INDEX
Negative Logits
udi
-0.08
sr
-0.08
kurt
-0.08
sx
-0.07
earch
-0.07
sorted
-0.07
ENSITIVE
-0.07
biased
-0.07
TREE
-0.07
.sorted
-0.07
POSITIVE LOGITS
pizza
0.13
toppings
0.12
pizzas
0.11
Pizza
0.11
mozzarella
0.10
Pizza
0.09
piz
0.09
waitress
0.09
verantwoordelijk
0.09
Napoli
0.09
Activations Density 0.020%