INDEX
Negative Logits
Claire
-0.07
might
-0.07
бель
-0.07
hygiene
-0.07
Belg
-0.07
pipeline
-0.07
Belgium
-0.07
חשב
-0.07
mand
-0.07
may
-0.07
POSITIVE LOGITS
extremes
0.12
extrema
0.11
extreme
0.10
extrem
0.10
Extrem
0.10
corners
0.09
分别
0.09
ekstrem
0.09
禽
0.09
extremos
0.09
Activations Density 0.054%