INDEX
Negative Logits
landers
-0.08
lau
-0.08
holder
-0.08
ления
-0.07
_fe
-0.07
lander
-0.07
enario
-0.07
CZ
-0.07
401
-0.07
ces
-0.07
POSITIVE LOGITS
hum
0.10
asim
0.08
μή
0.08
sembl
0.08
وخاصة
0.08
məsəl
0.08
wat
0.08
sort
0.08
.slf
0.08
ọju
0.07
Activations Density 0.035%