INDEX
Negative Logits
oň
-0.06
shave
-0.06
physiology
-0.06
ยวข
-0.06
�
-0.05
-mort
-0.05
赵
-0.05
Couples
-0.05
Salman
-0.05
chore
-0.05
POSITIVE LOGITS
antas
0.08
andes
0.08
населения
0.07
Assistance
0.06
строитель
0.06
/l
0.06
altitude
0.06
achers
0.06
muj
0.06
_tokenize
0.06
Activations Density 0.002%