INDEX
Negative Logits
bian
-0.08
tự
-0.07
접
-0.06
Kurds
-0.06
qua
-0.06
chants
-0.06
jeep
-0.06
">'; ↵
-0.06
yyn
-0.06
başarı
-0.06
POSITIVE LOGITS
stockings
0.10
stocking
0.07
moth
0.06
Максим
0.06
pository
0.06
ذر
0.06
Stephens
0.06
span
0.06
omit
0.06
додатков
0.06
Activations Density 0.002%