INDEX
Negative Logits
++){↵-0.07
الجم
-0.06
чуть
-0.06
عار
-0.06
ิทยาล
-0.06
adult
-0.05
řadu
-0.05
696
-0.05
týden
-0.05
كو
-0.05
POSITIVE LOGITS
techniques
0.07
isí
0.07
論
0.07
불
0.07
_RESPONSE
0.07
START
0.06
آپ
0.06
vements
0.06
Scientific
0.06
contribute
0.06
Activations Density 0.001%