INDEX
Negative Logits
Zet
-0.08
تل
-0.07
inode
-0.07
_Table
-0.07
�
-0.07
现代
-0.07
ition
-0.07
føle
-0.07
体验
-0.07
相信
-0.07
POSITIVE LOGITS
adversely
0.08
spree
0.08
doom
0.08
caric
0.08
vire
0.07
mania
0.07
одну
0.07
א
0.07
illicit
0.07
cue
0.07
Activations Density 0.006%