INDEX
Negative Logits
uang
-0.08
arım
-0.08
iro
-0.07
emo
-0.07
Maa
-0.07
üstünlik
-0.07
caire
-0.07
haunt
-0.07
YC
-0.07
šla
-0.07
POSITIVE LOGITS
perpendicular
0.10
_len
0.09
линия
0.08
pendicular
0.07
forming
0.07
русского
0.07
今回
0.07
宗
0.07
הראשון
0.07
oriented
0.07
Activations Density 0.009%