INDEX
Negative Logits
Thou
-0.09
ako
-0.09
aff
-0.08
ори
-0.08
Wann
-0.08
edf
-0.08
�
-0.08
phi
-0.08
Gud
-0.07
mens
-0.07
POSITIVE LOGITS
_met
0.08
主义
0.07
Minds
0.07
]string
0.07
Xi
0.07
vap
0.07
knocking
0.07
rappro
0.07
Met
0.07
값
0.07
Activations Density 0.001%