INDEX
Negative Logits
raf
-0.07
majority
-0.07
idia
-0.07
lingerie
-0.07
enet
-0.07
_prev
-0.07
underlying
-0.07
odied
-0.07
eventually
-0.06
rary
-0.06
POSITIVE LOGITS
�
0.06
skutečnosti
0.06
Sug
0.06
时
0.06
oui
0.06
тепло
0.06
/usr
0.06
warmly
0.05
понима
0.05
tan
0.05
Activations Density 0.002%