INDEX
Negative Logits
甚至
-0.08
ardige
-0.08
મ
-0.08
il
-0.08
뿐
-0.08
Moreover
-0.07
thus
-0.07
તથા
-0.07
ैली
-0.07
rép
-0.07
POSITIVE LOGITS
orb
0.08
0.08
marche
0.08
Emi
0.08
zas
0.08
ęż
0.07
anaer
0.07
Hg
0.07
僕
0.07
umut
0.07
Activations Density 0.086%