INDEX
Negative Logits
JJ
-0.07
glim
-0.07
nhìn
-0.07
chip
-0.07
rome
-0.07
(!
-0.07
religious
-0.07
-based
-0.07
retiring
-0.07
(_,
-0.06
POSITIVE LOGITS
Heming
0.09
нений
0.09
кан
0.08
ůže
0.08
hesitate
0.08
事项
0.08
/debug
0.08
عوبة
0.08
หาร
0.08
helu
0.08
Activations Density 0.020%