INDEX
Negative Logits
âng
-0.09
�
-0.08
ունի
-0.08
�
-0.08
jednom
-0.08
אש
-0.08
بال
-0.08
及
-0.08
采用
-0.08
край
-0.07
POSITIVE LOGITS
itchens
0.08
culo
0.08
Stim
0.07
tem
0.07
.ids
0.07
enne
0.07
PO
0.07
Already
0.07
olo
0.07
yness
0.07
Activations Density 0.000%