INDEX
Negative Logits
neglect
-0.08
進
-0.07
貼
-0.07
транспорт
-0.07
exhibition
-0.07
ష
-0.07
Alg
-0.07
ור
-0.07
[[
-0.07
liv
-0.07
POSITIVE LOGITS
Warning
0.08
sentencing
0.08
hins
0.08
علامة
0.08
india
0.08
chopping
0.08
Secretary
0.08
�്
0.08
daca
0.08
emitted
0.08
Activations Density 0.003%