INDEX
Negative Logits
Regierung
-0.10
inseg
-0.10
terem
-0.08
kvinne
-0.08
webtoken
-0.08
staten
-0.08
ŝ
-0.08
గా
-0.08
samba
-0.08
녀
-0.08
POSITIVE LOGITS
ETH
0.08
Husk
0.07
Heads
0.07
Graz
0.07
pis
0.07
منع
0.07
EPS
0.07
обуч
0.07
Slice
0.07
Cut
0.06
Activations Density 0.219%