INDEX
Negative Logits
(clean
-0.07
FEC
-0.06
icht
-0.06
OTH
-0.06
ODEV
-0.06
グ
-0.06
vhod
-0.06
손을
-0.06
χεδόν
-0.06
Kuzey
-0.06
POSITIVE LOGITS
bun
0.13
Bun
0.11
utut
0.08
rolls
0.07
obtaining
0.07
ॉन
0.07
bud
0.07
·
0.07
latest
0.07
reducing
0.07
Activations Density 0.001%