INDEX
Negative Logits
ాం
-0.08
ामा
-0.08
Locator
-0.08
FOX
-0.08
page
-0.07
\Container
-0.07
(Clone
-0.07
姜
-0.07
theta
-0.07
(cursor
-0.07
POSITIVE LOGITS
answer
0.10
غلط
0.09
ತಪ್ಪ
0.09
0.09
эмес
0.08
Nein
0.08
opción
0.08
unintended
0.08
vaihtoe
0.08
yanlış
0.08
Activations Density 0.084%