INDEX
Negative Logits
attrs
-0.07
(an
-0.07
562
-0.07
atemala
-0.07
earners
-0.06
مربع
-0.06
colors
-0.06
yclopedia
-0.06
standardUserDefaults
-0.06
errer
-0.06
POSITIVE LOGITS
_other
0.07
ihtiyac
0.06
Frank
0.06
vacc
0.06
gec
0.06
/~
0.06
vise
0.06
新的
0.06
инт
0.06
?>↵↵
0.06
Activations Density 0.004%