INDEX
Negative Logits
Alba
-0.09
مستقل
-0.09
```↵
-0.08
ொரு
-0.08
_do
-0.08
spills
-0.08
OCT
-0.08
сме
-0.08
keta
-0.08
đó
-0.08
POSITIVE LOGITS
(cookie
0.08
.number
0.07
тр
0.07
beast
0.07
slider
0.07
eming
0.07
ταν
0.07
cookie
0.07
impor
0.07
الرم
0.07
Activations Density 0.036%