INDEX
Negative Logits
prest
-0.08
خص
-0.08
laget
-0.07
gil
-0.07
अपना
-0.07
त्व
-0.07
Pau
-0.07
실시
-0.07
nw
-0.07
నలు
-0.07
POSITIVE LOGITS
itories
0.09
Fier
0.08
fighters
0.08
প্রব
0.08
oworld
0.08
uner
0.08
Кат
0.08
uous
0.07
matr
0.07
brutally
0.07
Activations Density 0.006%