INDEX
Negative Logits
അഭ
-0.08
hi
-0.08
Reviews
-0.07
_here
-0.07
Rever
-0.07
verand
-0.07
paggamit
-0.07
yep
-0.07
ps
-0.07
ัง
-0.07
POSITIVE LOGITS
殺
0.08
Xi
0.08
уб
0.08
πη
0.08
liegt
0.08
cerrado
0.07
closed
0.07
cca
0.07
indispensable
0.07
kap
0.07
Activations Density 0.002%