INDEX
Negative Logits
debris
-0.09
claro
-0.08
-0.08
Britney
-0.07
depressing
-0.07
Putin
-0.07
annat
-0.07
പരാത
-0.07
itarian
-0.07
provis
-0.06
POSITIVE LOGITS
ingenuity
0.08
mol
0.08
owo
0.08
BIS
0.08
Engineering
0.08
salles
0.08
Teams
0.08
salle
0.07
świe
0.07
दृ
0.07
Activations Density 0.059%