INDEX
Negative Logits
mensaje
-0.09
mensaje
-0.08
MEN
-0.08
juez
-0.08
mensagem
-0.08
nieces
-0.08
Direkt
-0.08
mens
-0.08
mengatakan
-0.07
পরিচালক
-0.07
POSITIVE LOGITS
且
0.10
ारी
0.08
optimization
0.08
истой
0.07
кий
0.07
-ти
0.07
tercih
0.07
เหม
0.07
-ish
0.07
tranquility
0.07
Activations Density 0.009%