INDEX
Negative Logits
porn
-0.08
elitian
-0.08
್
-0.07
anglais
-0.07
+
-0.07
専門
-0.07
pern
-0.07
проверить
-0.07
tackle
-0.07
Princeton
-0.07
POSITIVE LOGITS
heartfelt
0.10
thanking
0.09
votos
0.09
gratitude
0.09
behalf
0.09
sincere
0.09
серд
0.09
Wheels
0.09
وكل
0.09
635
0.09
Activations Density 0.045%