INDEX
Negative Logits
протест
-0.08
stav
-0.08
Champagne
-0.08
्तर
-0.08
hunt
-0.08
entan
-0.08
ganas
-0.07
ограм
-0.07
прош
-0.07
.dgv
-0.07
POSITIVE LOGITS
sa
0.11
creative
0.09
late
0.09
top
0.09
cr
0.09
grade
0.08
em
0.08
pr
0.08
ximately
0.08
ers
0.08
Activations Density 0.006%