INDEX
Negative Logits
/she
-0.08
Harmony
-0.08
unresolved
-0.08
Assistant
-0.08
343
-0.07
IGA
-0.07
Harmony
-0.07
ế
-0.07
transpl
-0.07
/la
-0.07
POSITIVE LOGITS
kill
0.09
очеред
0.09
കാര
0.08
ambientais
0.08
Char
0.08
ambientales
0.08
岁
0.08
brutal
0.08
کردن
0.07
നടത്ത
0.07
Activations Density 0.025%