INDEX
Negative Logits
Hopper
-0.08
Compassion
-0.08
Niem
-0.07
рис
-0.07
+m
-0.07
ALE
-0.07
risk
-0.07
Heroes
-0.07
Randolph
-0.07
heroes
-0.07
POSITIVE LOGITS
elet
0.09
idzi
0.09
congr
0.09
Longest
0.08
condom
0.08
Let's
0.08
ライト
0.07
tlak
0.07
дли
0.07
-toggler
0.07
Activations Density 0.010%