INDEX
Negative Logits
Gab
-0.09
おります
-0.08
stab
-0.08
SPR
-0.08
Legisl
-0.07
SPR
-0.07
лага
-0.07
Stark
-0.07
OTC
-0.07
claims
-0.07
POSITIVE LOGITS
phony
0.08
Angela
0.08
houette
0.08
ike
0.08
asi
0.08
coc
0.07
lotus
0.07
默
0.07
По
0.07
Einstein
0.07
Activations Density 0.011%