INDEX
Negative Logits
Camaro
-0.08
magní
-0.08
Dalam
-0.08
Vulner
-0.08
767
-0.08
Dalam
-0.08
Antibi
-0.08
-Luc
-0.07
lindo
-0.07
Along
-0.07
POSITIVE LOGITS
orn
0.09
ней
0.08
kth
0.08
人士
0.08
nehme
0.08
cambi
0.08
बदलाव
0.07
inn
0.07
modific
0.07
positives
0.07
Activations Density 0.011%