INDEX
Negative Logits
nung
-0.08
нання
-0.08
subir
-0.08
leitung
-0.08
ister
-0.07
restitution
-0.07
ner
-0.07
cheval
-0.07
anne
-0.07
Holly
-0.07
POSITIVE LOGITS
sharks
0.09
shark
0.09
mega
0.08
ển
0.08
blades
0.08
Dubai
0.07
Sharks
0.07
raped
0.07
237
0.07
মারা
0.07
Activations Density 0.004%