INDEX
Negative Logits
ğlu
-0.10
turi
-0.09
nephew
-0.08
pimp
-0.08
mesi
-0.08
ege
-0.08
lings
-0.08
ouders
-0.08
-orang
-0.08
leys
-0.08
POSITIVE LOGITS
Edition
0.08
thro
0.08
Edition
0.07
(cancel
0.07
edition
0.07
клуба
0.07
एक्स
0.07
समित
0.07
leicht
0.07
medicine
0.07
Activations Density 0.042%