INDEX
Negative Logits
�
-0.08
알려
-0.08
护
-0.08
adx
-0.08
ndz
-0.08
Insets
-0.08
Nost
-0.07
postar
-0.07
bdsm
-0.07
smartphones
-0.07
POSITIVE LOGITS
blonde
0.08
rych
0.08
ringan
0.08
fired
0.07
தொ
0.07
முட
0.07
எழ
0.07
ringing
0.07
माम
0.07
отдель
0.07
Activations Density 0.002%