INDEX
Negative Logits
ਝ
-0.07
ಾಗಿದೆ
-0.07
Bovendien
-0.07
ertain
-0.07
ਾਉ
-0.07
defines
-0.07
ாட்ச
-0.07
أم
-0.07
excludes
-0.07
साझ
-0.07
POSITIVE LOGITS
dick
0.09
Depp
0.08
TOT
0.08
Freud
0.08
Vip
0.08
ABCDEFG
0.08
agu
0.08
Adams
0.08
подбор
0.08
Johnson
0.07
Activations Density 0.009%