INDEX
Negative Logits
судь
-0.08
byose
-0.08
эт
-0.08
lah
-0.08
ethnic
-0.08
каким
-0.08
лег
-0.07
.pow
-0.07
Megh
-0.07
tinder
-0.07
POSITIVE LOGITS
ollar
0.07
ogene
0.07
ೆಯಿಂದ
0.07
695
0.07
right
0.07
anqu
0.07
وية
0.07
******/
0.07
<List
0.07
ward
0.06
Activations Density 0.038%