INDEX
Negative Logits
laud
-0.08
Hmm
-0.08
lowered
-0.07
bearing
-0.07
treat
-0.07
bearing
-0.07
Bearing
-0.07
雅
-0.07
अपर
-0.07
.Skip
-0.07
POSITIVE LOGITS
ري
0.08
خير
0.08
Influ
0.08
ماي
0.08
Ronnie
0.08
是真的
0.08
taong
0.08
riktigt
0.08
خی
0.07
Tinder
0.07
Activations Density 0.027%