INDEX
Negative Logits
kleuren
-0.09
adore
-0.08
crowns
-0.08
compliment
-0.08
coated
-0.08
المشاكل
-0.08
dilute
-0.08
צבע
-0.07
décoration
-0.07
annak
-0.07
POSITIVE LOGITS
нас
0.09
Hep
0.08
αι
0.07
_require
0.07
quantum
0.07
тым
0.07
നിയ
0.07
нер
0.07
есп
0.07
autof
0.07
Activations Density 0.680%