INDEX
Negative Logits
cách
-0.09
دة
-0.08
Refrigerator
-0.08
Jen
-0.08
Benutzer
-0.08
cải
-0.07
认真
-0.07
Leisure
-0.07
dah
-0.07
ulai
-0.07
POSITIVE LOGITS
aanvull
0.08
திரும
0.08
symptomatic
0.08
bilg
0.07
slimme
0.07
casamento
0.07
catered
0.07
iming
0.07
position
0.07
Sym
0.07
Activations Density 0.006%