INDEX
Negative Logits
誉
-0.07
sill
-0.07
-h
-0.07
/Application
-0.07
jia
-0.07
eki
-0.07
Gloria
-0.07
neglect
-0.07
rév
-0.07
nila
-0.06
POSITIVE LOGITS
mögen
0.08
-loving
0.08
سيارة
0.08
лав
0.08
Wel
0.08
workplaces
0.07
بودن
0.07
Channels
0.07
بتوان
0.07
языке
0.07
Activations Density 0.030%