INDEX
Negative Logits
yob
-0.09
幕后
-0.08
מחדש
-0.08
knees
-0.08
repercussions
-0.08
ulang
-0.07
gerek
-0.07
ות
-0.07
Against
-0.07
ških
-0.07
POSITIVE LOGITS
medications
0.09
Medication
0.08
дж
0.07
Channels
0.07
ুচ
0.07
0.07
病毒
0.07
Olu
0.07
Lig
0.07
esquer
0.07
Activations Density 0.003%