INDEX
Negative Logits
affairs
-0.08
ڊي
-0.08
بيق
-0.07
יט
-0.07
регули
-0.07
стаб
-0.07
тщательно
-0.07
овор
-0.07
deriv
-0.07
abino
-0.07
POSITIVE LOGITS
Lance
0.08
Appreci
0.08
END
0.08
راه
0.08
apsed
0.07
Sac
0.07
0.07
Guerr
0.07
appreciating
0.07
Sister
0.07
Activations Density 0.019%