INDEX
Negative Logits
itſelf
-0.73
ynchronously
-0.72
nawr
-0.66
مرئيه
-0.66
ंदीखरीदारी
-0.63
decla
-0.63
оригіналу
-0.62
auteuil
-0.62
-0.60
-0.60
POSITIVE LOGITS
iffa
0.43
Autoritní
0.43
сожалению
0.43
stateProvider
0.43
карта
0.42
åt
0.42
+"
0.41
چار
0.41
osoba
0.41
يله
0.41
Activations Density 0.035%