INDEX
Negative Logits
ترة
-0.07
dc
-0.07
عب
-0.07
трудов
-0.07
Spirit
-0.06
EE
-0.06
ترك
-0.06
обо
-0.06
его
-0.06
disob
-0.06
POSITIVE LOGITS
вод
0.07
/stdc
0.06
tir
0.06
Anniversary
0.06
Chương
0.06
Jung
0.06
Uni
0.06
program
0.06
キング
0.06
ılan
0.06
Activations Density 0.045%