INDEX
Negative Logits
hh
-0.08
ిపోయ
-0.08
bou
-0.08
vraiment
-0.08
कह
-0.07
(dirname
-0.07
/pl
-0.07
FOUR
-0.07
Sou
-0.07
timest
-0.07
POSITIVE LOGITS
ведом
0.07
состоя
0.07
Unidas
0.07
ാഥ
0.07
Таким
0.07
¶
0.07
습니다
0.07
interpreted
0.07
riak
0.07
中央
0.07
Activations Density 0.478%