INDEX
Negative Logits
၀၀
0.27
uitvo
0.25
нга
0.25
umož
0.25
usercontent
0.25
.。
0.25
Frum
0.25
способны
0.25
Gottes
0.24
unication
0.24
POSITIVE LOGITS
is
0.37
,
0.32
は
0.31
was
0.30
、
0.30
،
0.29
and
0.29
はもちろん
0.28
די
0.27
ט
0.27
Activations Density 0.148%