INDEX
Negative Logits
liger
-0.09
luent
-0.09
ង់
-0.09
Ũ
-0.09
torre
-0.09
涉嫌
-0.08
ahamwe
-0.08
ેન્ટ
-0.08
ুৱ
-0.08
IENTO
-0.08
POSITIVE LOGITS
.
0.08
بسیار
0.08
.gl
0.08
Thank
0.08
deutlich
0.07
Thank
0.07
::
0.07
nor
0.07
");↵↵
0.07
in
0.07
Activations Density 0.102%