INDEX
Negative Logits
and
-0.13
,
-0.11
.
-0.11
-0.10
/
-0.10
&
-0.09
-
-0.09
!
-0.09
_
-0.08
B
-0.08
POSITIVE LOGITS
chacune
0.09
sogen
0.09
saol
0.09
abusing
0.09
خول
0.09
kaik
0.09
بدأ
0.09
predetermined
0.08
dadas
0.08
ciert
0.08
Activations Density 0.372%