INDEX
Negative Logits
Tot
-0.07
postfix
-0.07
ip
-0.06
erg
-0.06
Bars
-0.06
deg
-0.06
/z
-0.06
열
-0.06
.WriteByte
-0.06
te
-0.06
POSITIVE LOGITS
SB
0.07
nun
0.07
.Inv
0.07
нош
0.07
each
0.06
ّة
0.06
upertino
0.06
Shame
0.06
musí
0.06
Ne
0.06
Activations Density 0.006%