INDEX
Negative Logits
Nd
-0.08
tn
-0.08
Nikola
-0.06
ับปร
-0.06
.Act
-0.06
цього
-0.06
707
-0.06
верх
-0.06
RP
-0.06
Dou
-0.06
POSITIVE LOGITS
coordinator
0.07
RESS
0.06
prend
0.06
seen
0.06
_repr
0.06
.',
0.06
>false
0.06
04
0.06
axs
0.06
PLICATION
0.06
Activations Density 0.033%