INDEX
Negative Logits
一点
-0.08
("[%-0.07
Truth
-0.07
peek
-0.07
noticing
-0.07
get
-0.07
.peek
-0.07
magnets
-0.07
mier
-0.07
gano
-0.07
POSITIVE LOGITS
subdivision
0.09
disputed
0.09
Strait
0.08
booda
0.08
potom
0.08
специф
0.08
<thead
0.08
�
0.08
liang
0.08
IZA
0.08
Activations Density 0.006%