INDEX
Negative Logits
dew
-0.07
ap
-0.07
**
-0.07
Поз
-0.07
umum
-0.07
dor
-0.07
(a
-0.07
-0.07
Proper
-0.07
ep
-0.07
POSITIVE LOGITS
=edge
0.10
_EDGE
0.09
gio
0.09
kanten
0.08
하면서
0.08
_LAYOUT
0.08
listen
0.08
рыл
0.08
-fed
0.08
petto
0.08
Activations Density 0.000%