INDEX
Negative Logits
USSR
-0.08
.active
-0.07
劐
-0.07
manned
-0.07
Roma
-0.07
_accuracy
-0.07
(rowIndex
-0.07
wysoko
-0.07
.getIn
-0.07
fires
-0.06
POSITIVE LOGITS
newcomer
0.07
aq
0.07
kbd
0.07
atype
0.07
vids
0.07
K
0.07
internals
0.07
бук
0.06
SG
0.06
千元
0.06
Activations Density 0.001%