INDEX
Negative Logits
Eden
-0.09
навер
-0.08
sosp
-0.08
повед
-0.08
freer
-0.08
caregiver
-0.07
khả
-0.07
vaste
-0.07
uites
-0.07
òa
-0.07
POSITIVE LOGITS
×
0.09
identical
0.08
×
0.08
968
0.08
Β
0.07
BAY
0.07
beasts
0.07
protobuf
0.07
在人
0.07
Β
0.07
Activations Density 0.006%