INDEX
Negative Logits
boundary
-0.08
curiosity
-0.07
stupid
-0.07
containment
-0.07
в
-0.07
-0.07
самой
-0.07
'instant
-0.07
teas
-0.07
config
-0.07
POSITIVE LOGITS
onomy
0.11
larni
0.10
utut
0.09
see
0.08
laring
0.08
kaart
0.08
laag
0.08
.patch
0.08
,其中
0.08
See
0.08
Activations Density 0.001%