INDEX
Negative Logits
liste
-0.08
reter
-0.08
alf
-0.08
algorithm
-0.08
eeper
-0.08
cir
-0.07
deltag
-0.07
ingly
-0.07
_lista
-0.07
liste
-0.07
POSITIVE LOGITS
brains
0.08
/'
0.08
endings
0.08
thing
0.08
suffix
0.08
conjug
0.08
postfix
0.07
конца
0.07
话
0.07
тал
0.07
Activations Density 0.030%