INDEX
Negative Logits
tempt
-0.08
adv
-0.07
MMM
-0.07
adecimal
-0.07
verst
-0.07
kn
-0.07
.Adv
-0.07
.concatenate
-0.07
.advance
-0.07
Müll
-0.07
POSITIVE LOGITS
grammar
0.09
lion
0.09
Connell
0.08
ும
0.07
उसकी
0.07
arkin
0.07
ところ
0.07
dragon
0.07
fiery
0.07
Conn
0.07
Activations Density 0.001%