INDEX
Negative Logits
gener
-0.07
rather
-0.07
outperform
-0.07
તેના
-0.07
NH
-0.07
nh
-0.07
guna
-0.07
maximal
-0.07
Дом
-0.07
domin
-0.07
POSITIVE LOGITS
.reply
0.09
reply
0.08
âtre
0.08
�
0.08
喊
0.08
bombard
0.08
alea
0.08
fours
0.08
удалось
0.08
(Command
0.08
Activations Density 0.001%