INDEX
Negative Logits
yur
-0.09
.↵//↵
-0.09
507
-0.08
unsub
-0.07
130
-0.07
mos
-0.07
suivante
-0.07
124
-0.07
Martins
-0.07
Москов
-0.07
POSITIVE LOGITS
Ini
0.08
valign
0.08
Wow
0.08
(defun
0.08
Crew
0.08
Thought
0.08
Lots
0.08
Vocabulary
0.07
Balcony
0.07
χει
0.07
Activations Density 0.076%