INDEX
Negative Logits
ãĥ»ãĥ»ãĥ»\n\n
-0.09
oop
-0.09
âĢŀP
-0.09
Tig
-0.09
emies
-0.09
markup
-0.09
ourney
-0.08
书记
-0.08
gone
-0.08
OutOf
-0.08
POSITIVE LOGITS
less
0.22
fewer
0.18
menos
0.17
weniger
0.17
Less
0.17
moins
0.15
менÑĮÑĪе
0.14
ménÄĽ
0.14
_less
0.14
Less
0.13
Activations Density 0.023%