INDEX
Negative Logits
:\"
-0.07
_Red
-0.07
exemplary
-0.06
ad
-0.06
beauty
-0.06
komple
-0.06
sentence
-0.06
anzi
-0.06
yyy
-0.06
Adj
-0.06
POSITIVE LOGITS
θεν
0.06
eldre
0.06
.RESULT
0.06
πολι
0.06
immoral
0.06
Initializing
0.06
rending
0.06
extrav
0.06
Contributors
0.06
insensitive
0.06
Activations Density 0.028%