INDEX
Negative Logits
_eff
-0.08
_o
-0.08
diplomatic
-0.08
讨
-0.08
敬
-0.08
.Ad
-0.08
disgust
-0.07
potrzeb
-0.07
(Enum
-0.07
percor
-0.07
POSITIVE LOGITS
noh
0.09
Mé
0.09
shin
0.08
schützt
0.08
daemon
0.08
umbrella
0.08
запись
0.08
shallow
0.08
сохранить
0.08
keyword
0.08
Activations Density 0.003%