INDEX
Negative Logits
Pleasant
-0.08
Human
-0.07
String
-0.07
atoms
-0.07
不得
-0.06
ful
-0.06
_maker
-0.06
_packages
-0.06
_encode
-0.06
eos
-0.06
POSITIVE LOGITS
roller
0.07
cil
0.06
Communic
0.06
κει
0.06
纪
0.06
commercially
0.06
drafting
0.06
EDIATE
0.06
,std
0.06
ーカー
0.06
Activations Density 0.001%