INDEX
Negative Logits
Output
-0.07
容
-0.06
Carr
-0.06
{\-0.06
ihre
-0.06
CAB
-0.06
safety
-0.06
ow
-0.06
Speed
-0.06
inyin
-0.06
POSITIVE LOGITS
dto
0.08
------↵↵
0.07
undisclosed
0.07
亏损
0.07
getter
0.07
твер
0.06
↵
0.06
chociaż
0.06
נפתח
0.06
下令
0.06
Activations Density 0.007%