INDEX
Negative Logits
the
-0.08
variable
-0.08
compression
-0.08
_VARIABLE
-0.08
examining
-0.07
Variable
-0.07
Luiz
-0.07
Jeep
-0.07
a
-0.07
unconventional
-0.07
POSITIVE LOGITS
拒
0.10
�
0.09
répondre
0.09
>&
0.08
refused
0.08
|"
0.08
Ог
0.08
prohibited
0.08
<|end|>
0.08
回应
0.08
Activations Density 0.009%