INDEX
Negative Logits
hann
-0.09
wine
-0.08
Ec
-0.08
abb
-0.08
antik
-0.08
Jas
-0.07
nik
-0.07
ant
-0.07
filas
-0.07
�
-0.07
POSITIVE LOGITS
(Note
0.09
Ban
0.08
Ban
0.08
-ko
0.07
silicone
0.07
эти
0.07
Verl
0.07
_POLICY
0.07
Bel
0.07
Dup
0.07
Activations Density 0.040%