INDEX
Negative Logits
ID
-0.07
-cycle
-0.07
:///
-0.06
張
-0.06
"c
-0.06
_numbers
-0.06
-bottom
-0.06
adjusted
-0.06
cats
-0.06
international
-0.06
POSITIVE LOGITS
영화
0.06
псих
0.06
_host
0.06
расс
0.06
legs
0.06
ほう
0.06
)[-
0.06
subs
0.06
機
0.06
ockey
0.06
Activations Density 0.008%