INDEX
Negative Logits
되
-0.07
odio
-0.07
롭
-0.07
382
-0.06
produit
-0.06
ゅ
-0.06
λύ
-0.06
در
-0.06
にお
-0.06
_PS
-0.06
POSITIVE LOGITS
arousal
0.08
at
0.06
독일
0.06
<Product
0.06
ā
0.06
<TSource
0.06
incub
0.06
ㅋㅋ
0.06
,:
0.06
Ops
0.06
Activations Density 0.007%