INDEX
Negative Logits
pizza
-0.08
Rewards
-0.08
_rewards
-0.08
ുപ്പ
-0.08
Pep
-0.07
深
-0.07
ingredientes
-0.07
grad
-0.07
Dish
-0.07
merzen
-0.07
POSITIVE LOGITS
(*.
0.12
*.
0.11
'*.
0.10
"*.
0.10
(.
0.09
Converted
0.09
Converted
0.09
MIME
0.09
Directory
0.08
Filename
0.08
Activations Density 0.002%