INDEX
Explanations
mentions of a specific brand or product
New Auto-Interp
Negative Logits
p
-0.06
edo
-0.06
Carn
-0.06
flesh
-0.06
Dum
-0.06
Dare
-0.06
z
-0.06
marrow
-0.05
i
-0.05
713
-0.05
POSITIVE LOGITS
ÄįÃŃ
0.09
rock
0.08
erte
0.08
ente
0.08
isque
0.07
aida
0.07
ivre
0.07
amework
0.07
ÌĪ
0.07
605
0.07
Activations Density 0.002%