INDEX
Negative Logits
Mira
-0.09
volta
-0.08
rej
-0.07
Wrangler
-0.07
Flint
-0.07
infr
-0.07
Mermaid
-0.07
eps
-0.07
berr
-0.07
mitten
-0.07
POSITIVE LOGITS
expectancy
0.12
-threatening
0.08
用品
0.08
quotidienne
0.08
practically
0.08
cotidiana
0.08
-changing
0.08
て
0.07
sociology
0.07
burn
0.07
Activations Density 0.079%