INDEX
Negative Logits
Carlson
-0.08
roger
-0.07
logic
-0.07
ritual
-0.07
OB
-0.07
Lith
-0.07
Barn
-0.07
lli
-0.07
ziv
-0.07
Mage
-0.07
POSITIVE LOGITS
Inf
0.09
ih
0.08
kende
0.08
bh
0.08
helu
0.08
isu
0.08
sabía
0.08
gobern
0.08
Reports
0.08
tablero
0.08
Activations Density 0.001%