INDEX
Negative Logits
leftover
-0.09
Carbon
-0.08
Carbon
-0.08
हल
-0.08
_overlap
-0.08
mukuru
-0.07
lát
-0.07
лица
-0.07
scars
-0.07
anot
-0.07
POSITIVE LOGITS
-era
0.09
攻
0.08
军
0.07
恐
0.07
WW
0.07
Guardians
0.07
Era
0.07
Mais
0.07
era
0.07
bild
0.07
Activations Density 0.003%