INDEX
Negative Logits
alli
-0.08
apuesta
-0.08
316
-0.08
advocated
-0.08
abrió
-0.07
interference
-0.07
agre
-0.07
-0.07
ecos
-0.07
cb
-0.07
POSITIVE LOGITS
sidii
0.09
hud
0.08
rubric
0.08
にな
0.08
Hud
0.08
itelj
0.08
드
0.08
itatud
0.08
lariga
0.08
kronor
0.08
Activations Density 0.006%