INDEX
Negative Logits
jima
-0.09
97
-0.09
stä
-0.08
isation
-0.08
dt
-0.08
pagbab
-0.08
05
-0.07
.sa
-0.07
.timer
-0.07
.clicked
-0.07
POSITIVE LOGITS
enriched
0.10
_DIP
0.10
окруж
0.09
experiências
0.09
experiencias
0.09
丰富
0.09
غني
0.08
풍
0.08
出生
0.08
哥哥
0.08
Activations Density 0.015%