INDEX
Negative Logits
purposely
-0.08
-he
-0.08
heal
-0.07
Abb
-0.07
he
-0.07
propósito
-0.07
Arqu
-0.07
Arro
-0.07
heed
-0.07
abb
-0.07
POSITIVE LOGITS
ಸು
0.09
Nich
0.08
aforementioned
0.08
parenting
0.08
وٽ
0.08
ymmen
0.08
madres
0.08
wijk
0.08
(condition
0.07
narod
0.07
Activations Density 0.018%