INDEX
Negative Logits
ović
-0.09
-rich
-0.08
োভ
-0.08
ys
-0.07
assert
-0.07
kiri
-0.07
.si
-0.07
counts
-0.07
-go
-0.07
-sing
-0.07
POSITIVE LOGITS
liefern
0.08
Philippine
0.08
smelled
0.08
hh
0.08
querem
0.08
lld
0.08
Sense
0.08
चाहता
0.08
柴油
0.07
Older
0.07
Activations Density 0.006%