INDEX
Negative Logits
An
-0.08
_
-0.08
==
-0.07
ATA
-0.07
K
-0.07
data
-0.07
can
-0.07
Electrical
-0.07
bijzonder
-0.07
digo
-0.07
POSITIVE LOGITS
նակ
0.09
nonetheless
0.08
akkut
0.08
leve
0.08
oldoende
0.08
więc
0.08
issaq
0.08
dominance
0.08
لذا
0.08
riedenheit
0.08
Activations Density 0.004%