INDEX
Negative Logits
dune
-0.09
cue
-0.08
😉
-0.08
借
-0.08
Cue
-0.08
entsprechenden
-0.08
deductible
-0.08
sandstone
-0.08
性的
-0.07
kiej
-0.07
POSITIVE LOGITS
hingegen
0.11
(This
0.09
naman
0.09
invece
0.08
(line
0.08
Lastly
0.08
또한
0.07
:**
0.07
(data
0.07
역시
0.07
Activations Density 0.046%