INDEX
Negative Logits
...)
-0.09
[df
-0.08
Horm
-0.08
existent
-0.07
interven
-0.07
circumstances
-0.07
-0.07
[msg
-0.07
ことで
-0.07
ediator
-0.07
POSITIVE LOGITS
factual
0.09
עבור
0.08
句
0.08
stanza
0.08
samengesteld
0.08
สำหรับ
0.08
Variation
0.08
déta
0.08
חדשה
0.08
Evo
0.07
Activations Density 0.013%