INDEX
Negative Logits
replies
-0.08
targets
-0.08
uristic
-0.08
aproxima
-0.08
compares
-0.07
sic
-0.07
-0.07
cons
-0.07
maupun
-0.07
completamente
-0.07
POSITIVE LOGITS
vint
0.08
سب
0.08
teraz
0.08
nonstop
0.07
-je
0.07
meg
0.07
équilibre
0.07
.cid
0.07
herstel
0.07
menurut
0.07
Activations Density 0.033%