INDEX
Negative Logits
quisiera
-0.09
vocht
-0.09
chú
-0.09
}/>
-0.09
chatte
-0.09
susu
-0.09
kui
-0.08
loge
-0.08
Tucson
-0.08
ологических
-0.08
POSITIVE LOGITS
Behavior
0.07
Display
0.07
(con
0.07
_AG
0.07
33
0.07
tro
0.07
যার
0.06
Behavior
0.06
0.06
031
0.06
Activations Density 0.116%