INDEX
Negative Logits
IPS
-0.09
enhver
-0.08
değerl
-0.08
Eric
-0.08
robber
-0.07
なら
-0.07
IRS
-0.07
eros
-0.07
ли
-0.07
DH
-0.07
POSITIVE LOGITS
whatsoever
0.10
besides
0.09
кроме
0.08
suggestion
0.08
.sign
0.08
关于
0.07
hours
0.07
substantive
0.07
assurances
0.07
indications
0.07
Activations Density 0.038%