INDEX
Negative Logits
Wars
-0.08
ERM
-0.08
بعدما
-0.08
giúp
-0.07
merupakan
-0.07
reales
-0.07
inté
-0.07
134
-0.07
nhé
-0.07
ंश
-0.07
POSITIVE LOGITS
에서는
0.10
alike
0.10
/count
0.08
бывает
0.08
では
0.08
情侣
0.08
abase
0.08
.segment
0.08
005
0.08
puhul
0.08
Activations Density 0.111%