INDEX
Negative Logits
unilateral
-0.07
шку
-0.06
Singh
-0.06
ши
-0.06
tricky
-0.06
Uno
-0.06
vat
-0.06
opor
-0.06
кирп
-0.06
ุง
-0.06
POSITIVE LOGITS
sera
0.07
Resp
0.07
_wh
0.07
grievances
0.06
ından
0.06
VE
0.06
Iv
0.06
Ga
0.06
0.06
Ga
0.06
Activations Density 0.002%