INDEX
Negative Logits
transf
-0.07
ંપ
-0.07
atiem
-0.07
WI
-0.07
honum
-0.07
ات
-0.07
ительным
-0.07
tolower
-0.07
matic
-0.07
Lik
-0.07
POSITIVE LOGITS
Ar
0.09
Sever
0.09
আর
0.08
Shark
0.08
Hip
0.08
Artem
0.08
福
0.08
(Un
0.08
Ar
0.07
ruas
0.07
Activations Density 0.015%