INDEX
Negative Logits
tanın
-0.07
تي
-0.06
ratulations
-0.06
兄
-0.06
remarks
-0.06
"../
-0.06
됩니다
-0.06
uestion
-0.06
ú
-0.06
|$
-0.06
POSITIVE LOGITS
проводить
0.06
چیز
0.06
इसम
0.06
اک
0.06
tol
0.06
developer
0.06
poorly
0.06
fick
0.06
ậ
0.06
روط
0.06
Activations Density 0.019%