INDEX
Negative Logits
pages
-0.07
')
-0.07
fon
-0.07
پزشکی
-0.06
Notices
-0.06
izr
-0.06
discrimin
-0.06
Rowe
-0.06
िण
-0.06
일
-0.06
POSITIVE LOGITS
conserv
0.07
-j
0.07
inges
0.06
开放
0.06
startActivity
0.06
-po
0.06
uchsia
0.06
va
0.06
elter
0.06
+i
0.06
Activations Density 0.001%