INDEX
Negative Logits
Bell
-0.08
آل
-0.07
�
-0.07
آذ
-0.07
AMD
-0.06
iVar
-0.06
podmín
-0.06
Ін
-0.06
申
-0.06
Hoff
-0.06
POSITIVE LOGITS
0.11
0.10
0.10
0.10
0.09
0.09
0.09
0.09
0.08
0.08
Activations Density 0.009%
Bell
آل
�
آذ
AMD
iVar
podmín
Ін
申
Hoff