INDEX
Negative Logits
.code
-0.08
زیر
-0.07
colon
-0.07
Colon
-0.07
ประ
-0.07
documenting
-0.07
Likewise
-0.07
uator
-0.07
sex
-0.07
soa
-0.07
POSITIVE LOGITS
most
0.14
洞
0.09
तः
0.09
ther
0.09
-most
0.09
तम
0.09
MOST
0.08
�
0.08
阁
0.08
围
0.08
Activations Density 0.006%