INDEX
Negative Logits
jan
-0.08
Fuse
-0.07
sticky
-0.07
Fou
-0.06
是他
-0.06
晰
-0.06
говорит
-0.06
Viol
-0.06
Said
-0.06
华人
-0.06
POSITIVE LOGITS
環境
0.07
Integr
0.07
�
0.07
etwa
0.07
ّ
0.06
資源
0.06
sayısı
0.06
(down
0.06
技術
0.06
第一
0.06
Activations Density 0.024%