INDEX
Negative Logits
worm
-0.09
泡
-0.08
tim
-0.08
Mis
-0.08
Mis
-0.08
(clk
-0.07
面对
-0.07
ané
-0.07
iconduct
-0.07
.ds
-0.07
POSITIVE LOGITS
mere
0.08
halfway
0.07
rock
0.07
सर
0.07
え
0.07
क
0.07
než
0.07
الذ
0.07
מבח
0.07
ذلك
0.07
Activations Density 0.017%