INDEX
Negative Logits
tras
-0.08
itempty
-0.08
neutr
-0.07
seu
-0.07
त्य
-0.07
導
-0.07
tangent
-0.07
ір
-0.07
导
-0.07
"",
-0.07
POSITIVE LOGITS
800
0.08
650
0.08
700
0.08
Wunused
0.08
১৫
0.08
৮
0.07
️
0.07
१५
0.07
tten
0.07
-Americans
0.07
Activations Density 0.008%