INDEX
Negative Logits
Vir
-0.11
Vir
-0.08
(E
-0.08
那个
-0.07
Ο
-0.07
Probably
-0.07
!↵↵
-0.07
(P
-0.07
(L
-0.07
(A
-0.07
POSITIVE LOGITS
752
0.09
995
0.08
770
0.08
++){↵0.08
christ
0.08
_ff
0.08
272
0.08
hemorr
0.08
Tommy
0.08
996
0.08
Activations Density 0.036%