INDEX
Negative Logits
دلیل
-0.07
authorized
-0.07
criar
-0.06
cunning
-0.06
claration
-0.06
rez
-0.06
-comm
-0.06
hilarious
-0.06
�
-0.06
Witch
-0.06
POSITIVE LOGITS
)
0.07
?)↵↵
0.07
)]);↵
0.07
!!)↵
0.07
...)
0.07
<translation
0.06
~":"
0.06
Owned
0.06
}); ↵ ↵
0.06
157
0.06
Activations Density 0.001%