INDEX
Negative Logits
ASCII
-0.07
-dialog
-0.07
indust
-0.06
される
-0.06
corpus
-0.06
zákaz
-0.06
uite
-0.06
ilation
-0.06
unnel
-0.06
.width
-0.06
POSITIVE LOGITS
toc
0.07
contents
0.07
Amerikan
0.07
Within
0.06
creative
0.06
kindly
0.06
catchError
0.06
+");↵
0.06
_MAN
0.06
Omni
0.06
Activations Density 0.005%