INDEX
Negative Logits
Piece
-0.07
istem
-0.07
DIFF
-0.07
MEMORY
-0.06
swallow
-0.06
-information
-0.06
tokenId
-0.06
نب
-0.06
poměr
-0.06
sterdam
-0.06
POSITIVE LOGITS
这个
0.08
Override
0.07
<tbody
0.07
Oregon
0.06
scratch
0.06
yap
0.06
SUR
0.06
_VOLT
0.06
جغراف
0.06
这种
0.06
Activations Density 0.001%