INDEX
Negative Logits
Jerusalem
-0.07
tid
-0.07
cavern
-0.07
pund
-0.07
picturesque
-0.07
rustig
-0.07
.annot
-0.07
家庭
-0.07
כב
-0.07
천
-0.07
POSITIVE LOGITS
阁
0.08
拥
0.08
SX
0.07
burge
0.07
betrayed
0.07
Dio
0.07
YO
0.07
motives
0.07
<|reserved_200010|>
0.07
GPU
0.07
Activations Density 0.074%