INDEX
Negative Logits
宣布
-0.08
incarn
-0.08
prized
-0.08
dürfte
-0.08
legitim
-0.08
狼
-0.08
steadfast
-0.08
slachtoffer
-0.08
announced
-0.08
ostens
-0.07
POSITIVE LOGITS
:");↵
0.09
..."↵
0.09
..."↵↵
0.09
XYZ
0.09
:");↵↵
0.09
...")↵
0.09
xxxxx
0.09
ូច
0.09
#{0.08
...");↵
0.08
Activations Density 0.037%