INDEX
Negative Logits
_targets
-0.07
rval
-0.07
,the
-0.07
—↵↵
-0.07
却
-0.07
dr
-0.07
panic
-0.07
anya
-0.07
Anyways
-0.07
dp
-0.07
POSITIVE LOGITS
Pron
0.09
plein
0.08
Pron
0.08
Auckland
0.08
Huk
0.08
Bonne
0.08
safeguarding
0.08
Prague
0.08
.Note
0.08
Prere
0.08
Activations Density 0.058%