INDEX
Negative Logits
ilate
-0.07
Spell
-0.07
-bottom
-0.07
godt
-0.07
Guar
-0.07
_middle
-0.07
_SU
-0.07
ominator
-0.06
tor
-0.06
aln
-0.06
POSITIVE LOGITS
baking
0.08
heet
0.06
「そう
0.06
」を
0.06
عفش
0.06
があり
0.06
quotes
0.06
ngôi
0.06
amy
0.06
طبقه
0.06
Activations Density 0.001%