INDEX
Explanations
phrases indicating assistance or suitability
New Auto-Interp
Negative Logits
ouch
-0.08
ibase
-0.06
POSIT
-0.06
pers
-0.06
ffen
-0.06
uki
-0.06
_FF
-0.06
OUCH
-0.06
cci
-0.06
mers
-0.06
POSITIVE LOGITS
ÏĦÏį
0.07
bola
0.07
é£
0.07
buflen
0.06
paralle
0.06
nist
0.06
enko
0.06
noch
0.06
upe
0.06
itsu
0.06
Activations Density 0.003%