INDEX
Explanations
expressions of urgency and promptness
New Auto-Interp
Negative Logits
adol
-0.07
iÃŃ
-0.07
mdp
-0.07
inton
-0.06
_CRC
-0.06
اذ
-0.06
ritel
-0.06
UFF
-0.06
赫
-0.06
makt
-0.06
POSITIVE LOGITS
elson
0.07
ablo
0.07
hol
0.07
ante
0.07
guilty
0.06
priority
0.06
дÑĭ
0.06
abe
0.06
antage
0.06
ogi
0.06
Activations Density 0.002%