INDEX
Negative Logits
Amend
-0.08
Something
-0.07
الخط
-0.07
ל
-0.07
Sm
-0.07
dar
-0.07
letcher
-0.07
dara
-0.07
သူ
-0.07
tre
-0.07
POSITIVE LOGITS
tones
0.11
tone
0.10
calm
0.10
-hearted
0.10
态
0.09
upbeat
0.09
toned
0.09
�
0.09
態
0.09
reprim
0.09
Activations Density 0.009%