INDEX
Negative Logits
疼
-0.09
تون
-0.09
adol
-0.08
insulin
-0.08
.step
-0.08
ежегод
-0.08
Wallpapers
-0.08
jaarlijkse
-0.08
vuos
-0.08
Clique
-0.08
POSITIVE LOGITS
persuasive
0.16
rhetorical
0.14
rhet
0.13
überzeug
0.12
rhetoric
0.12
persu
0.12
persuasion
0.12
persuade
0.11
convencer
0.11
Leser
0.10
Activations Density 0.017%