INDEX
Negative Logits
धम
-0.08
�
-0.07
ذ
-0.07
su
-0.07
acet
-0.07
dotycz
-0.07
Camel
-0.07
пользователя
-0.07
Linked
-0.07
indispens
-0.07
POSITIVE LOGITS
Nar
0.09
dire
0.08
sprake
0.08
pudd
0.08
disclaim
0.07
democr
0.07
Instantiate
0.07
pater
0.07
Gossip
0.07
junk
0.07
Activations Density 0.120%