INDEX
Negative Logits
Loose
-0.08
ಗಳ
-0.08
handic
-0.07
season
-0.07
vermittelt
-0.07
berg
-0.07
pup
-0.07
ке
-0.07
tourn
-0.07
paradox
-0.07
POSITIVE LOGITS
besteh
0.09
bestehenden
0.08
聊天室
0.08
推
0.08
deck
0.08
כדי
0.08
正文
0.07
Outgoing
0.07
作文
0.07
masyarakat
0.07
Activations Density 0.067%