INDEX
Negative Logits
Af
-0.10
Myself
-0.08
Sar
-0.08
써
-0.08
KO
-0.08
Habe
-0.08
disco
-0.07
�
-0.07
Af
-0.07
ület
-0.07
POSITIVE LOGITS
gonna
0.11
Kra
0.08
hollow
0.08
Lund
0.07
rid
0.07
rd
0.07
been
0.07
begging
0.07
amp
0.07
قس
0.07
Activations Density 0.151%