INDEX
Negative Logits
Tara
-0.07
켜
-0.06
بود
-0.06
quân
-0.06
zaman
-0.06
leen
-0.06
کردن
-0.06
_boundary
-0.06
Robert
-0.06
زاد
-0.06
POSITIVE LOGITS
itty
0.07
paused
0.07
ंक
0.06
utilizing
0.06
utilize
0.06
UPER
0.06
jsou
0.06
ITTER
0.06
Talk
0.06
PIO
0.06
Activations Density 0.060%