INDEX
Negative Logits
itev
-0.08
407
-0.07
736
-0.07
.old
-0.07
edly
-0.07
આંત
-0.07
autumn
-0.07
ifact
-0.07
985
-0.07
Asheville
-0.07
POSITIVE LOGITS
standers
0.09
alguien
0.08
clockwise
0.08
څوک
0.08
cramped
0.08
আছে
0.08
someone
0.07
바로
0.07
decess
0.07
ดับ
0.07
Activations Density 0.012%