INDEX
Negative Logits
定
-0.08
déf
-0.07
redef
-0.07
Run
-0.07
-def
-0.07
деб
-0.07
.Def
-0.07
�
-0.07
ator
-0.07
occupying
-0.07
POSITIVE LOGITS
EEE
0.09
_MORE
0.08
Southeastern
0.08
@[
0.08
ค่ะ
0.08
issim
0.08
มาก
0.08
ക്ഷേ
0.08
eet
0.08
@[
0.08
Activations Density 0.045%