INDEX
Negative Logits
they
-1.90
赑
-1.51
鸸
-1.48
there
-1.45
hän
-1.44
tendrás
-1.38
葑
-1.36
sinistro
-1.35
鹋
-1.34
iſt
-1.32
POSITIVE LOGITS
.”
1.69
–
1.63
той
1.47
一個
1.46
móds
1.45
!”
1.45
attività
1.44
):
1.41
;
1.41
activités
1.40
Activations Density 0.028%