INDEX
Negative Logits
聖
-0.07
व
-0.07
λόγ
-0.07
鲁
-0.07
�
-0.06
Jur
-0.06
藤
-0.06
encer
-0.06
ดำ
-0.06
_DOC
-0.06
POSITIVE LOGITS
matched
0.07
ationally
0.06
concerted
0.06
XXXX
0.06
japan
0.06
0.06
begs
0.06
melts
0.06
بما
0.06
İran
0.06
Activations Density 0.003%