INDEX
Negative Logits
başarılı
-0.08
Native
-0.07
ウ
-0.07
になれ
-0.07
シ
-0.07
.Async
-0.07
빰
-0.07
customary
-0.06
试试
-0.06
当事
-0.06
POSITIVE LOGITS
ясн
0.07
ழ
0.07
rink
0.07
涿
0.07
כיכר
0.07
坑
0.07
uthor
0.07
(++
0.07
同情
0.06
isers
0.06
Activations Density 0.004%