INDEX
Negative Logits
хоть
0.56
переменных
0.56
действительно
0.54
corresponds
0.52
varies
0.52
উভয়
0.52
언급
0.51
доступны
0.51
สำหรับ
0.50
연습
0.49
POSITIVE LOGITS
zamanda
0.55
devenir
0.54
фект
0.52
sant
0.52
fund
0.51
elsen
0.51
savo
0.51
fice
0.51
쩜
0.51
джа
0.49
Activations Density 0.002%