INDEX
Negative Logits
טוב
0.40
ممکن
0.39
ελλην
0.38
филлер
0.38
επίσης
0.38
olve
0.37
vpn
0.37
셩
0.37
тить
0.37
могли
0.37
POSITIVE LOGITS
ya
0.45
de
0.42
自己的
0.42
mío
0.42
mój
0.41
他的
0.38
↵
0.37
ö
0.36
žič
0.36
ка
0.36
Activations Density 0.353%
טוב
ممکن
ελλην
филлер
επίσης
olve
vpn
셩
тить
могли
ya
de
自己的
mío
mój
他的
↵
ö
žič
ка