INDEX
Explanations
adjectives in Russian -н- and Latin -n
New Auto-Interp
Negative Logits
တွေကို
0.64
ষণ
0.63
olaire
0.63
сси
0.62
whal
0.61
Inu
0.61
ాత్రి
0.61
થો
0.60
balo
0.59
செல்சியஸ்
0.59
POSITIVE LOGITS
ный
1.34
ные
1.33
ное
1.33
ным
1.18
ному
1.15
ного
1.11
ная
1.10
ny
1.09
ными
1.04
ную
1.00
Activations Density 0.051%