INDEX
    Explanations

    Russian/Ukrainian adjective/noun formation

    New Auto-Interp
    Negative Logits
    르는
    0.54
    čního
    0.53
    드를
    0.52
    ټبال
    0.50
    kového
    0.50
    ämän
    0.49
    années
    0.48
    ক্টর
    0.48
    উন্ট
    0.48
    čních
    0.48
    POSITIVE LOGITS
    ный
    1.48
    ное
    1.45
    ные
    1.40
    ность
    1.33
    ными
    1.26
    ным
    1.25
    ная
    1.20
    ных
    1.19
    ной
    1.13
    ний
    1.12
    Act Density 0.017%

    No Known Activations