INDEX
    Explanations

    greetings and questions

    New Auto-Interp
    Negative Logits
     טוב
    0.40
     ممکن
    0.39
     ελλην
    0.38
    филлер
    0.38
     επίσης
    0.38
    olve
    0.37
    vpn
    0.37
    0.37
    тить
    0.37
     могли
    0.37
    POSITIVE LOGITS
    ya
    0.45
    de
    0.42
    自己的
    0.42
     mío
    0.42
     mój
    0.41
    他的
    0.38
    0.37
    ö
    0.36
    žič
    0.36
    ка
    0.36
    Act Density 0.353%

    No Known Activations