INDEX
    Explanations

    non-latin script languages

    New Auto-Interp
    Negative Logits
     बस्ती
    0.52
    ɽ
    0.51
     enfant
    0.50
     البيت
    0.50
     mít
    0.49
     bolest
    0.49
     först
    0.48
     ICE
    0.48
     mangiare
    0.48
     sofort
    0.48
    POSITIVE LOGITS
    しまい
    0.50
    டுகின்றன
    0.48
    ッジ
    0.47
    神经
    0.45
    染色
    0.45
    க்கப்படுகிறது
    0.45
    じて
    0.43
    ινε
    0.42
     পড়িয়া
    0.42
    ण्याची
    0.42
    Act Density 0.000%

    No Known Activations