INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    由来
    0.36
     อื่น
    0.35
    ση
    0.32
     mennesker
    0.32
     pertanian
    0.32
    อื่น
    0.31
     फीसदी
    0.30
    0.30
     مطالعه
    0.30
     gasto
    0.29
    POSITIVE LOGITS
    如下
    1.05
     다음과
    0.92
     Voici
    0.90
     निम्नलिखित
    0.87
     Berikut
    0.86
    以下の
    0.84
     berikut
    0.83
    以下
    0.83
    下記
    0.82
    Berikut
    0.82
    Act Density 0.886%

    No Known Activations