INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    ังก์ชัน
    1.06
    رك
    1.05
    ায়
    1.02
     forth
    1.00
    ו
    1.00
    ある
    0.99
    stuffs
    0.97
    ুল
    0.95
    ขั้นตอน
    0.94
    oja
    0.93
    POSITIVE LOGITS
    Foto
    1.07
     izquierdo
    1.07
     oeste
    1.05
    0
    1.05
     unha
    1.02
     refleja
    1.00
    0.98
     comienzan
    0.97
     छोर
    0.96
     fuera
    0.95
    Act Density 0.120%

    No Known Activations