INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    Campo
    -0.07
    ملة
    -0.07
     inve
    -0.07
    χή
    -0.06
     unto
    -0.06
     armour
    -0.06
    elez
    -0.06
    -0.06
     боку
    -0.06
     относится
    -0.06
    POSITIVE LOGITS
     especific
    0.06
    ποίηση
    0.06
     SOLD
    0.06
     ром
    0.06
    .forRoot
    0.06
    ニニニニ
    0.05
     toString
    0.05
    ;;;
    0.05
    ูร
    0.05
    cycle
    0.05
    Act Density 0.064%

    No Known Activations