INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    ۔
    1.55
    1.26
    ی
    1.24
     on
    1.13
    1.11
    ב
    1.05
    تر
    1.04
    تين
    1.03
    ும்போது
    1.03
    ين
    0.97
    POSITIVE LOGITS
    Age
    1.21
    ER
    1.16
    EN
    1.00
     age
    0.98
    0
    0.97
    ;
    0.97
     AGE
    0.91
     Age
    0.89
    ir
    0.89
    AK
    0.87
    Act Density 0.031%

    No Known Activations