INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     atmos
    -0.08
     crashing
    -0.08
    _pat
    -0.08
     ch
    -0.07
     jäm
    -0.07
     ennen
    -0.07
     SARS
    -0.07
    േക്ക
    -0.07
     sper
    -0.07
     Vend
    -0.07
    POSITIVE LOGITS
     inglesa
    0.09
    -Alpes
    0.09
     francesa
    0.09
    irie
    0.08
     grip
    0.08
    ska
    0.08
    0.08
     Circle
    0.08
    
    0.08
    0.08
    Act Density 0.002%

    No Known Activations