INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    rafpunkte
    0.65
    kopp
    0.65
     রানের
    0.65
    medallas
    0.64
    instruction
    0.63
     xanth
    0.63
     montaña
    0.61
    จทย์
    0.61
    isal
    0.60
    teren
    0.60
    POSITIVE LOGITS
    HAR
    0.55
    V
    0.54
     HAR
    0.52
     V
    0.52
    नल
    0.50
    HS
    0.50
    0.50
    0.49
    har
    0.49
     Hiz
    0.49
    Act Density 0.316%

    No Known Activations