INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     После
    -0.07
    ؤال
    -0.07
     laid
    -0.07
     Theme
    -0.06
     приня
    -0.06
     πραγμα
    -0.06
     storyline
    -0.06
     retina
    -0.06
     경찰
    -0.06
     Decl
    -0.06
    POSITIVE LOGITS
     shortcut
    0.11
    Shortcut
    0.10
     Shortcut
    0.09
     shortcuts
    0.08
    shortcut
    0.08
     McDonald
    0.07
    0.07
    cuts
    0.06
    roti
    0.06
    onald
    0.06
    Act Density 0.002%

    No Known Activations