INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     Nasional
    -0.08
    แห่ง
    -0.07
     maxime
    -0.07
     കേരള
    -0.07
    اتر
    -0.07
     Σύ
    -0.07
    gern
    -0.07
     IPA
    -0.07
     ಕರ್ನಾಟಕ
    -0.07
     multiples
    -0.07
    POSITIVE LOGITS
    лава
    0.08
     хто
    0.07
     tankou
    0.07
     HALF
    0.07
     Sham
    0.07
    _____
    0.07
     blond
    0.07
    POL
    0.07
    bab
    0.07
    лет
    0.07
    Act Density 0.016%

    No Known Activations