INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     umana
    0.59
    :《
    0.59
     toekomst
    0.58
     Methoden
    0.57
     لي
    0.54
    твори
    0.54
    0.54
     cárcel
    0.54
     Потом
    0.54
     Socialism
    0.54
    POSITIVE LOGITS
     thereof
    0.97
    这一
    0.96
     তিনিও
    0.95
     them
    0.93
    它可以
    0.93
     এটির
    0.89
    kannya
    0.88
    这家
    0.85
     उनसे
    0.85
    這一
    0.84
    Act Density 0.853%

    No Known Activations