INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     mainline
    0.32
     dinyatakan
    0.31
     Windy
    0.30
     świata
    0.29
     Jar
    0.29
     sprung
    0.29
     boasted
    0.28
     Dioc
    0.28
     MSN
    0.28
     dynamite
    0.28
    POSITIVE LOGITS
    ל
    0.39
    และ
    0.35
     ಮತ್ತು
    0.35
    Ва
    0.35
    และการ
    0.33
     மற்றும்
    0.32
    ра
    0.32
    Та
    0.32
    фектив
    0.31
     כי
    0.31
    Act Density 0.300%

    No Known Activations