INDEX
    Explanations

    agreements and rules

    New Auto-Interp
    Negative Logits
    lungs
    -0.08
    obyl
    -0.07
     impulse
    -0.07
     rogue
    -0.07
     BED
    -0.07
    dyn
    -0.07
     Bürger
    -0.07
    ::::
    -0.07
     goût
    -0.07
    -0.07
    POSITIVE LOGITS
    Pieces
    0.08
    。ただ
    0.08
    raf
    0.08
    。其中
    0.08
     Embassy
    0.08
     المؤ
    0.08
     কারণ
    0.07
     अंदर
    0.07
     Pieces
    0.07
    netje
    0.07
    Act Density 0.053%

    No Known Activations