INDEX
    Explanations

    German/Russian, WWII

    New Auto-Interp
    Negative Logits
    -0.08
     کند
    -0.08
     Tengah
    -0.08
     அத
    -0.08
     postal
    -0.07
     Teller
    -0.07
    所得
    -0.07
     Shock
    -0.07
     oral
    -0.07
     Oral
    -0.07
    POSITIVE LOGITS
     wat
    0.09
     Wat
    0.08
     Fc
    0.07
     Unreal
    0.07
    కు
    0.07
    izi
    0.07
     NBC
    0.07
     bleed
    0.07
    levard
    0.07
    Wat
    0.07
    Act Density 0.002%

    No Known Activations