INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     Ged
    -0.09
     gamb
    -0.08
     fo
    -0.08
     worldwide
    -0.08
     Erd
    -0.07
     certainty
    -0.07
     cousin
    -0.07
     terem
    -0.07
    η
    -0.07
     επι
    -0.07
    POSITIVE LOGITS
     bich
    0.08
     bun
    0.08
     Hanover
    0.08
    quo
    0.08
    蒙古
    0.07
    Mur
    0.07
     quo
    0.07
     Pu
    0.07
    0.07
     cass
    0.07
    Act Density 0.009%

    No Known Activations