INDEX
    Explanations

    City/University names

    New Auto-Interp
    Negative Logits
     repr
    -0.07
     Почем
    -0.07
    -0.07
    .choice
    -0.07
    ということ
    -0.07
    どんど
    -0.06
     nghè
    -0.06
    .external
    -0.06
    -0.06
    公开招聘
    -0.06
    POSITIVE LOGITS
    -written
    0.08
     comunidad
    0.07
    LAT
    0.07
     NONE
    0.07
     (↵↵
    0.07
     Needs
    0.07
     bunker
    0.07
    جزاء
    0.07
    àn
    0.07
    فاء
    0.07
    Act Density 0.044%

    No Known Activations