INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     زیست
    -0.08
    在线观看
    -0.07
     이것
    -0.07
     бума
    -0.06
     bon
    -0.06
     homo
    -0.06
    ประถม
    -0.06
                                                                             
    -0.06
    FlatButton
    -0.06
     перен
    -0.06
    POSITIVE LOGITS
     faculty
    0.12
     Faculty
    0.11
    Faculty
    0.10
    INV
    0.06
     gerade
    0.06
     Vis
    0.06
     Fee
    0.06
    fte
    0.06
     DAC
    0.06
     troop
    0.06
    Act Density 0.004%

    No Known Activations