INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     hin
    -0.08
     ek
    -0.08
    opin
    -0.08
    كه
    -0.07
    emens
    -0.07
     فعل
    -0.07
    FXML
    -0.07
    مش
    -0.07
     ihn
    -0.07
     Ingl
    -0.07
    POSITIVE LOGITS
    ical
    0.11
     metaphor
    0.10
    0.09
     vascular
    0.08
    ery
    0.08
     بیان
    0.08
     لط
    0.07
    orical
    0.07
    /wp
    0.07
     Vita
    0.07
    Act Density 0.011%

    No Known Activations