INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    fish
    -0.07
     load
    -0.07
     rad
    -0.07
     restaurant
    -0.07
    Pel
    -0.07
     conference
    -0.07
     eat
    -0.07
    -0.07
     Pel
    -0.07
     पह
    -0.07
    POSITIVE LOGITS
     אליו
    0.11
     إليه
    0.11
     обращ
    0.09
     إليها
    0.09
     взыск
    0.09
     ува
    0.09
    lichkeiten
    0.08
    사항
    0.08
     внимания
    0.08
     Ú
    0.08
    Act Density 0.010%

    No Known Activations