INDEX
    Explanations

    national domestic violence

    New Auto-Interp
    Negative Logits
    س
    2.73
     noto
    1.70
    larından
    1.62
     Darüber
    1.62
    سلم
    1.61
    どうしても
    1.60
    ネルギー
    1.59
    AD
    1.56
    DA
    1.55
    vät
    1.54
    POSITIVE LOGITS
    𝐢
    1.65
    𝐧
    1.57
    ূট
    1.56
    ли
    1.55
    cracker
    1.52
    𝐠
    1.45
    ல்
    1.44
     strikeouts
    1.44
    unun
    1.42
    1.41
    Act Density 0.148%

    No Known Activations