INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    gna
    -0.08
    fig
    -0.08
    -0.07
    Pg
    -0.07
    _cond
    -0.07
     compagn
    -0.07
    ---------↵↵
    -0.07
    pg
    -0.07
    ‌آ
    -0.07
     BJ
    -0.07
    POSITIVE LOGITS
     byose
    0.11
     Happens
    0.11
    0.10
     sucede
    0.10
     passiert
    0.10
     händer
    0.10
     gebeurt
    0.10
     acontecendo
    0.10
     gebeuren
    0.10
     happening
    0.09
    Act Density 0.565%

    No Known Activations