INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    frauen
    -0.07
    frontend
    -0.07
     společně
    -0.06
    aghetti
    -0.06
    .has
    -0.06
     latex
    -0.06
    _chat
    -0.06
    ERSIST
    -0.06
     obligatory
    -0.06
    -n
    -0.06
    POSITIVE LOGITS
    	public
    0.10
     public
    0.09
     انتقال
    0.07
    หนด
    0.07
    ++++++++
    0.07
     Conscious
    0.07
    	cout
    0.07
     Public
    0.07
    、今
    0.07
    。今
    0.07
    Act Density 0.017%

    No Known Activations