INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     debt
    -0.08
    Debt
    -0.08
     friv
    -0.08
    Sinon
    -0.08
     bureaucr
    -0.08
     Debt
    -0.08
     добров
    -0.08
     reflux
    -0.08
     narc
    -0.07
     арен
    -0.07
    POSITIVE LOGITS
     फोटो
    0.10
     ছবি
    0.10
    .tensor
    0.09
     JPEG
    0.09
     ફોટ
    0.09
     interpretar
    0.09
     GPT
    0.09
    处理
    0.09
    	image
    0.09
    	input
    0.09
    Act Density 0.011%

    No Known Activations