INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    PAGE
    -0.07
     beetle
    -0.07
     analysis
    -0.07
     بگ
    -0.06
     analy
    -0.06
    ān
    -0.06
     rapor
    -0.06
    	layer
    -0.06
     UNIX
    -0.06
     bakış
    -0.06
    POSITIVE LOGITS
    uers
    0.09
    urther
    0.07
     nombre
    0.07
    (nome
    0.06
     names
    0.06
    θηκε
    0.06
     مقدم
    0.06
     endeavors
    0.06
     interfere
    0.06
     inspir
    0.06
    Act Density 0.011%

    No Known Activations