INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     الفني
    -0.08
    ugod
    -0.08
     afr
    -0.07
     פור
    -0.07
     பண
    -0.07
     ит
    -0.07
     جيدة
    -0.07
     nozzle
    -0.07
     bode
    -0.07
     нов
    -0.07
    POSITIVE LOGITS
     masyarakat
    0.08
     Pale
    0.08
     milieu
    0.08
     tric
    0.08
    Gang
    0.08
     gang
    0.07
     neurop
    0.07
    .gold
    0.07
     âge
    0.07
    0.07
    Act Density 0.007%

    No Known Activations