INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     ਨਾ
    -0.10
     člov
    -0.09
     Faust
    -0.08
    liš
    -0.08
     Steck
    -0.08
    ljenja
    -0.08
    beans
    -0.08
     அல்ல
    -0.08
     абсолютно
    -0.08
     фак
    -0.08
    POSITIVE LOGITS
     colors
    0.09
     pastel
    0.09
    0.09
     couleurs
    0.08
     emitted
    0.08
     colores
    0.08
     lighting
    0.08
     Farben
    0.08
     hues
    0.08
    颜色
    0.08
    Act Density 0.012%

    No Known Activations