INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     linear
    -0.08
     स्ट्र
    -0.08
     قام
    -0.08
     unfor
    -0.07
    حية
    -0.07
     만드는
    -0.07
     inconvenient
    -0.07
     ABC
    -0.07
     playground
    -0.07
     Inline
    -0.07
    POSITIVE LOGITS
     বন
    0.09
     nuit
    0.08
    0.08
    _Per
    0.08
     ночь
    0.08
     tranquill
    0.08
     priv
    0.08
     ರಾತ್ರಿ
    0.08
    0.08
     രാത്ര
    0.08
    Act Density 0.003%

    No Known Activations