INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     socialism
    -0.08
     astonishing
    -0.08
     hectic
    -0.08
    বল
    -0.08
     culp
    -0.07
    awk
    -0.07
     mauvais
    -0.07
     ansch
    -0.07
    -0.07
    SCR
    -0.07
    POSITIVE LOGITS
     جدًا
    0.12
     جداً
    0.12
    പ്പെട്ട
    0.12
     banget
    0.11
     ביותר
    0.10
     indrindra
    0.09
    事项
    0.09
    niejszych
    0.09
     kakhulu
    0.08
     מאוד
    0.08
    Act Density 0.030%

    No Known Activations