INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     degree
    -0.08
     карточ
    -0.08
    ED
    -0.07
    azini
    -0.07
    程度
    -0.06
    -0.06
    ää
    -0.06
     promised
    -0.06
     árbit
    -0.06
     الزمن
    -0.06
    POSITIVE LOGITS
     winds
    0.09
    Graw
    0.09
     ura
    0.08
     Tup
    0.08
     miejsce
    0.08
     מן
    0.08
     surrounds
    0.08
     transverse
    0.08
     কেউ
    0.08
     MUL
    0.08
    Act Density 0.005%

    No Known Activations