INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     пока
    -0.09
    ubl
    -0.09
    直到
    -0.08
     rutin
    -0.08
    Routine
    -0.08
    -bal
    -0.07
    mir
    -0.07
    ubby
    -0.07
    ivati
    -0.07
    ubal
    -0.07
    POSITIVE LOGITS
     خطوات
    0.09
    പ്പെട്ട
    0.08
     kw
    0.08
    0.07
     шаг
    0.07
     kern
    0.07
     мом
    0.07
     قص
    0.07
     момен
    0.07
    0.07
    Act Density 0.006%

    No Known Activations