INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    Peak
    -0.07
     років
    -0.07
     Tage
    -0.07
    نة
    -0.07
    --)
    -0.07
     дней
    -0.06
     Going
    -0.06
     rút
    -0.06
     Capt
    -0.06
    \Page
    -0.06
    POSITIVE LOGITS
    ..↵
    0.06
    _COMPONENT
    0.06
    0.06
     underestimated
    0.06
     einfach
    0.06
     Yog
    0.06
     Europa
    0.06
    loub
    0.06
     پیچ
    0.06
    ColorBrush
    0.06
    Act Density 0.021%

    No Known Activations