INDEX
    Explanations

    provides code functionality

    New Auto-Interp
    Negative Logits
     azonban
    0.14
    {
    0.14
     tetapi
    0.14
     ancak
    0.13
     ngayon
    0.12
     عبارت
    0.12
    ですが
    0.11
    ::
    0.11
     sljede
    0.11
     était
    0.11
    POSITIVE LOGITS
     Allows
    0.23
    для
    0.21
    Allows
    0.19
    untuk
    0.19
     Provides
    0.19
     тобто
    0.19
    Provides
    0.19
    important
    0.18
    provides
    0.18
    allowing
    0.18
    Act Density 1.267%

    No Known Activations