INDEX
    Explanations

    combat/battles

    New Auto-Interp
    Negative Logits
    ối
    -0.07
     شامل
    -0.07
     Род
    -0.07
    ۱۹۴
    -0.06
     х
    -0.06
     облад
    -0.06
     Kč
    -0.06
     والأ
    -0.06
    (QObject
    -0.06
     дітей
    -0.06
    POSITIVE LOGITS
    remainder
    0.07
    ROT
    0.07
     READY
    0.06
     indirectly
    0.06
    undefined
    0.06
     tempt
    0.06
    getClass
    0.06
    .cursor
    0.06
    599
    0.06
    _emb
    0.06
    Act Density 0.045%

    No Known Activations