INDEX
    Explanations

    explaining nuanced situations

    New Auto-Interp
    Negative Logits
     сказали
    0.36
    0.35
     рассчиты
    0.34
    гии
    0.34
    כ
    0.34
    0.33
     އަ
    0.32
     intends
    0.32
    aternion
    0.32
    irez
    0.32
    POSITIVE LOGITS
     yaşam
    0.40
     především
    0.38
     جائے۔
    0.37
     sobretudo
    0.37
     tourisme
    0.36
     głównie
    0.36
     principalement
    0.36
     rather
    0.35
    Gaming
    0.35
     möglichst
    0.35
    Act Density 0.198%

    No Known Activations