INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    สูง
    -0.09
     boom
    -0.08
     cad
    -0.08
    ையில்
    -0.08
    --------------------------------------------------------------------------------
    -0.07
     подар
    -0.07
     thank
    -0.07
    -0.07
    Multiplier
    -0.07
     nebude
    -0.07
    POSITIVE LOGITS
    成立
    0.10
     proposition
    0.09
     hypotheses
    0.09
     premise
    0.09
     विधान
    0.09
     hypothesis
    0.09
    _condition
    0.09
     predicates
    0.08
    0.08
     concernant
    0.08
    Act Density 0.019%

    No Known Activations