INDEX
    Explanations

    recognizing understanding you

    New Auto-Interp
    Negative Logits
     terhadap
    0.82
    cannot
    0.75
     אשר
    0.73
     කිරීමට
    0.71
     następnie
    0.68
     mempunyai
    0.68
     करण्याचा
    0.67
    または
    0.67
    することができる
    0.67
     대하여
    0.66
    POSITIVE LOGITS
     semantics
    1.02
     sarcasm
    1.01
     anecdotal
    0.92
     cyn
    0.91
     hindsight
    0.89
     nostalgia
    0.89
     cynical
    0.88
     rhetorical
    0.87
     sarcastic
    0.86
     irony
    0.81
    Act Density 0.178%

    No Known Activations