INDEX
    Explanations

    list of items and explanations

    New Auto-Interp
    Negative Logits
     เพื่อ
    0.49
     желательно
    0.48
    เพื่อ
    0.47
    னுடன்
    0.46
     моя
    0.46
    ເພື່ອ
    0.46
     иногда
    0.46
     ancak
    0.45
     저는
    0.45
     वाटते
    0.45
    POSITIVE LOGITS
     those
    0.47
    ؤس
    0.44
     تلك
    0.44
     rouge
    0.43
     quei
    0.42
    ုံး
    0.42
     publishers
    0.41
    imap
    0.41
     pharmacies
    0.41
    closure
    0.40
    Act Density 0.005%

    No Known Activations