INDEX
    Explanations

    former, latter, respectively, both

    New Auto-Interp
    Negative Logits
    把它
    0.43
    ʹ
    0.36
     notation
    0.35
     താര
    0.34
    TL
    0.34
    0.33
    0.33
     application
    0.33
    वाडी
    0.33
     അതിന്റെ
    0.33
    POSITIVE LOGITS
    前者
    1.38
    后者
    1.02
     latter
    0.87
    それぞれ
    0.86
     begge
    0.82
     respectivement
    0.80
     respectively
    0.79
     beide
    0.79
     keduanya
    0.79
     entrambi
    0.77
    Act Density 0.962%

    No Known Activations