INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    ರುತ್ತದೆ
    0.61
     आहे
    0.53
     становится
    0.51
     becomes
    0.51
     ఉంటుంది
    0.51
    ступает
    0.50
     آهي
    0.50
     ஏற்படுகிறது
    0.48
    ındadır
    0.48
     है
    0.48
    POSITIVE LOGITS
     sebelum
    0.74
     before
    0.71
     قبل
    0.69
     была
    0.69
     לפני
    0.66
     była
    0.66
     ছিল
    0.66
     voordat
    0.65
     était
    0.65
     ήταν
    0.64
    Act Density 0.020%

    No Known Activations