INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    。[
    0.81
    lingual
    0.74
     rim
    0.71
    0.68
    0.68
     போக்குவரத்து
    0.66
     dürfte
    0.66
    0.65
    |[
    0.65
    0.64
    POSITIVE LOGITS
     actually
    0.90
     tatsächlich
    0.82
     खरीदते
    0.73
     ternyata
    0.72
     ہمارے
    0.72
    不是
    0.71
     ain
    0.71
    不仅仅
    0.70
    不再
    0.70
     not
    0.69
    Act Density 0.263%

    No Known Activations