INDEX
    Explanations

    definitions and explanations

    New Auto-Interp
    Negative Logits
     شدند
    0.43
    0.40
    0.38
    netic
    0.38
    Brun
    0.37
    <unused82>
    0.37
     supplément
    0.37
    πων
    0.37
    บร
    0.37
     обрабо
    0.37
    POSITIVE LOGITS
     is
    1.02
     adalah
    1.02
     merupakan
    0.94
     είναι
    0.88
     является
    0.86
    是一种
    0.80
     represents
    0.80
     has
    0.80
     என்பது
    0.79
    是一个
    0.78
    Act Density 0.078%

    No Known Activations