INDEX
    Explanations

    punctuation or formatting indicators

    New Auto-Interp
    Negative Logits
     etcétera
    0.49
    之类的
    0.45
     میتوان
    0.43
    等等
    0.41
    といった
    0.40
     இங்கே
    0.40
     ebenso
    0.40
     इत्यादि
    0.40
     disini
    0.40
    ல்லாம்
    0.39
    POSITIVE LOGITS
     |
    0.57
    )([
    0.52
     &
    0.50
    0.50
    0.48
    0.47
    。[
    0.47
    )[
    0.45
    +[
    0.45
    /[
    0.45
    Act Density 0.057%

    No Known Activations