INDEX
    Explanations

    listing and conjunctions

    New Auto-Interp
    Negative Logits
    :
    0.48
    .
    0.48
    ?
    0.42
    ,
    0.42
     
    0.40
    ;
    0.38
    0.37
    )
    0.37
    '
    0.34
    =
    0.33
    POSITIVE LOGITS
    including
    0.39
    そして
    0.37
    ിക്കുകയും
    0.36
    ക്കുകയും
    0.34
    尤其是
    0.34
    များနှင့်
    0.34
     जिसमें
    0.33
    以及
    0.33
    ുകയും
    0.32
    tono
    0.32
    Act Density 0.005%

    No Known Activations