INDEX
    Explanations

    common words

    New Auto-Interp
    Negative Logits
    гел
    -0.08
     judging
    -0.08
     απαι
    -0.08
    lela
    -0.08
    hag
    -0.07
    ക്ക്
    -0.07
    -ils
    -0.07
    面对
    -0.07
    -0.07
    ರೂ
    -0.07
    POSITIVE LOGITS
     raining
    0.12
     habido
    0.11
     ezie
    0.11
     geschafft
    0.09
     alsof
    0.09
     माना
    0.08
     fallu
    0.08
     rains
    0.08
     matter
    0.08
     been
    0.08
    Act Density 0.626%

    No Known Activations