INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     सटे
    2.87
    2.75
    windigkeit
    2.74
    ার
    2.72
    2.67
    ို့
    2.67
     roaring
    2.66
    あります
    2.65
     behold
    2.65
    2.63
    POSITIVE LOGITS
    ва
    3.66
    м
    3.38
    ../../
    3.17
     decía
    3.02
    പ്പെട്ട
    2.89
     koje
    2.84
    راہیم
    2.81
    2.78
    мся
    2.77
     ausgezeichnet
    2.77
    Act Density 0.104%

    No Known Activations