INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    ද්ග
    0.42
    ನಾಟಕ
    0.37
     weit
    0.36
     langt
    0.36
    ূনতম
    0.36
     जुर्मा
    0.35
    ائف
    0.34
    0.34
    ौसी
    0.33
    စည်း
    0.33
    POSITIVE LOGITS
     color
    4.09
     colour
    3.75
     colors
    3.70
    color
    3.69
    Color
    3.52
     Color
    3.52
    颜色
    3.47
     رنگ
    3.39
    3.36
     colours
    3.33
    Act Density 0.233%

    No Known Activations