INDEX
    Explanations

    word endings: -ness, -ism, -ia

    New Auto-Interp
    Negative Logits
    س
    0.74
    ş
    0.66
    0.63
    อร์
    0.61
    0.60
    0.59
    िक
    0.58
    gambar
    0.58
    ع
    0.56
    0.56
    POSITIVE LOGITS
    ,
    0.66
    ;
    0.66
    />}/>
    0.61
    .
    0.61
    ,​
    0.61
    ​.
    0.60
     WARRANTIES
    0.57
    0.54
    .\\
    0.54
    ]).
    0.53
    Act Density 0.072%

    No Known Activations