INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    0
    1.23
    .
    1.20
    -
    1.16
    ,
    1.13
    ;
    1.11
    }\
    1.05
    UT
    1.01
    3
    1.01
    RO
    0.97
    ..
    0.95
    POSITIVE LOGITS
    1.22
     ی
    1.21
    یت
    1.21
    dengan
    1.20
    and
    1.18
    я
    1.16
    ۵
    1.16
    ک
    1.14
     سیاسی
    1.13
    ि
    1.13
    Act Density 0.000%

    No Known Activations