INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    जर
    -0.09
    إذا
    -0.09
    ?
    -0.08
    ?.↵↵
    -0.08
     ?↵↵
    -0.08
    ?-
    -0.08
    备注
    -0.08
    ्ड
    -0.07
     ":
    -0.07
    жал
    -0.07
    POSITIVE LOGITS
     vielmehr
    0.11
     durchaus
    0.11
     degelijk
    0.11
     гораздо
    0.11
     faktisk
    0.11
     faktiskt
    0.11
     totiž
    0.10
     Contrary
    0.09
     소비
    0.08
     genauso
    0.08
    Act Density 0.112%

    No Known Activations