INDEX
    Explanations

    purpose or explanation context

    New Auto-Interp
    Negative Logits
    สำหรับ
    0.43
     सांस्कृतिक
    0.36
    عنوان
    0.36
     från
    0.35
     ആരോഗ്യ
    0.35
    我对
    0.34
     Schriftsteller
    0.34
    ünstler
    0.34
     स्कूली
    0.33
     konuda
    0.33
    POSITIVE LOGITS
     כדי
    0.48
    使其
    0.45
     afin
    0.42
    เพื่อให้
    0.42
     allowing
    0.41
     adds
    0.41
     ensuring
    0.40
     giving
    0.40
    Чтобы
    0.40
     ώστε
    0.40
    Act Density 0.312%

    No Known Activations