INDEX
    Explanations

    abstract concepts and descriptions

    New Auto-Interp
    Negative Logits
     مذکور
    0.47
     này
    0.46
     tertentu
    0.45
     lätt
    0.44
    ใหญ่
    0.44
     معمولی
    0.43
     Japón
    0.43
     hidrógeno
    0.43
     مقدس
    0.42
     nào
    0.41
    POSITIVE LOGITS
     sự
    0.84
     những
    0.71
     các
    0.69
     việc
    0.67
    ความ
    0.63
     nguồn
    0.61
    ຄວາມ
    0.59
     các
    0.58
    สิ่งที่
    0.58
     phần
    0.55
    Act Density 0.010%

    No Known Activations