INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    ایج
    -0.06
    yal
    -0.06
    lech
    -0.06
     هواپیم
    -0.06
     squadron
    -0.06
    ]->
    -0.06
    -0.06
    -from
    -0.06
    ippi
    -0.06
    Td
    -0.05
    POSITIVE LOGITS
     collaps
    0.07
     کود
    0.07
     голов
    0.07
     parçası
    0.07
    constants
    0.06
    (encoder
    0.06
    ろう
    0.06
    .CommandType
    0.06
     извест
    0.06
    0.06
    Act Density 0.144%

    No Known Activations