INDEX
    Explanations

    prioritize, must, always

    New Auto-Interp
    Negative Logits
     இருக்கலாம்
    0.52
    也可
    0.52
    也可以
    0.50
     indirectly
    0.47
     możemy
    0.47
     olabilir
    0.46
    比較的
    0.45
     можем
    0.44
    也能
    0.44
     undesired
    0.43
    POSITIVE LOGITS
     mutlaka
    1.34
     반드시
    1.30
    必ず
    1.16
     MUST
    1.13
     обязательно
    1.13
    一定要
    1.13
    1.13
     ALWAYS
    1.06
     unbedingt
    1.06
    1.02
    Act Density 0.030%

    No Known Activations