INDEX
    Explanations

    computer code

    New Auto-Interp
    Negative Logits
    -0.08
     הגיע
    -0.07
    -0.07
     расположен
    -0.07
     הממשלה
    -0.07
    哪里
    -0.07
     Ngân
    -0.07
     pcs
    -0.07
    重温
    -0.07
    ".↵↵↵↵
    -0.07
    POSITIVE LOGITS
    0.08
    thè
    0.07
     controlling
    0.07
    0.07
    צועי
    0.06
     наблю
    0.06
    (arg
    0.06
    -to
    0.06
    𝓊
    0.06
    	be
    0.06
    Act Density 0.012%

    No Known Activations