INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    ttle
    -0.08
    ature
    -0.07
    łę
    -0.07
    ATURE
    -0.07
    ောင်
    -0.07
    ctype
    -0.07
     Laurent
    -0.07
     signature
    -0.07
     Humber
    -0.07
     lifts
    -0.07
    POSITIVE LOGITS
     spezial
    0.09
    dete
    0.08
    原则
    0.08
    0.08
    0.08
    ,’
    0.08
    	location
    0.08
    德国
    0.07
    0.07
    0.07
    Act Density 0.016%

    No Known Activations