INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    TextNode
    -0.06
     ку
    -0.06
    мотря
    -0.06
    obre
    -0.06
     Teddy
    -0.06
    	          
    -0.05
     authoritative
    -0.05
     contentType
    -0.05
     fontSize
    -0.05
    ographies
    -0.05
    POSITIVE LOGITS
    xl
    0.07
    0.07
    [length
    0.06
    ๊ก
    0.06
     ef
    0.06
    -groups
    0.06
    balanced
    0.06
     SENSOR
    0.06
    řed
    0.06
    =g
    0.06
    Act Density 0.017%

    No Known Activations