INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    esthes
    -0.06
    -0.06
    Affected
    -0.06
     Fly
    -0.06
     Primitive
    -0.06
     Thế
    -0.06
     étaient
    -0.06
    kills
    -0.06
    -hot
    -0.06
    erer
    -0.06
    POSITIVE LOGITS
     gv
    0.07
    ΙΑ
    0.06
    ObjectContext
    0.06
     ослож
    0.06
     ffm
    0.06
    	canvas
    0.06
     tracer
    0.06
    itempty
    0.06
     имеют
    0.06
     DW
    0.06
    Act Density 0.081%

    No Known Activations