INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     gestalt
    -0.09
    人格
    -0.08
     individ
    -0.08
    եթ
    -0.07
    .Typed
    -0.07
     связи
    -0.07
     Children's
    -0.07
     CR
    -0.07
     verbonden
    -0.07
     встречи
    -0.07
    POSITIVE LOGITS
     spilling
    0.10
     spill
    0.10
     pouring
    0.09
     spills
    0.09
     filling
    0.09
     poured
    0.09
     fillings
    0.09
    -filled
    0.09
     triglycer
    0.08
     spilled
    0.08
    Act Density 0.010%

    No Known Activations