INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     först
    -0.08
     Bird
    -0.08
    ]_
    -0.08
    biz
    -0.08
     wijn
    -0.07
    ////////////////////////////////////////////////////////////////////////
    -0.07
     Agoda
    -0.07
     weave
    -0.07
     dvd
    -0.07
     mj
    -0.07
    POSITIVE LOGITS
     resemblance
    0.11
     imitate
    0.10
     समान
    0.09
    -esque
    0.09
     likeness
    0.09
    0.09
    -like
    0.08
     तरह
    0.08
     sembl
    0.08
     ähn
    0.08
    Act Density 0.117%

    No Known Activations