INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     Raven
    -0.08
     Meadow
    -0.07
     consolidate
    -0.07
     SELF
    -0.07
    NEY
    -0.07
    之外
    -0.07
     mini
    -0.07
     Wrest
    -0.07
    -St
    -0.07
    heids
    -0.07
    POSITIVE LOGITS
     ಇದೇ
    0.09
     इसी
    0.08
     यही
    0.08
     válida
    0.08
     vậy
    0.08
     اسی
    0.08
     역시
    0.08
    ovní
    0.07
     Janu
    0.07
     Ds
    0.07
    Act Density 0.040%

    No Known Activations