INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     stature
    -0.09
    یکار
    -0.08
    იკური
    -0.08
    կար
    -0.08
    ప్పుడు
    -0.08
     العقل
    -0.08
    ələb
    -0.08
     einstellen
    -0.08
     attainable
    -0.08
     کلی
    -0.07
    POSITIVE LOGITS
     Bened
    0.08
    und
    0.08
    unds
    0.08
    Nig
    0.08
     fluoride
    0.08
    .rabbit
    0.07
     Und
    0.07
     Tul
    0.07
     vowel
    0.07
    leva
    0.07
    Act Density 0.000%

    No Known Activations