INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     liebsten
    -0.08
    useum
    -0.08
    하는
    -0.07
    .average
    -0.07
    urge
    -0.07
     کردن
    -0.07
     nursing
    -0.07
    .Response
    -0.07
     ನಾಗ
    -0.07
    -0.07
    POSITIVE LOGITS
     দেখা
    0.08
     أنها
    0.08
     أنه
    0.08
    ట్టి
    0.07
     видно
    0.07
     tensions
    0.07
     gef
    0.07
     দেখি
    0.07
    иат
    0.07
    	It
    0.07
    Act Density 0.030%

    No Known Activations