INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     frappe
    -0.09
    asana
    -0.08
     allocator
    -0.08
     أدوات
    -0.08
     kär
    -0.07
     procédures
    -0.07
    	opt
    -0.07
    -0.07
     føroys
    -0.07
     الجهات
    -0.07
    POSITIVE LOGITS
     hollow
    0.09
     MOR
    0.08
    KA
    0.07
     satisfactor
    0.07
     Sér
    0.07
     surprising
    0.07
     сери
    0.07
     accomplishing
    0.07
     simplic
    0.07
    (PR
    0.07
    Act Density 0.021%

    No Known Activations