INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    -0.08
    तान
    -0.08
    -0.08
     ICT
    -0.08
     Rol
    -0.07
    bread
    -0.07
     bere
    -0.07
     moy
    -0.07
     rekening
    -0.07
     ladies
    -0.07
    POSITIVE LOGITS
     بينها
    0.08
     بين
    0.08
    กับ
    0.08
    一下
    0.08
    0.07
    不上
    0.07
    wealth
    0.07
     سرعة
    0.07
     secretary
    0.07
    isons
    0.07
    Act Density 0.030%

    No Known Activations