INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    רז
    -0.08
     Fernando
    -0.07
    -0.07
    SERVER
    -0.07
    -0.07
    丽江
    -0.07
    ご覧
    -0.06
    ่าน
    -0.06
    erving
    -0.06
     futuro
    -0.06
    POSITIVE LOGITS
     ?>>
    0.08
    إنتاج
    0.07
    _rules
    0.07
    -user
    0.07
     كيف
    0.07
     authored
    0.07
    	Log
    0.07
     лечение
    0.07
     utilisateur
    0.06
     הספר
    0.06
    Act Density 0.005%

    No Known Activations