INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     पेय
    0.35
     VEH
    0.35
     درباره
    0.34
     비슷
    0.32
     مشابه
    0.32
    办事
    0.32
     фрук
    0.32
    0.32
     scorsa
    0.31
    去年
    0.31
    POSITIVE LOGITS
     bicycles
    0.42
     انواع
    0.41
     automobiles
    0.40
     microphones
    0.39
    世界の
    0.38
     bicicletas
    0.36
    自由に
    0.36
     ambulances
    0.35
     মসজিদের
    0.35
    ilient
    0.35
    Act Density 0.205%

    No Known Activations