INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     genealogy
    -0.08
     sigo
    -0.08
    ميت
    -0.08
     впервые
    -0.08
    azwe
    -0.07
    	length
    -0.07
     dwell
    -0.07
    holt
    -0.07
    issage
    -0.07
    irq
    -0.07
    POSITIVE LOGITS
    答案
    0.09
    正确
    0.08
     Да
    0.08
    符合
    0.08
     Lav
    0.08
     jaune
    0.08
     আপ
    0.08
     Yes
    0.08
     YES
    0.07
    之一
    0.07
    Act Density 0.014%

    No Known Activations