INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     murder
    -0.08
    -0.08
     Miracle
    -0.07
    -0.07
    .pow
    -0.07
    -0.07
    bah
    -0.07
     miracle
    -0.07
     gasp
    -0.07
    มี
    -0.07
    POSITIVE LOGITS
     pitfalls
    0.14
    0.09
    事項
    0.09
    _checks
    0.09
     traps
    0.09
     vigilant
    0.09
     avoided
    0.08
     majeur
    0.08
     الطب
    0.08
     majeure
    0.08
    Act Density 0.005%

    No Known Activations