INDEX
    Explanations

    phrases indicating success and positive actions or agreements

    New Auto-Interp
    Negative Logits
    LookAnd
    -0.69
     Infórmanos
    -0.60
    WriteTagHelper
    -0.58
     MenuView
    -0.54
    TagNumber
    -0.54
    ftagPool
    -0.53
     Савезне
    -0.52
     ويكيميديا
    -0.51
     ProtoMessage
    -0.50
     jsPsych
    -0.50
    POSITIVE LOGITS
    Lähteet
    0.35
    évaluateur
    0.34
    wapV
    0.31
    ագրություններ
    0.31
     désolés
    0.30
     nakalista
    0.29
     föres
    0.29
    Kjelder
    0.29
     réserver
    0.28
    pompa
    0.28
    Act Density 0.135%

    No Known Activations