INDEX
    Explanations

    phrases indicating source or origin

    New Auto-Interp
    Negative Logits
     policiales
    -0.38
    ptonshire
    -0.38
     Schauspielerin
    -0.37
    digheid
    -0.37
     présidenti
    -0.36
     tutkim
    -0.36
     operativa
    -0.36
     zoude
    -0.35
    фициальный
    -0.35
     déput
    -0.35
    POSITIVE LOGITS
     from
    0.77
    tagHelperRunner
    0.65
    จาก
    0.64
    getFrom
    0.63
    出自
    0.63
    from
    0.59
     från
    0.58
    來自
    0.57
     FROM
    0.55
    FROM
    0.55
    Act Density 0.384%

    No Known Activations