INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     виправивши
    -0.86
     فريبيس
    -0.81
    المشاركات
    -0.77
     Réponses
    -0.76
     חיצוניים
    -0.73
    extAlignment
    -0.72
     незавершена
    -0.71
     autorytatywna
    -0.70
    expandindo
    -0.70
    مصادر
    -0.69
    POSITIVE LOGITS
    BoxShadow
    0.54
     homes
    0.42
     Sir
    0.40
    ef
    0.39
     Homes
    0.39
     min
    0.39
     ap
    0.38
     rule
    0.38
    ={()
    0.38
    drucks
    0.38
    Act Density 0.124%

    No Known Activations