INDEX
    Explanations

    will follow

    New Auto-Interp
    Negative Logits
    89
    -0.08
    .Game
    -0.07
     yüz
    -0.07
    ifes
    -0.07
    /Game
    -0.07
    .Depth
    -0.07
     koszt
    -0.07
     şəkildə
    -0.07
    .Restr
    -0.07
    .State
    -0.07
    POSITIVE LOGITS
     تأتي
    0.10
     incidental
    0.09
     يأتي
    0.09
    أما
    0.09
     كنت
    0.08
     vanzelf
    0.08
     consequência
    0.08
     لاح
    0.08
    أتي
    0.08
     تعد
    0.08
    Act Density 0.025%

    No Known Activations