INDEX
    Explanations

    mathematical problem-solving

    New Auto-Interp
    Negative Logits
     Ces
    -0.07
     Iv
    -0.07
     Tong
    -0.07
     hills
    -0.07
     IV
    -0.07
     Vo
    -0.07
     שמת
    -0.07
    _vo
    -0.07
     регулиру
    -0.06
     voi
    -0.06
    POSITIVE LOGITS
    Pairs
    0.12
    pairs
    0.12
    _pairs
    0.11
    Pair
    0.11
     pairs
    0.11
    _PAIR
    0.11
     birbir
    0.11
     Pair
    0.10
     pairing
    0.10
     ipairs
    0.10
    Act Density 0.096%

    No Known Activations