INDEX
    Explanations

    characters discover things

    New Auto-Interp
    Negative Logits
     الفور
    0.45
     hacerlo
    0.42
    したり
    0.41
     correspondingly
    0.40
     також
    0.39
     потім
    0.39
     później
    0.39
     также
    0.39
    робнее
    0.39
     نیز
    0.39
    POSITIVE LOGITS
     accidentally
    0.79
     discovers
    0.71
     suddenly
    0.70
     desperately
    0.69
     tasked
    0.65
     hired
    0.63
     woke
    0.63
     случайно
    0.62
     menemukan
    0.62
     shipwreck
    0.61
    Act Density 0.032%

    No Known Activations