INDEX
    Explanations

    chooses, decides, takes, uses

    New Auto-Interp
    Negative Logits
     являются
    0.41
     является
    0.38
    0.38
     είναι
    0.36
     appartiennent
    0.34
    都是
    0.34
     হলো
    0.34
    เป็น
    0.33
     belong
    0.33
    :
    0.33
    POSITIVE LOGITS
     chose
    0.53
     chooses
    0.50
     gunakan
    0.47
     bruke
    0.46
     bruge
    0.45
     take
    0.43
     выбира
    0.43
     ṣe
    0.42
     puts
    0.42
     decides
    0.42
    Act Density 0.096%

    No Known Activations