INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     untuk
    0.71
    Untuk
    0.65
     Untuk
    0.63
     
    0.62
     ligeramente
    0.61
    untuk
    0.61
    เพื่อ
    0.59
     для
    0.58
     entgegen
    0.58
     -
    0.57
    POSITIVE LOGITS
    經歷
    0.73
     경험
    0.70
    ioribus
    0.70
     학습
    0.69
    歴史
    0.68
     lifetimes
    0.66
     upbringing
    0.66
    经历
    0.65
    mıştır
    0.65
     배웠
    0.64
    Act Density 0.004%

    No Known Activations