INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    Connexion
    -0.08
     calcium
    -0.07
     minds
    -0.07
    north
    -0.07
    =params
    -0.07
     κρί
    -0.07
     vole
    -0.07
     torne
    -0.07
    Obrigado
    -0.07
     Congresso
    -0.07
    POSITIVE LOGITS
    名称
    0.11
     제목
    0.10
    标题
    0.10
    0.09
     이름
    0.09
    正文
    0.09
    タイトル
    0.09
    编号
    0.08
     전체
    0.08
     번호
    0.08
    Act Density 0.005%

    No Known Activations