INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     заработ
    -0.08
     Sun
    -0.08
     sunscreen
    -0.08
     sunflower
    -0.07
     ornament
    -0.07
    이크
    -0.07
    ystore
    -0.07
     understanding
    -0.07
    errer
    -0.07
    crib
    -0.07
    POSITIVE LOGITS
    剧情
    0.13
    小說
    0.12
     сюжет
    0.12
    小说
    0.11
    0.10
     sequel
    0.10
    电视剧
    0.10
     الفيلم
    0.10
     фильма
    0.10
     داستان
    0.09
    Act Density 0.192%

    No Known Activations