INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     initially
    1.19
    初期
    1.16
     memulai
    1.07
     изначально
    1.05
     Initially
    1.05
    まずは
    1.04
     初期
    1.02
     enfin
    1.02
     finally
    1.02
     впервые
    1.01
    POSITIVE LOGITS
     touches
    1.49
    ity
    1.31
    ization
    1.26
    izes
    1.24
     Tou
    1.21
    izing
    1.21
    ización
    1.13
    ize
    1.13
    touches
    1.12
    izó
    1.11
    Act Density 0.043%

    No Known Activations