INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    >∕
    0.27
    專業
    0.26
    引っ
    0.26
    収入
    0.26
    0.26
    0.26
    0.26
     erstmal
    0.25
     drawdown
    0.25
     xAxis
    0.25
    POSITIVE LOGITS
     spelling
    0.39
     vowels
    0.38
    e
    0.37
     Spelling
    0.31
     e
    0.29
     spelled
    0.29
    C
    0.28
     consonants
    0.28
     misspelled
    0.28
     p
    0.27
    Act Density 0.083%

    No Known Activations