INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    érature
    0.52
    ataya
    0.47
     물질
    0.46
    берриз
    0.42
     Abschnitt
    0.42
    ersiz
    0.42
     pédicule
    0.42
    0.42
     vaisseaux
    0.42
    と思いますが
    0.41
    POSITIVE LOGITS
    s
    0.55
    In
    0.47
    *.
    0.47
    மெ
    0.47
    .*
    0.46
    所有
    0.44
    in
    0.44
     for
    0.43
    .**
    0.43
    For
    0.42
    Act Density 0.004%

    No Known Activations