INDEX
    Explanations

    introduces definitions or clarifications

    New Auto-Interp
    Negative Logits
     Tuttavia
    1.54
    Однако
    1.52
    ätz
    1.50
    ācijas
    1.44
    etric
    1.43
    IDER
    1.42
    ະລ
    1.40
    altro
    1.38
    。"
    1.38
    Ț
    1.35
    POSITIVE LOGITS
     不是
    1.28
     osobe
    1.09
     konuda
    1.09
    1.06
     如果
    1.05
    你要
    1.05
     osoby
    1.05
     πως
    1.05
     personer
    1.02
    你想
    1.02
    Act Density 0.151%

    No Known Activations