INDEX
    Explanations

    describing quality or state

    New Auto-Interp
    Negative Logits
     waardoor
    0.46
     wodurch
    0.46
     ermöglicht
    0.46
     permettent
    0.44
    iteits
    0.44
    recogn
    0.41
    plemente
    0.41
    造成的
    0.41
    とはいえ
    0.41
     menyebabkan
    0.40
    POSITIVE LOGITS
     பெரும்பாலும்
    0.54
     غال
    0.51
     کمتر
    0.50
     अक्सर
    0.48
     controversial
    0.46
     generalmente
    0.46
     genellikle
    0.44
     بیشتر
    0.43
     ఎక్కువగా
    0.43
     చాలా
    0.42
    Act Density 0.072%

    No Known Activations