INDEX
    Explanations

    quantifiers or descriptors followed by specifics

    New Auto-Interp
    Negative Logits
     êtres
    0.38
     त्यांना
    0.36
     kullanılır
    0.35
     தற்போது
    0.35
    zwischen
    0.35
     Meski
    0.34
     Bedür
    0.34
     Deutsch
    0.33
    0.33
    }$.
    0.33
    POSITIVE LOGITS
     examples
    0.47
     comparisons
    0.44
    (!)
    0.43
     specifics
    0.42
     (!)
    0.42
    级别的
    0.42
    版本的
    0.42
     ক্ষেত্রেই
    0.42
     versions
    0.42
     specific
    0.40
    Act Density 0.080%

    No Known Activations