INDEX
    Explanations

    intensifying comparisons

    New Auto-Interp
    Negative Logits
     अपेक्षाकृत
    0.54
     Relatively
    0.40
     довольно
    0.38
     относительно
    0.36
     досить
    0.35
     Somewhat
    0.34
    相对
    0.34
    比較的
    0.34
     möglichst
    0.33
    较低
    0.33
    POSITIVE LOGITS
     more
    0.89
     worse
    0.75
     better
    0.60
     mores
    0.59
     stronger
    0.58
     יותר
    0.55
    more
    0.54
     healthier
    0.54
     más
    0.52
     fier
    0.52
    Act Density 0.040%

    No Known Activations