INDEX
    Explanations

    best or perfect options

    New Auto-Interp
    Negative Logits
     najważ
    0.59
    最も
    0.57
    สำคัญ
    0.57
     가장
    0.54
     مهم
    0.50
     najbardziej
    0.50
    最重要的
    0.50
     सबसे
    0.47
    คัญ
    0.47
     найбіль
    0.46
    POSITIVE LOGITS
     perfect
    0.68
     melhores
    0.68
     mejores
    0.63
     better
    0.62
     Perfect
    0.58
    更好的
    0.56
     PERFECT
    0.56
     meilleurs
    0.55
    better
    0.54
    perfect
    0.54
    Act Density 0.003%

    No Known Activations