INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    rüstung
    0.59
    יו
    0.55
    0.54
     zusätzlichen
    0.54
     ruimte
    0.53
     Governo
    0.52
    ື້ນ
    0.52
     Fläche
    0.52
     الص
    0.51
    гра
    0.51
    POSITIVE LOGITS
     because
    0.61
    ก่อน
    0.57
     only
    0.54
     seniority
    0.53
     before
    0.52
    เพียง
    0.52
    ですが
    0.51
     first
    0.50
     beforehand
    0.50
     straightforward
    0.50
    Act Density 0.033%

    No Known Activations