INDEX
    Explanations

    seeking help or knowledge

    New Auto-Interp
    Negative Logits
     oftent
    0.26
     verwendeten
    0.25
     "-
    0.25
     obwohl
    0.25
     örne
    0.24
     pudi
    0.24
     ebenfalls
    0.24
     eponymous
    0.24
     sofern
    0.24
     Maschine
    0.24
    POSITIVE LOGITS
     tentang
    0.29
     about
    0.28
     عن
    0.25
     आणि
    0.25
     and
    0.24
    และ
    0.23
     zarówno
    0.23
    0.23
     که
    0.23
     về
    0.23
    Act Density 0.059%

    No Known Activations