INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    -0.08
     suppose
    -0.08
    zeigen
    -0.08
    2
    -0.07
     forum
    -0.07
     freeze
    -0.07
     भोज
    -0.07
    -0.07
    17
    -0.07
     smaller
    -0.07
    POSITIVE LOGITS
     веса
    0.09
     Seniors
    0.09
     mmetụta
    0.09
     количества
    0.08
     суммы
    0.08
     Verkä
    0.08
     центра
    0.08
     алког
    0.08
     Арх
    0.08
     chrét
    0.08
    Act Density 0.001%

    No Known Activations