INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     новости
    -0.08
     экспер
    -0.08
     Bung
    -0.07
     frontera
    -0.07
    ేష
    -0.07
    -0.07
     vorstellen
    -0.07
     berichten
    -0.07
    व्य
    -0.07
    ொழ
    -0.07
    POSITIVE LOGITS
    shaft
    0.12
    0.08
     Rotation
    0.08
    itas
    0.08
    0.08
     crank
    0.08
    че
    0.08
    .rotation
    0.07
    143
    0.07
     lantern
    0.07
    Act Density 0.003%

    No Known Activations