INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     Lua
    -0.07
     velké
    -0.07
     obě
    -0.07
    wave
    -0.07
    inae
    -0.07
     gerne
    -0.07
     clos
    -0.06
     Globe
    -0.06
     fly
    -0.06
     Samuel
    -0.06
    POSITIVE LOGITS
     traction
    0.11
     retract
    0.10
     tractor
    0.09
     المنت
    0.07
    .TO
    0.07
    coat
    0.07
    activ
    0.07
     pract
    0.07
    tract
    0.07
     πραγμα
    0.07
    Act Density 0.004%

    No Known Activations