INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     Wein
    -0.08
    ICOS
    -0.08
    itaka
    -0.07
     illusion
    -0.07
     הב
    -0.07
     beitr
    -0.07
     היח
    -0.07
    Zap
    -0.07
    -0.07
     préd
    -0.07
    POSITIVE LOGITS
     gesucht
    0.07
     Cre
    0.07
     gekeken
    0.07
    jy
    0.07
     Reports
    0.07
    anse
    0.07
     ru
    0.07
     gaan
    0.07
    0.07
     generado
    0.07
    Act Density 0.001%

    No Known Activations