INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    န္
    -0.08
    зі
    -0.08
     either
    -0.08
     Xiaomi
    -0.08
    ্যাট
    -0.07
     enten
    -0.07
    idet
    -0.07
     xil
    -0.07
     Ze
    -0.07
    z
    -0.07
    POSITIVE LOGITS
    ировки
    0.11
    ировку
    0.11
    ировка
    0.10
    Polyline
    0.08
    ierungen
    0.08
    erring
    0.08
    ીર
    0.08
    ierung
    0.08
     Poly
    0.08
    φάλ
    0.08
    Act Density 0.001%

    No Known Activations