INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    λό
    -0.07
     nebezpeč
    -0.06
    อดภ
    -0.06
    _ios
    -0.06
    ос
    -0.06
    niest
    -0.06
     Γεω
    -0.06
     грн
    -0.06
     gratuit
    -0.06
    Intensity
    -0.06
    POSITIVE LOGITS
     neither
    0.14
     Neither
    0.11
    Neither
    0.08
    --[
    0.08
     Сем
    0.07
    166
    0.06
     neut
    0.06
     Für
    0.06
    seek
    0.06
    anie
    0.06
    Act Density 0.004%

    No Known Activations