INDEX
    Explanations

    Portuguese and Spanish words

    New Auto-Interp
    Negative Logits
     проведення
    0.45
    ചെയ്യ
    0.43
     швид
    0.42
     завдання
    0.42
     tzw
    0.41
     ?.
    0.41
     unwillingness
    0.41
     створення
    0.41
    Пі
    0.41
     tzv
    0.41
    POSITIVE LOGITS
     busca
    0.61
     Estados
    0.59
     coloc
    0.58
     asegur
    0.57
     permitir
    0.57
     situação
    0.57
     Ainda
    0.56
    Durante
    0.56
     necesito
    0.56
     época
    0.55
    Act Density 0.001%

    No Known Activations