INDEX
    Explanations

    countries and languages

    New Auto-Interp
    Negative Logits
    ających
    0.93
    ające
    0.90
    ającym
    0.80
    ającej
    0.79
    ającą
    0.78
    ający
    0.77
    ńskiej
    0.74
    ześnie
    0.74
    Κα
    0.72
    szyst
    0.70
    POSITIVE LOGITS
     С
    0.88
     К
    0.88
     с
    0.81
     де
    0.80
     О
    0.80
    С
    0.80
     İ
    0.79
     о
    0.78
     да
    0.77
     и
    0.77
    Act Density 0.001%

    No Known Activations