INDEX
    Explanations

    patterns indicating context or definition

    New Auto-Interp
    Negative Logits
     figures
    0.79
     international
    0.78
    0.78
     International
    0.75
     the
    0.73
     
    0.73
     Food
    0.73
    ف
    0.72
     Mass
    0.71
     Size
    0.71
    POSITIVE LOGITS
     теркәлү
    0.89
     высоко
    0.87
     собственных
    0.86
    ных
    0.86
     aquellas
    0.85
     режисс
    0.85
    类型的
    0.84
     continuación
    0.83
     осуществляется
    0.83
     выбор
    0.82
    Act Density 0.001%

    No Known Activations