INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     intermédiaire
    0.54
    0.53
     коэффици
    0.51
    0.51
    0.50
     дверь
    0.50
    tní
    0.49
    ٹن
    0.48
    ıları
    0.48
    0.48
    POSITIVE LOGITS
    China
    1.39
     China
    1.37
     Chinese
    1.25
    Chinese
    1.23
     중국
    1.20
     中国
    1.14
    Beijing
    1.14
     चीन
    1.13
     الصين
    1.13
    中国
    1.12
    Act Density 0.040%

    No Known Activations