INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     желуд
    -0.07
    obsolete
    -0.06
    -intensive
    -0.06
    _po
    -0.06
     names
    -0.06
    _NC
    -0.06
     металли
    -0.06
     finanční
    -0.05
     creation
    -0.05
    _NON
    -0.05
    POSITIVE LOGITS
    ways
    0.10
    way
    0.09
     corridors
    0.08
     roadway
    0.08
    yang
    0.08
     corridor
    0.08
    ridor
    0.08
    WAY
    0.07
    away
    0.07
     رفتار
    0.07
    Act Density 0.010%

    No Known Activations