INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    快速
    -0.10
    健康
    -0.09
    -0.08
     zdrow
    -0.08
    _VALUE
    -0.08
    返回
    -0.08
    .quick
    -0.08
    -0.08
    疾病
    -0.07
    -0.07
    POSITIVE LOGITS
     батар
    0.09
     Feuerwehr
    0.08
     repairs
    0.08
     Repar
    0.08
     repairing
    0.08
     Vic
    0.08
     любви
    0.08
     bond
    0.08
     Saturday
    0.07
     Calvin
    0.07
    Act Density 0.007%

    No Known Activations