INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     Blood
    -0.08
     blood
    -0.07
    Blood
    -0.07
    ;background
    -0.07
     lo
    -0.06
     ifad
    -0.06
    表情
    -0.06
     Motion
    -0.06
     retorno
    -0.06
    156
    -0.06
    POSITIVE LOGITS
     대한민국
    0.08
    ál
    0.08
     bạn
    0.07
    owner
    0.07
     Сан
    0.07
    -owned
    0.07
     UN
    0.07
    320
    0.07
     Sau
    0.07
    ún
    0.07
    Act Density 0.057%

    No Known Activations