INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     участников
    -0.09
    ynd
    -0.09
    Anybody
    -0.09
     Anybody
    -0.08
    ynau
    -0.08
     обещ
    -0.08
     Yusuf
    -0.08
    imat
    -0.08
     yos
    -0.08
    ukk
    -0.08
    POSITIVE LOGITS
    661
    0.11
    791
    0.11
    914
    0.11
    739
    0.10
    207
    0.10
    722
    0.10
    507
    0.10
     รุ่น
    0.10
    931
    0.09
    262
    0.09
    Act Density 0.009%

    No Known Activations