INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    1.71
    れる
    1.68
     リュック
    1.61
    س
    1.59
    ہ
    1.59
    ع
    1.56
    1.52
    وز
    1.50
    ピンク
    1.45
    られる
    1.43
    POSITIVE LOGITS
    Rubber
    1.80
    rubber
    1.61
    ASS
    1.55
    ANAL
    1.47
    lovely
    1.46
    AN
    1.45
    enza
    1.42
     وعلى
    1.42
    Gov
    1.42
    volley
    1.42
    Act Density 0.007%

    No Known Activations