INDEX
    Explanations

    polskie czasowniki i przymiotniki

    New Auto-Interp
    Negative Logits
    0.41
    ंका
    0.39
    ändigen
    0.38
    গারে
    0.38
    lah
    0.38
    수인
    0.37
    LAH
    0.37
    اتے
    0.37
     complicate
    0.37
     ক্লে
    0.36
    POSITIVE LOGITS
    zy
    0.95
    zenie
    0.91
    sz
    0.86
    zenia
    0.85
    z
    0.82
    ze
    0.80
    rz
    0.78
    zeczy
    0.78
    0.78
    zz
    0.75
    Act Density 0.002%

    No Known Activations