INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     Compressed
    0.44
     시스템
    0.43
     sistema
    0.42
     systeem
    0.42
     levers
    0.41
     مسلح
    0.41
     дальнейшем
    0.41
     referendum
    0.41
     tankers
    0.40
    0.40
    POSITIVE LOGITS
     sart
    0.48
     نیچے
    0.45
    front
    0.43
     היה
    0.42
    ต้น
    0.41
    ına
    0.40
    seye
    0.40
     przede
    0.40
     właśnie
    0.39
     zit
    0.39
    Act Density 0.001%

    No Known Activations