INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    ీక
    -0.08
     cheese
    -0.08
     fis
    -0.08
     geom
    -0.08
     geometric
    -0.07
    غراف
    -0.07
    水果
    -0.07
    phon
    -0.07
    geom
    -0.07
     biome
    -0.07
    POSITIVE LOGITS
    мила
    0.11
    min
    0.10
    .Min
    0.10
    Min
    0.10
     Min
    0.10
    ,min
    0.10
     min
    0.09
    _min
    0.09
    zac
    0.09
    .min
    0.09
    Act Density 0.001%

    No Known Activations