INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    니까
    -0.08
    986
    -0.07
                                              
    -0.07
     Erasmus
    -0.07
    -Control
    -0.07
    nio
    -0.07
    -command
    -0.07
    -minded
    -0.07
     I've
    -0.07
    ,!
    -0.07
    POSITIVE LOGITS
     space
    0.09
    -space
    0.09
    空间
    0.09
     worlds
    0.09
     Worlds
    0.09
     transforms
    0.08
     transforming
    0.08
     virtual
    0.08
     Gottes
    0.08
    pace
    0.08
    Act Density 0.003%

    No Known Activations