INDEX
    Explanations
    New Auto-Interp
    Negative Logits
                            
    -1.18
                  
    -1.17
               
    -1.16
    I
    -1.16
              
    -1.15
    T
    -1.15
                                   
    -1.14
                 
    -1.13
    p
    -1.13
             
    -1.11
    POSITIVE LOGITS
     this
    1.21
     cappello
    1.18
     оригі
    1.16
    Elekt
    1.15
    jando
    1.13
    colgante
    1.13
    istán
    1.12
     camisas
    1.09
     използва
    1.07
     використання
    1.06
    Act Density 0.020%

    No Known Activations