INDEX
    Explanations

    personal pronouns

    New Auto-Interp
    Negative Logits
    /find
    -0.07
     ideologies
    -0.07
     jails
    -0.06
    urgery
    -0.06
     today
    -0.06
    _aspect
    -0.06
     trips
    -0.06
     हज
    -0.06
    	col
    -0.06
    tréal
    -0.06
    POSITIVE LOGITS
    μφωνα
    0.07
     dealloc
    0.07
     wcs
    0.07
    Productos
    0.06
    .tpl
    0.06
    λία
    0.06
    واج
    0.06
     Ав
    0.06
     compiling
    0.06
     Auto
    0.06
    Act Density 0.087%

    No Known Activations