INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     Stub
    -0.09
    stub
    -0.08
    Stub
    -0.08
     disadvantages
    -0.08
    -je
    -0.08
    Ign
    -0.08
     ceci
    -0.07
     aftermath
    -0.07
     alleged
    -0.07
     aki
    -0.07
    POSITIVE LOGITS
    0.08
     διαφορε
    0.08
     actieve
    0.08
     Pot
    0.08
    /from
    0.07
     bowl
    0.07
     pot
    0.07
     separ
    0.07
     Περι
    0.07
     περι
    0.07
    Act Density 0.003%

    No Known Activations