INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     svenska
    -0.07
    _side
    -0.07
    ográf
    -0.07
     serve
    -0.07
     crossword
    -0.07
     Spare
    -0.07
     přen
    -0.07
    alker
    -0.06
     spectacle
    -0.06
    igsaw
    -0.06
    POSITIVE LOGITS
    Init
    0.11
     init
    0.10
    .init
    0.09
    _init
    0.09
    ]initWith
    0.09
    INIT
    0.08
    _deinit
    0.08
    init
    0.08
     reset
    0.08
     Init
    0.08
    Act Density 0.017%

    No Known Activations