INDEX
    Explanations

    computation

    New Auto-Interp
    Negative Logits
    #
    -0.08
     Fing
    -0.08
    _idle
    -0.07
     verbr
    -0.07
    Alle
    -0.07
     Brink
    -0.07
    χν
    -0.07
     alve
    -0.07
    -0.07
    ##
    -0.07
    POSITIVE LOGITS
     concret
    0.12
     konkr
    0.11
     concrete
    0.11
    具体
    0.11
     конкрет
    0.11
     específicos
    0.11
    _specific
    0.10
    specific
    0.10
     plug
    0.10
     التنفيذ
    0.10
    Act Density 0.153%

    No Known Activations