INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     untersch
    -0.08
     thaim
    -0.08
     perception
    -0.08
     لدينا
    -0.08
    λα
    -0.08
     হাত
    -0.08
    タイ
    -0.08
     expenditure
    -0.08
    ော်
    -0.08
     percept
    -0.08
    POSITIVE LOGITS
     BONUS
    0.08
    VU
    0.08
     UVA
    0.07
     Djokovic
    0.07
    -debug
    0.07
    'U
    0.07
    .FILE
    0.07
     Fahrenheit
    0.07
    ʻ
    0.07
    ënd
    0.07
    Act Density 0.006%

    No Known Activations