INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     Fraser
    -0.07
     teste
    -0.06
    iden
    -0.06
     Martins
    -0.06
    keterangan
    -0.06
    -player
    -0.06
    partition
    -0.06
    стру
    -0.06
     sino
    -0.06
     Nixon
    -0.06
    POSITIVE LOGITS
    ↵		↵
    0.07
    _unc
    0.07
     […]↵
    0.06
    Injection
    0.06
     Коли
    0.06
    complete
    0.06
    ↵		
    ↵
    0.06
    0.06
    setFont
    0.06
     حم
    0.06
    Act Density 0.003%

    No Known Activations