INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     derzeit
    0.86
    0.82
    ර්
    0.82
     lawan
    0.79
    ardust
    0.77
    knopf
    0.75
    aufnahme
    0.74
     ""){
    0.73
     memutuskan
    0.73
    geschoss
    0.72
    POSITIVE LOGITS
    0.92
    0.82
    0.81
    0.81
    0.78
    0.73
     第一
    0.72
    ใน
    0.71
    0.70
     pp
    0.70
    Act Density 0.002%

    No Known Activations