INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    0.82
    ל
    0.80
    ב
    0.77
    0.73
    ات
    0.69
    ה
    0.67
    0.66
    r
    0.65
    0.64
    0.64
    POSITIVE LOGITS
    0.63
    för
    0.56
     Éd
    0.54
     REIT
    0.53
    funktionen
    0.52
     HAS
    0.49
     functie
    0.48
     CAD
    0.48
     HIP
    0.47
     Hälfte
    0.46
    Act Density 0.000%

    No Known Activations