INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    _intro
    -0.08
    chef
    -0.08
    monitor
    -0.08
     gekregen
    -0.08
    iseerde
    -0.08
     মাথ
    -0.08
    urlijke
    -0.07
    ็ม
    -0.07
     gekomen
    -0.07
     Yann
    -0.07
    POSITIVE LOGITS
     الوحدة
    0.09
     الأسرة
    0.08
     धन
    0.08
     Imm
    0.08
     Toute
    0.08
    ्ती
    0.08
     समूह
    0.08
     Relation
    0.08
     tonal
    0.08
     unité
    0.08
    Act Density 0.016%

    No Known Activations