INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    בוד
    -0.09
    τη
    -0.08
    צריך
    -0.08
     საჭირო
    -0.08
    ต้อง
    -0.08
     geïnteresseerd
    -0.08
     Fisch
    -0.08
    atge
    -0.08
     welkom
    -0.07
    -Luc
    -0.07
    POSITIVE LOGITS
     آنها
    0.08
     ored
    0.08
     ধারণ
    0.07
     آن
    0.07
     চাক
    0.07
     mother's
    0.07
     stø
    0.06
     وغير
    0.06
     esan
    0.06
    Json
    0.06
    Act Density 0.004%

    No Known Activations