INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     spheres
    -0.08
     zahlen
    -0.08
    ਦਾ
    -0.07
     verstehen
    -0.07
     duten
    -0.07
     multi
    -0.07
    ಕ್ಟ
    -0.07
     ausgest
    -0.07
     følgende
    -0.07
    ład
    -0.07
    POSITIVE LOGITS
     വീണ്ടും
    0.14
     ಮತ್ತೆ
    0.12
    再次
    0.12
     ફરી
    0.12
     tekrar
    0.12
     repetir
    0.11
    重复
    0.10
     wieder
    0.10
     erneut
    0.10
     снова
    0.10
    Act Density 0.079%

    No Known Activations