INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    ixon
    -0.08
     fancy
    -0.08
     det
    -0.08
    ise
    -0.07
     Junction
    -0.07
    331
    -0.07
    最准
    -0.07
    320
    -0.07
     szczeg
    -0.07
     fringe
    -0.07
    POSITIVE LOGITS
     വീണ്ടും
    0.15
     повтор
    0.14
     erneut
    0.14
     반복
    0.13
     tekrar
    0.13
    再次
    0.13
     ಬಾರಿ
    0.13
     ಮತ್ತೆ
    0.12
     repetir
    0.12
     opnieuw
    0.12
    Act Density 0.158%

    No Known Activations