INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    when
    0.52
    如果你
    0.47
     Quando
    0.45
     when
    0.45
    そして
    0.43
     जब
    0.43
     wenn
    0.42
     когда
    0.41
    たちが
    0.41
    私たちは
    0.41
    POSITIVE LOGITS
     alebo
    0.57
     veya
    0.55
    某个
    0.52
     souhaitez
    0.51
     algún
    0.50
     suatu
    0.50
     hoặc
    0.49
     või
    0.49
     nějak
    0.49
     alguno
    0.47
    Act Density 0.350%

    No Known Activations