INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     sebagai
    0.98
     selaku
    0.91
     kao
    0.86
     Sebagai
    0.86
     sesuai
    0.76
     jako
    0.76
     έτσι
    0.73
     као
    0.72
    }^{+}+
    0.69
    中で
    0.69
    POSITIVE LOGITS
     us
    1.29
     ass
    0.93
     has
    0.87
     aspirin
    0.86
     ask
    0.86
     asas
    0.83
     preguntar
    0.82
     нас
    0.80
     dass
    0.80
     az
    0.80
    Act Density 0.047%

    No Known Activations