INDEX
    Explanations

    harmful, and conjunctions

    New Auto-Interp
    Negative Logits
     The
    0.96
     hela
    0.93
     Consultado
    0.92
     "";
    0.87
     bardzo
    0.86
     całej
    0.86
     get
    0.85
     cały
    0.85
     był
    0.85
     grund
    0.84
    POSITIVE LOGITS
     and
    1.65
     आणि
    1.46
     மற்றும்
    1.45
    そして
    1.44
     ಮತ್ತು
    1.41
     અને
    1.41
     और
    1.40
    และ
    1.38
     และ
    1.37
     మరియు
    1.36
    Act Density 1.350%

    No Known Activations