INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    Everybody
    -0.08
    ۾
    -0.08
     eins
    -0.08
    -0.08
    нож
    -0.08
     اللح
    -0.08
     неё
    -0.08
     ағ
    -0.08
     शक्ति
    -0.08
     conséquent
    -0.08
    POSITIVE LOGITS
    haft
    0.08
    664
    0.07
    pun
    0.07
    Tra
    0.07
    857
    0.07
    place
    0.07
     wok
    0.07
     jurisdiction
    0.07
    CALE
    0.07
    াইট
    0.07
    Act Density 0.002%

    No Known Activations