INDEX
    Explanations

    listing or descriptions of categories

    New Auto-Interp
    Negative Logits
     species
    0.38
    ряду
    0.38
    helia
    0.38
    species
    0.35
     برقرار
    0.35
     Species
    0.35
     osc
    0.34
     Ryd
    0.34
     Pl
    0.34
     nine
    0.34
    POSITIVE LOGITS
    لح
    0.48
    হাস
    0.45
     крас
    0.44
     biased
    0.43
     சிவப்பு
    0.43
     chin
    0.42
     красный
    0.42
    0.42
     sèche
    0.42
     fenó
    0.41
    Act Density 0.002%

    No Known Activations