INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     visitation
    -0.08
     recul
    -0.08
     playback
    -0.08
     vəzi
    -0.07
     activation
    -0.07
     بهدف
    -0.07
     возникает
    -0.07
     פת
    -0.07
    dagen
    -0.07
    -0.07
    POSITIVE LOGITS
     counted
    0.12
     accounted
    0.10
     categ
    0.09
     categoría
    0.09
     Categories
    0.08
    “五
    0.08
     CATEGORY
    0.08
    カテゴ
    0.08
    categor
    0.08
     kategori
    0.08
    Act Density 0.040%

    No Known Activations