INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     anat
    -0.08
    nem
    -0.08
     göz
    -0.08
     просмотр
    -0.08
     Whale
    -0.08
     stere
    -0.07
     PN
    -0.07
     товаров
    -0.07
     водитель
    -0.07
    nier
    -0.07
    POSITIVE LOGITS
     tmpl
    0.08
    tmpl
    0.08
     civilisation
    0.08
     fw
    0.08
     bd
    0.08
     exponential
    0.08
     kw
    0.07
     sql
    0.07
     ভব
    0.07
     civilization
    0.07
    Act Density 0.025%

    No Known Activations