INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     Caribbean
    -0.09
    加勒比
    -0.09
     Caribe
    -0.08
     Aruba
    -0.08
     Angola
    -0.08
     nadat
    -0.08
     مباشر
    -0.08
     waarvan
    -0.07
     Malawi
    -0.07
    actics
    -0.07
    POSITIVE LOGITS
     日本
    0.14
    ,日本
    0.13
    Japan
    0.13
     Japan
    0.13
     japones
    0.13
     Jepang
    0.13
     japonais
    0.13
     जाप
    0.13
     Japón
    0.12
     jap
    0.12
    Act Density 0.065%

    No Known Activations