INDEX
    Explanations

    allows certain entities

    New Auto-Interp
    Negative Logits
     එය
    0.47
     അയാള
    0.47
     ĝi
    0.46
    זה
    0.46
     фаразы
    0.45
     বিষয়টা
    0.44
     njegova
    0.43
     وهذا
    0.42
     его
    0.41
    его
    0.41
    POSITIVE LOGITS
     людей
    0.67
     사람들이
    0.59
     people
    0.59
     ludzi
    0.54
     companies
    0.53
     ಜನರು
    0.53
     ludzie
    0.53
    人们
    0.52
     लोगों
    0.51
     люди
    0.50
    Act Density 0.079%

    No Known Activations