INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     خوف
    0.21
    GEBURTS
    0.21
     განს
    0.21
    0.20
    0.20
     רק
    0.20
    0.20
     Fleurit
    0.20
     מי
    0.20
    utiérrez
    0.20
    POSITIVE LOGITS
          
    0.24
                  
    0.21
     political
    0.21
    ,
    0.21
    ="
    0.20
    [
    0.19
    _[
    0.18
                
    0.18
    =[
    0.18
     organizations
    0.18
    Act Density 0.313%

    No Known Activations