INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    830
    -0.09
     renk
    -0.08
    	m
    -0.08
    859
    -0.08
     hunted
    -0.08
     хол
    -0.08
     esthétique
    -0.07
     consumed
    -0.07
     visión
    -0.07
     terrein
    -0.07
    POSITIVE LOGITS
    措施
    0.19
     safeguards
    0.15
     उपाय
    0.14
     mecanismos
    0.13
     mechanisms
    0.13
    Checks
    0.13
    机制
    0.12
     ব্যবস্থা
    0.12
    maßnahmen
    0.12
     Maßnahmen
    0.12
    Act Density 0.035%

    No Known Activations