INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     phon
    -0.09
    hadow
    -0.08
    βά
    -0.08
     repression
    -0.08
     muod
    -0.08
    humidity
    -0.08
    physical
    -0.08
     Buddhism
    -0.08
     teas
    -0.07
    -0.07
    POSITIVE LOGITS
     VBA
    0.13
     automate
    0.12
     автомат
    0.11
     automatique
    0.11
     automat
    0.11
     自动
    0.10
    自动
    0.10
     자동
    0.10
     autom
    0.10
     automatisch
    0.10
    Act Density 0.009%

    No Known Activations