INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     fiel
    -0.08
    护理
    -0.08
    üste
    -0.08
     головы
    -0.07
     oce
    -0.07
     faucet
    -0.07
    <(
    -0.07
     ух
    -0.07
    教材
    -0.07
    -0.07
    POSITIVE LOGITS
     સમય
    0.10
     time
    0.09
    (time
    0.09
     वेळ
    0.09
     समय
    0.09
    Timed
    0.09
     시간
    0.09
     الزمن
    0.09
     时间
    0.09
    	time
    0.09
    Act Density 0.002%

    No Known Activations