INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    로나
    -0.08
    chr
    -0.07
     maut
    -0.07
     listrik
    -0.07
     connaît
    -0.07
    antaine
    -0.07
     sponsor
    -0.07
     legislative
    -0.07
    ன்
    -0.07
    -0.07
    POSITIVE LOGITS
     scales
    0.13
     levels
    0.10
    (scale
    0.10
    .scale
    0.10
    Levels
    0.10
    尺度
    0.09
     Levels
    0.09
    	scale
    0.09
     šk
    0.09
    .zoom
    0.09
    Act Density 0.005%

    No Known Activations