INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    uced
    -0.08
     Estou
    -0.08
    ামী
    -0.08
    çal
    -0.07
    otiv
    -0.07
    	gbc
    -0.07
     অক
    -0.07
    	rc
    -0.07
    -0.07
    แรง
    -0.07
    POSITIVE LOGITS
     noun
    0.10
     verb
    0.09
    ಿಸಲು
    0.08
     whim
    0.08
     nouns
    0.08
     umgesetzt
    0.08
     route
    0.08
     resolver
    0.08
    实现
    0.08
    resolution
    0.07
    Act Density 0.003%

    No Known Activations