INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     inherently
    -0.08
    Brasil
    -0.08
     prospect
    -0.07
     adap
    -0.07
    phony
    -0.07
    전을
    -0.07
     basée
    -0.07
    ักษ
    -0.07
    の記事
    -0.07
     tailoring
    -0.07
    POSITIVE LOGITS
     somm
    0.09
    	double
    0.09
    Votes
    0.08
    <double
    0.08
    FLAG
    0.08
    -double
    0.08
     Somm
    0.08
    αιν
    0.08
    double
    0.08
    _double
    0.08
    Act Density 0.003%

    No Known Activations