INDEX
Negative Logits
Mahal
-0.08
Fo
-0.08
leaps
-0.08
asylum
-0.07
Bos
-0.07
Watson
-0.07
illuminating
-0.07
wonderful
-0.07
人生
-0.07
appr
-0.07
POSITIVE LOGITS
starch
0.08
ust
0.08
genomen
0.07
тв
0.07
492
0.07
كون
0.07
ISR
0.07
Falk
0.07
these
0.07
fractions
0.07
Activations Density 0.013%