INDEX
Negative Logits
isasi
-0.08
ίων
-0.08
trivial
-0.07
常
-0.07
hom
-0.07
用于
-0.07
igir
-0.07
appr
-0.07
parent
-0.07
grades
-0.07
POSITIVE LOGITS
Gucci
0.08
Ski
0.08
این
0.08
ANDING
0.08
scuba
0.08
украш
0.08
بد
0.08
Sculpt
0.08
decadent
0.08
مه
0.08
Activations Density 0.002%