INDEX
Negative Logits
、
-0.27
äºij端
-0.27
veau
-0.27
/modal
-0.26
MED
-0.26
主è¦ģé¢Ĩ导
-0.25
hour
-0.25
ä¼ģä¸ļåıijå±ķ
-0.25
imonial
-0.25
’h
-0.24
POSITIVE LOGITS
quirer
0.27
eken
0.27
onsense
0.26
anth
0.26
serializers
0.26
inder
0.25
angers
0.25
gar
0.25
tg
0.25
vere
0.25
Activations Density 0.005%