INDEX
Negative Logits
throat
-0.08
aule
-0.07
-0.07
Rad
-0.07
vak
-0.07
allá
-0.07
Cus
-0.07
Randolph
-0.07
Looper
-0.07
dentist
-0.07
POSITIVE LOGITS
成员
0.11
chores
0.10
用品
0.09
惯
0.09
appliances
0.09
affairs
0.09
households
0.08
members
0.08
薪
0.08
belongings
0.08
Activations Density 0.005%