INDEX
Negative Logits
lima
-0.08
Madam
-0.08
والعمل
-0.08
Elaine
-0.08
Otto
-0.08
Mae
-0.08
Simply
-0.07
에서도
-0.07
Malibu
-0.07
540
-0.07
POSITIVE LOGITS
办法
0.10
方案
0.09
_ie
0.08
措施
0.08
determined
0.07
帖
0.07
不了
0.07
normative
0.07
spruce
0.07
steun
0.07
Activations Density 0.003%