INDEX
Negative Logits
<span
-0.08
parks
-0.07
鲀
-0.07
Ŋ
-0.07
Ben
-0.07
بغ
-0.07
桀
-0.07
拟定
-0.07
Cls
-0.07
havoc
-0.07
POSITIVE LOGITS
k
0.07
健康
0.07
~
0.07
werde
0.07
技術
0.07
治療
0.07
::::
0.06
roi
0.06
probe
0.06
触及
0.06
Activations Density 0.012%
<span
parks
鲀
Ŋ
Ben
بغ
桀
拟定
Cls
havoc
k
健康
~
werde
技術
治療
::::
roi
probe
触及