INDEX
Negative Logits
Morrison
-0.07
积极性
-0.07
茅
-0.07
amble
-0.07
ERT
-0.06
�
-0.06
Пар
-0.06
�
-0.06
Suppose
-0.06
(et
-0.06
POSITIVE LOGITS
團隊
0.07
$temp
0.06
位于
0.06
のように
0.06
Be
0.06
门口
0.06
疼
0.06
站在
0.06
тебя
0.06
archetype
0.06
Activations Density 0.002%