INDEX
Explanations
phrases related to conditions that trigger alerts or user notifications
conditional or contrastive statements introducing consequences or alternatives.
New Auto-Interp
Negative Logits
孩子们
-0.52
Editors
-0.48
fathers
-0.47
人たち
-0.47
同学们
-0.47
rrggbb
-0.47
girls
-0.46
Managers
-0.46
énieurs
-0.46
Controllers
-0.45
POSITIVE LOGITS
這位
1.14
这位
1.10
此人
1.05
这个人
1.02
person
0.99
那个人
0.99
那人
0.98
對方
0.88
pessoa
0.84
这人
0.82
Activations Density 1.326%