INDEX
Explanations
asking for input or possessions
New Auto-Interp
Negative Logits
者は
0.55
率は
0.51
มีความ
0.50
有一种
0.48
者の
0.46
性が
0.46
是一種
0.45
會在
0.45
有一個
0.44
を有
0.44
POSITIVE LOGITS
自己的
0.75
他的
0.63
笑容
0.62
她的
0.61
手中的
0.59
眉头
0.55
你的
0.54
这个
0.53
礼物
0.53
他们的
0.53
Activations Density 0.007%