INDEX
Negative Logits
銥
0.52
綃
0.52
磧
0.51
釹
0.50
TableHeader
0.50
杣
0.49
drivetrain
0.49
並沒有
0.48
ักษณะ
0.48
鰓
0.48
POSITIVE LOGITS
填
0.67
英语
0.56
句子
0.55
中国
0.53
【
0.53
【
0.52
(
0.52
①
0.52
Китай
0.52
选择
0.51
Activations Density 0.003%
銥
綃
磧
釹
TableHeader
杣
drivetrain
並沒有
ักษณะ
鰓
填
英语
句子
中国
【
【
(
①
Китай
选择