INDEX
Negative Logits
adalah
0.78
también
0.72
είναι
0.70
aren
0.70
também
0.70
são
0.67
might
0.67
essentially
0.66
praticamente
0.66
bukanlah
0.66
POSITIVE LOGITS
进行
0.90
用
0.81
做
0.76
做出
0.73
提供
0.70
提高
0.70
進行
0.70
使用
0.69
增加
0.66
利用
0.66
Activations Density 0.048%