INDEX
Negative Logits
同時
-0.08
時
-0.07
discuss
-0.07
nte
-0.07
日
-0.06
día
-0.06
(render
-0.06
citing
-0.06
ское
-0.06
formulated
-0.06
POSITIVE LOGITS
Exclusive
0.07
outcry
0.07
我爱你
0.07
abilities
0.07
חומ
0.07
ﺗ
0.07
Abby
0.07
我喜欢
0.07
翛
0.06
!")
0.06
Activations Density 0.002%