INDEX
Negative Logits
Por
-0.07
pour
-0.07
exact
-0.07
dug
-0.07
cro
-0.06
auc
-0.06
成本
-0.06
butto
-0.06
poker
-0.06
أفضل
-0.06
POSITIVE LOGITS
ondrous
0.07
烈士
0.07
晚年
0.07
주시
0.07
discredit
0.07
biết
0.07
Manager
0.07
Bound
0.07
疁
0.06
眼界
0.06
Activations Density 0.029%