INDEX
Negative Logits
nuts
-0.07
暹
-0.07
lando
-0.07
Tri
-0.07
enses
-0.07
郸
-0.07
תיא
-0.07
uffling
-0.06
troubled
-0.06
转型发展
-0.06
POSITIVE LOGITS
surrogate
0.07
editor
0.06
desert
0.06
powerful
0.06
月中旬
0.06
yt
0.06
airflow
0.06
virus
0.06
vật
0.06
quantitative
0.06
Activations Density 0.004%