INDEX
Negative Logits
|#
-0.08
%%
-0.07
dumb
-0.07
thoughtful
-0.07
GetCurrent
-0.07
côté
-0.07
applaud
-0.07
Cobb
-0.07
Tran
-0.06
ctrl
-0.06
POSITIVE LOGITS
奥林匹克
0.07
ߊ
0.07
önemli
0.07
清朝
0.07
.from
0.07
waste
0.06
expenses
0.06
Hold
0.06
cow
0.06
𝒿
0.06
Activations Density 0.162%