INDEX
Negative Logits
환
-0.09
trat
-0.08
豊
-0.08
.Ok
-0.08
안
-0.08
ribbons
-0.08
baan
-0.07
помочь
-0.07
aider
-0.07
스크
-0.07
POSITIVE LOGITS
(<
0.09
hụ
0.09
(<
0.09
hesitate
0.08
priced
0.08
represented
0.08
-carb
0.08
shy
0.08
不足
0.08
-priced
0.08
Activations Density 0.021%