INDEX
Negative Logits
baud
-0.07
saving
-0.06
ียน
-0.06
かい
-0.06
懂
-0.06
ares
-0.06
increment
-0.06
xong
-0.06
urus
-0.06
都不
-0.06
POSITIVE LOGITS
FT
0.08
.warning
0.07
effect
0.07
CX
0.07
.start
0.07
box
0.06
DI
0.06
card
0.06
جشن
0.06
misc
0.06
Activations Density 0.011%