INDEX
Negative Logits
ayn
-0.08
paged
-0.08
Farr
-0.07
yelled
-0.07
paperwork
-0.07
taus
-0.07
aktivit
-0.07
undercover
-0.07
influenced
-0.07
ifies
-0.07
POSITIVE LOGITS
બ
0.09
简单
0.09
-lined
0.08
મૂક
0.08
.Light
0.08
_simple
0.08
_strip
0.08
塘
0.08
басс
0.08
બા
0.08
Activations Density 0.003%