INDEX
Negative Logits
Ü
-0.09
疑
-0.08
rosy
-0.08
UC
-0.08
outstanding
-0.08
factual
-0.08
Qing
-0.08
üc
-0.08
cob
-0.07
Mait
-0.07
POSITIVE LOGITS
Pers
0.08
Pers
0.08
Occup
0.07
Fib
0.07
Till
0.07
Invoke
0.07
mener
0.07
pers
0.07
Incorporated
0.07
emission
0.07
Activations Density 0.001%