INDEX
Negative Logits
-0.07
Sunset
-0.07
.MAX
-0.07
500
-0.06
KING
-0.06
maxX
-0.06
presidents
-0.06
weet
-0.06
thinks
-0.06
sweet
-0.06
POSITIVE LOGITS
Role
0.10
role
0.10
-role
0.09
roleName
0.09
UserRole
0.08
ре
0.08
役
0.08
roles
0.08
.role
0.08
责任
0.07
Activations Density 0.030%