INDEX
Negative Logits
ode
-0.09
cập
-0.08
ventilation
-0.08
grout
-0.08
departures
-0.08
eten
-0.08
_ACCEPT
-0.08
ACCEPT
-0.08
截止
-0.08
deterioration
-0.08
POSITIVE LOGITS
Rollen
0.09
角色
0.09
beings
0.09
(Role
0.09
reinc
0.09
incarn
0.09
.Role
0.08
الول
0.08
ಪಾತ್ರ
0.08
roles
0.08
Activations Density 0.008%