INDEX
Negative Logits
anlat
-0.07
сохра
-0.07
مباش
-0.07
metry
-0.06
έν
-0.06
开展
-0.06
nursery
-0.06
здійсню
-0.06
.SC
-0.06
λέ
-0.06
POSITIVE LOGITS
cd
0.07
orp
0.06
UserID
0.06
Wilmington
0.06
Hin
0.06
Harmony
0.06
ger
0.06
(+
0.06
Dyn
0.06
joints
0.06
Activations Density 0.002%