INDEX
Negative Logits
plut
-0.08
icha
-0.07
ekli
-0.07
neutr
-0.07
osex
-0.07
又
-0.07
бав
-0.07
Kauf
-0.06
Integration
-0.06
수로
-0.06
POSITIVE LOGITS
Rangers
0.17
Ranger
0.16
ranger
0.15
Harrison
0.09
ург
0.07
amber
0.07
Jenna
0.07
ather
0.07
anger
0.07
official
0.07
Activations Density 0.002%