INDEX
Negative Logits
騎
-0.07
aac
-0.06
より
-0.06
ortion
-0.06
_theta
-0.06
unveiled
-0.06
groin
-0.06
同意
-0.06
consent
-0.06
başk
-0.06
POSITIVE LOGITS
.di
0.07
лаж
0.06
.connector
0.06
Delay
0.06
'),
0.06
Він
0.06
.mag
0.06
_Pre
0.06
Я
0.06
pery
0.06
Activations Density 0.002%