INDEX
Negative Logits
hermanos
-0.08
:\
-0.07
DSL
-0.07
contraception
-0.07
{}↵↵-0.07
Geb
-0.07
validating
-0.07
positieve
-0.07
ומש
-0.07
retaining
-0.07
POSITIVE LOGITS
quil
0.09
脸
0.09
-faced
0.08
Naked
0.08
Cris
0.08
complexion
0.08
Cruc
0.08
blonde
0.08
perfectly
0.08
ニング
0.08
Activations Density 0.008%