INDEX
Negative Logits
feelings
-0.09
LR
-0.08
ensitivity
-0.08
Opacity
-0.08
ereich
-0.08
sensitivity
-0.07
discern
-0.07
Lip
-0.07
横
-0.07
Sensitivity
-0.07
POSITIVE LOGITS
Robertson
0.10
progres
0.09
'?
0.08
裸
0.08
'=',
0.08
pendientes
0.08
unfinished
0.08
pussy
0.08
nol
0.08
terminar
0.08
Activations Density 0.001%