INDEX
Negative Logits
�
-0.07
asian
-0.06
CORD
-0.06
quent
-0.06
-ren
-0.06
eren
-0.06
Respond
-0.06
Respond
-0.06
ad
-0.06
cor
-0.06
POSITIVE LOGITS
My
0.18
My
0.16
my
0.16
"My
0.12
MY
0.12
“My
0.11
-my
0.10
My
0.10
.My
0.09
mijn
0.09
Activations Density 0.067%