INDEX
Explanations
phrases or terms associated with nationality or citizenship
New Auto-Interp
Negative Logits
geil
-0.18
meiden
-0.17
rez
-0.14
ragaz
-0.14
gotta
-0.14
clim
-0.14
raud
-0.14
weiber
-0.14
vine
-0.13
geschichten
-0.13
POSITIVE LOGITS
voor
0.24
door
0.23
van
0.23
eigen
0.21
aan
0.21
uit
0.21
uur
0.21
acht
0.21
Een
0.20
een
0.19
Activations Density 0.298%