INDEX
Negative Logits
Samoa
-0.08
oui
-0.08
Solaris
-0.08
citar
-0.08
surfer
-0.08
activism
-0.08
SRC
-0.07
ț
-0.07
yep
-0.07
.Ar
-0.07
POSITIVE LOGITS
над
0.08
forth
0.08
围
0.08
Whole
0.08
ontbreken
0.08
lements
0.08
āj
0.07
whole
0.07
0.07
�
0.07
Activations Density 0.003%