INDEX
Negative Logits
�
-0.08
calam
-0.08
statues
-0.07
considere
-0.07
-col
-0.07
interracial
-0.07
jat
-0.07
Fletcher
-0.07
Cel
-0.07
statue
-0.07
POSITIVE LOGITS
ineries
0.08
remediation
0.08
Тор
0.08
��
0.08
("="0.07
дыр
0.07
Been
0.07
detox
0.07
iniert
0.07
ulle
0.07
Activations Density 0.042%