INDEX
Negative Logits
Ens
-0.07
maal
-0.07
Στα
-0.06
�
-0.06
arrest
-0.06
ayım
-0.06
café
-0.06
enas
-0.06
/********************************************************************************
-0.06
ären
-0.06
POSITIVE LOGITS
grou
0.07
cuckold
0.07
rd
0.07
Toggle
0.07
()>
0.06
'')↵
0.06
agher
0.06
Departments
0.06
рів
0.06
Tex
0.06
Activations Density 0.004%