INDEX
Negative Logits
磨
-0.11
紙
-0.09
бумаги
-0.09
janu
-0.08
speel
-0.08
ashin
-0.08
棋
-0.07
Practitioner
-0.07
’Ab
-0.07
真人
-0.07
POSITIVE LOGITS
relationships
0.08
วย
0.07
uf
0.07
/un
0.07
vf
0.07
QUAL
0.07
_relationship
0.07
gant
0.07
canf
0.07
FAB
0.07
Activations Density 0.002%