INDEX
Negative Logits
žila
-0.08
résident
-0.08
corres
-0.08
illusion
-0.08
假的
-0.07
中华
-0.07
wholesome
-0.07
jähr
-0.07
airborne
-0.07
adaptés
-0.07
POSITIVE LOGITS
bill
0.08
dc
0.07
/USD
0.07
pon
0.07
boq
0.07
vors
0.07
;">↵
0.07
/hour
0.07
atge
0.07
linkage
0.07
Activations Density 0.003%