INDEX
Negative Logits
arb
-0.08
Afghanistan
-0.08
Amer
-0.08
剤
-0.07
>`↵
-0.07
,该
-0.07
,’
-0.07
wayne
-0.07
кет
-0.07
待
-0.07
POSITIVE LOGITS
sovereignty
0.08
marine
0.08
respeto
0.08
Mic
0.08
machinery
0.08
clairement
0.07
پام
0.07
Radar
0.07
vigilancia
0.07
mic
0.07
Activations Density 0.004%