INDEX
Negative Logits
worthwhile
-0.08
伟
-0.08
απ
-0.07
征
-0.07
ofa
-0.07
demonstrating
-0.07
excursion
-0.07
jak
-0.07
cien
-0.07
sorting
-0.07
POSITIVE LOGITS
NEXT
0.08
syst
0.08
Fos
0.08
domicili
0.08
ае
0.07
Petr
0.07
NAC
0.07
COPY
0.07
Bai
0.07
COPY
0.07
Activations Density 0.164%