INDEX
Negative Logits
rer
-0.08
planning
-0.08
_Run
-0.07
_File
-0.07
_fragment
-0.07
lea
-0.07
Policy
-0.07
XOR
-0.07
Planning
-0.07
xor
-0.07
POSITIVE LOGITS
handcrafted
0.12
Handmade
0.12
handmade
0.12
-shaped
0.11
craftsmanship
0.10
正规的
0.09
antique
0.09
తయ
0.09
crafted
0.09
prized
0.09
Activations Density 0.028%