INDEX
Negative Logits
Uint
-0.07
(factor
-0.06
StringLength
-0.06
izoph
-0.06
EFF
-0.06
pound
-0.06
≥
-0.06
Hòa
-0.06
SelectedItem
-0.06
Presence
-0.06
POSITIVE LOGITS
.clean
0.07
یک
0.07
金
0.06
pron
0.06
↵ ↵
0.06
фров
0.06
remotely
0.06
Work
0.06
(EFFECT
0.06
침
0.06
Activations Density 0.002%