INDEX
Negative Logits
Ri
-0.08
Ud
-0.07
subsid
-0.07
underm
-0.07
CHA
-0.07
lac
-0.07
ment
-0.07
Descr
-0.07
申
-0.07
SH
-0.07
POSITIVE LOGITS
Vent
0.09
Eleven
0.08
loa
0.08
Dome
0.08
بغ
0.08
Gauge
0.07
Lo
0.07
ζ
0.07
Oblig
0.07
ial
0.07
Activations Density 0.004%