INDEX
Negative Logits
MA
-0.07
Bour
-0.07
punct
-0.07
.sav
-0.06
achten
-0.06
URT
-0.06
應
-0.06
nhắc
-0.06
.Error
-0.06
.Tr
-0.06
POSITIVE LOGITS
cell
0.07
-cell
0.07
Cell
0.07
Config
0.07
Pearl
0.06
CONTACT
0.06
Agricultural
0.06
Cell
0.06
хорош
0.06
contro
0.06
Activations Density 0.005%