INDEX
Negative Logits
orrh
0.48
<unused987>
0.46
<unused168>
0.46
rbrakk
0.45
<unused1924>
0.44
<unused2006>
0.44
itumor
0.44
<unused356>
0.44
<unused368>
0.44
<unused2174>
0.44
POSITIVE LOGITS
//
0.82
//
0.69
0.52
//}
0.46
–
0.44
//@
0.44
//.
0.43
//$
0.43
//$
0.42
↵↵↵↵
0.41
Activations Density 0.330%