INDEX
Negative Logits
:↵
-0.14
↵
-0.14
:↵
-0.13
:↵↵
-0.13
:↵↵
-0.13
:-↵
-0.12
↵↵
-0.12
:↵
-0.12
↵↵
-0.12
↵
-0.12
POSITIVE LOGITS
.,
0.32
.;
0.16
.,↵
0.14
.),
0.13
.д
0.13
.).
0.12
.:
0.12
.).↵↵
0.12
.~
0.11
.*,
0.11
Activations Density 0.036%
:↵
↵
:↵
:↵↵
:↵↵
:-↵
↵↵
:↵
↵↵
↵
.,
.;
.,↵
.),
.д
.).
.:
.).↵↵
.~
.*,