INDEX
Negative Logits
xb
-0.09
xdb
-0.09
xbf
-0.08
라
-0.08
xde
-0.07
xcb
-0.07
ま
-0.07
マ
-0.07
ラ
-0.07
로그
-0.07
POSITIVE LOGITS
ol
0.08
abort
0.08
SI
0.07
amela
0.07
SI
0.07
cliffs
0.07
cl
0.07
clip
0.07
idig
0.07
CL
0.07
Activations Density 0.037%
xb
xdb
xbf
라
xde
xcb
ま
マ
ラ
로그
ol
abort
SI
amela
SI
cliffs
cl
clip
idig
CL