INDEX
Negative Logits
rade
-0.07
identified
-0.06
udes
-0.06
ctl
-0.06
project
-0.06
riz
-0.06
jec
-0.06
CEL
-0.06
']}'
-0.06
Rape
-0.06
POSITIVE LOGITS
fun
0.13
Fun
0.12
FUN
0.09
fun
0.08
Fun
0.08
fun
0.08
FUN
0.08
TN
0.07
확인
0.07
_fun
0.07
Activations Density 0.015%