INDEX
Negative Logits
Marble
-0.09
따
-0.09
목적
-0.08
올라
-0.08
선을
-0.08
정보를
-0.08
المعادن
-0.08
驾
-0.08
寿
-0.08
Convers
-0.08
POSITIVE LOGITS
forest
0.08
ulse
0.08
RF
0.08
0.07
-top
0.07
top
0.07
competence
0.07
lt
0.07
TOP
0.07
acoust
0.07
Activations Density 0.001%