INDEX
Negative Logits
Bent
-0.08
slots
-0.08
Slot
-0.08
Zip
-0.08
Sal
-0.08
Beno
-0.08
SAL
-0.07
Ls
-0.07
Pats
-0.07
Ravi
-0.07
POSITIVE LOGITS
permiten
0.10
ckeditor
0.09
강
0.08
permitem
0.08
기본
0.08
confiance
0.08
책임
0.08
################
0.08
밝
0.08
gerais
0.08
Activations Density 0.001%