INDEX
Negative Logits
Substance
-0.08
Dx
-0.08
dr
-0.08
gummy
-0.07
התר
-0.07
hetto
-0.07
BQ
-0.07
الأسر
-0.07
(dr
-0.07
защ
-0.07
POSITIVE LOGITS
anc
0.09
matin
0.09
傅
0.08
您好
0.08
Palais
0.08
usuf
0.07
Anc
0.07
Ä
0.07
Art
0.07
Nolan
0.07
Activations Density 0.028%