INDEX
Negative Logits
sulfur
-0.08
phosphate
-0.08
soda
-0.08
�
-0.07
وعدم
-0.07
WHO
-0.07
�
-0.07
Nit
-0.07
Homo
-0.07
Luis
-0.07
POSITIVE LOGITS
(init
0.08
견
0.08
Crypto
0.08
CAC
0.08
ांची
0.07
initializes
0.07
Preis
0.07
prosent
0.07
staan
0.07
-benn
0.07
Activations Density 0.001%