INDEX
Negative Logits
étant
-0.08
medic
-0.08
⇒
-0.08
being
-0.08
Being
-0.08
Mom
-0.08
bem
-0.07
yang
-0.07
advocated
-0.07
amb
-0.07
POSITIVE LOGITS
burn
0.09
_fun
0.08
lv
0.08
�
0.08
�ে
0.07
ஆண்டு
0.07
precautions
0.07
(Animation
0.07
ountain
0.07
sure
0.07
Activations Density 0.002%