INDEX
Negative Logits
Dress
-0.09
chem
-0.08
examples
-0.07
disguis
-0.07
cities
-0.07
348
-0.07
examples
-0.07
dress
-0.07
Div
-0.07
686
-0.07
POSITIVE LOGITS
thankful
0.08
naf
0.08
@Before
0.08
Comune
0.08
白菜
0.07
approachable
0.07
transparente
0.07
начале
0.07
afia
0.07
Pequ
0.07
Activations Density 0.021%