INDEX
Negative Logits
savu
-0.08
tobac
-0.08
wat
-0.07
-faced
-0.07
worship
-0.07
спир
-0.07
서로
-0.07
pret
-0.07
홍
-0.07
façade
-0.07
POSITIVE LOGITS
.offset
0.09
付き
0.08
validated
0.08
.delta
0.08
offsets
0.08
Rooney
0.08
动力
0.07
剂
0.07
.Offset
0.07
者
0.07
Activations Density 0.040%