INDEX
Negative Logits
(question
-0.08
sons
-0.07
ident
-0.07
ンス
-0.07
ิลล
-0.07
ولي
-0.07
orders
-0.07
pově
-0.07
RITE
-0.07
osten
-0.06
POSITIVE LOGITS
cheap
0.16
Cheap
0.15
cheaper
0.14
Cheap
0.12
cheapest
0.12
cheap
0.11
Hep
0.07
Yahoo
0.07
Απο
0.06
chap
0.06
Activations Density 0.004%