INDEX
Negative Logits
TJ
-0.08
zudem
-0.08
sayesinde
-0.08
huh
-0.07
怪
-0.07
Seller
-0.07
請
-0.07
Todo
-0.07
Tutor
-0.07
een
-0.07
POSITIVE LOGITS
multiples
0.08
numeric
0.08
промеж
0.08
triples
0.08
рацион
0.08
gres
0.07
ορ
0.07
anc
0.07
traveled
0.07
Carter
0.07
Activations Density 0.153%