INDEX
Negative Logits
involve
-0.08
Aruba
-0.07
Dartmouth
-0.07
american
-0.07
projectile
-0.07
®
-0.07
Walgreens
-0.07
apl
-0.07
maya
-0.07
,美国
-0.07
POSITIVE LOGITS
exhort
0.12
deshalb
0.09
Schrift
0.09
cheerful
0.08
mutex
0.08
Philipp
0.08
otiv
0.08
ISTRY
0.08
Maced
0.08
deswegen
0.08
Activations Density 0.037%