INDEX
Negative Logits
快
-0.08
मुक्त
-0.08
freedom
-0.07
kjent
-0.07
быстр
-0.07
appings
-0.07
pei
-0.07
克
-0.07
crowded
-0.07
Bands
-0.07
POSITIVE LOGITS
-esque
0.10
understated
0.08
zut
0.08
/off
0.08
Bever
0.08
improb
0.08
demeanor
0.07
"It's
0.07
aston
0.07
sonian
0.07
Activations Density 0.008%