INDEX
Negative Logits
.US
-0.08
Coverage
-0.08
Hit
-0.08
Michelin
-0.08
(SK
-0.07
IGN
-0.07
bekl
-0.07
fungerer
-0.07
Nice
-0.07
Streams
-0.07
POSITIVE LOGITS
束
0.12
confines
0.11
拘
0.11
bondage
0.10
confinement
0.10
binds
0.09
ಬಂಧ
0.09
confin
0.09
shack
0.09
constrain
0.09
Activations Density 0.027%