INDEX
Negative Logits
CA
-0.07
kbd
-0.06
dt
-0.06
'{-0.06
-cycle
-0.06
.vol
-0.06
¦
-0.06
kin
-0.06
guild
-0.06
SPA
-0.06
POSITIVE LOGITS
.Other
0.08
other
0.08
Aussie
0.07
Other
0.07
ober
0.07
err
0.07
other
0.07
ower
0.07
another
0.07
toaster
0.07
Activations Density 0.014%