INDEX
Negative Logits
locality
-0.08
vantage
-0.08
Mv
-0.08
Ende
-0.07
efectu
-0.07
ceil
-0.07
locations
-0.07
Business
-0.07
Business
-0.07
-----
-0.07
POSITIVE LOGITS
dep
0.10
constit
0.08
offre
0.08
Ward
0.08
ban
0.07
Neub
0.07
opus
0.07
жу
0.07
hung
0.07
_tc
0.07
Activations Density 0.004%