INDEX
Negative Logits
tad
-0.09
zure
-0.08
absch
-0.08
hist
-0.08
125
-0.08
wrapper
-0.08
mur
-0.08
annes
-0.07
mie
-0.07
,end
-0.07
POSITIVE LOGITS
Homepage
0.09
residence
0.09
wohnhaft
0.09
spokesperson
0.08
hometown
0.08
voc
0.08
Wohn
0.08
гр
0.08
首页
0.08
גאר
0.07
Activations Density 0.029%