INDEX
Explanations
references to geographical regions or locations
New Auto-Interp
Negative Logits
næste
-0.48
køb
-0.46
læg
-0.45
række
-0.44
måned
-0.44
mulighed
-0.43
gatan
-0.43
dager
-0.43
gnings
-0.42
чь
-0.42
POSITIVE LOGITS
Norway
0.98
Norwegian
0.97
Norwe
0.90
fjord
0.85
Trondheim
0.84
norvég
0.83
Oslo
0.82
Norwegian
0.82
Norway
0.81
Norvège
0.80
Activations Density 0.129%