INDEX
Explanations
references to prisoners of war and military conflict
New Auto-Interp
Negative Logits
aikana
-0.63
enemmän
-0.60
olev
-0.57
kautta
-0.57
meille
-0.56
avulla
-0.54
kysy
-0.51
uksessa
-0.51
AnchorStyles
-0.50
kiin
-0.50
POSITIVE LOGITS
Finnish
0.70
Finnish
0.69
Finland
0.62
Finland
0.61
Helsinki
0.60
Finlande
0.59
Helsinki
0.55
Finns
0.52
Lähteet
0.51
Suomi
0.50
Activations Density 0.234%