INDEX
Explanations
terms related to law enforcement and policing
New Auto-Interp
Negative Logits
651
-0.16
äºľ
-0.15
odia
-0.15
álu
-0.15
eds
-0.15
ncia
-0.15
xB
-0.14
ieren
-0.14
ìłĪ
-0.14
átu
-0.14
POSITIVE LOGITS
owy
0.26
ový
0.22
owego
0.22
owych
0.21
ìłģìĿ¸
0.20
owe
0.20
owej
0.20
liche
0.20
nÃŃ
0.19
elijke
0.18
Activations Density 0.081%