INDEX
Explanations
proper nouns and references to specific individuals or roles
names of people
New Auto-Interp
Negative Logits
före
-0.26
Los
-0.25
fören
-0.24
azules
-0.24
pungkasnya
-0.24
Blue
-0.20
soweit
-0.20
atve
-0.20
<b>
-0.19
MAT
-0.19
POSITIVE LOGITS
AddTagHelper
0.93
Chwiliwch
0.91
propOrder
0.85
utafitiHapana
0.84
########.
0.84
հղումներ
0.82
ſelben
0.82
betweenstory
0.80
autorytatywna
0.79
aarrggbb
0.79
Activations Density 0.004%