INDEX
Explanations
references to specific categories or classifications, particularly related to group names or titles
New Auto-Interp
Negative Logits
ainfi
-1.35
iſt
-1.35
Theſe
-1.33
myſelf
-1.30
faſt
-1.27
raiſ
-1.20
ſhall
-1.19
uſe
-1.19
ſind
-1.17
ſelf
-1.17
POSITIVE LOGITS
Par
1.42
Par
1.40
par
1.34
par
1.23
Ar
1.14
Ar
1.14
PAR
1.11
PAR
1.03
La
0.94
La
0.94
Activations Density 0.119%