INDEX
Explanations
quantifiers and articles in German text
New Auto-Interp
Negative Logits
Exactos
-0.59
více
-0.58
ſtand
-0.54
liau
-0.54
Untersch
-0.54
invokingState
-0.54
таратура
-0.53
formKey
-0.53
getopt
-0.52
собенно
-0.52
POSITIVE LOGITS
eine
1.94
einen
1.80
einer
1.65
eine
1.53
einem
1.50
Eine
1.46
isang
1.42
một
1.40
sebuah
1.38
Eine
1.35
Activations Density 0.038%