INDEX
Explanations
words related to legal or bureaucratic processes
New Auto-Interp
Negative Logits
IntoConstraints
-0.92
endphp
-0.80
Walkover
-0.76
Przypisy
-0.72
المناصب
-0.71
culoskeletal
-0.69
phrag
-0.68
phazard
-0.68
estimés
-0.68
談社
-0.66
POSITIVE LOGITS
##
0.45
manger
0.43
っていない
0.41
out
0.40
dite
0.39
a
0.39
millon
0.39
إيران
0.38
EndTag
0.38
some
0.38
Activations Density 0.518%