INDEX
Explanations
"w skrócie", "w итоге", "w zależności"
New Auto-Interp
Negative Logits
территории
0.81
livello
0.79
лінії
0.77
Fourier
0.75
manera
0.74
формы
0.71
濋
0.71
<unused2213>
0.71
<unused1756>
0.70
сюда
0.70
POSITIVE LOGITS
yst
0.86
due
0.76
am
0.74
yr
0.74
involved
0.72
iele
0.70
resulting
0.68
oli
0.68
iness
0.68
yp
0.68
Activations Density 0.011%