INDEX
Explanations
various, diverse properties
New Auto-Interp
Negative Logits
budete
0.73
baisse
0.72
nowego
0.70
debería
0.67
と思いました
0.67
unchanged
0.66
sollte
0.66
seharusnya
0.66
ahorita
0.66
your
0.65
POSITIVE LOGITS
さまざまな
1.47
様々な
1.32
다양한
1.27
さまざ
1.27
various
1.27
variously
1.25
Various
1.24
各式
1.24
разнообраз
1.23
различных
1.22
Activations Density 0.000%