INDEX
Explanations
possibility, likelihood, and uncertainty
New Auto-Interp
Negative Logits
sometimes
0.58
usamos
0.52
soms
0.50
often
0.50
frecu
0.49
parfois
0.49
często
0.47
你就
0.47
有时
0.46
vaak
0.46
POSITIVE LOGITS
会不会
0.87
能否
0.85
的可能性
0.80
احتمال
0.79
poderão
0.79
可能會
0.77
likely
0.76
kemungkinan
0.76
unlikely
0.75
сможет
0.75
Activations Density 0.005%