INDEX
Explanations
modal verbs followed by state of being
New Auto-Interp
Negative Logits
sorgt
0.18
这些
0.18
zodat
0.17
sabía
0.17
őket
0.17
která
0.17
Якщо
0.17
waardoor
0.17
nayo
0.16
這
0.16
POSITIVE LOGITS
быть
0.37
be
0.33
être
0.31
essere
0.31
být
0.28
być
0.27
being
0.27
būti
0.27
เป็น
0.26
being
0.26
Activations Density 0.633%