INDEX
Explanations
Nederlandse en Engelse zinnen
New Auto-Interp
Negative Logits
Wanneer
0.72
Είναι
0.67
Maar
0.64
Deze
0.64
Aufgrund
0.64
ù
0.63
Zijn
0.62
ايضا
0.62
Además
0.62
Het
0.62
POSITIVE LOGITS
workaround
0.44
enorme
0.44
slogan
0.42
fl
0.40
scenario
0.39
euphoria
0.39
milestone
0.38
headline
0.38
fr
0.38
plethora
0.38
Activations Density 0.002%