INDEX
Explanations
words that indicate choices or alternatives
New Auto-Interp
Negative Logits
"]);
-0.60
"])
-0.56
")");
-0.56
)");
-0.53
Nuestro
-0.50
\"");
-0.49
nemlig
-0.48
жив
-0.48
"){
-0.47
"]
-0.47
POSITIVE LOGITS
or
1.35
Или
1.19
atau
1.18
hoặc
1.17
oder
1.15
或者
1.14
Or
1.14
или
1.13
eller
1.13
vagy
1.10
Activations Density 0.352%