INDEX
Negative Logits
out
0.72
evoke
0.71
elicit
0.70
just
0.66
original
0.66
sc
0.65
instead
0.65
ab
0.64
gold
0.64
ties
0.64
POSITIVE LOGITS
Cómo
1.35
Dónde
1.24
Qué
1.18
cómo
1.12
Que
1.11
Quién
1.08
Apakah
1.07
Cuáles
1.07
Какие
1.06
Puede
1.06
Activations Density 0.019%