INDEX
Explanations
Spanish conjunctions "que" and "de"
New Auto-Interp
Negative Logits
we
0.50
there
0.47
there
0.40
nhàng
0.39
these
0.39
jaar
0.38
dieser
0.38
these
0.38
certain
0.38
spezi
0.38
POSITIVE LOGITS
أنها
0.87
ว่าเป็น
0.83
أنه
0.67
ว่า
0.65
ότι
0.61
انها
0.58
rằng
0.57
أنّ
0.57
że
0.55
mieć
0.54
Activations Density 0.025%