INDEX
Explanations
Arabic phrases and country names
New Auto-Interp
Negative Logits
aprire
0.34
cornerback
0.31
huit
0.31
quirky
0.30
cheeky
0.30
problemlos
0.30
deux
0.29
voiture
0.29
kaikki
0.29
tiež
0.29
POSITIVE LOGITS
0.26
ית
0.25
ِ
0.25
نا
0.25
5
0.25
ี
0.24
ا
0.24
ُ
0.24
הר
0.23
ـــ
0.23
Activations Density 0.017%