INDEX
Explanations
geographic region specifier
New Auto-Interp
Negative Logits
ת
1.10
ו
0.95
ت
0.92
ות
0.91
ل
0.89
ють
0.88
л
0.87
י
0.86
אן
0.82
و
0.77
POSITIVE LOGITS
2
1.13
4
1.04
3
0.96
5
0.96
OS
0.93
8
0.91
HS
0.89
6
0.89
EG
0.88
Area
0.86
Activations Density 0.002%