INDEX
Explanations
occurrences of the word "El."
New Auto-Interp
Negative Logits
myſelf
-1.06
Anſ
-1.05
Theſe
-1.03
Monfieur
-1.03
themſelves
-1.00
raiſ
-1.00
Jefus
-1.00
Reſ
-0.97
Majefty
-0.96
Efq
-0.95
POSITIVE LOGITS
El
4.02
El
3.45
el
2.20
EL
2.02
Эль
1.72
Ел
1.48
Els
1.47
La
1.34
エル
1.32
Els
1.30
Activations Density 0.062%