Modèles algébriques et algorithmes pour la formalisation

music. Their author makes use of sophisticated algebraic notions the better to .... de la Society for Mathematics and Computation and Music4 et du Journal of ...
4MB taille 2 téléchargements 56 vues
p. 1

Thèse de Doctorat de l'Université Pierre et Marie Curie EDITE Présentée par

Emmanuel Amiot Pour obtenir le grade de

Docteur de l'Université Pierre et Marie Curie

Modèles algébriques et algorithmes pour la formalisation mathématique de structures musicales Soutenue le 5 mai 2010 devant le jury, composé de M. Carlos Agon, directeur de thèse M. Moreno Andreatta, co-directeur M. David Clampitt, rapporteur M. Jean-Paul Allouche, rapporteur M. Thomas Noll, examinateur. M. Emmanuel Saint-James, examinateur

Université Pierre & Marie Curie — Paris 6 Bureau d’accueil, inscription des doctorants et base de données Esc G, 2ème étage 15 rue de l’école de médecine 75270-PARIS CEDEX 06 Tél. Secrétariat : 01 42 34 68 35 Fax : 01 42 34 68 40 Tél. pour les étudiants de A à EL : 01 42 34 69 54 Tél. pour les étudiants de EM à MON : 01 42 34 68 41 Tél. pour les étudiants de MOO à Z : 01 42 34 68 51 E-mail : [email protected]

p. 2

p. 3

Résumé : Cette thèse sur travaux est fondée sur cinq articles, sélectionnés tant pour leur intérêt que pour leur représentativité. La synthèse ci-jointe vise à replacer et à expliciter le rôle de ces travaux dans le contexte de la recherche contemporaine en Mathématiques et Musique. L' auteur a été amené à utiliser des outils algébriques élaborés afin de mieux modéliser trois problèmes d'origine musicale: les canons rythmiques, les gammes, et les mélodies autosimilaires. Sa démarche s'avère ainsi indissociable des sciences de l'informatique, sous leur double facette d'expérimentation et d'implémentation de logiciels dédiés à l'analyse et à la composition musicale.

Mots clefs : Mathémusique, pavage, mosaïque, canons rythmiques, conjecture spectrale, Fuglede, canons de Vuza, gammes, Maximally Even Sets, transformée de Fourier discrète, tempéraments, autosimilarité, mélodies, affine, modulaire.

p. 4

English title:

Algebraic models and algorithms for the mathematical formalization of musical structures.

Abstract: This PhD is based on a selection of five previously published papers. They have been singled out for their scientific interest. The synthesis document aims at making clear the role and purpose of these papers in the field of contemporary research across mathematics and music. Their author makes use of sophisticated algebraic notions the better to study three main topics of musical lineage: rhythmic canons, musical scales, and autosimilar melodies. His approach intertwines with information sciences, on the one hand as a means of experimentation and on the other hand in producing software for musical analysis and composition.

Keywords: Mathematics, music, tiling, mosaic, rythmiques canons, spectral conjecture, Fuglede, Vuza canons, musical scales, Maximally Even Sets, discrete Fourier transform, temperaments, tuning, autosimilarity, melody, affine, modular.

p. 5

Table des matières

Introduction

6

Bref historique

6

Mes différents champs de recherche

8

Produits de mes recherches

14

Canons rythmiques

14

Gammes et transformée de Fourier discrète

22

Mélodies Autosimilaires

30

Conclusion et perspectives

37

Remerciements

42

Liste de travaux

45

p. 6

Introduction

Bref historique Avant de présenter ma recherche, il me semble important de retracer le parcours intellectuel et personnel qui m'y a conduit. Le cursus traditionnel de mes études (ENS, agrégation) me prédisposait naturellement à des recherches en mathématiques «pures». Cependant, mes incursions dans ces domaines (j’ai suivi un DEA sur les groupes et algèbres de Lie à l'université de Jussieu en 1983) m’ont convaincu que je ne m'y épanouirai pas. En particulier, ma passion pour la musique 1, structurée par mon cursus au Conservatoire de Nice, n'y trouvait pas sa place. C’est en rencontrant André Riotte, compositeur, ingénieur et enseignant novateur à Paris VIII d’un module intitulé Informatique et structures musicales, que j’ai trouvé ma voie. La formalisation mathématique de structures musicales me permettait d’utiliser des outils et des concepts à la fois puissants, élaborés et subtils, et simultanément de contrôler la validité de ces spéculations abstraites en les appliquant immédiatement à la réalité musicale. Ces structures, invoquées initialement pour des raisons mathématiques, s’incarnaient tout naturellement par des implémentations; ce qui explique tant l’importance quantitative de mes contributions au développement de logiciels d’assistance à la composition, comme OpenMusic2, que le nombre de mes participations à des colloques plus informatiques que mathématiques, tel l’International Computer Music Conference (1986, 2002, 2005, 2006, 2007) entre autres. Pour citer des exemples plus concrets, mes tous premiers travaux, comme stagiaire à l’Ircam en 1985, faisaient la part belle aux arborescences, qu’il s’agisse des hiérarchies tonales dans l’analyse Schenkérienne ou des arbres d’opérateurs pour l’élaboration de cribles à la Xéna-

1

Notamment contemporaine.

Langage de programmation et interface graphique pour l'analyse et la composition musicales, développé à l'IRCAM. 2

p. 7 kis. De ce fait, j'ai tout naturellement abordé ces problèmes sous l’angle de leur implémentation en Lisp, et, simultanément, du côté théorique, en recourant à des chaînes de Markov. Nous étions relativement nombreux dans les années 80 à multiplier les imbrications majestueuses de parenthèses en Lisp. Elles ont d'ailleurs laissé leur empreinte dans des logiciels bien plus élaborés: les arborescences qu'elles modélisent ont naturellement perduré dans Patchwork, puis surtout dans OpenMusic, logiciels développés par Carlos Agon à l'IRCAM afin d'intégrer de façon modulaire, et dans une interface graphique (GUI), les structures utiles aux compositeurs comme aux analystes. Il est donc logique que Lisp soit resté sous-jacent à ces environnements 3. C'est l'un des aspects de la nécessité d'une solide formalisation algébrique des concepts et des outils de la théorie musicale. En ce sens, une contribution décisive de Moreno Andreatta à OpenMusic fut d'y intègrer, via l'environnement MathTools, les structures algébriques avec lesquelles nous jouions dans les années 80: groupes cycliques et diédraux, opérations modulo n, ou encore algèbres de Boole avec tous les outils ensemblistes qui rendent accessible la Set Theory américaine des émules d'Allen Forte. Ce sont là des progrès matériels indubitables, mettant à disposition du plus grand nombre, et de manière intuitive, des concepts que leur abstraction rendait trop abscons il y a deux décennies. En ce sens, il est donc normal que de nouveaux objets théoriques soient apparus, puis à leur tour aient trouvé place dans ces environnements propres à démocratiser leur utilisation. Comme on le verra dans certains de mes articles, notamment dans ceux que je présente en annexe de cette thèse, j'ai pu contribuer à cette double évolution, tant par l'élaboration de nouveaux concepts ou de nouveaux modèles que par leur mise en œuvre sous forme d'implémentations dans différents environnements — ces deux vantaux étant organiquement indissociables.

Il faut souligner les formalisations de Guérino Mazzola [ToM], développées parallèlement et indépendamment. Elles ont rebuté plus d'un lecteur par leur formidable abstraction, mais ont néanmoins l'avantage de se prêter de façon transparente à l'implémentation de leurs concepts (réalisée dans l'environnement Rubato): par exemple, l'acte Grothendieckien de remplacement d'un point par une flêche se traduit immédiatement en terme de variables et de pointeurs (ou plutôt de 'handles'). 3

p. 8

Mes différents champs de recherche Comme la discipline de « Mathémusique » n'existait pas — et n'existe toujours pas dans le champ académique, même si les choses évoluent avec la création en 2007 à Berlin de la Society for Mathematics and Computation and Music4 et du Journal of Mathematics and Music5 , qui est son organe de publication — mes recherches ont été souvent solitaires. Cela est attesté par le nombre de mes travaux publiés sous ma seule signature. Néanmoins j'ai trouvé, notamment à l'Ircam et ce à diverses époques, non seulement de l'intérêt pour mes recherches, mais également des collaborations fructueuses, dans les équipes de recherches les plus orientées vers les structures et la théorisation 6. Comme le prouvent les noms des co-auteurs de mes articles collectifs, dont la plupart ont été écrits pour l' International Computer Music Conference, à commencer par le tout premier en 1985. On distingue aisément la partie théorique de mes travaux —  résultant en général en un article signé de moi seul — de la part appliquée, constituée par des contributions à l'élaboration collective de logiciels (ou au moins d'algorithmes) destinés à l'analyse ou à la composition musicale. Tant il est vrai que mes sujets de recherche se prêtent particulièrement à l'articulation entre théorie et pratique. Les canons rythmiques L' un des axes principaux de mes travaux concerne les canons rythmiques 7 . C'est l'enthousiasme communicatif de Moreno Andreatta, alors jeune étudiant, qui m'a conduit à m'intéresser à ce sujet foisonnant. Il avait remarqué que le problème musical étudié par D.T. Vuza8 était, en fait, celui de la conjecture de Hajós, née dans les années 40, mais complètement résolue bien plus tard, grâce aux efforts conjugués d'une génération de mathématiciens. Toute-

4

http://www.smcm-net.info/

5

http://www.informaworld.com/JMM

6

Le Projet 5 de la recherche musicale dans les années 1980, puis l'équipe "Représentations Musicales".

Dans le présent texte, il s'agira presque exclusivement de canons rythmiques mosaïques, dont l'étude équivaut à un problème de pavage. 7

Vuza, D.T., «  Supplementary Sets and Regular Complementary Unending Canons », en quatre articles : Canons. Persp. of New Music, nos 29(2) pp.22-49 ; 30(1), pp. 184-207 ; 30(2), pp. 102-125 ; 31(1), pp. 270-305 (1991- 1992). 8

p. 9 fois ce problème de combinatoire relève, en fait, aussi bien de la géométrie que de l"analyse harmonique: en témoigne la conjecture de Fuglede, qui relie la propriété de pavage à une condition de spectre. Mon approche, par ce chemin détourné, m'a permis notamment de démontrer que la notion de « canon de Vuza » — musicalement pertinente, puisqu' il s'agit des canons tels qu'on les entend — permettait de faire progresser cette conjecture de mathématiques dites "pures": en particulier, la conjecture est vraie si, et seulement si, elle l'est pour ces canons de Vuza.

Un canon de Vuza de période 108

Ces derniers ne sont pas faciles à inventorier, et ils constituent un matériau extrêmement rare. Compte tenu de mon résultat les liant à la conjecture de Fuglede, on peut considérer ce fait comme une bonne nouvelle; toutefois il reste ardu de les fabriquer de manière exhaustive. J'ai participé à une des premières étapes de cette quête, en contribuant avec Harald Fripertinger à l'établissement de leur liste exhaustive pour les périodes 72 et 108. C’est également par une synthèse de considérations théoriques, souvent formalisées à partir des intuitions de compositeurs et de ruses de programmation 9, que j’ai pu contribuer à la phase la plus récente de la même quête: avec les mathématiciens Kolountzakis et Matolcsi, nous avons énuméré exhaustivement les canons de Vuza jusqu’à la période 144. Au passage, j’ai découvert, avec J’ai élaboré le CanonCrawler, une bibliothèque d’outils en Mathematica® qui m’ont été indispensables aussi bien du point de vue pratique que théorique. 9

p. 10 étonnement, l'existence de liens profonds — et inédits — entre des questions qui pouvaient sembler se réduire à l’implémentation d’une exploration combinatoire (problème de Johnson, canons de Vuza, canons modulo p), et l’abstruse théorie de Galois qui régit l’organisation des racines des polynômes dans divers corps, notamment finis. Il existe là un carrefour étonnant entre de multiples disciplines: mathématiques sous diverses formes (combinatoire, algèbre commutative, analyse harmonique), informatique, et musique. À l'occasion de la présentation ces travaux lors de colloques en Europe, puis en Amérique du Nord, j’ai été amené à m'intéresser à de nouvelles problématiques, comme la théorie des gammes musicales. Les gammes. C’est à l'initiative du musicologue américain David Clampitt, rencontré à une séance du séminaire MaMuX10 à l’Ircam, que j’ai été invité à parler de mes travaux devant les membres de la Society for Music Theory lors d’une convention de l’American Mathematical Society à Evanston, près de Chicago. C'est aussi grâce à lui que j’ai découvert le foisonnement de recherches sur les gammes de la nouvelle école américaine, héritière de célèbres pionniers, tels les regrettés David Lewin ou John Clough. Ce sujet de recherche restera, pour moi, indissociablement lié aux acteurs américains de la théorie musicale: Richard Cohn s’est joint à David Clampitt (lui-même acteur de premier plan dans le renouveau de la théorie des gammes) pour m’impliquer dans les travaux de cette nouvelle école de chercheurs américains, dont la jeune génération — Cliff Callender, Dmitri Tymoczko ou Ian Quinn notamment — a précisément démontré son génie en présentant comme modèles continus des accords les "orbifolds"11, lors des John Clough Memorial Days à Chicago University en juillet 2005. Mon intérêt pour les gammes est d'ailleurs issu de la thèse

Mathématiques, Musique, et relations avec d'autres disciplines. http://recherche.ircam.fr/equipes/repmus/mamux/

10

Orbivariétés en français, ici des quotients d'espaces vectoriels par des groupes finis traditionnels en théorie musicale, comme T/I ou Sn. 11

p. 11 de Quinn 12, qui, pour la première fois, explicitait les coefficients de Fourier d’une gamme à des fins de comparaison et de classification. Par ailleurs, classer les gammes (ou plus précisément les "pc-sets", sous-ensembles du total chromatique) selon la valeur absolue de leurs coefficients de Fourier équivaut à considérer comme équivalents deux pc-sets ayant le même contenu intervallique. Cette taxonomie est bien connue des cristallographes; pourtant, ce n'est que récemment que les musiciens en ont pris conscience; or elle s'avère plus fine et plus subtile que la classification traditionnelle sous l'action du groupe diédral T/I. Bien entendu, ces coefficients de Fourier interviennent aussi dans les questions de pavages (canons rythmiques) que j'avais déjà étudiées: ce sont les valeurs des polynômes caractéristiques des motifs, prises aux racines nièmes de l'unité. J’ai commencé par généraliser les résultats de Ian Quinn, étudiant tous les cas de maximalité des coefficients de Fourier d’un sousensemble d’un groupe cyclique. Ensuite, mon expérience des pavages m’a permis de revisiter la plupart des questions traditionnelles sur les gammes (fonction intervallique, homométrie, générateurs…) et d’en explorer de toutes nouvelles (comparaison de tempéraments), avec notamment la surprenante confirmation, via un très simple algorithme de comparaison de coefficients de Fourier, de l’hypothèse du musicologue Bradley Lehman sur le tempérament qu’aurait utilisé J. S. Bach. Ce fut le fait du hasard, en étendant13 ces transformées de Fourier discrètes à des parties finies du cercle continu S1, il m'est venu l'idée de les appliquer dans le cadre de différents tempéraments musicaux. Toutefois ce domaine est riche de bien d'autres potentialités inexplorées, et de connexions prometteuses, dans la mesure où, par exemple, cette notion de transformée de Fourier d'une partie finie ordonnée d'un cercle permet de généraliser à de telles parties la notion de "Maximal Evenness"14. Par ailleurs, cette généralisation à cheval entre discret et continu, appliquée au domaine des rythmes périodiques, nous a conduits à un nouveau paradigme de pensée, où les pa-

12

Quinn, I., « A unified theory of chord quality in equal temperaments », PhD dissertation, Univ. of Rochester (2005).

13

L'idée de cette généralisation revient à Thomas Noll, peu après que nous soyons revenus de Chicago.

Notons qu'on peut calculer ces coefficients de Fourier pour des parties de la plupart des orbifolds susmentionnés, car leur valeur absolue passe au quotient par les groupes traditionnellement utilisés. 14

p. 12 ramètres sur lesquels joue le musicien sont, non pas les notes, mais les coefficients de Fourier; par exemple, par un seul paramètre on modifie, globalement et de façon cohérente, le «groove» d'un rythme15. Je reviendrai ultérieurement sur cette taxonomie motifs par les différents profils de leurs transformées de Fourier, qui devrait nous permettre enfin de jeter un pont vers les sciences cognitives, via les protocoles expérimentaux actuellement mis au point à l'Ircam afin de mettre en évidence la capacité de l’esprit humain à discerner certaines caractéristiques de ces profils: leur platitude, ou au contraire leur "saillance"; cette dernière caractérisant des patterns aussi célèbres que la gamme diatonique, ou le rythme traditionnel du tango .

Les mélodies autosimilaires. Je terminerai cet exposé panoramique de mes recherches en abordant un domaine peu ou pas exploré 16, qui illustre clairement le fait que mes travaux se trouvent toujours situés au confluent des trois mêmes forces : musique, structures algébriques discrètes, et algorithmique. Le concept même de mélodie autosimilaire est dû à Tom Johnson, compositeur américain vivant à Paris. L' acception mathématique du terme « autosimilaire » est plus restrictive que celle utilisée par T. Johnson : pour rester conforme à la notion d'autosimilarité des objets fractals, on dira qu'une mélodie est autosimilaire de rapport k si, en prenant seulement une note tous les k temps, on entend la mélodie initiale (jouée k fois plus lentement). Enfin l' étude de ces mélodies particulières est aussi bien abstraite (arithmétique, algèbre commutative) que pratique (énumération exhaustive de catalogues de solutions, dénombrements, module dans

Cette idée a été exposée pour la première fois dans Agon, C., Amiot, E., Andreatta, M., Noll, T., « Oracles for Computer-Aided. Improvisation », ICMC, New Orleans (2006). Une implémentation convaincante de ce concept de «Fourier DJ» a été présentée par Thomas Noll au dernier colloque de la SMCM en juin 2009. 15

Je n'ai trouvé sur ce sujet qu'une page de David Feldman, dans sa recension de SelfSimilar Melodies de Tom Johnson. Il y réfute brillament une conjecture de ce dernier concernant la conjonction de symétries par rétrogradation et inversion des mélodies autosimilaires. 16

p. 13 OpenMusic permettant, entre autres choses, la construction de mélodies autosimilaires ayant un groupe de symétries affines données), et même philosophique (car ce sont des «objets universels», i.e. des attracteurs limites d’itérations affines).

Une mélodie autosimilaire familière Il s'avère que cette notion fort peu connue est pourtant profondément ancrée dans la culture musicale, fût-ce inconsciemment : on trouve des mélodies autosimilaires aussi bien chez D. Scarlatti, Mozart, dans la cinquième symphonie de Beethoven, que dans In the Mood de Glen Miller par exemple. Or mes calculs, en établissant qu'une mélodie donnée possède une probabilité infinitésimale d'être autosimilaire, montrent que l'existence de mélodies autosimilaires, même rares, dans l'œuvre d'un compositeur, ne peut être interprétée comme le fait du hasard.

Ces trois domaines de recherche sont présentés plus en détail dans le développement qui suit, à travers cinq articles, choisis comme représentatifs de mon travail. On retrouvera, dans leur apparente diversité, la profonde unité des concepts qui les sous-tendent.



p. 14

Produits de mes recherches

Dans les pages qui suivent, je me propose de présenter et de détailler le contenu des cinq articles figurant dans le dossier de mes travaux, tout en les replaçant dans le double contexte de mes recherches personnelles et du champ de la recherche en général. En effet mes travaux individuels sont souvent liés à des réalisations collectives. En témoignent les divers articles co-écrits avec d'autres chercheurs (cf. la bibliographie). Les cinq articles retenus comme représentatifs de ma production sont: ✦ « À propos des canons rythmiques », Gazette des Mathématiciens, 106 (2005).  ✦ « David Lewin and Maximally Even Sets »,  Journal of Mathematics and Music (2007) vol. 3.  ✦ « Autosimilar Melodies », JMM (2008) vol. 3.  ✦ « Discrete Fourier Transform and Bach’s Good Temperament »,  Music Theory Online (2009) 15, 2.  ✦« New Perspectives on rhythmic canons and the Spectral Conjecture », JMM (2009). Ils touchent aux trois domaines d'étude définis dans l' Introduction: canons rythmiques, gammes musicales, et mélodies autosimilaires.

Canons rythmiques Parmi les nombreux articles que j'ai consacrés aux canons rythmiques, le dossier joint proose les deux études suivantes: 1. « À propos des canons rythmiques », Gazette des Mathématiciens, 106 (2005) 2. « New Perspectives on rhythmic canons and the Spectral Conjecture », JMM (2009). Dans la suite du texte, ces articles seront référencés par [GdM] et [AmiotJMM].



p. 15 Le premier article offre une synthèse de mes premières années de recherche sur les

canons ; il présente, notamment, le résultat séminal qui permet de limiter l'étude des conjectures sur les pavages de la ligne aux canons de Vuza. La formalisation musicale d'un canon rythmique (mosaïque), c'est à dire d'un pavage parfait périodique par un unique motif A, répété à différents intervalles de temps, se ramène à l'équation suivante: A ⊕ B = Z/nZ.

(A est le motif, B représente les différents départs de ce motif) qui équivaut à l' équation A(X) × B(X) = 1 + X + X2+ … Xn-1 modulo Xn -1

(1)

où A(X), polynôme caractéristique de la partie A, est la somme des Xk quand k décrit l'ensemble A. Le problème de la recherche de tous les canons rythmiques de période n donnée, se traduit donc par une question de factorisation 17 du polynôme 1 + X + X2+ … Xn-1 , étant entendu qu'on cherche deux facteurs dont les coefficients soient exclusivement des 0 ou des 1 (appelés polynômes 0-1 dans [GdM]), et dont le produit est calculé modulo Xn -1, ce qui signifie que tout monôme Xk où k>n est remplacé (itérativement) par Xk-n, ce que j'ai implémenté naturellement par pattern-matching. Je mentionne ce détail apparemment secondaire, parce qu'il est significatif de la prégnance des idées musicales à tous les stades de ces recherches. En effet, cette règle de programmation présente une signification perceptive forte, à savoir que le kème temps du canon sera occupé par une note, qui peut fort bien appartenir à une copie du motif ayant commencé plus de n notes avant18 .

La difficulté vient, bien évidemment, de ce que l'anneau quotient Z[X]/(Xn-1) n'est pas factoriel: les factorisations n'y sont pas uniques, et en particulier il y en a d'autres que celles que l'on trouve dans les polynômes habituels. J'ai exploré une autre piste (cf. [GdM]), cherchant des factorisations modulo p premier de l'équation (1). À ma grande surprise, il se trouve que tout motif pave (pour un période suffisamment grande), au sens où tout polynôme 0-1 A(x) dans Fp[X] admet un complément B(x), lui aussi 0-1, tel que (1) soit vérifiée — modulo Xp - 1. 17

L' auditeur perçoit des pavages de la ligne temporelle et non pas du cercle, structure quotient. Mais mathématiquement les deux notions sont identiques, tout pavage de la ligne par translations d'un motif étant périodique. 18



p. 16 Nous rencontrerons d'autres exemples de cette utilité d'une culture musicale à pro-

pos de questions qui sembleraient relever des mathématiques les plus abstraites.

pavage de Z et de Z/12Z par le motif {0,1,5} Les facteurs irréductibles dans Z[X] du polynôme 1 + X + X2+ … Xn-1 sont bien connus, ce sont les polynômes cyclotomiques Φd où d divise n. Certains de ces polynômes sont 0-1; c'est le cas, par exemple, quand d est premier et Φd = 1 + X +… Xd-1. D'autres ne le sont pas, comme Φ12 = 1X2+X4. Cette remarque, qui date de la préhistoire de l'étude des pavages, a permis d'implémenter dans OpenMusic un "patch" de production de canons rythmiques, dits « canons cyclotomiques19  » : pour obtenir des canons de période n, il suffit de sélectionner parmi les parties de l'ensemble des diviseurs d1 … dk de n celles qui fournissent un polynôme 0-1 par le produit des facteurs cyclotomiques Φdi correspondants, ce qui créera ipso facto un canon rythmique 20, à condition que ce polynôme A(X) admette un complément B(X) — un polynôme 0-1 lui aussi, et qui vérifie l'équation (1). Ainsi pour n=12 A(X) = Φ2 Φ4 Φ12 = (1 + X)(1 + X2)(1 - X2 + X4) = 1 + X + X6 + X7 est un polynôme 0-1, correspondant à la partie A = {0,1,6,7} qui "pave" (i.e. constitue un canon rythmique) avec par exemple B = {0, 2, 4} i.e. B(X) = 1 + X2 + X4. Le problème posé par cette démarche tient à ce que fabriquer un polynôme 0-1 A(X), fût-il produit de polynômes cyclotomiques, ne garantit pas l'existence d'un complément B(X). Ainsi pour :

Agon, C., Amiot, E., Andreatta, M., « Tiling the (musical) line with polynomials : Some theoretical and implementational aspects », Acts of ICMC 2005, Barcelona (2005). 19

Mais ce canon n'est jamais un canon de Vuza: l'algorithme utilisé, qui est emprunté à Coven et Meyerowitz, donne toujours un complément B périodique. 20



p. 17 A = {0,1,2,4,5,6}, i.e. A(X) = (1 + X4)(1 + X + X2) = Φ8 Φ3 il n'existe pas de pavage de Z/12Z — ni d'ailleurs d'aucun Z/nZ — dont le motif

soit A. Ce fait résulte des conditions qui se trouvent exposées dans l'article séminal [CM], et qui sont les premières conditions générales que l'on ait publiées pour que l'équation (1) soit vérifiée. Ces conditions, (T1) et (T2), portent précisément sur les indices des facteurs cyclotomiques du polynôme caractéristique A(X) d'une partie A de Z: si on note RA l'ensemble des indices d des Φd qui divisent A(X), et SA le sous-ensemble des éléments de RA qui sont des puissances de nombres premiers, alors ces conditions s'énoncent ainsi : ✦

(T1) : la valeur A(1) est le produit des Φpk(1) pour chaque pk dans SA.



(T2) : pour chaque pk , ql … dans SA, on a pk × ql ×…. qui appartient à RA.

En 1998, Coven et Meyerowitz ont prouvé 21 que ✦

Si A pave, alors (T1) est vérifiée.



Si (T1) et (T2) sont vérifiées, alors A pave.



Si A pave Z/n Z où n a au plus deux facteurs premiers, alors (T2) aussi est

vérifiée. On ignore encore si cette dernière propriété est vraie pour tout n. J'ai prouvé dans [AmiotJMM] que tous les canons de Vuza de période 120 vérifient (T2), ce qui implique que cette propriété est vraie pour une infinité d'autres canons. En effet, ainsi que je l'avais démontré précédemment22 , Tout canon rythmique peut se décomposer récursivement en canons plus courts, jusqu'à ce que l'on arrive à un canon de Vuza; Et, en conséquence23, la condition (T2) étant conservée durant ces tribulations, La conjecture « pave ⇒ (T2) » est vraie pour tout canon si, et seulement si, e(e est vraie pour tous les canons de Vuza.

21

Leur article sera dorénavant cité comme [CM].

« Rhythmic canons and Galois Theory », actes du Colloquium on Mathematical Music Theory, H. Fripertinger & L. Reich Eds, Grazer Math. Bericht Nr 347 (2005). Cité comme [Amiot05]. 22

23

Les calculs polynomiaux sont un peu longs, mais restent élémentaires, cf. ibid.



p. 18 À mon avis, il est important de souligner que cette démarche est avant tout d'ori-

gine musicale: en effet, la décomposition susmentionnée, baptisée « déconcaténation » dans [Amiot05], est une évidence auditive: si le canon A ⊕ B = Z/n Z n'est pas de Vuza, c'est que soit le motif A, soit son complément B, sont des répétitions de motifs plus simples24. Dans le premier cas on entendra un sous-motif de A répété un certain nombre de fois, dans le second on entendra tout simplement un canon plus court (même motif, répété moins de fois). C'est d'ailleurs la considération de toutes ces transformations de canons en d'autres canons, initiée par divers compositeurs contemporains, qui a mené à la découverte de canons de Vuza… inconnus de Vuza lui-même, en ce qu'ils n'étaient pas engendrés par l'algorithme qu'il a donné comme preuve de l'existence de ses canons25. Dans [Amiot05] j'ai donné une extension de ce résultat à une conjecture plus générale (énoncée en 1974 pour les espaces vectoriels de dimension finie): la conjecture de Fuglede, ou conjecture spectrale, ici en dimension 1. Il est intéressant de noter qu'entre temps, cette conjecture a été infirmée en dimension supérieure ou égale à trois (dans les deux sens), le premier contre-exemple étant dû à Terence Tao, lequel a depuis été récompensé de la profonde originalité de ses travaux par la médaille Fields. Une partie A de Z/nZ de cardinal k est dite spectrale si il existe un "spectre" Λ={λ0

λk-1}⊂[0,1[

tel que tous les exp(2iπ(λi - λj)) (pour i≠j) annulent son polynôme caractéristique A(X). La conjecture de Fuglede est: « pave ⇔ spectral »; e(e est vraie pour tout canon si et seulement si e(e est vérifiée pour tous les canons de Vuza.

Par exemple, le motif {0,1,6,7,12,13}, qui pave avec période 18, est une répétition du motif {0,1} qui pave avec la période 6. 24

Ainsi qu'il est mentionné dans [Amiot05, p. 13], toutes les opérations musicales sur les canons préservent (T1) et (T2). Edouard Gilbert a étendu cette invariance à la propriété spectrale dans son mémoire de mastère [Gil]. Dans la présente synthèse, seules sont mentionnées la concaténation et la déconcaténation des canons, mais d'autres opérations comme le bégaiement (ou multiplexage) ont été abordées indépendamment, par exemple par Kolountzakis et Matolcsi étudiant la conjecture forte de Tijdeman dans Kolountzakis, M., Matolcsi, M., « Tiles with no spectra », Forum Math., to appear. Enfin soulignons que l'algorithme de Vuza n'est pas le plus prolifique: une comparaison des différents algorithmes a été réalisée dans Fidanza, G., « Canoni ritmici a mosaico », tesi di laurea, Università degli Studi di Pisa, Facoltà di SSMMFFNN, Corso di laurea in Matematica (2008) . 25



p. 19 Edouard Gilbert [Gil] a parachevé la démonstration de ce théorème, que j'avais

énoncé sans prendre la peine d'en donner la preuve dans [GdM]. Il est notable que (T1) + (T2) ⇒ spectral, ce qui a été démontré par Izabella Łaba26 , peu après qu'elle ait lu l'article de Coven et Meyerowitz. Les canons de Vuza, objets musicaux par excellence, sont ainsi devenus incontournables pour la résolution de conjectures fondamentales de mathématiques pures. Le second article présenté en annexe répond à une question pointue et ésotérique: il s'agit de déterminer tous les canons de Vuza de période n=120, complétant ainsi la recherche présentée par Kolountzakis et Matolcsi27 dans le même numéro du Journal for Mathematics and Music par la classification exhaustive de ces canons pour les périodes inférieures à 168, et ce pour mieux étudier certaines des conjectures évoquées ci-dessus. Ce numéro spécial du Journal for Mathematics and Music de 2009 consacré aux canons rythmiques fait la part belle à la conjecture de Fuglede: c'est le sujet du troisième article (de Franck Jedrzejewski), elle est citée dans [KM], et démontrée au passage pour n=120 par [AmiotJMM]28. Notons que cela prouve aussi la conjecture de Fuglede 29 pour tout canon de période 240 (par exemple) qui n'est pas un canon de Vuza: en effet, il se décompose alors en canons plus petits30, qui vérifient donc nécessairement la conjecture spectrale puisqu'elle est vraie pour n≤120. La démarche, commune à ces deux derniers articles (avec n=144 dans [KM]) a été proposée par Maté Matolcsi. Elle consiste à classifier les canons de Vuza par leurs ensembles SA, en utilisant l'algorithme suivant: ✦ Choisir un SA qui permette d'espérer un canon de Vuza (des conditions sur RA permettent de repèrer la périodicité de A, voire celle de son complément éventuel B, cf. [KM]). Laba, I., « The spectral set conjecture and multiplicative properties of roots of polynomials », J. London Math. Soc. 65, pp. 661–671 (2002). 26

27

Dorénavant citée comme [KM].

28

Les résultats de Coven-Meyerowitz et Laba suffisaient à établir pour n=144 que « pave ⇒ spectral ».

29

Au moins dans le sens « pave ⇒ spectral ».

30

Des canons dont la période divise strictement 240, donc est au plus égale à 120.



p. 20 ✦ Fabriquer par l'algorithme de Coven et Meyerowitz un B qui complète tous les

A possibles ayant cet ensemble SA. ✦ Rechercher tous les compléments de ce complément, i.e. tous les motifs A tels que (1) soit vérifiée. ✦ Trier par les valeurs de l'ensemble RA — incidemment, ceci permet de nouveau d'éliminer des canons non Vuza. ✦ Sélectionner les solutions non périodiques, s'il y en a. Cet algorithme nous a permis (avec quelques ruses de programmation pour les cas les plus coriaces) de produire la classification suivante des canons de Vuza de période 72, 108, 120 ou 144, les deux premières périodes ayant déjà été exhaustivement détaillées par Harald Fripertinger [Frip]: n

RA

RB

nombre de ≠A

nombre de ≠B

72

{2, 8, 9, 18, 72}

{3, 4, 6, 12, 24, 36}

6

3

108

{3, 4, 12, 27, 108}

{2, 6, 9, 18, 36, 54}

252

3

120

{2, 3, 6, 8, 15, 24, 30, 120}

{4, 5, 10, 12, 20, 40, 60}

20

16

120

{2, 5, 8, 10, 15, 30, 40, 120

{3, 4, 6, 12, 20, 24, 60}

18

8

144

{2,8,9,16,18,24,72,144} or {2,8,9,16,18,72,144}

{3,4,6,12,24,36,48}

36

6

144

{2, 4, 9, 16, 18, 36, 144} or {2, 4, 6,9, 16, 18, 36, 144} or {2, 4, 9, 12, 16, 18, 36, 144}

{3,6,8,12,24,36,72}

8640

3

144

{3, 4, 6, 8, 12, 24, 48, 72} or {3, 4, 6, 8, 12, 24, 36, 48, 72}

{2,9,16,18,144} or {2,9,16,18,36,144}

156 +6

48 +12

144

{2, 3, 6, 8, 12, 24, 48, 72} or {2, 3, 6, 8, 12, 18, 24, 48, 72}

{4, 9, 16, 18, 36, 144}

324

6

Il n'y avait pas là de canons inédits pour n=120 (ceux qui ne provenaient pas de l'algorithme de Vuza avaient été façonnés empiriquement à partir de canons de période 72), mais l'algorithme utilisé a permis de l'établir avec certitude; en revanche de nouveaux canons ont été trouvés pour n=144, montrant au passage (dans l'avant-dernier cas) qu'on pouvait avoir plu-



p. 21

sieurs ensembles RA en face de plusieurs ensembles RB distincts (même si SA et SB ne peuvent changer, d'après [CM]). Par ailleurs, j'ai utilisé depuis et utilise encore une version rapide de ce "ping-pong" entre voix de canons pour tester des canons de plus grande taille et voir s'ils vérifiaient la condition (T2), en utilisant la programmation linéaire pour chercher un complément de B (renonçant à les chercher tous, ce qui est trop coûteux en temps de calcul). L' idée m'en est venue en travaillant sur des problèmes de décomposition linéaires de gammes, exactes ou approchées, avec Bill Sethares [AS]. Le problème n'avait rien à voir a priori avec les pavages, mais la programmation linéaire fournissait une méthode rapide (et quasi infaillible) pour obtenir un complément B d'un motif A qui pave 31. En itérant l'algorithme, on trouve un complément A' de B, puis un complément B' de A', etc… jusqu'à retomber sur un motif (ou complément) déjà exprimé. Les ensembles SA et SB restent invariants tout au long de la procédure. Cette exploration avait pour but de trouver des canons de Vuza qui ne vérifiraient pas la condition (T2), ni peutpas la condition spectrale; mais elle a failli à fournir un tel contre-exemple pour toutes les périodes allant jusqu'à n=120032 . En effet, la procédure décrite dans le numéro spécial de JMM présente deux points faibles: le calcul de tous les compléments prend du temps, même après les diverses optimisations apportées par Matolcsi, lesquelles sont pourtant particulièrement pertinentes pour des canons "irréguliers" comme ceux de Vuza; le calcul de l'ensemble RA est long lui aussi. Pour réduire le temps de calcul de cette dernière tâche, j'ai suivi une suggestion de Matolcsi et calculé certaines valeurs particulières du polynôme A(X) aux points X = e 2 i k π/n. En effet, ces valeurs ne sont autres que la transformée de Fourier (discrète) de l'ensemble A, qui permet de déceler en particulier ses périodicités internes. On obtient notamment

Qui plus est, l'algorithme du simplexe étant fortement asymétrique, il tend à donner des solutions non périodiques, c'est à dire qu'on trouve des canons de Vuza quand il y en a pour les couples SA et SB considérés. 31

Ceci ne constitue pas une preuve de ce qu'il n'y ait pas de tels contre-exemples avec de "petites" périodes, mais le laisse conjecturer, dans la mesure où les listes de canons de Vuza ainsi formées ont des cardinaux similaires à ce que l'on trouve dans les cas où le catalogue exhaustif est connu. Il est probable que de tels contre-exemples n'existent que pour d'assez grandes périodes, mais il serait dommage de se priver d'explorer les périodes qui nous sont d'ores et déjà accessibles. 32



p. 22 • m est élément de RA (pour m|n) si, et seulement si, A(e 2 i π/m) = 0, i.e. si le n/mème coefficient de Fourier est nul. • A est périodique (de période < n bien sûr) si, et seulemen,t si il existe un élément pm de SA maximal (i.e. n=pm q, où q est premier avec p) dont tous les multiples sont dans RA, i.e. qui vérifie que si pm| k | n alors k est dans RA. Cette dernière propriété a été utilisée dans les algorithmes cataloguant les canons

de Vuza, afin d' exclure certains ensembles RA. Je reviendrai sur l'intérêt de cette transformée de Fourier pour l'étude de parties discrètes d'un groupe cyclique, voire du cercle continu, car elle constitue mon outil privilégié pour aborder la question des gammes musicales. Finalement, la question éminemment pratique, pour ne pas dire basique, posée par l'établissement de catalogues de canons de Vuza à l'usage des compositeurs, a permis une avancée substantielle dans des problèmes ouverts de mathématiques dites pures. Il aurait été impossible de progresser du point de vue algorithmique sans l'utilisation d'outils algébriques puissants, comme les polynômes cyclotomiques et la théorie de Galois. Or il en est de même, nous le verrons, dans les deux autres domaines de mon étude, à commencer par les transformées de Fourier discrètes des gammes musicales.

Gammes et transformée de Fourier discrète Une partie A d'un ensemble E peut être décrite parfaitement par sa fonction caractéristique χA qui vaut 1 si x∈A, et 0 sinon. Un prolongement possible consiste à autoriser des valeurs entre 0 et 1, comme en logique floue, ce qui revient à considérer des probabilités. Une idée plus exotique est de calculer la transformée de Fourier de cette fonction. Comme la transformée de Fourier est un isomorphisme, il n'y pas de perte d'information. Qui plus est, la fonction originelle, c'est à dire la partie A, est facile à retrouver par la formule de transformation de Fourier inverse (théorème de Plancherel). Dans le cas particuliers de parties du groupe cyclique

(ou une gamme) remonte `a David Lewin en 1959. et est `a l’origine de nombreux concepts qui ont marqu´e la recherche am´ericaine depuis 1959. Nous choisissons la mˆeme d´efinition que lui parmi les diverses d´efinition possibles ´equivalentes :

efinition 1. La transform´ee de Fourier de f : Z → C est p. 23 D´ c ! F (f ) : t #→ f (k)e−2ikπt/c Z/cZ qui modélise la gamme chromatique, il s'agitk∈Z d'une transformée de Fourier discrète, ou c

Plus DFT:particuli`erement, la transform´ee de Fourier de A ⊂ Zc sera la transform´ee de Fourier de la fonction caract´eristique 1A du sous-ensemble A5 : ! FA : t #→ e−2iπkt/c k∈A

Quelques exemples : qui ait utilisé cette DFT à des fins d'étude structurelle en théorie de la Le premier d−1 " −2iπkt/c 1 − e−2iπt 33 (1) F , la transform´ e e de Fourier de toute la gamme chromatique, est e = . Cette musique Zest sans nul doute David Lewin, dans son tout premier ainsi que dans son dernier c 1 − e−2iπt/c k=0

fonction est nulle sur Z sauf quand t = 0. On voit bien sur ce calcul que seule compte la classe de article34. Dans le premier cas, ilc n'y fait qu'une allusion in fine, s'excusant de la difficulté de nol’indice k modulo d, ce qui est ad´equat. 4On comme tions l'algèbre des caractères pour du Journal prend le double du sinus de l’intervalle, avecles unlecteurs facteur d’´ echelle. . . of Music Theory. Néanmoins, 5Si

1 l’on s’int´eresse aux fonctions du cercle a valeurs dans C, on peut voir cela comme la transform´ee de Fourier d’une "S ` toute son analyse des rapports intervalliques entre deux parties de Z/nZ (qu'on n'appelait pas distribution, ` a savoir un peigne de Dirac k∈A δk . 2 title on some pages

2

title on some pages

encore pitch-class sets ou repose sur les relations entre leurs transformées Fourier.knowledge Thisdes shows that (when thepc-sets) Fourier transform of the characteristic function of A is nonde vanishing)

B,

This Fourieryields transform of theknowledge characteristic function of A is non vanishing) of A shows and ofthat the (when intervalthe function complete of the characteristic function of B.knowledge effet, si pour deux parties A, B de Z/nZ on définit la fonction d'intervalles par of Defining A andEn ofthe theinterval interval function yields complete knowledge of the characteristic function of B. function between A, B ⊂ Zc as Defining the interval function between A, B ⊂ Zc as IFUNC(A, B)(t) = nombre d'intervalles de taille entre de A et une note de IF unc(A, B)(t) = Card{(a, b) ∈t A × B,une b − note a = t}, IF unc(A, B)(t)!= Card{(a, b) ∈ A × B, b − a = t},

! 1 if t ∈ X the characteristic fuction of X as 1X (t) = 1 if t ∈ X , IF unc appears immediately as the convolution 0 if t ∈ /deXconvolution il s'avère que cette est=le produit des fonctions caractéristithe characteristic fuction of fonction X as 1X (t) , IF unc appears immediately as the convolution t∈ /X product of the characteristic functions of −A0 andif B: quesproduct de -A etofde theB:characteristic functions of −A and B: " " 1−A ! 1B : t %→ " 1−A (k)1B (t − k) = " 1A (k)1B (t + k) = IF unc(A, B)(t) 1−A ! 1B : t %→ k∈Zc 1−A (k)1B (t − k) = k∈Zc 1A (k)1B (t + k) = IF unc(A, B)(t) k∈Zc

k∈Zc

as 1A (k)1B (t + k) is nil except when k ∈ A and t + k ∈ B. Hence from the general formula for the Fourier transform aDFT convolution product, as 1A (k)1 (t k) isdu nilproduit except when k ∈ A and test + kle∈produit B. Hence from thedes general Or la+ de convolution ordinaire DFT:formula for the Fourier Bof transform of a convolution product, F(IF unc(A, B)) = F(1−A ) × F(1B ) F(IF unc(A, B)) = F(1−A ) × F(1B ) where F(f ) stands for the discrete Fourier transform of a map f . Cela signifie qu'il est possible de récupérer B, connaissant A et IFUNC(A, B) — We will quotefor thethe formula given by Lewin himself, it isf .hardly understandable: his notations are where F(fnot ) stands discrete Fourier transform of aas map undefined and the computations extremely cursory. Of course this is notunderstandable: for lack of rigor: as notations the following We will not quote the formula given by Lewin himself, as it is hardly are sauf quand la DFT de A a la mauvaise grâce de s'annuler, ce qui arrive dans le cas des his «special quotation suggests, Lewin did not really hope to be understood when making use of mathematics. undefined and the computations extremely cursory. Of course this is not for lack of rigor: as the following quotation suggests, Lewin didbynot hope be making use mathematics. cases» énumérés par Lewin (telles lareally gamme parto ou la isgamme mélodique ascenThe mathematical reasoning which I arrived attons, thisunderstood result notwhen communicable tomineure aofreader who does not have mathematical considerable mathematical For those who result have such a training, I append sketch who of the proof The reasoning by training. which I arrived at this is not communicable to aa reader does not:

consider groupmathematical algebra [. . . ] [13] dante have (0 2 3considerable 5 7the 9 11)). training. For those who have such a training, I append a sketch of the proof :

consider the grouppaper algebra [. . . ]one [13]a strong feeling that he wrote as little as possible on the mathematical Reading Lewin’s gives tools that underlay his results. Indeed, whatfeeling little he mentioned rouseas some readers ire in Reading Lewin’s paper gives one a strong that he wrotedid as little possible on to therighteous mathematical the next of JMT. tools that underlay his results. DFT etissue "Maximally Even Indeed, Sets" what little he mentioned did rouse some readers to righteous ire in a ‘considerable mathematical training’ will be considered basic by many readers of this theNowadays next issuesuch of JMT. journal; for instance D.T. Vuza made an essential use of will the be equation above in the 80’s inreaders the course of Nowadays such a ‘considerable mathematical training’ considered basic by many of this his seminal about rhythmic canons [21], lemma 1.9 sqq), wherein heinstressed journal; for work instance D.T. Vuza made an (see essential use of the equation above the 80’sthe inimportance the course of of Lewin’s use work of DFT of characteristic functions. his seminal about rhythmic canons (see [21], lemma 1.9 sqq), wherein he stressed the importance of 33 Lewin, D., as Re: Intervallic Relations between two notes, Journal of Music (1959). And we endeavour to prove,functions. thiscollections approachofenables to define ME Theory, sets (in3:298-301 equal temperament) in Lewin’s use ofwill DFT of characteristic a way perhaps more suggestive and even intuitive, than historical/usual definitions. And as we will endeavour to prove, this approach enables to define ME sets (in equal temperament) in 34 Lewin, D., Special Cases of the Interval Function between Pitch-Class Sets X and Y, Journal of Music Theory, a way perhaps more suggestive and even intuitive, than historical/usual definitions. 45-129 (2001). 1.2

A quick summary of Fourier transforms of subsets of Zc

1.2 A quick summary of Fourier transforms of subsets of Zc 1.2.1 First moves. 1.2.1 First1.1 moves. Definition Following Lewin, we will define the Fourier transform of a pc-set A ∈ Zc as the Fourier

transform of its characteristic function 1A :



p. 24 Le cas particulier B=A a été réexaminé de manière magistrale dans sa thèse35 par Ian

Quinn , qui voulut reconnaître, par les propriétés de leurs coefficients de Fourier, les parties les plus «prototypales» , i.e. celles qui jouent le rôle de phares dans le paysage des accords. La découverte la plus remarquable de Quinn est que ces «phares» ou prototypes, consacrés par la critique traditionnelle, sont caractérisés par la valeur maximale de l'un de leurs coefficients de Fourier. Or les prototypes en question ne sont autres que les Maximally Even Sets ou ME Sets, que je traduis par «gammes bien réparties» dans mon article pour la Revue de mathématiques et sciences humaines36; ce sont les répartitions de notes les plus proches d'un polygone régulier: ainsi la collection diatonique est, parmi les parties à sept notes de la C

gamme chromatique, celle qui se rapproche le mieux C!

B

d'un heptagone régulier (cf. la figure ci-jointe). A!

D

Évidemment, il convient de préciser ce qu'on

C major

A

D!

entend précisément par «se rapprocher d'un polygone régulier». Douthett et Kranz

ont prouvé qu'en termes de potentiels sur un G!

E

cercle discret, toutes les fonctions potentiel G

F F!

strictement convexes (comme les potentiels coulombiens en physique) donnaient les mêmes ME Sets 37. Or

Quinn a mis en évidence, dans sa thèse, une autre manière d'apprécier la «bonne répartition»: Le pc-set A à d éléments est « bien réparti » si, et seulement si, la valeur |FA(d)| (amplitude du dème coefficient de Fourier) est maximale par rapport à tous les autres pc-sets à d éléments.

Quinn, I., « A unified theory of chord quality in equal temperaments », PhD dissertation, Univ. of Rochester (2005). 35

36

Amiot, E., « Gammes Bien Réparties », Revue de Mathématiques et Sciences Humaines, 178 (juillet 2007).

Douthett, J. et Krantz, R. « Energy extremes and spin configurations for the one-dimensional antiferromagnetic Ising model with arbitrary-range interaction », Journal of Mathematical Physics 37 (1996). 37



p. 25 Mon article du Journal of Mathematics and Music, joint dans le dossier annexe 38, dé-

montre rigoureusement tout en la généralisant, cette découverte de Quinn. En effet, il m'a paru nécessaire de prouver précisément39 le fondement géométrique de cette propriété, qui est un lemme trigonométrique (appelé « Huddling Lemma » dans [MESets]), notamment pour clarifier le cas plus délicat des multi-ensembles qui apparaissent dans le cas des ME Sets dégénérés — comme la gamme octatonique par exemple. Au passage, j'ai démontré une conjecture de Quinn concernant certains ME sets particuliers (ceux de type III dans sa nomenclature — cette propriété ne figure pas dans l'article du JMM, mais on peut la trouver dans celui de la Revue de Mathématiques et Sciences Humaines); j'ai également complètement décrit tous les cas de maximalité de tous les coefficients de Fourier des pc-sets, et retrouvé alors de manière élégante le théorème de l'hexacorde de Babbit (avec diverses généralisations, en particulier à tout groupe abélien compact) 40 . Ce dernier point, vu l'argument utilisé, mérite d'être approfondi ici : quand on prend B=A dans les équations ci-dessus, on obtient le contenu intervallique de A, IC(A) en lieu et place de IFUNC(A, B) (c'est l'histogramme des intervalles présents entre les notes de A, ou, comme l'exprimait joliment Lewin dans un de ses derniers articles, la probabilité que tel intervalle soit ouï si l'on alternative joue des notes de A au hasard). De plus, la DFT de cet histogramme donne le module au title carré

(i.e. l'amplitude) de la DFT de A:

Proof If A ∈ Zc has c/2 elements, then as mentioned above, FZc \A = −FA F(ICA ) = |FA |2 = |FZc \A |2 = F(ICZc \A )

Hence (by inverse D

As far astrès I know, this short proof was first published in et [1] after I men Cette formule permet de comparer facilement le contenu intervallique de A

memorial days in july 2005. But considering the coincidence in time of Lew

celui de son complémentaire, ce qui est précisément l'énoncé du théorème l'hexacorde. with Babbitt, it is almost certain that hede was aware of it. Plus Perhaps the har

in his first paper explain why he did not publish it. It is left to the read exercise, to prove in the same way the Generalized Hexachord Theorem, and many others.

« David Lewin and Maximally Even Sets », Journal of Mathematics and Music (2007) vol. 3. Ci-après cité comme [MESets]. 38

2 Maximally Even Sets and their Fourier Transforms Les évidences sont bien souvent trompeuses. J'ai récemment élucidé le nombre de générateurs possibles d'une gamme monogène (comme la gamme majeure ou la gamme pentatonique, engendrées par des quintes), qui porte attribute ‘maximally applies to pitch class sets, bien mal son nom puisque (contrairement The aux parties monogènes, aliaseven’ séquences arithmétiques, dans R which par — in com the same cardinality — are as evenly as possible distributed within Zc . Thi exemple) ce nombre peut être arbitrairement grand — mais n'est jamais égal à 14 par exemple, cf. mon article which exist only for cardinalities d dividing the number c of pi « On the number of generators of a musical regular scale », sets, http://arxiv.org/abs/0909.0039. 39

case — where d and c are mutually coprime — was well studied in [8].

Ce point a été publié indépendamment dans la revue study de vulgarisation mathématique Par ailleurs j'ai extensive of the general case in Quadrature. [7] is an explicit construction of gen récemment étendu le théorème de l'hexacorde à des groupes compacts non nécessairement commutatifs (non puformula for this construction was later termed J-function. It departs from blié). c c 40

numbers 0, , ..., (d − 1) and ‘digitizes’ them within Zc in terms of the re d d! " ! c c" of these ratios mod c: 0, , ..., (d − 1) mod c. The J-function includ d d α Jc,d : k #→

! kc + α " , k = 0 . . . d − 1. d



p. 26

généralement, on voit sur cette dernière formule que la connaissance de l'amplitude de la DFT équivaut très exactement à la connaissance de IC(A), i.e. du contenu intervallique de A. Or l'étude des vecteurs d'intervalle, dans les années 60, a mis en lumière le fait troublant que certains pc-sets ont même distribution intervallique, sans être pour autant congruents41 . Ces exceptions, rares, ont été baptisées « Z-relation » par Allen Forte. La formule secrète utilisée par Lewin rend donc compte très simplement de cette relation, qui exprime l'égalité des longueurs des coefficients de Fourier. Or c'est seulement récemment que l'on s'est aperçu que cette notion était bien connue depuis la fin des années 40 par les cristallographes, qui l'avaient nommée homométrie42. Le problème de trouver des figures homométriques dans un groupe cyclique demeure, encore aujourd'hui, le sujet d'actives recherches, au centre desquelles je me suis subitement trouvé impliqué, par le biais de ces questions de ME sets. L' une de mes dernières contributions, toute récente, est nettement plus technique que la démonstration élégante du théorème de l'hexacorde susmentionnée. Elle porte sur certaines unités spectrales, objets mystérieux qui permettent de générer des classes d'objets homométriques — qui, malheureusement, ne sont pas en général de vrais ensembles, mais des multi-ensembles 43 . C'est en travaillant avec Bill Sethares sur une autre présentation des relations entre pc-sets 44 que j'ai trouvé un théorème pointu, qui énumère les unités spectrales rationnelles d'ordre fini. Notre projet était de décrire des relations de combinaisons linéaires entre gammes (ou accords, plus exactement). Par exemple Do mineur = Do majeur - Fa majeur + Mib majeur. Pour ce faire, nous avons introduit un formalisme matriciel, qui n'est autre qu'une représentation (au sens vulgaire comme au sens de la théorie des représentations de groupes)

41

i.e. isomorphes au groupe T/I près : il est évident que transposer, ou inverser, un pc-set A ne change pas ICA.

En effet, l'observation de la figure de diffraction donnée par un solide éclairé par des rayons X est essentiellement équivalente à l'amplitude de sa transformée de Fourier. Les solides homométriques mais non congruents sont donc des obstacles à une reconnaissance taxonomique via l'observation par ces techniques. 42

43

« On the Group of Rational Spectral Units with Finite Order », http://arxiv.org/abs/0907.0857.

44

« An Algebra for periodic rhythms and scales ». À paraître chez Springer.



p. 27

des fonctions caractéristiques de pc-sets dans l'algèbre des matrices circulantes. Il se trouve que ces matrices sont simultanément diagonalisables, et que leurs valeurs propres ne sont autres que les coefficients de Fourier ! Entre autres applications, nous avons donc retrouvé les «special cases» de Lewin, correspondant aux matrices circulantes avec un déterminant nul, et nous avons pu caractériser certains pc-sets à distribution intervallique « plate 45 » par un déterminant maximal. Dans ce contexte, comme dans celui de la transformée de Fourier discrète, il s'agissait de remplacer les relations musicales (intervalliques), peu commodes à exprimer mathématiquement (comme le produit de convolution de fonctions caractéristiques), par des objets moins immédiats (DFT, matrices), mais qui présentent l'avantage stratégique d'être pourvus d'une loi de composition interne plus praticable (le produit ordinaire ou le produit matriciel). Techniquement, on passe d'un contexte à un autre par des isomorphismes d'algèbres complexes. Le fluide qui permet une navigation sans heurts entre tous ces continents est la transformée de Fourier.

DFT vs JSB46 Une application de la transformée de Fourier discrète à l'archéologie des tempéraments musicaux

Publié dans Music Theory Online en juin 2009, cet article offre une application étroite, mais assez spectaculaire, de l'extension de l'analyse de Fourier discrète aux tempéraments, c'est à dire à des parties finies du cercle continu S1, qui modélise les hauteurs modulo l'octave. Cette extension m'a été suggérée par Thomas Noll après que nous ayons discuté de la thèse de Ian Quinn à Chicago en 2005, ce qui lui a donné l'idée d'étudier certaines gammes (les gammes engendrées par un intervalle) comme des suites géométriques dans le groupe S1, de la forme uk = u0 ×ξk 45

Leur inventeur Jon Wild les a nommés FLID pour « Flat Interval Distribution ».

46

Publié dans Music Theory Online, 2, 2009.



p. 28 et de considérer les DFT des applications k→ uk définies d'un groupe cyclique Z/n

Z dans le corps des nombres complexes. Une élégante propriété établie par Noll est que, dans le cas d'une telle gamme monogène, les coefficients de Fourier sont tous alignés en tant que nombres complexes dans le plan d'Argan-Cauchy, comme on le voit sur la figure suivante47. 2

4

4 0

560123

6

5

1

3

Une gamme et ses coefficients de Fourier Pour aller plus loin, j'ai plus généralement examiné une partie finie, fixée de S1 (on peut considérer de manière typique douzes notes obtenues par itération de la quinte pythagoricienne à partir d'une fondamentale) qu'on peut voir comme une gamme chromatique non nécessairement tempérée, et les gammes majeures, définies classiquement comme les séquences de notes indexées par (0,2,4,5,7,9,11) ou les translatés modulo 12 de cet ensemble d'indices, dans la gamme chromatique ambiante. Une variante du résultat de Quinn dans ce contexte élargi, mais de démonstration tout à fait similaire, donne que parmi toutes les gammes à 7 notes, ce sont les gammes majeures qui ont la plus grande valeur de leur premier coefficient de Fourier a1 — ce sont les plus pro-

J'ai bien entendu étudié la réciproque, qui se trouve être largement fausse: il existe des familles de gammes à plusieurs degrés de liberté dont les coefficients de Fourier sont alignés sans être pour autant monogènes. 47



p. 29 1

ches d'une progression géométrique parfaite, i.e. d'un heptagone régulier (cf. figure ci-jointe,). Ce résultat est, en fait, parfaite-

0.5

ment pur si la gamme chromatique ambiante est également tempérée (i.e. si tous les intervalles entre deux notes consécutives sont 1

2

3

4

5

6

égaux), et il reste vrai pour des tempéraCoefficients de Fourier de la gamme majeure et d'une gamme quelconque.

ments raisonnables (proches du tempérament égal), ce par continuité de la trans-

formée de Fourier. Il s'agit donc d'un résultat dont le domaine de validité est musical, et non pas mathématique: il n'a pas de sens pour un contexte chromatique arbitraire, mais il est parfaitement vrai pour tous les tempéraments48 qui ont été utilisés effectivement par des musiciens. En préparant un exposé pour l'atelier Klang und Ton à l'institut Helmholtz de Berlin en mai 2007 (à l'instigation de T. Noll), j'ai donc eu la curiosité de calculer les valeurs de ces coefficients de Fourier a1 pour les 12 gammes majeures dans différents tempéraments classiques, et constaté avec amusement que certains tempéraments permettaient d'obtenir une valeur plus grande (pour certaines gammes majeures) que le tempérament égal. Puis j'ai été frappé par l'éventail des valeurs obtenues. Cet éventail est certes réduit49 , mais sa largeur varie considérablement en fonction du tempérament considéré. Par exemple : • pour le tempérament égal toutes les gammes ont un coefficient de Fourier a1 identique; • pour le tempérament pythagoricien, engendré par onze quintes justes, le coefficient varie entre 0.9856 et 0.9927.

Tempéraments à douze notes; j'ai exclu de cette discussion des objets étranges comme par exemple le tempérament à 31 notes de Nicola Vicentino. Cependant, comme ce tempérament est quasiment égal, les résultats trouvés dans le contexte des douze notes pourraient s'y étendre mutatis mutandis. 48

Typiquement, les coefficients de Fourier des gammes majeures varient entre 0.975 et 0.995, le maximum théorique étant de 1 pour une gamme qui réaliserait un heptagone régulier parfait. 49



p. 30 Pour rendre compte de cette disparité de qualité entre les diverses gammes majeu-

res, j'ai créé un indicateur simple, la Major Scale Similarity ou MSS: l'inverse de l'écart maximum entre les coefficients de Fourier des douze gammes majeures. J'ai testé, entre autres, le tempérament proposé par Bradley Lehman comme celui qu'utilisait J.S. Bach, à partir d'une interprétation audacieuse (et contestée !) des volutes qui ornent la première page de l'édition originale du Wohltemperierte Klavier, publié en 172250:

Lehman y lit l'indication (de gauche à droite sur la figure) d'accorder cinq quintes diminuées de deux douzièmes de comma, puis trois quintes justes, puis trois diminuées d'un douzième de comma. J'ai alors constaté avec surprise que l' écart entre les coefficients de Fourier, calculé pour ce tempérament, était plus petit que celui que l'on obtient pour tous ses concurrents 51. Bien sûr, des tempéraments plus récents (postérieurs à la publication du Wohltemperierte Klavier) donnent un écart encore plus réduit; en particulier, le tempérament égal qui prédomine de nos jours donne un écart nul. C'est néanmoins un indicateur significatif, dans la mesure où Bach recherchait explicitement un tempérament qui permît de faire sonner «bien» (c'est une traduction plausible du mot wohl) toutes les gammes majeures. J'étais particulièrement heureux de trouver une retombée aussi concrète à des recherches à ce point abstraites.

Mélodies Autosimilaires

C'est Lehman qui renverse le dessin. Ce point est discuté dans mon article, où il est expliqué pourquoi la DFT ne donne pas de préférence entre un tempérament et son renversement. 50

Une amélioration possible du tempérament proposé par Lehman — d'ailleurs proposée par d'autres pour des raisons musicologiques — consiste à prendre pour unité de modification des quintes un treizième, au lieu d' un douzième, de comma pythagoricien. Cette valeur optimise la MSS, si on garde le schéma proposé par Lehman. 51



p. 31 Certains mathématiciens du groupe Bourbaki, peut-être extrémistes, sont allés jus-

qu'à prétendre que la géométrie classique n'avait plus lieu d'être depuis qu'on avait découvert qu'elle ne faisait que traduire l'action de certains groupes algébriques (groupes affine, orthogonal, projectif, conforme…), et n'était plus qu'un codicille à l'algèbre linéaire. Cependant, la considération de figures, fussent-elles les choix partiaux de représentants d'orbites de ces groupes, peut toujours suggérer des idées nouvelles, que l'on ne saurait découvrir aux altitudes éthérées de l'algèbre pure. Ainsi, mon étude des mélodies autosimilaires52 pourrait être vue comme un codicille à propos de l'action du groupe affine modulo n. Néanmoins, son origine musicale, et l'angle original qui en résulte, ont abouti à une quantité notable de résultats nouveaux et non triviaux, comme les Thms. 2.8 ou 6.1. On y voit, encore mieux à l'œuvre que dans mes autres domaines de recherche, l'interaction dialectique fructueuse entre algébrisation et implémentation. Pour ne prendre qu'un exemple de la complémentarité des processus, le Thm. 6.1 énonce que toute mélodie périodique devient autosimilaire après un certain nombre d'itérations de "l'extraction de la kème note". Or, sans la formalisation en termes d'action d'applications affines sur Z/nZ, l'itération à l'infini d'une telle application n'était guère concevable; mais d'autre part, sans expérimentation informatique, je n'aurais sans doute jamais découvert que cette itération convergeait — et il m'a fallu mettre en jeu des résultats assez profonds d'algèbre commutative 53 pour prouver que cette convergence avait toujours lieu. Dans le point de vue Bourbakiste évoqué plus haut, le groupe affine sur Z/nZ est représenté fidèlement par un simple sous-groupe des matrices GL(2, n). Mais pour le musicien, ces transformations sont fascinantes — au point qu'on peut s'interroger sur le peu de résultats les concernant — car elles préservent, selon le contexte, nombre de notions capitales: le contenu intervallique (à permutation près), les parties tous-intervalles, les modes à transpositions

52

Autosimilar Melodies, JMM, vol. 3 (2008), abrégé en [autoSimJMM].

Précisément il s'agit du Lemme de Fitting. Pour être parfaitement honnête, il arrive que l'attracteur autosimilaire final soit trivial, i.e. consiste en une mélodie faite d'une seule note répétée. 53



p. 32

limitées54 , les pavages, divers types de séries dodécaphoniques comme les séries tous-intervalles, etc… Pour ces raisons, je considère ces travaux comme ma contribution la plus importante et la plus originale à la recherche mathématico-musicale.

Les mélodies autosimilaires sont des mélodies périodiques (qu'on imagine infiniment longues) jouissant de la propriété suivante: si on a convenu d'une unité de temps telle que toutes les notes se produisent à des abscisses entières, alors en extrayant une note tous les a temps on obtient une copie conforme (jouée a fois plus lentement) de la mélodie originale. Comme on le voit ci-dessous, la cellule célèbrissime qui fonde le premier mouvement de la 5ème symphonie de Beethoven se retrouve quand on ne joue qu'une note sur trois — et donc, a fortiori, quand on joue une note sur neuf, etc.

Ce motif célèbre est autosimilaire de rapport 3 Une mélodie périodique est modélisée par une suite d'événements musicaux 55 , i.e. une suite Mk où k décrit un groupe cyclique Z/nZ. Dans l'acception originelle, la mélodie est auto-similaire de rapport a si pour tout k∈ Z/nZ , Mk = M a k (mod n)

54

Moreno Andreatta m'a fait remarquer ce résultat élégant.

… qui peuvent être absence d'événement, c'est à dire silence ou prolongation d'une note. Tom Johnson insiste d'ailleurs pour appeler les silences "rests", de manière plus positive, et s'en sert fréquemment dans ses compositions autosimilaires. 55



p. 33 Tom Johnson56 a rapidement réalisé que cette définition manquait de généralité,

qu'il pouvait exister des décalages (a k + b au lieu de a k), ou encore, plusieurs rapports distincts pour une mélodie. En outre, il a constaté que Si a et a' sont deux rapports d'autosimilarité d'une mélodie M de période n alors a×a' (mod n) est aussi un rapport d'autosimilarité de M. ce qui exprimait en fait que l'ensemble des transformations affines, sur les indices temporels des événements de la mélodie qui la laissent invariante, forment un groupe. D'où ma définition plus générale: M est autosimilaire de groupe G ⊂ An (groupe affine modulo n) si pour tout élément g de G on a pour tout k∈ Z/nZ , Mk = Mg(k). Ainsi la fameuse basse d'Alberti 57 , si populaire au XVIIIe siècle, possède un groupe de 8 symétries, les x → (2k+1) x + 4 ou x → (2k+1) x comme on le voit sur la figure suivante :

On trouvera dans [AutosimJMM] deux extraits de partitions de Johnson entièrement construites sur des mélodies autosimilaires. 56

Si on la considère comme une mélodie périodique de 8 notes; on peut donc considérer la basse d'Alberti comme très symétrique puisque son groupe est d'indice 4 seulement dans le groupe affine complet A8 qui contient 32 éléments. 57



p. 34

OpenMusic réalise les transformations affines d'une mélodie. L'étude d'une propriété de certaines mélodies isolées est donc ramenée à celle de l'action de sous-groupes du groupe affine modulo n sur les indices temporels des événements de cette mélodie. Cette démarche n'est pas neuve en soi (cf. par exemple la classification des pc-sets par Forte, qui est, de fait, une nomenclature des orbites de l'action du groupe T/I sur l'ensemble Z/nZ); et si elle est devenue classique dans nombre de domaines scientifiques 58 , c'est qu'elle permet une taxonomie pertinente qui réduit une combinatoire considérable (toutes les mélodies de période n) à un petit nombre de classes, tout en conservant le sens musical à l'intérieur d'une même classe : ainsi, toutes les mélodies qui y appartiennent vont être invariantes par les mêmes augmentations/extractions. Bien entendu, la faculté de reconnaître le

On peut dater son origine au fameux Programme d'Erlangen de Felix Klein: Vergleichende Betrachtungen über neuere geometrische Forschungen, 1872.

58



p. 35

sous-groupe des symétries affines d'une mélodie (autosimilaire) donnée est ausi fondamentale théoriquement que pratiquement, et elle a été dûment implémentée dans OpenMusic59.

Une fois obtenue la description algébrique complète (cf. [autosimJMM] qui se veut exhaustif sur la question), il devenait possible de renverser la perspective et de créer une mélodie autosimilaire jouissant de symétries données. Le "patch" que j'ai développé avec Carlos Agon pour OpenMusic60 permet de donFig. 9.

A palindrome with period 14

ner en entrée une ou plusieurs "symétries affines", c'est à dire diverses manières d'extraire des notes de la mélodie, ainsi qu'une séquence de notes (suffisamment longue), et d'en déduire une mélodie qui soit autosimilaire modulo toutes ces symétries. Par exemFig. 10. Autosimilar melody with period 15 and its palindromic deformation

ple, en prenant les trois notes do, sol, mi, et

1 en imposant les reference applications affines sequences under A126949. OpenMusic crée une mélodie ayant Besides of course, it is always possible to build a palinFig. 8. This patch shows how to produce an autosimilar melody (the Alberti Bass) starting with a set of symmetries, a period and a collection x → xdromic + 4, x(autosimilar) → 3x, x →melody 3x + 4, x any → 5x + 4, x →melody 5x from autosimilar un groupe donné d'autosimilarités.

of pitches.

by just collapsing together notes belonging to orbits that

61. orbits of are symmetrical (the map f : x !→d'Alberti −x exchanges modulo 8, on retrouve la basse

a primitive autosimilar melody with ratio a). For example 2) Find a melody with some given symmetries. One see the original and the ‘palindromized’ on Fig. 10 builds the orbits first as explained below, from there it obtained by collapsing together the two inversionallyis the composer’s choice to associate notes to each orbit relatedpermet orbits (1,ainsi 2, 4, 8) and (7, 11, 13, 14).2 ToutOpenMusic ce travailprocedure. sur les structures algébriques d'atteindre l'expression la with a standard A nice theoretical property of autosimilar melodies The user inputs a collection of affine maps. Starting from appears when one tries to iterate an affine map with plus du compositeur, qui peut jouer sur tous les paramètres qui restent an parfaite element xde in la Zncréativité , a set is initialized with x as sole a ratio that is not invertible modulo n: the map being element. Then all the maps in the collection are applied no longer one-to-one, there is no reversibility and some libres aprèstoqu'il symétries qu'il désirait. Un utilisateur de ce programme, suffisamrepeatedly that ait set fixé until les it no longer changes. All information is lost at each iteration, but (this is related elements of this set, now an orbit, are set aside and to the very deep Fitting Lemma of commutative algebra the algorithm carries on with the next element in Zn that already appeared in a musical context in Anatol that has not been reached yet, until Zn is exhausted Vieru’s sequences, [3]) after a time an autosimilar melody (see Fig. 8). choisi This ischerche the dual approach from the last entre la mélodie originale et les mélodies extraites à 59 L ' algorithme le coefficient de corrélation emerges (see Fig. 11). one,rapports, providingenthe withcomme the simplest structure divers lescomposer considérant des circlists, cf. [autosimJMM] 5.1.hides inside itself the deepest harmony. Thus chaos admitting autosimilar copies with the desired ratios and 60 offsets. cf. Agon, C., Amiot, E., Andreatta, M., « Autosimilar melodies and their implementation in OpenMusic », Proceedings SMC 07, Le1ada, Grèce (2007). D. Palindromes 61 Il est suffisant de donner quelques symétries, qui engendreront tout un sous-groupe qu'il n'est pas nécessaire The above concept enables to clarify which autosimilar d'expliciter, non plus que son nombre — l'algorithme calcule tout pour l'utilisateur, en appliquant toumelodies will be palindromes, as it d'éléments is only a question tesofleswhether symétries données jusqu'à ce que rien de nouveau x !→ −x (or some more general inversionne puisse être engendré: Se vogliamo che tutto rimanga come è, bisogna che tutto (G.T. x !→ c − x) iscambi present in di theLampedusa, stabilizer ofIl Gattopardo). the melody. Fig. 11. An autosimilar melody from a random one The algorithms allow the straighforward construction of palindromic melodies (among other symmetries), and the theory reaches interesting result, as (simplifying a little) IV. C ONCLUSION Theorem 6: An autosimilar melody with ratio a will We presented some theoretical and implementational be palindromic iff there is some power of a equal to -1 aspects of melodic autosimilarity. After describing a gen-



p. 36

ment versé en mathématiques, pourrait prévoir exactement le nombre d'occurrences des différentes notes, ou le nombre maximal de notes différentes, la possibilité ou non que la mélodie soit palindromique, ou faire en sorte que la mélodie s'exprime comme un pavage par augmentations: toutes ces questions, et d'autres, sont élucidées dans [autosimJMM]; mais en pratique, même sans aucune connaissance mathématique, en expérimentant avec les paramètres du patch développé sous OpenMusic on arrive rapidement aux mêmes résultats.

Mémoire de thèse

Amiot 37

Conclusion et perspectives

L’ élaboration de cette synthèse de recherches initiées il y a 25 ans m’a permis de comprendre pourquoi, et en quoi, l’informatique a toujours joué un rôle central dans chacun de mes travaux. Mes deux pôles d’intérêt ont toujours été musique et mathématiques (non triviales); or, refusant toute séparation schizophrénique entre elles, je me suis tout naturellement placé au carrefour de l’informatique. Cette discipline touche à la première, notamment par la validation des théories élaborées via des implémentations concrètes (et bien sûr, plus traditionnellement par tout l’aspect expérimental, analyse de données ou formulation de conjectures), et aux dernières via l’organisation rigoureuse des données, qui fait de l’écriture d’un programme le reflet fidèle (pour ne pas dire platonicien) des structures algébriques, qu’en retour il aura parfois suggérées.

Il est fréquent de considérer les mathématiques comme des prestataires d'outils et de concepts pour d'autres sciences; certes il en est ainsi, dans ma démarche comme dans d'autres: les structures de groupe, d'anneau, d'algèbre, la transformée de Fourier et autres morphismes montrent leur « déraisonnable » efficacité. Cependant, comme parfois avec la physique, il arrive que le champ d'étude lui-même suscite des retombées mathématiques, que l'on aurait obtenues bien plus tard, si la perspective musicale n'avait suggéré des questionnements d'une nature bien différente. En premier lieu, je peux citer mes résultats sur les pavages de Z par translation. La notion de canon de Vuza est «évidente» pour un musicien, et la réduction récursive à un canon de Vuza est exactement ce que l'on perçoit d'un canon musical (on n'entend jamais que des canons de Vuza…). Et par ailleurs, cette réduction apporte des lumières nouvelles sur certaines des plus fascinantes conjectures (mathématiques) sur les pavages.

Mémoire de thèse

Amiot 38

Un signe manifeste de l'injuste obscurité des canons de Vuza est l'absence, dans l'encyclopédie des suites d'entiers en ligne de Sloane, de la liste des cardinaux des «mauvais groupes» (ceux qui ne sont pas de Hajós: 72, 108, 120, 144…). Cette omission a été réparée depuis; j'y ai fait rajouter en plus une suite originale, celle des entiers n tels que -1 soit une puissance 62 modulo n. Ces entiers sont liés aux propriétés palindromiques 63 de certaines mélodies autosimilaires. D'autres propriétés intéressantes, et à ma connaissance inédites, ont surgi de l'étude de ces mélodies: ordre maximal d'une application affine, définition des mélodies autosimilaires commme limites asymptotiques d'extraction de toute mélodie périodique. D'autres propriétés déjà connues par ailleurs, mais demeurées obscures, ont pris un sens nouveau grâce à l'orientation que leur ont donnée mes recherches. Ainsi en va-t-il du lemme ésotérique qui assure que tout polynôme à coefficients modulo p, n'ayant pas 0 comme racine, divise un Xn-1 pour n assez grand. Lorsque je l'ai retrouvé, ce lemme m'a permis de prouver que tout motif fini «pave modulo p». Enfin, pour conclure provisoirement cette liste (qui, je l'espère, continuera de s'enrichir), il me semble que seul un musicien pouvait s'interroger sur le nombre d'intervalles générateurs d'une gamme, même s'il a fallu requérir des compétences de mathématicien pour établir que ce nombre ne peut jamais être 14,par exemple64. C'est en étudiant les diverses opérations musicales sur les gammes (transpositions, inversions) et les rapports algébriques entre elles que j'ai été amené à classer toutes les spectral units rationnelles d'ordre fini, qui sont (entre autres représentations) des matrices de passage entre gammes homométriques. Recherche qui m'a incidemment fait découvrir le fait beaucoup plus simple, que la différence entre deux nombres inversibles modulo n décrit le sous-groupe d'indice 2 de Z/nZ 65.

62

Les premières valeurs sont 5, 7, 9, 10, 11, 13, 14, 17, 18, 19, 21, 22, 23, 25, 26, 27, 28, 29, 31, 33…

Mon intérêt pour les palindromes est largement né de la passion que leur voue Moreno Andreatta, qui avait remarqué que nombre de canons de Vuza exhibent une certaine "palindromicité", quand ce n'est pas une palindromicité certaine. 63

64

Puisque j'ai prouvé que ce nombre est toujours de la forme Φ(n) où Φ est la fonction d'Euler.

65

Et le groupe tout entier quand n est impair.

Mémoire de thèse

Amiot 39

L' approche musicienne est, pour moi, une source d'émerveillement continuel, car elle ne cesse d'engendrer des découvertes nouvelles, dues à ses angles de pensers originaux. Cependant — et ce n'est pas une opposition mais une consolidation dialectique — il s'agit en vérité de l'unité profonde qui relie naturellement l'esprit d'un musicien et celui d'un mathématicien. Si l'on en croit un vieux poncif pythagoricien, cette unité va tellement de soi qu'elle n'a nul besoin d'être prouvée. Récemment encore, ce constat se fondait sur l'abondance du nombre dans la musique (mètre, hauteurs, combinatoire), abondance qui n'offre pourtant rien de particulièrement remarquable, ou de spécifique à la musique! Car, pour citer le mot trop célèbre de Leibniz, La musique est un exercice d'arithmétique secrète, et celui qui s'y livre, ignore qu'il manie des nombres. Si le secret perdure sans doute, il est clair dorénavant, et particulièrement je l'espère pour mes lecteurs, que cette harmonie dépasse de loin la notion de nombre et donc la perspective Leibnizienne66, embrassant tout particulièrement les structures algébriques qui modélisent au plus près les concepts du musicien, concepts simples de son point de vue (autosimilarité, contenu intervallique, etc… ) mais qui nécessitent des outils relativement complexes pour leur formalisation. Comme le dit fort justement Guérino Mazzola, On ne peut prétendre que Bach, Haydn, Mozart ou Beethoven — pour ne nommer que quelques uns des plus grands compositeurs, sont des génies exceptionnels qui ont élaboré des chefs-d'œuvres éternels, sans se donner, pour essayer de comprendre leurs créations uniques, des outils appropriés, c'est à dire suffisamment puissants et profonds 67.

La dépassant et même la renversant, comme tente de le montrer M. Andreatta dans « Mathematica est exercitium musicae : la recherche "mathémusicale" et ses interactions avec les autres disciplines », HDR (soutenance prévue pour octobre 2010). 66

67

Mazzola & alii, Topos of Music, Birkhaüser, 2002, p. vii. (ma traduction).

Mémoire de thèse

Amiot 40

Or l' ordinateur apporte un interfaçage bienvenu entre l'aridité de l'algèbre et l'immédiateté de la perception musicale; il est donc naturel que mes recherches se soient si souvent traduites en implémentations (comme d'ailleurs nombre de celles de Mazzola). Cependant il existe une autre piste qui confirmerait ce renouveau du poncif — la musique comme algèbre secrète ? — qui est celle de l'expérimentation en sciences cognitives. DFT of !0,2,3,4,8" mod 11 5 4 3 2 1

2

4

6

8

10

Un FLID: distribution plate des intervalles et des coefficients de Fourier

Avec Isabelle Viaud-Delmon, Carlos Agon et Moreno Andreatta, nous avons lancé à l'IRCAM un projet destiné à mesurer la perception par les sujets testés du caractère uniforme, ou pas, des coefficients de Fourier d'un rythme. Ce projet vise à établir si l'on discerne le caractère saillant (comme pour les ME sets) ou au contraire plat (cf. l'illustration ci-dessus, avec une platitude maximale des coefficients de Fourier) de structures discrètes périodiques. L'étude du caractère perceptif des coefficients de la DFT fait partie du projet plus large "Mathématiques/ Musique et Cognition68 " cherchant à relier les approches formelles en musicologie computationnelle et les sciences cognitives (cf. figure infra). Le projet "Mathématiques/Musique et Cognition", qui avait reçu initialement le soutien de l'AFIM (Association Française d'Informatique Musicale) est désormais intégré en tant qu' un axe de recherche, à laquelle je participe, au sein de l'équipe Représentations Musicales de l'IRCAM. 68

http://recherche.ircam.fr/equipes/repmus/mamux/Cognition.html

Mémoire de thèse

Amiot 41

Mémoire de thèse

Amiot 42

Remerciements

Avant tout, je remercie André Riotte, pionnier courageux grâce à qui j'ai pu trouver ma voie, ainsi que nombre de mes complices dans cette belle aventure. Il a eu le courage d'aller de l'avant dans une entreprise que presque tous jugeaient impossible. Il avait raison. Je remercie chaleureusement mon directeur de thèse, Carlos Agon, qui lui aussi a rendu possible ce qui semblait ne pas l'être. Sans lui jamais je ne me serai lancé dans cette thèse. Par ailleurs, je garde un souvenir ému des nombreuses heures que nous avons passées ensemble à implémenter mes idées les plus étranges. Son inégalable sens pratique a permis de concrétiser nombre de mes abstractions. Moreno Andreatta m'a convaincu de l'intérêt des canons rythmiques mosaïque, et m'a ainsi remis en selle dans la recherche mathémusicale après une longue parenthèse. Sans lui, je n'aurais sans doute pas infligé tous ces articles à la communauté scientifique. Son enthousiasme communicatif a impulsé un grand nombre d'événements et de recherches novatrices, et en particulier des miennes. David Clampitt porte une responsabilité non moins lourde, puisque c'est lui qui m'a fait connaître aux membres actifs de la théorie musicale aux USA. J'ai ainsi pu, avec quelques siècles de retard, découvrir l'Amérique, ce qui a eu des conséquences extrêmement fécondes sur ma recherche. Sa générosité, et son hospitalité chaleureuse, m'ont grandement aidé à trouver mon chemin en ces terres inconnues, et son travail visionnaire sur les We( Formed Scales (avec Norman Carey que je salue au passage) m' ont ouvert un nouvel univers. Thomas Noll a été un des chercheurs qui m'ont le plus stimulé, par nos discussions informelles comme par nos innombrables échanges d'emails. Ses idées visionnaires permettent d'aller plus loin qu'on ne s'en serait cru capable. Par ailleurs, il m'a lui aussi permis de rencontrer nombre de chercheurs fascinants, comme William Sethares dont je tiens à dire combien j'ai apprécié la collaboration, l'incurable optimisme et l'inaltérable bonne humeur. C'est un réel plaisir de faire de la recherche avec lui.

Mémoire de thèse

Amiot 43

Guerino Mazzola est un chercheur d'une envergure immense, dont les travaux ont plusieurs décennies d'avance sur le reste de la communauté. Je suis toujours pantois qu'il ait, si tôt, cru en moi (m'invitant à un colloque à Zürich dès 2003 et ne cessant jamais de m'encourager) et cela m'a été d'un grand secours dans les moments de doute ou de découragement. Ses idées fascinantes m'ont aussi grandement influencé, qu'il s'agisse des objets de nos études ou, plus vertigineusement, de ses théories sur que(es théories utiliser pour les étudier. Ma mère a eu le courage admirable de relire un texte dont elle ne pouvait que rarement suivre le sens, pour me conseiller une écriture mieux articulée, plus riche en virgules, et généralement plus limpide. S'il reste des obscurités dans ce mémoire, ce n'est certes pas de sa faute, mais de la mienne. Tom Johnson a toujours été un formidable réservoir d'idées et de questions. Je lui suis, entre autres, redevable de la merveilleuse question des mélodies autosimilaires, mais aussi de la découverte d'un bon nombre de belles propriétés — qu'il ne restait plus qu'à prouver… C'est néanmoins un vieux complice, Gérard Assayag, qui m'a signalé ce dernier problème. Je lui dois cela et bien plus, car il n'a pas peu contribué à m' inspirer, notamment grâce à ses belles réalisations informatiques, dont le fleuron est sans doute OMax. Jean-Paul Allouche m'a ouvert les colonnes de sa revue pour divulguer au grand public les mystères des canons rythmiques et je l'en remercie. J'ai toujours un grand plaisir à échanger des idées avec Jon Wild, un des chercheurs les plus fertiles que je connaisse. Nos discussions sont toujours extraordinairement stimulantes, et j'attends les prochaines avec impatience. Aux USA, j'ai été très sensible à l'accueil chaleureux de Rick Cohn, qui m'a notamment invité (avec David Clampitt) à être présent lors de la préentation mémorable des Orbifolds par Cliff Callender, Ian Quinn et Dmitri Tymosczko. J'ai dit plus haut à quel point la thèse de Ian m'a profondément influencé, et je répète ici à quel point je lui en suis reconnaissant. J'ai eu par ailleurs des échanges d'une grande fécondité et profondeur avec Dmitri, qui m'a très gentiment invité à un séminaire mémorable — et fécond — à la Barbade, dont je garde un souvenir ému.

Mémoire de thèse

Amiot 44

Je tiens à rappeler la mémoire de Marcel Mesnage, récemment disparu, qui a porté à son époque, et quasiment seul, la qualité de l'implémentation des théories musicales à un niveau longtemps inégalé. Son Morphoscope avait des années d'avance sur son temps. C'était un ami et une source d'inspiration, nous ne l'oublierons pas. Last but not least (by far), mes remerciements émus à mon épouse Pascale, qui a patiemment relu avec soin, non seulement ce mémoire, mais aussi la plupart de mes articles dont elle a aidé à polir l'anglais. Son mérité est d'autant plus immense que les sujets évoqués étaient bien éloignés de ses connaissances, et qu'elle dû, et su, supporter de nombreux moments de découragement, mais aussi — et ce sont sans doute les pires — ceux d'intense créativité.

Mémoire de thèse

Amiot 45

Liste de travaux ARTICLES FIGURANT DANS LE DOSSIER DES TRAVAUX ✦ Amiot E., « À propos des canons rythmiques », Gazette des Mathématiciens, 106 (2005). Consultable en ligne. ✦

Amiot E., « David Lewin and Maximally Even Sets »,  Journal of Mathematics and Music (2007) vol. 3. 

✦  Amiot E., « Autosimilar Melodies », Journal of Mathematics and Music (2008) vol. 3.  ✦  Amiot E., « Discrete Fourier Transform and Bach’s Good Temperament », Music Theory Online (2009) 15, 2. 

✦ Amiot E., « New Perspectives on rhythmic canons and the Spectral Conjecture », Journal of Mathematics and Music (2009) special issue on rhythmic canons, C. Agon et M. Andreatta dir..

AUTRES ARTICLES PUBLIÉS DANS DES REVUES avec comité de lecture ✦ Amiot E., « Pour en finir avec le Désir », Revue Analyse Musicale, 22 (1991). ✦ Amiot E.,« Mathématiques et analyse musicale: une fécondation réciproque », R.A.M., 28 (1992). ✦ Amiot E.,« La série dodécaphonique et ses symétries », Quadrature, 19 (1994). ✦ Amiot E.,« Chopin, virtuose de la théorie des groupes ?» Quadrature, 24 (2000). ✦ Amiot E.,« Une preuve élégante du théorème de l’hexacorde de Babbitt », Quadrature, 28 (2006). ✦ Amiot E.,« Gammes Bien Réparties », Revue de Mathématiques et Sciences Humaines, 178 (2007).

ACTES DE COLLOQUES avec comité de lecture ✦ Riotte, A., Amiot, E., Assayag, G., Malherbe, C., « Duration Structure Generation and Recognition in Musical Writing », Proceedings, ICMC (International Computer Music Conference), la Haye (1986). ✦ Agon, C., Amiot, E., Andreatta, M., « Tiling problems in music composition : Theory and Implementation », Voices of Nature Proceedings, ICMC, Göteborg (2002). ✦ Amiot, E.,

« Rhythmic canons and Galois Theory », Actes du Colloquium on Mathematical Music Theory, H.

Fripertinger & L. Reich Eds, Grazer Math. Bericht Nr 347 (2005). ✦ Agon, C., Amiot, E., Andreatta, M., « Tiling the (musical) line with polynomials : Some theoretical and implementational aspects », Acts of ICMC 2005, Barcelona (2005). ✦ Agon, C., Amiot, E., Andreatta, M., Noll, T., « Towards Pedagogability of Mathematical Music Theory: Algebraic Models and Tiling Problems in Computer-Aided Composition », Bridges Conferences, Proceedings, London (2006). ✦ Agon, C., Amiot, E., Andreatta, M., Noll, T., « Oracles for Computer-Aided. Improvisation », ICMC, New Orleans (2006). ✦ Agon, C., Amiot, E., Andreatta, M., « Autosimilar melodies and their implementation in OpenMusic », Proceedings SMC 07, Lefkada, Grèce (2007).

Mémoire de thèse

Amiot 46

✦ Amiot, E., « Eine kleine Fourier Nachtmusik », Actes du colloque de la Society for Mathematics and Computation in Music, Berlin (2007), Springer (à paraître). ✦ Amiot, E., Sethares, W., « An Algebra for periodic rhythms and scales », Actes du Helmholtz Workshop "Klang und Ton", Berlin (2007), Springer (à paraître).

OUVRAGE COLLECTIF ✦ « Why rhythmic canons are interesting », Perspectives in Mathematical and Computational Music Theory, Mazzola, Noll, Lluis Puebla Ed, Epos, 190-209, Univ. Onasbrück (2004).

CONFÉRENCES ✦ Un bon nombre de ces conférences ou communications ont été données dans le cadre du séminaire MaMuX à l'IRCAM, Paris. ✦ « Why rhythmic canons are interesting », colloque MaMuTh de Zürich (octobre 2002). ✦ « Outils pour les canons rythmiques », MaMuX (janvier 2003). ✦ « Sur des canons de Vuza que son algorithme ne permet pas d'obtenir », MaMuX (janvier 2004).

✦« Rhythmic canons and Galois Theory », conférence au colloque MaMuTh de Graz (mai 2004). ✦ « Les Canons rythmiques », conférence de vulgarisation, Perpignan (octobre 2004). ✦ « Rhythmic Canons, Galois Theory, Spectral Conjecture », American Mathematical Society’s Fall Session, Evanston, IL, USA (octobre 2004). ✦ « Canons rythmiques pour les musiciens », « canons rythmiques pour les mathématiciens », MaMuX (juin 2005). ✦ « Canons that worked » à McMaster University, et « Mathematical Properties of Rhythmic Canons », St Catherine University, Ontario, Canada (juillet 2005). ✦ « Sur les canons rythmiques », à l’invitation du Club Maths de l’université Pierre et Marie Curie, Paris VI (octobre 2006). ✦ « Why Fourier ? », journées à la mémoire de John Clough à l’Université de Chicago, IL, USA (7-10 juillet 2005). ✦ « Gammes et transformée de Fourier Discrète », MaMuX (mai 2006). ✦ « Mélodies Autosimilaires » (avec Tom Johnson), Colloque Mélodie de la Société Française d'Analyse Musicale, IRCAM (oct. 2006). ✦ « L’action du groupe affine modulo n et les mélodies autosimilaires », Séminaire MaMuX (oct. 2006). ✦ « Scales and Fourier in the non tempered universe », Helmholtz Workshop "Klang und Ton", Berlin (mai 2007). ✦ « Eine kleine Fourier Nachtmusik », colloque de la SMCM, Berlin (mai 2007). ✦ « DFT vs JSB: about some fine tuning », MaMuX, Paris (mai 2008). ✦ « Canone ritmici: come, quanto ? », université de Pise (octobre 2008).

Mémoire de thèse

Amiot 47

✦ « Fourier, Music, Mathematics and the Brain », colloque de la Society for Music Theory, Nashville (novembre 2008). ✦ « La trasformata di Fourier discreta & applicazione musicale », cours de Mastère à l’université de Pise (janvier 2009). ✦ « Aspects cognitifs de la DFT dans la perception de structures musicales », MaMuX (avril 2009). ✦ « Promenades musicales dans Z/12 Z »: une concerférence de vulgarisation sur certaines structures algébriques discrètes en musique; donnée à Perpignan, Toulouse, et Leucate. Une partie du concert (La cage aux chiffres d'André Riotte) est disponible en ligne.

AUTRES RÉFÉRENCES BIBLIOGRAPHIQUES ✦ Actes du colloque sur la Set Theory, Ed. Delatour France / IRCAM Centre Pompidou, Paris (2008). ✦ Amiot, E., « On the Group of Rational Spectral Units with Finite Order », http://arxiv.org/abs/0907.0857. ✦ Amiot, E., « About the Number of Generators of a Musical Scale », http://arxiv.org/abs/0909.0039. ✦ Andreatta, M., Méthodes algébriques en musique et musicologie du XXe siècle : aspects théoriques, analytiques et compositionnels, thèse, École des hautes études en sciences sociales / Ircam, Paris (2003). ✦ Coven, A., Meyerowitz, E., « Tiling the integers with translates of one finite set », J. Algebra 212 , pp 161--174 (1999). ✦ Douthett, J. et Krantz, R. « Energy extremes and spin configurations for the one-dimensional antiferromagnetic Ising model with arbitrary-range interaction », Journal of Mathematical Physics 37 , pp. 3334-3353 (1996). ✦ Fidanza, G., « Canoni ritmici a mosaico », tesi di laurea, Università degli Studi di Pisa, Facoltà di SSMMFFNN, Corso di laurea in Matematica (2008). ✦ Fripertinger, H., « Tiling problems in music theory », Perspectives of Mathematical and Computational Music Theory, (G. Mazzola, E. Puebla et T. Noll eds.) EpOs, Universität Osnabrück, 153-168 (2004). ✦ Gilbert, E., « Canons mosaïques, polynômes cyclotomiques, rythmes k-asymétriques », mémoire ATIAM, M. Andreatta dir. (2007). ✦ Kolountzakis, M., et Matolcsi, M. « Algorithms for Translational Tiling », special issue on rhythmic canons, C. Agon et M. Andreatta dir, JMM (2009). ✦ Kolountzakis, M., Matolcsi, M., « Tiles with no spectra », Forum Math., to appear. ✦ Łaba, I., « The spectral set conjecture and multiplicative properties of roots of polynomials », J. London Math. Soc. 65, pp. 661–671 (2002). ✦ Lewin, D., Re: Intervallic Relations between two collections of notes, Journal of Music Theory, 3:298-301 (1959). ✦ Lewin, D., Special Cases of the Interval Function between Pitch-Class Sets X and Y, Journal of Music Theory, 45-129 (2001). ✦ Quinn, I., « A unified theory of chord quality in equal temperaments », PhD dissertation, Univ. of Rochester (2005). ✦ Riotte, A., « Formalisation de structures musicales », cours Paris VIII (1978-1990).

Annexe I Articles figurant dans le dossier des travaux

` propos des canons rythmiques A Emmanuel Amiot

R´esum´e Cet article fait le point sur une notion riche, issue de pr´eoccupations musicales mais qui s’est av´er´ee f´econde en probl`emes math´ematiques fascinants. En particulier l’´etude des canons rythmiques a permis de d´ecouvrir des r´esultats in´edits sur ˆ les corps finis et de d´emontrer de nouveaux cas de la conjecture spectrale. En retour, bien sur, les outils math´ematiques performants utilis´es ont donn´e de nouvelles dimensions a` explorer aux compositeurs. La th´eorie de G ALOIS a donc fait une apparition inattendue dans certains logiciels d’aide a` la Composition Assist´ee par Ordinateur ! Des illustrations musicales (ou en tout cas, sonores. . .) de cet article peuvent eˆ tre trouv´ees sur le site http ://canonsrythmiques.free.fr/Midi, sous forme de fichiers MIDI.

Notations Je note Zn le groupe (parfois l’anneau) quotient Z/nZ, Fq est le corps a` q e´ l´ements. Dans tout anneau, a | b signifie que a divise b. Φn d´esigne le ne` me polynˆome cyclotomique dans Z[X]. Enfin [[ a, b ]] d´esigne l’intervalle d’entiers [a, b] ∩ Z.

1 1.1

Canons musicaux et canons rythmiques Canon musical

Le principe du canon musical est probablement bien connu du lecteur ; l’exemple le plus connu des francophones est sans doute « Fr`ere Jacques », qui se chante de pr´ef´erence a` quatre, chaque chanteur reprenant exactement la mˆeme comptine mais d´ecal´e d’une mesure par rapport au chanteur pr´ec´edent. Fr`ere Jacques, fr`ere jacques

Dormez-vous ? dormez-vous ?

Sonnez les matines, sonnez les matines

Ding deng dong, ding deng dong

Fr`ere Jacques, fr`ere jacques

Dormez-vous ? dormez-vous ?

Sonnez les matines, sonnez les matines

Fr`ere Jacques, fr`ere jacques

Dormez-vous ? dormez-vous ? Fr`ere Jacques, fr`ere jacques

qui devient, en r´egime de croisi`ere, Fr`ere Jacques, fr`ere jacques

Dormez-vous ? dormez-vous ?

Sonnez les matines, sonnez les matines

Ding deng dong, ding deng dong

Ding deng dong, ding deng dong

Fr`ere Jacques, fr`ere jacques

Dormez-vous ? dormez-vous ?

Sonnez les matines, sonnez les matines

Sonnez les matines, sonnez les matines

Ding deng dong, ding deng dong

Fr`ere Jacques, fr`ere jacques

Dormez-vous ? dormez-vous ?

Dormez-vous ? dormez-vous ?

Sonnez les matines, sonnez les matines

Ding deng dong, ding deng dong

Fr`ere Jacques, fr`ere jacques

Ce principe de jouer une mˆeme m´elodie (ou une forme l´eg`erement d´eform´ee de la mˆeme m´elodie) le long de diverses voix est aussi celui de la fugue, dont le plus c´el`ebre sp´ecialiste est J.S. B ACH. C’est tout un art (de la fugue !) que de faire co¨ıncider harmonieusement des notes diverses avec un ` d´ecalage. J.S. B ACH, justement, a par exemple montr´e sa virtuosit´e dans les Variations Goldberg ou il fait des canons d´ecal´es dans le temps et dans l’espace des hauteurs, successivement d’un unisson, d’une seconde, d’une tierce, etc. . . Pour mod´eliser de fac¸on constructive les canons, nous allons nous montrer moins ambitieux, en nous concentrant exclusivement sur le domaine rythmique, et plus exigeants, en posant une condition rigoureuse :   Sur chaque temps, on doit entendre une seule note   Sans cette contrainte, on pourrait (on peut !) faire un canon fond´e sur n’importe quel motif. Cela n’a pas grand int´erˆet, sauf peut-ˆetre combinatoire. Le canon rythmique « canonique », si j’ose dire, est donc fond´e sur un pattern rythmique discret, qu’on peut imaginer jou´e par un instrument de percussion (on n´eglige la question de la dur´ee des notes), pattern qui est r´ep´et´e a` l’identique par d’autres voix. On peut alors mod´eliser ce pattern tr`es simplifi´e par une s´erie d’entiers, qui rep`erent les moments ` une note est jou´ee. Sans perte de g´en´eralit´e, on peut fixer l’origine des temps a` la premi`ere note ou

du pattern, qui va donc commencer par le nombre 0. Le principe mˆeme du canon signifie que les diverses entr´ees du motif sont obtenues par des translations, e´ gales aux d´ecalages avec la premi`ere entr´ee : les diverses voix seront A, A + b1 , A + b2 . . . En mettant dans un mˆeme vecteur tous ces d´ecalages, on obtient une premi`ere formalisation, provisoire : ´ DEFINITION 1. Soit A = {0, a1 , . . . ak−1 } un sous-ensemble de N ; oo A sera le motif (inner rhythm) d’un canon rythmique s’il existe un pattern des voix (outer rhythm) oo oo B = {0, b1 , . . . b`−1 } tel que A × B 3 (a, b) 7→ a + b est injective. oo A est le motif du canon, B la s´equence des entr´ees (les moments ou` chaque instrument commence sa oo partie). oo Cette condition s’´ecrit aussi A + B = A ⊕ B. o Exemple : Le motif A = {0, 1, 3, 6} donne un canon a` quatre voix avec B = {0, 4, 8, 12}. En effet, A ⊕ B = {0, 1, 3, 4, 5, 6, 7, 10}. Une repr´esentation simplifi´ee de partition en est donn´ee figure 1.

F IG . 1 – Un canon rythmique REMARQUE 1. Chaque note est jou´ee sur un multiple entier de l’unit´e de temps ; ceci peut paraˆıtre une oo contrainte artificielle et forte, mais en fait aussi bien D AN T UDOR V UZA [20], qui est le pionnier des reoo cherches sur les canons rythmiques, que L AGARIAS [15] dans un article purement math´ematique, ont oo o montr´e essentiellement que ce cas est le seul possible pour un motif fini. Un corollaire e´ l´ementaire de la d´efinition : ´ Si A ⊕ B est un canon rythmique, il en est de mˆeme de B ⊕ A : on peut e´ changer les PROPOSITION (DUALITE). oo rˆoles des inner et outer rhythms. o La commutativit´e de l’addition permet donc de fabriquer un canon a` p voix de q notes en partant d’un canon a` q voix de p notes. Avec 4 × 5 ou 5 × 4 notes on par exemple la figure 2. Un canon et son dual

F IG . 2 – Deux canons duaux

1.2

Canons p´eriodiques

On remarque, sur l’exemple ci-dessus, qu’il y a des trous dans le canon – que les musiciens appellentdes silences – mais que ces trous se trouveraient naturellement bouch´es par d’autres copies du motif. En fait on peut obtenir un canon infini avec une note et une seule par temps, soit avec un nombre infini de voix, soit de fac¸on plus r´ealiste en prolongeant le motif par p´eriodicit´e (ici la p´eriode 8) comme on le constate sur la figure 3, qui reprend le motif de la figure 1.

Variations sur un canon

....

ou

....

....

....

F IG . 3 – Canon prolong´e a` l’infini On obtient ainsi un pavage p´eriodique de Z par le motif A. Dor´enavant, je parlerai donc indiff´eremment de pavages (pavages de Z) ou de canons rythmiques. Par passage au quotient, cela

2

` une nouvelle d´efinition, plus revient a` dire que l’on a un pavage du groupe cyclique Zn = Z/nZ. D’ou restrictive, qui est celle que nous consid´ererons d´esormais : ´ DEFINITION 2. On a un canon rythmique de motif A = {a0 , . . . ak−1 } et de p´eriode n s’il existe B ⊂ N tel que

oo oo oo o

A ⊕ B = Zn

La condition de somme directe (⊕) exprime que sur chaque temps on a exactement une note et une seule. Exemple : Le motif A = {0, 1, 3, 6} donne un canon de p´eriode 8 avec B = {0, 4}. En effet, A ⊕ B = {0, 1, 3, 4, 5, 6, 7, 10} = {0, 1, 2, 3, 4, 5, 6, 7} si on travaille modulo 8. C’est l’effet obtenu si on reprend p´eriodiquement ce canon (comme Fr`ere Jacques).

F IG . 4 – La forme d’un motif est d´efinie a` une rotation pr`es REMARQUE 2. Comme Zn est cyclique, la notion de pavage ou de canon rythmique est ind´ependante d’un choix oo d’origine de ce cercle comme on le voit sur les figures 4 et 5. C’est pourquoi en pratique on convient, sans oo perte de g´en´eralit´e, que A, B commencent par 0. Formellement cela est li´e a` l’action du groupe Z sur ses n oo o parties par translation.

F IG . 5 – Un canon de Vuza, de p´eriode 108 Cette condition de p´eriodicit´e que nous avons apparemment impos´ee semble tr`es forte. Mais on connait depuis 1950 le th´eor`eme suivant : ´ ` THEOR EME 1. ([de Bruijn)] oo Si A est une partie finie de N telle qu’il existe C ⊂ Z avec A ⊕ C = Z, alors il existe un entier n et une oo o partie (finie) B tels que C = B ⊕ nZ. Donc le pavage est p´eriodique, et A ⊕ B = Zn . La d´emonstration de ce th´eor`eme repose sur l’incontournable principe des tiroirs, je laisse le lecteur int´eress´e se r´ef´erer a` [2] et a` la figure suivante. Mentionnons a` ce propos un premier probl`eme ouvert : Si `(A) = Max A − Min A est la largeur du

3

Un musicien attend pour rentrer ICI

F IG . 6 – Pourquoi tout canon de motif fini est p´eriodique motif A, la d´emonstration de DE B RUIJN montre que n 6 2`(A) majore la p´eriode du canon, mais tous les exemples connus v´erifient n 6 2 × `(A). . . Est-ce g´en´eral ? EXERCICE 1. Donner un motif de largeur ` pour lequel la plus petite p´eriode possible du canon est effectivement oo 2` (solution en fin d’article). En revanche un motif infini peut tr`es bien donner un canon ap´eriodique (par exemple les nombres dont l’´ecriture binaire n’a que des bits d’ordre impairs), ainsi que des pavages plus « tordus »[2].

´ Modelisation polynomiale et facteurs cyclotomiques

2

Pour travailler dans une structure plus riche, on fait comme S OPHUS L IE passant d’un groupe de Lie a` son alg`ebre : par exponentiation.

2.1

Polynˆ ome associ´e a` un motif rythmique

On va enrichir la structure alg´ebrique ambiante, remplac¸ant les sommes d’ensembles par des produits de polynˆomes : P k ´ DEFINITION 3. Soit A ⊂ N un sous-ensemble fini non vide. Alors on pose A(X) = X .

oo

k∈A

PROPOSITION. La somme A + B est directe (i.e. A × B 3 (a, b) 7→ a + b est injective) ssi

oo oo oo o

A(X) × B(X) = (A ⊕ B)(X)

Sinon on trouverait des coefficients > 1. Et donc la d´efinition des canons rythmiques est la condition suivante, not´ee (T0 ) : ´ ` THEOR EME 2. A est le motif d’un canon rythmique avec « motif des entr´ees » B et p´eriode n ssi

oo oo oo o

(T0 )

A(X) × B(X) = 1 + X + X2 + . . . Xn−1

(mod Xn − 1)

Par exemple {0, 1, 3, 6} ⊕ {0, 8, 12, 20} donne les polynˆomes (1 + X + X3 + X6 ) × (1 + X8 + X12 + X20 ) dont le produit est 1 + X + X3 + X6 + X8 + X9 + X11 + X12 + X13 + X14 + X15 + X18 + X20 + X21 + X23 + X26 qui se r´eduit modulo X16 − 1 a` 1 + X + . . . X15 – concr`etement on applique la r`egle Xk → Xk mod n . NB : c’est en d´ecouvrant cette formalisation appliqu´ee par A NDRANIK T ANGIAN [16] a` un probl`eme de T OM J OHNSON que je me suis enthousiasm´e pour la la cause des canons rythmiques ; mais ce proc´ed´e remonte a` R EDEI dans les ann´ees 1950.

2.2

Les ‘perfect square tilings’ de Tom Johnson

Le but de paragraphe est de montrer sur un exemple assez simple que l’introduction des polynˆomes n’est pas qu’une simple commodit´e d’´ecriture : si on sort l’artillerie lourde, c’est qu’elle s’impose pour l’´etude des canons ! On sait plus de choses dans une alg`ebre que dans le mono¨ıde P(Zn ). . . T. J OHNSON, compositeur minimaliste am´ericain vivant a` Paris, s’est pos´e r´ecemment la question de r´ealiser une forme tr`es particuli`ere de canon (canon avec augmentations) avec le motif tr`es simple T1 =(0 1 2) mais avec les contraintes suivantes : – Utilisez des augmentations de ce motif, T2 = 2 × T1 , . . . Tk (au sens musical : comprenez des multiples, translat´es, comme (5 9 13)= 5 + T4 = 5+(0 4 8)= 5 + 4 × T1 ), – les multiplicandes sont tous distincts, – et on pave de fac¸on ‘compacte’, i.e. sans faire de r´eduction modulo n.

4

Ce probl`eme a e´ t´e expos´e dans la rubrique de J.P. D ELAHAYE dans Pour la science (novembre 2004) ce qui a donn´e l’occasion a` plusieurs lecteurs, bons programmeurs, de trouver des solutions avec le motif initial (0 1 2 3) – a` cette heure la question de l’existence d’un pavage parfait pour un motif de 5 notes est ouverte. 5 4 3 2 1 0 0

4

2

6

8

10

12

14

F IG . 7 – Plus petit ‘perfect square tiling’. Quant Tom s’est ouvert de cette nouvelle question, il nous a pr´esent´e la plus petite solution (cf. ` l’on voit T1 aux e´ chelles 1,2,4,5,7), et une question troublante : pourquoi e´ tait-il imposfigure, ou sible de trouver de ‘pavage en carr´e parfait’ avec seulement un ou deux des motifs T3 , T6 , T9 ? Son programme lui donnait soit les trois a` la fois (figure suivante), soit aucun. 7 6 5 4 3 2 1 0 0

5

10

15

20

F IG . 8 – Plus petit ‘perfect square tiling’ avec T3 , T6 , T9 . Cette petite question admet une solution tr`es simple, si l’on exprime le motif de base par le polynˆome Φ3 (X) = 1 + X + X2 , ses augmentations sont de la forme Xk (1 + Xi + X2i ) = Xk Φ3 (Xi ), et la question de Tom revient a` trouver une expression alg´ebrique de la forme X

Xki Φ3 (Xi ) = 1 + X + . . . =

i∈I

3n−1 X j=0

Xj =

X3n − 1 X−1

EXERCICE 2. Montrer que dans une relation comme la pr´ec´edente, le nombre d’indices i qui sont multiples de oo 3 est lui-mˆeme un multiple de 3.

2.3

Polynˆ omes cyclotomiques

L’int´erˆet de ce changement d’espace, de Z a` une partie de Z[X], est que l’on sait plusieurs choses sur les polynˆomes qui apparaissent dans notre probl`eme (voyez n’importe quel bon livre d’alg`ebre commutative pour une preuve du th´eor`eme suivant) : ´ ` THEOR EME 3. Les facteurs irr´eductibles (dans Q[X] ou Z[X]) de 1 + X + X2 + . . . Xn−1 sont les c´el`ebres polynˆomes oo cyclotomiques Φd , avec d | n (et d > 1 ici). Φd est le produit (dans C[X]) des X − ξ ou` ξ d´ecrit l’ensemble des oo oo racines de l’unit´e d’ordre exactement d. Q ¨ oo Φd (X) = Xn − 1 ou, par inversion de M OBIUS On peut les calculer par r´ecurrence par la formule oo d|n oo Φ (X) = Q (Xd − 1)µ(d) . n o

oo oo oo o

d|n

Leurs coefficients sont entiers (relatifs). On a par exemple Φp (X) = 1 + X + X2 + . . . Xp−1 quand (ssi) p est premier.

On a tout de suite un crit`ere tr`es utile qui r´esulte du th´eor`eme pr´ec´edent : COROLLAIRE 1. Pour un canon de p´eriode n, chaque polynˆome cyclotomique Φd , 1 < d | n, divise A(X) ou B(X). Ceci r´esulte du th´eor`eme du G AUSS dans l’anneau principal Q[X], appliqu´e a` la relation (T0 ) (cf. Thm 2). Ce ph´enom`ene explique une remarque d’A NDREATTA, faite sur les canons de V UZA (cf. infra), observant que beaucoup de canons sont « presque » (i.e. a` peu de termes pr`es, voire exactement) des palindromes. En effet, tous les polynˆomes cyclotomiques sont autor´eciproques, i.e. palindromiques,

5

ainsi que leurs produits. Comme ce sont (presque) les seuls facteurs de A(x), B(x) cela explique que ces derniers sont (presque) palindromiques. Nous verrons que la r´epartition de ces facteurs cyclotomiques entre A(x) et B(x) est cruciale pour permettre l’existence d’un canon rythmique. Le cas de Φp d’indice premier admet une g´en´eralisation utile quoique e´ l´ementaire (r´ecurrence) : LEMME 1. On a Φd (1) 6= 1 ssi d est une puissance d’un nombre premier. oo Si d = pα on a alors Φd (1) = p, car

oo oo oo oo

Φpα (X) = 1 + Xp

α−1

α−1

+ X2p

+ . . . + X(p−1)p

α−1

Par exemple, Φ9 = 1 + X3 + X6 .

3

Les conditions de Coven-Meyerowitz

Avant 1998, on ne connaissait quasiment aucune condition g´en´erale pour d´eterminer si le motif ` |A| e´ tait une A e´ tait capable d’engendrer un canon rythmique, i.e. de paver. (a` l’exception du cas ou puissance d’un nombre premier). EXERCICE 3. Sauriez-vous dire par exemple si (1, 4, 9, 16) forme un canon rythmique ? Des consid´erations pr´ec´edentes, les deux math´ematiciens A ARON M EYEROWITZ ont d´eduit (cf. [5]) les crit`eres suivants :

ET

E TAN C OHEN

´ ` ` Φd divise A(x), et SA le sous-ensemble THEOR EME DE COVEN-MEYEROWITZ. Soit RA l’ensemble des d ∈ N ou oo des puissances de nombres premiers e´ l´ements de RA . On d´efinit alors les conditions Q oo (T1 ) : A(1) = p et o

oo oo oo oo oo oo oo o

α

pα ∈SA β

(T2 ) : si p , q , · · · ∈ SA alors pα .qβ · · · ∈ RA . Alors (Thm A1) Si A pave, alors (T1 ) est v´erifi´ee. (Thm A2) Si (T1 ) et (T2 )sont v´erifi´ees, alors A pave. (Thm B) Si |A| = A(1) n’a que deux facteurs premiers et si A pave, alors (T2 ) est v´erifi´ee.

Donnons un exemple : le motif A = {0, 1, 8, 9, 17, 28} a un polynˆome associ´e qui se factorise en      (1 + X) 1 − X + X2 1 + X + X2 1 − X2 + X4 1 − X3 + X6 1 + X3 − X4 − X7 + X8 − X9 + X11 − X12 + X13 On reconnaˆıt1 les facteurs cyclotomiques d’indices 2, 3, 6, 12, 18, plus un outsider qui n’est pas cyclotomique du tout. On a donc RA = {2, 3, 6, 12, 18}, SA = {2, 3} ; or 2 × 3 = 6, ce qui prouve a` la fois (T1 ) (car A(1) = 6) et (T2 ) (car 6 ∈ RA ). Effectivement, A pave :

F IG . 9 – Canon v´erifiant (T1 )&(T2 ) Seul le troisi`eme de ces r´esultats (thm B) est v´eritablement difficile ; il repose sur un lemme de ` p est l’un des deux facteurs premiers), ce qui est S ANDS qui prouve que A ou B est inclus dans pZ (ou faux dans le cas g´en´eral, et ce en utilisant un r´esultat on ne peut plus Galoisien : LEMME 2. Si n est premier avec m alors Φn est encore irr´eductible dans le corps cyclotomique Q[e2iπ/m ]. ` l’on travaille Qu’on me pardonne de mentionner ce r´esultat technique : dans une partie ult´erieure ou dans Fq [X], les Φn cessent g´en´eralement d’ˆetre irr´eductibles et le contraste avec la situation en caract´eristique 0 m´eritait, je pense, d’ˆetre mentionn´ee. Cet article serait interminable si toutes les d´emonstrations y figuraient, mais je vais tout de mˆeme reproduire bri`evement ici la d´emonstration du (Thm A1), qui illustre bien l’int´erˆet d’avoir e´ largi le contexte de parties de Zn a` une alg`ebre de polynˆomes. 1

ˆ impl´ementer pour cela une proc´edure qui marie harmonieusement th´eorie de G ALOIS et math´ematiques j’ai du num´eriques, utilisant notamment que si toutes les racines d’un polynˆome unitaire irr´eductible a` coefficients entiers sont ˆ eˆ tre adapt´ee au degr´e du polynˆome pass´e en de module 1, alors ce sont des racines de l’unit´e. La pr´ecision du calcul a du variable !

6

Demonstration. La preuve repose sur le lemme 1. Observons que si A ⊕ B = Zn , on a en termes de ´ polynˆomes A(1)B(1) = n. Mais dans la d´ecomposition en facteurs premiers de A(1)B(1) figurent tous les Φd (1), qui valent 1 ou p (ce dernier cas ssi d est une puissance de p). Le nombre premier p figure un nombre de fois e´ gal au nombre de puissances de p qui divisent n, i.e. sa multiplicit´e dans n. Donc les facteurs premiers de n apparaissent dans A(1)B(1) sous la forme Φpα (1) et seulement sous cette forme. Les autres facteurs (cyclotomiques ou pas) de A(X) (ou B(X)) contribuent seulement pour la valeur 1 quand X = 1, puisque tous les facteurs de n sont recens´es. La valeur de A(1) est donc e´ gale au seul produit des facteurs premiers p tels que Φpα soit un facteur de A(X) : c’est bien la condition (T1 ).  Notons sans insister, pour l’instant, qu’on ignore toujours aujourd’hui si la condition (T2 ) est n´ecessaire dans tous les cas pour paver. Ces conditions ne sont pas d´enu´ees d’applications pratiques : en septembre, nous avons pr´esent´e a` Barcelone pour l’ICMC2 une nouvelle fonctionnalit´e du logiciel d’aide a` la composition OpenMusic, d´evelopp´e a` l’IRCAM notamment par C ARLOS A GON et M ORENO A NDREATTA, et qui permet de fabriquer des « canons cyclotomiques », de p´eriode donn´ee, en utilisant les conditions ci-dessus.

4

Canons et corps finis

Nous allons faire un d´etour instructif en g´en´eralisant de fac¸on naturelle la notion de canon rythmique a` celle de canon modulo p. Il s’agit alors d’avoir sur chaque temps un nombre de notes e´ gal a` 1 modulo p, condition plus g´en´ereuse que « une note et une seule ». On se retrouve naturellement ` k est un corps fini. En effet, comme on l’a vu la a` factoriser des polynˆomes dans l’anneau k[X], ou condition d´efinissant un canon rythmique est A(X) × B(X) = 1 + X + X2 + . . . Xn−1

(T0 )

mod (Xn − 1)

La question se pose alors de consid´erer les facteurs irr´eductibles de cette identit´e polynˆomiale. Dans le cas de Z[X] on avait affaire aux polynˆomes cyclotomiques ; dans l’expos´e qui suit la situation est plus compliqu´ee, notamment du fait de la multiplicit´e > 1 des racines (de l’unit´e).

4.1

Le probl`eme de Johnson

Je r´esume ici le probl`eme qui m’a pouss´e a` consid´erer des factorisations dans des corps finis en lieu et place de Z[X]. T OM J OHNSON a pr´esent´e en 2001 aux Journ´ees d’Informatique Musicale [10] le probl`eme suivant de canon par augmentations : Faire un canon (compact) avec le motif (0 1 4) et (certaines de) ses augmentations (0, 2, 8) (ainsi que (0, 4, 16) etc). Le compositeur et math´ematicien A. T ANGIAN, de l’universit´e de Hanovre, r´edigea aussitˆot [16] un programme en Fortran pour calculer toutes les solutions de taille born´ee par un N donn´e ; il s’av´era que toutes ces solutions avaient une longueur multiple de 15. La plus petite se trouve sur la figure suivante. 5 4 3 2 1 0 0

2

4

6

8

10

12

14

F IG . 10 – Le plus petit pavage avec (0 1 4) et augmentations Qu’elles soient multiples de 3 n’avait rien de surprenant, mais pourquoi de 15 ? Si l’on pose J(X) = 1 + X + X4 , le probl`eme de J OHNSON revient a` trouver des facteurs 0-1 A, B . . . tels que A(X)J(X) + B(X)J(X2 ) . . . = 1 + X + X2 + . . . Xn−1 En effet, une augmentation comme (0, 2, 8) a pour polynˆome associ´e J(X2 ) = 1 + X2 + X8 . Dans la plus petite solution, on a A(X) = 1 + X2 + X8 + X10 et B(X) = X5 pour n = 15. Je me suis demand´e s’il y avait moyen de trouver une racine commune de tous ces facteurs. Pour cela il s’est av´er´e n´ecessaire de changer de corps. En effet, dans tout corps de caract´eristique 2 on a 2 2 J(X2 ) = 1 + X2 + X8 = (1 + X + X4 ) = J(X) 2

International Computer Music Conference

7

par l’automorphisme de F ROBENIUS3 on a plus g´en´eralement p LEMME 3. pour tout polynˆome A(X) a` coefficients dans Fp , on a A(X) = A(Xp ).

De mˆeme J(X4 ) = J(X)4 et ainsi de suite. Donc J(X) doit diviser 1 + X + X2 + . . . Xn−1 a` condition de calculer modulo 2. Or J se d´ecompose dans le corps F16 a` 16 elements (r´esultat e´ l´ementaire de G ALOIS : J est irr´eductible sur F2 et donc F16 = F2d◦ J ≈ F2 [X]/(J)), de plus dans ce corps toutes ses racines4 sont d’ordre (multiplicatif) 15, i.e. v´erifient αn = 1 ⇐⇒ 15 | n. Maintenant on a donc, si α est racine de J dans F16 , 1 + α + α2 + . . . αn−1 = J(α) × (. . . ) = 0. On en d´eduit en multipliant par α − 1 que αn − 1 = 0, donc αn = 1, ce qui impose bien que 15 | n, cqfd.

4.2 « Der verfluchte Ring » La condition (T0 ) a un sens dans tous les anneaux5 k[X], et mˆeme A[X] pour tout anneau A conte` nant 0, 1. En effet c’est une identit´e entre polynˆomes 0-1, c’est-a-dire entre e´ l´ements de l’ensemble {0, 1}[X]. Je dis bien ensemble : car il n’est ferm´e ni pour + ni pour × (par exemple d´evelopper (1 + X2 )3 fait intervenir des op´erations autres que 0+0 ou 0+1). Il est bien clair que Z[X] est beaucoup trop vaste (il y a une e´ crasante majorit´e de polynˆomes NON 0-1), et il est bien difficile de donner des conditions n´ecessaires et suffisantes sur un polynˆome 01∈ Z[X] pour d´eterminer s’il va paver ou non (cela reste un probl`eme ouvert), sinon en exhibant un tel pavage6 . Il est bien plus tentant de travailler dans F2 [X] = Z2 [X] = Z/2Z[X] cet anneau ne contient que des polynˆomes 0-1, et il les contient mˆeme tous une fois et une seule. Malheureusement bien que l’application canonique

P=

X

Z[X] → F2 [X] ak Xk 7→ P

(mod 2) =

X

ak Xk

envoie bijectivement {0, 1}[X] ⊂ Z[X] sur F2 [X], il n’y a pas de bonne application r´eciproque vers Z[X], faute de structure alg´ebrique sur {0, 1}[X]. Par exemple on ne peut pas remonter dans Z[X] l’´equation suivante : (1 + X)(1 + X + X2 ) = 1 + X3 ∈ F2 [X] en termes de polynˆomes 0 − 1. J’ai donc recherch´e des conditions e´ quivalentes au fait que « (T0 ) soit v´erifi´ee dans Z[X] ». La plus convaincante est : ´ ` THEOR EME 5. (T0 ) est vraie dans Z[X] ⇐⇒ elle est v´erifi´ee dans tous les Fp [X] C’est un lointain cousin du th´eor`eme chinois, qu’il est bien plus facile[2] de d´emontrer musicalement que math´ematiquement : il signifie que le nombre de notes sur chaque temps est exactement 1, si et seulement si il vaut 1 modulo tous les p premiers (on peut affaiblir les hypoth`eses d’ailleurs). REMARQUE 3. Il est capital de souligner que l’´enonc´e ci-dessus est diff´erent de ce qui suit : oo « Il existe B(X) ∈ {0, 1}[X] ⊂ Z[X], n tel que A(X) × B(X) ≡ 1 + x + . . . xn−1 (mod Xn − 1) dans Z[X]

oo oo oo oo

⇐⇒ Pour tout p premier, il existe Bp , np tel que A(X) × Bp (X) ≡ 1 + x + . . . xnp −1 (mod Xnp − 1, p) »

ˆ ⇒ est vraie. J’ai essay´e assez longtemps de prouver la r´eciproque, conform´ement a` la phiBien sur, losophie de Y ONEDA ou aux th´eor`emes (local ⇒ global) du genre de ceux de H ASSE sur les formes quadratiques. Le r´esultat fut surprenant. . .

4.3

Canons modulo p : todos locos !

Nous avons pos´e la question de l’´etude locale, i.e modulo p, de la relation (T0 ). Quelles conditions a-t-on pour qu’un motif donn´e pave modulo p ? De fac¸on stup´efiante, il n’y en a aucune ! (cf. [3]) 3 Pour p premier, q une puissance de p, F : x 7→ xp est un automorphisme du corps Fq (et il engendre le groupe de G ALOIS de Fq sur Fp ). L’ensemble de ses points fixes est le sous-corps premier Fp . Cela r´esulte de l’identit´e (x + y)p = xp + yp en caract´eristique p. 4 Ceci r´esulte du th´eor`eme de L AGRANGE : tout e´ l´ement de F∗16 a un ordre qui divise 15, et du fait que des e´ l´ements d’ordre inf´erieur seraient racines d’autres polynˆomes (ex. 1 + X + X2 pour les e´ l´ements d’ordre 3) qui sont premiers avec J. 5 ˆ le titre de cette section. Sauf peut-ˆetre celui des Nibelungen auquel r´ef`ere bien sur 6 Ce serait un probl`eme NP, si l’on en croit [12].

8

´ ` THEOR EME 6. (Amiot, avril 2004) oo Pour toute partie finie non vide A ⊂ N (contenant 0), pour tout p premier, il existe B ⊂ N, n ∈ N∗ tel que

oo oo oo oo oo

(T0,p )

A(X) × B(X) ≡ 1 + X + X2 + . . . Xn−1

(mod Xn − 1, p)

` c’est-a-dire qu’on a cette congruence dans Fp [X].

En termes musicaux, cela signifie que sur chaque temps, le nombre de notes est 1, mais a` un multiple de p pr`es. J’ai d’abord trouv´e ce th´eor`eme avec le modulo 2, toujours tr`es particulier (dans ce cas on a mˆeme ` un pavage compact, c’est-a-dire que la r´eduction modulo Xn − 1 est superflue). Ainsi avec le motif (0 1 4), qui ne pave certes pas Z, on a un canon avec des notes isol´ees ou des accords de trois sons :

F IG . 11 – Un pavage dans F2 EXERCICE 4. Le lecteur est invit´e a` chercher un tel pavage avec le motif (0,1,3) modulo 2. L’argument clef est un th´eor`eme assez simple, mais frappant, de la th´eorie de G ALOIS des corps finis : ´ ` THEOR EME 7. Dans tout Fp [X], tout polynˆome A(X) non nul en 0 divise Xn − 1, pour n assez grand. Demonstration. Je ne donne que les grandes lignes (cf. [3]). Toute racine de A(X) ∈ Fp [X] est dans un ´ corps Fq , extension de Fp de degr´e fini. Or dans ce corps, Fq , tout e´ l´ement non nul v´erifie xq−1 = 1 (a` cause du th´eor`eme de L AGRANGE). Avec quelques points techniques (a` cause de la multiplicit´e des racines), on en d´eduit un n tel que A(X) | Xn − 1 (un multiple de tous ces q − 1). Si A(X) repr´esente le motif rythmique, il existe donc n tel que A(X) × (X − 1) | Xn − 1, et donc en Xn − 1 Xn − 1 on a bien A(X) × C(X) = . posant C(X) = A(X)(X − 1) A(X)(X − 1) Certes, C(X) n’est pas en g´en´eral un polynˆome 0-1 ; mais en caract´eristique finie on construit facilement un polynˆome 0-1 B(X), qui soit congru a` C(X) modulo Xn − 1 : il suffit de remplacer tout terme αXk par (α − 1)Xk + Xn+k−1 , α > 1, et d’it´erer cette transformation jusqu’a` ce qu’il ne reste plus que des coefficients 0 ou 1, ce qui ach`eve la preuve du th´eor`eme. 

Ce proc´ed´e est constructif : la figure pr´ec´edente est obtenue par un algorithme qui impl´emente pr´ecis´ement cette m´ethode (en optimisant n, en plus). Des r´ef´erences sur ce sujet trop peu e´ tudi´e sont [21] et, plus r´ecent (avec des applications a` la cryptographie), [1]. En conclusion, il n’y a PAS de condition locale (modulo p) pour qu’un motif donn´e A pave : todos Xn − 1 ∈ Z[X] seront simples. . . Pour locos ! il nous faut donc revenir a` Z[X]. Au moins, les facteurs de X−1 l’amour de l’art, observons en effet que la situation est bien moins claire dans les corps finis : • Xn − 1 peut avoir un discriminant nul (i.e. des racines multiples) quand p | n. • Des polynˆomes jadis irr´eductibles (ex. Φ8 = X4 + 1) sont factorisables dans TOUT corps fini. ` ξ parcourt l’ensemble des racines d’ordre multiplicatif donn´e dans F∗q • Le produit des X − ξ ou n’est plus en g´en´eral un polynˆome irr´eductible dans Fp [X] (cf. [1]). Q EXERCICE 5. Trouvez les facteurs irr´eductibles du produit (X−ξ) quand ξ d´ecrit l’ensemble des huit g´en´erateurs oo du groupe (F∗ , ×), (les e´ l´ements d’ordre 15). Vous pouvez vous r´ef´erer utilement au paragraphe sur le 16 oo o probl`eme de J OHNSON) J’ai d´ecouvert incidemment une propri´et´e e´ trange et myst´erieuse, bien que sa preuve ne soit pas tr`es difficile, qui permet de calculer la multiplicit´e de 1 comme racine de A(X) donn´e :

9

PROPOSITION. oo Soit A(X) un polynˆome 0-1 qui pave avec p´eriode n et soit p un facteur premier de A. Alors

oo oo oo oo oo oo oo oo

• La multiplicit´e de 1 comme racine de A dans Fp , s’exprime en base p comme un nombre dont les chiffres sont exclusivement 0 ou p − 1. • le nombre des chiffres non nuls dans ce nombre en base p n’est autre que la multiplicit´e de p comme facteur de A(1) dans N, A(1) e´ tant le nombre de notes du motif A (ceci est quasiment la condition (T1 ) de Coven-Meyerowitz).

Curieusement, ce nombre de bits non nuls apparaˆıt pour le calcul de complexit´e de l’exponentiation rapide, comme dans le difficile th´eor`eme de S MALE sur l’immersion d’une vari´et´e sans singularit´e dans Rn .

5

Retour dans Z[X]

Ce bref passage en caract´eristique p nous a permis de toucher a` d’autres formes de canons. Il en existe autant d’esp`eces que de compositeurs et je ne puis les e´ num´erer toutes ; mentionnons seulement le r´esultat remarquable du canadien Jon W ILD (2000) : « tout motif de trois notes pave avec son r´etrograd´e », qui renvoie a` une pratique courante a` l’ˆage baroque. On revient en caract´eristique nulle, avec l’intention de pousser l’utilisation des polynˆomes 0-1 aussi loin que possible. On parviendra au fait remarquable que la conjecture spectrale en dimension 1 repose sur le cas particulier des canons de V UZA, dont l’int´erˆet d´epasse donc de loin les simples applications musicales. Dans le cas de Z[X] les facteurs irr´eductibles de l’identit´e (T0 ) polynomiale sont les polynˆomes cyclotomiques Φd , d | n ; les conditions trouv´ees en 1998 par C OVEN - M EYEROWITZ sont cruciales pour la suite de cet expos´e. J’ajoute ici un lemme qu’ils jugent capital : ` α ∈ Z∗n est un des Les automorphismes du groupe Zn sont bien connus, ce sont les x 7→ αx ou e´ l´ements inversibles de l’anneau Zn . Il est donc clair que A ⊕ B = Zn ⇐⇒ αA ⊕ αB = Zn . Il est beaucoup moins e´ vident que l’on a LEMME 4. A ⊕ B = Zn ⇐⇒ αA ⊕ B = Zn pour tout α inversible modulo n. C OVEN & M EYEROWITZ ([5]) donnent une d´emonstration de ce lemme « capital » dans un anneau de polynˆomes, apparemment insatisfaits de la d´emonstration originale (combinatoire) de [17]. ˆ a` D.T. V UZA 6 ans auparavant. Il en a senti d’ailleurs Mais en fait sa premi`ere preuve est due la raison profonde, qui est que ψα : z 7→ zα est un automorphisme du groupe des racines ne` mes de l’unit´e ; et l’utilise pour une d´emonstration encore assez compliqu´ee a` base de transform´ee de F OURIER et convolution. Ma version consiste a` remarquer que changer A en αA revient a` changer A(X) en A(Xα ), qui est une bijection sur l’ensemble des polynˆomes 0-1 consid´er´es modulo Xn − 1 (cf. exo), et cela applique (l’inverse de) ψα aux racines de A(X), et donc les ensembles des racines ne` mes de l’unit´e qui sont racines de A(X) ne sont pas chang´ees, ce qui signifie que les facteurs cyclotomiques de A(X) sont invariants dans cette transformation. Comme ceux de B(X) n’ont pas boug´e, on a encore entre A(Xα ) et B(X) tous les facteurs cyclotomiques de (Xn − 1)/(X − 1), qui doit donc diviser A(Xα ).B(X). Un argument de degr´e permet de conclure (on connaˆıt les n − 1 racines de A(Xα ).B(X) modulo Xn − 1). EXERCICE 6. V´erifier que changer A(X) en A(Xα ) (modulo Xn − 1) conserve sa nature de polynˆome 0-1. Je tiens a` souligner que ce proc´ed´e est musical7 : par exemple T OM J OHNSON l’a red´ecouvert tout seul, exp´erimentalement ! ˆ cette action de groupe permet une description plus e´ conomique des canons : par exemple Bien sur pour l’ensemble des canons de V UZA de p´eriode 72, qui consiste de 3 formes pour A et 6 pour B8 , il ne reste qu’une orbite pour chacun et on peut donc d´eduire facilement tous les canons de V UZA 72 du couple A = (0, 3, 6, 12, 23, 27, 36, 42, 47, 48, 51, 71) B = (0, 8, 10, 18, 26, 64)

´ Dan Tudor Vuza, et les canons rythmiques 6 Les groupes de Hajos, ´ irreductibles 7 8

Alban Berg par exemple l’a utilis´e pour transformer des s´eries dod´ecaphoniques dans son op´era Lulu. ` rotation pr`es. A

10

Le math´ematicien et musicien roumain D AN T UDOR V UZA a pass´e pr`es de dix ans, de 1980 a` 1990, a` e´ tudier la question des canons rythmiques en long et en large. En particulier, il s’est int´eress´e aux canons pour lesquels ni A ni B n’ont de p´eriode propre. ˆ d’apr`es le th´eor`eme de DE B RUIJN (tout canon de motif fini est p´eriodique), Pr´ecisons : bien sur, on travaille avec une p´eriode globale, n, du canon. Mais il arrive tr`es souvent (presque toujours, en fait) que l’un des termes de la somme directe A ⊕ B = Zn ait une sous-p´eriode. Ainsi pour l’exemple simple de A = {0, 1, 4, 5} qui pave avec p´eriode 8 : c’est en fait le sous-motif {0, 1} r´ep´et´e avec p´eriode 4 qui constitue A = {0, 1} ⊕ 4. M ORENO A NDREATTA s’est aperc¸u que V UZA avait red´ecouvert des r´esultats sur les factorisations ` : un groupe cyclique Zn est de H AJ OS ` , ou des groupes cycliques issus de la conjecture de H AJ OS encore est un « bon groupe », si dans toute factorisation Zn = A ⊕ B, on a A + p = A pour un ´ cycliques en certain p < n (ou la mˆeme chose pour B). V UZA a caract´eris´e tous les groupes de H AJ OS utilisant la th´eorie de F OURIER, suivant une remarque d´eja` ancienne du grand th´eoricien L EWIN qui remarquait qu’une somme directe de parties revient a` un produit de convolution de leurs fonctions caract´eristiques. Cela est d´ecrit en d´etail dans [4]. Le plus petit « mauvais groupe » est Z72 . On connaˆıt des algorithmes pour fabriquer des canons de V UZA (i.e. des factorisations de « mauvais » groupes), mais aucun proc´ed´e qui assure de les trouver tous. La formule la plus simple est ˆ due[11] a` F RANK J EDRZEJEWSKI : PROPOSITION (2003). Si on consid`ere p1 , p2 premiers et ni , i = 1..3 tels que n1 p1 soit premier avec n2 (et oo r´eciproquement) alors en posant [[ a, b ]] = {a, a + 1, . . . b} on a pour n = p1 p2 n1 n2 n3 le canon de V UZA oo o suivant :

oo oo oo oo oo oo oo

A = n2 n3 × ([[ 0, p2 − 1 ]] ⊕ p2 n1 × [[ 0, p1 − 1 ]) ] B = n1 n3 × ([[ 0, p1 − 1 ]] ⊕ p1 n2 × [[ 0, p2 − 1 ]) ]  S = n3 (p2 n2 × [[ 0, n1 − 1 ]] ⊕ p1 n1 × [[ 0, n2 − 1 ]) ] R = [[ 1, n3 − 1 ]] ⊕ B ∪ A R ⊕ S = Zn

La factorisation de n est g´en´erale : si on ne peut ainsi e´ crire n c’est que Zn est un bon groupe ([18]). Une autre fac¸on de l’´ecrire[18] consiste a` e´ num´erer les cardinaux des « bons » groupes : ` ´ ` THEOR EME (HAJOS, REDEI, DE BRUIJN, SANDS,. . .). oo ` p, q, r, s Les « bons groupes » cycliques sont les Zn tels que n s’´ecrive de l’une des fac¸ons suivantes (ou oo sont des nombres premiers distincts) : o

oo oo oo o

n = pα

n = pα q

n = p2 q2

n = p2 qr

n = pqrs

Remarque : si Zn a un sous-groupe qui est « mauvais », alors on montre que Zn est aussi « mauvais ». Ces canons sont d’un grand int´erˆet pour les compositeurs, car ils introduisent une non-r´ep´etitivit´e dans la r´egularit´e (du ph´enom`ene globalement p´eriodique), un peu comme la rime en po´esie. La notion a beau eˆ tre relativement r´ecente, une liste d’outils sur les canons de V UZA est pr´esente dans divers logiciels d’aide a` la composition, comme Open Music d´evelopp´e a` l’Ircam, et plusieurs compositeurs ´ ) s’en servent dans leurs œuvres. J ’ai par exemple sur contemporains (G EORGE B LOCH , F ABIEN L EVY mon piano un morceau tr`es simple de G. B LOCH qui a servi de musique pour une version franc¸aise d’un film de Hitchcock. Il nous a expliqu´e de fac¸on tr`es convaincante pourquoi ces cellules qui se r´ep`etent, mais a` intervalles impr´evisibles, excellent a` faire monter la tension du spectateur/auditeur !

7

´ eration ´ Gen de canons

Pouss´es par le dynamisme des compositeurs, nous avons e´ tudi´e nombre de transformations sur les canons rythmiques :

7.1 7.1.1

Plusieurs transformations Le groupe affine

Le Lemme 4 donne l’exemple mˆeme d’une transformation non triviale, qui pr´eserve la notion de canon sous l’action d’un groupe. Il s’agit ici du groupe affine Aff(Zn ). Souvenons-nous en effet que l’on a convenu d’identifier un motif rythmique A a` la classe de tous ses translat´es A + m mod n. Le lemme 1 rajoute les homoth´eties (de rapport a inversible) et on a donc affaire aux orbites sous les actions de toutes les bijections x 7→ ax + b dans Zn . La figure suivante montre une telle orbite et les canons correspondants : (0, 1, 4, 5) et (0, 3, 4, 7) sont les deux formes du motif modulo 8. Le lemme 4 prouve que les conditions (T1 ) et (T2 ) de [5] sont pr´eserv´ees par une telle transformation.

11

F IG . 12 – Orbite d’un motif sous l’action du groupe affine Je me suis pos´e la question de g´en´eraliser ce r´esultat aux autres transformations utilis´ees par les musiciens. Les voici :

7.1.2

Zoom/augmentation

Cette transformation revient a` dilater le temps et a` remplacer une note (ou un silence) par k notes (ou silences). Illustration :

F IG . 13 – Zoom d’un canon rythmique Du point de vue polynˆomial, on change B(X) en B(Xk ) et A(X) en A(Xk ) × (1 + X + . . . Xk−1 ). En travaillant par r´ecurrence sur les facteurs premiers de k, j’ai pu montrer dans [3] que cette op´eration pr´eserve aussi les conditions (T1 ) et (T2 ) de [5]. L’ importance particuli`ere de cette op´eration vient de ce qu’elle permet de fabriquer de nouveaux « canons de V UZA », a` partir d’anciens. On obtient ainsi des canons in´edits (non fournis par l’algorithme de V UZA). Cela a e´ t´e remarqu´e par divers chercheurs (Carlos Agon, Thomas Noll) et notamment par Harald F RIPER TINGER de l’universit´e de Graz, qui a donn´e des formules remarquables de d´enombrement des canons rythmiques et s’est lanc´e a` la recherche de tous les canons de V UZA de « petite » taille. Une amicale comp´etition (il a gagn´e) nous a permis en 2003-2004 de trouver force nouveaux canons de p´eriode 108, 120 ou 144. Au colloque de Graz[7] en mai 2004, Harald a fait sensation en montrant que tous les canons de V UZA que nous avions trouv´es pour les deux premi`eres p´eriodes, 72 et 108, e´ taient en v´erit´e les seuls possibles. Pour cela il s’est appuy´e a` la fois sur des algorithmes habilement conc¸us par ses soins, des actions de groupes et d´enombrements d’orbites a` coups d’´equation aux classes, et de la combinatoire (th´eorie de P OLYA). Incidemment, les canons de V UZA apparaissent comme un mat´eriau exceptionnellement rare (probabilit´e inf´erieure au 1 millioni`eme), ce qui a son int´erˆet pour la suite.

7.1.3

Concat´enation

L’op´eration de concat´enation est tr`es simple, elle consiste a` r´ep´eter un mˆeme motif a` la queueleu-leu plusieurs fois :

F IG . 14 – Un canon rythmique r´ep´et´e Je suis redevable a` H. F RIPER TINGER pour m’avoir fait comprendre l’importance th´eorique de cette op´eration si simple. Elle lui a permis [8] de donner des formules exactes pour d´enombrer les canons dans les « bons groupes », puisque par d´efinition mˆeme un des facteurs d’une d´ecomposition en somme directe d’un tel groupe est concat´en´e {0, 1} ⊕ {0, 2} → {0, 1, 4, 5} ⊕ {0, 2}. d’un motif plus court. Ceci permet de proche en proche de trouver tous les canons de p´eriode donn´ee, a` condition d’´eviter les p´eriodes fatidiques 72,108,120 , etc. . .

12

Cette op´eration consiste, polynˆomialement, a` multiplier A(X) par ce que j’appelle un m´etronome : ´ DEFINITION 4. Un m´etronome est un motif de la forme

oo oo oo oo

A = (0, k, 2k, 3k, . . . (m − 1)k)

A(X) = 1 + Xk + X2k + . . . X(m−1)k =

i.e.

Xmk − 1 = Xk − 1

Y

Φd

d|k et d6|k

Il en r´esulte assez facilement (cf. [3]), travaillant avec m premier sans perte de g´en´eralit´e, le ˜ pavant avec B, alors l’un v´erifie (T2 ) si et seulement si ´ ` THEOR EME 9. Si A s’obtient par concat´enation de A, oo l’autre v´erifie aussi (T2 ).

7.1.4

Entrelacement et e´ quir´epartition

Ce proc´ed´e n’est pas (encore) connu des musiciens mais je ne doute pas qu’ils en fassent bientˆot leurs choux gras. Je l’ai d´ecouvert dans un article r´ecent et tr`es g´en´eral (de K OLOUNTZAKIS et M A TOLCSI , [12]) (dans un contexte d’alg` ebre commutative), mais il s’av`ere que vu sous un autre angle, c’est un outil essentiel pour le dernier th´eor`eme de [5], le plus difficile. Je reformule ensemble ces diff´erents r´esultats. La d´emonstration n’en est pas tr`es difficile (le lecteur courageux pourra s’y essayer) : ˆ ´ ` THEOR EME 10. Soient A1 , . . . Ak des motifs S qui pavent un canon rythmique avec un MEME B. Alors on obtient oo un canon rythmique en posant A = (i + kAi ), qui pave avec kB.

oo oo oo oo oo oo oo oo o

i=0...k−1

R´eciproquement, un tel canon est caract´eris´e par le fait que l’« outer rhythm » B est multiple d’une constante k > 1 : B ⊂ kZ, ou, de mani`ere e´ quivalente, par le fait que A est e´ quir´eparti modulo k : les ensembles b i = A ∩ (i + kZ) A b = B/k. ont tous mˆeme cardinal, et pavent avec un mˆeme B

On peut ainsi fabriquer de nouveaux canons de V UZA, par exemple en prenant pour les Ai (une partie de) l’orbite d’un motif sous le groupe affine. De fac¸on bien plus remarquable, tous les canons V UZA recens´es (ceux obtenus par algorithme et les autres) peuvent eˆ tre fabriqu´es par ce proc´ed´e a` partir de canons plus petits, qu’ils soient de V UZA ou pas. La figure ci-dessous illustre la gen`ese d’un canon de p´eriode 72. On y reconnaˆıt (cf. la voix sup´erieure) les deux motifs g´en´eriques qui sont dilat´es et s’entrelacent pour donner le motif final.

F IG . 15 – Un canon de Vuza 72 comme entrelacement de deux canons 36

7.2

R´eduction des canons rythmiques

` ils sont Les canons de V UZA sont finalement assez similaires aux nombres premiers, au sens ou « irr´eductibles », et engendrent tous les autres canons ; en effet, r´esulte de leur d´efinition le : ´ ` THEOR EME 11. On peut r´eduire r´ecursivement tout canon par d´econcat´enation – l’op´eration inverse de la oo concat´enation – appliqu´ee a` l’un des deux termes A ou B, soit a` un canon de V UZA, soit au canon trivial oo o ({0} ⊕ {0}). Nous disposons finalement de diverses transformations, dont plusieurs (zoom, concat´enation, entrelacement) changent la p´eriode ; toutes ces op´erations conservent les conditions (T1 ), (T2 ) de C OVEN M EYEROWITZ et il est temps de mentionner le lien avec la conjecture spectrale.

8 8.1

La conjecture de Fuglede La conjecture spectrale

Dans le cas le plus g´en´eral, la conjecture publi´ee par F UGLEDE en 1974 ([13]) est une question qui relie la g´eom´etrie et l’analyse harmonique :

13

` . Un domaine K (compact d’int´erieur non vide) pave Rn ,c’est-a-dire qu’il existe B ⊂ Rn tel que

oo oo oo oo oo oo oo oo o



[

◦ z }| { z }| { b + K = R et b + K ∩ b 0 + K = ∅ pour b 6= b 0 n

b∈B

si et seulement si K poss`ede une base hilbertienne, i.e. il existe une famille Λ telle que (e2iπλ )λ∈Λ est une famille orthonorm´ee qui engendre une partie dense de L2 (K).

` B est un r´eseau (B ≈ Zn ). On comprend mieux cette F UGLEDE a prouv´e sa conjecture dans le cas ou ` K est par exemple l’ hypercube unit´e : il suffit alors de prendre pour conjecture dans le cas simple ou K le r´eseau Zn , c’est la th´eorie de la d´ecomposition en s´erie de F OURIER. Jusqu’a` l’´et´e 2003, tous les r´esultats publi´es sont all´es dans le sens de la confirmation de cette conjecture. Elle est vraie en particulier pour tous les K assez r´eguliers (les convexes plans, par exemple). Comme il s’agit d’orthogonalit´e dans Rn , on a assez vite e´ tabli une condition e´ quivalente en terme d’existence d’une matrice de H ADAMARD dou´ee de propri´et´es ad´equates. C’est en exhibant des matrices de H ADAMARD complexes que T ERENCE T AO a finalement prouv´e que cette conjecture est fausse en dimension > 5. Depuis on a trouv´e des contre-exemples dans les deux sens, dont la dimension est descendue a` 3 [12]. Mais cela reste un probl`eme ouvert en dimension 1 malgr´e une kyrielle de r´esultats partiels (cf. [13]). Un des plus r´ecents concerne les produits de m´etronomes, au sens de la d´efinition ci-dessus ([14]). Il est en partie contenu dans le th´eor`eme que je d´emontre ci-dessous. Notons le lien trivial entre pavages de R et pavages de Z : si A pave Z alors A + [0, 1[ pave R. La r´eciproque est moins triviale mais r´esulte des travaux de V UZA et de fac¸on tr`es diff´erente de L AGARIAS & WANG[15].

8.2

La conjecture spectrale en dimension 1

I ZABELLA L ABA, lisant l’article de C OVEN -M EYEROWITZ, a rapidement compris qu’on pouvait en tirer une connexion a` la conjecture spectrale. Elle publia peu apr`es (2000) [13] le r´esultat suivant : PROPOSITION. (T1 ) + (T2 ) ⇒ spectral (et spectral ⇒ (T1 )). Cela utilise des calculs e´ l´ementaires, et le lemme suivant qui caract´erise le caract`ere spectral en dimension 1 (on peut le prendre comme d´efinition) : LEMME 5. A pave Z si et seulement si il existe une famille 0 = λ0 < λ1 < . . . λk−1 , k = |A| = A(1) telle que les e2iπλj oo soient racines de A(X). o L ABA prend tout simplement des λj de la forme i/pα , i = 0 . . . p−1, pour montrer que si (T2 ) est v´erifi´ee alors A est spectral. REMARQUE 4. Il ne faut pas croire que le caract`ere 0-1 du polynˆome A(X) oblige ses racines de module 1 a eˆ tre oo d’ordre fini dans S1 . En d’autres termes, th´eoriquement un spectre peut tr`es bien exister et eˆ tre irrationnel :

oo oo oo

EXERCICE 7. Trouver un polynˆome 0-1 ayant des racines de module 1 d’ordre infini.

D’apr`es ce r´esultat de L ABA, si un motif rythmique pave mais qu’il n’est pas spectral, il ne peut v´erifier (T2 ). Mais si l’on en croit le principe de r´eduction e´ nonc´e au th´eor`eme 11, cela ne peut se ´ . En effet, tout pavage dans un « bon groupe » se r´eduit produire que dans un groupe non-H AJ OS r´ecursivement a` des canons plus petits dans des sous-groupes, qui sont donc encore « bons », et donc on peut encore r´eduire jusqu’a` tomber sur le canon trivial a` une note, (0) ⊕ (0). Qui v´erifie la condition (T2 ) ( !). Par conservation d’icelle dans le proc´ed´e de concat´enation des canons (voir le th´eor`eme 9), on d´eduit ´ ` THEOR EME (AMIOT, JUIN 2004). oo Si un canon n’est pas spectral, alors il peut se r´eduire par d´econcat´enation a` un canon de V UZA, oo oo lui aussi non spectral. A fortiori, si n a l’une des formes suivantes (p, q, r, s e´ tant des nombres premiers oo distincts) : oo n = pα n = pα q n = p2 q2 n = p2 qr n = pqrs

oo oo

alors tout motif d’un canon rythmique de p´eriode n est spectral.

On peut mˆeme aller plus loin en prenant au lieu de la p´eriode n la taille du motif (= le nombre de notes = A(1)). Les trois premiers cas avec deux facteurs premiers r´esultent du th´eor`eme (B2) de [5], les deux derniers sont nouveaux a` ma connaissance.

14

Ce r´esultat s’applique aussi aux pavages d’un intervalle d’entiers, que j’appelle canons compacts (ceux pour lesquels il est inutile de proc´eder a` une r´eduction modulo n car on a A ⊕ B = [[ 0, n − 1 ]] dans N, par exemple {0, 1, 4, 5} ⊕ {0, 2} = {0, 1, 2, 3, 4, 5, 6, 7}), car d’apr`es un r´esultat ancien de DE B RUIJN ils sont tous d´econcat´enables. COROLLAIRE 2. En cons´equence de l’´enum´eration par F RIPER TINGER des canons de V UZA pour n = 72, 108 nous oo savons que tous les canons de p´eriode 6 108 (et mˆeme jusqu’a` 119) sont spectraux (au sens ou` aussi bien oo o A, le « inner rhythm », que le « outer rhythm » B, sont spectraux). Ceci sugg`ere une id´ee assez intuitive, a` savoir que s’il existe un motif A qui pave sans v´erifier (T2 ), alors A, n doivent eˆ tre grands. Jusqu’ici, tous les algorithmes qui fabriquent des canons de V UZA assurent que (T2 ) est v´erifi´ee, et tous les proc´ed´es d’augmentation de taille des canons vus ci-dessus conservent cette propri´et´e : on ne sait donc vraiment pas comment construire un e´ ventuel canon de V UZA qui nie la propri´et´e (T2 ), ce qui ne prouve pas qu’il n’en existe pas puisqu’on ne sait pas comment les construire tous. . .

8.3

R´eduction par e´ quir´epartition

Il ne paraissait pas impossible d’esp´erer r´eduire TOUS les canons de V UZA, et donc de d´emontrer le sens (pave ⇒ spectral) de la conjecture de F UGLEDE. En effet l’algorithme de V UZA fabrique toujours un second membre multiple de n3 (cf. la formule de J EDRZEJEWSKI). Dans ce cas on a e´ quir´epartition de l’inner rhythm modulo n3 (cf. [5], lemme 2.5). Le groupe affine pr´eserve d’ailleurs cette condition d’´equir´epartition.. Mais elle signifie que l’on peut r´eduire un tel canon a` un canon plus petit, en pr´eservant la condition (T2 ). Si donc il s’av´erait que TOUT canon de V UZA ait, a` l’instar de ceux que l’on sait fabriquer, un facteur e´ quir´eparti, la m´ethode de r´eduction (utilisant dualit´e, concat´enation, e´ quir´epartition selon le cas) permettrait de r´eduire TOUT canon au canon trivial. Ce qui d´emontrerait la condition (T2 ) pour tout canon, ce dont on pourrait d´eduire (un sens au moins de) la conjecture de F UGLEDE.

8.4

Le cimeti`ere des conjectures

Mais le champ de bataille des canons rythmiques est jonch´e des cadavres de nombreuses conjec` commencer, historiquement au tout d´ebut, par la conjecture de DE B RUIJN : si un groupe tures. . .A abelien fini est somme directe de A et B alors l’un des deux est periodique, tu´ee dans l’œuf par les ca´ ´ ` , DE B RUIJN et consorts ; nons de V UZA et bien avant cela, par les contre-exemples de R EDEI , H AJ OS La conjecture de F UGLEDE a certes tenu 31 ans avant de connaˆıtre son premier contre-exemple – mais il est vrai qu’elle aura e´ t´e prouv´ee dans nombre de cas particuliers ; au contraire, br`eves auront e´ t´e la vie de celle de T IJDEMAN 1996 (si ppcm(A)=1 alors il existe un nombre premier tel que B ⊂ pZ, tu´ee par S ZAB O´ ), ou de celle de L AGARIAS & WANG (si T pave avec les compl´ements T1 , . . . Tn alors ils sont spectraux et de mˆeme spectre) qui fut victime de K OLOUNTZAKIS & M ATOLCSI en juin 2004[12]. On ignore actuellement si la conjecture que C OVEN ET M EYEROWITZ se sont soigneusement retenus d’´enoncer (pave ⇒ (T2 )) est prouvable ; elle est logiquement plus forte que le sens (pave ⇒ spectral) de celle de F UGLEDE, d’apr`es L ABA. Les r´esultats en sens inverse sont encore peu nombreux (si A est ` spectral alors ?. . .), a` part [14] qui utilise des m´etronomes c’est-a-dire des canons tr`es simples, et il est difficile de se faire une opinion sur cette direction. Mais je finirai cette h´ecatombe par l’extermination de ma propre conjecture. En effet, la construction mentionn´ee par [5] du hongrois S ZAB O´ dans [19] r´efute au d´epart une conjecture de S ANDS, proche de celle de T IJDEMAN. Mais il s’av`ere qu’elle donne, incidemment, un canon de V UZA, qui n’est donc par d´efinition pas r´eductible par d´e-concat´enation, et par construction pas r´eductible par e´ quir´epartition ! Signalons tout de mˆeme que le plus petit contre-exemple donn´e par cette m´ethode, que j’ai impl´ement´e avec Mathematica TM , est de p´eriode , ce qui explique qu’il n’ait pas saut´e aux yeux. De plus la m´ethode de construction est particuli`erement perfide, mˆeme si elle n’est pas sans rappeler certains proc´ed´es de construction des canons de V UZA ; j’en donne ici l’id´ee tr`es simplifi´ee : En hommage au th´eor`eme de DE B RUIJN intitul´e ’on British Number systems’, j’emprunterai une m´etaphore p´ecuniaire. On consid`ere un ensemble de pi`eces et de billets qui permettent de payer exactement n’importe quelle somme (< n). On prend pour A la somme des « pi`eces jaunes », et pour B 0 les sommes de « gros billets ». De fac¸on encore plus imag´ee, A contient les unit´es et B 0 les dizaines, et A ⊕ B 0 = [[ 0, n − 1 ].] Dans l’exemple donn´e plus bas, B 0 = {0, 30, 60, . . . 30k, . . .}. L’id´ee hongroise consiste alors a` perturber B 0 en une nouvelle partie B, en modifiant certains e´ l´ements, choisis expr`es irr´eguli`erement, par l’ajout d’un e´ l´ement variable de A, tout cela variant circulairement ; ceci ne modifie pas le fait que A ⊕ B = Zn mais cela rend B plus irr´egulier. Avec certaines conditions techniques (cf. [19]) on montre que B (ainsi que, plus trivialement, A) engendre Zn et en cons´equence, qu’il n’est pas contenu dans un sous-groupe strict k Zn : donc pas de r´eduction possible par e´ quir´epartition. De plus, la m´ethode employ´ee assure qu’on a affaire a` deux facteurs A, B ap´eriodiques, et donc a` un canon de V UZA. . . Le plus petit que j’ai pu construire de cette fac¸on est de

15

p´eriode  :

A = (0, 36, 72, 100, 108, 136, 144, 172, 200, 208, 225, 236, 244, 261, 272, 297, 308, 325, 333, 344, 361, 369, 397, 425, 433, 461, 469, 497, 5 B = (0, 30, 60, 90, 156, 210, 240, 250, 270, 330, 336, 360, 390, 405, 420, 510, 516, 540, 550, 570, 600, 690, 696, 720, 780, 810, 850, 855, 8

9

Coda

9.1

Stretta

Nous pouvons nous croire arriv´es bien loin de Fr`ere Jacques et de son petit canon a` quatre voix. Mais les contre-exemples obtenus par des arguments sophistiqu´es a` ces conjectures math´ematiques pointues permettent de mettre en e´ vidence des objets musicaux dou´es de propri´et´es int´eressantes, qui vont certainement faire leur apparition dans des partitions prochaines : cela a d´eja` e´ t´e le cas par le pass´e, particuli`erement avec les canons de V UZA mais aussi dans bien des domaines – il n’est pas nouveau que des id´ees math´ematiques servent, consciemment ou non, l’inspiration de musiciens. En retour, et de fac¸on bien plus novatrice, on peut esp´erer que les suggestions des compositeurs continuent, comme elles ont commenc´e de le faire, a` e´ clairer la recherche math´ematique de leurs id´ees sp´ecifiques. L’´etonnante f´econdit´e de cette irruption de la musique dans les math´ematiques s’explique a` mon avis par la fringale des math´ematiciens pour les concepts nouveaux, qui ont toujours servi spectaculairement l’avancement de notre science : bien des outils math´ematiques auˆ mais aussi de la biologie, de l’´economie, etc. . . jourd’hui banals sont issus de la physique, bien sur, Proph´etisons que le temps est venu de reformer et d’´elargir le Quadrivium antique, la musique reprenant avec les autres son statut de pilier de la connaissance.

9.2 9.2.1

Solutions des exercices Canon de p´eriode 2 × `(A)

Il suffit de prendre A = (0, n − 1) qui pave avec B = (0, 1, . . . , n − 1) mais pas moins.

9.2.2

Perfect square tilings P

3n−1 P

X3n − 1 on pose X = j = e2iπ/3 : les indices i X−1 i∈I j=0 multiples de 3 sont caract´eris´es par le fait que Φ3 (ji ) = Φ3 (1) = 3 6= 0. Pour tout autre indice on aura Φ3 (ji ) = 0 – c’est la relation classique 1 + j + j2 = 0. Il reste donc une somme des jki , i ∈ 3N qui doit valoir 0. Or la plus courte somme valant 0 est encore 1 + j + j2 = 0, ce qui impose qu’il y ait 0 ou 3 (ou 6, ou 9. . .) multiples de trois parmi les indices i. Cela explique pourquoi T3 n’apparaˆıt pas sans T6 et T9 . Partant de :

9.2.3

Xki Φ3 (Xi ) = 1 + X + . . . =

Xj =

(1, 4, 9, 16) pave-t-il ?

Non. On a bien deux facteurs cyclotomiques, d’indices 2 et 10, mais la condition (T1 ) n’est pas v´erifi´ee, sans parler de (T2 ). X16 + X9 + X4 + X = X × (1 + X) × (1 − X + X2 − X3 + X4 ) × (1 + X3 − X5 + X10) (il faut un logiciel de calcul formel si on veut factoriser sans efforts ; en revanche on liste facilement α−1 α−1 les polynˆomes cyclotomiques du style Φpα = 1 + Xp + X2p + . . . et on teste s’ils sont diviseurs).

9.2.4

Pavage modulo 2

La plus petite solution pour paver modulo 2 avec A = (0, 1, 3) est B = (0, 2, 3). En effet A + B = {0, 1, 2, 3, 3, 3, 4, 5, 6}.

F IG . 16 – pavage modulo 2 avec (0,1,3) 9.2.5

´ ements d’ordre 15 dans le corps a` 16 e´ l´ements El´

Dans la discussion du probl`eme de J OHNSON, on a vu que le polynˆome (irr´eductible sur F2 [X]) J(X) = 1 + X + X4 a 4 racines d’ordre 15 dans F16 . Leurs inverses sont aussi d’ordre 15, elles sont racines du polynˆome r´eciproque 1 + X3 + X4 . On a alors Φ(15) = 8 e´ l´ements d’ordre 15, on n’en trouvera pas plus (Φ d´esignant la fonction d’E ULER).

16

9.2.6

Transformation affine

Si α est premier avec n, alors l’application k 7→ αk mod est une bijection. Donc A et αA sont en correspondance bijective, et leurs polynˆomes associ´es sont bien 0-1.

9.2.7

Nombres alg´ebriques de module 1 non racines de l’unit´e

Ma plus petite solution est A(x) = 1 + x + x3 + x5 + x6 , dont les quatre racines non r´eelles peuvent eˆ tre exprim´ees par radicaux (poser y = x + 1/x) et sont de module 1, mais ce ne sont pas des racines de l’unit´e (sinon A(x) aurait un facteur cyclotomique).

´ erences ´ Ref [1] Al Fakir, S., Alg`ebre et theorie des nombres, T2, Ellipses 2004. ´ [2] Amiot, E., Why Rhythmic Canons are Interesting, in : E. Lluis-Puebla, G. Mazzola et T. Noll (eds.), Perspectives of Mathematical and Computer-Aided Music Theory, EpOs, 190–209, Universit¨at Os¨ nabruck, 2004. [3] Amiot, E., Rhythmic canons and Galois theory, Grazer Math. Ber., 347 (2005), 1–25. [4] Andreatta, M., On group-theoretical methods applied to music : some compositional and implementational aspects, in : E. Lluis-Puebla, G. Mazzola et T. Noll (eds.), Perspectives of Mathematical ¨ and Computer-Aided Music Theory, EpOs, 122–162, Universit¨at Osnabruck, 2004. [5] Coven, E., and Meyerowitz, A. Tiling the integers with one finite set, in : J. Alg., 212 :161-174, 1999. [6] DeBruijn, N.G., On Number Systems, Nieuw. Arch. Wisk. (3) 4, 1956, 15–17. [7] Fripertinger, H. Remarks on Rhythmical Canons, Grazer Math. Ber., 347 (2005), 55–68. [8] Fripertinger, H. Tiling problems in music theory, in : E. Lluis-Puebla, G. Mazzola et T. Noll (eds.), Perspectives of Mathematical and Computer-Aided Music Theory, EpOs, 149–164, Universit¨at Os¨ nabruck, 2004. ´ G., Sur les factorisations des groupes abeliens, [9] Hajos, in : Casopsis Pest. Mat. Fys.,74 :157´ 162,1954. [10] Johnson, T., Tiling The Line, proceedings of J.I.M., Royan, 2001. [11] Jedrzejewski, F., A simple way to compute Vuza canons, MaMuX seminar, January 2004, http ://www.ircam.fr/equipes/repmus/mamux/. [12] Kolountzakis, M. & Matolcsi, M., Complex Hadamard Matrices and the spectral set conjecture , http ://arxiv.org/abs/math.CA/0411512. [13] Laba, I., The spectral set conjecture and multiplicative properties of roots of polynomials, J. London Math. Soc. 65 (2002), 661-671. [14] Laba, I., and Konyagin, S., Spectra of certain types of polynomials and tiling of integers with translates of finite sets, J. Num. Th. 103 (2003), no. 2, 267-280. [15] Lagarias, J., and Wang, Y. Tiling the line with translates of one tile, in : Inv. Math., 124 :341-365, 1996. [16] Tangian, A., The Sieve of Eratosthene for Diophantine Equations in Integer Polynomials and Johnson’s problem, disc. paper N◦ 309 Fern Universit¨at Hagen. [17] Tijdeman, R., Decomposition of the Integers as a direct sum of two subsets, in : Seminaire de ´ theorie des nombres de Paris, 3D, p.261-276, Cambridge U.P, 1995. ´ [18] Sands, A.D., The Factorization of abelian groups, Quart. J. Math. Oxford, 10(2) :45–54. ´ S., A type of factorization of finite abelian groups, Discrete Math. 54 (1985), 121–124. [19] Szabo, [20] Vuza, D.T., Supplementary Sets and Regular Complementary Unending Canons, in four parts in : Canons. Persp. of New Music, nos 29(2) pp.22-49 ; 30(1), pp. 184-207 ; 30(2), pp. 102-125 ; 31(1), pp. 270-305, 1991-1992. [21] Warusfel, Structures Algebriques finies, Classiques Hachette, 1971. ´ [22] Wild, J., Tessellating the chromatic, Perspectives of New Music, 2002. [23] Midi files for the illustrations in this paper, as part of my website dedicated to rhythmic canons, at http ://canonsrythmiques.free.fr/midiFiles/, 2004.

17

Journal of Mathematics and Music Vol. 01, No. 03, December 2007, 1–21

David Lewin and Maximally Even Sets Emmanuel AMIOT 1 rue du Centre, F 66570 St NAZAIRE, France (v1.0.0 released june 2007) David Lewin originated an impressive number of new ideas in musical formalized analysis. This paper formally proves and expands one of the numerous innovative ideas issued by Ian Quinn in his dissertation [17], to the import that Lewin might have invented the much later notion of Maximally Even Sets with but a small extension of his very first published idea, where he made use of Discrete Fourier Transform (DFT) for investigating the intervallic differences between two pc-sets. Many aspects of Maximally Even Sets (ME sets) and, more generally, of generated scales, appear obvious from this original starting point, which would deserve in our opinion to become standard. In order to vindicate this opinion, we develop a complete classification of ME sets starting from this new definition. As a pleasant by-product we mention a neat proof of the hexachord theorem, which might have been the motivation for Lewin’s use of DFT in pc-sets in the first place. The nice inclusion property between a ME set and its complement (up to translation) is also developed, as it occurs in actual music.

Keywords: Maximally Even Sets, Discrete Fourier Transform, David Lewin. Notations : the cyclic group of order c is Zc . It models a chromatic universe with c pitch classes, and it is as usual pictured as a regular polygon on the unit circle. In most actual examples c will be equal to 12. x | y means the integer x divides y. For the sake of readability we generally use the same notation for integers and their residue classes, the context usually making clear whether a computation occurs in Z or in Zc . The greatest common divisor of x, y is denoted by gcd(x, y). We will use indiscriminately ‘Fourier transform’, ‘Discrete Fourier Transform’, or ‘DFT’. The bracket notation is for the floor function. The symbol X ⊕ Y means ‘all possible sums of an element of X and an element of Y ’, each result being obtained in a unique way.

1

Fourier Transform of pc-sets

Part of our claim that Fourier Transforms provide the best way to define Maximally Even Sets relies on the high musical significance of the DFT of pc-sets in general. This was salient in [17] for the special pc-sets that Quinn collected as ‘prototypes’, among which the ME sets; and it was confirmed since by many other cases. We thus feel it important to spend some time on the general DFT of pc-sets before turning to the main topic, that is its application to ME sets proper.

1.1

History

In a short paper ( [13]), D. Lewin investigated intervallic relationships between two ‘note collections’ and proved that, except in several listed exceptional cases, the interval function between the ‘note collections’ enables to reconstruct one from the other. He cursorily motivates the five exceptional cases by a final note, wherein he puts forward that (1) the interval function is a convolution product (of characteristic functions), (2) the Fourier transform of such a product is the ordinary product of Fourier transforms.

Professor in Class Preps, Perpignan, France. Email: [email protected]

Journal of Mathematics and Music c 2007 Taylor & Francis Ltd. ISSN 1745-9737 print / ISSN 1745-9745 online http://www.tandf.co.uk/journals DOI: 10.1080/17459730xxxxxxxxx

2

title on some pages

This shows that (when the Fourier transform of the characteristic function of A is non vanishing) knowledge of A and of the interval function yields complete knowledge of the characteristic function of B. Defining the interval function between A, B ⊂ Zc as IF unc(A, B)(t) = Card{(a, b) ∈ A × B, b − a = t}, ( 1 if t ∈ X the characteristic fuction of X as 1X (t) = , IF unc appears immediately as the convolution 0 if t ∈ /X product of the characteristic functions of −A and B: 1−A ? 1B : t 7→

X k∈Zc

X

1−A (k)1B (t − k) =

1A (k)1B (t + k) = IF unc(A, B)(t)

k∈Zc

as 1A (k)1B (t + k) is nil except when k ∈ A and t + k ∈ B. Hence from the general formula for the Fourier transform of a convolution product, F(IF unc(A, B)) = F(1−A ) × F(1B ) where F(f ) stands for the discrete Fourier transform of a map f . We will not quote the formula given by Lewin himself, as it is hardly understandable: his notations are undefined and the computations extremely cursory. Of course this is not for lack of rigor: as the following quotation suggests, Lewin did not really hope to be understood when making use of mathematics. The mathematical reasoning by which I arrived at this result is not communicable to a reader who does not have considerable mathematical training. For those who have such a training, I append a sketch of the proof : consider the group algebra [. . . ] [13]

Reading Lewin’s paper gives one a strong feeling that he wrote as little as possible on the mathematical tools that underlay his results. Indeed, what little he mentioned did rouse some readers to righteous ire in the next issue of JMT. Nowadays such a ‘considerable mathematical training’ will be considered basic by many readers of this journal; for instance D.T. Vuza made an essential use of the equation above in the 80’s in the course of his seminal work about rhythmic canons (see [21], lemma 1.9 sqq), wherein he stressed the importance of Lewin’s use of DFT of characteristic functions. And as we will endeavour to prove, this approach enables to define ME sets (in equal temperament) in a way perhaps more suggestive and even intuitive, than historical/usual definitions. 1.2 1.2.1

A quick summary of Fourier transforms of subsets of Zc First moves.

Definition 1.1 Following Lewin, we will define the Fourier transform of a pc-set A ∈ Zc as the Fourier transform of its characteristic function 1A : FA = F(1A ) : t 7→

X

e−2iπkt/c

k∈A

The values FA (t), t ∈ Zc , are the Fourier coefficients. 1A is a map from Zc to C, whose DFT is well defined for t mod c, as FA (t + c) = FA (t). The DFT of a single pc a is a single exponential function t 7→ e−2iπat/c , the DFT of the whole chromatic c−1 P −2iπkt/c scale is FZc (t) = e =0 for all t ∈ Zc except t = 0. k=0

But FA + FZc \A = FZc , hence

alternative title

3

Lemma 1.2 The Fourier transforms of a pc-set A and of its complement Zc \ A have opposite values, except when t = 0: ∀t ∈ Zc , t 6= 0,

FZc \A (t) = −FA (t)

Furthermore, we get FZc \A (0) = FA (0) if and only if Card A = c/2, as Lemma 1.3 The Fourier transform of A in 0 is equal to the cardinality of A: FA (0) = Card A. For other coefficients, taking into account lemma 1.2 and the triangular inequality one gets Lemma 1.4 ∀ t ∈ Zc , t 6= 0 ⇒ |FA (t)| ≤ min(d, c − d). The DFT FA characterizes the pc-set A, by the following identity (Inverse Fourier transform) 1A (t) =

1 X +2ik tπ/c e FA (k) c k∈Zc

easily derived from the definition of FA . Thus the DFT yields the same information as the pc-set, but in a form that stresses musically relevant concepts. More precisely, there is preservation of the absolute value of DFT under all usual1 musical transformations. For instance, Theorem 1.5 The length of the Fourier transform, i.e. the map |FA | : t 7→ |FA (t)|, is invariant by (musical) transposition or inversion of the pc-set A. More precisely, for any p, t ∈ Zc • FA+p (t) = e−2ipπt/c FA (t) (invariance under transposition) • F−A (t) = FA (t) (invariance under inversion) and also under complementation (except in 0 when Card A 6= c/2). Let us say that A, B are Lewin-related when maps |FA | and |FB | are identical. It is the case whenever A, B are exchanged by the T/I group of musical transformations, but the reverse is not true (see below). All the same, the map |FA | appears to be a very good snapshot of the relevant musical information of a given pc-set: by dropping the information of the phase of the Fourier coefficients and retaining only the absolute value, we seem to keep the best part, in a way reminiscent of the Helmoltzian approach of sound, which showed that the phase of a sine wave can (mostly) be neglected, as the frequency is the part that generates the perception of pitch. This strongly vindicates and to some measure extends Quinn’s ( [17]) notion of ‘chord quality’, which appears in the last section of his dissertation with a value that is precisely |FA (d)|, d = Card A, and is measured in ‘lewins’. As as nice application of these invariance properties, we may characterize periodic subsets: Proposition 1.6 A ⊂ Zc is periodic , meaning A + τ = A for some τ , if and only if FA (t) = 0 except when t belongs to some subgroup of Zc . The proof is left to the reader (see also Supplementary II online). Remark 1 • Some may well claim this proposition is obvious: a subset A ∈ Zc is the set of residues of a periodic b ⊂ Z, with period c. This periodicity means precisely that 1A (or 1 b, with the same formula) can set A A be expressed as a combination of c exponential functions, the t 7→ e2iπ k t/c : this is the inverse Fourier transform formula and the very reason Fourier transform works. The existence of a smaller period m | c means that m exponentials functions only are sufficient, e.g the t 7→ e2iπ k t/m . • In Z12 , the octatonic scale (0 1 3 4 6 7 9 10) is an interesting example of such a periodic subset. Its group of periods is 3 Z12 . Periodic subsets of Z12 are well known as Messiaen’s Modes ` a Transposition Limit´ees. 1 Less

usual transformations, like t 7→ 7t mod 12, permute the Fourier coefficients.

4

title on some pages

DFT and intervallic content. The following theorem is based on the idea to interpret the multiplicities of pc intervals within a pc-set A as complex numbers (such as we did with the values 0 and 1 of the characteristic functions 1A ). The interval content is treated as function from Zc to the complex numbers and is defined on the c (oriented) possible intervals1 . 1.2.2

Theorem 1.7 (Lewin’s Lemma) Define the interval content of a subset A ∈ Zc as ICA (k) = IF unc(A, A)(k) = Card{(i, j) ∈ A2 , i − j = k} Then the DFT of the intervallic content is equal to the square of the length of the DFT of the set: F(ICA ) = |FA |2 Proof Let A be a pc-set; as Lewin observed (for the more general interval function between two subsets), the ‘intervallic function’ from pc-set A to itself is 2 the convolution product ICA = 1−A ? 1A But as we recalled earlier, the Fourier transform of a convolution product is the ordinary product of Fourier transforms, i.e. (using last part of theorem 1.5) F(ICA ) = FA × F−A = FA × FA = |FA |2 

Note that the Fourier transform of any IC is a real positive valued function, an uncommon occurence among DFT of integer-valued functions 3 . Now we see that the Lewin relation is the equivalence closure of the Z-relation: Proposition 1.8 A, B ⊂ Zc are Lewin-related (|FA | = |FB |) if and only if they share the same interval content. The equivalence stands because |FA | holds all the information about ICA by inverse Fourier transform4 – this case follows directly here from theorem 1.5. From there we also get a very short proof of the hexachord theorem, one of the most striking mathematical results in music theory. At the time he issued his first paper, Lewin had come to work with Milton Babbitt, who was trying to prove the hexachord theorem (see fig. in Supplementary II online): Theorem 1.9 If two hexachords (i.e. 6 notes subsets of Z12 ) are complementary pc-sets in Z12 , then they have the same intervallic content (same numbers of same intervals). A simple derivation of this theorem in Zc for any even c ensues from the elementary properties of DFT already listed:

1 Usually,

textbooks define interval content for T/I-classes of intervals. relation has been quoted, in musical context, by several authors: for [21], it might be the most important single contribution by David Lewin: ”It is therefore my conviction that in the near future music theory will integrate convolution and Fourier transform as effective investigation tools, music theorists being able to use them in the same way as presently they make use of groups, homomorphisms, group actions, and so forth;” ; it also appears for instance in the recent [16]. 3 The DFT of a real valued function is non real in general, it only verifies F (f )(−t) = F (f )(t). 4 Please note that we endeavour here to define a true equivalence relation, contrarily to the Fortean tradition which excludes the ‘easy case’, when A, B are T/I related. This traditional position is weird; another argument against it is that some classes of ‘Z-related’ chords are indeed exchanged through action of a larger group than T/I, like the two famous all-intervals (0 1 4 6) and (0 1 3 6) in Z12 , which are affine-related (see [20], pp.102 sqq)– and this is a general situation, as any affine transform of an all-interval set will be Z-related. Jon Wild pointed out to me that the reverse is false. 2 This

alternative title

5

Proof If A ∈ Zc has c/2 elements, then as mentioned above, FZc \A = −FA . So F(ICA ) = |FA |2 = |FZc \A |2 = F(ICZc \A )

Hence (by inverse DFT) ICA = ICZc \A .



As far as I know, this short proof was first published in [1] after I mentioned it during the J. Clough memorial days in july 2005. But considering the coincidence in time of Lewin’s first paper and his meeting with Babbitt, it is almost certain that he was aware of it. Perhaps the harsh reactions to the mathematics in his first paper explain why he did not publish it. It is left to the reader, as a good and entertaining exercise, to prove in the same way the Generalized Hexachord Theorem, as expounded in [18], [20], [16] and many others.

2

Maximally Even Sets and their Fourier Transforms

The attribute ‘maximally even’ applies to pitch class sets, which — in comparison to all pitch class sets of the same cardinality — are as evenly as possible distributed within Zc . This is obviously the case for totally regular sets, which exist only for cardinalities d dividing the number c of pitch classes. The opposite special case — where d and c are mutually coprime — was well studied in [8]. The point of departure for the extensive study of the general case in [7] is an explicit construction of generalized diatonic sets in [8]. The formula for this construction was later termed J-function. It departs from the arithmetic series of rational c c numbers 0, , ..., (d − 1) and ‘digitizes’ them within Zc in terms of the residue classes of the floor-values d d   c c of these ratios mod c: 0, , ..., (d − 1) mod c. The J-function includes a translation parameter α: d d α : k 7→ Jc,d

 kc + α  , k = 0 . . . d − 1. d

In this section we accomplish the theory of maximally even sets with an alternative definition via FourierCoefficients and derive the main known results directly from this definition. Our ‘Lewinesque’ definition matches the semantics of the term ’maximally even’ better than the explicit J−function, which lacks the aspect of comparison. See Supplementary I of the online edition for a compilation of facts and arguments around maximally even sets, or the recent [10]. 2.1

An illuminating remark by Ian Quinn

Discussing a general typology of chords (or pc-sets), Ian Quinn noticed ( [17], 3.2.1) that what he calls ‘generic prototypes’ are the ME sets, and that they share an extremal property in terms of Fourier ‘weight’1 . This is what we will now adopt as a definition; Quinn’s impressive survey and classification of the landscape of all chords was not focused exclusively on ME sets, and as his redaction voluntarily avoided, to quote him, the ‘stultifying’ quality inherent to dry mathematical generalizations, he left room for a formal proof that this definition is equivalent to the traditional ones (we will prove the following definition is equivalent to the classicical description, up to and including the formula with J functions; see [7] and [10] for equivalence between all previous definitions). Moreover, and this is in itself justification enough for what follows, many properties of ME sets will now appear obvious from this starting point. Finally, the only quantity involved is |FA |, the invariant of the Lewin relation which is, as we have seen, in many ways the most natural musical invariant for pc-sets. 2.2

A Lewinesque definition of ME sets and derived properties

1 “ We note that generic prototypicality may be interpreted as maximal imbalance on the associated Fourier balance – at least to the extent that a generic prototype tips its associated Fourier balance more than any other chord of the same cardinality possibly can”.

6

title on some pages

Definition 2.1 The pc-set A ⊂ Zc , with cardinality d, is a ME set, if the number |FA (d)| is maximal among the values |FX (d)| for all pc-sets X with cardinality d: ∀X ⊂ Zc ,

Card X = d



|FA (d)| ≥ |FX (d)|

p As the number of pc-sets is finite, a solution must exist. Remember that |FA (d)| = F(ICA )(d) (see section 1). Therefore, maximal evenness is also manifest in the DFT of the interval vector as a maximality condition for |F(ICA )(d)|. From the invariance of the ‘Fourier profile’ |FA | under musical operations (see theorem 1.5 and lemma 1.2 about complementation) we obtain easily Proposition 2.2 Transposition, inversion and complementation of a ME set still yield a ME set.

2.3

Notations and Maps

Throughout the remainder of this section let m = gcd(d, c) denote the greatest common divisor of d and d c c and let d0 = and c0 = denote the associated quotients. m m Let ϕd : Zc → m Zc and ϕd0 : Zc0 → Zc0 denote the linear multiplication maps ϕd (l) = d · l and onZ some pages ϕd0 (k) = d0 · k, respectively. Further let πc0 :title Zc → c0 denote the reduction of the finer residue classes 0 mod c to the coarser residue classes mod c , i.e. πc0 (l) = l mod c0 . Finally, let im : m Zc → Zc0 denote the isomorphism, identifying the submodule m Zc of Zc with Zc0 : im (mk) := k mod c0 . d of ‘mathemusical’ knowledge is the continued contribution of Jack Douthett Note that the multiplication by d is a concatenation of the multiplications by m and by d0 . Thus, if we the maps ϕd and im into a mapaπdbeacon := im ◦ ϕd , in we see the map the previous ugh andconcatenate other partners). He is still thethatfield of iME sets. m ‘undoes’ multiplication by m. Therefore im ◦ ϕd = ϕd0 ◦ πc0 , which means that the diagram below commutes.

reviewers have been instrumental in bringing this paper up to the quality level itable task for a lone writer. I would like to thank especially Dmitri Tymocsko, R Noll in that respect. A

Zc

ϕd !

d A mod c

mZc

# # πd πc! ιm # " # $ " # ϕd! ! Zc! Zc! B' B

A'

es

E., 2006, Une preuve ´ el´ egante du th´ eor` eme de Babbitt par transform´ ee de Fourier discr` ete, Quadrature,

E., The Different Generators of A Scale, 2008, ofmorphisms Music Theory, to be published. Figure 1. Journal Notations and M., 1955, Some Aspects of Twelve-Tone Composition, Score, 12 , 53-61. . Douthett, J.., 1994, Vector products and intervallic weighting, Journal of Music Theory , 38, 2142. V., Vicinanza D., 2004, Myhill property, CV, well-formedness, winding numbers and all that, Logique elles en musique., Keynote adress to MaMuX seminar 2004 - IRCAM - Paris. N., Clampitt, D., 1989, Aspects of Well Formed Scales, Music Theory Spectrum, 11(2),187-206. J., Douthett, J., 1991, Maximally even sets, Journal of Music Theory, 35:93-173. J., Myerson, G., 1985, Variety and Multiplicity in Diatonic Systems, Journal of Music Theory,29:249-7 J., Myerson, G., 1986, Musical Scales and the Generalized Circle of Fifths, AMM, 93:9, 695-701. t, J., Krantz, R., 2007, Maximally even sets and configurations: common threads in mathematics, physics,

alternative title

2.4

7

Pich Class Sets and related Multisets

Our goal is to translate the maximality condition for the absolute value |FA (d)| of the d-th Fouriercoefficient for pc-sets A into an equivalent maximality condition for the absolute value |FA0 (1)| for associated pc-multisets A0 . To that end we investigate the image of a pc-set A ⊂ Zc under the map πd in a refined way. The refinement of the image πd (A) is a multiset which controls the multiplicity of each single image l = πd (k) ∈ Zc0 for k ∈ A, i.e. the cardinality of the pre-image πd−1 (l) ∩ A. A suitable definition of the concept of a multiset is given in terms a generalized concept of characteristic function. Recall that the ordinary characteristic function 1A : Zc → {0, 1} ⊂ C serves as an alternative representation of the set A. In this way, the set of subsets of Zc appear as the subspace of complex-valued functions on Zc , with the condition that the values are only 0, 1. The Fourier transform is an automorphism of this last algebra. d : Z 0 → {0, ..., m} ⊂ C with In extrapolation of this idea, we consider the function νA c d νA (l) := Card(πd−1 (l) ∩ A) = Card({k ∈ A | q · k = l}).

The multiset associated with A consists of the elements of πd (A), each being repeated with the multiplicity d (l). For the non-elements of π (A), i.e. for all l ∈ Z 0 \π (A), the multiplicity vanishes: ν d (l) = 0. In order νA c d d A to manipulate this multiset like an ordinary set, we attach the multiplicity of each element as a superscript: d A0 := {νA (l) l | l ∈ πd (A)}. For instance, the multiset associated with c = 12, d = 3 and the regular set (augmented fifth) A = {0, 4, 8} ⊂ Z12 is the multi-singleton set A0 = {3 0} (with 0 ∈ Z4 ). The multiset associated with c = 12, d = 8 and the octatonic set A = {0, 1, 3, 4, 6, 7, 9, 10} ⊂ Z12 is A0 = {4 0,4 2} (with 0, 2 ∈ Z3 ). The straightforward following lemma relates the d-th Fourier coeffient of the set A to the first Fourier d . When the meaning of A0 is clear, we may adopt the notation from pc-sets coefficient of the function νA d ) and call this the Fourier transform of the multiset A0 . and write: FA0 := F(νA Lemma 2.3 With the notations above we have: FA (d) = FA0 (1). Proof We need to re-interpret a Fourier coefficient defined over Zc as a Fourier coefficient over Zc0 : FA (d) =

X k∈A

e−2πikd/c =

X k∈A

0

0

e−2πikd /c =

X

X

l∈Zc0 k∈A∩πd−1 (l)

0

e−2πil/c =

X

0

d νA (l)e−2πil/c = FA0 (1).

l∈Zc0



In order to faithfully translate the maximality conditions from sets in Zc to multisets in Zc0 , we need to determine the correct collection of multisets involved. The following definition and lemma clarify this issue. P Definition 2.4 A m|d-multiset in Zc0 is a function ξ : Zc0 → {0, ..., m} satisfying k∈Zc0 ξ(k) = d. Lemma 2.5 m|d-multisets are exactly the multisets associated with a subset A with cardinality d. Proof We represent Zc as a disjoint union of the pre-images πd−1 (l) of single residue classes l ∈ Zc0 under the surjective map πd , i.e.: Zc = πd−1 (0) t πd−1 (1) t ... t πd−1 (c0 − 1) and we list the m elements of each of these pre-images in some arbitrary way: πd−1 (l) := {kl,1 , ..., kl,m } for each l ∈ Zc0 . Now for d = ξ. A = {k0,1 , ..., k0,ξ(0) } t {k1,1 , ..., k1,ξ(1) } t ... t {kc0 −1,1 , ..., kc0 −1,ξ(c0 ) }, we easily see that νA 0 Conversely, the kernel of ϕd is the subgroup c Zc , with m elements, so the multiplicity of any element of πd(A) is at most d. And of course the sum of multiplicities is Card A = d.  Corollary 2.6 The absolute value |FA (d)| of the d-th Fourier coefficient of a pc set A ⊂ Zc is maximal d )(1)| among the values |FX (d)| for all d-element subsets X ⊂ Zc iff the absolute value |FA0 (1)| = |F(νA 0 of the 1-st Fourier coefficient of the associated multiset A is maximal among the values |F(ξ)(1)| for all m|d-multisets ξ in Zc0 .

8

title on some pages

2.5

Huddling Lemma

This subsection is dedicated to the analysis of the maximality condition for the absolute values of the 1-st Fourier coefficients for multisets associated with pc-sets A. Lemma 2.7 (Huddling Lemma) The absolute value of the 1-st Fourier coefficient |F(ζ)(1)| of a m|d multiset A0 with characteristic function ζ is maximal among the values |F(ξ)(1)| for all m|d-multisets ξ in Zc0 iff ξ is a contiguous cluster of d0 pitch classes of multiplicity m, i.e. iff there is a l0 ∈ Zc0 such that ζ is of the form  ζ(l) =

m 0

for l − l0 ∈ {0, ..., d0 − 1}, for l − l0 ∈ {d0 , ..., c0 − 1}.

Just for the sake of illustration, we point out the two simple subcases: • When c, d are coprime, πd is bijective and A0 = d A is an ordinary subset of Zc . The definition of ME sets, corollary 2.6 and the huddling lemma above mean that A0 is a chromatic cluster, i.e. some translate of {1, 2, . . . , d}. Hence A = d−1 A0 is an arithmetic sequence with ratio d−1 , as is well known since [8]. The seminal example is the major scale, generated by a cycle of fifths. • When d is a divisor of c, then A0 is a multi-singleton set {d a0 } as then the value |F(ζ)(1)| = d is clearly maximal – here the huddling lemma is obvious. This means that A is a saturated preimage, i.e. A = π −1 (a0 ) = a + c0 Zc = a + ker πd with πd (a) = a0 , i.e. A is a regular polygon: see figure 21 .

x4

Figure 2. All exponentials superimposed

Now for the technical proof of the huddling lemma. It relies basically on the very old geometrical fact that the sum of two vectors making an acute angle is grater than both. Proof We consider a m|d multiset A0 in Zc0 such that ξ does not have the contiguous form given in the lemma, and prove that |F(ξ)(1)| = |FA0 (1)| is not maximal; the heuristic idea is that ‘filling in the holes’ increases the length of the sum. Let us enumerate the elements of A0 as r real integers in some increasing order: k1 < k2 < . . . kr < k1 + c (the span kr − k1 could be chosen minimal, but it is sufficient that it be < c). Assume that A0 is not a translate of {m 0,m 1,m 2, . . . m d0 − 1}, then there must be some element k ∈ [k1 , kr ] with multiplicity 0 ≤ ξ(k) < m (and r > d0 ). • Say there is such a k with multiplicity < m, aka ‘hole’, with k1 < k < kr ; I claim that |FA0 (1)| strictly increases when (say) k1 is replaced by k, i.e. when ξ(k) is incremented while ξ(k1 ) is decremented:

1 This exemplifies that the Lewinesque definition aims at looking for the best approximation to a regular polygon — obviously it will be only an approximation when d does not divide c, for instance there is no regular heptagon√inside the 12 notes universe. Indeed the solution (the major scale A =(0 2 4 5 7 9 11) or any translate thereof) achieves |FA (7)| = 2 + 3 ≈ 3.73, still far from the unattainable value 7 (or rather 5, for the complement), but still the largest value possible.

alternative title

9

P 0 0 0 in so doing, the sum S = FA0 (1) = l∈Z0c ξ(l)e−2iπl/c is replaced with S 0 = S + e−2iπk/c − e−2iπk1 /c . If S = 0 then clearly |S 0 | > |S|. If not, let S = r e−iθ . We can choose a determination of θ mod 2π (or rather choose the ki ’s) such that 2πk1 /c0 < θ < 2πkr /c0 , and I will assume that θ is closer to 2πk1 (if not, the proof is the same but π(k − k1 ) −iπ(k+k1 )/c0 +iπ/2 0 0 e and with kr ) i.e. 0 < θ − 2πk1 /c0 < π. As V = e−2iπk/c − e−2iπk1 /c = 2 sin c0 0 0 0 < θ − π(k + k1 )/c + π/2 < π/2 by our assumption that θ is ‘close’ to 2πk1 /c , the vectors S, V with directions respectively −θ and −π(k + k1 )/c0 + π/2 make an acute angle. Hence their sum S 0 is longer than both, qed (see fig. 3). This can be done until no ‘holes’ remain between k1 and kr , i.e. ξ(k) = m for all k1 < k < kr . • Eventually we reach the last case: the vector of multiplicities must then be ξ(k1 ) = µ, ξ(k2 ) = m = ξ(k3 ) = . . . ξ(kd ), ξ(kd+1 ) = m − µ Say for instance µ ≥ m − µ. Then the direction θ of −iθ

FA0 (1) = r e

=m

d+1 X

e−2iπk/c + (m − µ)(e−2iπk1 /c − e−2iπkd+1 /c )

k=1

lies between 2πk1 /c and the mean value π(k1 + kd+1 )/c (convexity). Hence as above, moving one point 0 from position kd+1 to position k1 , i.e. incremeting ξ(k1 ) while decrementing ξ(kd ), i.e. adding e−2iπk1 /c − 0 e−2iπkd+1 /c to S, increases its length, as the two vectors makes an acute angle. Iteration of this process increases S strictly until it is no longer possible, which happens when A0 is made of d0 consecutive points with multiplicity m, qed. 

k

k FA' (1)

kr

new FA' (1)

kr

k1

k1

Figure 3. Maximizing the sum on a multiset

Notice that for m = 1, the maximal solution is simply a chromatic cluster: A0 is an ordinary set with d consecutive points.

2.6

Maximally Even Sets Revisited

It remains to be justified that our Lewinesque definition of maximally evenness is indeed equivalent to the traditional definitions. In the following subsection we recover the definition via J-functions. In the present subsection we explore the pre-images πd−1 (ζ) of contiguous clusters as described in the huddling lemma. This leads to the well-know taxonomy of maximally even sets:

10

title on some pages

• The regular polygon type: When m = d and hence d0 = 1, as mentioned above the associated d is a multi-singleton {m l } of multiplicity m which corresponds to the complete pre-image multiset νA 0 −1 πd (l0 ) = k0 + {0, c0 , ..., (m − 1)c0 } for some k0 ∈ πd−1 (l0 ) and hence is a regular polygon in Zc . • The Clough/Myerson type: When m = 1 and hence c = c0 the map πd = ϕd = ϕd0 is an autod is the characteristic function of an ordinary cluster of morphism of Zc and the associated multiset νA cardinality d co-prime with c. We have found again the result of [8], e.g. that maximally even sets of cardinality d which are co-prime with the chromatic cardinality c are generated by the inverse d−1 mod c1 . • The general Clough/Douthett type: From our construction, A = πd−1 (m {l0 , . . .m ld0 −1 }) = πd−1 (m l0 )t. . . πd−1 (m ld0 −1 ) = (a0 +m Zc )t. . . (ad0 −1 +m Zc ) = {a0 , . . . ad0 −1 }⊕m Zc meaning, in accordance with the known facts from [7], that general maximally even sets are Cartesian products of the two previous types, i.e. bundles of regular polygons which are anchored in a Clough/Meyerson type maximally even set. For example with the octatonic scale, we have A0 = {4 0,4 2}, with preimages 0, 3, 6, 9 for 4 and 1, 4, 7, 11, for 2: A = {0, 1} ⊕ {0, 3, 6, 9} = B ⊕ 3 Z12 . There is a nice Fourier interpretation of this last and most complicated case: as seen above, A is periodic with period c0 . Let us introduce for clarity B = {0, 1 . . . c0 − 1} ∩ A = {0, 1 . . . c0 − 1} ∩ πd−1 (A0 ) = πc0 (A) ⊂ Zc0 . We have shown that Theorem 2.8 A is a ME set in Zc if and only if A = B ⊕ m Zc and B is a ME set in Zc0 . This is pleasantly related to the the following simple equation between Fourier transforms: Remark 1 If A = B ⊕ m Zc then FA (d) = m FB (d0 ) (B being considered as a subset of Zc0 ). This number is of maximal length if and only if B is a ME set in Zc0 , which is precisely the above theorem. Indeed the Fourier coefficients of B are (up to the m factor) the meaningful values of FA (d) as when A is c0 −periodic, all coefficients FA (k) vanish for k not a multiple of c0 (Prop. 1.6). This is clearly visible on figure 4, with Fourier transforms of the ME set (0 2 4) in Z7 and its counterpart (0 2 4)⊕ (0 7 14 21) in Z28 . This argument seems to us more illuminating than purely algebraic computations, as it enhances the fact that the “characteristic domain” B concentrates its energy in the sense of the huddling lemma, in order for A to do the same. We get from there the complete enumeration of ME sets, which is developed in the end of Supplementary I in the online version of this paper.

2.7

Expression by way of J functions

For the sake of completeness we add this technical but quick derivation of all ME sets: Theorem 2.9 Let A ⊂ Zc be the pc set, whose elements are given by the J function, i.e.  kc + α  α , k = 0 . . . d − 1.} A = {Jc,d (k) | k = 0 . . . d − 1} = { d Then πd (A) is a contiguous cluster of d0 pitch classes of multiplicity m, i.e. A is maximally even. Proof We compute values of the floor-function in Z, but interpret the results in Zc and Zc0 . Further we suppose α = 0 w.l.o.g.

1 Contiguous

order of cluster A0 = l0 + {0, ..., d − 1} represents generation order of ME set A = l0 d−1 + {0, d−1 , ..., (d − 1)d−1 }.

alternative title

11

(0

0

24

)

2

4

ME!7,3"

ME!28,12"

12

12

10

10

8

8

6

6

4

4

2

2 4

4

8

12

16

20

24

Figure 4. Maximizing for B is maximizing for A

 (k + d0 )c   kc  kc  d0 c  = + = + c0 , we conclude first that A is a disjoint d d d d  kc  union of m translates of the set B = { , k = 0 . . . d0 − 1}, with multiples of c0 as displacements, i.e. d A = B t c0 + B t ... t (m − 1)c0 + B. Thus, each element in the multiset πd (A) has multiplicity m. It remains to be shown that πd (B) is a contiguous cluster. kc kc0 We will use the fact that the fractional parts of the rational numbers = 0 take d0 different values d d when k runs from 0 to d0 − 1. This is true because c0 and d0 are coprime. To see this choose 0 ≤ k, k 0 < d0 : From the equations

k 0 c0 kc0 − 0 = n ∈ Z ⇒ (k 0 − k)c0 = d0 n ⇒ d0 | (k 0 − k) ⇒ k 0 = k as |k 0 − k| < d0 d0 d  0 kc0  kc0  0 different integers 0 ≤ kc0 −d0 kc − < 1 we obtain d ≤ d0 d0 d0 0  kc  d0 − 1, which are in fact all the integers 0, ..., d0 . Reduction of the elements kc0 − d0 0 modulo c0 yields d the set −πd (B) = −d0 B mod c0 . Thus πd (B) is a cluster, namely πd (B) = {c0 − d0 + 1, c0 − d0 + 2, ..., c0 }.  From the d0 different fractional parts 0 ≤

3

Generated Sets and Groups Generated by a Set

The Fourier approach offers further directions of investigation. Here we restrict ourselves to maximality conditions for the absolute values for Fourier coefficients. As we have seen in Section 2 it is the index d ∈ Zc , i.e. the residue class of the chords cardinality to which the maximality condition for maximal evenness is attached.

12

title on some pages

What about the other coefficients? It is illuminating to investigate the maximal Fourier coefficients among invertible indices t ∈ Z∗c as well as among all non-zero indices t ∈ Zc \{0}. In the definition below we exclude the index t = 0, because the maximum |FA (0)| = d is shared by all sets A with d elements. Definition 3.1 For any pitch class set A ⊂ Zc let kFA k = max |FA (t)| and kFA k∗ = max∗ |FA (t)| be t∈Zc ,t6=0

t∈Zc

respectively the maximal absolute value among all Fourier coefficients at non-zero indices, and the maximal value of Fourier coefficients at invertible indices. First notice that if f : x 7→ a x + b, a ∈ Zc0 , is a bijective affine map then for any subset A kFf (A) k∗ = kFA k∗

as

∀t ∈ Zc

|Ff (A) (t)| = |FA (a t)|

(the Fourier coefficients are permuted by affine maps). Same for kFA k: these quantities are invariant on affine orbits of subsets. There are three plausible values for the maximum kFA k or kFA∗ k. The first is the value characterizing ME sets: Proposition 3.2 Fix a cardinality d coprime with c. Let µ(c, d) = |FB (d)| for some (c, d) ME set B. For all d-element subsets of A ⊂ Zc , we find that kFA k∗ ≤ µ(c, d) The equality occurs iff A = r · B + t for suitable r ∈ Z∗c and t ∈ Zc , or equivalently A = a0 + {0, f, ..., (d − 1)f } is generated by a residue f ∈ Z∗c (coprime with c). The second plausible value is sin(π d/c)/ sin(π/c) which is equal to |FC (1)| for C a cluster, eg C = {1, 2 . . . d}. The affine images of C are the generated scales with cardinality d, and we have a similar proposition: Proposition 3.3 Let ρ(c, d) = |F{1,2...d} (1)|. For all d-element subsets of A ⊂ Zc , we find that kFA k∗ ≤ ρ(c, d). The equality kFA k∗ = ρ(c, d) occurs if and only if A = a0 + {0, f, ..., (d − 1)f }, i.e. A is generated by a residue f ∈ Z∗c coprime with c. The last interesting value is d itself, as we have seen that FA (t)| ≤ d ∀t. First of all, remember that from prop. 1.2, kFZc \A k = kFA k is at most the lowest of d, c − d, so it is enough to work out the case d ≤ c/2: dealing with a ‘large’ ME set (d > c/2) is equivalent to dealing with a ‘small’ one (d ≤ c/2), its complement. Henceforth we will assume the latter case. Proposition 3.4 kFA k = d iff A is contained in a regular polygon, i.e. ∃r ∈ N, a0 ∈ Zc , 1 < r < c,

A ⊂ a0 + rZc

Notice that, although this includes the generated scales that we missed in the last proposition, other cases are possible: C = {0, 2, 6} ∈ Z12 also checks FC (6) = 3. The proofs of these propositions and a discussion of the remaining chords with maximal kFA k which are not of the previous types are to be found in Supplementaryary III of the online version.

4

Chopin’s theorem

As the inverse of a ME set (in the musical sense) is also maximally even, either f 0 = d0−1 or its opposite −f 0 will generate a hc0 , d0 i ME set1 . This has a consequence on complementary ME sets classes: as gcd(c, c−d) = c−d = c0 − d0 ≡ −d0 gcd(c, d) = m, when one replaces d by c − d, one gets the same c0 , and replaces d0 by m mod c0 ; hence Lemma 4.1 A same generator f 0 can be used for the construction of both hc, di and hc, c − di ME sets.

1 The

interesting question of all generators of a scale (not only for ME sets) is to be elucidated in [2].

alternative title

13

For instance, the fifth f 0 = f = 7 generates both the pentatonic and the major scales, when c = 12. For, say, c = 20 and d = 8, one gets m = 4, d0 = 2, c0 = 5, f 0 = 3 and the generated ME sets with 8 and 12 elements are {0, 3} ⊕ {0, 5, 10, 15} and {0, 3, 6, 9} ⊕ {0, 5, 10, 15} = {0, 3, 1, 4} ⊕ {0, 5, 10, 15}. More generally, Theorem 4.2 Let 1 < d ≤ c/2; then any given hc, c − di ME set contains several (exactly c0 − 2d0 + 1) hc, di ME sets. In other words, any ‘small’ ME set is contained in several translates of its complement Proof A hc, di ME set is constructed by truncating to just d0 consecutive values the sequence {f 0 , 2f 0 , . . . (c0 − d0 )f 0 } mod c0 , which generates (adding up c0 Zc ) the given hc, c − di ME set A. This can be done in precisely c0 − 2d0 + 1 ways. From there, as seen in thm. 2.8, it suffices to add c0 Zc to get both whole ME sets, since c0 is the same for d and c − d, preserving the inclusion relation all the time.  We would like to baptize this result Chopin’s theorem in reference to the Etude op 10 N◦ 5 (see fig. in Supplementary II of the online version) where the right hand plays the pentatonic (black keys only) while the left hand wanders through several keys, G flat and D flat major for instance. This result has been observed (especially in this pentatonic ⊂ major scale case) and commented1 although perhaps it has not been stated and proved as a quality of all ME sets (or, alternatively, generated scales). So David Lewin, who almost invented ME sets as we have seen, might also have originated set-complex Kh−theory too in one fell swoop.

5

Coda

We have examined the definition of the DFT of a pc-set, according to David Lewin. Several interesting features of the pc-set are encapsulated in the absolute value of this function. Following then Ian Quinn, we were led to advance an original definition of Maximally Even sets, which appears to be geometrical, concise, elegant, and illuminating2 . We hope that this definition will become a productive one.

Acknowledgements

First of all to Ian Quinn who not only spelled out the property which makes the gist of this paper, but also drew our attention, through his comprehensive study of chords landscape, to the impressive advantages of the DFT of chords, and not only ME sets and other ‘prototypes’. David Clampitt kindly explained the subtleties of WF scales vs ME sets and most of the history of these fascinating notions. Equally important to the field of ‘mathemusical’ knowledge is the continued contribution of Jack Douthett (with the late John Clough and other partners). Several reviewers have been instrumental in bringing this paper up to the quality level of the Journal, an undomitable task for a lone writer. I would like to thank especially Dmitri Tymocsko, Robert Peck and particularly Thomas Noll, in that respect.

References [1] Amiot, E., 2006, Une preuve ´ el´ egante du th´ eor` eme de Babbitt par transform´ ee de Fourier discr` ete, Quadrature, 61, EDP Sciences, Paris. [2] Amiot, E., The Different Generators of A Scale, 2008, Journal of Music Theory, to be published. [3] Babbitt, M., 1955, Some Aspects of Twelve-Tone Composition, Score, 12 , 53-61. [4] Block, S. Douthett, J.., 1994, Vector products and intervallic weighting, Journal of Music Theory , 38, 2142.

1 For instance in [17], 2.3: “ all secondary prototypes are Kh-related to one another”, which seems to be an equivalent statement to the theorem above. 2 Though less general than [10] which allows all possible strictly convex measures on the unit circle to be chosen indifferently.

14

title on some pages

[5] Cafagna V., Vicinanza D., 2004, Myhill property, CV, well-formedness, winding numbers and all that, Logique et thories transformationnelles en musique., Keynote adress to MaMuX seminar 2004 - IRCAM - Paris. [6] Carey, N., Clampitt, D., 1989, Aspects of Well Formed Scales, Music Theory Spectrum, 11(2),187-206. [7] Clough, J., Douthett, J., 1991, Maximally even sets, Journal of Music Theory, 35:93-173. [8] Clough, J., Myerson, G., 1985, Variety and Multiplicity in Diatonic Systems, Journal of Music Theory,29:249-70. [9] Clough, J., Myerson, G., 1986, Musical Scales and the Generalized Circle of Fifths, AMM, 93:9, 695-701. [10] Douthett, J., Krantz, R., 2007, Maximally even sets and configurations: common threads in mathematics, physics, and music, Journal of Combinatorial Optimization, Springer. Online: http://www.springerlink.com/content/g1228n7t44570442/ [11] Cohn, R., 1991, Properties and Generability of Transpositionally Invariant Sets, Journal of Music Theory, 35:1, 1-32. [12] Clough, John; Douthett, Jack; and Krantz, Richard, 2000, Maximally Even Sets: A Discovery in Mathematical Music Theory is Found to Apply in Physics, Bridges: Mathematical Connections in Art, Music, and Science, Conference Proceedings 2000, ed. Reza Sarhangi. Winfield, Kansas: Central Plain Book Manufacturing, 193-200. [13] Lewin, D., 1959, Re: Intervallic Relations between two collections of notes, Journal of Music Theory, 3:298-301. [14] Lewin, D., 2001, Special Cases of the Interval Function between Pitch-Class Sets X and Y, Journal of Music Theory, 45-129. [15] Lewin, D., 1987, Generalized Musical Intervals and Transformations, New Haven, Yale University Press. [16] Jedrzejewski, F., 2006, Mathematical Theory of Music, Editions Delatour/ Ircam-Centre Pompidou. [17] Quinn, I., 2004, A Unified Theory of Chord Quality in Equal Temperaments, Ph.D. dissertation, Eastman School of Music. [18] Mazzola, G., 2003, The Topos of Music, Birkh¨ auser, Basel, 2003. [19] Noll, T., Facts and Counterfacts: Mathematical Contributions to Music-theoretical Knowledge, in Sebastian Bab, et. al. (eds.): Models and Human Reasoning - Bernd Mahr zum 60. Geburtstag. W&T Verlag, Berlin. [20] Rahn, J., Basic Atonal Theory, Longman, New York, 1980. [21] Vuza, D.T., 1991-1992, Supplementaryary Sets and Regular Complementary Unending Canons, in four parts in: Canons. Persp. of New Music, 29:2, 22-49; 30:1, 184-207; 30:2, 102-125; 31:1, 270-305.

Supplementary I: about Maximally Even Sets 5.1

A short history of ME sets

Maximally Even Sets, or ME sets in short, were defined in [8], generalized in [7] and later extended to Well Formed Scales, which exist also in non equal temperaments (see [6]). The name refers to the intuitive feature of being ‘as evenly distributed in the chromatic circle as possible’. As we will see, it is not so easy to make this idea rigorous: many different though equivalent definitions exist, and our main objective in this paper is to ground firmly the notion of ME sets on a DFT-based definition. We include a short paragraph for readers who might still be unfamiliar with the notion, followed by a discussion of several existing definitions. A very thorough paper on state-of-the-art applications of ME sets is [10]. Originally, Clough, Myerson and soon after Douthett observed this yet informal notion of ‘maximal evenness’ in a collection of famous scales: whole tone scale, major scale, pentatonic, octatonic. . . For musicological reasons, and perhaps also because of mathematical difficulties we will mention below, their definition was rather indirect. In the minor scale there are three different values of intervals between consecutive notes. Not so for the major scale, or the melodic (ascending) minor; but the latter features three different fifths. From these examples, and others, ME sets were defined in regard with the different (some say ‘diatonic’) possible values of intervals inside the scale: for instance, the major scale and the pentatonic alike have only two different interval sizes between consecutive notes – tones and semi-tones for the one, tones and minor thirds for the other. Also notice that the two semi-tones in the major scale, for instance, are as far from one another as possible. This has some relevance to the organisation of black and white keys on a keyboard, and hence to traditional musical notation in staves. The common original definition (here reworded) states that Definition 5.1 Let A be a subset of Zc . Let us for convenience’s sake call a ‘second’ any interval between two adjacent elements of A, a ‘third’ an interval between every odd note, and so on. Then A is maximally even if, and only if, there are at most two different kinds of ‘seconds’, ‘thirds’, ‘fourths’ aso. This definition suffers from the common blemish of many formalized musicological definitions, that take for granted many notions with intuitive, musical support (like diatonic intervals, adjacency of notes, etc.) which are not so obvious to define mathematically1 . 1 To

be fair, pre-Hilbert mathematics (and some post-Hilbert, too) often relied too heavily on intuitions of the physical world, as the

alternative title

15

To state it with numbers: if an ordered scale2 is A = {a1 , a2 . . . ad } with indexes taken modulo d and values taken modulo c, for each value of k there should be at most two different values of ai+k − ai when i varies. This was named the ‘Myhill property’ in [8]1 ) and it is not at all straightforward.

Figure 5. All intervals come in two sizes

Worse still, in our opinion, this definition necessitates an ordering, or reordering, of the notes : (C E D G A) is not a ME set, though (C D E G A) is ! This verges on the unsatisfactory, if one is interested in pc-sets and not (ordered) scales. Many geometrical criteria have been given, and proved equivalent (see [10]); we especially like the ‘black and white’ definition in [7], very intuitive though hardly practical (see figure 6): plot two regular polygons, one white with d vertexes and one black with c − d vertexes. Then rearrange all the vertexes, preserving order, with identical distance between consecutive points. Both black and white subsets are ME sets.

mixing two regular polygons

the same rearranged

Figure 6. Rearranging the points of two intertwined regular polygons

The most effective way to actually compute ME sets is as follows: taking c as the cardinality of the ambient chromatic space, d the number of notes of the looked-for set, and α some arbitrary number, the J functions α Jc,d : k 7→

 kc + α  ,k = 0...d − 1 d

quarrel on non-euclidean geometries made clear. 2 We skip a formal definition of ‘ordered’ in Z , which will be useless in our approach. c 1 Note that in general, it is not enough that Myhill property holds for adjacent notes, e.g. having only two kinds of ‘seconds’ does not ensure we have a ME set, as shown by the example of the melodic minor scale.

16

title on some pages

already introduced in [8], give all ME sets with cardinality d by their sets of values α α α Jc,d (0), Jc,d (1), . . . Jc,d (d − 1)

(taken modulo c): for instance with c = 12, d = 5, α = 12 one gets the pentatonic (0 2 4 7 9); but relevance to the intuitive idea of maximum evenness, or even to sizes of intervals, is less than obvious. The P most natural definition might be to try and maximize the mutual distances between all the notes, eg a,a0 ∈A δ(a, a0 ), but the result depends on the chosen distance function δ, and is not satisfactory for the (arguably) most natural one, the interval metric : δ(u, v) = min |u − v + kc| k∈Z

as several unexpected1 extraneous solutions crop up, as in figure 7 . A ‘good’ definition would be expected to give one characteristic shape for a given pair (c, d), not so many. This exemplifies why there is no universal, or obvious, definition for the na¨ıve concept of ‘Evenness’.

Figure 7. Some sets maximizing the sums of distances for the interval metric – c = 15, d = 6

It is because none of these definitions (or others) appears completely satisfactory in our opinion, that we ventured to propose another one. 5.2

Symmetries of ME sets

This is the sequel of subsection 2.6. Corollary 5.2 The number of different ME sets of cardinality d in Zc is c0 = c/ gcd(c, d) (the number of different possible B’s). All are translates of one another (the group of translations acts transitively on ME sets)2 . For each couple (c, d) there is but one translation class of ME sets with d points in Zc . Henceforth we will denote such a ME set class as hc, di. An actual ME set will be ‘a hc, di ME set’. For example there are exactly three different h12, 8i ME sets, i.e.the octatonic scales. Remark 1 Each individual hc, di ME set is invariant under the m translations of step c0 and multiples. We have seen (1.5) that the inversion operation preserves the class of ME sets: this means that the inverse of a ME set is one of its translates. Indeed a ME set is its own image under exactly3 2 × m operations, m translations and m inversions in the dihedral group T/I of transformations of type x 7→ x+τ and x 7→ `−x in Zc . For instance, inversions x 7→ −x, 3 − x, 6 − x, 9 − x preserve the above octatonic.

1 But all strictly convex distance functions on the unit circle will give maximums on the same pc-sets, which are the ME sets, as shown in [12]. Nonetheless, such a distance (like the chordal distance, length of the line segment between two points of the circle) has little musical meaning. 2 Only when m = 1 do we have simple transitivity, i.e. an interval group in the sense of [15]. 3 The stabilizer of any pc-set in T/I, isomorphic to the dihedral group D , is either a cyclic or a dihedral group. For hc, di, it is always c a Dm .

alternative title

17

Supplementary II: pictures and proofs

Figure 8. These two hexachords share intervallic content

On figure 8 with the two complementary hexachords, the fifths have been signaled with arrows. Each hexachord has the same number of fifths, three in this example.

Figure 9. Etude N◦ 5 opus 10, Fr´ ed´ eric Chopin

Proof of prop. 1.6: Proof From Thm. 1.5 we have A is τ −periodic ⇐⇒ ∀t ∈ Zc

FA (t) = e−2iπτ t/c FA (t) ⇐⇒ ∀t ∈ Zc

(1 − e−2iπτ t/c )FA (t) = 0

Unless e−2iπτ t/c = 1, this compels FA (t) to be 0. Now the condition e−2iπτ t/c = 1 is equivalent to c | τ t, i.e. t multiple of m = c/ gcd(c, τ ) – this makes sense for any representative of the residue classes τ and t. This is compatible with reduction modulo c, and means t ∈ m Zc ⊂ Zc . Conversely, if FA is nil except on a subgroup, say m Zc with 0 < m | c in Z (we recall all subgroups of Zc are cyclic) then, by inverse Fourier Transform ∀k ∈ Zc

1A (k) =

1X 1 X 1 0 FA (t)e2iπ k t/c = FA (t0 )e2iπ k t /c = c c 0 c t∈Zc

t ∈m Zc

00

X t00 =1...

FA (m t00 )e2iπ k t

m/c

c m

c c and this is obviously periodic with (the residue class of ) as a period, as each term in the sum is m m periodic.  Proof of prop 2.2:

18

title on some pages

Proof For transposition and inversion it is theorem 1.5. For complementation we see that |FZc \A (c − d)| = |FZc \A (−d)| = | − FA (d)| = |FA (d)| holds for any subset A. So the one value is maximal whenever the other is, e.g. A is a ME set iff Zc \ A is maximally even.  Proof of remark 1, linking he Fourier coefficients of A and its reduction B mod c0 : FA (d) =

X k∈A

e−2iπdk/c =

X m−1 X

e−2iπd(k

00

+` c0 )/c

k00 ∈B `=0

=

X k00 ∈B

e−2iπd k

00

/c

m−1 X `=0

e−2iπ` = m

X

0

e−2iπd

k00 /c0

= m FB (d0 )

k00 ∈B

Supplementary III: about other maximums of Fourier coefficients

When d is coprime with c, generated hc, di ME sets (the Clough-Myerson type) get their maximum Fourier sin(π, d/c) coefficient value in d: kFA k = kFA k∗ = |FA (d)| = µ(c, d) = . sin(π/c) Any generated scale with a generator coprime with c will share the same value of kFA k∗ , as • any ME set A is in affine bijection with any such generated scale, both being affine images of the cluster {0, 1, 2 . . . d − 1}. • If f : x 7→ a x + b, a ∈ Zc0 , is a bijective affine map then kFf (A) k∗ = kFA k∗ , as ∀t ∈ Zc |Ff (A) (t)| = |FA (at)| (the Fourier coefficients are permuted by affine maps). We can reformulate prop. 3.2 in more detail: Proposition 5.3 Fix a cardinality d coprime with c. For all d-element subsets of A ⊂ Zc . we find that kFA k∗ ≤ µ(c, d). With regard to equality the following three conditions are equivalent: (i) kFA k∗ = µ(c, d). (ii) A = r · M (c, d) + s for suitable r ∈ Z∗c and s ∈ Zc and M (c, d) as in Definition 3.1. above. (iii) A = a0 + {0, f, ..., (d − 1)f } is generated by a residue f ∈ Z∗c coprime with c. Proof Choose t ∈ Z∗c such that kFA k∗ = |FA (t)|. Then we have |FA (t)| = |Fd−1 t·A (d)| ≤ µ(c, d). To prove (i) ⇔ (ii) we argue that the equality kFA k∗ = µ(c, d) holds iff d−1 t · A = M (c, d) + s0 or equivalently iff A = t−1 d · M (c, d) + t−1 ds0 . To prove (ii) ⇔ (iii) we remember that M (c, d) = k0 + {0, d−1 , ..., (d − 1)d−1 }, hence A = r · M (c, d) + s = (rk0 + s) + {0, d−1 r, ..., (d − 1)d−1 r}.  When c, d are no longer coprime this is not true anymore. The value of µ(c, d) = |FA (d)| for a hc, di ME set is now m sin(d0 π/c0 )/ sin(π/c0 ) (this comes from thm. 2.8), which is larger than ρ(c, d) = sin(dπ/c)/ sin(π/c) π mπ π because (by concavity) sin 0 = sin ≤ m sin . c c c But in that more general case, and with this value, we can characterize scales generated by some invertible generator (among which the chromatic clusters): this is prop. 3.3, whose proof follows. Proof Choose t0 ∈ Z∗c such that kFA k∗ = |FA (t0 )|. Then we have |FA (t0 )| = |Ft0 A (1)| ≤ µ(c, d) by the huddling lemma in the simple case m = 1. The maximal case is that of a cluster, i.e. t0 A = τ +{0, 1 . . . d−1} is a cluster. Multiplying by f = t−1  0 we get A = a0 + f {0, 1 . . . d − 1}. We do not find a characterization of all generated scales, i.e. also for generators not coprime with c. This is because, for instance, the chunck of whole tone scale A = {0, 2, 4} ⊂ Z12 , generated though certainly not Maximally Even, realizes FA (6) = 3, clearly an unbeatable value (notice |FA (3)| = 1 < 3). In order to understand better the maximality condition for kFA k, it is is useful to inspect the subgroup of Zc which is generated by the intervals of a pitch class set A.

alternative title

chunk of whole tone

19

another pc set with maximal DFT 3

3

1 2 3 4 5 6 7 8 9 10 11

1 2 3 4 5 6 7 8 9 10 11

Figure 10. DFT of (0 2 4) and (0 2 6) modulo 12 share maximal value in 6

Definition 5.4 For any pitch class set A ⊂ Zc let G[A] ⊂ Zc denote the interval group1 of A. It is generated by the differences in A: G[A] := hA − Ai = {r · (k1 − k2 ) | k1 , k2 ∈ A, r ∈ Zc }. One can see that G[A] = h{a0 − k | k ∈ A}i independently of the choice of a0 ∈ A (c.f. [18], p. 125). It will be impossible to reach kFA k = d for a ‘large’ ME set, i.e. when d > c/2, as in general kFA k ≤ min(d, c − d). So we work in the case d ≤ c/2. Theorem 5.5 kFA k = d ⇐⇒ G[A] 6= Zc . Any subgroup of Zc being cyclic, say G[A] = r Zc (taking r minimal); this means A ⊂ a0 + rZc . This can happen if and only if d is lower than some strict divisor c0 = c/r of c (for instance whenever c is even). Proof Assume kFA k P = d. Then |FA (t0 )| = k∈A e−2iπ k t0 /c = d for some t0 6= 0; but from Cauchy-Schwarz inequality’s case of equality, this means that all exponentials, each with length 1, are equal. In other words, multiset t0 A = {d a} is a singleton with multiplicity d (and t0 cannot be invertible). Hence A is a subset of the preimages of a, i.e. A = a0 + ker ϕt0 i.e. G[A] = ker ϕt0 . As we have seen when studying maps ϕd , this kernel is a regular polygon with c0 = c/ gcd(c, t0 ) elements. So Card(A) ≤ c0 , a strict divisor of c. Conversely, assume d ≤ c0 = c/m, a strict divisor of c. Then there are subsets A of c0 Zc with cardinality d, any of which will check |FA (m)| = d. It is notable that in that case, the maximum is reached for members of a subgroup: |FA (t)| = d ⇐⇒ t ∈ m Zc

1 In

a more general context Mazzola [18], p. 125 - 127 calls this the module of a local composition.

20

title on some pages



Notice that, although this includes generated scales, other cases are possible: C = {0, 2, 6} ∈ Z12 also checks FC (6) = 3. This includes the ‘secondary’ and many ternary ‘prototypes’1 in [17], 2.4, as it seems that Quinn had noticed. This class of maximal pc-sets includes generated scales, but is somewhat wider. Now the general question arises: for a given pair (c, d), what are the subsets A ⊂ Zc with cardinality d that yield the maximal value M of all kFA k ? There are three cases: (i) The maximum value is d: this is well understood from the last theorem. It happens whenever d is lower than some strict divisor of c. 0 (ii) The maximum value is the one for ME sets, i.e. m sin πd sin cπ0 . This is very often the case. For instance c0 for c = 12, d = 4 the cluster (0 1 2 3) is not maximal for kFA k: the winner is the h12, 4i ME set (0 3 6 9). (iii) Sometimes the maximum is not of one of the previous types. For instance for c = 75, d = 27 when d is larger than all divisors of c, one gets µ(c, d) = 21.6581 for ME sets or their affine image; the value for clusters or generated scales is lower, ρ(c, d) = 21.6075 (this is general), but for A = {0, 1, 3, 4, 6, 9, 12, 15, 18, 21, 24, 27, 30, 33, 36, 39, 42, 45, 48, 51, 54, 57, 60, 63, 66, 69, 72} √ i.e. 3Zc ∪ {1, 4}, one gets kFA k = 579 = 24.062188. The principle involved is, just as in the huddling lemma but in greater generality, to have for some k the multiset A0 = k A ⊂ Zc as ‘clustered’ as possible [we depart here from the definition of A0 in fig. 1]. Ideally, from the huddling lemma philosophy, one should aim at a few multipoints as close as possible in k Zc , with maximum multiplicities. Let us clarify this, without working out the complete theory. We are working with a subset A with cardinality d, greater than any strict divisor of c, which is an odd number. The maximum value of |FA | is some |FA (k) = FA0 (1)| where A0 is the multiset k A; k is not coprime with c or else we get a previous case, and as permutations of Fourier coefficients are irrelevant, we can assume (up to an affine transform of A) that k is a divisor of c. The kernel of πk : t 7→ k t mod c is c0 Zc with c0 = c/k, it has k elements ; this is the maximum possible multiplicity for a point of A0 . The distance between consecutive points of A0 [in Zc ] will be k, d hence the number of different points in A0 is d0 = d e. All these points will have multiplicity k, except k one on the border with multiplicity d − k d0 . The maximum shall be found among the different subsets obtained in this way, checking on all values of k | c. In the example, A0 has one point (0) with multiplicity k = 25 and another one (25) with multiplicity 2. B 0 has two points, with multiplicity 15 and 12 respectively, and C 0 has 5 points with multiplicity 5 and one with multiplicity 2 [other possible values of k have been left aside]. As it happens, the respective values are kFA k =



√ 909 − 180 5 = 22.5057

q 579 = 24.0624

kFB k =

kFC k = 21.529

In that case, the winner is A, corresponding with the greatest divisor (k = 25). But in other cases, it 2π may pay off to restrict the angular span of the associated multiset – this means that (d0 − 1) 0 is made c as low as possible, by choice of the divisor k of c. For instance, with c = 75, d = 29, the set analogous to B (i.e. one point with maximum multiplicity k = 15 and another one with multiplicity 14) is the winner, as kFA k = 23.2594 < kFB k = 23.4689 and ||FC || = 22.3884. So there is an algorithm, but no hard and fast rule for constructing the subsets with the biggest kFA k. The solutions approximate (affine transforms of) ME sets, add or drop a few points. Maybe these chords, or scales, which generalize ME sets in a way (look at the multisets on fig. 11 ), and are defined modulo the action of the affine group, should be catalogued as for instance the tiling subsets of 1 (0

2 6) mod 10 falls under the last theorem, but not (0 1 2 3 4 5 7 8 9).

alternative title

A

A'

B

B'

21

C

C'

Figure 11. Three candidates for a maximum kFA k.

Zn have been. This is one of many interesting directions for future research on the subject of musically relevant features of the DFT of discrete structures..

Journal of Mathematics and Music Vol. 03, No. 01, February 2009, 1–26

Autosimilar Melodies Emmanuel AMIOT 1 rue du Centre, F 66570 St NAZAIRE, France (v1.0.2 released September 2009) The present work originated from purely musical topics, namely the notion of ‘selfRep melody’ as defined by composer Tom Johnson in [9], and reaped interesting mathematical as well as musical rewards. It is about melodies that contain themselves in augmentation, and some generalizations thereof. Some of the mathematical by-results are new to the best of the author’s knowledge. Applications range from melodies to rhythms, and include some new results on mosaics. Finally, extensions to approximate and ‘non invertible’ autosimilar melodies suggest that this notion is both widespread and universal.

Notations: Zn stands for the cyclic set with n elements, with its group or ring structure if needed. Quite often, calculations make sense both in Zn and Z. When in doubt, consider that a ∈ Zn can be identified with the smallest non negative integer in Z with residue a. Divisibility (usually in Z) is denoted by |: for instance 8 | 4 in Z12 , as 4 = 5 × 8 mod 12. The invertible elements of (Zn , ×) are the generators of the additive group (Zn , +); they form a multiplicative group, Z∗n . Any set might be given by the list of its elements: (0, 3, 5); or by some defining property, e.g. Z∗n = {a ∈ Zn , gcd(a, n) = 1}. The subgroup generated by some element g of a group G is denoted by gr(g). For instance gr(a) = (Zn , +) ⇐⇒ a ∈ Z∗n . A periodic melody M is a map from Zn into some musical space, usually pitches or notes, or equivalently a periodic sequence: ∀k ∈ Z, Mk+n = Mk . So Mk is well defined for k ∈ Zn . The affine group modulo n is the set Aff n of affine bijections in Zn , i.e. x 7→ a x + b for (a, b) ∈ Z∗n × Zn . The order of an element g of a group G is the cardinality of gr(g), i.e. the smallest integer r > 0 with g r = e, the unit element of group G. It is classically characterized by the following equivalence: g k = e ⇐⇒ o(g) is a divisor of k The cardinality of any set G is denoted |G|: e.g. o(g) = | gr(g)|.

Introduction

Symmetries of Zn have been thoroughly explored under the group of translations and inversion (T/I), for instance in American Set Theory. Such transformations are expressed by maps x 7→ ±x + b. But despite the obvious interest of more general affine transforms in Zn , e.g. x 7→ a x + b, much less research has been made on orbits of affine maps, or subgroups of the affine group.1 . This is surprising, as many interesting notions are invariant under affine transformations: interval content (up to permutation), all-interval sets, limited transposition modes, tiling (mosaic) property, series and all-interval series, to name but a few. This paper both presents a mathematical study of orbits of affine maps operating on a cyclic group, and develops a musically interesting notion of autosimilarity, just like famous fractals (the Cantor Set, Koch

Professor in Class Preps, Perpignan, France. Email: [email protected] of course for c = 12, well studied for instance in [12] or [11], but with great loss of generality, as stigmatised in [10][section 11.5.4.2]: for instance there is no element of order greater than 2 in (Z∗12 , ×). I am indebted to a reviewer who mentioned the work of Batstone ( [6]) in the case c = 2n − 1, also well covered by Johnson with the natural multiplier 2 and orbits of length n, see below. 1 Except

Journal of Mathematics and Music c 2009 Taylor & Francis Ltd. ISSN 1745-9737 print / ISSN 1745-9745 online http://www.tandf.co.uk/journals DOI: 10.1080/17459730xxxxxxxxx

2

autosimilar melodies

flake, Sierpinski sponge). Diverse musical renderings are possible; in the simplest, one melody plays within itself contrapuntally (see fig. 2), something the Kantor of Leipzig might have dreamed of. Several instances of such melodies have been identified in classical music. 1

First definitions, historical examples

We begin with the simplest case, when all augmentations begin on the same note. This is historically the case studied by Tom Johnson in [9], though he came across the more general case, with different starting points, which will be studied in section III; further generalizations will occur in the last sections. 1.1

Autosimilar melody with ratio a

Definition 1.1 Let M be a periodic melody with period n: M0 , . . . Mn = M0 , Mn+1 = M1 , . . . wherein the values Mk are musical events (key strokes, for instance) and k is some measure of time. M is autosimilar1 with ratio a iff ∀k ∈ Zn

Ma k = Mk .

This means that taking one note every a beats yields the same melody, only slower; or equivalently that some augmentation of the melody is part of the melody itself, as is obvious on the score below (fig. 1, with a = 3). This explains why the melody has to be infinite. Non-periodic solutions are possible, but this is another subject. 1.2

Musical examples

Figure 1. First bars of ’La Vie Est Si Courte’ by Tom Johnson

Of course, the use of augmentation is quite ancient. J.S. Bach is probably the best known exponent of melodies played simultaneously with their augmentations in numerous fugas; he is also famous for contriving several voices inside one monody (the Suites for solo strings spring to mind). Tom Johnson has discovered this possibility around 1980 (cf. [9]), and is probably the first composer who made use of it so systematically, as in La Vie Est Si Courte (fig. 1: one can see that the left hand voice is the right hand one played thrice slower, and that each note of the former falls in with the same note in the latter), Kientsy Loops, Rational Melodies, or Loops for Orchestra (fig. 13), though – as he acknowledges – a few other contemporary American musicians (David Feldman, Paul Epstein) toyed with it at times. There are some earlier American examples: consider Glen Miller’s famous In the Mood. Ratio 4 autosimilarity is perfectly audible (if one understands it as it is written, i.e. with regular eighth notes, and not as it is played), since one note out of four emerges on each strong beats, probably quite voluntarily on Miller’s part as he studied with the mathematically minded (some say ‘obsessed’) Joseph Schillinger.2 1 We decided to change Tom Johnson’s ‘selfRep’ to ‘autosimilar’, which he himself used in the broad sense of ‘result of some iterated process’, because this is the traditional mathematical meaning, for instance with classical fractals. 2 This was pointed out by T. Johnson. Almost forgotten nowadays, Schillinger taught Miller, Gerschwin and other prominent composers

GGGE[

3

Figure 2. Thema of ’in the Mood’

But it will surprise many readers to realise that much more ancient Western music features autosimilarity: it can be found in Beethoven’s Fifth Symphony, though the ratio 3 autosimilarity is not blatant at all (fig. 4). The ubiquitous Alberti Bass (fig. 3), well known from (for instance) the beginning of Mozart’s Sonata in C major K. 545, is an excellent example, with autosimilarities at ratios 3, 5 and generally every odd number. In Mozart’s first bar, left hand is exactly autosimilar while right hand significantly plays the same three notes. Ratio 4 autosimilarity is even explicit in the first two bars of Scarlatti’s Sonata Kirk. 9 in D minor, as pointed by an anonymous reviewer.

Figure 3. Alberti Bass with augmentation by 3

1.3

Mathematical generation.

Theorem 1.2 Any autosimilar melody with ratio a and period n is built from orbits of the affine map x 7→ a x mod n: denoting the orbit of x as Ox = {ak x

mod n, k ∈ Z} = aZ .x,

for each note p of the melody, the subset of indexes M −1 (p) = {i ∈ Zn , Mi = p} is one such orbit, or a union of several ones. Proof It is sufficient to prove that if Mx = p then Mk = p for all k ∈ Ox , hence every orbit will come in toto for a given note. But this is obvious from the definition, as Mk = Mam x = Mam−1 x = . . . Mx = p. 

A basic fact about orbits is worth recalling here, namely that x ∈ Oy ⇐⇒ y ∈ Ox . In group theory, these orbits are the classes of the action of the cyclic subgroup generated by the map f : x 7→ a x mod n. At this point it seems a good idea to demand that a (or f ) should generate a subgroup, which means that a is coprime with n, or equivalently a ∈ Z∗n . As will be seen below, interesting situations arise when this condition is dropped. But until section V, The ratio a of an autosimilar melody is assumed to be coprime with the period n.

before WW II. Quoting Henry Cowell in his preface to [13], “The idea behind the Schillinger System is simple and inevitable: it undertakes the application of mathematical logic to all the materials of music and to their functions, so that the student may know the unifying principles behind these functions, may grasp the method of analyzing and synthesizing any musical materials that he may find anywhere or may discover for himself, and may perceive how to develop new materials as he feels the need for them.”

4

autosimilar melodies

Example 1.3 The abstract melody generated by ratio 3 modulo 8 has five orbits: 0 is sent to 0 so (0) is one orbit. 1 is sent to 3 and 3 sent to 1, so (1 3) is another one. (4), (5 7), (2 6) are the remaining orbits, hence the general structure, x, y . . . denoting arbitrary pitches, is: xyzytuzuxyzytuzu . . . . The Alberti Bass (cf. fig. 3) has less than five notes, because identical notes are used for different orbits: putting arbitrarily C on 0 and 4, G on odd beats i.e. (1 3) and (5 7), and E on (2 6) we get: C G E G C G E G C G . . . , still autosimilar with ratio 3. Here several orbits have been collapsed on identical notes: z = E, x = t = C, u = y = G. Hence it is necessary to define: Definition 1.4 A primitive autosimilar melody is a melody generated by a ratio a and a modulo n with different notes for different orbits. In other words, there are as many different notes as possible for the given n, a. As will be seen below, several mathematical results will only stand for primitive melodies: obviously the possibility of collapsing all the orbits into as few as one (a one note melody, or even a melody of silences. . . like Cage’s 4’33” !) impairs any attempt at a classification of symmetries.

1.4

The simple case of n prime.

In this paragraph we assume that the period n is a prime number. This is not really necessary for further study, but it helps come to grips with the notion of autosimilar melodies. Proposition 1.5 One orbit has only one note : O0 = (0). All others share the same cardinality, which is the multiplicative order of a: o(a) = |O1 | = |{ak

mod n, k ∈ Z}| = min{k > 0, ak = 1

mod n}

Proof The orbit of 1 is exactly the subgroup of Zn ∗ generated by a, e.g. all different powers of a mod n: hence |O1 | = o(a). Let x 6= 0, now the map y 7→ y x is one-to-one (as x must be invertible, Zn being a field when n is prime) and maps precisely O1 onto Ox : hence |Ox | = |O1 | = o(a).  n−1 . o(a) Musically it is a natural idea to put a rest (or silence) on the singleton 0, as Tom Johnson does in many instances. There is another simple result, given in [7] for n prime, but both true and simpler in the general case: This is the one case where the number of different notes in the melody is easily computed, i.e. 1 +

Proposition 1.6 For any period n > 1, the ‘melody’ xyyyyyyy . . . xyyyyyy . . . is autosimilar1 for any ratio a (coprime with n). This is obvious: x stands on the orbit of 0, and the y’s are just on the union of all other orbits, whatever the value of a. Of course, such a melody (with one single note repeated on n − 1 beats out of n) seems a little simplistic. Still the following example (fig. 4) will sound familiar to most readers (from mes. 256 sqq) and it is autosimilar with n = 4, a = 3.

1.5

Some figures.

In the case of x 7→ a x mod n where a is no longer prime, we can give a few explicit formulas. As will be proved in the next section, in the most general case these formulas remain valid about half of the time.

1 But

it is not primitive in general.

GGGE[

5

Figure 4. Beethovenian autosimilarity

1.5.1 Number of occurences of one note. Some special cases are easy: O0 always has a single element, and O1 is the multiplicative subgroup generated by a, i.e. the set of powers of a, and its cardinality is equal to the order o(a) of a. This is exactly what happened for n prime. The group Z∗n however, though abelian, is fairly complicated. In particular, the maximal order of any element a ∈ Z∗n , that is to say the largest possible number of occurences of one note in a n−periodic primitive autosimilar melody, is given by Carmichael’s function Λ.1 Also, even for simple a’s, for instance for a = p prime, the lengths of orbits are by no mean easy to compute.2 This comes from a new behaviour: contrariwise to the n prime case, the map t7→x t

O1 3 ak 7−→ x ak ∈ Ox is no longer one to one. Proposition 1.7 The length of any orbit, i.e. the number of occurences of a given note in a primitive autosimilar melody of ratio a and period n, is a divisor of o(a). Proof In short, f acts on every Ox as a circular permutation.



It is helpful to visualise (fig. 5) all these orbits as little clocks of different sizes, ticking at different speeds, with at least one great clock whose size is a multiple of all others. Each multiplication by a (mod n) ticks every clock, and after a whole ‘day’, e.g. after o(a) ticks, all clocks must have resumed their initial positions. This is the substance of the above proposition. The perception of an autosimilar melody is then explained as an aural illusion: multiplying by a, i.e. picking one note every a beat, completely rearranges the order of all the notes inside, but as the different onsets of a given note belong to the same orbit, we assume that we hear the same note at that moment. 1 0

3

7

14

12

11

6

5 2

16

4 8

10

13

20

17 19

Figure 5. Several clocks ticking together: n = 21, a = 2

The length of the orbit of a given x is given exactly by: 1 The Carmichael function Λ verifies Λ(pα q β . . . ) = lcm[Λ(pα ), Λ(q β ), . . . ] with Λ(pα ) = Φ(pα ) = (p−1)pα−1 except when p = 2 < α. See http://mathworld.wolfram.com/CarmichaelFunction.html for details. 2 The orbits (x, p x, p2 x . . . ) are called cyclotomic orbits, their lengths are the degrees of the irreducible factors of X n − 1 in the ring of polynomials on the field with p elements, see [1] for a musical application to a species of rhythmic canons.

6

autosimilar melodies

Proposition 1.8 Let d = gcd(x, n); the length of Ox = (x, a x, a2 x, . . . ) is the order of a modulo n/d, i.e. the smallest integer k > 0 with ak = 1 mod n/d. In particular, Ox is of maximal length whenever x and n are coprime. Proof Let us begin with a particular case: Lemma 1.9 If gcd(y, m) = 1 then the length of the orbit of y in Zm is exactly the order of a (mod m). Proof The map Ψy is one-to-one and maps O1 to Oy .



The general case follows by considering the orbit of x as a part of the cyclic subgroup x Zn = d Zn , where d = gcd(x, n), which is isomorphic to Zm , m = n/d where the orbit Ox ⊂ Zn is mapped onto Ox/d ⊂ Zm for the map y 7→ (a/d)y ∈ Zm : therein the lemma applies.  We draw the reader’s attention to the fact that the automorphisms of the additive group (Zn , +), which are the x 7→ b x with b ∈ Zn ∗ , permute these maximal orbits. Indeed they permute all orbits, preserving their sizes.

1.5.2

Number of single notes. A last particular case is that of one note orbits, i.e. single notes, i.e.

fixed points of the map x 7→ a x: Ox = {x} ⇐⇒ a x = x ⇐⇒ (a − 1)x = 0

(mod n).

This means exactly that x contains the prime factors of n that are missing in a − 1. For instance, say a = 4 and n = 15: such x’s are simply the multiples of 5. Hence Proposition 1.10 The number of single notes in a primitive autosimilar melody of ratio a and period n is gcd(a − 1, n). They are the multiples of n/ gcd(a − 1, n). This will come as a special case of Prop. 2.14. Looking for an autosimilar melody with ratio 3 and period 8, we can thus predict gcd(3 − 1, 8) = 2 singletons, and indeed 0 and 4 are the only fixed points of the map x 7→ 3x (mod 8) (both are note C in the Mozart example). This result will be generalized in the following section. Tom Johnson conjectured that the total number of different notes in a melody with period n is at most 3n/4, as happens for the melody in fig. 6 (n = 8, a = 5, 6 different notes):

Figure 6. Melody with many different notes

This follows from the last proposition, even in the most general case (see Thm. 2.16).

2

Extension to general affine automorphisms

A more general case, especially from an aural point of view, is the action of any affine automorphism. Practically, the following definition means that by extracting one note every a notes in the melody, one hears the same melody, though perhaps with a different starting point (namely b) – but this is surely irrelevant mathematically, as periodic melodies do not have a starting point.

GGGE[

7

Definition 2.1 Let M be a periodic melody with period n. M is autosimilar with ratio a and offset b iff ∀k ∈ Zn

Ma k+b = Mk .

An example is the following common rhythmic beat, which is autosimilar with ratio 3 and offset 1:

Figure 7. Autosimilarity with offset

Theorem 2.2 Any autosimilar melody of ratio a, period n, and offset b is built up from orbits of the affine map x 7→ a x + b (mod n). The proof is identical to that of Thm. 1.2.1 Remark 1 This new, more general setting, includes the case a = 1 with melodies invariant under x 7→ x+τ , i.e. maps with a period smaller than n. Each orbit, and hence each preimage M −1 (p) = {k, Mk = p} is then a Limited Transposition Subset of Zn . We will henceforth exclude this case and assume a 6= 1.2 For instance, the Kientsy Loops 3 melody G F E D E F G D G F E D E F G D G F E. . . can be viewed as generated by x 7→ 3x + 6 (mod 8) if we set origin at G=0. It can be viewed more simply as generated by x 7→ 3 x if we decide that the consecutive F, E are labelled 0, 1 instead of 1, 2. This ambivalence will be elucidated below.

2.1

Orbit lengths

Lemma 2.3 The order of map f : x 7→ a x + b (mod n) (e.g. the size of the subgroup gr(f ) generated by f in Aff n ) is: o(f ) = min k > 0 such that gcd(a − 1, b) (1 + a + . . . ak−1 ) = 0

(mod n)

(2)

Proof Easily from formula f k (x) = f ◦ f ◦ . . . f (x) = ak x + b (1 + a + . . . ak−1 )

(3) 

In practice, compute the ‘missing factor’ mf = n/ gcd(a − 1, b, n), and look up the first number 1 + a + . . . ak−1 that is a multiple of mf .

1

The mathematical standpoint would be here to define an action of Aff n on the set of maps M : Zn → (pcs) by f • M = M ◦ f . setting of affine maps modulo n might be unfamiliar to many readers, and a few reminders may be useful. The main point is to distinguish between the monoid of general affine maps, and the group of affine transformations, which are one-to-one maps; these last are exactly the x 7→ a x + b (mod n) with gcd(a, n) = 1. Their group Aff n is a semi-direct product of its translation subgroup (all x 7→ x + b), isomorphic to the group Zn , and its homotheties subgroup (all x 7→ a x, gcd(a, n) = 1) which is isomorphic to Z∗n ; Aff n is not abelian and several open problems remain about its structure. [10] is justified in demanding that the exact sequence 2 The

0 → (Zn , +) → (Aff n , ◦) → (Z∗n , ×) → 1 (ES) (which is another way of expressing that Aff n = 3 CD Pogus productions, P21033-2, 2004.

Z∗n

n Zn ) be taken into account; but it does not explain all that follows.

(1)

8

autosimilar melodies

Proposition 2.4 o(f ) is a multiple of o(a), and a divisor of the smallest integer s satisfying 1 + a + a2 + . . . as−1 = 0 We leave the proof to the reader. All these numbers are identical for instance when a − 1 is coprime with n, as then 1 + a + a2 + . . . as−1 = 0 ⇐⇒ (1 − a)(1 + a + a2 + . . . as−1 ) = 0 ⇐⇒ 1 − as = 0 ⇐⇒ as = 1 A technical result brings in more precision: Proposition 2.5 Let τ be the number of translations in gr(f ) where f : x 7→ a x+b: then τ = n/ gcd(k, n) and o(f )/o(a) = τ . Proof Straightforward from the exact short sequence 0 −→ k Zn ≈ Zτ ≈ gr(x 7→ x + k) −→ gr(f )

(x7→a x+b)→a

−→

gr(a) ⊂ Z∗n −→ 1,

which mimicks the exact sequence 0 → (Zn , +) → (Aff n , ◦) → (Z∗n , ×) → 1.



This means heuristically that if a has many (o(a)) different powers, then the melody will have few (τ ) periods. Example 2.6 : consider map f : x 7→ 3 x + 1 (mod 8). Then f ◦ f (x) = 3(3 x + 1) + 1 = 9x + 4 = x + 4 (mod 8) hence f 4 (x) = x (mod 8), τ = 2 = o(a) and o(f ) = 4, as predicted. As in section I, we get Proposition 2.7 The length of any orbit is a divisor of o(f ). The metaphor of the clocks (fig. 5) is the same as in the case b = 0: all smaller clocks must have looped to initial position when a ‘day’ is spent, that is to say when f has been iterated a number of times that equals it to identity.1 This means that the number of occurences of a given note divides o(f ) – but this stands only if the melody is primitive: random reunions of orbits would of course play havoc with this result. Surprisingly, one result from the easy case b = 0 remains valid: 2.2

Orbits with maximal length.

Theorem 2.8 There exists at least one orbit with length exactly o(f ). Consequently, o(f ) ≤ n. This2 is NOT obvious, as • the group of all affine automorphisms has cardinality n Φ(n) and is non commutative;3 a subgroup (like the one generated by f ) of such a finite group might well have more than n elements; in general, the order of a general permutation of n objects may be much greater than n: French composer • ´ made use of this when he translated twelve tone rows into permutations of 12 objects, J. Barraque and generated up to 60 series from a single one in this way.4 The general formula is that the order of a map that permutes n objects is the lowest common multiple of the cardinalities of its orbits, which is usually more than the greatest among these cardinalities. 1 This is a special case of a general result in group action theory: cardinals of orbits of a finite group divide the cardinality of the group, and more precisely the quotient is the cardinality of the subgroup fixing some given element of the orbit. Here this subgroup is gr(f ). 2 o(f ) = n for instance when f (x) = x + b, b ∈ Z∗ . These maps are conjugates of the basic translation x 7→ x + 1 in Aff . It happens n n also, surprisingly, for non translations, like x 7→ 5 x + 1 (mod 8) or x 7→ 16 x + b (mod 45), gcd(b, 45) = 1. These maps are related to circulant graphs, cf. [15]. 3 Except for n = 2; here Φ denotes Euler’s totient function. 4 A permutation with cycles (= orbits) of lengths 3, 4 and 5 has order 60.

GGGE[

9

Proof We need Dirichlet’s famous theorem on arithmetical sequences: In any sequence {v, u + v, . . . k u + v, . . . } with gcd(u, v) = 1, there exists an infinity of prime numbers. a−1 b Let α = gcd(a − 1, b) and u = , v = : u, v are coprime integers, hence we can produce some large α α prime p = u x0 + v > n in the sequence above, and: Lemma 2.9 There exists x0 with p = u x0 + v =

a−1 b x0 + invertible modulo n. α α

We then compute the length of Ox0 :  f k (x0 ) = x0 ⇐⇒ 0Zn = (a−1)x0 +b (1+a+. . . ak−1 ) = (u x0 +v)α(1+a+. . . ak−1 ) ⇐⇒ α(1+a+. . . ak−1 ) = 0 As seen in Lemma 2.3, this implies that o(f ) is a divisor of k, which completes the proof.



Example 2.10 n = 10, a = 3, b = 4. We compute α = gcd(a − 1, b) = 2. Also r = o(f ) = 4 as α (1 + 3 + 9 + 27) = 0 (mod 10). And indeed there is one orbit of length 4, O0 = (0, 4, 6, 2). Other orbits like O3 or O1 have lengths 1, 2 or 4.

2.3

Unexpected lengths.

Example 2.11 : Sometimes, orbit lengths appear unrelated to the order of a. For instance, though 72 = 1 (mod 12), the orbits of x 7→ 7 x + 2 mod 12 have length 3 or 6 (this last being the order of f ).1 On the other hand, not all divisors of o(f ) are lengths of orbits, just as not any divisor of the order of a group corresponds to a subgroup. Still a composer might wish to repeat some note a given number of times, and so try and find a map f ∈ Aff n with appropriate order. For instance, by Cauchy’s Lemma, there exists an element of order p in any group whose cardinality is divisible by p, hence if p is a prime factor of n or Φ(n), there is an element of f ∈ Aff n with order o(f ) = p. More generally, any result on the order of elements of group Aff n , e.g. Sylow theorems and their like,2 can be interpreted as a result on lengths of orbits.3

2.4

Orbits with one element.

The shortest orbits are given by fixed points of the affine map. There is a nice geometric characterization:

2.4.1

Fixed points are for homotheties.

Theorem 2.12 Any autosimilar melody with ratio a and offset b admitting at least one lone note is generated by a homothety x 7→ a x (mod n) for some a – if this lone note is chosen as the origin 0 on Zn . In algebraic terms this means that the map is a conjugate of a homothety. This means that, at least musically, more than half of all autosimilar melodies belong to the simple case we studied in the first place. We have already observed this behaviour with the melody of Kientsy Loops above. Geometrically this is obvious, if one is willing to convey his or her intuition of affine maps into Zn : if f fixes z ∈ Zn , then as f is affine it is completely determined by the value of f (z + 1) = f (z) + a. But the 1 The

classification of these lengths for c = 12 apparently goes back to [14]. Johnson advocated that these textbook theorems on finite groups be applied to the context of autosimilar melodies./ 3 For instance, if n = 2v(2) pv(p) q v(q) . . . , it could be shown that there exists an element of Z∗ with order pv(p) q v(q) . . . 2v(2)−2 , or any n divisor of this. This maximal value is called Λ(n), see note on Carmichael’s function above. See also Sloane’s integer sequence A046790. 2 Tom

10

autosimilar melodies

homothety hz,a with center z and ratio a gives the same values in z, z + 1, so hz,a = f . There is also a numerical test, that the reader may check with a direct computation: Theorem 2.13 f is a homothety up to a change of origin iff f (x) = a x + b with b a multiple of a − 1 in Zn (if b is to be read as a true integer in N, this reads as “ b must be a multiple of gcd(a − 1, n)”). It is worthy of note that • if f is a homothety (i.e. admits some fixed point) then o(f ) = o(a), but • the converse is not true: map x 7→ 3 x + 1 (mod 10) has no fixed point at all but is of order 4, just the same as its ratio: 34 = 81 = 1 (mod 10) and 3(3 x + 1) + 1 = 9 x + 4 = 4 − x (mod 10), 4 − (4 − x) = x. Two orbits have length 4, and the other has length 2.

2.4.2 Number of fixed points. Contrarily to our intuition in planar geometry, an affine map mod n may well have several fixed points, e.g. ‘centers’.

Proposition 2.14 Let d = gcd(a − 1, n): if d | b (in N) then we get d fixed points. Else there is none. Proof x0 is a fixed point ⇐⇒ (a − 1)x0 = −b (mod n). If d = 1, then a − 1 is invertible, and x0 = (a − 1)−1 b is the only possible fixed point. If d divides a − 1 and n but not b, we get an impossibility. Assume d does divide b : b = k d: the equation now reads (a − 1)x0 = b (mod n) ⇐⇒

a−1 b x0 = d d

(mod

n ), d

a−1 n and are coprime, we get one solution modulo n/d, that is to say d solutions modulo n.  d d So a homothety might have different centers, that is to say an autosimilar melody can be related to the simplest case in more ways than one. Musically this enables to render the autosimilarity on different circular permutations of the initial melody.

and as

2.4.3

Number of homotheties. From theorem 2.13 above we can easily compute the number of homo-

theties in Aff n , as it is a simple matter to enumerate all acceptable b’s for a given a, which are all multiples of gcd(n, a − 1): Proposition 2.15 The number of homotheties in Aff n , identity map excluded, is given by formula Nhom (n) =

X 2≤a≤n−1 gcd(a,n)=1

n gcd(n, a − 1)

Its maximum value is achieved when n is prime, as for all values of a, gcd(n, a − 1) = 1 and hence Nhom (n) = n(n − 2) = (n − 1)2 − 1, among n2 − n affine maps. By contrast, Nhom (30) = 63 only; and almost one affine map out of 3 is a homothety when n is a power of 2. It seems that 4, 6 and 12 are the only values of n with Nhom (n) < n. The proportion of homotheties among general affine maps, depending mostly on the factorisation of n, is erratic, cf. fig. 8: On average and for practical purposes, the proportion of homotheties in Aff n is around 57% for n ≤ 200. 2.5

Number of different notes

The question of the maximal possible number of different notes (that is to say the number of orbits) for a map f not equal to identity was answered in the simpler case b = 0. The following result states that the

GGGE[

11

1.0

0.8

0.6

0.4

10

20

30

40

50

Figure 8. Proportion of homotheties in Aff n .

simpler case is also the general one. We leave the proof to the reader (or Online Supplementary I). Theorem 2.16 The maximum number of different notes for an autosimilar melody with period n is 3n/4, which is reached exactly when n = 4k, a = 2k + 1 and b is 0 or n/2. In general, the total number of notes (or orbites) varies wildly with the modulo and ratio. There is a formula, making use of stabilizer groups and the celebrated ‘Lemma that is not Burnside’s ’ of group theory and combinatorics, but it is computationally more efficient just to compute all orbits and enumerate them. Here it is, wherein X(g) is the number of fixed points of g ∈ Aff n (computed from Prop. 2.14): ( dk if dk | b(1 + a + . . . ak−1 ) k k Proposition 2.17 Let r = o(f ), dk = gcd(a − 1, n) and X(f ) = . 0 if not The total number of notes, i.e. of orbits of f , i.e. of the group G = gr(f ) ⊂ Aff n , is X g∈G

r  1X X(f k ) X(g) |G| = r k=1

Here is a plot (fig. 9) with the mean value of the number of different notes for any given n, mean taken on all ratios a > 1 coprime with n and all possible offsets b.

15

10

5

20

40

60

Figure 9. Average number of notes

80

12

autosimilar melodies

These computations enable to compute a fairly reasonable1 value of the probability for a melody to be [primitive] autosimilar, namely the number of partitions of Zn into affine orbits, over the number of all partitions (e.g. 2n ). This probability decreases quickly, for n = 20 it is p = 0.000084877 and for n = 72, with only 480 partitions into affine orbits, the probability is negligible (≈ 10−19 ). This shows that autosimilar melodies are highly organised material, and that autosimilarity is a significant feature. 3

Other symmetries

We will remain in the more general context of affine automorphisms x 7→ a x + b, not only homotheties. 3.1

Symmetry group

Definition 3.1 The symmetry group of a (periodic) melody M is the subgroup of Aff n containing all maps g satisfying M ◦ g = M , that is to say ∀k Mg(k) = Mk . One says that g stabilizes M . This generalizes Johnson’s remark that a melody invariant under two ratios is also invariant under their product. Two extreme examples are a melody that is not autosimilar, meaning its symmetry group contains only the identity map; and the melody with only one note, which has the whole group Aff n for symmetries. The Alberti bass C G E G C G E G . . . admits all odd ratios for autosimilarity, and more precisely its symmetry group is made of eight distinct maps mod 8 (this is an abelian group): x 7→ x, 3x, 5x, 7x, x + 4, 3x + 4, 5x + 4, 7x + 4 As any autosimilar melody is built up from some map f ∈ Aff n , it is obvious that any f k stabilises the melody. Indeed this means exactly that the melody is autosimilar under map f . The reverse is partially true: Theorem 3.2 Let M be a primitive autosimilar melody generated by map f : x 7→ a x. Then any homothety g ∈ Aff n , e.g. g(x) = c x that stabilises M , is a power of f , e.g. ∃k g = f k , i.e. c = ak . Maps g(x) = c x where c is not a power of a permute the orbits, that is to say stabilises the rhythmic structure of the melody, while exchanging its notes. Proof Assume g(x) = c x stabilises M . In particular, the orbit O1 which contains powers of a is globally invariant under g, meaning g(1) = c ∈ O1 is some power of a. If c is not a power of a, as we have seen already, maps of the kind x 7→ c x turn Ox into Oc x .  This means, quite significantly, that in considering only the simpler affine maps (homotheties), only the obvious symmetries will occur. The picture is of course different in the whole affine group, and we do not have a general result. Of course, nothing can be said when the melody is not primitive, since collapsing some orbits together will increase the symmetry group. Apart from the Alberti Bass, we quote below (fig. 13) one page of the score of Loops for Orchestra by Tom Johnson, wherein the melody admits several different ratios. The result stands of course for an affine map that is a homothety, up to a change of origin – the most frequent occurence as we have seen. Remark 1 One could also look for the larger subgroup of Aff n preserving the set structure of orbits – meaning that exchanges of notes are allowed. In the case of the theorem above we fall back on the whole group of homotheties, isomorphic to Z∗n . In the more general case, the situation can be less simple: for instance the map x 7→ 3x + 1 (mod 8) (cf. Fig. 7) yields the melody CCGGCCGGCCGGCCGG. . . which admits 8 symmetries, like the Alberti 1 There are many different ways to define a probability space on melodies, and about as many different probability values. The order of magnitude of the result stands, however, regardless of the chosen probabilized space.

GGGE[

13

bass: x 7→ x, x + 4, 3x + 1, 3x + 5, 5x, 5x + 4, 7x + 1, 7x + 5 Complicated symmetry groups are possible (the last one, often called H8 , is not abelian). As all powers of f are in the symmetry group, we can at least predict from Lagrange’s theorem that Lemma 3.3 The order of the group of symmetries of M is a multiple of o(f ). It is interesting for composers, and maybe analysts alike, to find a melody with a given symmetry group. For instance one may wish to find an 8-periodic melody, palindromic, and autosimilar with ratio 3. Hence the orbit of 1 must contain −1 = 7 (for palindromicity); as it contains 3, 5 = −3 is there too. Hence O1 contains all odd numbers. Acting similarly with the remaining residue classes, one finds the primitive solution O1 = (1, 3, 5, 7), O2 = (2, 6) with 4 and 8 standing alone as fixed points. A rendering of this unique solution is the Alberti Bass. This leads to the most general definition so far, which indeed should be the starting point for the study of melodies invariant under some affine maps: Definition 3.4 An autosimilar melody M with period n and symmetry group G ⊂ Aff n is any map M : Zn → (some pitch set) that satisfies ∀f ∈ G

∀k Mf (k) = Mk

Theorem 3.5 Such a melody is built from the orbits of G, i.e. each pitch appears on indexes that are a union of orbits Ox = {f (x), f ∈ G}. Algorithmically speaking, one usually wishes to consider only some symmetries in G. An orbit will be produced by repeatedly applying the given affine maps, starting with a given seed, until no new number is produced.1 This last definition reduces to the previous one when the group of symmetries is cyclic, generated by just one map. It must be pointed out that the group of symmetries eventually achieved is usually larger than the group one starts from; not any odd group is the symmetry group of some object: for instance modulo 8, this Klein group K = {x 7→ x, x 7→ 3x + 1, x 7→ x + 4, x 7→ 3x + 5} is not the symmetry group of a melody: its orbits are (0, 1, 4, 5), (2, 3, 6, 7), and the symmetry group of any melody built up from these [say CCGGCCGG. . . ] is strictly larger (for instance it contains x 7→ 5x + 4), with 8 elements. Remark 2 Musically speaking, for such an autosimilar melody with a non cyclic group of affine symmetries, it is possible to extract the melody from itself at different ratios. A similar situation will arise in the last section.

3.2

Palindroms

Now we can clarify when a given autosimilar melody will be a palindrome, as this means exactly that x 7→ −x is an element of the group G of symmetries. The answer is obvious when G is generated by ha : x 7→ a x, as we have seen that the symmetries must be powers of ha :

1 The underlying idea is that: any orbit is a fixed point of the action of any set of generators of G on the set of all subsets of Z . This n was implemented in OpenMusic, cf. [3].

14

autosimilar melodies

Theorem 3.6 A primitive autosimilar melody M with ratio a, period n and offset 0, will be palindromic ⇐⇒ some power of a is equal to −1 (mod n). The question of whether -1 is a square modulo n (a quadratic residue) is familiar in number theory, but the concept of -1 being a power residue appears to be novel. The sequence of moduli n admitting such a possibility: 5, 7, 9, 10, 11, 13, 14, 17, 18, 19, 21, 22, 23, 25, 26, 27, 28, 29, 31, 33. . . has been added to Sloane’s online encyclopedy of integer sequences under number A126949.1 It is a rather common occurence. For instance 19 belongs to the sequence because 109 = −1 (mod 19). Again, this stands only for primitive melodies: it is always possible to build a palindromic (autosimilar) melody from any autosimilar melody, by setting identical notes on pairs of orbits Ox and O−x , e.g. turning C G E G B A E A. . . into the Alberti bass. What of a melody autosimilar with offset ? The infinite melody A A B B A A B B . . . is only a palindrom up to an offset of the origin. Here is a sufficient condition: Theorem 3.7 If M is a primitive autosimilar melody generated by f : x 7→ ax+b (mod n); if some power of a is equal to −1 (mod n), then M will be palindromic up to some offset. Proof Assume that ar = −1. Then f r (x) = −x + c for some c and hence Mk = Mf r (k) = Mc−k , i.e. M is palindromic for some starting point.  The reverse, unfortunately, is false when the map is not a homothety: no power of 3 equals -1 modulo 8, though x 7→ 3x + 1 generates a palindromic melody with offset. And for some pairs (a, n), no value of b will allow x 7→ a x + b to generate a palindrom, for instance x 7→ 8x + b (mod 15).

4

Autosimilarity and tilings

This is about some mosaics, or tilings, which are deduced from some autosimilar melodies. Most of this section had to be moved to the Online Supplementary in order to save space.

4.1

Autosimilar tesselations

The problem of tesselating Zn is an ancient and difficult one (see [1, 4, 8]). It can be asked whether an autosimilar melody tesselates Zn , meaning that all orbits are translates of one another. Example 4.1 All maps of form x 7→ x + b will give some tesselation (with only one orbit when b ∈ Z∗n ). A less trivial case: 7x + 7 (mod 12) has two orbits in Z12 , (0 3 4 7 8 11) and (1 2 5 6 9 10), which make up a tiling. It is rather difficult to meet the tight requirements for an autosimilar melody to be a tiling: the orbits must be not only the same size, but also the same shape. Also the last example shows why tiles will often be periodic themselves (i.e. all invariant under some same translation): if some power of the map f is a translation x 7→ x + τ , then all orbits must be τ −periodic. We have only a very partial result: Theorem 4.2 A (primitive) melody autosimilar with ratio a 6= 1 and period n > 4 gives a tiling of Zn by translations of a 2-tile iff n = 4k, a = 1 + 2k, b = ±k with k odd. Remark 1 It is easier to build tiles with unions of orbits of an affine map but we have no general result. Indeed the question of tiling vs autosimilarity arose when Tom Johnson found (0, 1, 3, 7, 9), which tiles Z20 by translation and also with ratio 3.

1 http://www.research.att.com/

njas/sequences/A126949

GGGE[

4.2

15

Tilings with augmentations

In the simplest case n prime, b = 0, we get tilings of Z∗n with augmentations, as any orbit except O0 = (0) is an augmentation of O1 : Ox = xO1 . For instance, (1 2 4) and its augmentation (3 6 12) tile together Z∗7 as (3 6 12)=(3 5 6) mod 7. But there is a better way to obtain a whole family of tilings with particular affine maps. But the tiles will no longer be the orbits: on the contrary they will be sets transverse to them. Lemma 4.3 Any autosimilar melody whose orbits share the same length enables to build tilings with augmentation. Proof Consider any set transverse with the orbits, i.e. X containing one point and only one from each orbit. Then X, f (X), . . . f r−1 (X) partition Zn , i.e. X tiles with augmentations a X + b a.s.o.  Example 4.4 All the orbits of f : x 7→ 13 x + 3 (mod 20) have length 4: (0 2 3 9), (1 6 11 16), (4 15 17 18), (5 7 8 14) and (10 12 13 19). Take for instance the first elements: X =(0 1 4 5 10). Applying f yields all following members of each orbit: f (X) = (3 16 15 8 13). Iteration of the process gives a mosaic, where all motives are images of the preceding one by the map f . Notice that one can choose any starting element in each orbit. For this to happen, all orbits must share the same length. A discussion of this condition is enclosed in Online Supplementary I.

5

Approximate autosimilarity

In a way, autosimilarity in a (periodic) melody is a special form of redundancy: as we have seen by now, autosimilarity is an aural illusion, where identical notes are identified though lying in fact in different positions in the original melody and in its augmentation. It is a legitimate question to ask for approximate autosimilarity: what if some melody is autosimilar except for a few notes ? With which ratio ? It turns out that this can be investigated with a simple and fast algorithm, and also that such relaxed autosimilarity appears surprisingly often in the corpus of classical music.

5.1

Algorithm

Let M be some melody with period n. We define the periodic augmentations of M as the a M + b in symbolic notation, meaning here the sequences (Ma k+b (mod n) )k∈N . As seen above, M is autosimilar iff a M + b = M for some a, b. We can compute a correlation coefficient between all a M + b and M itself by checking the proportion of notes that are the same – technically it is a comparison of circular lists, or circlists, between M and a M . Checking for maximum on b, then a, allows to find the best candidate for R autosimilarity. Here is an implementation in Mathematica . Comparison of circlists uses a trick: Union is applied to pairs {Mk , Ma k+b }; if it gives a singleton, there is coincidence. correl[melo_, a_]:= Module[{n=Length[melo], meloBis}, (* local variables *) meloBis = Table[melo[[Mod[a*(k+decalage)-1 , n]+1]], {k,n},{decalage, n}]; (* these are the alternate melodies a*M + decalage *) Max[(Count[Length /@ (Union /@ Transpose[{melo, #}]), 1])& /@ meloBis]/n] For instance, trying this function on a modified Alberti bass: Table[correl[{C, G, E, A, C, G, E, G},k], {k, {3,5,7}}]  yields the correlation coefficients 34 , 1, 34 . So though 3 is no longer a ratio for autosimilarity, 5 still is.

16

5.2

autosimilar melodies

Example

It is fairly obvious that no autosimilarity will be found when all notes are different – the melody cannot be broken down into orbits in that case. But with repeated rythmic motives involving repeated notes, approximate autosimilarity may well be found. The first melodic sentence of Beethoven’s Fifth exhibits very good autosimilarity when cut down to 12 notes: G, G, G, E[, A[, A[, A[, G, E[, E[, E[, C has a correlation coefficient of 5/6 for x 7→ 7 x + 6. Musically this means that only two pcs are not identical in the augmented version. These alien pcs have been signaled as chords together with the ‘expected’ note on the score fig. 10 (notice also the octave identification for E[’s).

Figure 10. A famous almost autosimilar melody

With a little bad faith, strong approximate autosimilarity could be found widely in classical or Jazz music, as shown by this very first try. It is also part of the routines looking for ‘interesting melodies’ in the OMax software for improvisation developed in Ircam.

6

About general affine maps (not one to one)

Most of this section also had to be transferred to Online Supplementary II.

6.1

Definition

The condition that the ratio a be invertible modulo n may seem a little artificial, a contrivance in order to allow the mathematical tools to come in. Actually the initial definition can work well with any ratio (not zero), as for instance melody D, G, F, G, D, G, F, G, D, G, F, G, D, G, F, G, D, G, F, G, D, G, F, G . . . with period 24 is certainly autosimilar with ratio 3, though 3 is not coprime with 24. So we have to consider what happens when iterating an affine map that is not bijective. There is a very pleasant theorem, establishing autosimilar melodies as universal objects.

GGGE[

17

Theorem 6.1 The iteration of any affine map f modulo n (not one to one) eventually reduces to iterating an affine transformation on some subset of Zn . Musically, this means that one hears an autosimilar melody after several augmentations of any periodic melody. Mathematically, it means that the submelody  p f f ◦ (f q ) = M f for some p, q. p M = M ◦ (f ) = Mf (k) k∈Z is autosimilar under some power of f : M Example 6.2 Consider this seemingly random sequence of 36 notes as a periodic melody:

D, C, G, G, B, F, A, B, F, F ], B, E, B, B, G, F ], F ], C, E, C, C, E, E, E, F ], F ], E, A, C, E, E, E, D, F, F ], E, (D, C, G . The two first iterations of map x 7→ 3x − 1 (mod 36), that is to say picking one note out of three starting with the second, yield successively C, B, B, B, B, F ], C, E, F ], C, E, F ], C, B, B, B, B, F ], C, E, F ], C, E, F ], C, B, B, B, B . . . B, B, E, E, B, B, E, E, B, B, E, E, B, B, E, E, B, B, E, E, B, B, E, E, B, B, E, E, . . . the last of which is periodic and autosimilar: further iterations of the same transform will yield the same melody. We notice that several notes have disappeared, and that the ultimate period is smaller than 36. The algorithm that enables to construct such an ultimately autosimilar melody is straightforward: Definition 6.3 We generalise the definition of orbits to the attractor of x: Ax = {f k (x) | k ≥ p) (where p is defined in thm. 6.1). It is the part of the sequence f k (x) that loops (beware ! usually x ∈ / Ax . . . ). Now it only remains to make sure that, as in the preceding theorems about building autosimilar melodies, all notes with indexes in the same Ax are identical. In the above example, we have two attractors, A = (5, 14) and B = (23, 32). The initially completely random melody M was modified by setting M14 = M5 = B, M23 = M32 = E. All other notes are irrelevant. Musical applications could involve extracting a simple, autosimilar beat, from a complex melody. Another nice application is to arrange the initial melody in order to support several extractions of ultimately autosimilar melodies. For instance, E, F ], B, G, C, G, F ], G, E, A, F ], F ], C, C, B, G, F, G, C, G, F ], G, G, F ], A, F, G, G, E, F ], F ], G, F, G, F, B . . . gives two autosimilar melodies when augmented by 2 or by 3 by applying the same trick as above, both to the attractors of x 7→ 3 x + 1 and those of x 7→ 2 x. It is plainly visible on the ‘score’ below that two (simple) autosimilar melodies emerge (the initial melody is the middle voice).

Figure 11. Two attractors for one melody

Remark 1 What remains after m iterations of f on the original melody is not necessarily invariant under f itself, but as proved in the supplementary, it is always invariant under some f q . In other words, it has

18

autosimilar melodies

at most q ‘alternate melodies’ (under iteration of f ). Though in theory one might stumble on the case f q = id (for instance if the original melody has n distinct notes!), in practice one frequently finds some non trivial attractor. In this sense, autosimilar melodies are exactly the attractors of any affine map operating on any initial (periodic) melody, thus reaching the elated status of universal object.

7

Perspectives

7.1

More symmetries

Other generalizations are of course possible. Uncharacteristically, Tom Johnson put forward in [9] a false conjecture, refuted by Feldman ( [7]), that hints at transformations of the pitch- or time-space more general than inversion or retrogradation. The conjecture was: A related melody [= an augmentation of the original melody] produced by playing a melodic loop [= a periodic melody] at some ratio other than 1:1, can never be the inversion of the original loop, unless it is also a retrograde of the original loop.

The melodies satisfying this conjecture can be formalized and generalized in the following way: Definition 7.1 Let G be some finite order transformation of the pitch (classes) domain, and f ∈ Aff n . We define a melody M0 , M1 , Mn = M0 with period n autosimilar under f , with respect to G, by the condition ∀k ∈ Zn Mf (k) = G(Mk ). We state without proof that this occurs whenever (Mk ) is built from the iteration of g on the orbits of f: ∀x ∈ Zn , ∀k ∈ Z, Mf k (x) = Gk (Mx ). Also, for this to happen, the order of G must divide all the orbit lengths. David Feldman, who cast the first shrewd mathematical look on these melodies (he used some himself as a composer) yet unfortunately only published one page in [7] about them, explains why Johnson’s conjecture will be true in most cases, and provides a counterexample with period 15. Inversion is G(m) = −m, but other operators are possible: a reviewer suggested G(m) = m + 3 (mod 12) [on length 4 orbits]. Feldman’s example is similar to the following: take a = 2, n = 15 and fill in the ordered orbits (1 2 4 8), (3 6 12 9), (5 10), (7 14 13 11) with alternate opposite values of one note (0 is C, 1 is C], 2 is B, a.s.o.), we get by construction Mf (k) = −Mk ∀k, see fig. [?] with the inverted elements of orbits in blue:

Figure 12. One note out of two gives inversion, not retrograde

The ratio that retrogrades. The above suggests looking for the retrograde among the augmentations of a melody. While composing an electronic piece, Orion, we found (C D E C D F C D G C D E . . . ), autosimilar with period 9, ratio 4 and offset 6: picking every odd note turned the melody into its retrograde (up to offsetting): (C E D C G D C F D C E D C . . . ), i.e. M2k+1 = M8−k . As it happens, this is a general phenomenon: 7.1.1

GGGE[

19

Proposition 7.2 Let M be an autosimilar melody with ratio a and any offset; put r = −a−1 (mod n); then picking one note every r yields the retrograde −M (up to some offset). n−1 This is particularily audible when r = 2, i.e. when a = (for odd n). 2 In musical terms, this means that any autosimilar melody has an augmentation equal to one of its retrogradations. Inverse-retrograde symmetry. Johnson’s conjecture mentions melodies whose inverse IS the retrograde. These can be build from an autosimilar melody with a symmetry between its orbits, setting opposite notes on symmetric orbits: then the retrograde of the melody will be its inversion. It is uncommon to find autosimilar (primitive) structures without such a symmetry (this is related to Johnson’s conjecture): it is mandatory for instance when b = 0. But 4x + 1 (mod 21) does the trick, as its orbits (0, 1, 5), (2, 9, 16), (3, 11, 13), (4, 6, 17), (7, 8, 12), (10, 18, 20), (14, 15, 19) exhibit no inversional symmetry whatsoever. We have a condition ensuring that such retrogradation symmetries between orbits do exist:

7.1.2

Theorem 7.3 Assume a − 1 divides 2b, 2b = c(a − 1); then all orbits are permuted by the symmetry x 7→ −c − x, i.e. ∀x ∈ Z/nZ

O−x−c = −c − Ox

(some orbits may be self-invariant under this symmetry). Proof to be found in the Online Supplementary I. 7.2

Other spaces

Further perspectives include the use of spaces other than pitch and time. The full group Aff 12 would provide, on the one hand, sequences of series derived from a seminal one (not unlike Jean Barraqu´e’s S´eries prolif´erantes) and on the other hand, series with interesting symmetries when the sequence turns out to be shorter than expected. This has been studied, notably for f : x 7→ −x + b (e.g. retrogradations), for instance in the ancient [2], with enumeration and construction of such series. But more general affine transforms may be of interest for composers, especially with n 6= 12.

Acknowledgements

First and foremost I must thank composer Tom Johnson for his pioneering work on the subject and the wonderful music he managed to create out of this basically simple idea. I am also grateful to Gerard Assayag who introduced me to the notion on an informal occasion, and later raised the fine question of detecting approximate autosimilarity. Carlos Agon implemented all this in OpenMusic T M , while Moreno Andreatta helped clarify a number of delicate points. I have received precious and learned advice from anonymous reviewers. I owe them several interesting additional references.

References [1] Amiot, E., Why Rhythmic Canons are Interesting, in: E. Lluis-Puebla, G. Mazzola et T. Noll (eds.), Perspectives of Mathematical and Computer-Aided Music Theory, EpOs, 190–209, Universit¨ at Osnabr¨ uck, 2004. [2] Amiot, E., La s´ erie dod´ ecaphonique et ses sym´ etries (1994), Quadrature, 19, Ed. du Choix, Marseille. Online version: http://pagesperso-orange.fr/chuckydoo/SeriesSym/index.html [3] Amiot, E., Agon, C., Andreatta, M., Implementation of autosimilar melodies in OpenMusic (2007), ICMC acts. [4] Andreatta, M., M´ ethodes alg´ ebriques en musique et musicologie du XXe sicle : aspects th´ eoriques, analytiques et compositionnels (2003), Ph.D. dissertation, EHESS. [5] Andreatta, M., Agon, C., Vuza, D.T., Analyse et impl´ ementation de certaines techniques compositionnelles chez Anatol Vieru, in Actes des Journ´ ees dInformatique Musicale, Marseille, (2002), pp. 167-176 [6] Batstone, Philip. Multiple Order Functions in Twelve-Tone Music. (1972) Perspectives of New Music 10(2); 11(1). [7] Feldman, D., Self-Similar melodies, in Leonardo Music Journal, (1998) 8:80-84.

20

autosimilar melodies

[8] Fripertinger, H., Tiling Problems in Music Theory in in: E. Lluis-Puebla, G. Mazzola et T. Noll (eds.), Perspectives of Mathematical and Computer-Aided Music Theory, EpOs, 153–168, Universit¨ at Osnabr¨ uck, 2004. [9] Johnson, T., Self-Similar melodies, (1996), Two-Eighteen Press, NY. [10] Mazzola, G., et alli, Topos of Music (2002), Birkha¨ user. [11] Morris, R., Composition With Pitch Classes: A Theory of Compositional Design, (1987), New Haven, Yale University Press. [12] Rahn, J., Basic Atonal Theory, (1980), Longman, New York. [13] Schillinger, J.,The Schillinger System of Composition, (1946), Carl Fischer Inc, New York [14] Starr, D., Morris, R., A General Theory of Combinatoriality and the Aggregate, (1977-78) Perspectives of New Music 16(1) [15] Weisstein, Eric W. Circulant Graph., from MathWorld–A Wolfram Web Resource. http://mathworld.wolfram.com/CirculantGraph.html

œ &b ! ‰ Œ 52

Ó

Œ

Ó

Œ

Ó

Œ

& b !œ‰ Œ

Ó

Œ

Cl.

&

Ó

Œ

B. Cl.

&

Fl. 1

Fl. 2

Ob. 1

Ob. 2

Bsn. 1

Bsn. 2

œ &b ! ‰ Œ œ &b ! ‰ Œ # ! ‰ Œ œ # Ó

Œ

?b

Œ

œ œ ! ! Œ

Ó

Ó

Ó

Ó

Ó

Ó

œ œ ! ! Œ

Ó

Ó

œ. œ. Ó

Ó

œ. œ. œ. œ. œ. œ.

œ. œ œ. œ. œ. œ. .

"

?b Ó

œ. œ.

Ó

Œ



Ó

Œ



Ó

Œ



!œ!œŒ

Ó

Œ



!œ!œŒ

Ó

Œ

œ œ ! ! Œ

Ó

"

"

Ó œ. œ œ. œ. œ. œ. .

Ó

Ó

œ. œ. œ. œ. œ. œ.

Œ

Ó

‰ œ. œ. ‰ Œ



Ó

œ!‰ ‰ !œ Œ

‰ œ!Œ

!œ‰ Œ

œ!‰ ‰ !œŒ

Hrn. 2

&

‰ !œŒ



œ!‰ ‰ !œ Œ



!œ‰ Œ

œ!‰ ‰ !œŒ

Trp. 1

&b Ó

!œ‰ Œ

Trp. 2

&b

Trb. 1

Trb. 2

Tb.

Perc. 1 Perc. 2

1 Vn. 2

Vla.

Vcl.

Cb.

"

?b

"

÷ ÷

œ.

"



œ.

‰ !œŒ

œœœœœœ

"

Ó

"

‰ œ ‰ ‰ œ ‰ œ ‰ Ó œ. . . .

"

"

‰ œ!Œ

!œ‰ Œ

"

œ!‰ ‰ !œ Œ

Œ

‰ Ó

œœœœœœ‰ Ó

" ‰ !œœœœœ œ!‰ Œ

?b Ó ?b

Ó

" ‰ œ!Œ

! œœ œœ!Œ œ œ "

Œ

!œœœœœœ!Œ "

Ó

!œ‰ Œ

œ. "



œ.

œ!‰ ‰ !œŒ

‰ œ . œ. œ. œ. œ. œ. œ. ‰ œ!Œ

Ó



Ó

œ



"

Ó



Ó

‰ œœœœœœ

Ó



‰ œ!Œ

"

"

"

"

"

&b

"

"

"

"

"

œœœœ!œœœœœœ! Œ

‰ !œœœœœœ!œœ œœœœŒ

Œ

œœœœœœ

" Ó

52

Œ

œœœœœœ

‰ œ ‰ ‰ ‰ œj œ. . . œ.

&b

B b œœœ!œœœœœœ‰ Œ

œœœœœœ œœœœœœ

œ. œ. œ. œ. œ. œ. ‰ œœœœœœ

Ó

!œ‰ Œ

‰ ! œœ œ œ!‰ Œ œ œ

œ. œ.

Œ

‰ œ!Œ



œ œ ‰ œœ œœ



‰ !œŒ

œ

œœœœœœ

‰ Œ

&



œ. œ.

‰ Œ



œ œ ‰ œœ œœ

Hrn. 1

œ

œ. œ.

‰ Œ

‰ Œ

"

Œ œ. œ. œ. œ. œ. œ.

œ. œ.

œœœœ œ œ!œœœœœœ ! œ œ œ œ œ œ

? b œ. œ. œ. œ. œ. ‰ œ. œ. œ. œ. œ. œ. ‰ œ. œ. œ. œ. œ. œ. ‰ œ. œ. œ. œ. œ. œ. ‰ œ. œ. œ. œ. œ. œ. ‰ œ. œ. œ. œ œ œ œ œ œ t b œ. ‰ œ. ‰ œ. ‰ œ. ‰ œ. ‰ œ. ‰ Œ

. œ. ‰ œ. ‰ œ. ‰ œ. ‰ œ ‰ œ. ‰ Œ

Figure 13. Loops10 for Orchestra

. . . œ. ‰ œ ‰ œ ‰ œ. ‰ œ. ‰ œ ‰

GGGE[

21

Online Supplementary I 7.3

Proof of Thm. 2.16

The theorem states that the maximum number of orbits (and hence of different notes in the melody) is 3n/4. Proof Consider some autosimilar melody with period n generated by map f : x 7→ a x + b. Obviously, for the number of orbits to be maximal, their sizes must be minimal. Rejecting the case f = id, this means that there are as many one note orbits (i.e. fixed points) as possible, the rest being arranged in two note orbits. But from Prop. 2.14, the number of fixed points is the gcd of b, a − 1, n, and thus we can do no better than a − 1 = b = n/2 (with n even). n/2 points remain; in order to arrange them by two note orbits n/2 must be even also. So necessarily n = 4k, b = 2k, a = 2k + 1. Now we just have to check the converse: for such n, a, b there are n/2 fixed points: f (x) = x ⇐⇒ (2k + 1)x + 2k = x ⇐⇒ 2k(x + 1) = 0

(mod 4k) ⇐⇒ x is odd

and the other points (even values of x) come in pair orbits : x, f (x) = (2k + 1)x + 2k as then x 6= f (x) and f (f (x)) = (2k + 1)[(2k + 1)x + 2k] + 2k = 4k((k + 1)x + 1) + x = x

(mod n)

We have n/2 orbits with 1 element and n/4 orbits with two elements, which totals 3n/4 different notes. 

7.4

Tesselations with autosimilarity

7.4.1

Proof of Thm. 4.2. The theorem characterized autosimilar melodies that tile by translation with

a 2-tile. Proof It is easy to check that the given condition provides 2k orbits with two elements, as f : x 7→ (2k + 1)x ± k has order 2: f (f (x)) = (4k 2 + 4k + 1)x ± k(1 + 2k + 1) = x ± 2k(k + 1) = x as k s odd and 4k = 0 and f (x) − x = 2k x ± k is equal to ±k when x is even, and to 2k ± k = ∓k (mod 4k) when x is odd: so all orbits, being pairs with equal diameter, are translates of one another. Conversely, let us assume that f has order two: f 2 = id i.e. a2 = 1 and b(1 + a) = b + a b = 0. If (as assumed) O0 = (0, b) is a translate of O1 = (1, a + b), then both pairs have same diameter: either b − 0 = a + b − 1 or b − 0 = 1 − (a + b). The first case is forbidden as a 6= 1. So a + 2b = 1. We must now consider O2 = {2, 2 a + b} (unless 2 is a member of O1 or O2 , which case is easily excluded) : either 2 a + b − 2 = b − 0 or 2 a + b − 2 = 0 − b, i.e. 2a + 2b = 2 which would imply again (substracting a + 2b = 1) a = 1. Only the former case is possible: hence 2a = 2 which is allowed only if a = n2 + 1. Then 2b = 1 − a = n2 , implying that n must be a multiple of 4. Finally n = 4k, a = 2k + 1 and 2(b + k) = 0 (mod n) i.e. b = ±k. Moreover k must be odd, or else b(1 + a) = ±2k(k + 1) 6= 0 (mod n = 4k).  Going from one orbit to the next is like braiding a girdle, as the first note of one orbit is translated to the last note of the next, and vice versa.

7.4.2

Tilings with augmentations. The main text has stated that

Any autosimilar melody whose orbits share the same length enables to build tilings with augmentation.

Under this condition, a tile is just any set with one note exactly in each orbit.

22

autosimilar melodies

Now we would like to know when this can happen. We have no simple arithmetic characterization, but a few interesting conditions. Notice that a − 1 is not allowed to divide b (in Zn ) – which excludes a − 1 being coprime with n in Z, or b = 0 – or else we have fixed points, by Prop. 2.14. Lemma 7.4 All orbits have the same length whenever the smallest orbit has length (some multiple of ) o(a). Proof Let x0 belong to the smallest orbit with length m: ((a − 1)x0 + b)(1 + a + . . . am−1 ) = 0 and ∀x, ((a − 1)x + b)(1 + a + . . . ar−1 ) = 0 ⇒ r ≥ m All orbits will share the same length m iff r = m works, i.e. ∀x

0 = 0−0 = ((a−1)x+b)(1+a+. . . am−1 )−((a−1)x0 +b)(1+a+. . . am−1 ) = (a−1)(x−x0 )(1+a+. . . am−1 )

As (for x = x0 + 1) (a − 1)(1 + a + . . . am−1 ) = am − 1 = 0 iff m is a multiple of o(a), and ((a − 1)x0 + b)(1 + a + . . . am−1 ) = 0 by assumption, this works. Reverse implication: if all orbits share the same length m, we know that this length is the order of f , which is always a multiple of o(a).  Computationally, Theorem 7.5 All orbits will have the same length m ⇐⇒ ∀x 

((a − 1)x + b)(1 + a + . . . am−1 ) = 0



 o(a) | m

that is to say one cannot have ((a − 1)x + b)(1 + a + . . . am−1 ) = 0 without o(a) dividing m. Proof Assume all orbits have the same length m; from the Lemma above, that length is a multiple of o(a). The length of Ox is the smallest r such that ar x + b (1 + a + . . . ar−1 ) = x ⇐⇒ ((a − 1)x + b) (1 + a + . . . ar−1 ) = 0 By assumption, this r is a multiple of o(a). Hence ar = 1. Hence also b (1 + a + . . . ar−1 ) = 0. Now for any m > 0 with ((a − 1)x + b) (1 + a + . . . am−1 ) = 0 this means f m (x) = x and m is a period of the restriction of f to Ox . As seen previously, this means that m is a multiple of r, length of Ox : again am = akr = (ar )k = 1 i.e. o(a) | m. Reverse implication: assume that condition ((a − 1)x + b) (1 + a + . . . am−1 ) = 0 always implies that am = 1, i.e. o(a) | m. This means literally that all orbit lengths m are multiples of o(a); by the lemma above, it proves that all orbits have the same length.  There is little hope of simplifying this condition: one has to look into the sequence 1 + a + . . . am−1 (m varies from 1 to some divisor of o(f )) for factors c common with n, and look for arithmetic sequences (b + x(a − 1)) (x from 0 to n/ gcd(n, a − 1)) that do NOT provide the missing factors n/c. In the last example, the only possible case was with m = 2, 1 + a = 14, common factor 2: one had to find arithmetic sequences with ratio 12, where no term is a multiple of 20/2 = 10. Example 7.6 For instance, for f : x 7→ 13 x+3 (mod 20), the sequence of the 1+a+. . . am−1 takes values 1, 14, 3, 0 cyclically. The order of a = 13 is 4 mod 20. For b = 3, one computes b+x(a−1) = 3, 15, 7, 19, 11, neither of which gives 0 when multiplied by 1, 14 or 3. So the condition is verified, as it is for any odd b. But for (say) b = 2, it does not work (|O4 | = 2). The sequence (12 x + 2)x=0...4 contains 10 (for x = 4), and this enables ((a − 1)x + b) (1 + a + . . . am−1 ) = 0 for m = 2 < 4, i.e. an orbit of length 2 instead of 4.

GGGE[

23

The smallest odd value of n satisfying this condition is: n = 21, with a = 4. Remark 1 When equal length orbits are longer than o(a), it means that o(f ) > o(a). In that case, all orbits will be periodic, as they will be invariant under f o(a) , which must be a translation as f o(a) (x) = ao(a) x + · · · = x + . . . (not x + 0 by assumption). For instance with f : x 7→ 3 x + 1

(mod 8)

O0 = (0, 1, 4, 5) O2 = (2, 3, 6, 7)

f 2 (x) = x + 4

But such periodicities of orbits cannot happen when o(a) = o(f ), as we have seen with x 7→ 13 x + 3 (mod 20). Remark 2 Say a = −1 for some even n = 2k and b = 2k + 1: f : x 7→ 2k + 1 − x (mod n) is a map with all orbits of length 2. Barring those ‘trivial’ solutions, the first values of (n, a) giving such tilings are (with adequate values for b) (8, 3)

(8, 5)

(12, 5)

(12, 7)

(16, 2k + 1)

(18, 7)

(18, 13)

(20, 9)

(20, 11)

(20, 13) . . .

Some other families of solutions could be devised likewise, e.g. when n = 4k, a = 2k±1, f : x 7→ (2k±1)x+1 has orbits of length four, and provides a tiling. But musically (following Tom Johnson’s advice) it is better to keep to small values of a, so we won’t pursue this line.

7.5 7.5.1

Multiple symmetries A false conjecture. This was the conjecture stated in [9]:

A related melody produced by playing a melodic loop [= a periodic melody] at some ratio other than 1:1, can never be the inversion of the original loop, unless it is also a retrograde of the original loop.

What Tom Johnson means by ‘related melody’ is just some f [M ] = (Mf (k) )k∈Zn ; an autosimilar melody is precisely a melody M that is equal to one of its related melodies. Here we are looking for periodic melodies satisfying a condition Mf (k) = p − Mk

∀k ∈ Zn

(where p is some constant)

For this to happen, we need the musical space wherein M takes its values to possess some minimal algebraic structure, which is usually true in most models (eg pc-space). The conjecture states that the above condition implies ∀k M−k = Mf (k) .

(4)

Feldman shrewdly points out that Tom’s conjecture will be true when n is prime [and f is homothetic] and provides a counterexample with period 15. Let us have a closer look. The inversion condition implies that M itself is autosimilar under f 2 , as ∀k

 Mf 2 (k) = p − Mf (k) = p − p − Mk = Mk

As the inversion acts on the orbits of f , they must all have even cardinality: let us consider the simpler case f (x) = a x, say note 1 is pitch x, then note a is pitch p − x, note a2 is pitch x again, a.s.o. What we want to avoid in order to disprove the conjecture is −1 ∈ O1 , as then the melody would be invariant under x 7→ −a x. As seen above, -1 is often a power residue (this explains Johnson’s error) and, for instance when n is prime, if a is of even order 2k, then −1 = ak as ak 6= 1 is solution of X 2 = 1 in the field Zn , where this equation has only two solutions ±1 (this is Feldman’s argument).

24

autosimilar melodies

But in Z15 for instance, X 2 = 1 has other solutions (eg 4); taking a = 2, n = 15 and filling in the ordered orbits (1 2 4 8), (3 6 12 9), (5 10), (7 14 13 11) with alternate opposite values of one note (0 is C, 1 is C], 2 is B, a.s.o.), we get by construction Mf (k) = −Mk ∀k, close to Feldman’s example.

7.5.2

r=

Proof of Thm. 7.2. Proof Consider an autosimilar melody generated by f : x 7→ a x + b and let

−a−1 ,

which is coprime with n; hence the sequence M0 , Mr , M2r , . . .

contains all the notes of the sequence M0 , M1 , . . . though in a different order. We know by construction that ∀x, Ma x+b = Mx . Hence (putting y = a x + b) ∀y, My = M−r y+c ⇐⇒ Mr y = Md−y for some offsets c, d. This is what we endeavoured to prove: that some augmentation of the melody is one of its retrogrades. 

7.5.3 Inverse-retrograde symmetry. The last situation is about melodies whose inverse IS the retrograde (like in Tom Johnson’s conjecture). For instance, with f : x 7→ 3x + 1 mod 26: see fig. 14.

Figure 14. Autosimilar melody (ratio 3) with inverse-retrograde symmetry

It can be seen, and even better, heard, that O0 (the B flat’s) and O8 (the C’s) (resp. O2 and O3 ) are retrogrades one of another. This allows a pretty rendition of the melody, setting opposite notes for symmetric orbits: then the retrograde of the melody will be its inversion, as seen on figure 14 (the symmetry axis for pitches is around F). It is somewhat difficult in fact, to construct an example of an autosimilar (primitive) structure without such a symmetry (this is akin to Johnson’s conjecture). For one thing, if f is a homothety (recall this happens whenever a − 1 | b in Zn , not only when b = 0), then x 7→ −x permutes the orbits, as any other homothety does. Also if some power of a is equal to c − 1, we get directly a palindrom. Still, an autosimilar melody built from 4x + 1 mod 21 does the trick, as its orbits (0, 1, 5), (2, 9, 16), (3, 11, 13), (4, 6, 17), (7, 8, 12), (10, 18, 20), (14, 15, 19) exhibit no inversional symmetry whatsoever. We have given in the main text a condition ensuring that such retrogradation symmetries between orbits exist: Thm. 7.3. Here is its proof. Proof We assume that 2b = c(a − 1) and consider symmetry S : x 7→ −c − x. The theorem states that S acts on the set of all orbits, i.e. the symmetric of any orbit is some orbit, i.e. for any x, S(Ox ) = OS(x) . Recall Ox = {x, f (x), f 2 (x), . . . } where f (x) = a x + b; it is sufficient to notice that f ◦ S = S ◦ f , i.e. f (S(x)) = a (−x − c) + b = −a x + b − a c = −a x − b − c = −c − (a x + b) = S(f (x))

GGGE[

25

as a c − b = b + c by hypothesis. From there we get immediately S(f k (x)) = f k (S(x)) and hence S(Ox ) ⊂ OS(x) . By symmetry (reasoning on S −1 which is none other than S itself !) the inclusion is an equality.  These examples open a new alley for future research, combining inner symmetries (the autosimilarity) of a melody with outer symmetries (e.g. inversion), using some structural features of the space of musical events.

8

Online Supplementary II: about general affine maps

Here we consider what happens when iterating an affine map that is not bijective.

8.1

Universal property

Theorem 6.1, establishes autosimilar melodies as universal objects. Musically this means that one hears an autosimilar melody after several augmentations of any periodic melody. The iteration of any affine map f modulo n (not one to one) eventually reduces to iterating an affine transformation on some subset of Zn .  f = f p (M ) = Mf p (k) is autosimilar by some power of Mathematically, it means that the submelody M k∈Z f] = M f for some p, q > 0. f : f q [M

Proof The set (algebraically, a monoid) of all affine maps modulo n is finite. Thus the sequence of powers of f will only take a limited number of different values. So there must exist two different exponents p, p + q with f p = f p+q . Now for any r > p, f r+q = f (p+q)+(r−p) = f p+q ◦ f r−p = f p ◦ f r−p = f p+(r−p) = f r We have just shown that the sequence of powers of f is ultimately periodic. So is for any x ∈ Zn , the sequence f k (x). This means that after p iterations of f , any further iteration of f q will preserve the sequence. 

8.2

A Fitting ending

We will round up this last theorem with a more detailed explanation in the simpler case of homotheties, which links this result with the abstract Fitting Lemma already connected with several musicological situations (Anatol Vieru’s iteration of the difference operator, [5]).1 A connection to the general case is that the ultimate period of f ∈ Aff n : x 7→ a x + b is a multiple of the ultimate period of its linear part f~ : x 7→ a x. Let us consider this map x 7→ a x mod n. First we will assume for simplicity’s sake that gcd(a, n) = p is a prime factor. This means n = pm q where q is coprime with p. Now x 7→ a x maps Zn into the cyclic subgroup of index p, namely p Zn , isomorphic with Zpm−1 q . After m iterations we are working in pm Zn , cyclic subgroup of Zn isomorphic with Zq . There x 7→ a x is one-to-one, at long last. Proposition 8.1 The attractors Ax = {ak x, k ≥ m} are the orbits of fe : x 7→ a x operating on Z/qZ, identified to subgroup pm (Z/nZ).

1 It is worth noticing that orbits, for homotheties, or their difference sets, for general affine maps, are exactly the eigenvectors of Vieru’s difference operator acting on subsets of Zn :

∆(x, a x, a2 x . . . ) = (a x − x, a2 x − a x, . . . ) = (a − 1)(x, a x, a2 x . . . )

26

autosimilar melodies

At this juncture, everything is like in section I: f cycles around the Ax , generating an autosimilar melody. In a more general setting, this is a case of the Fitting Lemma, a very abstract result on decomposition of modules in commutative algebra: Theorem 8.2 Let p1 , . . . pr be the prime factors belonging to both a and n: m` mr 1 a = pm 1 . . . pr . . . p` (` ≥ r)

n = pn1 1 . . . pnr r × Q = P × Q, with gcd(P, Q) = 1

then the sequence (ak x)k∈N is ultimately periodic, from at least the rank m verifying (n/Q) | am , i.e. the smallest integer exceeding all ratios ni /mi . n The periodic parts of this sequence, i.e. the attractors Ax = {ak x, k > m}, partition the sub-group Zn Q of Zn , isomorphic with ZQ . Proof We use the Chinese Remainder Theorem: the ring Zn is isomorphic with the ring product ZP × ZQ (meaning essentially that any residue class modulo n is well and truly determined by its residues modulo P and modulo Q). Thus any (affine) map in Zn can be decomposed into two (affine) components on ZP and ZQ : if x ∈ Zn corresponds to (y, z) ∈ ZP × ZQ then f (x) corresponds to (fb(y), fe(z)) where fb(y) = f (x) mod P, fe(z) = f (x) mod Q. Consider map f : x 7→ a x ∈ Zn : as am = 0 mod P , we have fbm = 0 (the null map), i.e. fb is nilpotent; conversely, as a is coprime with Q, the other component fe is one to one. After k ≥ m iterations, f k reduces to (fbk , fek ) = (0, fek ) and we are back to section I.  Remark 1 The ultimate period, q, is the order of a in Z∗Q . Example 8.3 Take f : x 7→ 10 x in Z84 . Here P = 4, Q = 21. The projections of f are fb(y) = 10y (mod 4) = 2y (mod 4), fe(z) = 10y (mod 21)). We get fb2 (y) = 0, but fe cycles on length 7 orbits. Hence after two rounds, we get an autosimilar melody, with each note repeated 7 times. For instance, iterating f on 1 yields 1, 10, 16, 76, 4, 40, 64, 52, 16, 76, 4, 40, . . . corresponding to the iterates of fb : 1, 2, 0, 0, 0, 0 . . . and of fe : 1, 10, 16, 13, 4, 19, 1, 10, 16, 13, 4, 19, 1, 10, . . .

AUTHOR: AMIOT Emmanuel TITLE: Discrete Fourier Transform and Bach’s Good Temperament KEYWORDS: Temperament, tuning, Fourier Transform, Lehman, J.S. Bach, Wohl Temperierte Klavier. Emmanuel Amiot Prof. in CPGE, Perpignan. 1, rue du Centre F 66570 St Nazaire [email protected] ABSTRACT: The statement by Bradley Lehman that the scribble at the beginning of the first page of WTC shows how J.S. Bach tuned his harpsichord is much disputed. The use of a mathematical and rather abstract characterization of major scales puts forward a quality of the Lehman temperament that singles it out among all competing temperaments, thereby sustaining his claim. Accompanying files: 2gammes.pdf, program.pdf, huddling.pdf, minors.pdf, tableauMSS.pdf, wtc.gif, algo.pdf, heptagon.pdf, justFifth.wav, shortFifth.wav, mediumFifth.wav, NearestHeptagons.mov. Introduction 0.1. Lehman’s hypothesis. In two papers ([6, 7]) published in 2005, Bradley Lehman introduced the view that the recipe for the long lost temperament of Johann Sebastian Bach, had in fact been lying for all to see – not unlike Poe’s Purloined Letter – as a scribbling on the front page of the autograph edition of Das Wohltemperirte Clavier, the ‘Well Tempered Clavier’ (henceforth abbreviated as WTC). The two papers are downloadable here. As Lehman’s own learned comparisons with many previously known tunings make clear, this is a vexed question, and his ‘discovery’ aroused a number of refutations, on various grounds. Lehman’s homepage is accessible by clicking here, with abundant discussions, and links. Here is a short summary of his interpretation of picture 1.

Figure 1. Bach’s diagram on the first page of WTC. Let us recall the gist of the problem of tuning. Twelve just fifths (frequency ratio 3/2) amount to seven octaves plus a Pythagorean comma. Using eleven just fifths leaves a ‘wolf’, e.g. one ugly fifth, and all tonalities featuring this fifth will sound wrong. The abstract solution is equal temperament, wherein all fifths are reduced by one twelfth of a comma, but then all intervals are out of tune, and all scales sound (equally) disharmonious. The problem of tuning thus consists of adjusting with different fifth sizes, aiming at a temperament wherein all tonalities sound well. This is exactly the meaning of ‘Wohl Temperirte’ as Bach explains it on the first page of WTC. According to Lehman, the picture before the text (fig. 1) gives the directions for such a temperament. First the picture must be turned over; now consider all those loops as directives on how to tune successive fifths, beginning with F-C. The small inner loops represent nudges, slight moves of the tuning-pin.1 There are either 2, 0 or 1 nudges. The total is 13 nudges (=2+2+2+2+2+0+0+0+1+1+1), suggesting that each nudge should be one thirteenth of the Pythagorean comma2 in order to get round the circle of fifths smoothly. Eventually, the 1 2

Counterclockwise, i.e. decreasing the size of the fifth. Lehman uses one twelfth of a comma, which is indistinguishable in practice. 1

2

circle of fifths begins with five short fifths (like numerous generalized meantone temperaments), carries on with three pure fifths and ends with intermediate-size fifths (click for the sound files). It is fairly simple to realize in practice, in accordance with the well-known fact (or legend) that Bach tuned a harpsichord in a quarter of an hour. Lehman made a movie showing the tuning of an octave on YouTube, and accessible here. The three different sizes of fifths are hard to distinguish when played alone, Lehman’s videos are much more explicative. 0.2. Why it is unprovable. . . The unsolvable problem of tuning is well understood since Ptolemaios at least: twelve just fifths are slightly in excess of seven octaves, (3/2)12 ≈ 129.75 > 27 = 128, and more generally, there is no way any number of fifths can equal some number of octaves, as the equation (3/2)n = 2p admits no solutions in integers n, p > 0. Fiddling with the sizes of fifths introduces problems with other ‘pure’ intervals, like the major third, that should ideally be close to 5/4. There can be no ideal solution, since a number of different properties are desirable, competing and vying with one another. Hence the musicological debate on the quality of Lehman’s temperament (henceforth called LT) might go on for ever, as proponents of any other temperament will put forward (usually in good faith) diverse qualities,3 often sporting personal preferences instead of facts (see for instance the acerbic [9] and its refutation by Lehman). 0.3. . . . or is it ? We need some objective quality to assess a temperament, preferably addressing the whole collection of major (and minor) scales – as Bach did, allowing arbitrary modulation in the composition and play, e.g. tuning the harpsichord once and for all before playing through the 24 tonalities in WTC. The present paper puts forward a geometric quality of temperaments, measured with a single number (the Musical Sameness of Scales, or MSS); as it happens, the comparison of values of MSS for the different tunings in competition so far, singles out LT as a clear winner, primus inter pares. This MSS makes use of the Discrete Fourier Transform (DFT), a mathematical tool whose relevance to major scales was discovered very recently (see [11, 1]). Despite its technicality, the MSS puts forward a musical quality that Bach would have found desirable. Its discovery was serendipitous, and has nothing to do with Bach and WTC. I was investigating DFT of major scales for purely theoretical reasons, but endeavoured to try it on unequal temperaments as an illustration for the Helmholtz ‘Klang und Ton’ workshop in Berlin, May 2007. I came across Lehman’s story while browsing the internet, and included it in my list of various temperaments out of curiosity. Computing values of DFT for all major scales in all these temperaments, I noticed an exceptional quality of LT, only equaled by Werckmeister’s IV, or septenarius.4 The notion of MSS was formulated in order to sum up this quality in a single number, for the sake of simplicity. Of course, I do not claim that the best temperaments (musically speaking) are just the ones with the greatest MSS. For instance, equal temperament gives an infinite value for MSS, but nowadays specialists agree on the fact that the equal temperament was abhorrent to Bach, as it still is to baroque musicians. The computation of MSS should come after all musicological arguments, enabling to choose among temperaments already acknowledged as musically interesting. Readers are invited at this point to listen to the pleasant sound of the recordings in LT, which can be found on this page. Together with the record value of MSS, this makes a convincing case for Lehman’s hypothesis. But arguments, like a razor,5 cut both ways: some lesser known temperament might achieve a better MSS than LT. Readers are strongly invited to test the temperaments they like best against LT with the formula for MSS given in section I. The computation is possible even with a pocket calculator (especially if it manages complex numbers) and only takes a few lines of programming with a computer. For instance, some alternative interpretations of Bach’s scribble have been offered, and the values of MSS for these temperaments are of interest. On the other hand, should some other temperament with a greater MSS supersede LT one day, the fact will remain that most or all temperaments reportedly in use around Bach’s time have a much smaller MSS, and this will remain a significant hallmark of LT. 3 For instance, many pages have been written about the quality of the single third E-G# in LT versus other ways of tuning; but

the overall number of nice ‘tertiam minorem’, as Bach calls them, might also be considered of equal or greater importance than that of major thirds, or the size of whole tones, or any other plausible feature of a given temperament. 4 In the rectified version, assuming the value 176/196 in the division of the monochord should be read as 175/196, as many have corrected. 5Occam’s razor? See [10].

3

1. Sameness of Scales in a Temperament I fear it is impossible to appreciate the import of the MSS value without some attempt at understanding the math behind it: most of the strength of the argument derives from Theorem 1. I have made use of footnotes and annexes in order to lighten the reading as much as possible. Roughly speaking, the DFT defined below enables one to appraise how close a scale6 is to the mathematical paradigm of a regular polygon. This makes musical sense, because the largest DFT values characterize the major scales. As it happens, the distribution of these values calculated for the 12 major scales exhibits a very special feature in the case of LT. The next subsection attempts a non-technical description. Readers averse to mathematics are invited to read it and then skip to section II, with tables of values of MSS for a number of temperaments. The precise definitions leading to the MSS are given in the sequel of this section, but the truly technical part (the proofs of the Lemma and Theorem) were confined to the last section. We hope that most readers will go through the whole section, thus getting the gist of the argument, even if understanding the actuals proofs requires some training in that prolific branch of mathematics called harmonic analysis. The complexity of the diatonic, which underlies the major scale and is hence responsible for a large part of the beauty of western classic music and the fulfilling emotions that we experience with it, 1.1. Major scales are regular heptagons (almost). Consider the C major scale in fifth order: F C G D A E B. A tone-deaf person might not perceive that the interval between the extreme notes, B-F, is smaller than the other fifths. After all, the difference is the smallest possible inside the twelve tone universe, e.g. a semitone (or augmented prime). This means that the sequence of seven notes in the major scale is as close as can be, in the twelve note ambient universe, to a completely regular sequence (a perfectly regular sequence is the whole tone scale, for instance). This can be seen graphically on this movie. The mathematical tool that measures such regularities is the Fourier Transform (rigorously defined in the next subsection). It enables to simplify considerably the data for periodic phenomena: in the domain of sound for instance, a sound file recording one note played by a musical instrument can be summarized by a few figures giving the Fourier coefficients, which are in this case the weights of the different overtones. In the study of scales, we use a slightly simplified version, called the Discrete Fourier Transform. For a perfectly regular scale, like the whole-tone, the value FA (1) of this Fourier Transform would be equal to 1, or 100%. The major scales are the twelve seven-note scales with the greatest value of this FA (1) – not 100%, but about 98%. This is the most important point about FA (1): it characterizes the major scales among all possible seven-note scales. Now in unequal temperaments, all scales are different, if only slightly. Hence for each tonality A, we compute a different value of FA (1). The MSS is then defined as a measure of the discrepancy of the twelve values of FA (1) for the twelve major scales: the higher the value of MSS, the closer the values of FA (1) are to one another. For high values of MSS, we expect all (major) scales to be equally close to their abstract model. Indeed an infinite value of MSS means an equal temperament, wherein all scales sound identically. Hence MSS can be taken as a measure of how much a temperament achieves Bach’s goal, having all tonalities coexist peacefully inside a same temperament. 1.2. Discrete Fourier Transform of a Scale. Research on DFT of scales originated in the preparation of the John Clough Memorial Days in Chicago (July 2005), organized by Richard Cohn and David Clampitt, when several researchers had their interest about DFT aroused by Ian Quinn’s ground-breaking dissertation [11], wherein he rekindled an original idea of the late David Lewin [8]. Fresh developments may be found in [1]. But a slightly different track, initiated a few months later by Thomas Noll, led to the present indicator of sameness of scales. Definition 1. Let all notes inside an octave be given by a real number between 0 and 1; this means chosing a reference note (say C) and measure all intervals from there in cents/1200. Then the Discrete Fourier Transform of a scale A = (a1 , a2 , . . . an ) ⊂ [0, 1] is the map  n n 1 X 2iπ ak −k t/n 1 X 2iπak −2iπk t/n e e = e FA : t 7→ n n k=1

6Meaning a sequence of notes in a given temperament

k=1

4

(it is the Fourier Transform of the map k 7→ e2iπak ). The values FA (0), FA (1) . . . FA (n − 1) are the Fourier coefficients of scale A. For instance, the (equal) tempered C major scale would be CM = (0, 1/6, 1/3, 5/12, 7/12, 3/4, 11/12) and its DFT is  2iπt 4iπt 6iπt 8iπt 10iπt 12iπt 1 1 + e− 7 + e− 7 + e− 7 + e− 7 + e− 7 + e− 7 FCM : t 7→ 7 It may be useful to recall that the Fourier Transform is in general a tool for checking the periodicities of a given phenomenon. Here, it is easily seen that the map FA is defined from the cyclic group with n elements Zn to the field C of complex numbers.7 The notes can be visualised as the points e2iπak on the unit circle, which is the quotient structure of frequencies modulo octave: see fig. 2. 1.3. DFT and Maximal Evenness. Lemma 1. |FA (1)| = 1 ⇐⇒ A is a ‘regular polygon’, i.e. a2 − a1 = a3 − a2 = · · · = a1 − an =

1 n

mod 1

For any other scale, for any t, |FA (t)| ≤ 1. The first case |FA (1)| = 1 occurs for instance when A is a whole tone scale (in equal temperament), or an augmented triad, or diminished seventh. But of course a seven note scale in a (decent) twelve note temperament cannot be a regular polygon, as 12 cannot be divided into 7 equal integral parts (see fig. 2). Still, best approximations of regular polygons are musically interesting scales: Theorem 1. Let S be the set of scales of n notes chosen in some equal temperament with m notes (m > n), meaning ∀A ∈ S, ∀a ∈ A, m a is an integer. Then the scales in S with biggest value of |FA (1)| are the Maximally Even Sets. What are Maximally Even Sets ? The ME Sets were defined in [4], extended in [3]. A recent and thorough paper on their features is [5] and the connection with DFT, discovered in [11], is investigated in [1]. The proofs of the above Lemma and Theorem are relegated to the annex, together with technical definitions. For the moment let it suffice to mention that (1) Informally, a ME set is the ‘most regular’ repartition of n notes in a given temperament. (2) ME sets (in equal temperament) are musically prominent scales: for instance the pentatonic, whole tone, major and octatonic scales all are ME sets in twelve tone temperament. (3) In several cases, including the major (and pentatonic) scales, this Maximal Evenness implies the ‘generated’ quality, e.g. the major scale is generated by consecutive fifths. This means that in a given context (here an equal tempered chromatic ambient universe) the size of |FA (1)| measures the regularity of the scale, i.e. its closeness to a regular polygon. The above theorem, as the next proposition, can bear some degree of approximation,8 and hence both still stand in all common tunings, which are close to equal temperament. However, we only need the case of 7 note ME sets in 12 tone temperaments: Proposition 1. In 12 tone equal temperament, the Maximally Even Scales with 7 notes (e.g. the seven-note scales A with greatest value of |FA (1)|) are precisely the 12 major scales. Now we can see that |FA (1)| really measures the closeness of 7 note-scale A to the theoretical regular heptagon, which appears as a common goal, a Platonic model, that major scales strive to approximate as best they can: this is the meaning of the last proposition.9 7 Adding n to t does not change the value of F (t). A 8 The DFT is a continuous map: if |F (1)| > |F (1)| in equal temperament, the small modifications of arguments A and B A B

resulting from nudging some notes away from their equal tempered position, will only slightly disturb the values |FA (1)|, |FB (1)| and the inequality will still stand. 9 Obviously this appears as a mathematical feature, not a musical one. The fact that the major scale is Maximally Even is highly relevant to tonal functions. This is discussed in the literature on ME sets and the reader is invited to consult the references given in the bibliography.

5

C Cð

B



D

C major

A





E

G

F Fð

Figure 2. Major scales are best approximations of regular heptagons From now on, all we need to remember is this meaning of |FA (1)|. For instance, if scale A is a regular heptagon (say a ‘whole tone scale’ in 14 note equal temperament) then |FA (1)| = 1; for any major scale A in 12 tone equal temperament, |FA (1)| ≈ 0.988846. This is a fundamental feature of major scales and not a mere curio: P a basic fact about DFT, Parseval’s formula, states that t=0...n−1 |FA (t)|2 = 1 = 100%. Hence, when |FA (1)| evaluates around 0.98 for a major scale, it means that almost all the energy of the scale is concentrated in this coefficient, as all other Fourier coefficients are negligible. In the case of other, random, seven note scales, the energy is spread between the seven coefficients: for a chromatic succession of 7 notes, |FA (1)| is roughly 0.74, see fig. 3. It is also worth considering the scales with second best value of |FA (1)|, which are quite different from major scales ([0234568], e.g. G], A], B, C, C], D, E). 1

0.5

1

2

3

4

5

6

Figure 3. DFT of a major scale and a chromatic 7 note scale We are now ready to define the sameness coefficient of scales (MSS) inside a given temperament. 1.4. Sameness Coefficient. A temperament is simply a collection of 12 tones, i.e. a subset T of [0, 1] with 12 elements. Henceforth we will only consider scales with seven notes, that is to say ordered sequences of seven elements of T . Let us assume that the elements of T are given in order:

6

Definition 2. A temperament, or tuning, is an ordered sequence of twelve different notes: 0 ≤ t0 < t1 < t2 < . . . t11 < 1 Definition 3. A major scale in temperament T is a sequence of the form Aα = (a0 , . . . a6 )

with

ai = t(ki +α

mod 12)

where α is a constant and the ki ’s are the indexes of the standard C major scale: (k0 , k1 . . . k6 ) = (0, 2, 4, 5, 7, 9, 11) Example: say α = 5, we get the notes ai with i = 5, 7, 9, 10, 12 = 0, 14 = 2, 16 = 4, i.e. F major. This enables to compute |FAα (1)| for all α = 0 . . . 11, i.e. for the 12 major scales in T . For instance, taking for T the so-called pythagorean tuning with the ‘wolf fifth’ between A# and F, we get the following values for all major scales (in semi-tone order): 0.9891, 0.9891, 0.9856, 0.9927, 0.9856, 0.9915, 0.9856, 0.9856, 0.9915, 0.9856, 0.9927, 0.9856 Notice that all scales that do not contain the wolf fifth are isometrical, and hence share the same absolute value of the Fourier coefficient (for equal temperament). The most striking fact about these values is their closeness to 1, which but reflects the characterization of ME sets in theorem 1. But the most important feature in a given temperament is the distribution of these values, which are exceptionally close to one another in the case of LT. In order to visualize this phenomenon more easily, we define Definition 4. The Major Scale Sameness (MSS) of temperament T is the inverse of the biggest discrepancy between values of coefficients |FAα (1)| for all twelve major scales in T : M SS(T ) =

1 max(|FAα (1)|) − min(|FAα (1)|) α

α

This quantity is highest when all values of |FAα (1)| (for all 12 major scales) are the closest, i.e. when all major scales are almost equally similar to the ideal (theoretical) model of the regular heptagon. For instance for Pythagorean tuning, we get a maximum (resp. minimum) value of 0.9927 (resp. 0.9856) and hence 1 1 = ≈ 140. MSS(Pyth) = 0.9927 − 0.9856 0.0071 For LT, no major scale comes higher than |FAα (1)| = 0.991, but none comes lower than 0.987, so the MSS is 1 particularly high: MSS(LT)= ≈ 250 (actually a little more, see fig. 5). 0.991 − 0.987 1.5. Musical relevance: playing in all tonalities. Most analyses of different temperaments, including Lehman’s, put forward some particular intervals. The MSS coefficient on the other hand is comprehensive: it gives a measure of the sameness of all major scales in T . Though it tells nothing about the closeness of E-G] to the pure third, it is well in tune with Bach’s own project in WTC.10 A tuning with high MSS means that ALL major scales are similarly close to the theoretical heptagon, i.e. similarly ‘good’. Or should one say, ‘wohl’ ? This movie online shows all diatonic scales in LT, together with their closest heptagons. It can be observed that though the 12 scales differ among themselves, they are quite similar in the way they resemble the regular heptagon: this is what MSS is all about. 2. Comparison of MSS for different tunings This section is devoted to numerical results, i.e. tables of values of MSS. 10Admittedly Bach does mention major and minor thirds on the front page, plus tones and semi tones (see 1), but he insists on

the possibility of playing all these intervals in all 24 tonalities.

7

2.1. Tables. Let us begin with a computer program for the computation of MSS on a given T . It is convenient to put the values of the 12 elements of T in some table: T = {t0 , t1 , . . . t11 } To do this, take any table of a temperament in cents and divide by 1200 to get the ai ’s. This will be the input of the function that computes the MSS. Now we loop through the twelve major scales: For α = 0 to 11, compute the scale Aα and its first Fourier coefficient cα : 6 1 X Aα = (ai = t(ki +α) mod 12 )i=0...6 cα = e2iπ(ak −k/7) 7 k=0

Lastly, find the minimum and the maximum in those 12 values; subtract the one from the other, and take the inverse11 of the result: 1 M SS(T ) = maxα (cα ) − minα (cα ) R Fig. 4 gives this algorithm in Mathematica , for scales with any number n of notes.

fou1 Hgamme_L := ModuleB8n = Length@gammeD