Computer modelling of innovations relative to Latin in contemporary Romance dialects
Abstract
This study relies on a corpus illustrating several dozen Romance dialects from France, Belgium, Switzerland, Italy, Spain and Portugal, for which 145 innovations relative to Latin have been encoded in the form of 1 (presence) or 0 (absence). Based on contemporary recordings (translations of Aesop’s 100-word fable “The North Wind and the Sun” and another 100-word list), following the principles of dialectometry, the Comparative method and especially historical glottometry, we propose computational tools to address the relationships and classifications amongst these Romance varieties. Results of data-mining techniques confirm the robustness of a North/South divide — with the Oïl area being, by far, the most innovative — and, secondarily, an opposition between the South-West (mainly Ibero-Romance) and the South-East (mainly Italo-Romance, more conservative). Among the most important/discriminant features are the palatalisation of Latin ca, which characterises the majority of northern Gallo-Romance dialects, and the simplification of geminates north of the La Spezia-Rimini line. Most innovations relate to phonetic/phonological traits. However, we also consider morphosyntactic and lexical features, such as non-null subject in northern Gallo-Romance varieties, and the substitution of cum ‘with’ by apud > amb in Occitano-Romance varieties. By retaining only morphosyntactic innovations, we still find a North vs. South-East- vs. South-West tripartition.
Keywords
phylogenetic classification, Wave model, computational dialectometry, historical glottometry, Romance varietiesReferences
Abalain, Hervé. 2007. Le français et les langues historiques de la France. Paris: Éditions Jean-Paul Gisserot.
Adams, James Noel. 2007. The regional diversification of Latin 200 BC–AD 600. Cambridge: Cambridge University Press.
Ascoli, Graziadio Isaia. 1877. Schizzi franco-provenzali. Archivio glottologico italiano 2: 61–120.
Ascoli, Graziadio Isaia. 1882/1885. L’Italia dialettale. Archivio glottologico italiano 8: 98–128.
Avolio, Francesco. 1995. Bommèsprë. Profilo linguistico dell’Italia centro-meridionale. San Severo: Gerni.
Bartoli, Matteo G., Pellis, Ugo, Massobrio, Lorenzo. 1995. Atlante Linguistico Italiano. Rome: Istituto Poligrafico e Zecca dello Stato.
Bec, Pierre. 1995. La langue occitane. Paris: Presses Universitaires de France.
Beijering, Karin, Gooskens, Charlotte, Heeringa, Wilbert. 2008. Predicting intelligi-bility and perceived linguistic distance by means of the Levenshtein algorithm. Linguistics in the Netherlands 25: 13–24.
Blanchet, Philippe. 1996. Problématique de la situation ethnolinguistique du pays de Retz (L.-Atl.) : pratiques linguistiques et identité en zone de marches. Cahiers de socio-linguistique 1: 45–80.
Boula de Mareüil, Philippe, Rilliard, Albert, Vernier, Frédéric. 2018. A speaking atlas of the regional languages of France. Proceedings of the 11th International Conference on Language Resources and Evaluation, 4133–4138. Miyazaki.
Boula de Mareüil, Philippe, Bilinski, Éric, De Iacovo, Valentina, Romano, Antonio & Vernier, Frédéric. 2021. For a mapping of the languages/dialects of Italy and regional varieties of Italian. In A. Thibault, M. Avanzi, N. Lo Vecchio & A. Millour (eds), New Ways of Analyzing Dialectal Variation, 267–288. Strasbourg: Éditions de linguistique et de philologie.
Boutin, Béatrice Akissi. 2003. La norme endogène du français de Côte d’Ivoire : mise en évidence de règles différentes du français de France concernant la complémentation verbale. Sud Langues 3: 33–46.
Brun-Trigaud, Guylaine. 2020. Études dialectométriques sur le lexique des parlers du Croissant. In L. Esher, M. Guérin, N. Quint & M. Russo (eds), Le Croissant linguis-tique entre oc, oïl et francoprovençal : des mots à la grammaire, des parlers aux aires, 173–181. Paris: L’Harmattan.
Câmara Jr., Joaquim Mattoso. 1970. Estrutura da língua portuguesa. Petrópolis: Vozes.
Chambers, Jack K. & Trudgill, Peter. 2004. Dialectology. Cambridge: Cambridge University Press.
Chambon, Jean-Pierre & Greub, Yan. 2002. Note sur l’âge du (proto)gascon. Revue de linguistique romane 66: 263–264.
Chevrier, Jean-Jacques & Gautier, Michel. 2002. Le poitevin-saintongeais : langue d’oïl méridionale. La Crèche : Gestes Éditions.
Contini, Michel. 1987. Étude de géographie phonétique et de phonétique instrumen-tale du sarde. Alessandria: Edizioni dell’Orso.
Coquebert de Montbret, Charles. 1831. Essai d’un travail sur la géographie de la langue française. In S. Bottin (ed.), Mélanges sur les langues, dialectes et patois: renfermant, entre autres, une collection de versions de la parabole de l’enfant prodigue en cent idioms ou patois différens [sic], presque tous de France ; précédés d’un essai d’un travail sur la géographie de la langue française, 5–29. Paris: Bureau de l’Almanach du commerce.
Coseriu, Eugen. 1973. Sincronía, diacronía e historia. El problema del cambio lingüístico. Madrid: Gredos.
Cugno, Federica. 2023. Italian dialect classifications. Dialectologia 10: 197–230.
Dalbera-Stefanaggi, Marie-José. 2002. La langue corse. Paris: Presses Universitaires de France.
François, Alexandre. 2014. Trees, waves and linkages: Models of language diversifi-cation. In C. Bowern & B. Evans (eds), The Routledge Handbook of Historical Linguistics. 161–189. London: Routledge.
François, Alexandre & Kalyan, Siva. Forthcoming. Subgrouping: Trees vs. Waves. In C. Bowern & B. Evans (eds), The Routledge Handbook of Historical Linguistics (Second edition). New York: Routledge.
Gaillard-Corvaglia, Antonella, Léonard, Jean Léo & Darlu, Pierre. 2007. Testing Cladistics on Dialect Networks and Phyla (Gallo-Romance Vowels, Southern Italo-Romance Diasystems and Mayan Languages. Proceedings of the 9th Meeting of the ACL SIG in Computational Morphology and Phonology, 23–30. Prague.
Garassino, Davide & Filipponio, Lorenzo. 2021. The impact of information structure on the phonetic implementation of vowel length. A contrastive analysis of two Ligurian Dialects. In A. Teixeira Kalkhoff, M. Selig & C. Mooshammer (eds), Prosody and conceptional variation. 213–236. Bern: Peter Lang.
García Mouton, Pilar, Fernández-Ordóñez, Inés, Heap, David, Perea, María Pilar, Saramago, João & Sousa, Xulio. 2016. ALPI-CSIC [www.alpi.csic.es], digital edition of Navarro Tomás, in T. Navarro Tomás (dir.), Atlas Lingüístico de la Península Ibérica. Madrid: CSIC.
Gilliéron, Jules & Edmont, Edmond. 1902–1910. Atlas linguistique de la France. Paris: Champion.
Goebl, Hans. 2002. Analyse dialectométrique des structures de profondeur de l’ALF. Revue de linguistique romane 66(261–262): 5–63.
Goebl, Hans. 2003. Regards dialectométriques sur les données de l’Atlas linguistique de la France (ALF) : relations quantitatives et structures de profondeur. Estudis Romànics 25: 59–121.
Goldman, Jean-Philippe. Scherrer, Yves., Glikman, Julie., Avanzi, Mathieu, Benzitoun, Christophe & Boula de Mareüil, Philippe. 2018. Crowdsourcing regional variation data and automatic geolocalisation of speakers of European French. Proceedings of the 11th International Conference on Language Resources and Evaluation, 3336–3342. Miyazaki.
Goldstein, David M. 2023. Divergence-time estimation in Indo-European: The case of Latin. Diachronica 40(3): 1–53.
Gooskens, Charlotte. 2005a. How well can Norwegians identify their dialects? Nordic Journal of Linguistics 28(1): 37–60.
Gooskens, Charlotte. 2005b. Travel time as a predictor of linguistic distance. Dialecto¬logia et Geolinguistica 13: 38‒62.
Goyette, Stéphane. 2000. The emergence of the Romance languages from Latin: a case for creolization effects. Ph.D thesis. Ottawa: University of Ottawa.
Guérin, Maximilien, Esher, Louise, Léonard, Jean Léo, Loiseau, Sylvain. 2021. Comparing inflectional structure across a dialect group: verb morphology in the “croissant linguistique”. Revue roumaine de linguistique 66: 299–316
Haust, Jean, Remacle, Louis, Legros, Élise, Lechanteur, Jean, Boutier, Marie-Guy & Baiwir, Esther. 1953–2011. Atlas linguistique de la Wallonie. Liège: Vaillant-Carmanne.
Heeringa, Wilbert. 2004. Measuring dialect pronunciation differences using Levenshtein distance. PhD thesis. Groningen: Rijksuniversiteit.
Herrero de Haro, Alfredo & Hajek, John. 2020. Eastern Andalusian Spanish. Journal of the International Phonetic Association 52(1): 135–156.
IPA [= International Phonetic Association]. 1999. Handbook of the International Phonetic Association. A Guide to the Use of the International Phonetic Alphabet. Cambridge: Cambridge University Press.
Jaberg, Karl & Jud, Jacob. 1928–1940. Sprach- und Sachatlas Italiens und der Südschweiz. Ringier: Zofingen.
Joret, Charles. 1881. Essai sur le patois normand du Bessin: suivi d’un dictionnaire étymologique. Paris: Friedrich Vieweg.
Kalyan, Siva & François, Alexandre. 2018. Freeing the Comparative Method from the tree model: A framework for Historical Glottometry. Senri Ethnological Studies 98: 59–89.
Kihm, Alain. 2005. Les langues créoles. In J.-M. Hombert (ed.), Aux origines des langues et du langage, 390–427. Paris: Fayard.
Knyazeva, Elena, Boula de Mareüil, Philippe & Vernier, Frédéric (2022), Aesop’s fable “The North Wind and the Sun” used as a Rosetta Stone to extract and map spoken words in under-resourced languages. Proceedings of the 13th International Conference on Language Resources and Evaluation, 2072–2079. Marseilles.
Lausberg, Heinrich. 1939. Die Mundarten Südlukaniens. Niemeyer: Halle (Saale).
Ledgeway, Adam. 2011. La sopravvivenza del sistema dei doppi complementatori nei dialetti meridionali. In P. Del Puente, (ed.), Dialetti: per parlarne e parlare. 239–262. Rionero in Vulture: Caliceditori.
Ledgeway, Adam. 2022. Residues and Extensions of Perfective Auxiliary BE: Modal Conditioning. Languages 7(3): 160.
Legeard, Fernand. 2020. Et si on caôsait patois ! Histouéres d’mon Pays mainiot. Éditions de Igé: l’Étrave.
Leinonen, Therese, Çöltekin, Çağrı & Nerbonne, John. 2015. Using Gabmap. Lingua 178: 71–83.
Léonard, Jean Léo, Brun-Trigaud, Guylaine & Picard, Flore. 2024. Atlas linguistiques et perspectives dialectométriques. In L. Esher & J. Sibille (eds), Manuel de linguis¬tique occitane, 473–520. Mouton de Gruyter: Berlin.
LIPSKI, JOHN. 1996. EL ESPAÑOL DE AMERICA. MADRID: CÁTEDRA.
Loporcaro, Michele. 1997a. Lengthening and Raddoppiamento Fonosintattico. In M. Maiden, & M. Parry (eds), The Dialects of Italy, 41–51. London–New York: Routledge.
Loporcaro, Michele. 1997b. Puglia & Salento. In M. Maiden, & M. Parry (eds), The Dialects of Italy, 338–348. London: Routledge.
Madriz, Anna & Roseano, Paolo. 2006. Scrivere in friulano. Udine: Società Filologica Friulana.
Martin, Jean-Baptiste. 2011. Le francoprovençal. Langues et cité 18: 1–12.
Marotta, Giovanna. 2008. Lenition in Tuscan Italian (gorgia toscana). In J. Brandão de Carvalho, T. Scheer & P. Ségéral (eds), Lenition and Fortition, 235–270. Berlin: Mouton de Gruyter.
Nagore Laín, Francho. 1989. Gramática de la lengua aragonesa. Zaragoza: Mira Editores.
Nerbonne, John, Kleiweg, Peter, Heeringa, Wilbert & Manni, Franz. 2007. “Projecting dialect differences to geography: bootstrap clustering vs. noisy clustering. In C. Preisach, L. Schmidt‐Thieme, H. Burkhardt & R. Decker (eds), Data analysis, machine learning, and applications, 647–654. Berlin: Springer.
Oliviéri, Michèle. 2015. Le statut des pronoms sujets dans les dialectes du nord de l’Occitanies. In S. Retali-Medori (ed.), Paroddi varghji, mélanges offerts à Marie-José Dalbera-Stefanaggi, 289–302. Alessandria: Edizioni dell’Orso.
Patriarca, Marco, Heinsalu, Els, Léonard, Jean Léo. 2020. Language in Space and Time. Cambridge: Cambridge University Press.
Pei, Mario A. 1949. A New Methodology for Romance Classification. Word 5(2): 135–146.
Pellegrini, Giovan Battista. 1973. I cinque sistemi dell’italo-romanzo. Revue roumaine de linguistique 18: 105–129.
Pellegrini, Giovan Battista. 1977. Carta dei dialetti d’Italia. Pisa: Pacini.
Ploog, Katja. 2002. Le français à Abidjan. Pour une approche syntaxique du non-standard. Paris: Éditions du CNRS.
Poplineau, Bernard. 2006. Méthode d’apprentissage du champenois. Lou Champaignat 28: 5–31.
Premat, Timothée & Boula de Mareüil, Philippe. 2018. Le /R/ « roulé » en français et dans quelques langues régionales de France. Actes des 32es Journées d’Études sur la Parole, 55–63. Aix-en-Provence.
Preston, Denis R. 2005. What is folk linguistics? Why should you care? Lingua Posnaniensis 47: 143–162.
Quint, Nicolas. 2023. Les parlers du Croissant : un aperçu des actions actuelles de documentation et de promotion d'un patrimoine linguistique menacé. In A. Rialland & M. Russo (eds), Les langues régionales de France. Nouvelles approches, nouvelles méthodologie, revitalisation, 213–245. Paris: Éditions de la Société de Linguistique de Paris.
Regueira, Xosé Luís. 1996. Galician. Journal of the International Phonetic Association 26(2): 119–122.
Rohlfs, Gerhard. 1937. La struttura linguistica dell’Italia. Leipzig: H. Keller.
Romano, Antonio, Mairano, Paolo & Pollifrone, Barbara. 2010. Variabilità ritmica di varietà dialettali del Piemonte. In S. Schmid, M. Schwarzenbach & D. Studer (eds), La dimensione temporale del parlato, 101–112.Torriana: EDK.
Romano, Antonio. 2013. Osservazione e valutazione di traiettorie vocaliche su dia-grammi formantici per descrivere il polimorfismo e la dittongazione dialetti pugliesi. In F. Sánchez Miret, & D. Recasens, (eds), Experimental Phonetics and Sound Change (with special reference to the Romance languages), 121–143. Munich: LINCOM.
Romano, Antonio. 2016. La BD AMPER, La tramontana e il sole e altri dati su lingue, dialetti, socioletti, etnoletti e interletti del Laboratorio di Fonetica Sperimentale “Arturo Genre”. Quaderni del Museo delle Genti d’Abruzzo 41: 225–240.
Romano, Antonio. 2020. Vowel reduction and deletion in Apulian and Lucanian dialects with reference to speech rhythm. Italian Journal of Linguistics 32(1): 85–102.
Ronjat, Jules. 1913. Essai de syntaxe des parlers provençaux modernes. Paris: Imprimerie nationale.
Ronjat, Jules. 1930. Grammaire istorique [sic] des parlers provençaux modernes. Macon: Protat.
Scherrer, Yves. 2021. Les cartes dialectométriques interactives de dialektkarten.ch. In A. Thibault, M. Avanzi, N. Lo Vecchio & A. Millour (eds), New Ways of Analyzing Dialectal Variation, 137–152. Strasbourg: Éditions de linguistique et de philologie.
Saussure, Ferdinand de. 1916. Cours de linguistique générale. Paris: Payot.
Schleicher, August. 1861[2010]. Compendium der vergleichenden Grammatik der indogermanischen Sprachen. Cambridge: Cambridge University Press.
Schmidt, Johannes. 1872. Die Verwandtschaftsverhältnisse der indogermanischen Sprachen. Weimar: Hermann Böhlau.
Séguy, Jean. 1973. La dialectométrie dans l’Atlas linguistique de la Gascogne. Revue de linguistique romane 37: 1–24.
Sumien, Domergue. 2007. Preconizacions del Conselh de la Lenga Occitana. Lingüistica Occitana 6: 1–157.
Sumien, Domergue. 2008. Classificacion dei dialèctes occitans. Lingüistica Occitana 7: 1–55.
Tillinger, Gabor. 2016. Étude des frontières linguistiques à l’intérieur de la zone d’interférence appelée “Croissant”. Atti del XXVIII Congresso internazionale di linguistica e filologia romanza, 1037–1052. Rome.
Walter, Henriette. 1994. L’aventure des langues en Occident. Paris: Éditions Robert Laffont.
Wartburg, Walther von. 1922–2002. Französisches Etymologisches Wörterbuch. Eine darstellung des galloromanischen sprachschatzes. Bonn/Leipzig/Bâle: Teubner/Klopp/Zbinden.
Zink, Gaston. 1989. Morphologie du français médiéval. Paris: Presses Universitaires de France.
Published
Downloads
Copyright (c) 2025 Philippe Boula de Mareüil, Marc Evrard, Alexandre François, Antonio Romano

This work is licensed under a Creative Commons Attribution 4.0 International License.