InLéctor: creació automàtica de llibres electrònics bilingües

Antoni Oliver González

Resum

Aquest article presenta un sistema de creació automàtica de llibres bilingües amb textos alineats. El sistema permet crear llibres electrònics en què l’oració en la llengua de partida està vinculada amb la corresponent oració en la llengua d’arribada. Els usuaris poden llegir en la llengua original i veure l’oració corresponent en la llengua d’arribada fent clic sobre l’oració de partida. D’aquesta manera pot continuar llegint en la llengua d’arribada o tornar a la versió original fent clic sobre qualsevol oració. El llibre en la llengua de partida s’alinea automàticament a nivell d’oració amb la seva traducció en la llengua d’arribada. Aquest sistema no utilitza la traducció automàtica sinó que, per contra, mostra la traducció publicada de l’obra original en la llengua d’arribada. Hem creat diversos llibres electrònics bilingües utilitzant novel·les clàssiques i la seva traducció de domini públic, però aquest sistema també és utilitzable per a qualsevol llibre per al qual l’usuari tingui drets sobre l’original i la traducció. El sistema s’adreça a persones que vulguin llegir originals en una llengua en què tenen un nivell mitjà o alt. Aquest article també presenta el procés de creació de diccionaris bilingües a partir de recursos lèxics gratuïts. Tots dos recursos, el del llibre electrònic i el de diccionaris bilingües, poden ser de gran ajuda per a tots aquells lectors que vulguin accedir a la versió original dels llibres.

Paraules clau

llibre electrònic; textos paral·les¸suport a la lectura.

Text complet:

PDF (English)

Referències

Bamford, J.; Day, R. R. (1997). “Extensive reading: What is it? Why bother?” The Language Teacher, v. 21, n. 5. p. 6-8. . [Consulted: January 3, 2017].

Bird, S. (2006). “NLTK: the natural language toolkit”. In: Proceedings of the COLING/ACL on Interactive presentation sessions, Association for Computational Linguistics, p. 69-72. ,

. [Consulted: April 15, 2017].

Bond, F.; Kyonghee, P. (2012). “A Survey of WordNets and their Licenses”. In: Proceedings of the 6th International Global WordNet Conference, Matsue, Japan, p. 64-71. . [Consulted: October 11, 2017].

Chin-Neng, C. [et al.] (2013). “The effects of extensive reading via e-books on tertiary level efl students’ reading attitude, reading comprehension and vocabulary”. TOJET: The Turkish Online Journal of Educational Technology, v. 12, n. 2 (April). [Consulted: April 15, 2017].

Ernst-Slavit, G.; Mulhern, M. (2003). “Bilingual books: Promoting literacy and biliteracy in the second-language and mainstream classroom”. Reading online, v. 7, n. 2, p. 1096-1232. . [Consulted: January 3, 2017].

Fellbaum, C. (ed.) (1998). WordNet: An electronic lexical database. London: The MIT Press. (Language, speech and communication).

Forcada, M. L. [et al.] (2011). “Apertium: a free/open-source platform for rule-based machine translation”. Machine translation, v. 25, n. 2, p. 127-144. . [Consulted: October 11, 2017].

Hafiz, F. M.; Tudor, I. (1989). “Extensive reading and the development of language skills”, ELT journal, v. 43, n. 1, p. 4-13. . [Consulted: September 17, 2017].

Nuttall, C. (1996). Teaching reading skills in a foreign language. London: Heinemann.

Iribarren, T.; Oliver, A.; Peiró, E. (2016). “Recuperar traduccions inèdites per a internautes: el cas de L’illa dels pingüins, d’Anatole France, en traducció de J. F. Vidal Jové”. In: Bacardí, M.; Godayol, P. (eds). Traducció i franquisme. Lleida: Punctum. (Visions; 8).

Kiss, T.; Strunk, J. (2006). “Unsupervised multilingual sentence boundary detection”. Computational Linguistics, v. 32, n. 4 (December), p. 485-525. . [Consulted: September 18, 2017].

Krashen, S. D. (2004). The Power of Reading: Insights from the Research: Insights from the Research. 2nd ed. Santa Barbara, California: ABC-CLIO.

Lehmann, J. [et al.] (2015). “DBpedia: A Large-scale, Multilingual Knowledge Base Extracted from Wikipedia”. Semantic Web Journal, v. 6, n. 2, p. 167-195. . [Consulted: September 18, 2017].

Padró, L.; Stanilovsky E. (2012). “FreeLing 3.0: Towards Wider Multilinguality”. In: Proceedings of the Language Resources and Evaluation Conference (LREC 2012), ELRA, Istanbul, Turkey, p. 2473-2479. . [Consulted: September 18, 2017].

Prowse, P. (2002). “Top ten principles for teaching extensive reading: A response”. Reading in a Foreign Language, v. 14, n. 2 (October), p. 136-141. . [Consulted: September 17, 2017].

Semingson, P.; Pole, K.; Tommerdahl, J. (2015). “Using Bilingual Books to Enhance Literacy around the World”. European Scientific Journal, v. 3 (February), p. 132-139. . [Consulted: October 22, 2017].

Sérasset, G. (2015). “DBnary: Wiktionary as a Lemon-based multilingual lexical resource in RDF”. Semantic Web Journal, v. 6, n. 4, p. 355-361. , . [Consulted: October 22, 2017].

Tiedemann, J. (2012). “Parallel Data, Tools and Interfaces in OPUS”. In: Proceedings of the Eight International Conference on Language Resources and Evaluation (LREC’12), European Language Resources Association (ELRA), Istanbul, Turkey, may, p. 2214-2218. . [Consulted: September 18, 2017].

Varga, D. [et al.] (2007). “Parallel corpora for medium density languages”. Amsterdam Studies in the Theory and History of Linguistic Science Series IV, v. 292. . [Consulted: October 22, 2017].

Zanettin, F. (2002). "Corpora in Translation Practice". In: Yuste-Rodrigo, E. (ed.). Language Resources for the Translator Work and Research. LREC 2002 Workshop Proceedings, pp. 10-14. . [Consulted: September 18, 2017]

Zesch, T.; M̈uller, C.; Gurevych, I. (2008). “Extracting Lexical Semantic Knowledge from Wikipedia and Wiktionary”. LREC, v. 8, p. 1646-1652. . [Consulted: September 18, 2017].

Mètriques darticles

Carregant mètriques ...

Metrics powered by PLOS ALM
Copyright (c) 2017 Antoni Oliver González
Llicència de Creative Commons
Aquesta obra està subjecta a una llicència de Reconeixement 4.0 Internacional de Creative Commons