-
Partager cette page
SLT0804T - Méthodes, ressources et applications du TAL 2
Semestre | Semestre 2 |
---|
Crédits ECTS | 4 |
---|---|
Volume horaire total | 25 |
Domaine(s) LMD
Langue(s) d'enseignement
Responsables
Lydia-Mai Ho-Dac
Enseignants : Lydia-Mai Ho-Dac, Josette Rebeyrolle et Cécile Fabre
Objectifs
Cette UE poursuit l’enseignement de l’UE « SLT0703T Méthodes, ressources et applications du TAL 1 ». Cette seconde partie poursuivra le questionnement sur le rôle et l’apport des connaissances et données linguistiques dans les applications du TAL en présentant 1) le fonctionnement de deux applications emblématiques du TAL : la RI et la EI, 2) les enjeux et techniques liés à l’extraction terminologique et 3) la question de l’éthique en TAL.
Contenu
- Présentation de deux applications emblématiques visant l’accès au contenu textuel :
-
- recherche d'informations (RI)
- extraction d'informations (EI)
- Manipulation d'outils et de techniques associées à ces applications :
-
-
- indexation d'une base de données textuelles
- initiation à la plateforme Gate et au module d'extraction d'information ANNIE
-
- Extraction automatique de termes pour la création de ressources terminologiques
- La question de l’éthique dans les données manipulées en TAL
Ce cours est composé de cours magistraux complétés par des travaux individuels des étudiants pour chacun des aspects enseignés.
Bibliographie
- BALVET, A. (2021), Introduction : numéro spécial sur les ressources lexicales. Revue Lexique, 27, 5-19. URL :https://lexique.univ-lille.fr/numero27-2020.html
- Bel, N. & Sagot, B. (2011) Introduction : Ressources linguistiques libres. Revue TAL, 52(3).
- Bassil, Y. (2012). A survey on information retrieval, text categorization, and web crawling. arXiv preprint arXiv:1212.2065.
- Claveau, V. & Nie, J. (Ed.) (2016). Recherche d'information et traitement automatique des langues. Revue TAL, n.s., 56 (3).
- Cunningham, H. et al. (2009). Developing Language Processing Components with GATE Version 5 (a User Guide). University of Sheffield, Sheffield. URL :https://gate.ac.uk/releases/gate-5.1-beta1-build3397-ALL/
- CUNNINGHAM, H. (2005). Information extraction, automatic. In Encyclopedia of language and linguistics, 3(8).
- DOJCHINOVSKI, M., HERNANDEZ, J., ACKERMANN, M., Kirschenbaum, A. & Hellmann S. (2018) DBpedia NIF: Open, Large-Scale and Multilingual Knowledge Extraction Corpus. arXiv preprint arXiv:1812.10315, 2018.
- L'HOMME, M.-C. (2004) La terminologie : principes et techniques. Montréal : Les Presses de l’Université de Montréal, Coll. « Paramètres ».
- L ‘HOMME, M.-C. (2008). Ressources lexicales, terminologiques et ontologiques: une analyse comparative dans le domaine de l’informatique. Revue française de linguistique appliquée, XIII, 1, 97-118.
- Litkowski, K. C. (2005). Computational Lexicons and Dictionaries. In Encyclopedia of Language and Linguistics (2nd ed.). Oxford: Elsevier
- Musen MA & Protégé Team. (2015) The Protégé Project: A Look Back and a Look Forward. AI Matters, 1(4):4-12.
- Nazarenko, A., Zargayouna, H., Hamon, O. et van Puymbrouck, J. (2009). Evaluation des outils terminologiques: enjeux, difficultés et propositions. Revue TAL, 50 (1), 257-281.