SLT0805T - Informatique pour le Traitement Automatique des Langues 2

Semestre Semestre 2
Crédits ECTS 4
Volume horaire total 25

Responsables

Ludovic Tanguy

Pré-requis

Les étudiants doivent avoir suivi le cours SLT0702T « Informatique pour le TAL 1 »

Objectifs

Cette UE vise à approfondir les méthodes informatiques vues dans l’UE SLT0702T (Informatique pour le TAL 1) et à confronter les étudiants à des traitements plus sophistiqués, ainsi qu’à des données linguistiques plus complexes et plus volumineuses.

Contenu

Les techniques fondamentales de manipulation des données linguistiques vues au premier semestre sont complétées et mises en application dans des programmes plus complexes.

Y sont abordées notamment les structures de données complexes (du second ordre, récursives), les bases de la programmation modulaire, et des technologies complémentaires couramment utilisées en TAL.

Bibliographie

  • BIRD, S., KLEIN, E. and LOPER, E. (2010). Natural Language Processing with Python. O’Reilly, version mise à jour en ligne sur http://www.nltk.org/
  • CLARK A.,FOX, C. & LAPPIN S. (2010). The Handbook of Computational Linguistics and Natural Language Processing, Blackwell.
  • KAZIL, J. and JARMUL, K. (2016). Data Wrangling with Python : Tips and Tools to Make Your Life Easier. O’Reilly.
  • MANNING C.D. & SCHÜTZE H. (1999). Foundations of statistical language processing, MIT Press