Proposition de thèse en Traitement Automatique des Langues et Multilinguisme

L’équipe du Traitement Automatique du Langage Naturel (TALN) du Laboratoire Informatique de Nantes Atlantique (LINA UMR CNRS 6241) à l’Université de Nantes propose un sujet de thèse en Informatique dans les domaines du Traitement Automatique des Langues et du Multilinguisme.

Titre: Analyse des structures discursives des textes et alignement de terminologies  multilingues en corpus comparable ; pour une modélisation discursive de la notion de contexte.

Résumé : La traduction automatique est l’une des activités de recherche les plus  ambitieuses de notre temps. Ce travail de thèse propose de s’attaquer à l’un de ses enjeux, à savoir l' »alignement de terminologies multilingues » en corpus comparable, et ce en explorant de nouvelles méthodes de mise en correspondance des termes, à savoir à l’aide d' »analyses des structures discursives des textes ». L’approche état de l’art consiste à établir une mise en correspondance des termes en mesurant la similarité de leurs contextes d’apparition à l’aide de dictionnaires bilingues préexistants. Les problèmes fondamentaux de cette approche sont qu’elle repose sur une modélisation très pauvre du contexte d’apparition d’un terme (un sac de mots apparaissant autour des termes
analysés) et qu’elle présuppose l’existence de ressources lexicales bilingues pour être réalisée.
Ce travail a pour objectif d’expérimenter des contextes de termes définis sur la base de résultats d’analyses du discours ainsi que réfléchir à la définition d’une notion de contexte discursif plus en adéquation avec la tâche.
Ce sujet émerge dans la continuité du projet européen TTC et du projet ANR MeTRICC dont l’équipe TALN assure les coordinations.

Mots clefs : Traduction, Alignement de terminologies multilingues, Analyse et modélisation
des structures du discours, Corpus comparable

Profil et compétences recherchés:
M2 Recherche informatique ou école d’ingénieurs
Bon niveau en anglais
Bonnes notions en apprentissage automatique
Bonnes connaissances en programmation Java/Python
Affinités avec le logiciel libre et le développement collaboratif

Procédure de candidature :
La date butoir de réception des candidatures est  le 20 Avril 2012 mais la position restera ouverte jusqu’à ce qu’elle soit attribuée.
La thèse démarrera en Octobre 2012 et sera financée par une allocation ministérielle.
Les candidats intéressés sont invités à prendre contact le plus tôt possible et à envoyer les informations suivantes : une lettre de motivation incluant votre positionnement par rapport aux compétences attendues, un CV, un relevé de notes avec classement au Master (au moins pour la période écoulée), un lien vers un site web présentant le programme de votre master et des lettres de recommandations de vos encadrants scientifiques.
Cette thèse pourra être précédée d’un stage de master recherche financé sur le même thème. Prendre contact.

Contact :
Nicolas Hernandez et Emmanuel Morin (prenom.nom à univ-nantes.fr)

Plus d’information sur le sujet de thèse : http://e.nicolas.hernandez.free.fr/pub/rec/12

About these ads
Ce contenu a été publié dans Proposition de travail, Thèse. Vous pouvez le mettre en favoris avec ce permalien.

Laisser un commentaire

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l'aide de votre compte WordPress.com. Déconnexion / Changer )

Image Twitter

Vous commentez à l'aide de votre compte Twitter. Déconnexion / Changer )

Photo Facebook

Vous commentez à l'aide de votre compte Facebook. Déconnexion / Changer )

Photo Google+

Vous commentez à l'aide de votre compte Google+. Déconnexion / Changer )

Connexion à %s