Vers Un Corpus Parallèle Monolingue Pour La Langue Arabe A Partir De Corpus Parallèle Bilingues
2021
Mémoire de Master
Informatique

Université Saad Dahleb - Blida

F
Feknous, Hind
S
Selhani, Imène

Résumé: La génération d’un corpus parallèle monolingue -dit corpus de paraphrases- en langue arabe peut remédier le problème de manque de données arabes et facilite beaucoup de tâches de TAL (Traitement Automatique de langage) tels que la traduction des textes, les systèmes de question-réponses … Dans notre travail nous abordons les techniques de génération des corpus de paraphrases, nous nous intéressons beaucoup plus aux approches guidées par les données, plus précisément une approche basée sur l’extraction de données à partir des corpus parallèles bilingues. Notre corpus a été généré en traduisant des couples de phrases extraits des corpus parallèles bilingues de différentes langues en langue arabe, ces couples ont été prétraités, alignés et évalués en impliquant différentes techniques y compris l’intervention d’une expertise humaine. Un modèle de génération de paraphrases nommé -EDAM- (conçu dans un travail précédent) a été utilisé pour entrainer un nombre considérable des couples considérés comme couples candidats-, et pour tester et enfin générer des paraphrases. Mots clés : corpus, paraphrase, corpus parallèle, Traitement Automatique de langage.

Mots-clès:

corpus
paraphrase
corpus parallèle
traitement automatique de langage
Nos services universitaires et académiques

Thèses-Algérie vous propose ses divers services d’édition: mise en page, révision, correction, traduction, analyse du plagiat, ainsi que la réalisation des supports graphiques et de présentation (Slideshows).

Obtenez dès à présent et en toute facilité votre devis gratuit et une estimation de la durée de réalisation et bénéficiez d'une qualité de travail irréprochable et d'un temps de livraison imbattable!

Comment ça marche?
Nouveau
Si le fichier est volumineux, l'affichage peut échouer. Vous pouvez obtenir le fichier directement en cliquant sur le bouton "Télécharger".
Logo Université


Documents et articles similaires:


footer.description

Le Moteur de recherche des thèses, mémoires et rapports soutenus en Algérie

Doctorat - Magister - Master - Ingéniorat - Licence - PFE - Articles - Rapports


©2025 Thèses-Algérie - Tous Droits Réservés
Powered by Abysoft