Vers Un Corpus Monolingue Parallèle De Paraphrases Pour La Langue Arabe À Partir De Connaissances Web
Résumé: De nos jours, la langue arabe est de plus en plus utilisée sur le Web. On peut y trouver de nombreux articles dans tous les domaines. Cependant, il existe peu de travaux exploitant les connaissances Web comme ressources de données pour réaliser les différentes tâches du TAL. La réalisation de nouvelles applications en traitement automatique de la langue (TAL) pour l'arabe nécessite en premier lieu de développer une approche performante et robuste. Dans notre travail, nous abordons le problème de création automatique de corpus monolingues de paraphrases pour la langue Arabe afin de les utiliser pour entrainer un modèle de génération automatique de paraphrases dédiée à cette langue. Une évaluation qualitative humaine sur un échantillon de couples de phrases générées par notre approche, confirme que la qualité des paraphrases construites est bonne sémantiquement et syntaxiquement. L’utilisat ion de notre dataset pour entrainer un modèle de génération de paraphrases montre des résultats considérables nous permet de faire un grand pas pour palier le problème de manque ressources arabe. Mots clés : connaissances web, TAL, paraphrases, paraphrases, Dataset.
Mots-clès:
Nos services universitaires et académiques
Thèses-Algérie vous propose ses divers services d’édition: mise en page, révision, correction, traduction, analyse du plagiat, ainsi que la réalisation des supports graphiques et de présentation (Slideshows).
Obtenez dès à présent et en toute facilité votre devis gratuit et une estimation de la durée de réalisation et bénéficiez d'une qualité de travail irréprochable et d'un temps de livraison imbattable!