The Lipad Blog

What About the French Version? Qu'en est-il de la version française?

Digitizing the French version of the Hansard is a priority for our research team. Unfortunately, we are not able to release it at this time. The creation of a digitized textual database such as Dilipad requires many hours of work and is conducted entirely by academics and students. In particular, the optical recognition of special and accentuated characters in French would require adjusting the parameters of our source code and completing a testing phase in order to produce a digitized version of sufficient quality. We hope to complete this task as soon as possible and release the full version of the Hansard in both official languages. The creation of a bilingual database matters to us. It would give Canadians an easier access to parliamentary debates and would be a useful resource for applied research in natural language processing, for instance in the development of translation tools.

La numérisation de la version française du Hansard de la Chambre des communes est une priorité pour notre équipe. À l'heure actuelle, nous ne sommes malheureusement pas en mesure de rendre publique une telle version. La création d'une base de données textuelles comme Dilipad requiert de nombreuses heures de travail, et il s'agit d'un projet sans but lucratif mené par des universitaires. En particulier, la reconnaissance optique des caractères spéciaux et accentués dans la langue de Molière nécessite un recalibrage des paramètres de notre code source afin de produire une version numérisée de qualité satisfaisante. Nous espérons accomplir cette tâche dès que possible et rendre disponible la version numérisée du Hansard dans les deux langues officielles. La création d'une base de données bilingue nous tient à coeur: non seulement elle simplifierait l'accès aux débats parlementaires pour tous les Canadiens, quelle que soit leur langue maternelle, mais elle serait aussi une ressource utile pour la recherche, par exemple pour le développement d'outils de traduction dans le domaine du traitement automatique du langage naturel.

< Return to Blog

Ludovic Rheault

Assistant Professor, Department of Political Science, University of Toronto