OPALINe Annexe technique


1MB taille 14 téléchargements 354 vues
Programme d’Investissements d’Avenir

ANNEXE TECHNIQUE

PROJET OPALINE OUTILS POUR L'ACCESSIBILITE DES LIVRES NUMERIQUES Axe n°1 : Traduction / Transcription / Enrichissement de contenu Axe n°2 : Conversion de contenu Axe n°4 : Interfaces de contrôle adaptées

Projet OPALINe

ANNEXE TECHNIQUE

Historique du document Version du document V1

Date

Rédacteur

10/01/2017 BrailleNet

Commentaires/modifications 

Page 2 sur 74

Projet OPALINe

ANNEXE TECHNIQUE

Table des matières 1

Résumé du projet ................................................................................................................................ 4

1.1 Résumé exécutif ........................................................................................................................... 4 1.2 Mots clés ....................................................................................................................................... 6 1.3 Partenaires..................................................................................................................................... 7 1.4 Durée du projet et effort global ................................................................................................. 8 1.5 Résultats visibles attendus .......................................................................................................... 8 1.6 Contact coordinateur du projet ................................................................................................. 9 2 Description des travaux .................................................................................................................... 10 2.1 Planning et découpage par lots ................................................................................................ 10 2.1.1 Liste des lots ....................................................................................................................... 10 2.1.1 Planning prévisionnel général .......................................................................................... 10 2.2 Identification des partenaires responsables de chaque lot ................................................... 10 2.3 Description des lots ................................................................................................................... 11 2.3.1 Lot n°1 : Coordination ..................................................................................................... 11 2.3.2 Lot n°2 : Enrichissement structurel et sémantique du texte ....................................... 14 2.3.3 Lot n°3 : Edition collaborative ........................................................................................ 25 2.3.4 Lot n°4 : Transcription braille ......................................................................................... 36 2.3.5 Lot n°5 : Contrôle de l’accessibilité ................................................................................ 43 2.3.6 Lot n°6 : Interfaces de lecture accessibles ..................................................................... 51 2.3.7 Lot n°7 : Dissémination ................................................................................................... 66 2.4 Tableaux récapitulatifs .............................................................................................................. 71 2.4.1 Charge par lot et par partenaire ....................................................................................... 71 2.4.2 Dépenses par lot par partenaire ...................................................................................... 71 3 Les livrables ........................................................................................................................................ 72 3.1

Présentation des livrables.......................................................................................................... 72

Page 3 sur 74

Projet OPALINe

ANNEXE TECHNIQUE

1 RESUME DU PROJET 1.1

Résumé exécutif

Un projet innovant destiné à augmenter significativement le nombre de livres numériques accessibles aux handicapés visuels L’accessibilité des livres pour les personnes empêchées de lire du fait d’un handicap est un souci constant de la communauté du livre, papier comme numérique. D’après l’INSEE, environ 1,7 millions de personnes sont atteintes d’un tel handicap. Il est donc choquant de constater qu’à ce jour, ces personnes - aveugles, mal voyants ou dys* - ne disposent chaque année que de 6 ou 7 % d’ouvrages accessibles, et cela grâce aux associations qui réalisent les adaptations nécessaires : transcription braille, impression en gros caractères, lecture audio ou adaptation numérique. Depuis plusieurs années, le numérique est l’allié des déficients visuels et de nombreux projets ont permis d’augmenter le nombre de livres accessibles : plateforme de transfert des ouvrages numériques gérée par la BnF (PLATON), exception au droit d’auteur en faveur des personnes handicapées du 1er août 2006, avancées du consortium Daisy sur des formats numériques spécialisés, travaux du groupe “Normes et Standard” sur l'accessibilité du livre numérique au sein de la Commission numérique du SNE (Syndicat National du Livre), etc. Malgré toutes ces avancées, la quantité de livres accessibles est encore marginale en France et le niveau d’accessibilité des ouvrages n'est pas suffisant. Notre premier objectif est donc d’améliorer l’accès aux œuvres écrites pour les personnes empêchées de lire du fait d’un handicap, par la mise en place d'une chaîne expérimentale de traitement et de diffusion d'une grande quantité de livres du XXe siècle d'un haut niveau d'accessibilité. Notre second objectif est d'accompagner les acteurs français de l’édition dans leur transition vers des ouvrages numériques nativement accessibles, d'accompagner également le secteur spécialisé dans la mise en place de procédés techniques d'adaptation plus performants, d'étudier la mise en place d’une certification de l’accessibilité des livres publiés, et d'évaluer et améliorer l’accessibilité des outils de lecture numérique du marché. Sept Lots au service de l’accessibilité numérique des livres Le projet a pour ambition de développer cinq prototypes, réalisés chacun au sein d'un lot du projet, permettant d'améliorer significativement l’accessibilité numérique des livres pour les handicapés visuels. Ces cinq lots portent sur trois axes technologiques de l'appel à projets :  Les prototypes développés dans les lots 2 à 4 portent sur l'Axe Technologique 1 de l'Appel à projets et permettront de renforcer significativement la quantité de contenus accessibles pour les personnes en situation de handicap.  Le prototype du lot 5 relève de l'Axe technologique 2 de l'Appel à projets et facilitera la conversion de contenus numériques aux normes internationales en matière d'accessibilité numérique.  Les prototypes du lot 6 concernent l'Axe technologique 4 de l'Appel à projets et intègrent des interfaces de contrôle adaptées aux handicapés visuels sur des équipements numériques fixes et mobiles.

Page 4 sur 74

Projet OPALINe

ANNEXE TECHNIQUE

Les lots "Gestion de projet" et "Dissémination" viennent compléter le projet et permettront la bonne mise en œuvre de ces prototypes. La liste des lots du projet s'établit donc comme suit : Lot 1 : Gestion de projet Coordination du projet entre les différents partenaires. Lot 2 : Enrichissement sémantique du contenu textuel Un prototype d'outil automatique d'enrichissement structurel et sémantique du contenu des livres numériques améliorera l'accessibilité des textes grâce à l'utilisation de technologies d'ingénierie documentaire et de traitement automatique du langage naturel. Lot 3 : Édition collaborative Un prototype de chaîne d’édition collaborative de livres en SaaS destinée à la production de livres accessibles, basée sur une plateforme d'édition de livres open-source existante, permettra de faciliter significativement la mise sur le marché de livres numériques accessibles. Lot 4 : Transcription braille Un prototype de logiciel d'aide à la production de livres en braille permettra d'améliorer sensiblement la qualité du braille en la langue française au sein d'une chaîne d'adaptation spécialisée de livres numériques. Lot 5 : Contrôle de l'accessibilité Un prototype d’outils de contrôle du niveau d’accessibilité automatique permettra d'évaluer l'accessibilité des textes au format EPUB 3. Lot 6 : Interfaces de lecture accessibles Des prototypes d'applications de lectures, en environnement mobile et sur ordinateur, seront diffusés afin de tester la satisfaction des déficients visuels. Lot 7 : Dissémination Les enseignements du projet seront transmis auprès des éditeurs français et européens, afin de diffuser les meilleures pratiques d'adaptation native des livres numériques. Une équipe dédiée spécialisée et complémentaire dans les secteurs du livre numérique et de l’accessibilité Pour mener à bien le développement de ces prototypes, 5 partenaires (2 entreprises, 2 associations et 1 établissement de recherche) se sont associés :  L'association BrailleNet, qui a pour objet de favoriser l'accès au numérique pour les personnes handicapées, est le chef de file naturel de ce projet car la structure possède en interne une ingénierie technique et une connaissance des besoins des utilisateurs des prototypes. BrailleNet accompagnera la réalisation de l'ensemble des lots du projet et pilotera plus particulièrement les Lots 1 et 4.  L'équipe ALMAnaCH de l'Inria, spécialisée dans l'analyse du langage naturel à grande échelle, pilotera naturellement le Lot 2.  Le laboratoire EDRLab, laboratoire européen de lecture numérique, apportera son expertise sur le standard international EPUB 3 et pilotera les développements des Lot 5 et 6.  La société Prismallia adaptera sa plateforme d'édition Publiforge pour réaliser l'ambition du prototype du lot 3 de mettre en place une édition collaborative de livres accessibles.  Enfin, la société FeniXX, qui numérise et commercialise des livres du XXe siècle indisponibles dans leur format d'origine, mettra à disposition du consortium son Page 5 sur 74

Projet OPALINe

ANNEXE TECHNIQUE

catalogue de plus de 23 000 livres numériques pour tester à grande échelle les différents prototypes, et sera responsable du Lot 7. Le budget total du projet pour l'ensemble des partenaires est d’environ 1,2 millions d'euros sur une durée de 24 mois, avec un lancement des travaux de R&D de type "développement expérimental" au printemps 2017. Il est prévu que les prototypes soient livrés soient commercialisables ou utilisables dans le but d'une commercialisation de livres numériques accessibles avant la fin d'année 2019. Plusieurs embauches, chez les différents partenaires, sont prévues dans le cadre du projet.

1.2 Mots clés Secteur :  Livre  Livre numérique  Accessibilité handicapés visuels  Braille  Diffusion de livres  Distribution de livres  Editeurs  Edition spécialisée  Edition collaborative  Enrichissement structurel  Automatisation  Interfaces accessibles  Transcription Technologies :  Applications mobiles  HTML5  ePub et ePub 3  IPDF  Daisy  Logiciel GROBID  Logiciel DAISY Pipeline 2  Logiciel BibLouis  iOS  Mac  Androïd  PC

Page 6 sur 74

Projet OPALINe

ANNEXE TECHNIQUE

1.3 Partenaires Équipe Inria ALMAnaCH Inria, institut de recherche dédié au numérique, promeut « l’excellence scientifique au service du transfert technologique et de la société ». Inria emploie 2700 collaborateurs issus des meilleures universités mondiales, qui relèvent les défis des sciences informatiques et mathématiques. L’équipe-projet Inria ALMAnaCH (anciennement Alpage) est spécialisée dans le traitement automatique des langues (TAL). C’est une équipe multidisciplinaire, puisqu’elle est composée d’informaticiens (avec des compétences linguistiques) et de linguistes (avec des compétences informatiques), tous spécialisés en TAL. Les domaines d’application du TAL sur lesquels ALMAnaCH s’investit sont d’une part la linguistique empirique et d’autre part diverses applications telles que la recherche d’informations et la fouille de textes, y compris en collaboration avec le monde industriel. BrailleNet Chef de file du projet BrailleNet est une association loi 1901 exerçant des activités commerciales (formations, conseil, etc.), qui œuvre depuis 1997 pour l’accessibilité numérique en faveur de toutes les personnes qui, du fait d’un handicap, ont des difficultés pour utiliser les services et outils numériques. Sa mission : favoriser, grâce au numérique, l’inclusion sociale, professionnelle, scolaire et culturelle des personnes handicapées. BrailleNet propose de services dans deux principaux domaines : → Accessibilité des sites Web : audits, formations, conseils, etc. → Accessibilité des livres : adaptation de livres pour les personnes déficientes visuelles (1er producteur en France), diffusés via une bibliothèque numérique (www.bnfa.fr) qui compte plus de 40 000 références à son catalogue et 4 500 utilisateurs inscrits. Les services proposés par BrailleNet résultent de projets de R&D menés depuis la création de l'association (ANR, FUI, Europe, etc.). EDRLab L'European Digital Reading Lab (EDRLab) a pour mission de contribuer à des actions d’intérêt général dans les domaines de la lecture, de l’éducation et de l’accessibilité, et de soutenir les acteurs européens de l’édition impliqués dans la transition numérique de cette industrie, en les accompagnant dans le développement et l’utilisation de technologies ouvertes, interopérables et accessibles. FeniXX Créée en juillet 2014 par le Cercle de la Librairie, sous l’égide du Syndicat national de l’édition et en partenariat avec le Ministère de la Culture, pour numériser et commercialiser les ouvrages inscrits dans le registre ReLIRE de la Bibliothèque nationale de France, la société FeniXX (Fichier des Éditions Numériques des indisponibles du XXe siècle) a pour mission de : → Préserver le patrimoine éditorial du siècle dernier et lui permettre de revivre au format numérique ; → Rendre à nouveau disponibles au plus grand nombre un vaste corpus de livres de notre histoire culturelle récente ; Page 7 sur 74

Projet OPALINe

ANNEXE TECHNIQUE

→ Permettre aux éditeurs et aux auteurs de rester maîtres de la chaîne du livre numérique, et agir comme prestataire technique et commercial pour leur compte ; → Faciliter la mise en œuvre d’un dispositif juridique et économique respectueux du droit d’auteur et pionnier à l’échelle mondiale, redonnant une place aux œuvres indisponibles dans la société de l’information ; → Accompagner les éditeurs ayant souscrit une Licence d'exploitation exclusive auprès de la Sofia (Société Française des Intérêts des Auteurs de l’écrit), en prenant en charge gratuitement la numérisation et la commercialisation des livres indisponibles de leur catalogue passés en gestion collective. Prismallia Prismallia est expert en gestion de contenus et technologies de publication. Depuis 2009, Prismallia accompagne les éditeurs dans leur transformation numérique, et leur offre les outils et les plateformes technologiques pour créer et publier sur tous les supports. La société a notamment développé la plateforme open source Publiforge, qui permet l'édition de contenus complexes vers de nombreux formats, en ligne et de façon collaborative. Adepte du logiciel libre, Prismallia promeut les standards (HTML, EPUB) et accorde une grande attention à l'accessibilité et à l'interopérabilité de ses solutions. Ses prestations vont de la structuration de contenus et bases de données, au développement d'applications (desktop, mobiles) et de sites web.

1.4 Durée du projet et effort global Durée du projet : 24 mois Début prévisionnel : 1 mai 2017 Effort global : 10,3 hommes.an

1.5 Résultats visibles attendus Le fil rouge de ce projet de R&D est, une fois tous les prototypes développés, d’augmenter significativement la quantité de livres numériques accessibles aux handicapés visuels. Le principe même des prototypes qui vont être construits dans les différents sous-projets reste de valider concrètement les solutions techniques qui vont permettre de lever les verrous et difficultés qui se dressent encore devant le développement de la lecture numérique pour les personnes empêchés à cause d’un handicap visuel. De plus, ces mêmes prototypes, afin qu'ils soient vraiment utiles aux différentes expérimentations qui vont être menées, vont impliquer des professionnels des différents métiers du livre numérique et de l’accessibilité pour les déficients visuels. Pour chaque sous-projet, on trouvera dans le tableau ci-dessous les résultats concrets qui pourront être observés.

Page 8 sur 74

Projet OPALINe Lot 2 3 4 5 6

ANNEXE TECHNIQUE

Résultats concrets de l'expérimentation, prototypes développés Un prototype d'outil automatique d'enrichissement structurel et sémantique du contenu des livres numériques Un prototype de chaîne d’édition collaborative de livres en SaaS destinée à la production de livres accessibles Un prototype de logiciel d'aide à la production de livres en braille Un prototype d’outils de contrôle du niveau d’accessibilité automatique Deux prototypes d'application de lecture de livres numériques au format EPUB :  Une version desktop, pour PC et Mac OS  Une version mobile (smartphones et tablettes), pour iOS et Android

1.6 Contact coordinateur du projet Nom : Bernier Prénom : Alex Société : BrailleNet Adresse : 12 bis, avenue Maurice Thorez Ville : 94200 Ivry sur Seine Mail : [email protected] Téléphone : 01 85 09 05 13

Page 9 sur 74

Projet OPALINe

ANNEXE TECHNIQUE

2 DESCRIPTION DES TRAVAUX 2.1 Planning et découpage par lots 2.1.1

Liste des lots

Lot N°1 N°2 N°3 N°4 N°5 N°6 N°7

Intitulé du lot Coordination Enrichissement Edition collaborative Transcription braille Contrôle de l’accessibilité Interfaces de lecture accessibles Dissémination

Début 01/05/17 01/05/17 01/05/17 01/11/17 01/05/17 01/05/17 01/05/17

Fin 30/04/19 31/08/18 30/04/19 01/01/19 30/04/19 30/04/19 30/04/19

Durée 24 mois 16 mois 24 mois 15 mois 24 mois 24 mois 24 mois

2.1.1 Planning prévisionnel général Le planning ci-dessous montre l’articulation des 7 lots du projet OPALINe dans le temps.

2.2 Identification des partenaires responsables de chaque lot Lot

Intitulé du lot

N°1 N°2 N°3 N°4 N°5 N°6 N°7

Coordination Enrichissement Edition collaborative Transcription braille Contrôle de l’accessibilité Interfaces de lecture Dissémination

Partenaire responsable BrailleNet Inria-ALMAnaCH Prismallia BrailleNet EDRLab EDRLab BrailleNet

Autres partenaires impliqués Tous les autres membres du Consortium FeniXX, BrailleNet, EDRLab Tous les autres membres du Consortium EDRLab, FeniXX BrailleNet, FeniXX BrailleNet, FeniXX Tous les autres membres du Consortium Page 10 sur 74

Projet OPALINe

ANNEXE TECHNIQUE

2.3 Description des lots 2.3.1

Lot n°1 : Coordination

Date de début : T0 Date de fin : T0+24 Partenaire responsable : BrailleNet Partenaires impliqués : EDRLab, FeniXX, Inria-ALMAnaCH, Prismallia A. Objectifs Ce lot est dédié à l’ensemble des travaux de pilotage et de coordination du projet : - Mise en place d’un environnement de développement collaboratif et d'outils de gestion de projets ; - Organisation des comités de pilotage ; - Suivi de chaque membre du consortium ; - Gestion des tâches administratives ; - Validation des livrables et organisation des réunions bilan ; - Modifier cette section B. Démarche détaillée Tâche 1.1 : Pilotage stratégique et technique du projet Les partenaires réunis en consortium ont choisi d’organiser le suivi des travaux qui constituent le programme de R&D proposé et intitulé OPALINe grâce à un outil de gestion de projets en ligne, proposant un gestionnaire de tâches, un Wiki, des fonctionnalités permettant d'être relié aux principaux outils de gestions de version de code source, etc. De manière générale l'outil retenu devra permettre de gérer le travail collaboratif entre un nombre élevé de personnes. La structure et l’organisation des processus internes de cet outil seront définis et mis en place en parallèle du démarrage effectif des différents lots afin que cet outil de gestion de projet soit opérationnel lors du lancement des premiers développements techniques. Les membres du comité de pilotage du projet se sont déjà réunis pour évaluer plusieurs outils qui pourraient correspondre aux besoins du programme : Redmine semble le plus approprié pour l'ensemble des partenaires, de par ses fonctionnalités et son niveau d'accessibilité. L'outil permettra d’avoir à disposition un système de communication et d’échange complet, ouvert et collaboratif (messages, échanges de documents, stockage, organisation de réunions, planification des tâches, …). L'outil facilitera aussi un reporting efficace du travail de chacun et l’organisation des comités de pilotage (point d’avancement des sous-projets, aléas rencontrés, utilisation des ressources, dernières versions de documents disponibles, etc.). Le pilotage technique du projet sera aussi intégré à l'outil de gestion du programme avec les mêmes principes de fonctionnement que pour le pilotage stratégique. Chaque partenaire Page 11 sur 74

Projet OPALINe

ANNEXE TECHNIQUE

nommera, lors du démarrage de chaque sous-projet un chef de projet technique responsable de l’avancement des tâches dans sa propre structure. Sur demande, à tout moment, il sera possible d’extraire de l'outil les informations détaillant l’état des sous-projets (reporting) qui précisera l’état d’avancement des différentes tâches, les avances ou les retards éventuellement constatés, l’identité des personnes en charge de telle ou telle tâche, etc. Livrable de la tâche 1.1 Livrable 1 : T0+1 : outil de gestion de projets déployé et paramétré (comptes des différents participants, création des lots et tâches, etc.) / Partenaires : BrailleNet, Prismallia, FeniXX, InriaALMAnaCH, EDRLab. Tâche 1.2 : Gestion administrative et financière du projet La gestion administrative, juridique et financière du projet sera assurée par l’équipe de BrailleNet, en sa qualité de chef de file du programme. Cette gestion sera aussi assurée grâce à l'outil de gestion du projet. Le projet sera doté d’un comité de pilotage et d’une équipe projet. Le comité de pilotage, constitué des partenaires ou de leur représentant, aura pour vocation : - de déterminer et de valider les actions mises en œuvre dans le cadre du projet ; - de s’assurer du bon déroulement de leur mise en œuvre ; - de valider chaque phase du projet pour autoriser le passage à la phase suivante ; - et de rendre les arbitrages nécessaires si besoin est. Pour assurer la gouvernance du projet, un comité de pilotage sera mis en place. Chaque partenaire désignera une personne le représentant; il se réunira au moins tous les 3 mois pendant la durée du projet. Il aura pour vocation : - de s’assurer du bon déroulement des travaux ; - de déterminer et de valider les actions mises en œuvre dans le cadre du projet, notamment au niveau de la dissémination des résultats ; - de rendre les éventuels arbitrages nécessaires au sein du consortium si besoin est. Des réunions techniques se tiendront entre les partenaires, autant que nécessaire, afin de mener à bien les travaux prévus par le programme. C’est le chef de file du projet - BrailleNet - qui assurera l’animation des différents comités de pilotage et réunions de travail. Chaque sous-projet débutera par une réunion du comité de pilotage qui définira les objectifs généraux du lot concerné, les tâches préliminaires à effectuer, une mise à jour du planning des tâches et nommera les responsables opérationnels au sein du sous-projet.

Page 12 sur 74

Projet OPALINe

ANNEXE TECHNIQUE

Livrables de la tâche 1.2 La réalisation de l’ensemble des livrables de la tâche 1.2 sera exécutée par le partenaire BrailleNet. Livrable 2 : T0+1 : Compte-rendu de la réunion de démarrage ; Livrable 3 : T0+3 : Compte-rendu de réunion du comité de pilotage à T0+3; Livrable 4 : T0+6 : Compte-rendu de réunion du comité de pilotage à t0+6; Livrable 5 : T0+9 : Compte-rendu de réunion du comité de pilotage à T0+9; Livrable 6 : T0+10 : Proposition d'accord de consortium ; Livrable 7 : T0+12 : Compte-rendu de réunion du comité de pilotage à T0+12 ; Livrable 8 : T0+12 : accord de consortium signé par tous les partenaires ; Livrable 9 : T0+12 : Rapport d’avancement annuel T0+12 ; Livrable 10 : T0+15 : Compte-rendu de réunion du comité de pilotage à t0+15; Livrable 11 : T0+18 : Compte-rendu de réunion du comité de pilotage à T0+12 ; Livrable 12 : T0+21 : Compte-rendu de réunion du comité de pilotage à t0+21; Livrable 13 : T0+24 : Rapport d'avancement annuel T0+24 ; Livrable 14 : T0+24 : Rédaction de l'ensemble des livrables du projet pour chaque sous-projet ; Livrable 15 : T0+24 : Compte-rendu des réunions de coordination technique. Livrable 16 : T0+24 : Rédaction du rapport final du projet OPALINe.

C. Budget détaillé du Lot N°1 « Coordination »

Dépenses de personnel du partenaire BrailleNet Tâches 1.1 Pilotage stratégique et technique du projet 1.2 Gestion administrative et financière du projet

TOTAL

Total Lot 1

Profil personnel

Taux Horaire

Nb jours

Nb Heures

Montant*

Assistant gestion de projet

24,59

2

14

344,26

Assistant gestion de projet

24,59

48

336

8 262,24

50

350

8 606,50

8 606,50€

* Les montants sont en euros

Page 13 sur 74

Projet OPALINe 2.3.2

ANNEXE TECHNIQUE

Lot n°2 : Enrichissement structurel et sémantique du texte

Date de début : T0 Date de fin : T0+16 Partenaire responsable : Inria-ALMAnaCH Partenaires impliqués : EDRLab, FeniXX, BrailleNet A. Objectifs L'accessibilité des livres et autres documents numériques pour les personnes déficientes visuelles se caractérise par le respect de plusieurs exigences, parmi lesquels on peut citer : → La possibilité pour l'utilisateur de mettre en œuvre une navigation précise, qui permet par exemple d'accéder directement au résumé d'un document, à la quatrième de couverture d'un livre, de passer rapidement de chapitre en chapitre ou de section en section, d'accéder à (ou d'éviter) une note de bas de page, etc. ; → La bonne restitution par une synthèse vocale (notamment la prononciation correcte des mots) ; → La restitution correcte en braille (c'est-à-dire le respect des codes braille en vigueur, la césure correcte des mots, etc.). Pour respecter ces exigences, la structure du document doit être enrichie de manière précise. Cela signifie que le fichier source du document doit contenir un des informations sémantiques précises sur la nature de chaque élément : titre, note de bas de page, numéro de page, nom propre, etc. Pour le format EPUB 3, cela se fait à l'aide d'attributs sémantiques DPUB-ARIA définis très récemment par l'IDPF et le W3C1. D'autres formats basés sur le XML (comme DAISY XML DTBook, la TEI, ZedAI, etc.) proposent des grammaires suffisamment précises pour répondre à ces besoins. Par ailleurs, une synthèse vocale efficace requiert un balisage des mots étrangers et des entités nommées (noms de personnes, lieux, sociétés, etc.), traitement qui n'est actuellement pas réalisé par les outils de synthèse du marché. Ceci est nécessaire afin d'associer à ces mots une prononciation phonétique, qui viendra se substituer à celle par défaut du moteur de synthèse, ceci afin que les mots soient correctement prononcés afin d'être compris. En effet, le français compte de nombreuses ambiguïtés qui rendent parfois sa prononciation difficile à déterminer. C'est par exemple le cas des homographes hétérophones (les mots qui s'écrivent de la même façon mais se prononcent différemment) : le mot "convient" a par exemple une prononciation différente, selon qu'il s'agisse du verbe convenir conjugué à la troisième du présent de l'indicatif, ou du verbe convier conjuguer à la troisième personne du pluriel du présent de l'indicatif. Les noms propres peuvent également créer des ambiguïtés : "marquez" peut être un nom de famille pour lequel le "z" final est vocalisé, ou bien le verbe "marquer" conjugué pour lequel le "z" est muet. Enfin, le braille nécessite également la détection de noms propres, ceux-ci devant subir un traitement spécifique dans le cas d'une restitution du document en braille abrégé. 1

DPUB-ARIA (2016), https://www.w3.org/TR/dpub-aria-1.0/

Page 14 sur 74

Projet OPALINe

ANNEXE TECHNIQUE

Afin d'augmenter le nombre et la qualité des documents accessibles, il est donc indispensable d'améliorer les outils d’adaptation des contenus couvrant ces enrichissements. Ces outils reposant aujourd'hui quasiment exclusivement sur un travail manuel, nous proposons d'automatiser une part importante des opérations d'adaptation. Les progrès des techniques d'apprentissage automatique, en particulier appliquées au traitement de documents et du contenu textuel, ont été très soutenus ces dernières années et ouvrent des perspectives prometteuses et nouvelles dans le domaine de l'accessibilité. L'objectif de ce lot est de tirer partie de l'état de l'art des techniques d'apprentissage automatique afin d'enrichir automatiquement un document selon deux axes : structure logique d'un ouvrage numérique et entités nommées. B. Démarche détaillée Tâche 2.1 : Analyse des besoins Période : T0 à T0+2 Partenaires impliqués : ALMAnaCH, BrailleNet Cette tâche a pour objectif de réaliser une analyse qui permettra de définir précisément à quels besoins devront répondre les outils développés dans ce lot, notamment : - Le niveau attendu de structuration des documents (parties, chapitres, sous-chapitres, sections pour la structure générale, et éléments "plus "fins" tels que les résumés, les index, les notes, etc.) ; - Les types d'entités nommées à détecter ; - Une description des corrections de prononciation à apporter aux principaux outils de synthèse vocale du marché. L'analyse des besoins sera fondée sur : - L'analyse des règles du Code Braille Français Unifié (CBFU) et du code braille abrégé orthographique français ; - Une enquête réalisée auprès des 4500 utilisateurs de la Bibliothèque Numérique Francophone Accessible (BNFA) gérée par BrailleNet, auxquels sera proposé un questionnaire qui leur permettra d'indiquer les problèmes de prononciation rencontrés fréquemment lors de la consultation de livres audio en voix de synthèse. Livrable 1 : Questionnaire en ligne destiné aux utilisateurs de la BNFA Livrable 2 : Rapport d'analyse des besoins Tâche 2.2 : Outil automatique d'enrichissement structurel Période : T0+2 à T0+12 Partenaires impliqués : ALMAnaCH, BrailleNet → Point sur l’existant L’application de techniques d’apprentissage automatique, en particulier les CRF (Conditional Random Fields) pour la structuration de documents, a démontré qu’il était possible d’obtenir automatiquement des performances très élevées, parfois comparables à celles de documentalistes. Page 15 sur 74

Projet OPALINe

ANNEXE TECHNIQUE

L’application de telles techniques en vue d’automatiser l’accessibilité de documents n’a encore jamais été explorée. Le logiciel GROBID2 permet l’extraction automatique du contenu de documents scientifiques, en particulier de documents PDF. Développé à partir de 2008 par Patrice Lopez de l'équipe Inria ALMAnaCH, GROBID permettait initialement l’extraction de métadonnées (titre, auteurs, affiliations, résumé, mots-clefs, références bibliographiques, etc.). GROBID est également capable d'identifier aujourd'hui la structure logique de documents, comme les sections, paragraphes, titres, notes, etc. C'est aujourd'hui un outil de référence, utilisé en production par un nombre important de grands services documentaires scientifiques et techniques (CERN, NASA, OEB, INIST-CNRS, ResearchGate, Mendeley, MyScienceWork, Semantic Scholar, IOP, etc.), mais aussi dans l’archive nationale HAL pour faciliter le dépôt d’articles par les chercheurs. L’outil est régulièrement en tête des évaluations pour les tâches ciblées depuis 20133 et supporte des montées en charge sur plusieurs millions de PDF. Il s'agit d'un logiciel libre. Tâche 2.2.1 Adaptation du logiciel GROBID à l'identification des structures des livres numériques Partenaires impliqués : ALMAnaCH, BrailleNet Avec le support de BrailleNet sur les technologies liées à l'accessibilité des documents, l'équipe ALMAnaCH mettra à profit son expertise en intégrant au logiciel GROBID de nouvelles fonctionnalités nécessaires à l’automatisation de la production de documents accessibles : modèles d’apprentissage pour la détection générique de la structure globale d’un ouvrage, des composants d’un ouvrage, des notes, des tables des matières, des annexes, etc. La structuration globale d’un ouvrage sera alignée automatiquement sur une table des matières en assurant la cohérence logique des structures. D'autre part, GROBID est actuellement spécialisé dans des documents scientifiques courts et devra faire l'objet d'une adaptation et de tests spécifiques pour des œuvres littéraires de potentiellement plusieurs centaines de pages. Livrable 3 : Logiciel open source d'annotation structurelle de livres numériques Tâche 2.2.2 Création et curation de données d'apprentissage dédiées Partenaires impliqués : ALMAnaCH, BrailleNet Afin d'obtenir des résultats fiables pour les livres numériques comparables à ceux observés pour les documents scientifiques, il est nécessaire de disposer de suffisamment de données d'entraînement spécifiques. Nous exploiterons pour cela deux approches complémentaires : 1) La disponibilité au sein du consortium de livres numériques déjà structurés manuellement, qui constitueront des données d'entrainement fiables après un effort de conversion de formats. Cette approche permet d'obtenir rapidement un modèle de

GROBID (2008-2017), http://github.com/kermitt2/grobid, démonstrateur : http://grobid.science-miner.com M. Lipinski et al. Evaluation of Header Metadata Extraction Approaches and Tools for Scientific PDF Documents, in Proceedings of the 13th ACM/IEEE-CS Joint Conference on Digital Libraries (JCDL), Indianapolis, IN, USA, 2013. 2 3

Page 16 sur 74

Projet OPALINe

ANNEXE TECHNIQUE

qualité, mais qui peut s'avérer trop spécialisé sur les livres numériques d'entrainement (overfitting) et faible sur de nouvelles mise en page ; 2) L'utilisation de fonctionnalités existantes du logiciel GROBID permettant de générer semi-automatiquement des données d'entrainement à partir de documents non structurés et d'un modèle existant. Cette approche complémentaire permet d'augmenter la robustesse du modèle en ajoutant de la variété dans le corpus d'apprentissage. Elle nécessite cependant une étape de correction manuelle partielle couteuse et doit donc être combinée à un contrôle de la courbe d'apprentissage du modèle et à des tests permettant de suivre les gains de performance. Livrable 4 : Corpus d'apprentissage au format TEI de livres numériques avec annotations structurels. Tâche 2.2.3 Formats et interopérabilité Partenaires impliqués : ALMAnaCH, BrailleNet, EDRLab Les documents à traiter dans le cadre de ce projet sont de deux ordres : - D'une part des documents aux formats PDF et XML ALTO, qui correspondent à des formats brutes dont le texte disponible n'est pas du tout structuré. PDF reste le format le plus courant pour les livres numériques. BrailleNet par exemple dispose d'un fond de plusieurs milliers de livres numériques dans ce format. Le format XML ALTO est pour sa part utilisé dans le cas de livres numérisés à partir de leur version imprimée. - D'autre part des documents au format EPUB 3 (donc aux structures html5), dans lesquels seules certaines structures sont balisées. Supporter ce format ouvrira un nouveau champ d'application à l'outil GROBID. Pour ces deux types d'entrées GROBID produira un document TEI encodant le contenu textuel et les structures automatiquement identifiées. Le format TEI est utilisé par ALMAnaCH comme format pivot générique pour agréger à la fois le contenu textuel structuré et d'autres types d'annotations. Le document TEI enrichi sera finalement converti en format EPUB 3 enrichi à l'aide d'attributs sémantiques DPUB-ARIA, particulièrement pertinents pour notre objectif d’accessibilité. Livrable 5 : Module d'enrichissement structurel basé sur GROBID supportant les formats PDF, XML ALTO et EPUB3 en entrée et produisant des résultats sous format TEI et EPUB 3 enrichi, intégrable dans l'architecture logicielle globale du projet par une interface web RESTful. → Contribution des partenaires Avec le support de BrailleNet dans le domaine des technologies liées à l'accessibilité des documents, ALMAnaCH mettra en œuvre les différentes adaptations nécessaires au logiciel GROBID, au corpus d'apprentissage ainsi que la conversion au format EPUB 3. EDRLab apportera à cette tâche son expertise des formats EPUB 3. BrailleNet apportera son expertise sur les formats XML ALTO.

Page 17 sur 74

Projet OPALINe

ANNEXE TECHNIQUE

→ Verrou technique La fiabilité des meilleures techniques de structuration automatique de document, qui sont supervisées, dépend aujourd’hui essentiellement de la qualité et du volume des données d’entrainement. BrailleNet a produit au cours des dernières années un corpus important de documents structurés manuellement en vue de l’adaptation en ressources accessibles. D'autre part FeniXX dispose d'un grand volume de livres à la fois au format PDF et EPUB 3. Une telle richesse de ressources structurées est une opportunité singulière que nous exploiterons comme données d’entrainement afin d'obtenir un apprentissage automatique optimal. Tâche 2.3 : Détection d'entités nommées Période: T0+6 à T0+12 Partenaires impliqués : ALAMnaCH, BrailleNet Les documents au format TEI produits lors de la tâche précédente feront l'objet d'un enrichissement visant à identifier les entités nommées ainsi que les mots étrangers. L'équipe ALMAnaCH possède une forte expérience en reconnaissance et en désambiguïsation automatique d'entités nommées pour le français avec en particulier le développement d'un corpus annoté basé sur des articles du journal le Monde et l'implémentation d'un outil de reconnaissance d'entités nommées basé sur les CRF nommé grobid-ner. Ce dernier présente en particulier des performances de l'état de l'art et est capable de traiter 40 000 mots par seconde sur un serveur de bas de gamme. Pour les entités nommées correspondants à des noms propres (c'est-à-dire avec majuscule) de personnes, lieux et organisations, les performances sur le français dépassent 0.95 en score f0. Comme GROBID, cet outil est également un développement Open Source4. Tâche 2.3.1 Adaptation du logiciel de reconnaissance d'entité nommée Partenaires impliqués : ALMAnaCH, BrailleNet Avec le support de BrailleNet, l'équipe ALMAnaCH adaptera l'outil d'annotation existant dans l'optique de l'accessibilité des livres numériques :  Les types d'entités actuellement traités seront complétés pour couvrir le maximum d'entités courantes en français ;  Les mots étrangers qui ne correspondent pas à des entités nommées seront identifiés et la langue correspondante détectée ;  Le corpus d'entrainement, qui est actuellement constitué uniquement d'articles de presse, sera complété et adapté plus particulièrement aux livres numériques ;  La structure des livres numériques identifiée lors de la tâche précédente sera exploitée afin d'améliorer les performances de reconnaissance (les structures pouvant être exploitées sont par exemple les champs auteurs ou les notes bibliographiques qui sont explicitement reconnues par GROBID). Livrable 6 : Logiciel open source d'annotation d'entités nommées et de mots étrangers pour les livres numériques 4

(N)ERD (2013-2017), http://github.com/kermitt2/grobid-ner, démonstrateur : http://nerd.science-miner.com

Page 18 sur 74

Projet OPALINe

ANNEXE TECHNIQUE

Tâche 2.3.2 Création et curation de données d'apprentissage dédiées Partenaires impliqués : ALMAnaCH, BrailleNet Afin d'exploiter les adaptations réalisées précédemment, il est nécessaire de disposer d'un corpus d'apprentissage lui-même adapté. Cet effort est similaire à celui de la tâche 2.2.2 mais pour des annotations d'entités nommées. Il sera concentré essentiellement sur les types d'entités nommées non couverts par le corpus actuel d'apprentissage et la création d'un sous-corpus sur la base d'échantillons de textes de livres numériques disponibles au sein du consortium du projet. Livrable 7 : Corpus d'apprentissage au format TEI de livres numériques avec annotations d'entités nommées et de mots/termes non français. Tâche 2.3.3 Formats et interopérabilité Partenaires impliqués : ALMAnaCH, BrailleNet, EDRLab L'outil d'annotation d'entités nommées ALMAnaCH traite en entrée de préférence des documents TEI. L'outil produit des documents TEI enrichis où les entités nommées identifiées sont annotées sous forme d'annotations TEI standoff. Une conversion en format EPUB3 sera développée prenant en compte la nature particulière de ces annotations. Livrable 8 : Module d'enrichissement d'entités nommées basé sur grobid-ner supportant les formats EPUB3 et TEI en entrée et produisant des résultats sous format TEI et EPUB 3 enrichi, intégrable dans l'architecture logicielle du projet par une interface web RESTful. → Contribution des partenaires BrailleNet et ALMAnaCH mettront en œuvre les différentes adaptations nécessaires au logiciel grobid-ner ainsi que la conversion au format EPUB 3. EDRLab apportera à cette tâche son expertise des formats EPUB 3. Tâche 2.4 : Amélioration de la prononciation des entités nommées Période: T0+12 à T0+14 Partenaires impliqués : ALMAnaCH, EDRLab, BrailleNet L'objectif de cette tâche est de créer un outil permettant d'enrichir les documents avec des indications phonétiques pour corriger la prononciation de certains mots qui sont actuellement mal restitués par les moteurs de synthèse vocale du marché. Pour ce faire, nous utiliserons les résultats de la détection des entités nommées réalisée par les outils de la tâche précédente, et ajouterons des indications phonétiques en utilisant le standard SSML5 et par des lexiques PLS6. Cet outil d'enrichissement phonétique sera intégré au programme DAISY Pipeline 2 (précisément, au module "text to speech" qui pilote différents moteurs de synthèse).

5 6

SSML (Speech Synthesis Markup Language), https://www.w3.org/TR/speech-synthesis/ SSML in EPUB 3 Accessibility Guidelines, https://idpf.github.io/a11y-guidelines/content/tts/ssml.html

Page 19 sur 74

Projet OPALINe

ANNEXE TECHNIQUE

Livrable 9 : Module "text to speech" du DAISY Pipeline 2, intégrant la gestion des entités nommées, des changements de langue et des exceptions de phonétisation (support SSML et lexiques PLS). → Contribution des partenaires BrailleNet apportera à cette tâche son expérience dans le développement de modules pour DAISY Pipeline, ALMAnaCH son expertise en traitement automatique des langues et EDRLab son expertise des formats EPUB 3. Tâche 2.5 : Tests Période: T0+14 à T0+16 Partenaires impliqués : ALMAnaCH, BrailleNet, FeniXX L'objectif de cette tâche est de réaliser des tests des outils développés dans ce lot, sur un corpus important de documents, afin notamment d'en valider la pertinence en terme de qualité des traitements et de performances. Des métriques seront définies préalablement à l'exécution des tests pour évaluer la solution proposée (par exemple : nombre d'entités nommées détectées par seconde, ratio du nombre de titres de chapitres détectés par rapport au nombre de titres). Livrable 10 : Spécifications des caractéristiques des lots de tests Livrable 11 : Spécifications et code source de l'environnement de tests Livrable 12 : Constitution de lots de tests, sous la forme de fichiers sources des livres sélectionnés répondant aux spécifications, extraits des bases de BrailleNet et de FeniXX, dans différents formats (PDF, XML ALTO et EPUB) Livrable 13 : Rapport de tests → Apports des partenaires ALMAnaCH et BrailleNet auront en charge la spécification des caractéristiques des lots de tests. FeniXX et BrailleNet auront en charge la spécification d'un environnement de tests, permettant notamment l'automatisation de l'exécution des outils développés dans les tâches du Lot 2 sur les lots de tests. BrailleNet, FeniXX et ALMAnaCH développeront et mettront en place cet environnement de tests. FeniXX et BrailleNet interviendront ensuite pour : - Structurer un export des bases de données des ouvrages FeniXX et BrailleNet pour la réalisation des tests ; - Créer des "lots tests" de livres pour la mise au point des outils d'enrichissement, suivant les spécifications retenues, à partir de leurs catalogues respectifs (24 000 titres pour FeniXX, 31 000 titres pour BrailleNet). Enfin, BrailleNet pilotera l'exécution des tests. C. Evaluation des risques Techniquement, le risque se situe essentiellement sur le plan des performances des solutions développées : il s'agit de créer des outils pouvant traiter des documents volumineux là où l'existant est actuellement utilisé sur des documents de petite taille. Nous avons affecté une part Page 20 sur 74

Projet OPALINe

ANNEXE TECHNIQUE

importante de la main d'œuvre du projet en ingénieurs experts en développement, afin de minimiser ce risque. Au niveau du planning du projet, un certain nombre de tâches d'autres lots dépendent des résultats produits par les outils développés dans le lot 2. Le risque de retard est toutefois tempéré par la mise en place d'une période de 10 mois dédiée au développement des outils les plus complexes de ce lot, à savoir ceux de structuration automatique (tâche 2.2). Enfin, le risque que la qualité des documents enrichis produits automatiquement par les outils développés dans le cadre de ce lot s'avère insuffisante est présent et il remettrait en cause la possibilité d'atteindre un objectif important du projet, qui est, à terme, d'augmenter significativement le nombre de livres accessibles mis à disposition des personnes déficientes visuelles. Toutefois, une qualité insuffisante des documents produits automatiquement ne remettrait pas en cause l'exécution des autres lots du projet : BrailleNet et FeniXX disposent en effet déjà dans leurs catalogues, de documents enrichis manuellement qui pourraient être utilisés comme base de travail pour les autres lots du projet. D. Tâches et livrables du Lot 2  2.1 2.2 2.2.1 2.2.2 2.2.3 2.3 2.3.1 2.3.2 2.3.3 2.4

2.5

Intitulé tâche Analyse des besoins Outil automatique d’enrichissement Adaptation du logiciel Création données d’apprentissage Formats et interopérabilité Détection entités nommées Adaptation du logiciel Création données d’apprentissage Formats et interopérabilité Amélioration de la prononciation des entités nommées Tests

Echéance

Intitulé livrable

Partenaires

T0 + 2 mois

L1 – Questionnaire BNFA L2 – Rapport d’analyse

ALMAnaCH BrailleNet

T0 + 12 mois L3 – Logiciel d’annotation ALMAnaCH structurelle livres numériques BrailleNet EDRLab L4 – Corpus d’apprentissage L5 – Module d’enrichissement structurel basé sur GROBID T0 + 12mois L6 – Logiciel d’annotation ALMAnaCH d’entités nommées BrailleNet L7 – Corpus d’apprentissage EDRLab L8 – Module d’enrichissement d’entités nommées T0 + 14 mois

T0 + 16 mois

ALMAnaCH L9 – Module « text to speech » BrailleNet EDRLab L10 – Caractéristiques lot test ALMAnaCH L11 – Environnement test BrailleNet L12 – Constitution lots test FeniXX L13 – Rapport de tests Page 21 sur 74

Projet OPALINe

ANNEXE TECHNIQUE

→ Articulation avec d'autres lots Les travaux réalisés dans ce lot s'articulent avec ceux des lots 3, 4 et 6 : 1/ Les outils de structuration (tâche 2.2) et de détection des entités nommés (tâche 2.3) seront intégrés à la chaîne d'édition collaborative (lot 3). 2/ La détection des entités nommées (tâche 2.3) est utilisée pour améliorer la transcription en braille (lot 4). 3/ La tâche 2.4 sera suivie de l'intégration de possibilités d'amélioration de la prononciation dans les applications de lecture développées par EDRLab et BrailleNet au sein du lot 6.

E. Budget détaillé du Lot N°2 « Enrichissement »

Dépenses de personnel du partenaire ALMAnaCH Tâches

Profil personnel

2.1 Analyse des besoins 2.2.1 Outil enrichissement Adaptation logiciel 2.2.2 Création données apprentissage 2.2.3 Formats et interopérabilité 2.3.1 Outil entités nommées Adaptation logiciel 2.3.2 Création données apprentissage 2.3.3 Formats et interopérabilité 2.4 Amélioration prononciation entités 2.5 Tests

Ingénieur expert

Taux Nb Nb Montant* Horaire jours Heures 46,37 10 70 3 245,90

Ingénieur expert

46,37

80

560

25 967,20

Ingénieur expert

46,37

20

140

6 491,80

Ingénieur expert

46,37

40

280

12 983,60

Ingénieur expert

46,37

60

420

19 475,40

Ingénieur expert

46,37

10

70

3 245,90

Ingénieur expert

46,37

20

140

6 491,80

Ingénieur expert

46,37

10

70

3 245,90

Ingénieur expert

46,37

20

140

6 491,80

270

1 890

87 639,30

TOTAL

Sous-traitance ALMAnaCH Tâches

Sous-traitant

Montant*

Tâches Lot 2

Science-Miner – Soutien technique dév et encadrement

20 000,00

TOTAL

20 000,00

Dépenses de personnel du partenaire FeniXX Tâches

Profil personnel

2.5 Tests

Directeur des opérations Responsable technique Développeur Editrice spécialisée catalogue

TOTAL

Taux Nb Nb Montant* Horaire jours Heures 89 4 28 2 492,00 47 37 259 12 173,00 47 31 217 10 199,00 37 5 35 1 295,00

77

539

26 159,00

Page 22 sur 74

Projet OPALINe

ANNEXE TECHNIQUE

Dépenses de personnel du partenaire BrailleNet Tâches 2.1 Analyse des besoins 2.2.1 Outil enrichissement Adaptation logiciel 2.2.2 Création données apprentissage 2.2.3 Formats et interopérabilité 2.3.1 Outil entités nommées Adaptation logiciel 2.3.2 Création données apprentissage 2.3.3 Formats et interopérabilité 2.4 Amélioration prononciation entités 2.5 Tests

Profil personnel Ingénieur dev expert Ingénieur dev junior Technicien adaptation docu Ingénieur dev expert Ingénieur dev junior

Taux Nb Nb Montant* Horaire jours Heures 42,30 5 35 1 480,50 32,79 10 70 2 295,30 26,06 20 140 3 648,40 42,30 10 70 2 961,00 32,79 20 140 4 590,60

Technicien adaptation docu

26,06

40

280

7 296,80

Ingénieur dev expert Ingénieur dev junior Ingénieur dev expert Ingénieur dev junior

42,30 32,79 42,30 32,79

10 20 10 20

70 140 70 140

2 961,00 4 590,60 2 961,00 4 590,60

Technicien adaptation docu

26,06

40

280

7 296,80

Ingénieur dev expert

42,30

10

70

2 961,00

Ingénieur dev expert Ingénieur dev junior Ingénieur dev expert Technicien adaptation docu

42,30 32,79 42,30 26,06

20 40 5 20

140 280 35 140

5 922,00 9 171,20 1 480,50 3 648,40

300

2 100

67 855,70

TOTAL

Total Lot 2

201 654€

* Les montants sont en euros

F. Description des activités de sous-traitance Présentation des sous-traitants du Lot 2 : Science-Miner : SCIENCE-MINER est une entreprise fondée en juin 2015 dans le domaine de l’information scientifique et technique (IST). Le but de SCIENCE-MINER est de faire émerger des solutions innovantes en TDM (Text and Data Mining) à grande échelle et de fouille de textes scientifiques en s’appuyant sur des technologies d’apprentissage automatique émergentes et des outils de type Big Data. L’entreprise propose principalement des conseils dans le domaine des technologies pour l'information scientifiques et techniques, incluant l'ingénierie documentaire, la recherche d'information, l'analyse sémantique et la fouille de données textuelles. SCIENCE-MINER mène également le développement d’outils Open Source liés à son cœur d’activité et met à disposition des API sous forme de micro-services cloud en lien à ces développements.

Page 23 sur 74

G. Planning de développement du Lot 2

2.3.3

Lot n°3 : Edition collaborative

Date de début : T0 Date de fin : T0 + 24 mois Partenaire responsable : Prismallia Partenaires impliqués : BrailleNet, EDRLab, FeniXX, Inria-ALMAnaCH

A. Objectifs L'objectif de ce lot est de développer, de paramétrer et de tester un prototype de plateforme d'édition collaborative pour la production de livres accessibles, en adaptant la plateforme d'édition Publiforge. Cette chaîne d'édition collaborative est innovante à plusieurs titres : - Techniquement, car actuellement, il n'existe pas de tel environnement d'édition collaborative permettant de produire des contenus accessibles, et étant lui-même accessible aux personnes déficientes visuelles. - De par les conséquences organisationnelles que va avoir son déploiement : un environnement collaboratif va notamment permettre de structurer une communauté de professionnels de l'adaptation de documents, qui travaillent aujourd'hui souvent de façon isolée, rendant peu efficace la production de livres adaptés au niveau national. Les principaux verrous qu'il faudra lever pour réaliser cette chaîne d'édition collaborative sont les suivants : 1. La grande diversité des formats de documents qui devront être gérés en entrée 2. La difficulté de reconstituer un document complet, structuré et cohérent, à partir des fragments qui le composent, potentiellement édités par plusieurs personnes de manière concurrent.

B. Démarche détaillée Le prototype d'édition collaborative devra permettre l'édition de deux types de contenus : → des livres non-structurés et non enrichis à la base ; → des livres partiellement structurés enrichis, comme ceux issus du catalogue de l'association BrailleNet, afin de les améliorer. Il devra donc proposer des fonctionnalités adaptées à chaque utilisation. Les livres travaillés par la plateforme proviendront des catalogues de FeniXX et de BrailleNet, qui les mettent à disposition dans le cadre du projet. → Contexte D'une façon générale, le prototype profitera de la technologie et des fonctionnalités de Publiforge jugées pertinentes pour le projet. Les autres fonctionnalités seront développées spécifiquement et feront l'objet des tâches décrites ci-après. L'outil Publiforge7 est une plateforme de publication en ligne aux fonctionnalités étendues :  téléchargement et stockage de contenus variés (textes, XML, images, sons, vidéos...) ;  édition de contenus au format XML structuré ; 7

Documentation de PubliForge, http://doc.publiforge.org/

Projet OPALINe     

ANNEXE TECHNIQUE

gestion de versions ; recherche dans les métadonnées et à l'intérieur des fichiers ; workflow ; assemblage des fichiers en lots pour création des projets éditoriaux (granularité) ; transformation des fichiers vers des formats variés (EPUB, HTML, XML, mobi, base de données, PDF...).

Le prototype sera développé sur les mêmes bases techniques, à savoir du Python côté serveur et du HTML, CSS et JavaScript côté client. La technologie Python permet d'avoir une plateforme très réactive tout en pilotant de très nombreux logiciels du côté serveur : traitement d'images, manipulation XML, etc. Toutefois, l'usage de la technologie Javascript devra être adapté pour répondre aux critères d'accessibilité requis par les recommandations Web Content Accessibility Guidelines (WCAG) et Accessible Rich Internet Applications (ARIA) du W3C 8, afin que la plate-forme d'édition soit accessible aux personnes handicapées. Ce travail fait l'objet d'une tâche à part entière. Tâche 3.1 : analyse des besoins Période: T0 à T0+1 Partenaires impliqués : BrailleNet L'objectif de cette tâche est de réaliser une étude des besoins auprès de professionnels de l'adaptation de documents, qui permettra de déterminer :  Quelles sont, dans le processus d'adaptation, les tâches qui prennent le plus de temps  Quels sont les besoins des utilisateurs d'outils d'adaptation en termes d'ergonomie. Cette analyse viendra alimenter les tâches 3.3.2 à 3.3.4 (ergonomie, modules d'édition et d'affichage) et la tâche 3.7 (workflow). BrailleNet apporte ses compétences en ergonomie, ainsi que dans les processus d'adaptation de documents et son réseau de professionnels qui sera sollicité pour définir les besoins. Livrable 1 : Rapport d'analyse des besoins Tâche 3.2 : audit d'accessibilité de la plateforme Période: T0+1 à T0+4 Partenaires impliqués : Prismallia, EDRLab, BrailleNet Un audit de la plateforme sera réalisé pour évaluer les améliorations à apporter afin de s'approcher au plus près des exigences requises en termes d'accessibilité du module d'édition. Cette tâche sera réalisée en partenariat avec BrailleNet et EDRLab, qui feront bénéficier Prismallia de leur expertise technique sur ces questions. BrailleNet apportera ainsi ses compétences en audit d'accessibilité des sites Web. À l'issue de cette tâche, un cahier des charges sera émis pour la suite de la réalisation du lot 3.

8

DPUB-ARIA (2016), https://www.w3.org/TR/dpub-aria-1.0/

Page 26 sur 74

Projet OPALINe

ANNEXE TECHNIQUE

Livrable 2 : Un rapport d'audit décrivant les conformités et non conformités de la plateforme visà-vis des recommandations d'accessibilité WCAG et ARIA Livrable 3 : Un document de type cahier des charges comportant les recommandations à suivre pour corriger les non conformités. Tache 3.3 : Développement des modules fonctionnels Partenaires impliqués : Prismallia, ALMAnaCH, BrailleNet, EDRLab Tâche 3.3.1 : définition de la structure du format pivot Période: T0+4 à T0+6 Partenaires impliqués : Prismallia, ALMAnaCH, BrailleNet Il s'agira ici de définir précisément le format pivot, ou format d'édition de la plateforme. Ce travail sera réalisé en concertation avec les parties prenantes du projet, et particulièrement avec les équipes de BrailleNet et ALMAnaCH. La plateforme existante édite à ce jour tout type de format XML. À ce stade, les pistes suivantes ont été envisagées : 1. Edition au format pivot TEI, directement produit par le prototype GROBID (lot 2). 2. Conversion vers un format pivot spécifique au projet, qu'il conviendra de définir (en utilisant un schéma de type RelaxNg). 3. Conversion vers le format DTBook, ou DAISY XML9, ce qui faciliterait le travail des associations telles que BrailleNet, qui travaillent quotidiennement avec DAISY XML. Livrable 4 : un document spécifiant le format requis, et, dans le cas de l'option 2, le fichier de la structure du format pivot. Tâche 3.3.2 : ergonomie générale de l'édition Période : T0+4 à T0+8 Partenaires impliqués : Prismallia, BrailleNet, EDRLab L'ergonomie générale du module d'édition collaborative devra être spécifiée avant de démarrer son développement. Là où la tâche 3.2 visait à faire un audit d'accessibilité afin d'assurer que la plateforme soit utilisable par tous, l'objectif de cette tâche est de faire en sorte que le module d'édition permette aux opérateurs qui adaptent des livres d'être les plus performants possible : il s'agit de travailler sur l'optimisation des processus et des tâches liées à la mise en accessibilité de documents. À l'issue de cette tâche qui sera réalisée avec les partenaires BrailleNet et EDRLab, un cahier des charges technique fonctionnel sera émis. Livrable 5 : un cahier des charges technique et fonctionnel qui devra être appliqué en tâche 3.4 Tâche 3.3.3 : module d'affichage des fichiers entrant Période : T0+4 à T0+8 Partenaires impliqués : Prismallia, BrailleNet

9

DAISY XML http://www.daisy.org/tools/xml

Page 27 sur 74

Projet OPALINe

ANNEXE TECHNIQUE

Développement du module d'affichage des fichiers entrant. Ce module devra être capable d'interpréter les différents formats des documents entrants (EPUB 3, PDF, XML ALTO, DTbook) et de les afficher. Pour l'affichage de l'EPUB 3, il est envisagé de s'appuyer sur une base ReadiumJS10. Pour l'affichage du PDF, une solution compatible avec tous les types de navigateurs devra être trouvée : elle pourrait consister en la conversion en fichiers images (format compressé DjVu, conservant une haute qualité). Pour l'affichage DTbook, une conversion à la volée du format DTBook vers HTML sera mise en place. Le principal verrou identifié est la diversité des formats entrants, et la nécessité de développer intégralement quatre modules d'affichage distincts. Ces modules devront être testés à grande échelle pour anticiper un maximum de cas. FeniXX et BrailleNet mettront à disposition leur catalogue de titres après numérisation, qui contiennent des documents dans les formats souhaités. Livrable 6 : Module d'affichage PDF Livrable 7 : Module d'affichage XML ALTO Livrable 8 : Module d'affichage EPUB 3 Livrable 9 : Module d'affichage XML DTBook Tâche 3.3.4 : module d'édition collaborative Période : T0+8 à T0+15 Partenaires impliqués : Prismallia, BrailleNet Cette tâche s'effectuera d'après les cahiers des charges définis en tâches 3.1 (analyse des besoins), 3.2 (audit et préconisations pour l'accessibilité) et 3.3.2 (ergonomie). Cette tâche sera réalisée avec BrailleNet, qui y apportera ses compétences en programmation JavaScript et ARIA : - Paramétrage du module d'édition collaborative existant d'après le format d'édition retenu. C'est-à-dire le paramétrage de la prévisualisation et de la barre d'outils. - Renforcement de l’édition multi-utilisateurs dans le module d'édition, afin d'éviter les conflits lors de l'édition simultanée d'un même fichier. La réalisation de ces travaux passe par la diminution du niveau de granularité du contenu faisant l'objet d'un "verrouillage" lors de l'édition et de la gestion des conflits éventuels lors de l'édition simultanée. Le principal verrou identifié est l'utilisation massive du Javascript dans le module d'édition. Les composants Javascript devront être mis en conformité avec les spécifications ARIA du W3C pour être pleinement exploitables par les outils d'aides techniques utilisées par les personnes handicapées pour accéder à la plateforme. Livrable 10 : Le module d'édition rendu accessible, contenant les fonctionnalités permettant de gérer l'édition d'un même fichier par plusieurs utilisateurs. Tâche 3.4 : interface avec les outils d'enrichissement sémantique Période: T0+16 à T0+18 10

ReadiumJS http://readium.github.io/

Page 28 sur 74

Projet OPALINe

ANNEXE TECHNIQUE

Partenaires impliqués : Prismallia, EDRLab, BrailleNet, ALMAnaCH L'objectif de cette tâche est d'intégrer à la plateforme d'édition les outils réalisés par InriaALMAnaCH développés dans le lot 2 (enrichissement structurel et détection d'entités nommées), d'après les spécifications définies au cours du projet. Plusieurs scénarios sont envisagés, de manière non exclusive :  Appel d’outils depuis la plateforme d'édition, sur des fragments de texte  Exécution automatique à l'import de chaque nouveau lot, préalablement à l'édition de celui-ci. Livrable 11 : module d'import manuel et automatique de données issu du lot 2 dans la plateforme d'édition. Tâche 3.5 : traitements d'export Période: T0+18 à T0+21 Partenaires impliqués : Prismallia, EDRLab, BrailleNet Cette tâche a pour objectif de développement les traitements d'export des documents une fois adaptés. Ces traitements (processeurs) seront développés et intégrés à la plateforme pour permettre la transformation des ouvrages structurés vers tous les formats nécessaires à leur exploitation :  DTBook (pour conversion ultérieure en braille notamment)  EPUB 3.0.1 (produit fini)  EPUB 3.1 (produit fini) Livrable 12 : Processeur pour XML DTBook Livrable 13 : Processeur pour EPUB 3.0.1 Livrable 14 : Processeur pour EPUB 3.1 avec support des attributs EPUB-ARIA Tâche 3.6 : intégration du validateur d'accessibilité Période: T0+15 à T0+18 Partenaires impliqués : Prismallia, BrailleNet, EDRLab Il s'agit d'intégrer à la chaîne d'édition collaborative l'outil de vérification automatique de l'accessibilité des livres numériques au format EPUB réalisé dans le lot 5. Un rapport d'accessibilité du document sera ainsi présenté à l'adaptateur et des indications concernant les points restant à valider manuellement lui seront communiquées. Livrable 15 : Module de vérification de l'accessibilité basé sur l'outil développé à la tâche 5.4. Tâche 3.7 : mise en place du workflow Période: T0+15 à T0+18 Partenaires impliqués : Prismallia, BrailleNet

Page 29 sur 74

Projet OPALINe

ANNEXE TECHNIQUE

L'objectif de cette tâche est de définir et de réaliser le workflow général du dispositif d'adaptation, à savoir : - les automates d'import depuis la plateforme FeniXX vers la plateforme d'édition ; - les automates de lancement des outils d'enrichissement structurels et de détection des entités nommées - l'imbrication des tâches et de leurs intervenants sur la plateforme d'édition ; - les automates de vérification de l'accessibilité - les automates d'export. Livrable 16 : Un rapport définissant le workflow Livrable 17 : La plate-forme paramétrée selon le workflow défini Tâche 3.8 : tests et recette Période: T0+21 à T0+24 Partenaires impliqués : Prismallia, EDRLab, BrailleNet, FeniXX L'objectif de cette tâche est de tester de manière exhaustive la plateforme d'édition collaborative en produisant des documents expérimentaux rendus accessibles. FeniXX et BrailleNet se chargent de créer un "lot test" de livres pour la mise au point de l'outil d'édition collaborative suivant les spécifications retenues. BrailleNet conduira les tests : - En dédiant un technicien qui produira des documents expérimentaux - En impliquant son réseau de professionnel de transcripteurs/adaptateurs, afin de vérifier l'acceptation de la plateforme. Livrable 18 : Spécifications des caractéristiques des lots de tests Livrable 19 : Spécifications et code source de l'environnement de tests Livrable 20 : Lots de tests, sous la forme de fichiers sources des livres sélectionnés répondant aux spécifications, extraits des bases de BrailleNet et de FeniXX, dans différents formats (PDF, XML ALTO, EPUB et TEI issus du lot 2) Livrable 21 : Documents expérimentaux structurés Livrable 22 : Rapport de tests

C. Tâches et livrables du Lot 3 

Intitulé tâche

Echéance

Intitulé livrable

Partenaires

3.1

Analyse des besoins

T0 + 1 mois

L1 – Rapport d’analyse

BrailleNet

3.2

Audit accessibilité plateforme

T0 + 4 mois

L2 – Rapport d’audit L3 – CDC et recommandations

BrailleNet EDRLab Prismallia

L4 – Document spécifiant le

Prismallia

Développement modules 3.3.1 Déf. structure 3.3

T0 + 15 mois T0 + 6 mois

Page 30 sur 74

Projet OPALINe

ANNEXE TECHNIQUE

format pivot

3.3.2

Ergonomie générale édition

Modules affichage 3.3.3 fichiers entrant

format requis

T0 + 8 mois

T0 + 8 mois

L5 – CDC technique et fonctionnel L6 – Module d’affichage PDF L7 – Module d’affichage XML L8 – Module d’affichage Epub3 L9 – Module affichage DTbook L10 – Module d’édition accessible

3.3.4

Module édition collaborative

T0 + 15 mois

3.4

Outils d’enrichissement

T0 + 18 mois

L11 – Module d’import manuel et automatique

3.5

Traitement d’exports

T0 + 21 mois

L12 – Processeur pour XML L13 – Processeur pour Epub L14 – Proces. Pour Epub-ARIA

3.6

Validateur accessibilité

T0 + 18 mois

L15 – Module de vérification de l’accessibilité

3.7

Mise en place du workflow

T0 + 18 mois

3.8

Tests

T0 + 21 mois

L16 – Rapport déf. Workflow L17 – Dev plateforme L18 – Caractéristiques lot test L19 – Environnement test L20 – Constitution lots test L21 – Doc expérimentaux L22 – Rapport de tests

ALMAnaCH BrailleNet Prismallia BrailleNet EDRLab Prismallia BrailleNet Prismallia BrailleNet BrailleNet Prismallia EDRLab ALMAnaCH Prismallia BrailleNet EDRLab Prismallia BrailleNet EDRLab BrailleNet Prismallia BrailleNet EDRLab FeniXX Prismallia

→ Articulation avec d'autres lots Ce lot est partiellement dépendant du lot 2. En effet, les outils développés par Inria-ALMAnaCH seront intégrés à la plateforme d'édition et directement exécutables. La plateforme permettra ensuite l'édition du contenu enrichi. Il existe également une dépendance avec les outils de contrôle de l'accessibilité développés dans le lot 5, qui seront intégrés à la plateforme.

Page 31 sur 74

Projet OPALINe

ANNEXE TECHNIQUE

D. Budget détaillé du Lot N°3 « Edition collaborative »

Dépenses de personnel du partenaire BrailleNet Tâches

Profil personnel

3.1 Analyse des besoins

Ingénieur accessibilité Technicien adaptation docu

3.2 Audit accessibilité plateforme 3.3.1 Définition structure formats pivot 3.3.2 Ergonomie générale de l’édition 3.3.3 Modules affichage fichiers entrant 3.3.4 Module édition collaborative 3.4 Outils d’enrichissement 3.5 Traitement exports 3.6 Validateur accessibilité 3.7 Mise en place workflow 3.8 Tests

Taux Nb Nb Montant* Horaire jours Heures 47,21 5 35 1 652,35 26,06 10 70 1 824,20

Ingénieur accessibilité

47,21

20

140

6 609,40

Ingénieur dev expert

42,30

5

35

1 480,50

Ingénieur accessibilité Ingénieur dev expert Ingénieur dev junior Ingénieur dev expert Ingénieur dev junior Ingénieur dev expert Ingénieur dev junior Ingénieur dev expert Ingénieur dev junior Ingénieur dev expert Ingénieur dev junior Ingénieur dev junior Ingénieur dev expert Ingénieur dev junior Ingénieur dev expert Ingénieur accessibilité Technicien adaptation docu

47,21 42,30 32,79 42,30 32,79 42,30 32,79 42,30 32,79 42,30 32,79 32,79 42,30 32,79 42,30 47,21 26,06

10 5 10 5 15 5 20 5 5 5 5 5 5 10 5 15 90

70 35 70 35 105 35 140 35 35 35 35 35 35 70 35 105 630

3 304,70 1 480,50 2 295,30 1 480,50 3 442,95 1 480,50 4 590,60 1 480,50 1 147,65 1 480,50 1 147,65 1 147,65 1 480,50 2 295,30 1 480,50 4 957,05 1 6417,8

260

1 820

56 067,20

TOTAL

Dépenses de personnel du partenaire FeniXX Tâches

Profil personnel

3.8 Tests

Responsable technique Développeur

Taux Nb Nb Montant* Horaire jours Heures 47 5 35 1 645,00 47 1 7 329,00

TOTAL

6

42

1 974,00

Dépenses de personnel du partenaire ALMAnaCH Tâches 3.3.1 Définition structure formats pivot 3.4 Outils d’enrichissement

TOTAL

Profil personnel

Taux Horaire

Nb jours

Nb Heures

Montant*

Ingénieur expert

46,37

10

70

3 245,90

Ingénieur expert

46.37

10

70

3 245,90

20

140

6 491,80

Page 32 sur 74

Projet OPALINe

ANNEXE TECHNIQUE

Dépenses de personnel du partenaire EDRLab Tâches

Profil personnel

3.2 Audit accessibilité plateforme 3.3.2 Ergonomie générale de l’édition 3.4 Outils d’enrichissement 3.5 Traitement exports 3.6 Validateur accessibilité 3.8 Test

Taux Horaire

Expert accessibilité

48,60 48,60

Expert accessibilité

48,60 48,60

Expert accessibilité Expert accessibilité Développeur junior Expert accessibilité

41,45 48,60

TOTAL

Nb jours

Nb Heures

Montant*

5

35

1 697,50

5

35

1 697,50

5 5 5 5

35 35 35 35

1 697,50 1 697,50 1 450,75 1 697,50

25

175

9 938,00

Sous-traitance EDRLab Tâches

Sous-traitant

Montant*

Tâches 3.2, 3.3 et 3.5

Flux numérique – Société de conseil en système d’information et d’accompagnement d’entreprises sur des projets de R&D

9 900,00

Tâche 3.8

Noop – Développeur expert

5 500,00

TOTAL

15 400,00

Dépenses de personnel du partenaire Prismallia Tâches

Profil personnel

3.2 Audit accessibilité plateforme

CTO Développeur CTO Développeur CTO Développeur CTO Développeur CTO Développeur CTO Développeur Développeur Développeur Développeur Développeur

3.3.1 Définition structure formats pivot 3.3.2 Ergonomie générale de l’édition 3.3.3 Modules affichage fichiers entrant 3.3.4 Module édition collaborative 3.4 Outils d’enrichissement 3.5 Traitement exports 3.6 Validateur accessibilité 3.7 Mise en place workflow 3.8 Tests

TOTAL

Total Lot 3

Taux Nb Nb Montant* Horaire jours Heures 52,33 15 105 5 494,65 41,86 5 35 1 465,10 52,33 10 70 3 663,10 41,86 10 70 2 930,20 52,33 20 140 7 326,20 41,86 30 210 8 790,60 52,33 20 140 7 326,20 41,86 60 420 17 581,20 52,33 20 140 7 326,20 41,86 70 490 20 511,40 52,33 10 70 3 663,10 41,86 20 140 5 860,40 41,86 25 175 7 325,50 41,86 10 70 2 930,20 41,86 25 175 7 325,50 41,86 25 175 7 325,50

375

2625

116 845,05

200 716,05€

* Les montants sont en euros

Page 33 sur 74

Projet OPALINe

ANNEXE TECHNIQUE

H. Description des activités de sous-traitance Présentation des sous-traitants du Lot 3 : Noop : Noop (http://www.noop.fr/) est une société de développement informatique innovante, créée en 2016. La société est spécialisée dans les logiciels open-source pour les domaines de la vidéo à la demande et du livre numérique. Son créateur, Cyrille Lebeaupin, a été directeur technique d'UniversCiné VOD, et responsable technique du développement de la solution Médiathèque Numérique, pilotée par Arte. Il travaille depuis un an sur les projets d'EDRLab. Flux numérique : Flux Numérique (EURL) est une société de conseil en système d’information et d’accompagnement d’entreprises sur des projets de R&D. La société a été créée en aout 2013, son gérant et associé unique est Laurent Le Meur. Diplômé ingénieur de l'Ecole supérieure de Physique de Marseille (actuellement Centrale Marseille), Laurent Le Meur conduit des projets d'innovation pour des sociétés du monde des médias. Il s'intéresse particulièrement aux domaines suivants : plateformes multimédias, moteurs de recherche, recommandation collaborative, diffusion vidéo sur le Web, technologies sémantiques, interactions sociales sur le Web, usages des technologies xml et Web, livre numérique. Laurent Le Meur a été successivement responsable R&D de l'Agence France Presse, Directeur Etudes et Développement d'AlloCiné, Responsable R&D d'UniversCiné VOD. Il occupe depuis fin 2015 la position de Directeur Technique d'EDRLab.

Page 34 sur 74

E. Planning de développement du Lot 3

2.3.4

Lot n°4 : Transcription braille

Date de début : T0 +6 mois Partenaire responsable : BrailleNet Partenaires impliqués : EDRLab, FeniXX

Date de fin : T0 + 21 mois

A. Objectifs L'objectif de ce lot est de développer un ensemble d'outils automatiques de transcription braille : - Supportant la totalité des règles du Code Braille Français Uniformisé (CBFU) 11 édité en 2008 ainsi que celles du code braille abrégé orthographique étendu telles que présentées dans le manuel d'abrégé braille français édité en 2013 ; - Multi plate-forme ; - Performant et stable. L'innovation de ce lot réside dans le fait de supporter intégralement les règles du code braille français, ce qui n'est actuellement le cas d'aucun outil de transcription en braille. Nous mettons pour cela en œuvre une approche originale encore non testée dans ce contexte, qui consiste à utiliser des outils linguistiques, notamment le lexique Leff (Lexique des Formes Fléchies du Français)12 fourni par ALMAnaCH, qui nous permettra de traiter la complexité de la transcription en braille du français. Le processus de transcription d'un document en braille peut être décrit comme suit :  Une étape de traduction, c'est-à-dire la transformation d'une chaîne de caractères en une séquence de combinaisons de points braille ;  Une étape de formatage, c'est-à-dire le positionnement selon certaines règles, des éléments d'un texte original, sur une ligne, une page ou à l'intérieur d'un volume en braille, afin qu'ils soient correctement présentés, soit en version imprimée, soit sur un afficheur braille numérique. Ces outils de transcription seront utilisés pour traiter :  Les documents enrichis produits par les outils développés dans le lot 2 et traités dans la chaîne d'édition collaborative développée dans le lot 3 ;  Des documents "non enrichis", qui bénéficieront donc d'une qualité de transcription moindre. Les documents produits en braille par ces outils de transcription pourront être consultables :  Soit en version imprimée sur papier (produits par des imprimantes spécifiques nommées "embosseuse") ;  Soit en version numérique, sur des équipements nommés "afficheurs" ou "plages" braille éphémère.

Code braille français uniformisé : https://www.avh.asso.fr/fr/tout-savoir-sur-le-braille/lecriture-braille/codebraille-francais-uniformise 12 Leff: http://alpage.inria.fr/~sagot/lefff.html 11

Projet OPALINe

ANNEXE TECHNIQUE

La solution développée dans ce lot reposera sur deux briques principales :  Le logiciel DAISY Pipeline 213, et plus précisément ses modules dédiés au braille, qui sont responsables de l'interprétation d'un document XML, ainsi que du "pilotage" de la traduction et du formatage de ce document en braille. Cet outil est aujourd'hui largement utilisé dans le secteur de l'édition adaptée, par des producteurs de documents en braille, au niveau international ;  Le logiciel LibLouis14, une bibliothèque, utilisée par le DAISY Pipeline 2 pour assurer la traduction. LibLouis est le moteur de traduction braille utilisé par de nombreux logiciels du marché, notamment les lecteurs d'écran JAWS et NVDA pour Windows, la tablette braille InsideOne d'InsideVision, etc. DAISY Pipeline 2 est utilisé pour produire des documents en braille dans 2 principaux formats : 15  PEF (Portable Embossable Format) , un format destiné à l'archivage et à l'embossage  BRF, un format destiné à l'embossage et également utilisé par des afficheurs braille éphémère. Il est à noter que la solution développée dans ce lot est destinée à être intégrée dans des chaînes de production automatique : il ne s'agit pas d'un outil de transcription proposant une interface homme-machine destiné à être manipulé par un opérateur.

B. Démarche détaillée Tâche 4.1 : Analyse des besoins Période : T0+6 à T0+7 Partenaires impliqués : BrailleNet, EDRLab L'objectif de cette tâche est de réaliser une étude auprès de professionnels de la transcription en braille, afin d'identifier les erreurs les plus fréquentes réalisées par les programmes existants ainsi que les erreurs dont la correction est la plus coûteuse en temps, pour établir une liste hiérarchisée par ordre de priorités des fonctionnalités à implémenter dans la suite de la tâche. Livrable 1 : Rapport d'analyse des besoins Tâche 4.2 : Outil de traduction Période : T0+7 à T0+15 Partenaires impliqués : BrailleNet Cet ensemble de tâches a pour objectif d'améliorer le support du code braille français, dans le logiciel open-source LibLouis. En effet, LibLouis dispose actuellement d'un support parcellaire de ce code, qui empêche son utilisation dans des chaînes de production de documents pour lesquels le besoin de qualité de transcription est important.

DAISY Pipeline 2 : https://github.com/daisy/pipeline-assembly LibLouis, Open-source braille translator : https://github.com/liblouis/liblouis 15 PEF Format, The Portable Embosser Format : http://pef-format.org/ 13 14

Page 37 sur 74

Projet OPALINe

ANNEXE TECHNIQUE

Tâche 4.2.1 : Traduction en braille abrégé Période : T0+7 à T0+9 Un document imprimé en braille est volumineux. À titre d'exemple, "les misérables" de Victor Hugo représentent 47 volumes une fois transcrit en braille. Par ailleurs, la lecture tactile du braille est plus lente que la lecture visuelle ordinaire. Pour ces raisons, un code braille abrégé a été créé, avec deux objectifs : réduire l'encombrement des documents imprimés et accélérer la lecture et l'écriture du braille. Avec l'avènement du numérique, c'est surtout l'objectif d'améliorer les performances de lecture des personnes déficientes visuelles qui reste primordial. Il est ainsi important de disposer d'outils performants supportant le code braille abrégé français, notamment dans le contexte de production de documents longs. L'objectif de cette tâche est 'améliorer le moteur de traduction en braille abrégé de LibLouis pour supporter intégralement le code braille français. Nous adopterons une approche basée sur des lexiques, notamment Leff fourni par InriaALMAnaCH, qui nous permettra de détecter les différentes exceptions qui peuvent survenir pour la langue française, afin de définir des règles d'abrégement appropriées. Livrable 2 : Version de LibLouis supportant intégralement les règles de traduction du code braille abrégé français → Verrous Le principal verrou pour cette tâche réside dans le fait que le code braille abrégé pour le français est un code syllabique. Ainsi, comme pour la synthèse vocale, se pose le problème des "homographes hétérophones": le mot couvent ne s'abrège pas de la même façon lorsqu'il s'agit du nom commun désignant une maison de religieux et lorsqu'il s'agit du verbe couver conjugué. Nous utiliserons des lexiques pour détecter ce type de cas et pour définir des règles pour les traiter, couplées à la détection des entités réalisée par les outils du lot 2. Tâche 4.2.2 : Gestion de la césure de mots transcrits en braille abrégé Période : T0+10 à T0+12 L'objectif de cette tâche est d'implémenter dans LibLouis un algorithme de césure pour le code braille abrégé français. Celui-ci sera utilisé pour "couper" les mots en fin de ligne (i.e., les séparer par un tiret qui doit être situé entre deux syllabes). Livrable 3 : Algorithme et tables de césures pour le code braille abrégé, intégrés dans LibLouis. → Verrous Pour être correcte, la césure de mots abrégés doit respecter un certain nombre de règles, dont l'une d'entre elles spécifie par exemple que la seconde partie du mot coupé ne doit pas commencer par trois "signes inférieurs" (c'est-à-dire des signes braille dont seuls les points 2,3 5 et 6 sont utilisés) pour éviter toute confusion lors de la lecture. Ce type de règle implique de connaître la représentation du mot en braille abrégé avant de réaliser la césure, ce qui constitue un verrou, car il est nécessaire de réaliser un aller-retour entre l'algorithme de césure et l'algorithme d'abrégement. Comme pour la tâche précédente, nous nous baserons sur des lexiques pour détecter en amont ce type de cas. Page 38 sur 74

Projet OPALINe

ANNEXE TECHNIQUE

Tâche 4.2.3 : Levée d'ambiguïtés Période : T0+13 à T0+15 Certains mots ne doivent pas être abrégés car cela entraînerait des confusions lors de la lecture : l'abréviation serait ambiguë et pourrait être confondue avec celle d'un autre mot. L'objectif de cette tâche est de détecter ces d'ambiguïtés afin d'appliquer le traitement approprié aux mots en question lors de la traduction. En nous basant sur les données du lexique Leff, nous créerons un outil qui détectera à partir des mots du lexique les ambiguïtés potentiel lors de la traduction en abrégé et générera les règles appropriées qui seront ensuite intégrées à LibLouis. Livrable 4 : Outil de détection d'ambiguïtés et de génération de règles Tâche 4.3 : Outil de formatage Période : T0+15 à T0+18 Partenaires impliqués : BrailleNet Cette tâche a pour objectif d'intégrer dans le logiciel DAISY Pipeline2 le support des règles de formatage décrite dans le code braille français unifié. Ceci sera réalisé : - En définissant des feuilles de style "CSS braille" 16 décrivant la manière de présenter les différents éléments d'un document ; - En ajoutant les fonctionnalités manquantes au module de formatage braille du programme DAISY Pipeline 2, et éventuellement à la spécification "CSS braille". Les travaux suivants seront réalisés, consistant à développer de nouvelles fonctionnalités qui seront ajoutées au logiciel DAISY Pipeline 2 :  Adaptation du document à la taille (nombre de cellules) d'un afficheur braille cible ;  Intégration de la détection des entités nommées réalisée par les outils du lot 2 ;  Support des différentes méthodes de positionnement des notes (notes incises, de bas de pages, de fin de volume, etc.) ;  Support des méthodes de gestion de la pagination (pagination supérieure et inférieure, pagination de référence avec changement de numéro de page dans la page braille en cours, pagination de référence double, etc.) ;  Présentation des notes des transcripteurs ;  Présentation des tables des matières (générales et spécifiques en liste hiérarchisée) ;  Présentation des tableaux (présentés en colonnes, en lignes, et en renfoncements progressif, en liste hiérarchisée, etc.) ;  Présentation des notes marginales ;  Présentation de la poésie ;  Présentation du théâtre en prose et en vers. Livrable 5 : Règles de présentation pour le braille française en "CSS braille" Livrable 6 : Module pour le DAISY Pipeline 2 supportant les règles de formatage du braille français 16

CSS Braille : https://github.com/braillespecs/braille-css

Page 39 sur 74

Projet OPALINe

ANNEXE TECHNIQUE

Tâche 4.4 : Tests Période : T0+18 à T0+21 Partenaires impliqués : BrailleNet, EDRLab, FeniXX L'objectif de cette tâche est de valider la solution en utilisant un lot de tests qui sera créé par FeniXX et BrailleNet à partir des fichiers enrichis issus des lots 2 et 3 et à partir de fichiers "non enrichis". BrailleNet spécifiera et développera l'environnement de tests. Les tests seront conduits par BrailleNet et EDRLab. Des métriques seront définies préalablement à l'exécution des tests pour évaluer la solution proposée, notamment : - Performance : nombre de mots traduits par secondes; nombre de lignes formatées par secondes, etc. - Qualité : écart entre le nombre d'erreurs constatées dans un document produit automatiquement et dans un document manuellement - Progrès par rapport à l'existant : écart entre le nombre d'erreurs dans un document produit par l'existant (version des outils de traduction avant le projet) et par la solution développée Livrable 7 : Spécifications des caractéristiques des lots de tests Livrable 8 : Spécifications et code source de l'environnement de tests Livrable 9 : Lots de tests, sous la forme de fichiers enrichis (issu des lots 2 et 3) et non enrichis, répondant aux spécifications, extraits des bases de BrailleNet et de FeniXX, dans différents formats (EPUB et XML DTBook) Livrable 10 : Rapport de tests

C. Tâches et livrables du Lot 4 

Intitulé tâche

Analyse des besoins Outil de 4.2 traduction Traduction braille 4.2.1 abrégé Gestion de la 4.2.2 césure des mots Levée des 4.2.3 ambiguïtés 4.1

Echéance

Intitulé livrable

Partenaires

T0 + 7 mois

L1 – Rapport d’analyse

BrailleNet EDRLab

T0 + 15 mois T0 +9 mois T0 + 12 mois T0 + 15 mois

4.3

Outil de formatage T0 + 18 mois

4.4

Tests

T0 + 21 mois

L2 – Logiciel LibLouis intégrant règles code braille L3 – Algorithmes et tables de césure L4 – Outil de détection d’ambiguïtés L5 – Règles de présentation L6 – Module DAISY Pipeline 2 L7 – Caractéristiques lot test L8 – Environnement test L9 – Constitution lots test L10 – Rapport de tests

BrailleNet

BrailleNet BrailleNet EDRLab FeniXX

Page 40 sur 74

Projet OPALINe

ANNEXE TECHNIQUE

D. Budget détaillé du Lot N°4 « Transcription braille »

Dépenses de personnel du partenaire BrailleNet Tâches 4.1 Analyse des besoins 4.2.1 Traduction en braille 4.2.2 Gestion de la césure 4.2.3 Levée ambiguïtés 4.3 Outil de formatage 4.4 Tests

Profil personnel Ingénieur dev expert Technicien adaptation docu Ingénieur dev expert Ingénieur dev junior Ingénieur dev expert Ingénieur dev junior Ingénieur dev expert Ingénieur dev junior Ingénieur dev expert Ingénieur dev junior Ingénieur dev expert Ingénieur dev junior Technicien adaptation docu

Taux Nb Nb Montant* Horaire jours Heures 42,30 5 35 1 480,50 26,06 10 70 1 824,20 42,30 10 70 2 961,00 32,79 10 70 2 289,00 42,30 10 70 2 961,00 32,79 30 210 6 867,00 42,30 10 70 2 961,00 32,79 30 210 6 867,00 42,30 20 140 5 922,00 32,79 50 350 11 445,00 42,30 5 35 1 480,50 32,79 10 70 2 289,00 26,06 30 210 5 472,60

TOTAL

230

1610

54 819,80

Dépenses de personnel du partenaire FeniXX Tâches

Profil personnel

4.4 Tests

Responsable technique Développeur

Taux Nb Nb Montant* Horaire jours Heures 47 5 35 1 645,00 47 1 7 329,00

TOTAL

6

42

1 974,00

Dépenses de personnel du partenaire EDRLab Tâches

Profil personnel

4.1 Analyse des besoins 4.4 Tests

Expert accessibilité Expert accessibilité

TOTAL

Total Lot 4

Taux Nb Nb Montant* Horaire jours Heures 48,60 10 70 3 402,00 48,60 30 210 10 206,00

40

280

13 608,00

70 401,80€

* Les montants sont en euros

Page 41 sur 74

E. Planning de développement du Lot 4

2.3.5

Lot n°5 : Contrôle de l’accessibilité

Date de début : T0 Partenaire responsable : EDRLab Partenaires impliqués : BrailleNet, FeniXX

Date de fin : T0 + 24 mois

A. Objectifs Ce lot a deux objectifs : 1) Développer des outils de contrôle de l'accessibilité de livres numériques. Un outil automatique sera développé, qui permettra de contrôler les critères d'accessibilité décidables (i.e. pour lesquels une machine peut indiquer si un contenu est conforme ou non à ce critère). En complément, un outil d'assistance à la réalisation d'audit, permettant de guider un opérateur dans la réalisation complète du contrôle d'un ouvrage, en particulier en lui signalant les critères qui n'ont pas pu être vérifiés automatiquement ; 2) Définir un schéma de certification de l'accessibilité de livres numériques, c'est-à-dire un document décrivant les outils, les méthodes et les processus organisationnels que devraient être mis en place par les organisations souhaitant valider le niveau d'accessibilité de livres numériques, en vue par exemple de proposer un label. Ce lot est innovant, car les outils et méthodes développés n'existent actuellement pas pour les livres numériques. B. Démarche détaillée Tâche 5.1 : Spécifications de critères d'accessibilité pour les livres numériques Période: T0 à T0+4 Partenaires impliqués : BrailleNet La recommandation Web Content Accessibility Guidelines (WCAG 2.0, dont BrailleNet a coordonné la traduction en français17) a été développée par le W3C pour spécifier des critères d'accessibilité pour des pages Web "ordinaires". WCAG 2.0 n'est pas suffisante pour traiter le cas de l'accessibilité des livres numériques : elle doit être étendue pour prendre en compte les spécificités de ces contenus. À titre d'exemple WCAG ne traite pas la question de notes (de bas de page ou de fin d'ouvrage) que l'on trouve dans des livres numériques, et qui doivent être structurées correctement afin de permettre à un utilisateur d'y accéder directement ou de les éviter. Les consortiums Daisy, EDItEUR et l'OMPI (Organisation Mondiale de la Propriété Intellectuelle) ont publié en 2013 un document de référence, Accessible best practice guidelines for publishers. Ce document (disponible en version française) recommande des pratiques d'accessibilité adaptables à différents formats de documents : Word, Daisy DTBook et EPUB.

17

WCAG 2.0 : https://www.w3.org/Translations/WCAG20-fr/

Projet OPALINe

ANNEXE TECHNIQUE

L'IDPF, organisme de standardisation créateur du format EPUB, a publié récemment en anglais plusieurs documents relatifs à l'accessibilité des publications EPUB :  IDPF Accessibility guidelines  EPUB Accessibility FAQ  Conformance and Discovery Requirements for EPUB Publications  EPUB Accessibility Techniques Le dernier document peut servir de base à la mise en place de tests d'accessibilité partiellement automatiques pour les publications et les logiciels de lecture. Les travaux suivants seront réalisés :  Étude de WCAG 2.0 ainsi que des spécifications EPUB et EPUB-ARIA afin de définir

une liste de critères spécifiques aux livres numériques. Cette liste précisera pour chaque critère : o si la vérification en est automatisable ou non, o le niveau d'accessibilité correspondant selon la définition des niveaux adoptés par WCAG (A, AA ou AAA), o les catégories de handicap que le respect de ce critère concerne.  Proposition d'une extension du Référentiel Général d'Accessibilité des Administrations

(RGAA18), la méthode d'implémentation des WCAG 2.0 utilisée en France, dont le respect est obligatoire pour les services publics de communication en ligne (État, établissements qui en dépendent, collectivités territoriales, etc.). Le RGAA permet de mettre en œuvre les WCAG de manière opérationnelle, en présentant les différentes préconisations sous forme de critères et de tests unitaires, rédigés sous la forme de questions auxquelles la réponse est "oui" (contenu accessible) ou "non" (contenu non accessible"). Proposer une extension du RGAA pour les livres numériques est utile dans la perspective de qualifier le niveau d'accessibilité de contenus proposés par des établissements publics tels que des universités, des écoles ou des bibliothèques. Livrable 1 : Document listant les critères d'accessibilité spécifiques aux livres numériques et proposition de formulation d'une thématique "livres numériques" pour le RGAA Tâche 5.2 : Outils d'évaluation automatique de l'accessibilité des livres numériques Période: T0+4 à T0+10 Partenaires impliqués : EDRLab, BrailleNet L'objectif de cette tâche est de créer un outil de contrôle automatique du niveau d'accessibilité des publications EPUB 3. Les travaux seront réalisés en collaboration avec le consortium Daisy, dans le cadre du projet "Baseline for Accessible EPUB 3" 19. Le principal défi à relever pour cette tâche est de tentant d'automatiser le plus possible cette évaluation (une automatisation totalement automatique étant impossible). 18 19

RGAA : https://references.modernisation.gouv.fr/rgaa-accessibilite/ Baseline for Accessible EPUB 3 : http://www.daisy.org/baseline

Page 44 sur 74

Projet OPALINe

ANNEXE TECHNIQUE

Les travaux suivants seront réalisés :  Sélection d'un outil open source de vérification de l'accessibilité de contenus Web. Les outils envisagés sont notamment aXe20 et Asqatasun21, car ils mettent tous les deux à disposition une API qui leur permet d'être intégré dans d'autres outils.  Adaptation de l'outil choisi à l'étape précédente, pour y ajouter les critères spécifiques aux livres numériques définis dans la tâche 5.1.  Intégration de l'outil résultant dans le logiciel EPUBCheck. EPUBCheck est un programme open-source développé principalement par l'IDPF et le consortium Daisy, qui vérifie la conformité de documents EPUB au regard des spécifications de l'IDPF. Or, un document peut être conforme à ces spécifications, sans pour autant être accessible : EpubCheck vérifie la validité au regard de grammaires (DTD) ou des schémas XML, mais ne vérifie actuellement pas l'accessibilité. EpubCheck est actuellement utilisé dans de nombreuses chaînes de conversions automatisées, et lui intégrer la possibilité de vérifier l'accessibilité des livres constitue un levier important pour améliorer la prise en compte de l'accessibilité à grande échelle.  Une traduction en français de ces outils.  La prise en compte des évolutions du format EPUB (la version courante début 2017 est la 3.0.1 et une version 3.1 est en cours de validation), et ces outils devront en conséquence évoluer de manière synchrone pendant la durée du projet. Livrable 2 : Un outil open source modifié vérifiant les critères d'accessibilité des livres numériques Livrable 3 : Une version modifiée d'EpubCheck, intégrant un l'outil de vérification de l'accessibilité Tâche 5.3 : Outil d'assistance à la réalisation d'audit d'accessibilité de livres numériques Partenaires impliqués : BrailleNet, EDRLab L'outil résultant de la tâche précédente permettra de tester tous les critères vérifiables automatiquement. Or, de nombreux critères ne le sont pas : la vérification de l'accessibilité consiste souvent à apprécier la pertinence de contenus. Par exemple, s'il est possible de déterminer automatiquement si une image dispose d'un texte de remplacement (il s'agit de vérifier la présence d'un attribut dans le code source HTML), il n'est pas possible de déterminer automatiquement si ce texte décrit l'image de manière pertinente dans le contexte dans lequel elle se situe dans un ouvrage (c'est-à-dire, si le texte de remplacement permet à un utilisateur qui ne voit pas l'image de savoir quelle information elle transmet). Dès lors, une intervention humaine reste nécessaire pour évaluer de nombreux critères. Pour rendre les opérations d'audit efficaces, il est alors utile de guider l'opérateur dans ses travaux d'évaluation, en lui indiquant par exemple les points d'attention à vérifier manuellement : présence d'images à contrôler, présence de longs passages de texte sans niveau de titre intermédiaire laissant supposer un oubli dans la structuration du document, etc.

20 21

aXe : http://www.deque.com/products/axe/ Asqatasun : http://asqatasun.org/

Page 45 sur 74

Projet OPALINe

ANNEXE TECHNIQUE

L'objectif de cet ensemble de tâches est de développer un outil disposant d'une interface utilisateur permettant de compléter l'évaluation de l'accessibilité d'un document en présentant à l'opérateur la liste des critères à vérifier manuellement et la liste de possibles anomalies contenues dans le document. Tâche 5.3.1 : Analyse des besoins et spécifications techniques, fonctionnelles et ergonomiques Période: T0+10 à T0+12 Partenaires impliqués : BrailleNet L'objectif de cette tâche est de réaliser une analyse des besoins basée sur une étude des tâches réalisées par un opérateur pour mener à bien un audit et de spécifier les caractéristiques de l'interface homme-machine auxquels devra se conformer l'outil pour répondre au mieux à la nécessité de réalisation rapide et sans erreur d'un tel audit. Livrable 4 : Rapport d'analyse des besoins Livrable 5 : Spécifications techniques, fonctionnelles et ergonomiques de l'outil d'assistance à la réalisation d'audits Tâche 5.3.2 : Développement d'un outil d'assistance à la réalisation d'audits Période: T0+12 à T0+19 Partenaires impliqués : BrailleNet L'objectif de cette tâche est de développer l'outil spécifie en tâche 5.3.1. Afin que celui-ci puisse être utilisé dans différents environnements (Windows, Mac OS, Linux, etc.), nous envisageons un développement basé sur des technologies Web : un client en HTML, CSS et Javascript avec un serveur en PHP, Perl ou Python. Livrable 6 : Outil d'assistance à la réalisation d'audits Tâche 5.4 : Définition d'un processus de certification de l’accessibilité des livres numériques Période: T0+12 à T0+24 Partenaires impliqués : EDRLab, BrailleNet Lorsqu'un document diffusé est accessible, il est important que les utilisateurs en soient informés et qu'ils puissent connaître le niveau d'accessibilité de ce document afin qu'ils sachent s'il répond à leurs attentes : le document a-t-il été structuré, a-t-il été préparé pour une lecture optimisée en synthèse vocale, en braille ? L'objectif de cette tâche est de définir les outils, méthodes et processus, qu'ils soient techniques ou organisationnels, que devront mettre en place les organisations souhaitant certifier l'accessibilité de livres numériques, afin par exemple de proposer un label "livre numérique certifié accessible". Ce schéma de certification sera réalisé grâce à l'expérience de BrailleNet, qui a mis en place un tel processus de certification pour les sites Web depuis 2004. Il s'appuiera sur le tissu associatif Page 46 sur 74

Projet OPALINe

ANNEXE TECHNIQUE

français, sur les acteurs de l'édition et de la diffusion de livres numériques, et au niveau international, sera réalisé en collaboration avec le consortium Daisy. Livrable 7 : Document décrivant le processus de certification proposé Tâche 5.5 : Tests Période : T0+19 à T0+24 BrailleNet, EDRLab, FeniXX La qualité et l'ergonomie de l'intégration des outils de contrôle du niveau d'accessibilité des publications EPUB 3 dans les outils collaboratifs sera testée dans cette tâche. BrailleNet et FeniXX se chargeront de créer un "lot test" de livres pour la validation de l'outil de contrôle de l'accessibilité. Le principal critère d'évaluation de la solution proposée sera la performance atteinte par un opérateur utilisant l'outil développé par rapport à un audit non outillé (i.e., consistant à consulter manuellement le code du livre numérique, sans être guidé). Livrable 8 : Spécifications des caractéristiques des lots de tests Livrable 9 : Environnement paramétré pour les tests Livrable 10 : Lots de tests, sous la forme de fichiers sources des livres sélectionnés répondant aux spécifications, extraits des bases de BrailleNet et de FeniXX, au format EPUB Livrable 11 : Rapport de tests C. Evaluation des risques La tâche 5.2 comporte un risque de difficulté d'automatisation de la vérification de critères d'accessibilité spécifiques aux livres numériques. Ce risque n'a pas d'impact sur la réalisation du projet, mais sur la possibilité ultérieure de proposer un modèle soutenable pour vérifier l'accessibilité de grandes quantités de livres numériques. Ce risque est tempéré par la réalisation de l'outil d'assistance à la réalisation d'audit (tâche 5.3), qui permettra à un opérateur de réaliser un audit de manière performante, et donc à moindre coût. D. Tâches et livrables du Lot 5 

Intitulé tâche

Spéc. critères accessibilité Outil d’évaluation 5.2 de l’accessibilité Outil d’assistance 5.3 audit accessibilité Analyse des 5.3.1 besoins Développement 5.3.2 de l’outil 5.1

Echéance

Intitulé livrable

Partenaires

T0 + 4 mois

L1 – Document listant critères d’accessibilité spécifiques L2 – Outil vérifiant les critères L3 – Version EpubCheck

BrailleNet

L4 – Rapport d’analyses L5 – Spécifications de l’outil L6 – Outil d’assistance à la réalisation d’audit d’accessibilité

BrailleNet

T0 + 10 mois

BrailleNet

T0 + 19 mois T0 + 12 mois T0 + 19 mois

Page 47 sur 74

Projet OPALINe Déf. Processus certification acces.

5.4 5.5

Tests

ANNEXE TECHNIQUE T0 + 24 mois T0 + 24 mois

L7 – Document décrivant le processus de certification L8 – Caractéristiques lot test L9 – Environnement test L10 – Constitution lots test L11 – Rapport de tests

BrailleNet EDRLab BrailleNet EDRLab FeniXX

→ Articulation avec d'autres lots L'outil de vérification automatique de la tâche 5.2 sera intégré à la chaîne d'édition collaborative (lot 3).

E. Budget détaillé du Lot N°5 « Contrôle de l’accessibilité »

Dépenses de personnel du partenaire BrailleNet Tâches

Profil personnel

5.1 Spécification critères accessibilité 5.2 Outil d’évaluation auto de l’accessibilité 5.3.1 Analyse des besoins 5.3.2 Développement outil d’assistance 5.4 Définition processus de certification accessibilité 5.4 Tests

Taux Horaire

Nb jours

Nb Heures

Montant*

Ingénieur dev expert

42,30

10

70

2 961,00

Ingénieur dev expert Ingénieur dev junior Ingénieur accessibilité Ingénieur dev expert Ingénieur dev junior

42,30 32,79 47,21 42,30 32,79

5 20 20 20 80

35 140 140 140 560

1 480,50 4 590,60 6 604,40 5 922,00 18 362,40

Ingénieur dev expert

42,30

20

140

5 922,00

Ingénieur accessibilité

47,21

10

70

3 304,70

185

1 295

49 147,60

TOTAL

Dépenses de personnel du partenaire EDRLab Tâches

Profil personnel

5.2 Outil d’évaluation auto de l’accessibilité 5.4 Définition processus de certification accessibilité 5.4 Tests

Expert accessibilité Développeur junior

Taux Nb Nb Montant* Horaire jours Heures 48,60 10 70 3 402,00 41,45 20 140 5 803,00

Expert accessibilité

48,60

10

70

3 402,00

Expert accessibilité

48,60

5

35

1 701,00

55

385

14 308,00

TOTAL

Sous-traitance EDRLab Tâches

Sous-traitant

Tâches 5.2 et 5.4

Flux numérique – Société de conseil en système d’information et d’accompagnement d’entreprises sur des projets de R&D

6 600,00

Tâche 5.2

Noop – Développeur expert

5 500,00

TOTAL

Montant*

12 100,00

Page 48 sur 74

Projet OPALINe

ANNEXE TECHNIQUE

Dépenses de personnel du partenaire FeniXX Tâches

Profil personnel

4.4 Tests

Responsable technique Développeur

Taux Nb Nb Montant* Horaire jours Heures 47 5 35 1 645,00 47 1 7 329,00

TOTAL

Total Lot 5

6

42

1 974,00

77 529,60€

* Les montants sont en euros

F. Description des activités de sous-traitance Présentation des sous-traitants du Lot 5 : Noop : Noop (http://www.noop.fr/) est une société de développement informatique innovante, créée en 2016. La société est spécialisée dans les logiciels open-source pour les domaines de la vidéo à la demande et du livre numérique. Son créateur, Cyrille Lebeaupin, a été directeur technique d'UniversCiné VOD, et responsable technique du développement de la solution Médiathèque Numérique, pilotée par Arte. Il travaille depuis un an sur les projets d'EDRLab. Flux numérique : Flux Numérique (EURL) est une société de conseil en système d’information et d’accompagnement d’entreprises sur des projets de R&D. La société a été créée en aout 2013, son gérant et associé unique est Laurent Le Meur. Diplômé ingénieur de l'Ecole supérieure de Physique de Marseille (actuellement Centrale Marseille), Laurent Le Meur conduit des projets d'innovation pour des sociétés du monde des médias. Il s'intéresse particulièrement aux domaines suivants : plateformes multimédias, moteurs de recherche, recommandation collaborative, diffusion vidéo sur le Web, technologies sémantiques, interactions sociales sur le Web, usages des technologies xml et Web, livre numérique. Laurent Le Meur a été successivement responsable R&D de l'Agence France Presse, Directeur Etudes et Développement d'AlloCiné, Responsable R&D d'UniversCiné VOD. Il occupe depuis fin 2015 la position de Directeur Technique d'EDRLab.

Page 49 sur 74

G. Planning et développement du Lot N°5

2.3.6

Lot n°6 : Interfaces de lecture accessibles

Date de début : T0 Partenaire responsable : EDRLab Partenaires impliqués : BrailleNet, FeniXX

Date de fin : T0 + 24 mois

A. Objectifs L'objectif de ce lot est de développer deux prototypes d'application de lecture de livres numériques au format EPUB :  Une version desktop, pour PC et Mac OS  Une version mobile (smartphones et tablettes), pour iOS et Android Ces prototypes apportent plusieurs innovations par rapport à des applications de lecture existantes : 1. Ils permettront de tirer le maximum du potentiel offert par le format EPUB 3 en terme de support de l'accessibilité, là les applications actuellement sur le marché supportent un ensemble restreint de fonctionnalités permises par EPUB. Les prototypes développés ici supporteront par exemple la possibilité de synchroniser un contenu audio en voix de synthèse avec le texte correspondant affiché (surlignage du mot prononcé), la possibilité d'être informé par un signal sonore puis de choisir de lire ou non certains éléments optionnels (notes de bas de page, numéro de page de la version imprimée du livre, etc.). 2. Ils seront optimisés pour exploiter les contenus enrichis issus du lot 3, notamment pour créer une excellente expérience utilisateur dans un contexte de lecture en braille et sonore avec voix de synthèse. 3. Pour la version mobile, ils proposeront deux types d'interfaces : une "classique" basée sur la réalisation de gestes, une "adaptée" qui consistera à proposer à l'utilisateur de poser une "coque" sur son téléphone ou sa tablette afin de lui fournir des repères et de faciliter l'utilisation de l'application.

B. Point sur l’existant Pour desktop EDRLab a débuté en 2016 le développement d'une application de lecture EPUB 3 fonctionnant sous Windows, Mac OS et Linux. Ce premier prototype hybride (Javascript / C++) est développé à l'aide de la technologie Electron22 et du moteur de lecture Readium23 et inclut le SDK DRM Readium LCP. Il a permis de vérifier la faisabilité d'une application de lecture "desktop" en open-source, supportant des livres numériques protégés par DRM. Ce projet se poursuivra en 2017, avec l'adoption du moteur de lecture Readium 2 actuellement développé par la communauté Readium (dont EDRLab), un support plus complet des spécifications EPUB 3 (ressources multimédia en particulier) et une interface homme-machine soignée.

22 23

Electron, http://electron.atom.io/ Readium, https://github.com/readium

Projet OPALINe

ANNEXE TECHNIQUE

Nous proposons d'ajouter à ce développement open-source des fonctionnalités rendant le logiciel accessible - interface de commande au clavier, commandes vocales, lecture en voix de synthèse, lecture vocale synchronisée avec le texte - qui en feront un lecteur de choix pour les déficients visuels et handicapés physiques. Pour mobiles BrailleNet a développé une application de lecture de livres numériques au format DAISY fonctionnant sous iOS et sous Android. Elle propose une interface tactile "ordinaire". Nous proposons d'étendre cette application afin qu'elle supporte le format EPUB (intégration de Readium 2) et de lui adjoindre une interface spécifique basée sur l'utilisation d'une coque additionnelle qui propose à l'utilisateur des repères tactiles sur l'appareil utilisé pour exécuter l'application, afin d'en faciliter l'appropriation et d'en optimiser l'utilisation.

C. Démarche détaillée Tâche 6.1 : Identification des stratégies d'utilisation des applications de lecture Période: T0 à T0+4 Partenaires impliqués : BrailleNet Les travaux associés à cette première étape permettront d’identifier et d’analyser, d’un point de vue de l’ergonomie, les différentes stratégies employées par les personnes aveugles, malvoyantes, dyslexiques et porteuses de handicap moteur pour utiliser une application de lecture, en version desktop et mobile. Ces stratégies sont certainement fonction de l’environnement (mobile ou desktop), des préférences de lecture (braille, audio, caractères agrandis, etc.), des types de documents (romans "simples", littérature générale, contenus universitaires fortement structurés, etc.) et des objectifs utilisateurs (lecture continue, recherche d'une information spécifique, etc.). La réalisation de cette tâche passe par deux étapes clefs successives : 1. Identifier les situations de référence : cette étape consiste à identifier quelques peuvent être les situations, ou catégories de situations, dans lesquelles seront utilisées les applications de lecture. Afin de satisfaire à cet objectif, nous créerons un "focus group" représentatif des différentes catégories d'utilisateurs de l'application auprès duquel nous réaliserons une enquête sur l'utilisation des applications de lecture. 2. Analyser les situations de référence. les situations de références identifiés, nous effectuerons des observations scénarisées (séances de tests) afin d’identifier les stratégies mises en jeu et d'évaluer précisément les limites des solutions existantes. Ces observations sont indispensables afin d’identifier les choix technologiques et d’interfaces et ainsi d’éviter des solutions inapplicables ou non adaptées. et des séances de tests pour évaluer précisément les limites des solutions existantes. Livrable 1 : Rapport d’analyse décrivant les exigences auxquelles devront répondre les prototypes en terme notamment d'IHM.

Page 52 sur 74

Projet OPALINe

ANNEXE TECHNIQUE

Tâche 6.2 : Spécifications des interfaces Période: T0+4 à T0+5 Partenaires impliqués : BrailleNet, EDRLab L’objectif de cette tâche est de définir les caractéristiques des interfaces mobiles et desktop les plus adaptées et les plus simples pour la lecture de livres numériques accessibles. Afin de satisfaire à un besoin optimal en termes d’interaction, nous nous appuierons sur les « Critères ergonomiques » (Bastien & Scapin) - depuis longtemps reconnus par la communauté des ergonomes - afin de spécifier le système. Il est à noter que, pour réaliser cette tâche, nous nous proposons d’adopter une démarche de conception itérative avec les utilisateurs. Cette démarche se base sur la production de solutions et/ou de concepts qui sont testés et/ou validés par des utilisateurs. Plusieurs types d'interactions seront spécifiés :  Au clavier pour PC/Mac  Tactiles simples pour mobiles  Guidées (avec coque) pour mobiles  Par dictée vocale  Via les commandes d'un afficheur braille Livrable 2 : Document de spécification des interfaces desktop et mobile du système. Tâche 6.3 : Interface de commande au clavier Période: T0+5 à T0+7 Partenaires impliqués : BrailleNet, EDRLab L'objectif de cette tâche est de rendre complètement contrôlable par le clavier l'application de lecture, dans sa version desktop. Cela la passe par la création d'une série de raccourcis clavier normalisés et utilisables à travers les différents systèmes d'exploitation auxquels le logiciel est adapté. Cette tâche comprend la programmation dans le logiciel de lecture de raccourcis d'accessibilité définis dans la tâche 6.2. Livrable 3 : Version de Readium Desktop contrôlable au clavier Tâche 6.4 : Commandes vocales Partenaires impliqués : BrailleNet, EDRLab L'objectif de ce groupe de tâches est de permettre à un utilisateur de piloter par la voix, grâce à la mise en œuvre d'outils de reconnaissance vocale, les applications de lecture pour desktop et mobiles. La commande d'un logiciel de lecture par la voix n'a à notre connaissance jamais été réalisée sur Mac ou PC, même si quelques développements isolés peuvent être trouvés sur mobile (Android ou iOS).

Page 53 sur 74

Projet OPALINe

ANNEXE TECHNIQUE

Tâche 6.4.1 : Sous PC et Mac Période: T0+7 à T0+9 EDRLab : CTO : 5j, dev expert : 30j ; dev junior : 20j Ce développement présente plusieurs difficultés : le logiciel de reconnaissance vocale doit être multiplateformes et compatible avec la technologie Electron utilisée sur le prototype, facile d'installation, doit reconnaître les phonèmes français, si possible en open-source et utilisable sans accès à Internet. Google a bloqué à la mi-2015 l'utilisation de sa Chrome Speech API depuis Electron, ce qui rend ce développement plus délicat. Les moteur open-source connus ne remplissent pas toutes nos conditions : CMU Sphinx24 est disponible sous forme de bibliothèque C, donc a priori intégrable à Electron, mais n'est pas (encore) disponible en français ; Kaldi25 est disponible sous forme de bibliothèque C++, mais c'est plutôt un outil de recherche ; MySam26 est une nouvelle expérimentation open-source, mais basée sur un serveur accessible dans le cloud. Nous essaierons donc en premier lieu d'utiliser les API de reconnaissance vocale des systèmes d'exploitation modernes (Cortana sous Windows, Siri sous Mac OS et iOS ; à noter qu'il n'y a pas d'équivalent sous Linux) ; puis nous testerons les librairies open-source citées ci-dessus. L'utilisation d'une API Cloud commerciale, telle que la Google Cloud Speech API, api.ai ou l'API Nuance Mix, reste néanmoins possible pour notre prototype bien que ces API Cloud ne soient ni open-source ni à usage hors ligne. Les différents tests réalisés, leur résultat et les raisons du choix final pour le prototype, seront explicités dans la documentation du livrable. Livrable 4 : Rapport d'analyse des outils de reconnaissance vocale existants et sélection d'une solution Livrable 5 : Application Readium Desktop avec module de pilotage par reconnaissance vocale Tâche 6.4.2 : Sous iOS et Android Période: T0+7 à T0+9 Partenaires impliqués : BrailleNet De même que pour la version desktop, l'objectif de cette tâche est d'implémenter le support de la reconnaissance vocale dans le l'application de lecture pour mobile. Les solutions disponibles seront étudiées, avec la contrainte supplémentaire d'être suffisamment optimisée pour fonctionner sur mobiles (où la consommation en ressources processeur doit être moindre pour des questions de gestion de l'énergie et de disponibilité de puissance de calcul). Livrable 6 : Rapport d'analyse des outils de reconnaissance vocale existants et sélection d'une solution pour mobile Livrable 7 : Application de lecture pour mobiles avec module de pilotage par reconnaissance vocale CMU Sphinx, http://cmusphinx.sourceforge.net/ Kaldi, https://github.com/kaldi-asr/kaldi et http://kaldi-asr.org/ 26 MySam, https://github.com/mysamai/mysam 24 25

Page 54 sur 74

Projet OPALINe

ANNEXE TECHNIQUE

Tâche 6.5 : Lecture en voix de synthèse Partenaires impliqués : EDRLab, BrailleNet L'objectif de cet ensemble de deux tâches est de permettre aux applications de lecture pour desktop et mobiles d'interpréter correctement les annotations phonétiques au format SSML incluses dans les documents enrichis issus des lots 2 et 3 afin que les mots concernés soient correctement prononcés par les programmes de synthèse vocale. Tâche 6.5.1 : Sous PC et Mac Période: T0+15 à T0+17 Partenaires impliqués : EDRLab L'objectif de cette tâche est de proposer une application de lecture :  Intégrant un moteur de synthèse vocale de qualité raisonnable, en mesure d'interpréter les annotations phonétiques en SSML  De piloter un moteur de synthèse vocale éventuellement déjà présent sur le PC, en implémentant le protocole SAPI pour Windows et Speech Manager pour Mac, des API "standards" définies respectivement par Microsoft et Apple.  De véhiculer les annotations phonétiques aux lecteurs d'écran, outils fréquemment utilisés par les personnes aveugles. Les lecteurs d'écran pilotent eux-mêmes la synthèse vocale. → Verrou Le principal verrou réside dans l'hétérogénéité des situations décrites ci-dessus, résultant de la diversité des usages des personnes déficientes visuelles. Par ailleurs, le choix d'un moteur de synthèse qui sera intégré par défaut dans l'application pour que ceux qui n'en dispose pas puisse tout de même y avoir accès pose plusieurs difficultés : le logiciel de synthèse vocale doit être multiplateformes et compatible avec la technologie Electron utilisée sur le prototype, facile d'installation, doit être adapté au français, compatible SAPI 5 (protocole de communication avec un synthétiseur vocal utilisé sous Windows) ou , si possible open-source et utilisable sans accès Internet. Il doit également être capable d'analyser les contenus SSML et supporter un alphabet phonétique. Livrable 8 : Rapport d'analyse des outils de synthèse vocale existants pour desktop et sélection d'une solution pour mobile Livrable 9 : Application de lecture pour desktop avec module de synthèse vocale étendu pour gérer les corrections de prononciation Tâche 6.5.2 : Sous iOS et Android Période: T0+15 à T0+17 Partenaires impliqués : BrailleNet Pour iOS et Android, les difficultés sont similaires à celles mentionnées pour la version desktop. Elles sont accentuées pour ce qui concerne, la transmission de corrections de la prononciation en utilisant le langage SSML : en effet, le protocole de communication avec les outils de synthèse Page 55 sur 74

Projet OPALINe

ANNEXE TECHNIQUE

vocale pour iOS et Android ne supportent actuellement pas cette méthode. Un moyen de contournement devra donc être trouvé. Livrable 10 : Rapport d'analyse des outils de synthèse vocale existants pour mobiles et sélection d'une solution pour mobile Livrable 11 : Application de lecture pour mobiles avec module de synthèse vocale étendu pour gérer les corrections de prononciation Tâche 6.6 : Lecture synchronisée avec le texte Partenaires impliqués : BrailleNet, EDRLab Le format EPUB 3 permet de synchroniser des segments de texte avec une version audio correspondante, qu'elle soit en voix de synthèse ou enregistré par un narrateur. Cette fonctionnalité est nommée "media overlays"27. L'objectif de ce groupe de tâches est de développer cette possibilité au sein du SDK Readium 228 actuellement développé par la communauté Readium (ce sera le moteur des applications de lecture) et de l'intégrer aux versions desktop et mobiles de ces applications. Tâche 6.6.1 : Support des media overlays dans le SDK Readium 2 Période: T0+9 à T0+11 Partenaires impliqués : EDRLab, BrailleNet L'objectif de cette tâche est de créer un module supportant la spécification "média overlays" du format EPUB, qui sera ajouté au SDK Readium 2. Le principal verrou tient au fait que pour synchroniser finement un texte avec la version audio correspondante, il faut structurer le texte d'origine de manière très précise (utiliser une granularité de niveau "mot"). Cela génère des fichiers de taille conséquente, qu'il est donc difficile de traiter dans des environnements disposant de ressources limitées (mémoire et CPU) tels que les mobiles. Livrable 12 : Module supportant la spécification media overlays intégré au SDK Readium 2 Tâche 6.6.2 : Implémentation sous PC et Mac Période: T0+9 à T0+11 Partenaires impliqués : EDRLab L'objectif de cette tâche est d'intégrer le support de la synchronisation entre texte et version audio à l'interface graphique de l'application de lecture pour desktop. L'objectif est de permettre à un utilisateur qui écoute un livre de visualiser à l'écran le texte lu, grâce à un surlignage ou toute autre indication visuelle pertinente selon le handicap. En fonction du niveau de structuration des contenus EPUB, l'utilisateur devra pouvoir choisir la granularité de la synchronisation souhaitée : paragraphe, phrase, mot, etc.

27 28

EPUB 3 Media Overlays, http://epubzone.org/news/epub-3-media-overlays Readium 2, https://github.com/readium/readium-2

Page 56 sur 74

Projet OPALINe

ANNEXE TECHNIQUE

Livrable 13 : Application de lecture pour desktop avec interface utilisateur supportant la synchronisation texte et audio Tâche 6.6.3 : Implémentation sous iOS et Android Période: T0+9 à T0+11 Partenaires impliqués : BrailleNet L'objectif de cette tâche est d'intégrer le support de la synchronisation entre texte et version audio à l'interface graphique de l'application de lecture pour mobiles. Livrable 14 : Application de lecture pour mobiles avec interface utilisateur supportant la synchronisation texte et audio Tâche 6.7 : Lecture en braille Période: T0+15 à T0+18 Partenaires impliqués : BrailleNet L'objectif de cette tâche est de proposer une restitution en braille de qualité au sein des applications pour desktop et mobiles, c'est-à-dire sachant tirer profit des documents enrichis produits par les lots 2 et 3 et des travaux du lot 4. Pour ce faire, plusieurs options sont envisagées : - Intégrer LibLouis (lot 4.2) au SDK Readium 2 et se baser sur les outils de lecture d'écran (NVDA/JAWS pour Windows, VoiceOver pour Mac OS et iOS, TalkBack et BrailleBack pour Anrdoid) pour piloter les afficheurs braille - Intégrer LibLouis aux applications desktop et mobiles et leur ajouter des fonctionnalités de pilotage d'un afficheur braille grâce au logiciel BRLTTY29 Les travaux consisteront tout d'abord à réaliser une étude technique afin de sélectionner l'une des deux options précédentes, puis à réaliser les développements logiciels nécessaires. Livrable 15 : Rapport d'étude sur l'intégration de support braille aux applications de lecture Livrable 16 : Implémentation de la solution retenue dans le rapport d'étude Tâche 6.8 : Interfaces tactiles guidées pour mobiles Partenaires impliqués : BrailleNet Pour une personne aveugle, l'utilisation des interfaces tactiles sur smartphones et tablettes est rendue possible grâce des logiciels de lecture d'écran directement intégrés dans les équipements iOS et Android (VoiceOver pour iOS, TalkBack pour Android). Outre la possibilité de vocaliser le contenu affiché à l'écran, ces outils permettent à l'utilisateur de naviguer à l'intérieur des applications en redéfinissant un certain nombre de gestes. L'utilisateur peut ainsi par exemple explorer l'écran et la synthèse vocale lui indiquera quel est l'objet situé sous son doigt. De nombreux gestes existent, permettant par exemple de passer d'un élément de l'interface à un autre. 29

BRLTTY : htpt://www.brltty.com

Page 57 sur 74

Projet OPALINe

ANNEXE TECHNIQUE

Ainsi, plus de 80 gestes différents ont été définis par les outils de vocalisation pour iOS et Android. L'appropriation de ces gestes est nécessaire pour utiliser efficacement un équipement mobile lorsqu'on est aveugle. Elle est toutefois longue (plusieurs dizaines d'heures), ce qui constitue une barrière qui rebute de nombreux utilisateurs davantage habitués à utiliser des claviers. L'objectif de ce groupe de tâches est de proposer une interface mixant l'utilisation de l'écran tactile que l'on trouve sur la quasi-totalité des équipements mobiles aujourd'hui avec la possibilité d'avoir des repères tactiles sur ces équipements, afin de guider l'utilisateur dans sa navigation et dans son utilisation de l'application de lecture. Cela passera par la conception et la création de cinq prototypes différents de coques en silicone, qui viendront se poser sur l'écran tactile d'un téléphone ou d'une tablette, afin de fourni des repères tactiles à l'utilisateur (grilles constitués de tous, encoches, indications en relief, etc.). Les coques qui seront proposées seront optimisées pour le contexte d'utilisation d'applications de lecture. Cette tâche est innovante car de telles interfaces utilisateurs n'ont encore jamais été proposées dans le contexte d'applications de lecture de livres numériques. Tâche 6.8.1 : Design de coques Période: T0+4 à T0+10 BrailleNet: ingénieur accessibilité et ergonomie: 15j L'objectif de cette tâche est de définir cinq prototypes de coques, pour mobiles et tablettes. Les travaux suivants seront réalisés :  Choix de modèles de smartphones et tablettes cibles  Proposition de plusieurs possibilités de design, alimentées par l'analyse des besoins de la tâche 6.1  Choix d'un matériau utilisé pour les coques (silicone, élastomère thermoplastique, etc.)  Conception 3D et prototypage de cinq coques, en fonction des propositions graphiques, matériaux, et modèles de smartphones/tablettes retenus Ces travaux seront réalisés en collaboration avec un partenaire sous-traitant spécialisé dans l'étude, la conception 3D et la réalisation d'outillage pour le prototypage rapide. Livrable 17 : Dessins et modèles 3D de cinq coques Livrable 18 : Cinq prototypes en 3D de coques (dans un matériau de type silicone) Tâche 6.8.2 : Adaptation de l'interface utilisateur aux coques Période: T0+10 à T0+18 Partenaires impliqués : BrailleNet L'objectif de cette tâche est d'adapter l'interface homme machine de l'application mobile aux cinq coques réalisées dans la tâche précédente. Livrable 19 : Application de lecture pour mobiles avec interface adaptée aux coques

Page 58 sur 74

Projet OPALINe

ANNEXE TECHNIQUE

Tâche 6.9 : Tests Période T0+18 à T0+24 Partenaires impliqués : BrailleNet, EDRLab, FeniXX Les deux prototypes d'applications de lecture, pour mobile et desktop, feront l'objet d'une phase d'expérimentation visant à évaluer les solutions développées. Plusieurs étapes sont nécessaires à la satisfaction de cet objectif :  Rédaction du protocole d’expérimentation. Le protocole, pièce essentielle de tous tests utilisateurs définira spécifiquement l’ensemble des éléments de l’évaluation. Afin de garantir des analyses adéquates et non discutables, une attention toute particulière sera portée à ce document. La détermination des éléments constitutifs de ce document feront l'objet d'une consultation conjointe avec l'ensemble des intervenants du lot. Toutefois, nous pouvons envisager les points suivants : o Profils des participants : Les participants à expérimentation seront des nonvoyants, malvoyants, dyslexiques et personnes porteuses de handicap moteur (membres supérieurs). Ils seront sélectionnés, de manière équilibrée, en fonction de leur typologie de handicap et du niveau de leur déficience. Afin d'être le plus représentatif possible de la population, les variables de profils, à définir, seront équilibrés (âge, expertise informatique, sexe, etc.). o Le recrutement des participants sera réalisé sur la base du réseau des usagers et des adhérents de l'association BrailleNet. Le nombre de participants sera fonction des profils envisagés (âge, sexe, catégorie socio-professionnelle, etc.). Nous pouvons envisager à ce stade de l'étude 60 participants. Ces derniers devraient être répartis suivant cinq grandes catégories : non-voyants, malvoyants (vision périphérique), malvoyants (vision centrale), dyslexiques, handicap moteur. La taille de l'échantillon expérimental sera supérieure au minima envisagé et cela afin de pallier aux différents problèmes expérimentaux (difficultés techniques, participants non présents, profils non adaptés, environnement non propice au test, etc.). Il est à noter que les participants n'auront pas participé à la réflexion et à la conception du système. o Variables et traitement des données : Les variables traitées sont issues de la définition des exigences utilisateurs et techniques réalisées préalablement dans la tâche 7.1. Au-delà de ces exigences, des variables telles que la performance (réussite des scénarios), le nombre et le type d'erreur d'utilisation (classification de Reason), le temps de réalisation des scénarios, seront prises en compte. À chaque variable sera associé un type de traitement des données expérimentales. La définition en amont de ces traitements permet de rationaliser les modes de recueils et facilite le traitement. o Scénario : Les scénarios seront définis sur la base de cas d'utilisations typiques (exemple : lire un ouvrage de type universitaire en voix de synthèse). Ces derniers seront identifiés lors des ateliers d'analyse des besoins et caractéristiques utilisateurs. Au vu de la durée des scénarios, il ne sera pas envisagé de réaliser plus de 2 ou 3 scénarios par participant au cours d'une passation expérimentale. Page 59 sur 74

Projet OPALINe

ANNEXE TECHNIQUE

Mode de recueils : Le mode de recueil sera défini en fonction des variables et des scénarios sélectionnés. Toutefois, sans trop de doutes, nous pouvons nous avancer sur l’emploi de systèmes audio-vidéo de type caméras externes ou internes à l’usage du système, de capteurs d’actions utilisateurs (enregistrement de l’interaction par film ou « log-files ») et de grilles expertes de recueil d’informations comportementales. Dans le cadre d'une appropriation du système par les participants, nous pouvons envisager la mise en place d'un recueil collaboratif longitudinal (de type wiki) afin d'obtenir les « premières » impressions des participants. L'expérimentation sera segmentée en trois phases distinctes : 1. La phase d'appropriation du système : Cette étape permettra aux participants de découvrir le produit. Un système de wiki pourra permettre à ces personnes d'échanger sur leurs premières impressions et cela tout au long des semaines d'essais. Il est à noter que l'évaluation de l'appropriation du système pourra être envisagé par l'absence de cette phase pour certains participants (comparaison avec ou sans test préalable du système). 2. La phase de passation expérimentale : Cette phase, composée d'entretiens semidirectifs et de scénarios, permettra le recueil des variables objectives et subjectives nécessaires à l'évaluation du système. 3. La phase « post-test » : Dans le cadre de cette étape, nous reviendrons avec les participants sur leurs impressions durant le test. Il s'agira par des techniques d'auto-confrontation de préciser les difficultés et les forces du système. Passation expérimentale : La passation du test reprend l'ensemble des éléments décrit par le protocole de test. Traitement des données expérimentales : Suite au recueil nous mettrons en place un traitement statistique adéquat (inférentiel si possible) afin d’analyser les diverses variables étudiées. Synthèse des résultats : La synthèse des résultats consiste en la production d’une analyse des diverses variables mesurées et plus précisément leurs impacts sur les usages ainsi que sur le système et les interfaces proposées. Des propositions de correction seront associées à cette analyse. o



 



Livrable 20 : Spécifications des caractéristiques des lots de tests Livrable 21 : Lots de tests, sous la forme de fichiers des livres sélectionnés répondant aux spécifications, extraits des bases de BrailleNet et de FeniXX, après enrichissement par les outils lots 2 et3, au format EPUB Livrable 22 : Protocole d’expérimentation Livrable 23 : Rapport décrivant la réalisation de l’expérimentation, ses résultats et des orientations éventuelles quant aux choix technologiques et en matière d’interface pour améliorer le système.

Page 60 sur 74

Projet OPALINe

ANNEXE TECHNIQUE

D. Tâches et livrables du Lot 6  6.1 6.2 6.3 6.4

Intitulé tâche Stratégies usages appli lecture Spécification des interfaces Interface de commande clavier Commandes vocales

6.4.1 Sous PC et Mac 6.4.2 6.5

Echéance

Intitulé livrable

Partenaires

T0 + 4 mois

L1 – Rapport d’analyse

BrailleNet

T0 + 5 mois T0 + 7 mois

T0 + 9 mois

Sous iOS et Androïd Lecture en voix de synthèse

6.5.1 Sous PC et Mac Sous iOS et Androïd Lecture synchro 6.6 avec le texte Support media 6.6.1 overlays Implémentation 6.6.2 PC et Mac Implémentation 6.6.3 iOS et Androïd Lecture braille

6.8

Interfaces tactiles guidées (mobiles)

L4 – Rapport d’analyse outils L5 – Intégration Readium L6 – Rapport d’analyse outils L7 – Appli lecture pour mobiles

BrailleNet BrailleNet EDRLab BrailleNet EDRLab EDRLab BrailleNet BrailleNet EDRLab

T0 + 17 mois

6.5.2

6.7

L2 – Document de spécification des interfaces L3 – Version Readium Desktop contrôlable au clavier

T0 + 11 mois

T0 + 18 mois

6.8.1 Design de coques

T0 + 10

6.8.2

Adaptation interfaces usagers

T0 + 18

5.5

Tests

T0 + 24 mois

L8 – Rapport d’analyse outils L9 – Intégration Readium L10 – Rapport d’analyse outils L11 – Appli lecture pour mobiles

L12 – Module supportant la spécification L13 – Appli de lecture avec synchro texte et audio L14 – Appli de lecture pour mobiles avec synchro texte/audio L15 – Rapport étude intégration L16 – Implémentation solution

L17 – Dessins et modèles 3D L18 – 5 prototypes 3D de coque L19 – Appli avec interfaces adaptées aux coques L20 – Caractéristiques lot test L21 – Lots test L22 – Protocole expérimentation L23 – Rapport de résultats

EDRLab BrailleNet BrailleNet EDRLab EDRLab BrailleNet BrailleNet

BrailleNet

BrailleNet EDRLab FeniXX

Page 61 sur 74

Projet OPALINe

ANNEXE TECHNIQUE

→ Articulation avec d'autres lots La tâche 6.5 relative la synthèse vocale suit nécessairement les travaux liés à SSML effectués au lot 2 (tâche 2.4). De même, la tâche 6.7 sur la restitution des documents en braille suit les travaux réalisés sur LibLouis dans le lot 4 (tâche 4.2).

E. Budget détaillé du Lot N°6 « Interfaces de lecture accessibles »

Dépenses de personnel du partenaire BrailleNet Tâches

Profil personnel

6.1 Identification stratégies utilisateurs appli 6.2 Spécification des interfaces 6.3 Interfaces de commande clavier 6.4.2 Commandes vocales sous iOS et Androïd 6.5.2 Lecture voix synthèse sous iOS et Androïd 6.6.1 Support media overlays 6.6.3 Implémentation sous iOS et Androïd 6.7 Lecture braille 6.8.1 Design des coques 6.8.2 Adaptation de l’interface utilisateurs 6.9 Tests

Taux Horaire

Nb jours

Nb Heures

Montant*

Ingénieur accessibilité

47,21

20

140

6 609,40

Ingénieur accessibilité

47,21

10

70

3 304,70

Ingénieur dev junior

32,79

5

35

1 147,65

Ingénieur dev expert Ingénieur dev junior Ingénieur dev expert Ingénieur dev junior Ingénieur dev expert Ingénieur dev junior Ingénieur dev expert Ingénieur dev junior Ingénieur dev expert Ingénieur dev junior Ingénieur accessibilité Ingénieur dev expert Ingénieur dev junior Ingénieur accessibilité Ingénieur dev expert Ingénieur accessibilité

42,30 32,79 42,30 32,79 42,30 32,79 42,30 32,79 42,30 32,79 47,21 42,30 32,79 47,21 42,30 47,21

10 25 10 50 5 10 5 15 20 40 15 10 60 5 10 20

70 175 70 350 35 70 35 105 140 280 105 70 420 35 70 140

2 961,00 5 738,25 2 961,00 11 476,50 1 480,50 2 295,30 1 480,50 3 442,95 5 922,00 9 181,20 4 957,05 2 961,00 13 771,80 1 652,35 2 961,00 4 590,60

355

2485

88 894,75

TOTAL

Sous-traitance BrailleNet Tâches

Sous-traitant

Tâche 6.8

AMPIA – Conception 3D et réalisation d'un outillage en vue de produire 5 prototypes de coques adaptées pour l'application de lecture sur smartphones/tablettes

TOTAL

Montant* 22 000,00

22 000,00

Page 62 sur 74

Projet OPALINe

ANNEXE TECHNIQUE

Dépenses de personnel du partenaire EDRLab Tâches

Profil personnel

6.2 Spécification des interfaces 6.3 Interfaces de commande clavier 6.4.1 Commandes vocales sous PC et Mac 6.5.1 Lecture voix synthèse sous PC et Mac 6.6.1 Support media overlays 6.6.2 Implémentation sous PC et Mac 6.9 Tests

Taux Horaire

Nb jours

Nb Heures

Montant*

Expert accessibilité

48,60

5

35

1 701,00

Développeur junior

41,45

15

105

4 352,25

Développeur junior

41,45

20

140

5 803,00

Développeur junior

41,45

30

210

8 704,50

Développeur junior

41,45

10

70

2 901,50

Développeur junior

41,45

10

70

2 901,50

Expert accessibilité

48,60

20

140

6 804,00

110

770

33 167,75

TOTAL

Sous-traitance EDRLab Tâches

Sous-traitant

Montant*

Tâches 6.4, 6.5 et 6.6

Flux numérique – Société de conseil en système d’information et d’accompagnement d’entreprises sur des projets de R&D

9 900,00

Tâches 6.3, 6.4, 6.5 et 6.6

Noop – Développeur expert

5 100,00

TOTAL

15 000,00

Dépenses de personnel du partenaire FeniXX Tâches

Profil personnel

6.9 Tests

Responsable technique Développeur

Taux Nb Nb Montant* Horaire jours Heures 47 5 35 1 645,00 47 1 7 329,00

TOTAL

Total Lot 6

6

42

1 974,00

161 036,50€

* Les montants sont en euros

F. Description des activités de sous-traitance Présentation des sous-traitants du Lot 6 : Noop : Noop (http://www.noop.fr/) est une société de développement informatique innovante, créée en 2016. La société est spécialisée dans les logiciels open-source pour les domaines de la vidéo à la demande et du livre numérique. Son créateur, Cyrille Lebeaupin, a été directeur technique Page 63 sur 74

Projet OPALINe

ANNEXE TECHNIQUE

d'UniversCiné VOD, et responsable technique du développement de la solution Médiathèque Numérique, pilotée par Arte. Il travaille depuis un an sur les projets d'EDRLab. Flux numérique : Flux Numérique (EURL) est une société de conseil en système d’information et d’accompagnement d’entreprises sur des projets de R&D. La société a été créée en aout 2013, son gérant et associé unique est Laurent Le Meur. Diplômé ingénieur de l'Ecole supérieure de Physique de Marseille (actuellement Centrale Marseille), Laurent Le Meur conduit des projets d'innovation pour des sociétés du monde des médias. Il s'intéresse particulièrement aux domaines suivants : plateformes multimédias, moteurs de recherche, recommandation collaborative, diffusion vidéo sur le Web, technologies sémantiques, interactions sociales sur le Web, usages des technologies xml et Web, livre numérique. Laurent Le Meur a été successivement responsable R&D de l'Agence France Presse, Directeur Etudes et Développement d'AlloCiné, Responsable R&D d'UniversCiné VOD. Il occupe depuis fin 2015 la position de Directeur Technique d'EDRLab. AMPIA : AMPIA (http://www.ampia.fr) est une société basée en Bretagne, spécialisée dans la conception 3D, l'usinage 3D, la réalisation de prototypes et de pré-séries industrielles. AMPIA réalise des études et des prototypes pour de nombreux industriels, dans des secteurs très diversifiés : alimentaire, pharmaceutique, automobile, informatique, etc.

Page 64 sur 74

G. Planning et développement du Lot N°6

2.3.7

Lot n°7 : Dissémination

Date de début : T0 Date de fin : T0 + 24 mois Partenaire responsable : BrailleNet Partenaires impliqués : EDRLab, FeniXX, Inria-ALMAnaCH, Prismallia

A. Positionnement stratégique de ce lot Ce dernier lot est particulièrement stratégique pour le projet OPALINe car les tâches qui le constituent permettront de diffuser les bonnes pratiques auprès de l'ensemble des acteurs de la chaîne du livre afin de permettre une meilleure accessibilité des contenus littéraires auprès des handicapés visuels. Il est impératif de préparer cette "dissémination" des bonnes pratiques et des nouveaux outils avant même que ces derniers soient disponibles sur le marché pour préparer les acteurs de la chaîne du livre, et en particulier les éditeurs, à les intégrer dans leurs chaînes de production de livres numériques. La dissémination des résultats du projet sera réalisée en direction de plusieurs cibles :  La communauté scientifique du traitement automatique des langues, de l'apprentissage automatique pour les travaux réalisés par Inria-ALMAnaCH  Les communautés des développeurs et utilisateurs de logiciels open source concernées par les outils sous licence libre développés dans le cadre du projet  Les éditeurs "ordinaires", auprès desquels seront relayés des bonnes pratiques d'édition en vue de produire davantage de livres nativement accessibles  Le secteur de l'édition "spécifique", constitué d'association et d'établissements qui adaptent des livres aux aveugles et aux malvoyants, qui seront notamment sensibilisés aux nouveaux outils d'édition, d'enrichissement et de transcription en braille.

B. Démarche détaillée Tâche 7.1 : Traduction française des principales bonnes pratiques Période : T0 à T0+24 Partenaires impliqués : EDRLab, BrailleNet Traduire les documents les plus techniques produits par l'IDPF ne semble pas indispensable, puisque les développeurs de logiciels lisent généralement l'anglais. Par contre, traduire en français les bonnes pratiques de création de livres numériques, pour une audience constituée d'éditeurs, d'auteurs et de chargés d'adaptation, est indispensable à la dissémination de ces pratiques dans les régions francophones. Les documents ainsi synthétisés et traduits seront publiés sur le site Inclusive Publishing, qui doit devenir la référence de ce type de publications multilingue, et seront référencés depuis le site EDRLab.

Projet OPALINe

ANNEXE TECHNIQUE

Le périmètre visé par ces documents est l'ensemble de la francophonie, pour le public des éditeurs (ordinaires ou spécialisés dans l'édition adaptée aux déficients visuels), les professionnels de la documentation et les rédacteurs. Livrable 1 : Document des bonnes pratiques en français Tâche 7.2 : Accompagnement du secteur spécialisé Période : T0 à T0+24 Partenaires impliqués : EDRLab, FeniXX, BrailleNet, Prismallia EDRLab utilisera les enseignements du projet pour promouvoir auprès des éditeurs français et européens les meilleures pratiques de création de livres numériques nativement accessibles à un public déficient visuel. BrailleNet fera de même pour le secteur de l'édition "spécialisée", constitué d'associations, d'établissements scolaires et universitaires. Livrable 2 : Document présentant les actions de promotion des bonnes pratiques Tâche 7.3 : Communication sur le projet Période : T0 à T0+24 Partenaires impliqués : EDRLab, ALMAnaCH, BrailleNet, Prismallia Au démarrage du projet, les différents partenaires communiqueront sur le projet via leurs sites Web respectifs. Les sites EDRLab, INRIA, ALMAnaCH, BrailleNet, Fenixx, relaieront ainsi les communications du consortium sur les avancées du projet. Ce type de communication distribuée s'avère en pratique beaucoup plus efficace que la mise en place d'un site Web projet qui souffrirait nécessairement d'un déficit de référencement naturel. À partir de T0+12, la communication sur les avancées du projet prendra un tour plus évènementiel, par des participations à différentes conférences, en particulier : → EPUB Summit 2018 et 2019. L'EPUB Summit est un évènement annuel à vocation européenne, organisé par EDRLab au printemps dans une ville européenne. Il est centré sur le marché du livre numérique, le standard EPUB et les logiciels de lecture associés. Chaque année, une large place est dédiée à l'accessibilité des publications numériques. → Les conférences organisées par le Daisy consortium, la principale organisation internationale dédiée à l'accessibilité des livres, dont BrailleNet est membre et dont EDRLab est aussi partenaire. → Salons du livre (Livre Paris, London Book Fair, etc.) Les partenaires proposeront des interventions à l'occasion de ces évènements. L'équipe ALMAnaCH et BrailleNet comptent par ailleurs publier des articles scientifiques autour des contributions réalisées dans le projet, dans le domaine de l'apprentissage automatique, du traitement automatique du langage naturel et de l'ingénierie documentaire. Les conférences visées sont par exemple : - International Conference on Document Analysis and Recognition - European Chapter of the Association for Computational Linguistics Conferences - International Conference on Computers Helping People with Special Needs Page 67 sur 74

Projet OPALINe

ANNEXE TECHNIQUE

AAATE (Association for the Advancement of Assistive Technology in Europe) Conferences - Human-Computer Interaction International Conference - "ACM's Special Interest Group on Accessible Computing" Conferences Enfin, ALMANaCH, BrailleNet, EDRLab et Prismallia assureront la promotion des outils Open Source développés dans le cadre du projet auprès des différentes communautés concernées. -

Livrable 3 : Liste des actions de communication menées par le Consortium

C. Tâches et livrables du Lot 7 

Intitulé tâche

Echéance

Intitulé livrable

Partenaires

7.1

Traduction en français bonnes pratiques

T0 + 24 mois

L1 – Documents présentant les bonnes pratiques en français

BrailleNet EDRLab

7.2

Accompagnement secteur spécialisé

T0 + 24 mois

7.3

Communication sur le projet

T0 + 24 mois

L2 – Document listant les actions promotion des bonnes pratiques L3 – Liste des actions de communication par Consortium

BrailleNet EDRLab, FeniXX Prismallia BrailleNet, ERLab ALMAnaCH Prismallia

D. Budget détaillé du Lot N°7 « Dissémination »

Dépenses de personnel du partenaire BrailleNet Tâches 7.1 Traduction en français des bonnes pratiques 7.2 Accompagnement secteur spécialisé 7.3 Communication sur le projet

Profil personnel

Taux Horaire

Nb jours

Nb Heures

Montant*

Ingénieur dev expert

42,30

10

70

2 961,00

Ingénieur accessibilité Ingénieur dev junior Ingénieur accessibilité Ingénieur dev expert Ingénieur dev junior

47,21 32,79 47,21 42,30 32,79

10 10 5 5 5

70 70 35 35 35

3 304,70 2 295,30 1 652,35 1 480,50 1 147,65

45

315

12 841,50

Nb jours

Nb Heures

TOTAL

Dépenses de personnel du partenaire FeniXX Tâches

Profil personnel

7.2 Accompagnement secteur spécialisé

Directeur des opérations

TOTAL

Taux Horaire 89

Montant*

5

35

3 115,00

5

35

3 115,00

Page 68 sur 74

Projet OPALINe

ANNEXE TECHNIQUE

Dépenses de personnel du partenaire EDRLab Tâches

Profil personnel

7.1 Traduction en français des bonnes pratiques 7.2 Accompagnement secteur spécialisé 7.3 Communication sur le projet

Taux Horaire

Nb jours

Nb Heures

Montant*

Expert accessibilité

48,60

20

140

6 804,00

Expert accessibilité

48,60

50

350

17 010,00

Expert accessibilité

48,60

40

280

13 608,00

110

770

37 422,00

TOTAL

Sous-traitance EDRLab Tâches

Sous-traitant

Montant*

Tâches 7.2 et 7.3

Flux numérique – Société de conseil en système d’information et d’accompagnement d’entreprises sur des projets de R&D

13 200,00

TOTAL

13 200,00

Dépenses de personnel du partenaire Prismallia Tâches 7.2 Accompagnement secteur spécialisé 7.3 Communication sur le projet

Profil personnel

Taux Horaire

Nb jours

Nb Heures

Montant*

CTO

52,33

5

35

1 831,55

CTO

52,33

10

70

3 663,10

15

105

5 494,65

TOTAL

Dépenses de personnel du partenaire ALMAnaCH Tâches

Profil personnel

7.2 Accompagnement secteur spécialisé

Ingénieur expert

TOTAL

Total Lot 7

Taux Horaire 46,37

Nb jours

Nb Heures

Montant*

20

140

6 491,80

20

140

6 491,80

78 564,95€

* Les montants sont en euros

Présentation des sous-traitants du Lot 7 : Flux numérique : Flux Numérique (EURL) est une société de conseil en système d’information et d’accompagnement d’entreprises sur des projets de R&D. La société a été créée en aout 2013, son gérant et associé unique est Laurent Le Meur. Diplômé ingénieur de l'Ecole supérieure de Physique de Marseille (actuellement Centrale Marseille), Laurent Le Meur conduit des projets d'innovation pour des sociétés du monde des médias. Il s'intéresse particulièrement aux domaines suivants : plateformes multimédias, moteurs de recherche, recommandation collaborative, Page 69 sur 74

Projet OPALINe

ANNEXE TECHNIQUE

diffusion vidéo sur le Web, technologies sémantiques, interactions sociales sur le Web, usages des technologies xml et Web, livre numérique. Laurent Le Meur a été successivement responsable R&D de l'Agence France Presse, Directeur Etudes et Développement d'AlloCiné, Responsable R&D d'UniversCiné VOD. Il occupe depuis fin 2015 la position de Directeur Technique d'EDRLab.

Page 70 sur 74

Projet OPALINe

ANNEXE TECHNIQUE

2.4 Tableaux récapitulatifs 2.4.1

Charge par lot et par partenaire

Charge en hommes.an Lot 1 : Coordination Lot 2 : Enrichissement Lot 3 : Edition collaborative Lot 4 : Transcription braille Lot 5 : Contrôle accessibilité Lot 6 : Interfaces accessibles Lot 7 : Dissémination Total Charge en hommes.an Lot 1 : Coordination Lot 2 : Enrichissement Lot 3 : Edition collaborative Lot 4 : Transcription braille Lot 5 : Contrôle accessibilité Lot 6 : Interfaces accessibles Lot 7 : Dissémination Total 2.4.2

BrailleNet 0,2 1,2 1 0,9 0,7 1,4 0,2 5,6 EDRLab 0 0 0,1 0,2 0,3 0,4 0,4 1,4

Prismallia 0 0 1,5 0 0 0 0,1 1,6 FeniXX 0 0,3 0,02 0,02 0,02 0,02 0,02 0,4

Inria-ALMAnaCH 0 1,1 0,1 0 0 0 0,1 1,3 Total 0,2 2,6 2,72 1,12 1,02 1,82 0,82 10,3

Dépenses par lot par partenaire

Dépenses en k€HT Lot 1 : Coordination Lot 2 : Enrichissement Lot 3 : Edition collaborative Lot 4 : Transcription braille Lot 5 : Contrôle accessibilité Lot 6 : Interfaces accessibles Lot 7 : Dissémination Total Dépenses en k€HT Lot 1 : Coordination Lot 2 : Enrichissement Lot 3 : Edition collaborative Lot 4 : Transcription braille Lot 5 : Contrôle accessibilité Lot 6 : Interfaces accessibles Lot 7 : Dissémination Total

BrailleNet 8,6 67,9 56 54,8 49,1 110,9 12,8 360,1 EDRLab 0 0 25,4 13,6 26,4 48,1 50,6 164,1

Prismallia 0 0 116,8 0 0 0 5,5 122,3 FeniXX 0 26 2 2 2 2 3 37

Inria-ALMAnaCH 0 107,6 6,5 0 0 0 6,5 120,6 Total 8,6 201,5 206,7 70,4 77,5 161 78,4 804,1

Page 71 sur 74

Projet OPALINe

ANNEXE TECHNIQUE

3 LES LIVRABLES 3.1 Présentation des livrables

#

Nature du livrable

Lot N°1 : « Coordination » 1 Outil de gestion de projet déployé et paramétré 2 Compte-rendu de la réunion de démarrage 3 CR réunion comité pilotage à T0+3 4 CR réunion comité pilotage à T0+6 5 CR réunion comité pilotage à T0+9 6 Proposition d’accord de Consortium 7 CR réunion comité pilotage à T0+12 8 Signature de l’accord de Consortium 9 Rapport d’avancement annuel à T0+12 10 CR réunion comité pilotage à T0+15 11 CR réunion comité pilotage à T0+18 12 CR réunion comité pilotage à T0+21 13 Rapport d’avancement annuel à T0+24 14 Rédaction de l’ensemble des livrables 15 CR des réunions de coordination technique 16 Rédaction du rapport final projet OPALINe Lot N°2 : « Enrichissement » 1 Questionnaire BNFA 2 Rapport d’analyse des besoins 3 Logiciel d’annotation structurelle livres numériques 4 Corpus d’apprentissage 5 Module d’enrichissement structurel basé GROBID 6 Logiciel d’annotation d’entités nommées 7 Corpus d’apprentissage 8 Module d’enrichissement d’entités nommées 9 Module « text to speech » 10 Caractéristiques des lots test 11 Environnement test 12 Constitution lots test 13 Rapport de tests Lot N°3 : « Edition collaborative » 1 Rapport d’analyse des besoins 2 Rapport d’audit 3 Cahier des charges et recommandations 4 Document spécifiant le format requis 5 Cahier des charges technique et fonctionnel 6 Module d’affichage PDF 7 Module d’affichage XML 8 Module d’affichage Epub3 9 Module d’affichage DTbook

Echéance

Date de livraison prévisionnelle

T0+1 T0+1 T0+3 T0+6 T0+9 T0+10 T0+12 T0+12 T0+12 T0+15 T0+18 T0+21 T0+24 T0+24 T0+24 T0+24

31/05/17 31/05/17 31/07/17 30/10/17 31/01/18 28/02/18 30/04/18 30/04/18 30/04/18 31/07/18 30/10/18 31/01/19 30/04/19 30/04/19 30/04/19 30/04/19

T0+2 T0+2 T0+12 T0+12 T0+12 T0+12 T0+12 T0+12 T0+14 T0+16 T0+16 T0+16 T0+16

30/06/17 30/06/17 30/04/18 30/04/18 30/04/18 30/04/18 30/04/18 30/04/18 30/06/18 31/08/18 31/08/18 31/08/18 31/08/18

T0+1 T0+4 T0+4 T0+6 T0+8 T0+8 T0+8 T0+8 T0+8

31/05/17 31/08/17 31/08/17 30/10/17 31/12/17 31/12/17 31/12/17 31/12/17 31/12/17 Page 72 sur 74

Projet OPALINe 10 Module d’édition accessible 11 Module d’import manuel et automatique 12 Processeur XML 13 Processeur Epub 14 Processeur Epub-ARIA 15 Module de vérification de l’accessibilité 16 Rapport définition workflow 17 Développement de la plateforme 18 Caractéristiques lot test 19 Environnement test 20 Constitution lots test 21 Documents expérimentaux 22 Rapport de test Lot N°4 : « Transcription braille » 1 Rapport d’analyse des besoins 2 Logiciel LibLouis intégrant les règles du code braille 3 Algorithmes et tables de césure 4 Outil de détection d’ambiguïtés 5 Règles de présentation 6 Module DAISY Pipeline 2 7 Caractéristiques lot test 8 Environnement test 9 Constitution lots test 10 Rapport de tests Lot N°5 : « Contrôle de l’accessibilité » 1 Document listant les critères d’accessibilité spécifiques 2 Outil vérifiant les critères 3 Version EpubCheck 4 Rapport d’analyse 5 Spécifications de l’outil 6 Outil d’assistance à la réalisation d’audit d’accessibilité 7 Document décrivant le processus de certification 8 Caractéristiques lot test 9 Environnement test 10 Constitution lots test 11 Rapport de tests Lot N°6 : « Interfaces de lecture accessibles » 1 Rapport d’analyse des besoins 2 Document de spécification des interfaces 3 Version Readium Desktop contrôlable au clavier 4 Analyse outils commande vocale sous PC et Mac 5 Intégration de l’outil à Readium 6 Analyse outils commande vocale sous iOS et Androïd 7 Application de lecture pour mobiles 8 Analyses outil voix de synthèse sous PC et Mac 9 Intégration de l’outil à Readium 10 Analyse outils Voix de synthèse sous iOS et Androïd 11 Application de lecture pour mobiles 12 Module supportant la spécification

ANNEXE TECHNIQUE T0+15 T0+18 T0+21 T0+21 T0+21 T0+18 T0+18 T0+18 T0+21 T0+21 T0+21 T0+21 T0+21

31/07/18 30/10/18 31/01/19 31/01/19 31/01/19 30/10/18 30/10/18 30/10/18 31/01/19 31/01/19 31/01/19 31/01/19 31/01/19

T0+7 T0+9 T0+12 T0+15 T0+18 T0+18 T0+21 T0+21 T0+21 T0+21

30/11/17 31/01/18 30/04/18 31/07/18 31/10/18 31/10/18 31/01/19 31/01/19 31/01/19 31/01/19

T0+4 T0+10 T0+10 T0+12 T0+12 T0+19 T0+24 T0+24 T0+24 T0+24 T0+24

31/08/17 28/02/18 28/02/18 30/04/18 30/04/18 30/11/18 30/04/19 30/04/19 30/04/19 30/04/19 30/04/19

T0+4 T0+5 T0+7 T0+9 T0+9 T0+9 T0+9 T0+17 T0+17 T0+17 T0+17 T0+11

31/08/17 30/09/17 30/11/17 31/01/18 31/01/18 31/01/18 31/01/18 30/09/18 30/09/18 30/09/18 30/09/18 30/09/18 Page 73 sur 74

Projet OPALINe 13 Application de lecture avec synchronisation texte et audio 14 Appli de lecture mobile avec synchronisation texte/audio 15 Rapport d’étude sur l’intégration 16 Implémentation de la solution 17 Dessins et modèles 3D 18 Cinq prototypes 3D de coques 19 Application avec interfaces adaptées aux coques 20 Caractéristiques lot test 21 Constitution lots test 22 Protocole d’expérimentation 23 Rapport de tests Lot N°7 : « Dissémination » 1 Documents de bonnes pratiques en français 2 Document listant les actions de promotion 3 Liste des actions de communication par le Consortium

ANNEXE TECHNIQUE T0+11 T0+11 T0+18 T0+18 T0+10 T0+10 T0+18 T0+24 T0+24 T0+24 T0+24

31/03/18 31/03/18 31/10/18 31/10/18 28/02/18 28/02/18 28/02/18 30/04/19 30/04/19 30/04/19 30/04/19

T0+24 T0+24 T0+24

30/04/19 30/04/19 30/04/19

Page 74 sur 74