Construction d'une ontologie basée compétence - CNRS

Bizer et al [5] ont décrit l'architecture d'une ontologie .... Données. Composant d'appariement. Fig. 1 : Architecture du système d'annotation et d'appariement ...
175KB taille 75 téléchargements 181 vues
Construction d’une ontologie basée compétence pour l’annotation des Cvs/Offres d’emploi F.Amourache1, Z.Boufaida2, L.Yahiaoui3 1

Laboratoire LIRE, Université de Mentouri Constantine-25000, [email protected] 2 Laboratoire LIRE, Université de Mentouri, Constantine-25000, [email protected] 3 Laboratoire LIRE, Université de Mentouri Constantine-25000, [email protected]

Résumé Dans cet article, nous proposons une ontologie pour la modélisation du contenu sémantique des CVs/Offres d’emploi en termes de leurs acquis (CV) ou requis (Offre d’emploi) permettant ainsi leur rapprochement automatique ultérieur. Due à l’importance des compétences sou- jacentes à ces documents pour leur rapprochement, L’ontologie construite se concentre sur une modélisation explicite de la compétence. le modèle adopté assure un certain compromis entre la simplicité et la pertinence, en distinguant l’identification des compétences acquises de celles requises et en explicitant la sémantique de la relation pouvant exister entre les différents thèmes des compétences. Par ailleurs, cette ontologie permet à l’utilisateur d’enrichir explicitement son document avec des annotations ( méta-données). Mots clés : Web sémantique, e-recrutement, ontologie, compétence requise ou acquise, annotation sémantique.

I. Introduction Les technologies de l'Internet ont introduit de nouvelles pratiques dans la gestion des ressources humaines. D’une part les chercheurs d’emploi peuvent déposer leurs Curriculums Vitae (CVs) sur des serveurs dédiés du Web ou les envoyer directement aux sociétés par le biais du courrier électronique. D’autre part les sociétés peuvent diffuser leurs offres d'emploi via le Web, considéré dans ce domaine comme un vecteur de diffusion d'informations très utilisé. Néanmoins, ces grandes masses de données diffusées sont souvent mal exploitées car les outils de gestion de CVs et d’offres d’emploi disponibles sont purement syntaxiques et restent limités devant la masse importante des documents à traiter et le besoin d’une interprétation plus sémantique de leurs contenus. Plusieurs travaux menés dans le cadre du recrutement électronique(e-recrutement) prennent en considération, la sémantique des documents à traiter (CV/Offre d’emploi) pour assurer leur rapprochement automatique, en exploitant les technologies émergentes du web sémantique.

Certains d’entre eux utilisent la technique d’indexation sémantique qui consiste principalement d’associer les éléments les plus importants figurants dans un document aux concepts d’une ou plusieurs ontologies de domaine, à travers les techniques de TALN [2], souvent difficile a maîtriser. D’autres travaux se concentrent plutôt sur l’approche de l’annotation sémantique qui consiste à enrichir explicitement les documents avec leur contenu sémantique sous forme de méta-données. Une approche qui semble intéressante surtout pour sa simplicité et de la disponibilité des outils et des standards du web sémantique nécessaires. Dans le projet COMMONCV [8], un noyau ontologique dédié à la représentation des compétences sous-jacentes à un CV a été proposé, en s’appuyant sur une ontologie de domaine. Cette représentation formelle, concrétisée sous forme d’annotations d’une ressource électronique, est par la suite utilisée comme référentiel pour l’appariement sémantique entre le CV et les annonces disponibles sur le Web. Les sous-ontologies utilisées sont : une ontologie de secteur pour les métiers, une ontologie d’entreprise qui spécialise l’ontologie du secteur et une ontologie de comportements. Bizer et al [5] ont décrit l’architecture d’une ontologie (de gestion des ressources humaines), implémentée en OWL, celle-ci est exploitée lors de l’annotation basée compétence des documents (CVs/offres d’emploi). Elle est constituée d’un ensemble de sous ontologies : Education, Organisation, Person, skills et industry (inspirée des référentiels métiers existants). Cependant, le manque principal dans ces travaux est l’incomplétude des descriptions et le niveau de détail insuffisant. Dans un premier travail [21], nous avons proposé une solution simple et détaillée, pour décrire les éléments nécessaires aux processus d’annotation sémantique des CVs et offres d’emploi, en exploitant les technologies du web sémantique et les résultats des travaux précédents. Une architecture globale du système d’annotation sémantique et d’appariement automatique entre les CVs/Offres d’emploi a été proposée. L’élément crucial de cette architecture est une ontologie-ER implémentée en OWL et exploitée lors de l’annotation basée compétence des documents (CVs/offres d’emploi). Cette ontologie est constituée d’un ensemble de sous ontologies : Compétence,

Diplôme, Métier (inspirée des référentiels métiers et diplômes existants), Personne et Annotation. Néanmoins, du point de vue modélisation le travail souffre de quelques lacunes. L’ontologie construite permet la gestion des compétences sous-jacentes aux documents annotés, mais selon un modèle simpliste, sans tenir compte de la différence l’identification des compétences requises par un métier donné d’une part et de l’identification et l’évaluation des compétences acquises par un individu d’autre part [4]. De plus la hiérarchie des thèmes de compétence a été proposée dans le but de rapprocher les compétences requises (Offre d’emploi) à celles acquises (CV), sans distinction entre la relation de subsumption ’’is-a’’ et celle de ’’composition’’ [20]. Finalement, Un coefficient de pondération est associé à chaque type de compétence dont le e choix est basé sur l’importance de chaque type de compétence dans le processus de recrutement alors que l’importance d’une compétence varie d’un métier à un autre [6]. Dans ce qui suit, nous proposons une approche basée sur l’annotation sémantique des documents [16] pour faciliter l’automatisation ultérieure du rapprochement des documents CVs/Offres d’emploi. L’idée de base consiste à modéliser le contenu sémantique de ces documents en termes de leurs acquis/requis d’une façon formelle, explicite, à base d’une ontologie commune. Les concepts de cette ontologie sont inspirés des parties communes les plus significatives de ces documents, en mettant l’accent sur la compétence considérée comme étant l’élément crucial dans la modélisation proposée. L’article est organisé comme suit. La section 2 décrit l’architecture du système d’annotation et d’appariement sémantique proposée. La section3 décrit les différents aspects liés à la notion de compétence que nous considérons lors de la modélisation du contenu sémantique des documents.

Deposer le document Identification d’utilisateur (Candidat /Recruteur) Annoter Document Exploitation Instanciation

Utilisateur

Ontologie-ER

Extraction Connaissances

La section 4 présente l’ontologie construite en détail. La section 5 décrit quelques aspects d’implémentation et nous terminons l’article par une conclusion et quelques perspectives.

II. Architecture du système d’annotation et d’appariement sémantiques L’architecture du système proposé est inspiré du travail [22] dont le but est d’apporter les modifications nécessaires à l’issu de la suppression du sous ontologie « Annotation » de notre ontologie globale, comme il est illustré dans la figure (Fig.1). Elle est constituée des composants suivants : 1. L’ontologie-ER : une ontologie construite pour l’annotation sémantique des Cvs/Offres d’emploi. Elle est constituée de plusieurs sous ontologies inter liées et son instanciation génère des méta-données (annotations). 2. L’interface d’annotation : il donne à l’utilisateur la possibilité d’annoter son document à base de l’instanciation et de l’exploitation de l’ontologie ER; cette opération génère des méta-données (annotations). 3- Entrepôt de méta-données : il permet le stockage des méta-données générées dans la phase d’annotation sémantique des documents (CVS-Offres d’emploi). 4. Le composant d’appariement : ce composant permet le calcul des degrés d’appariement sémantique du document de l’utilisateur avec les documents (Cvs-Offre d’emploi) annotés disponibles, 5. Entrepôts de documents HTML : il permet le stockage des documents à annoter, (CVs et offres d’emploi). 6- L’interface d’appariement : permet aux recruteurs de trouver les Cvs qui lui correspondent le plus, et vice versa.

Interface Annotation

Entrepôt de documents HTML Stocker Document CVs

Interface d’appariement

Srtockage Méta-Données

Afficher Rrésultat Composant d’appariement

Offres Emploi

Extraction Connaissances

Entrepôt MétaDonnées CVs

Moteur Inférence Fig. 1 : Architecture du système d’annotation et d’appariement sémantiques

Offres Emploi

III. Modélisation de la compétence Dans un environnement complexe, instable, caractérisé par une ambiguïté des orientations à suivre de profondes mutations, les organisations (entreprise, établissement, etc) éprouvent de plus en plus des difficultés à réagir. Pour faire face à ces défis, il est impératif pour ces organisations de développer leur capacité d’action et de réaction en repensant les modes d’organisation et de gestion afin de concevoir des structures flexibles, propices à la coopération et à l’innovation et qui placent les compétences au coeur de leur stratégie de développement comme un facteur clé de succès. Dans ce cadre, le thème de la compétence préoccupe, plus que jamais aussi bien le monde académique que le monde industriel [6].

III.1. Identification des compétences Dans ce travail nous distinguons deux types de processus, permettant ainsi le rapprochement automatique des documents (CV/Offre d’emploi) dans le cadre d’une logique basée compétence D’une part, il s’agit d’identifier les compétences requises pour un métier donné, en se basant sur des référentiels existants (O*NET [14], CIGREF [7]). Les méthodes les plus connues chez les gestionnaires pour l’identification des compétences requises sont l’observation directe, l’auto-description, les interviews [4]. Le référentiel peut être défini manuellement, en utilisant des documents de référence de l’entreprise et en demandant aux experts quel type de compétence a fallu pour créer ces documents [13]. Il s’agit bien des compétences requises pour un métier donné puisqu’elles sont liées aux documents réellement utilisés dans l’entreprise. De plus le recruteur peut exprimer d’autres exigences à travers son offre d’emploi d’une façon explicite en annotant ce document à base d’une ontologie de référence. D’autre part ; l’identification et l’évaluation des compétences acquises, en se basant sur des référentiels de formation qu’un candidat peut avoir, en plus d’une possibilité d’exprimer explicitement des compétences acquises par un individu en choisissant sa liste de compétences dans une ontologie de référence de compétence.

III.2. Importance de la compétence Les compétences se distinguent selon leur importance pour une activité professionnelle selon chaque métier [6]. Il existe des compétences prioritaires nécessitant un traitement spécifique et une attention particulière. Par conséquent, la hiérarchisation des compétences s’avère indispensable afin d’optimiser la gestion des ressources humaines et de cibler les actions de l’entreprise (formation, recrutement, mobilité,…etc.). Selon certaines considérations liées à l’activité ou encore à la compétence, un facteur d’importance (Gravité) doit

être considéré pour traduire l’impact de la compétence sur les performances de l’activité concernant un métier donné. Un coefficient est attribué à chaque niveau d’importance : Mineure (1), Moyenne (2), Importante (3), Vitale (4).

III.3. Modèle de la compétence Dans le cadre de ce projet, nous avons besoin d’une représentation formelle et explicite des compétences et donc, un modèle pour cette notion. Ainsi nous adoptons la définition suivante : Une compétence peut être identifiée comme un ensemble de connaissances mises en action dans la réalisation des tâches quotidiennes de l’entreprise. Elle se manifeste sous la forme d’un comportement (le savoir agir), et peut être scientifique et technique (Le savoir et le savoir-faire), comportementale (le savoir être) [17] ou une habilité (habilité cognitive, Physique, sensationnelle) [1]. La compétence scientifique et technique est spécifique, lorsqu’elle est propre à une spécialité particulière, sinon elle est considérée comme générale. La compétence scientifique et technique est caractérisée par un sujet et un niveau d’expertise, le sujet peut être un « Thème » ou un « outil technologie » [14] lié à une spécialité spécifique, quant au niveau d’expertise, il peut avoir l’une l’une des valeurs suivantes: Notion, Application Maîtrise ou Expert, la figure (Fig.2) illustre le modèle de la compétence que nous proposons.

IV. Construction d’une ontologie pour la modélisation du contenu sémantique Le Web sémantique est une infrastructure dont le but est de permettre l’utilisation des connaissances formalisées en plus du contenu informel actuel du Web [3]. A la base de l’infrastructure du Web sémantique se trouvent les ontologies considérées comme une spécification formelle et explicite d’une conceptualisation partagée. Ces ontologies sont cruciales dans le cadre du erecrutement, car elles permettent aux recruteurs et aux chercheurs d’emploi de partager un référentiel commun pour décrire le contenu de leurs documents d’une façon non ambiguë, précise, sémantique et formelle. Un tel référentiel facilitera sans doute la tâche d’annotation de l’utilisateur et permettra un enrichissement avec de nouvelles connaissances, inspirées des concepts et des relations de cette ontologie. L’apport de la formalisation réside dans la possibilité d’assurer un raisonnement automatique pour le rapprochement entre offre et demande d’emploi. Pour la construction de notre ontologie, quelques idées sont inspirées des travaux existants [21], [12], nous avons utilisé la méthode de construction d’ontologies METHONTOLOGY [9] ainsi que quelques idées inspirés du travail [11].

Compétence Savoir agir

Compétence scientifique/technique Savoir ou savoir faire Compétence cognitive

Habilité

Compétence physique

Aptitude Comportemental

Compétence sensationnelle

Compétence psychomoteur Est un

Fig.2 : Le modèle de la compétence

· L’étape

de conceptualisation est constituée d’un ensemble de phases permettant d’aboutir à un ensemble de représentations intermédiaires semiformelles. Cette dernière identifie et définie le vocabulaire du domaine, à partir des sources d’informations et les connaissances du domaine, indépendamment des langages de formalisations à utiliser pour représenter l’ontologie. La Figure ( Fig.3) illustre le résultat de la phase de conceptualisation et de représentation des relations entre les différents concepts. Nous représentons les relations binaires entre les classes par un diagramme, dans lequel les classes sont représentées par des rectangles et les relations par les flèches (du domaine vers le co-domaine) marqué par le nom de la relation. Nous enrichissons ce diagramme en ajoutant les flèches pointillées (sous-classe vers la classe) pour représenter la hiérarchie des concepts.

·

L’ontologie conceptuelle obtenue dans l’étape précédente doit être formalisée dans une logique de description [18], afin de faciliter sa représentation ultérieure dans un langage complètement formel et opérationnel (OWL). Le résultat de cette étape est une ontologie formelle constituée d’une partie terminologique (T-Box) décrivant les concepts et les rôles (relations binaires) et d’une partie assertionnelle (A-Box) décrivant les individus (les instances) et les assertions sur celles-ci. Notre ontologie, est composée essentiellement des sous ontologies suivantes : 1- AquiRequi : dans notre ontologie on distingue les acquis des requis dans le but de donner au recruteur une possibilité de guider le processus de rapprochement, en exprimant son choix alternatif ou simple entre ses exigences à travers son offre d’emploi. Dans le premier cas un requis est obligatoire, dont le but est de limiter les CVs à traiter, en considérant seulement ceux qui répondent à ce type de requis selon le profil du recruteur. Dans le deuxième cas ; le recruteur doit attribuer un coefficient de pondération associé à chacun des types de

requis afin de valoriser son importance dans le calcul du degré d’appariement en question. De ce fait, on peut assurer plus d’efficacité du résultat d’appariement. 2- Personne : constituée d’un seul concept, il décrit les caractéristiques personnelles les plus importantes, que le recruteur peut exiger, ou que le candidat peut avoir. Il s’agit d’attributs tels que: le sexe, l’âge, le service militaire, la résidence (pays/ville), le permis de conduire, la situation familiale et nationalité. 3- DIPLOME : décrit les diplômes qu’un recruteur peut exiger ou qu’un chercheur d’emploi peut avoir ; ils sont regroupés selon le degré d’étude (FamilDipmôme), liée d’une part à la sous ontologie SPECIALITE et DOMAINE pour déterminer la spécialité et le domaine d’un diplôme donné; d’autre part liée à la sous-ontologie « COMPETENCE » pour attester les compétences mobilisées par un diplôme particulier, liée au concept Etablissement qui encapsule certains critères d’établissement par laquelle le diplôme est délivré. 4- METIER : décrit un métier exercé (CV) ou exigé (Offre d’emploi), les métiers sont regroupés par secteur d’activité, liée d’une part à la sous-ontologie COMPETENCE pour attester les compétences exigées par un métier particulier avec un certain degré d’importance (CompétenceImportance), liée d’autre part au concept Organisme qui encapsule certains critères de l’organisme dans lequel un métier peut être exercé. 5- COMPETENCE : permet de décrire le modèle de compétence adopté. La compétence scientifique et technique peut avoir un thème général ou un thème spécifique et un Outil/technologie [O*NET] liés à un spécialité déterminée. La relation qui existe entre les différents thèmes est soit une relation de subsumption (Is-a) [20], sinon celle de composition (Fig.3). La compétence de type Habilité est inspiré du référentiel [O*NET], tandis que les compétences comportementales sont inspirées du référentiel CIGREF.

Relation entre classes Relation Classe/sous-classe Concept / Classe Acqui AcquiRequi

RequiSimple

a-Profil

Requi

Profil

RequiAlternative

exigeFamil

Famil Diplôme

Domaine

a_Domaine

RequiObligatoire

composé-Requi

RequiOptionnel

MetierExp

Compétence

a-Competence

mobilise a_Famil

Personne

a_Metier

Référentiel Métiers

Compétence Importance

Habilité Spécialité

a_Spécialité réfèreDiplôme Référentiel Diplômes

lié_Spécialité

Diplôme

Aptitude

a-Etablissement Etablissement

Outil Technologie lié_Spécialité

exige

a_Secteur

a_Organisme

Compétence Sientifiq/Techniq

exercéDans

a-Sujet

lié-Théme

Métier

Secteur Activité

réfère-Métier

a-Secteur

Organisme

Thème

ThèmeSpécifiq

ThèmeGénéral

ComposéThèmSpéc

ComposéThèmGén

Fig.3 : Le diagramme des relations binaires et de spécialisation entre concepts.

V. Implémentation L’implémentation de l’ontologie construite dans le cadre de ce travail, est faite en OWL (Ontology Web Language) [19] sous Protégé 3.1 [15]. OWL est le standard recommandé par le W3C. Son avantage réside, en plus de son pouvoir d’expression, dans la puissance des services d’inférences qui lui sont offerts par le raisonneur RACER [10]. VI. Conclusion et perspectives : Dans cet article, nous avons proposé une ontologie permettant aux recruteurs et aux chercheurs d’emploi de partager un référentiel commun pour décrire le contenu de leurs documents d’une façon non ambiguë, sémantique et formelle. Ce référentiel facilitera sans doute la tâche d’annotation de l’utilisateur et permettra un enrichissement avec de nouvelles connaissances, inspirées des concepts et des relations de cette ontologie. L’apport de la formalisation réside dans la possibilité d’assurer un raisonnement automatique pour le rapprochement entre offre et demande d’emploi. Elle permet aussi la gestion des compétences via une modélisation formelle. Le modèle de la compétence proposé assure un certain compromis entre la simplicité et la pertinence de la modélisation.

Références [1] C. Allen. HR-XML. Measurable Competencies. HR-XML (2007). http://www.hr-xml.org [2] BONOM : www.damas.ift.ulaval.ca/~pasquier/ Bonom/ [3] T.Berners-Lee. ‘‘ Semantic Web Road map’’. October 1998. [4] G. Berio, M.Harzallah De l’Ingénierie des Connaissances à la Gestion des Compétences Dans les actes de la conférence IC 2005. 16éme journées francophones d’Ingénierie des Connaissances. Pages 49-59. [5] C. Bizer, R. Heese, M. Mocho, R. Oldakowski, R. Tolksdorf, R. Eckstein. The Impact of Semantic Web Technologies on Job Recruitment Processes. In International Conference workshop on computer science (WI’05), 2005. [6] A. Boumane, A. Talbi, D. Bouami et C. Tahon. Quelle méthodologie pour Identifier les compétences requises. Colloque international PENTOM sur : les performances et nouvelles technologies en maintenance,18-20 avril, Marrakech, Maroc. 2005. [7] CIGREF. Nomenclature , les emplois-métiers du système d’information dans les grandes entreprises. 2005. [8] COMMONCV : http://www.sciences.univ-nantes.fr/irin/commoncv/ [9] M. Fernandez, A. Gomez-Perez, N. Juristo, “Methontology from Ontological Art Toward Ontological Engineering”, In AAAI’97, Spring Symposium Series on Ontological Engineering, USA, 1997. [10] V. Haarslev, R. Moller et M. Wessel. RACER User’s Guide and Reference Manual (Version 1.7.19). 2004. [11] M. Hemam, Z. Boufaida “An Ontology Development Process for the Semantic Web”, EKAW’04, 14th

[12] [13]

[14] [15] [16] [17]

[18] [19]

[20]

[21]

[22]

International Conference on Knowledge Engineering and Knowledge Management Whittlebury Hall, Northamptonshire, UK, 5-8 October 2004. L. Juri . E. Herder, A model for competence gap analysis. L3S Research Center and University of Hannover, Hannover, Germany T. Ley , D. Albert. Identifying employee competencies in dynamic work domains:methodological considerations and a case. Journal of Universal Computer Science, vol. 9 n. 12,pp. 1500-1518. 2003 O*NET: http://online.onetcenter.org/ Protègè OWL :http//protégé/standford/edu/plugins/owl Y. Prié et S. Garlatti. Méta-données et annotations dans le Web sémantique. Dans «Web sémantique-Rapport final», action spécifique 32 CNRS / STIC, pages 25-42, 2003. C. Rieu, C.-M. Rousseau et C. Roche. Gestion des compétences: un modèle opérationnel à base d’ontologie. Colloque Du E-Management à la ERH, université Paris-Dauphine, 2005. P. Schneider- Patel, F. Baader, D. Calvanese, L. D. McGuinness, D. Nardi, editors. “The Description Logic Handbook”, Cambridge University Press, 2003. P. Schneider-Patel, I. Horrocks, F. V. Harmelen, “From SHIQ and RDF to OWL: The making of a web ontology language”, In Journal of Web Semantic, Vol. 1, N° 1, pp. 7-26, 2003. J. Vasconcelos, C. Kimble, A. Rocha (2003). Ontologies and the Dynamics of Organisational Environments. An example of a Group Memory System for the Management of Group Competencies. In Proc. of IKNOW '03 - 3rd International Conference on Knowledge Management, Graz, Autriche L.Yahiaoui, Z.Boufaïda et Y.Prié.Semantic annotation of documents applied to E-Recrutment. In Proceeding of SWAP, The 3rd Italian Semantic Web Workshop, Pisa, Italia, December 18-20,2006 L.Yahiaoui, Z.Boufaïda, Y.Prié. Automatisation du e-recrutement dans le cadre du web sémantique, en Journées francophones d'Ingénierie des Connaissances, Nantes, juin 2006.