Présentation
Sémanticpédia est une plateforme de collaboration entre le Ministère de la culture et de la communication,
l'Inria et Wikimedia France pour réaliser des programmes de recherche et développement
appliqués à des corpus ou des projets collaboratifs culturels, utilisant des données extraites des projets de Wikimedia.
Le but de ces projets est de développer un écosystème de données culturelles liées et publiquement accessibles.
Les rôles des différents acteurs sont les suivants :
Projets
Actuellement un jeu de données est disponible.
D'autres projets sont envisagés:
-
La sémantisation du Wiktionnaire (http://fr.wiktionary.org/).
Le Wiktionnaire est un des projets de la Wikimedia Foundation visant à construire un dictionnaire multilingue libre et écrit collaborativement.
Il compte plus de 2,2 millions d'entrées dans sa déclinaison linguistique en français,
ce qui le place en deuxième position de ce type de dictionnaires après la déclinaison en anglais.
C'est un corpus unique par sa richesse : à titre de comparaison, le trésor de la langue française informatisé (TLFi) compte 100 000 termes.
Le Wiktionnaire contient également la traduction des termes, ce qui ouvre des perspectives intéressantes en terme de multilinguisme.
-
Le développement d'outils d'étiquetage automatique de textes par des données sémantiques,
à l'image de DBpedia Spotlight pour les textes anglais.
-
L'historisation des données sémantiques.
Actuellement la plupart des données existantes sur le web ne représentent des connaissances qu'à un instant donné,
elles sont mises à jour sans conserver la trace de leurs état précédent.
La conservation de l'état des données dans le temps permettra de une analyse de l'évolution des connaissances sur un sujet.