On dit souvent que le "Web3", qui sera une evolution du "Web2", sera : Le "Web Semantique".
Le Web3 ne sera pas que "semantique", fort heureusement, mais en fera très certainement partie.
Alors qu'est ce que le "Web semantique" ?
C'est une facon d'organiser les trucs et les bidules du web pour que cela devienne comprehensible pour un programme informatique. C'est pas clair ... bon ... C'est une facon d'organiser de facon
formelle, a l'aide de metadonnée, quelque chose qui ne l'pas (ou pas assez pour etre comprehensible par un programme (ex : La langue francaise)).
Pour prendre un exemple : les meta-tags, tels que ceux qui sont dans mon profil, sont une forme primitive de web semantique. De même que la Catégorie, la Communauté et la Thématique de cet article
que je peux indiquer en postant cet article.
Le web semantique, c'est un peu ca, mais a l'echelle du web, et sur tout type de document/ressource.
Imaginez un document qui decrive :
- Ce site web est de type "blog", avec un lien vers un document qui decrit ce qu'est un blog.
- Un blog est composé d'un (ou plusieurs) auteur(s), de categorie(s) d'article, ...
- Un auteur a un nom, parle une langue, une date de naissance, un metier, un sexe, etc ...
- un article a une date de publication, un titre, un texte, et un theme eventuellement decrit dans un document qui explique de facon structurée de quoi parle l'article.
- Une image va avoir une url, une date et lieu de prise de vue si c'est une photo, etc ...
Tout cela existe de facon plus ou moins avancée, de facon plus ou moins standardisée.
Par exemple, pour les photos prises avec un appareil numerique, il y a les données EXIF. Dans le fichier de la photo, vous y trouverez : le fabricant de l'appareil, le modele, la resolution de la
photo, la date de prise de vue, le lieu si l'appareil a un gps, la vitesse d'obturation, l'ouverture, si un flash a été utilisé, etc etc etc ...
Associé a toute ces structures, il y a un langage qui permet de faire des requetes sur les données structurée du web semantique (SPARQL) .
Actuellement, chercher un "article" dans un "Blog" ecris en "francais" par un "sysadmin" de "plus de 30ans" et qui reside a "toulouse", c'est pas facile facile. Google va peut etre y arriver avec
une plus ou moins de bonheur parce que j'ai indiqué assez de metatags permetant de me trouver, mais c'est pas gagné et il faut une usine a gaz facon google pour y arriver.
Avec le "web semantique", on pourra chercher dans les metadonnées qui decrivent un document ou une ressource. C'est un programme qui fait la recerche, et les metadonnées sont structurées de facon a
ce que le programme puisse les comprendre. Il y aura 2 web : le web des humains et le web des programmes. Le 2eme etant au service du premier, bien evidemment :)
Prenons l'exemple d'une recherche de photo :
"Je cherche des photos prisent 2003 avec un appareil Canon, sans Flash, d'une resolution de plus de 3 Megapixel". Grace aux (meta)donnée (structurée et standardisée) EXIF des photos, c'est
super simple. Sans les donnée EXIF, c'est impossible.
Ou, plus simple, je cherche des photos de nuit de toulouse :
Encore une fois, avec les données EXIF, c'est facile (si l'appareil a un GPS ...)
Sans les données EXIF, c'est possible mais laborieux. Il faudrait regarder les photos une a une, regarder si c'est pris de nuit (ciel, lampadaire) et reconnaitre si c'est bien Toulouse (batiments
connus, plaque minearalogique des voitures, nom des rues sur les plaques, bref, la galere).
Google pourra eventuellement s'en demerder, parce que si vous metttez une photo de nuit de toulouse vous allez peut etre marquer : "Photo de nuit a toulouse", il va les trouver.
Marquez : "Photo du ciel nocturne toulousain" et il ne va pas la trouver.
Marquez : "Photo de moi dans le train de nuit en direction de toulouse" et il va afficher une photo .... de vous dans le train de nuit en direction de toulouse", mais pas une "photo de nuit a
toulouse".
Le web3, ca va etre l'organisation de ce gigantesque foutoir qu'est le web ! Autant dire que c'est pas pour demain ;)