L'édition électronique ouverte

Syndiquer le contenu
The open electronic publishing blog
Mis à jour : il y a 9h 37 min

Journée d’étude à la BnF : Web participatif et institutions culturelles

mar, 03/09/2010 - 18:41

« Curves & Clouds » par fs999, cc by-nc-nd

Après deux journées consacrées à la numérisation du patrimoine et aux moteurs de recherche, la BnF, l’Université Paris Ouest Nanterre La Défense (Laboratoires HAR, ArScAn, Modyco), l’Université Paris-8 (Laboratoire Paragraphe) et l’Université d’Avignon s’associent pour la tenue d’une troisième journée d’étude consacrée au web participatif des institutions culturelles.

Cette journée se tient sous la direction scientifique de Bernadette Dufrene (Université Paris Ouest), Madjid Ihadjadene, (Université Paris-8) et Denis Bruckmann (BnF) et se déroulera le 18 mars 2010 à la Bibliothèque Nationale de France.

Le Cléo sera présent à cet événement. Marin Dacos, Directeur du Centre pour l’édition électronique ouverte interviendra auprès de Geneviève Vidal et Estelle Rojas (Université Paris-13), Sophie Pene (ENSCI) et Anne Marie Rouge (Bibliothèque municipale de Lyon) sur le thème :

« Amateurs » versus professionnels ou experts : quelles nouvelles autorités sur le savoir ?

Alors que la théorie de « la sagesse des foules » formulée par Surowiecki gagne du terrain puisque certaines institutions développent de nouveaux liens avec leurs publics (notamment les folsksonomies, le social tagging, …), alors que se développent partout l’autoédition, le « journalisme amateur », peut-on souscrire à l’idée que les autorités traditionnelles du savoir sont en concurrence avec les « amateurs » ?

Véronique Mesguich (Pôle universitaire Léonard de Vinci) introduira et modérera cette séance.

Lien

Programme de la journée

Table ronde : Pratiques de lectures dans la culture numérique

lun, 03/08/2010 - 18:29

« Globo » par Gonzo Bonzo, CC by-nc-sa

L’École régionale des beaux-arts de Valence organise le jeudi 10 mars 2010, deux tables rondes sur la contribution du design graphique aux pratiques et apprentissages des savoirs dans la culture numérique.

À cette occasion, Marin Dacos, directeur du Centre pour l’édition électronique ouverte (Cléo) participera à la rencontre autour du thème : « Production et diffusion des savoirs en ligne. »

« En entrant dans l’ère de l’informatique en réseau, le livre semble appelé à devenir de plus en plus réinscriptible. Il n’est plus seulement séquentiel, il est aussi réticulaire. Il se pare de multiples couches, un ensemble d’informations ajoutées par des dizaines de métiers différents, qui participent à une vaste entreprise d’enrichissement documentaire, et par des auteurs secondaires qui, par leurs inscriptions, contribuent, à toutes les étapes, à enrichir la grille de lecture du texte. Ce livre inscriptible, c’est le Read/Write Book. »

Pratiques de lectures dans la culture numérique : contribution du design Deux questions, deux tables rondes, une journée

Les technologies numériques sont des technologies d’écriture. En tant que telles elles constituent, comme l’invention de l’écriture elle-même il y a 5000 ans, une extension sans précédent de notre cerveau et, ainsi, de nos possibilités cognitives.
Grâce à elles, jamais les hommes n’ont possédé autant de possibilités d’étendre les savoirs et leurs capacités d’agir ; jamais nous n’avons disposé d’autant de moyens pour satisfaire notre volonté de connaître et de comprendre.
Lire la suite…

Liens

Programme de la journée et informations

Le Cléo participe au « printemps des Sciences Humaines et Sociales »

lun, 03/08/2010 - 16:22

« Le Printemps des Sciences Humaines et Sociales » organisé par la Maison des Sciences Humaines et Sociales (MESHS) à Lille aura pour thème cette année les  « SHS 2.0 : objets et pratiques numériques ».

Dans le cadre de cette manifestation, Marin Dacos, directeur du Cléo interviendra aux côtés de Renaud Limelette, chef de projet du portail Fontes Historiae IurisCynthia Pedroja, Chargée des ressources documentaires numériques à la MESHS et Stéphane Pouyllau,  Responsable du pôle Digital Humanities au TGE Adonis et du Centre national pour la numérisation de sources visuelles (CN2SV) dans un séminaire consacré aux Digital Humanities. La séance sera introduite et menée par Gabriel Galvez-Béhar, Maître de conférences en histoire à l’Université Lille 3 (laboratoire IRHiS), responsable scientifique à la MESHS.

L’intensification des usages des technologies de l’information et de la communication bouleversent les sciences humaines et sociales. Si ces pratiques constituent un terrain d’enquête et d’analyse, elles rencontrent également celles des chercheurs en SHS. Avec le développement du micro-ordinateur et avec l’essor d’Internet, de nouvelles possibilités techniques sont mises au service de la recherche et redéfinissent en même temps les manières de faire, voire transforment les communautés savantes elles-mêmes.
Ce constat est au cœur des Digital Studies qui se développent outre-Atlantique depuis plus d’une dizaine d’années et dont le but est d’intégrer les nouvelles technologies aux pratiques de recherche et d’enseignement en SHS. Les humanités numériques jouent désormais un rôle fondamental dans la constitution et la conservation des données ; elles transforment le rapport aux sources, dont la démultiplication nécessite de nouveaux modes de critiques. L’usage des nouvelles technologies intervient également dans la production des connaissances, qu’il s’agisse d’analyse textuelle, de système d’information géographique ou de simulation statistique. Enfin, les humanités numériques jouent aussi un rôle important dans la diffusion des savoirs. L’émergence de l’édition électronique transforme l’économie de l’argumentation mais aussi les modes de validation des connaissances.
Lire la suite…

Ce séminaire est ouvert au public et a lieu le lundi 22 mars 2010 de 15h à 18h / MESHS – Espace Baïetto / 2 rue des canonniers – Lille

Présentation du « printemps des Sciences Humaines et Sociale »

L’importance croissante des données numériques et de leur échange (qu’il s’agisse d’images, de textes, de vidéo, de musique ou de quelque autre « data ») a donné à l’ordinateur individuel, ou au serveur de données, une place prépondérante dans l’économie de la recherche, tout comme dans notre rapport individuel à l’information et au savoir. Sans micro-ordinateur, point de salut. Après avoir bénéficié de l’aide à l’écriture par le biais du traitement de texte, le chercheur dispose aujourd’hui d’un outil de traitement du savoir. Cet outil ordonne, classe, échange, propose, parfois impose des formats. Le numérique est un fait, il remodèle le paysage du savoir, de son apprentissage et des méthodes qui y donnent accès.

Devant notre écran, nous croyons disposer d’un assistant ; d’aucuns pensent que nous avons trouvé un maître (un maître autoritaire) car son action est parfaitement diffuse et continue, parfois tellement omniprésente qu’elle en devient presque invisible et finalement naturelle. Pour avoir sur lui un semblant de maîtrise, il a fallu apprendre des gestes (utiliser des menus, enregistrer, se connecter, envoyer un courriel, ouvrir et redimensionner une image) comme on a appris jadis à lire, compter ou écrire. La pratique de l’outil, si alerte soit-elle, ne nous renseigne cependant pas sur sa nature technologique ou son mode de fonctionnement. Nous utilisons une technique, peut-être même un savoir, si l’on considère que l’informatique est fille des mathématiques, sans toutefois le connaître (à moins d’être informaticien) pour faire progresser ou soutenir le nôtre. Que devons-nous donc penser de cette nouvelle interdépendance des savoirs ?

La Maison européenne des sciences de l’homme et de la société (MESHS), en consacrant son deuxième Printemps des SHS au thème du numérique, s’est proposé de mener une réflexion sur ce qui apparaît à certains comme une révolution. Dans quelle mesure l’informatique (l’ordinateur, pour ne citer que cette machine numérique) intervient-elle dans les processus de recherche ? Jusqu’où les objets d’étude eux-mêmes s’en trouvent-ils modifiés, voire redéfinis ? Dans quelle mesure aussi, et pas seulement au sein des seuls champs disciplinaires des sciences de l’homme et de la société, le numérique réorganise-t-il certains aspects de nos pratiques sociales et culturelles ? (…)

En réunissant des chercheurs d’horizons divers, le Printemps des SHS 2010 entend nourrir une réflexion interdisciplinaire qui rompe avec des questionnements souvent sectoriels sur des pratiques et des objets pourtant omniprésents.
Lire la suite…

Le Printemps des SHS 2010 se déroulera en quatre semaines, introduisant quatre volets différents :

  • L’informatique : un nouveau langage pour un nouveau savoir ?
  • La norme, le droit et la régulation
  • Le document et l’immatériel
  • Accès, interactivité et réseaux sociaux

Les manifestations sont ouvertes à tous. L’entrée y est libre, dans la limite des places disponibles. Une inscription est recommandée.

Liens :

Programme détaillé en ligne

Programme détaillé en PDF

Inscriptions / réservations

Stage au Cléo : qualité des données et échanges avec les bibliothèques

sam, 03/06/2010 - 17:22

Le Centre pour l’édition électronique ouverte recrute un(e) stagiaire pour son pôle information scientifique pour une durée de 3 à 6 mois.

Missions

Les missions du stagiaire porteront sur la qualité des données du catalogue de Revues.org et les échanges avec les bibliothèques. Il interviendra dans la mise en œuvre de solutions destinées à améliorer le catalogage des carnets de recherche de la plateforme Hypothèses, puis celui des revues présentes sur le portail Revues.org.

En coordination avec le pôle information scientifique et le pôle informatique, il aidera notamment à la mise en place d’un workflow permettant aux carnetiers et aux responsables de revues d’entrer les données de catalogage à partir du logiciel Lodel.

Le stagiaire devra également proposer des spécifications permettant l’exportation des notices dans des formats utilisés par les bibliothèques.

Compétences requises
  • Une connaissance des formats classiques de métadonnées (Dublin Core) et de catalogage utilisés par les bibliothèques (familles MARC) ;
  • une connaissance du monde de l’édition et de la recherche en sciences humaines et sociales sera appréciable.

Le stage aura lieu à Marseille (13003). Il durera trois à six mois et débutera entre mars et juillet 2010.

Indemnité de stage prévue, en conformité avec la réglementation en vigueur.

Pour toute information, écrivez à contact@revues.org

L’employeur

Le Cléo est un laboratoire associant le CNRS, l’EHESS, l’Université d’Avignon et l’Université de Provence. Il fait activement partie du réseau constitué par le Très grand équipement-Adonis. Il est installé à l’Université de Provence (site Saint-Charles) et mène des missions de service public : mise à disposition d’une plateforme complète comprenant un portail (Revues.org) de revues scientifiques en libre accès, une plateforme de carnets de recherche en sciences humaines (Hypothèses), développement de fonctionnalités, mise en place d’accords d’interopérabilité. Il met en ligne plus de 50 000 documents structurés en XML, via des sites web éditorialement gérés par plus de deux cents chercheurs, enseignants, documentalistes et éditeurs en sciences humaines. Le nombre de projets éditoriaux, de visiteurs et de fonctionnalités est en forte croissance.

Cléo Revues.org

CNRS/EHESS/UP/UAPV
3, place Victor Hugo, Case n°86,
13331 Marseille Cedex 3
FRANCE
Tél. +33 4 88 57 69 29
Fax +33 4 88 57 69 30
http://cleo.cnrs.fr

Revues.org présent dans les bibliothèques universitaires étrangères

ven, 03/05/2010 - 12:16

« Biblioteca José Vasconcelos », par CLiNKer, CC by ca

Un récent travail sur les statistiques de fréquentation du portail a mis en évidence l’indexation par les bibliothèques universitaires internationales d’une partie des revues adhérentes.

Petit tour d’horizon :

Avec le développement des Digital Library, les  « étagères virtuelles » se multiplient, sur lesquelles les revues en Open Access occupent une place de choix. Ainsi, certaines  revues adhérentes sont indexées aux États-Unis dans plusieurs catalogues :

Au sein des universités, certaines revues sont aussi sélectionnées par les départements comme des ressources bibliographiques conseillées pour leurs étudiants. En voici quelques exemples :

Enfin, c’est parfois l’ensemble des revues adhérantes au portail qui sont proposées par les bibliothèques universitaires, grâce à leurs partenariats avec les sociétés gestionnaires de catalogues (Serials Solutions, Elsevier, Ex-Libris, EBSCO….) qui utilisent les outils d’intéropérabilités développés par le Cléo. Les statistiques présentent ainsi des résultats en provenance de grandes bibliothèques québécoises :

Pour tout renseignement complémentaire sur le référencement des revues du portail, n’hésitez pas à nous contacter à l’adresse suivante :  referencement@revues.org

Blio : un logiciel de lecture de livres électroniques (Tools of change for publishing)

ven, 02/26/2010 - 00:40


Pour beaucoup d’orateurs, TOC 2010 a été l’occasion de promouvoir son projet, son produit, sa plateforme. C’est dissimulé plus ou moins délicatement derrière des considérations plus générales, mais c’est bien de cela qu’il s’agit. La présentation de Blio avait, de ce point de vue, le mérite de la clarté : il s’agissait d’une page de publicité, ni plus, ni moins.

Dans la profusion d’initiatives qui touche aujourd’hui l’édition électronique, on voit émerger des propositions de logiciels de lecture de livres. On connaissait déjà, chacun dans son registre, Stanza, Aldiko, Adobe Digital Edition, FBReader, Acrobat Reader… Il faut désormais ajouter à cela Blio. Blio est un logiciel gratuit (ne pas confondre, il ne s’agit pas d’un logiciel libre), qui tourne sur Microsoft WindowsTM Il a, cependant, vocation à fonctionner dans un grand nombre d’environnements fixes et mobiles :

  • Windows
  • Mac
  • Linux
  • Android
  • Symbian
  • Windows Mobile
  • iPhone

La présentation insiste sur la faiblesse de l’affichage sur les technologies d’encre électronique, statiques, lentes et monochromes.

Le projet se concentre plutôt sur une approche multimédia, en s’appuyant sur le format XPS (XML Paper Specification) de MicrosoftTM. Ce format a été lancé, il y a quelques années, pour contrer le PDF. Le Blio Reader pourra, cependant, lire également du PDF et de l’Epub.

De toute évidence, le modèle économique promu par le Blio Reader est celui du Bookstore, sur le modèle qui a tant réussi à Apple. La société K-NFB ouvrira une librairie qui distillera ses livres à destination du Blio Reader. Elle annonce diffuser, prochainement, des ouvrages venus de gros poissons : Elsevier, Hachette, HarperCollins, Random House, Penguin, Simon & Schuster, Wiley. Tout cela, normalement, devrait être truffé de DRM. Il est fort probable que ce bookstore aura le monopole d’alimenter du Blio Reader. Nous n’avons jamais eu autant besoin de la technologie BookServer (OPDS)…

La fonctionnalité la plus intéressante du Blio Reader est celle qui permet le TTS (Text to speech) automatique, car elle est très pédagogique, notamment pour apprendre une langue étrangère. Cette possibilité cohabite avec une fonctionnalité audiobook plus élaborée, quand le texte est lu par un être humain… Bien entendu, cette dernière fonctionnalité, très intéressante pour les enfants notamment, ne passera que par le format XPS, ce qui ne donne pas vraiment envie… mais pourrait pousser les promoteurs de l’Epub à se réveiller un peu. On se demande, en effet, si l’IDPF dort ou bien si elle a décidé de maintenir l’Epub à un niveau low tech pour rester en phase avec le Sony Reader…

Il est également possible d’ajouter des annotations aux livres. L’histoire ne nous dit pas si on pourra le faire sur les trois formats (Epub, PDF et XPS) ou seulement sur l’XPS. L’histoire ne dit pas, non plus, si ces notes seront emprisonnées dans le logiciel, propulsées dans les nuages ou accessibles dans un format ouvert…

Ce lecteur de livre concentre son attention sur les livres de cuisine, les livres pour enfants, les encyclopédies illustrées.

Socialgraphics (Tools of change for publishing)

jeu, 02/25/2010 - 19:16

Dale Dougherty a co-confondé les éditions O’Reilly. Depuis six ans, il crée des magazines. Il est venu parler pour revenir sur le Web 2.0 et ses possibilités dans l’édition générale, orientée très grand public et même kiosques. Comme la très grande majorité des autres intervenants, il est là pour proposer des possibilités de développer des revenus.
Il met en avant un nombre : 84000. C’est le nombre de personnes qui exercent la profession d’interprète d’Elvis Presley aux USA. Il énumère également de nombreux “tribudes bands”, ces groupes qui clonent Kiss ou les Village People. Le jeu Guitar hero surfe sur ce type de passion, ce qui a permis de vendre 34 millions de morceaux… Et Dale Dougherty de citer les Guitar Zeros, qui ont détourné Guitar hero pour pouvoir programmer leur propre musique… Cette énumération d’exemples permet à Dale Dougherty de proposer à ses auditeurs de s’appuyer sur l’enthousiasme du public, pour ses passions. Il se base sur le livre de Tyler Cowen, Create your own economy. The Path to Prosperity in a Disordered World. Ce livre affirme que Twitter, Facebook, Myspace sont des espaces de création de valeur.

Rien de bien neuf, il faut le reconnaître. Le conférencier en profite pour parler de ses projets autour de l’idée de “Do it yourself” :  http://makerfaire.com/ et http://makersmarket.com/ Des rencontres de bricoleurs, que Dale Dougherty réunit, fait se rencontrer. Il se présente donc comme un catalyseur de passions… mais il faut reconnaître que c’est bien peu intéressant… De même, l’application ebird.org, une encyclopédie des oiseaux, avec géolocalisation, qui est devenue une application iPhone, qui permet aux passionnés de retrouver l’information en contexte, particulièrement d’un point de vue géographique. On voit bien le potentiel de ces livres-applications, mais la démonstration s’arrête vite… on passe déjà à foursquare, puis Tweetawatt, qui est un outil pour twitter sa consommation électrique en temps réel… So what?

Le cœur du propos du conférencier est de pousser à l’étude et à la cartographie des usages sociaux en ligne, ce qu’il appelle sociographics. Il s’agit d’une analyse statistique et graphique des comportements en réseau des internautes, à travers l’étude de leur identité numérique, de leurs relations et de leur activité en ligne. Il cite quelques outils allant dans ce sens :
- http://my.peoplebrowsr.com/
- http://squawq.com/

Pas de quoi tomber de son fauteuil, me semble-t-il. Au fond, le vrai point intéressant de la conférence porte sur la dénonciation des approches fermées et centralisatrices des réseaux sociaux comme Facebook. Il promeut l’adoption de Google Open Social API, pour disposer d’outils transversaux et ouverts, permettant d’avoir des interactions sociales dans un univers complexe, associant de nombreux sites et de nombreux périphériques. Mais les détails sur l’API Open Social de Google seront sans doute pour une autre conférence…

L’impression numérique (Tools of change for publishing)

mar, 02/23/2010 - 17:51

Pour la deuxième année consécutive, me voici à New York, pour assister à Tools of change for publishing (TOC), la grand-messe sur l’édition et sur l’édition électronique. Je tente de bloguer en direct les conférences les plus marquantes.

Sur l’impression numérique, il y avait hier un atelier à TOC 2010. Hubert Guillaud l’a bien mieux résumé que ce que j’aurais pu faire.

Lors d’un des premiers ateliers de l’après-midi, Brian O’Leary de Magellan Media et Ashley Gordon de Mockingbird Publishing ont proposé une défense très orientée business de l’impression numérique et de ses possibilités. Les spécialistes n’apprendront pas grand chose de cette présentation, mais la synthèse était riche d’exemples d’utilisation possible de l’impression numérique pour les éditeurs. Il faut reconnaître que ceux-ci y ont encore trop peu recours. Cela explique certainement la clarté très argumentée de cet atelier.

L’univers de l’impression numérique ne se limite pas à l’impression à la demande (le bien connu POD, pour Print on demand), rappelle Ashley Gordon. Elle ne se limite pas non plus au livre, mais à l’ensemble des contenus, glisse-t-elle subtilement. L’impression numérique recouvre plusieurs réalités comme l’impression à la demande, l’impression à court terme, l’impression unique…

Lire la suite…

Le livre augmenté (Tools of change for publishing) – Peter Collingridge

mar, 02/23/2010 - 17:01

Pour la deuxième année consécutive, me voici à New York, pour assister à Tools of change for publishing (TOC), la grand-messe sur l’édition et sur l’édition électronique. Je tente de bloguer en direct les conférences les plus marquantes.

Nous avons eu droit à une keynote de Peter Collingridge, qu’Hubert Guillaud, mon voisin de table, a synthétisée. La présentation publicitaire d’Enhanced-editions est assez éclairante sur la façon dont le conférencier conçoit ce qui est bien le successeur des CD-ROM, le livre-application. La conférence a notamment dressé le tableau d’une recomposition des métiers de l’édition.

Peter Collingridge, consultant chez APT (blog) et cofondateur d’Enhanced-editions, connu notamment pour l’application iPhone du livre de Nick Cave, The Death of Bunny Munro (voir les explications d’ebouquin.fr), revient sur les choix qui ont présidé à la création de Enhanced editions (EE). Parmis leurs réalisation, le site de l’auteur James Frey ou Bookseer, un outil simple de recommandation en ligne puisant dans les recommandations des lecteurs d’Amazon et de LibraryThing. Mais Apt Studio a également produit plusieurs films comme 25th Estate, une double compétence qui explique certainement l’origine de leur application.

Lire la suite…

Le droit n’est pas un modèle économique (Tools of change for publishing) – William Patry

mar, 02/23/2010 - 16:42

Moral panics and the copyright wars

William Patry est un juriste prolifique, qui travaille désormais pour Google, mais ne parle pas en son nom aujourd’hui… Il vient parler du droit selon une ligne iconoclaste pour un juriste…

D’après lui, en général, les juristes pensent que la loi est une solution pour tous les types de problème. Les acteurs économiques ont aussi cette tendance très prononcée : chercher dans la loi des solutions à tous leurs problèmes. C’est ainsi que le piratage est dénoncé comme la source de tous les maux des industries culturelles…

Iconoclaste, mais très américain, il croit aux vertus de la compétition. Et ne considère pas qu’on puisse gagner une médaille d’or aux Jeux Olympiques par la seule force de la loi. Pour lui, il n’est pas possible de menacer de prison des jeunes de 20 ou de 25 ans, en espérant que cela aura pour conséquence un succès en librairie ou au box-office

Il s’appuie sur la notion de “regulatory capitalism”, un capitalisme non libéral, dans lequel on s’appuie sur la loi pour s’imposer, au lieu de jouer le jeu de la concurrence. Lorsque les lobbys de Walt Disney, par exemple, demandent à renforcer la force du copyright, cela revient à exercer une contrainte sur les citoyens, c’est-à-dire à chercher de les empêcher… ce qui revient à les obliger. Mais il n’est pas possible de forcer les gens à acheter un livre ou un album.

William Patry insiste sur le fait que des contraintes juridiques plus fortes ne vont pas contribuer à développer l’édition de livres. Et de révéler sa conviction : le copyright ne crée pas de valeur économique. Le copyright n’a pas de vertu magique. Ce qui donne de la valeur marchande aux biens culturels, c’est la volonté des gens de les acheter.

Il y a trop d’entreprises qui appuient leur modèle économique sur la force de la loi. S’appuyer sur la loi pour construire un projet, c’est compenser les faiblesses de son projet en s’appuyant sur une force artificielle. Il faut, au contraire, s’appuyer sur de l’innovation.

William Patry conclut en s’appuyant sur un exemple de création de valeur qu’il considère comme réellement innovant. Ce sont les Dynamic books de Mac Millan, que le Cléoradar signalait hier : des livres scolaires qui vont pouvoir être composés à façon, pour s’adapter au contexte pédagogique particulier.  Ils ont décidé de les vendre moins cher que les livres classiques. C’est du livre sur-mesure. Or, en ajoutant de la valeur par la personnalisation, ils rendent la revente du livre plus difficile… Il y a donc, pense William Patry, une double création de valeur. Plus c’est personnalisé, moins c’est adapté à d’autres usages.

Sur William Patry

Bio : http://en.wikipedia.org/wiki/William_F._Patry

Blog : Moral panics and the copyright wars

Bookserver, diffusion et commercialisation distribuée de livres sur Internet (OPDS pour les intimes) – TOC 2010

mar, 02/23/2010 - 05:47

Schéma de Bookserver - Auteur inconnu et licence inconnue

Pour la deuxième année consécutive, me voici à New York, pour assister à Tools of change for publishing (TOC), la grand-messe sur l’édition et sur l’édition électronique. Je tente de bloguer en direct les conférences les plus marquantes.

Je l’ai déjà écrit dans ces colonnes, les protocoles et les formats d’échanges de données doivent être ouverts. Dans le domaine de l’édition électronique, l’enjeu est évident. La norme OPDS, pour  Open Publication Distribution System, est une des planches de salut en direction d’une ouverture du monde des livres en ligne, dans une perspective distribuée, par opposition à une perspective qui serait hyper-concentrée autour de trois ou quatre acteurs, qui serait Amazon, Apple et Google.

Le format OPDS est un format de syndication pour la publication électronique s’appuyant sur ATOM (RFC4287) et le protocole HTTP (RFC2616). Il permet l’agrégation, la distribution, la détection et l’acquisition de publications électroniques. OPDS utilise des standards ouverts existants ou émergeants, en mettant l’accent sur la simplicité.

Dans un atelier très clair, mais trop court pour entrer dans les détails, Hadrien Gardeur (Feedbooks), Keith Fahlgren (Threepress Consulting Inc.) et Liza Daly (Threepress Consulting Inc.) ont montré le potentiel de ce format.

Il s’agit de permettre la diffusion de catalogues de contenus (livres et publications en général), indépendamment de la plateforme de diffusion et du lecteur utilisé (sofware et hardware). C’est l’équipe de développement de Stanza est à l’origine de la création d’OPDS. Depuis son acquisition par Amazon, si j’ai bien compris, il n’y a pas de position officielle d’Amazon au sujet d’OPDS.

J’ai tenté de résumer l’architecture par un schéma naïf (ci-dessous).

On distingue :

  • le lecteur, qui s’adresse à un client (au sens de logiciel),
  • le client, qui peut être une application iPhone (Stanza), Androïd (Aldiko), un cyberlibraire (Immateriel),
  • des catalogues, qui sont compatibles avec OPDS.

Le lecteur interroge l’interface proposée par le client. Sur Aldiko, la présentation est construite pour donner l’impression qu’on consulte une bibliothèque. Le client est capable de mettre en valeur chaque catalogue séparément, ou bien de mettre en place sa propre approche de valorisation, s’appuyant sur les métadonnées de l’ouvrage délivrées par le catalogue, ou bien en ajoutant une couche d’information qui lui soit propre.

Le catalogue offre au client deux types d’informations :

  • des métadonnées classiques, décrivant la ressource;
  • un ou des liens dits d’acquisition : lien vers emprunt, location ou achat. L’acquisition peut être gratuite ou payante.

Ecran d'Aldiko

OPDS s’appuie sur ATOM, standard très répandu. Le protocole s’appuie aussi sur le standard OpenSearch. Il a, par ailleurs, l’ambition d’être un standard plus simple qu’Onyx.

Les spécifications ne sont pas encore définitives. On nous les promet pour bientôt…

L’OPDS a pour objectif d’être, pour les livres, ce que l’OAI-PMH a été pour les articles scientifiques. Un outil de distribution relativement aisé à mettre en place, délivrant des métadonnées structurées à destination des opérateurs souhaitant moissonner et valoriser les contenus des dépôts d’articles. Ici, la différence est que le livre a fortement inspiré ce protocole (qui n’est en fait pas vraiment un protocole), ce qui a plusieurs incidences :

  • l’objet physique a une importance, et les outils de consultation de catalogue affichent volontiers une couverture (au besoin, une couverture fictive), qui est prévue dans les champs de base du format ;
  • l’unité documentaire de base est la publication (en général, le livre), c’est-à-dire que nous nous situons plus haut dans la hiérarchie documentaire. L’unité documentaire de l’OAI-PMH, les articles, est plus profonde, ce qui a eu pour effet de diluer l’importance du numéro, parfois même de la revue elle-même. Il y a bien des “sets”, mais ceux-ci peuvent décrire beaucoup de choses différentes, et la structure n’est pas très directive… Au final, dans l’OPDS, il est possible de décrire en profondeur une structure éditoriale, et à chaque niveau, de proposer le texte correspondant au téléchargement. C’est conçu pour des livres, mais ça peut marcher pour des revues : il suffit de proposer au téléchargement le numéro (au niveau n) et les articles (au niveau n-1 ou n-2 ou même n-3).
  • le format de diffusion du texte intégral n’est pas contraint, mais les concepteurs d’OPDS promeuvent le format Epub. Il est tout-à-fait possible de proposer de la TEI, du PDF ou du MP3…
  • la diffusion en libre accès n’est qu’une des modalités de diffusion : la diffusion commerciale est également possible, avec inclusion d’un prix et d’un protocole de transaction. C’est sur ce point que la présentation a été la plus rapide et la moins précise. Il semble cependant que la transaction soit en fait assurée par le détenteur du catalogue, typiquement l’éditeur. L’authentification https semble prévue, mais les détails ont manqué lors de cette courte présentation. Des authentifications par plages d’IP seront-elles possibles ? Pourra-t-on gérer des accès à des lots ou des bouquets de contenus, en complément d’accès à l’unité ?

On devine qu’il sera possible de créer une architecture plus complexe que cela, dans laquelle des catalogues OPDS seraient alimentés par d’autres catalogues OPDS…

Par ailleurs, OPDS ne demande qu’à se développer et à s’étendre (Cf. Extending OPDS).

Il faudra approfondir tout cela. Les organisateurs de TOC ont considéré que le sujet était assez important pour lui consacrer une conférence plénière, en plus de l’atelier d’aujourd’hui : A Future for Books: BookServer. C’est Brewster Kahle, d’Internet Archive, qui officiera. Quand on vous dit que c’est important ! Et on se doute que certains acteurs vont contourner OPDS pour imposer leur mode opératoire et construire des citadelles bien gardées. Il ne tient qu’à la profession de s’organiser pour rendre cela impossible.

Mieux comprendre

Un diaporama qui reprend une grande partie de ce qui a été dit aujourd’hui : http://www.slideshare.net/bisg/bisg-webcast-bookserver

Des explications d’Internet Archive : http://www.archive.org/bookserver

Hubert Guillaud a assisté à la même conférence que moi : Welcome to OPDS (Open publication distribution system) !

Quelques liens techniques

Le site d’OPDS : http://code.google.com/p/openpub/

Spécifications provisoires : http://code.google.com/p/openpub/wiki/CatalogSpecDraft

Propositions d’extensions d’OPDS : Extending OPDS

Tools of change for publishing, saison 2

mar, 02/23/2010 - 03:23

New York sous la neige, février 2010, licence CC (Marin Dacos)

Pour la deuxième année consécutive, me voici à New York, pour assister à Tools of change for publishing (TOC), la grand-messe sur l’édition et sur l’édition électronique. C’est à Times Square que se produit l’événement, au milieu des néons et au sein d’un palace au luxe tapageur…

Cette année, ce voyage d’études a été financé par Cap Digital, par l’École des hautes études en sciences sociales (EHESS) et par le Centre pour l’édition électronique ouverte (Cléo).

Comme l’année dernière, je tenterai de prendre quelques notes et de vous faire profiter de ce que j’apprends outre-Atlantique. Cette fois, j’ai la chance d’avoir un compagnon de jeu en la personne d’Hubert Guillaud, qui blogue plus vite que son ombre, et qui va me permettre de le regarder tapoter pendant les conférences… Il a déjà publié un compte-rendu ce matin : Construire la présence des auteurs en ligne.

Pour mémoire, voici les principaux billets publiés l’année dernière. Une grande partie d’entre eux reste d’actualité. Et comme l’interopérabilité est un de mes dadas, je prépare, de ce pas, une piqûre de rappel sur l’OPDS.

L’epub pour de vrai (Tools of change for publishing)

Keith Fahlgren (O’Reilly Media, Inc. ) Des fonctionnalités définies pour l’utilisateur (”reader-defined navigation”) Epub offre de nouvelles possibilités aux lecteurs. Le lecteur a besoin de tables des matières, de plus de figures, d’index, de possibilités de recherche (même dans le domaine de la fiction). Nous devons rendre nos contenus faciles à réutiliser et à relire. Les fonctionnalités…
Lire la suite
Enjeux de l’édition électronique (Tools of change for publishing)

Orateurs : Michael Smith (International Digital Publishing Forum), Kenneth Brooks (Cengage Learning), Leslie Hulse (HarperCollins Publishers), Cynthia Cleto (Springer Science+Business Media) Neuf enjeux majeurs L’identification des enjeux de l’édition électronique est un exercice relatif, voire subjectif, qui dépend essentiellement de la position de son auteur. A “Tools of change for publishing”, la préoccupation commerciale est évidente….
Lire la suite
Readius eReader (Tools of change for publishing)

La démonstration du Readius eReader (and PressDisplay) à TOC comme si vous y étiez. Thanks to Open publishing lab. O’Reilly Tools of Change: Readius eReader (and PressDisplay) Demo from Open Publishing Lab on Vimeo.
Lire la suite
Et si iTunes avalait tous vos livres ? (Tools of change for publishing)

Digital Distribution and the Whip Hand: Don’t Get iTunesed with your eBooks (Tools of Change for Publishing) Cory Doctorow (Happy Mutants LLC). En direct de New-York (TOC). Cory Doctorow a fait un show. Comme tous les shows, il s’appuie sur des trucs et des astuces de langue, qui échappent partiellement au français moyen que je suis, du…
Lire la suite
Les projets de l’Open publishing lab (OPL) (Tools of Change for Publishing)

Résumé (officiel) “Taking Open Source Publishing Further: Tools from the Open Publishing Lab at the Rochester Institute of Technology. RIT’s Open Publishing Lab will present a suite of open-source applications, currently under development, that enhance and extend current publishing platforms, including a tool to automatically convert wikis and blogs into ready-to-print books, Drupal extensions that allow…
Lire la suite
Expériences d’édition électronique (Tools of change for publishing)

Liveblogging en direct de New York,  TOC. Orateurs : Michael Smith (International Digital Publishing Forum), Kenneth Brooks (Cengage Learning), Leslie Hulse (HarperCollins Publishers), Cynthia Cleto (Springer Science+Business Media) La matinée sur les ebooks a permis de couvrir un certain nombre d’expérimentations en cours, dont je vous propose une sélection ici. Constatant que le temps passe et…
Lire la suite
What would Google do? (Tools of change for publishing)

Jeff Jarvis (Buzzmachine.com) JEFF JARVIS is the author of What Would Google Do? (Collins, January). He blogs about media and news at Buzzmachine.com and as a columnist for the Guardian. He is associate professor and director of the interactive journalism program at the City University of New York’s new Graduate School of Journalism. He is…
Lire la suite
“A book is a place” (Tools of change for publishing)

Bob Stein, de l’Institute for the Future of the Book, a ouvert la journée par une intervention sur la définition du livre. Il part de l’idée que les livres sont les choses qui permettent aux humains de manipuler des idées à travers le temps et l’espace (”Books are what humans use to move ideas…
Lire la suite
Le casse-tête des formats de livres électroniques (Tools of change for publishing)

Dans le cadre d’un voyage d’études aux USA, je vais tenter de rendre compte, en direct, de mes rencontres et des informations collectées. Ce travail de compte-rendu, appelé “live blogging” a pour objectif le partage de l’information avec l’équipe du Centre pour l’édition électronique ouverte (Cléo), et, d’une façon plus large, avec les acteurs…
Lire la suite

Semaine de l’édition électronique scientifique au Proche-Orient

mar, 02/16/2010 - 17:42

Le Bureau Moyen-Orient (BMO) de l’Agence universitaire de la francophonie (AUF), les Centres culturels français (CCF) de Beyrouth et Damas et le Centre pour l’édition électronique ouverte (Cléo) s’associent à l’Institut français du Proche-Orient (Ifpo) pour organiser une semaine de formation à l’édition électronique scientifique au Proche-Orient du 12 au 15 avril 2010.

Les sciences humaines vivent à l’heure d’une intégration chaque jour plus systématique des technologies numériques dans les pratiques de recherche. Cette semaine de l’édition électronique sera l’occasion pour les chercheurs, doctorants et ingénieurs de se confronter à l’utilisation des outils d’édition en ligne et d’échanger leurs expériences face à l’irruption du Web dans le champ éditorial scientifique. Les formations et les conférences permettront également d’explorer les différentes possibilités de diffusion des savoirs et des revues, à partir de l’expérience du Cléo et de Revues.org.

Calendrier Date limite d’inscription : 30 mars 2010

Lundi 12 avril 2010 à Damas

Formation : Les blogs scientifiques et Hypothèses, plateforme de carnets de recherche en sciences humaines et sociales

Conférence : Les ressources électroniques en libre accès en sciences humaines et sociales : Revues.org, Hypothèses et Calenda

Mardi 13 avril 2010 à Beyrouth

Conférence : Les ressources électroniques en libre accès en sciences humaines et sociales : Revues.org, Hypothèses et Calenda

Mardi 13 et mercredi 14 avril 2010 à Beyrouth

Formation : Lodel utilisateur

Jeudi 15 avril 2010 à Beyrouth

Formation : Les blogs scientifiques et Hypothèses, plateforme de carnets de recherche en sciences humaines et sociales

  • Lieu : Rectorat de l’Université Libanaise
  • Horaire : de 10h00 à 16h00
  • En savoir plus
Candidatures
  • 30 mars 2010 : Date limite des candidatures
  • Nombre de places par formation : 6
  • Pour participer à la formation « Lodel utilisateur », prière d’envoyer un courriel à lodel@lb.auf.org
  • Pour participer à la formation « Les blogs scientifiques et Hypothèses », prière d’envoyer un courriel à blog@lb.auf.org

Les formations sont gratuites

Partenaires

Programme des formations et conférences Les blogs scientifiques et Hypothèses, plateforme de carnets de recherche en sciences humaines et sociales

Formateurs

  • Pierre Mounier – Cléo
  • Jean-Christophe Peyssard – Ifpo

Présentation

Hypothèses est une plateforme de publication de carnets de recherches. Les carnets de recherche offrent une solution rapide et légère pour rendre compte régulièrement de recherches sur Internet. Peuvent ainsi être créés des carnets de fouilles archéologiques, des chroniques scientifiques sur un thème précis, des carnets de bord d’une recherche collective en cours, des carnets de terrain, des blogs de revues ou de livres, des newsletters scientifiques, etc. Hypothèses accompagne le travail de mise en forme et de valorisation de projets éditoriaux en mettant à disposition des équipes les fonctionnalités souples d’un blog.

Il s’agit d’une initiative du Centre pour l’édition électronique ouverte (Cléo), laboratoire du Centre national de la recherche scientifique (CNRS), de l’École des hautes études en sciences sociales (EHESS), de l’Université de Provence et de l’Université d’Avignon, qui met en œuvre notamment le portail Revues.org.

Objectifs de la formation

  • Montrer la diversité, les enjeux, l’intérêt des blogs pour les chercheurs, les enseignants-chercheurs et les doctorants ;
  • Donner des repères sur la blogosphère scientifique en Sciences humaines ;
  • Présenter Hypothèses, plate forme de carnets de recherche en sciences humaines et sociales du Cléo ;
  • Apprendre à créer, alimenter et configurer un blog avec Wordpress, sur Hypothèses ou ailleurs

Contenu de la formation

  • Rappel sur les blogs en général : principes, fonctionnement, aspects techniques, typologies ;
  • Qu’est-ce qu’un « carnet de recherche » ? : spécificités de la blogosphère scientifique, notamment en sciences humaines ; différents types de blogs, intérêt pour les chercheurs, questions posées par ces nouvelles formes d’écriture et de diffusion scientifique ; comment trouver des blogs scientifiques ;
  • Présentation de la plateforme Hypothèses : le Cléo (Centre pour l’édition électronique ouverte) et le portail Revues.org ; fonctionnement, contenu, partenaires de la plateforme Hypothèses ; diversité des carnets de recherche ; outils d’utilisation de la plate forme ;
  • Place des carnets de recherche dans les nouveaux circuits de l’information scientifique.
  • Présentation de l’interface d’édition de Wordpress
  • Les objets de Wordpress : billets et pages, tags et catégories
  • Personnaliser l’apparence de son blog
  • Ajouter et éditer des contenus
  • Configurer le fonctionnement de son blog
  • Utilisation avancée : les extensions
Formation Lodel utilisateur

Formateurs

  • Pierre Mounier – Cléo
  • Jean-Christophe Peyssard – Ifpo

Présentation Lodel est le logiciel d’édition électronique développé par le Centre pour l’édition électronique ouverte (Cléo) pour la diffusion en ligne de ses revues adhérentes sur le portail Revues.org. Lodel est aussi un logiciel libre qui peut être utilisé gratuitement pour créer des sites de revues, de collections de livres électroniques ou d’autres types de contenus éditorialisés.

Programme de la formation

  • Initiation aux principes et enjeux de l’édition électronique en sciences humaines et sociales ;
  • Présentation du logiciel Lodel : principes, objets éditoriaux et mode de fonctionnement ;
  • Présentation de l’interface du logiciel ;
  • Création et édition des publications et des documents ;
  • Fonctions avancées : gestion des index, des documents annexes, des images et documents multimédias, des utilisateurs. La syndication d’information par flux RSS ;
  • Apprentissage du stylage des documents dans les logiciels de traitement de texte en vue de leur importation dans Lodel ;
  • Trucs et astuces de stylage. Le logiciel Orphan Notes.
Conférences Les ressources électroniques en libre accès en sciences humaines et sociales : Revues.org, Hypothèses et Calenda

Conférencier

  • Pierre Mounier – Cléo

Présentation

Créé en 1999, le portail en ligne Revues.org propose 35000 articles majoritairement francophones en libre accès provenant de plus de 160 revues de sciences humaines et sociales en ligne. Il s’accompagne aujourd’hui de services associés comme Calenda, l’agenda des sciences sociales qui publie chaque mois près de 200 annonces d’événements scientifiques, et Hypothèses, plateforme de carnets de recherche en sciences humaines qui permet aux équipes de recherche d’informer en temps réel leur communauté et le public de l’avancée de leurs travaux. Enfin, depuis septembre 2008, Revues.org propose à des éditeurs et des institutions partenaires, comme l’Ifpo, de diffuser sur son portail des collections de livres électroniques en libre téléchargement.   Engagé en faveur du libre accès aux résultats de la recherche, le Centre pour l’édition électronique ouverte (Cléo), qui édite ces trois portails, offre aux équipes scientifiques une plateforme d’édition électronique complète basée sur le principe de l’appropriation éditoriale. Cette dernière permet aux communautés des sciences humaines et sociales à la fois de maîtriser autant que possible le processus de publication en ligne et d’affirmer dans l’environnement numérique leur identité propre.

Voir l’annonce de cette semaine sur

Crédits photographiques : « L’année 368, Gaius Virius Alkimos et Titus Statilius Hermès ont fait (ce tombeau) pour eux et les leurs »,
Inscription trilingue latin-grec-araméen du Musée de Palmyre (ref. A 1500/9194, photographie tirée du livre Inscriptions de Palmyre. Promenades épigraphiques dans la ville antique de Palmyre, Guides archéologiques de l’IFAPO n° 3, p. 3)

Rencontrer le Cléo au « rendez-vous des sciences humaines »

ven, 02/12/2010 - 16:24

« Inès de Montesquieu » Par Lisa George, en CC by-nc-nd

Organisé par la Fondation maison des sciences de l’homme (FMSH), « Les Rencontres du Livre de sciences humaines » deviennent en 2010 « Le Rendez-vous des sciences humaines » qui se tiendra à l’Espace d’animation des Blancs-Manteaux, à Paris, du 12 au 14 février.

La formule qui a fait le succès des éditions précédentes est maintenue mais s’améliore cette année par l’introduction d’une thématique générale : « L’humanisme, valeur du présent ? ». Plusieurs tables rondes et conférences seront consacrées à cette question.

Par ailleurs, de nombreux chercheurs et éditeurs chinois seront à l’honneur cette année et participeront aux débats. L’accès à toutes les animations est gratuit.

Le Cléo sera présent lors de ce rendez-vous. Vous pouvez venir nous rencontrer sur notre stand pendant toute la durée du salon.

Nous présenterons au public les nouveautés fonctionnelles et éditoriales de cette année : le portail, le moteur de recherche, les collections de livres, l’insertion de documents multimédias, les nouvelles revues concernées par notre accord de commercialisation avec Cairn, les services documentaires proposées aux bibliothèques.

Nous exposerons aussi les projet sur lesquelles nous travaillons : la diffusion au format Epub, la distribution de livres numériques sur des plateformes de commercialisation, l’impression à la demande.

Cette présentation se déroulera le samedi 13 février à l’espace des Blancs-Manteaux de 12h à 13h.

Inès de Montesquieu, responsable du pôle édition du Cléo, participera à la rencontre inter-professionnelle « La diffusion des savoirs à l’ère des archives ouvertes : réinvention ou disparition du métier d’éditeur ? » qui se déroulera le dimanche 14 février de 11h à 13h.  Elle y parlera du modèle de libre accès que le Cléo développe avec Revues.org.

Voici la présentation de la rencontre :

La multiplication sur Internet de sites collaboratifs, le développement des archives ouvertes et de la culture du « libre accès » à l’information sont actuellement des tendances fortes qui influent aussi bien sur la communauté scientifique que sur le monde de l’édition en SHS.

Un rapport récent réalisé par le Groupement français de l’industrie de l’information (GFII) pour le TGE Adonis, insiste sur :
« la nécessité d’une réinvention du métier d’éditeur de recherche SHS, au-delà des fonctions éditoriales classiques, vers l’édition de corpus, l’édition de collection de données, la gestion déléguée d’archives institutionnelles et l’enrichissement de celles–ci en métadonnées, la déclinaison de ressources éditoriales nouvelles (bases de connaissance, bases terminologiques, etc.) construites en s’appuyant, dans un cadre marchand ou non, sur les logiques du Web collaboratif. Cette réinvention de la fonction d’éditeur de recherche doit toucher aussi bien les éditeurs publics que les éditeurs privés. ».

Au-delà de l’effervescence suscitée par ces nouveaux modèles de diffusion des savoirs, une question est en jeu qui nous semble devoir être débattue en priorité : la plus-value éditoriale et ses conséquences épistémologiques…

Rencontre animée par Jean-Michel Henny (Fondation MSH)

Avec Mme Christine Berthaud, responsable du Service d’Ingénierie documentaire de l’Institut des sciences de l’homme, représentante de HAL-SHS
M. Richard Figuier, directeur des publication de l’École française de Rome
M. Cory Mc Cloud, directeur de la société Giantchair
M. Marc Minon, directeur du portail Cairn

Lien

Programme du « Rendez-vous des sciences humaines »

Formations URFIST-Cléo : matchs retour à Paris, Lyon, Strasbourg

jeu, 02/11/2010 - 12:33

Le réseau des URFIST (Unités régionales de formation à l’information scientifique et technique) et le Cléo ont conclu un accord pour organiser des formations en commun. Plusieurs formations sont organisées dans les semaines à venir avec les URFIST de Paris, Lyon et Strasbourg. On en trouvera le descriptif ci-dessous :

L’édition électronique en sciences humaines et sociales : les ressources documentaires proposées par le Cléo Objectifs du stage

- Présenter aux professionnels de l’information (bibliothécaires, documentalistes) de l’enseignement supérieur toutes les ressources documentaires de la plateforme d’édition électronique Revues.org ;
- montrer les différents services proposés aux utilisateurs, former à l’utilisation avancée de la plateforme ;
- montrer l’apport des ressources intéressant directement le monde des bibliothèques universitaires.

Contenu du stage

1/ Introduction sur l’édition électronique en sciences humaines
2/ Présentation sur l’intérêt et les enjeux du libre accès dans l’édition scientifique et sur le rôle des bibliothèques
3/ Présentation du Cléo (Centre pour l’édition électronique ouverte) : origines, missions, acteurs…
4/ Présentation de la plateforme d’édition électronique Revues.org et de ses services : Revues.org et Livres, Calenda, les carnets de recherche d’Hypothèses, Manuscrits…
5/ Les services pour les usagers : principes de navigation, moteur de recherche et index, interopérabilité trans-plateforme…
6/ Les ressources pour les bibliothèques : indexation (OAI, Coverage), statistiques, prochains développements (XML NLM, DOI, Open URL)

Ce stage se déroulera :

* le vendredi 12 février 2010 à Paris. (stage complet)
* le mardi 16 mars 2010 à Strasbourg.
Cliquer ici pour en savoir plus et s’inscrire
* le lundi 22 mars 2010 à Lyon.
Cliquer ici pour en savoir plus et s’inscrire

Une présentation détaillée du nouveau portail de Revues.org ainsi que de son nouveau moteur de recherche à facettes sera faite au cours de ces journées.

Le blogging scientifique et la plateforme de carnets de recherche Hypothèses

* le mardi 23 mars 2010 à Lyon. La journée se divise en deux parties. La matinée est consacrée à une présentation de la plateforme et des enjeux du blogging scientifique,  l’après-midi est un atelier destiné à apprendre l’utilisation du  logiciel de publication de blogs Wordpress, dans le cadre d’Hypothèses ou non.

Les carnets de recherche en Sciences Humaines et Sociales : espaces de reflexion et de communication pour la recherche Objectifs

- Apporter des repères sur la blogosphère scientifique en sciences humaines et sociales
- Montrer la diversité des blogs de recherche et les enjeux que ce support peut représenter pour les enseignants-chercheurs et les doctorants
- Connaître Hypothèses, la plate forme de carnets de recherche en SHS éditée par le Cléo

Contenu

1/ Rappel sur les blogs : les principes, le fonctionnement, aspects techniques et typologie
2/ Les carnets de recherche en SHS : spécificités de la blogosphère scientifique, types de blogs scientifiques, l’intérêt pour les chercheurs, comment trouver des blogs scientifiques,
3/ Place des carnets de recherche dans les nouveaux circuits de l’information scientifique, questions posées par ces différentes formes d’écriture
4/ Présentation de la plate forme Hypothèses : fonctionnement, contenu, partenaires, outils

Cliquer ici pour s’inscrire et en savoir plus

Ouvrir son blog sur Hypothèses : un outil pour les chercheurs en Sciences Humaines et Sociales Objectifs

- Connaître Hypothèses, la plate forme de carnets de recherche en SHS éditée par le Cléo
- Apprendre à créer, alimenter et configurer un blog avec Wordpress, sur Hypothèses ou ailleurs

Contenu

1/ L’interface Wordpress, les objets de Wordpress (billets et pages, les tags et catégories )
2/ Ouvrir son blog dans Hypothèses : personnaliser l’apparence de son blog, ajouter et éditer des contenus, configurer le fonctionnement de son blog.

Cliquer ici pour s’inscrire et en savoir plus

Le Cléo est membre de l’Association française des utilisateurs de logiciels libres (AFUL)

mar, 02/09/2010 - 15:35

Fortement utilisateur de logiciels libres, développant lui-même des logiciels libres, le Centre pour l’édition électronique ouverte (Cléo) renouvelle cette année son adhésion à l’AFUL.

Depuis 1998, l’AFUL a pour but de promouvoir le logiciel libre, en particulier les systèmes d’exploitation (comme GNU-Linux ou les systèmes BSD libres), et aide à la diffusion de standards ouverts. L’AFUL est une organisation à but non lucratif (association loi 1901) qui réunit des utilisateurs, des professionnels, des entreprises et d’autres associations situées dans plus de dix pays et régions francophones (France, Belgique, Suisse, Québec, pays d’Afrique francophone, etc.)

  • L’AFUL est un contact privilégié pour joindre la communauté francophone du logiciel libre. Elle tient à jour la liste de référence des groupes d’utilisateurs de logiciels libres (GUL).
  • L’AFUL est un acteur clé dans le domaine de l’Éducation, avec l’accord-cadre passé avec le ministère français de l’Éducation nationale (depuis 1998) et avec l’Agence Universitaire de la Francophonie (depuis 1999).
  • L’AFUL est membre fondateur de l’association Scideralle qui depuis 2002 soutient des projets visant à fournir à tout public des logiciels et ressources libres pour l’enseignement et l’éducation populaire.
  • L’AFUL s’est considérablement impliquée dans des travaux, rapports, et processus législatifs liés à l’évolution de la législation française du droit d’auteur et relatifs à la législation touchant les médias numériques, dont Internet. L’AFUL participe aux travaux du Conseil Supérieur de la Propriété Littéraire et Artistique Français (CSPLA) au titre des logiciels libres et plus généralement des œuvres ouvertes et sous licence libre.
  • L’AFUL est l’initiatrice en 1999 du mouvement contre les brevets logiciels, et un des membres fondateurs de l’Alliance EuroLinux. L’AFUL soutient également les actions d’Economic Majority.
  • L’AFUL tient à jour un dossier sur les modèles économiques liés aux logiciels libres. Ses membres débattent en permanence afin d’analyser, évaluer et conseiller dans le champ économique. Ordinateurs et outils électroniques sont vendus ces dernières années avec des logiciels préinstallés, empêchant les consommateurs de choisir les logiciels et de payer seulement pour ceux dont ils ont besoin.
  • Depuis 1999, l’AFUL est un des acteurs les plus avancés au monde dans la lutte contre la vente liée et l’information du consommateur dans le domaine de l’informatique. L’AFUL a financé des actions en justice et a initié la pétition Racketiciel.info dans le but que chaque utilisateur/consommateur puisse acheter des ordinateurs et du matériel sans être contraint de payer de logiciel non désiré.
  • L’AFUL aide à organiser et financer des actions et des évènements tels que les Rencontres Mondiales du Logiciel Libre.

Plaquette de l’AFUL

Positions de L’AFUL sur certains sujets majeurs liés aux logiciels libres

Les revues de Revues.org indexées sur TicTOCs

jeu, 02/04/2010 - 12:42

« Clock », par vagabond by nature/Jonathan Steffens, en CC by-nc

TicTOCs référence 113 revues adhérantes à Revues.org soit plus de la majorité des revues en ligne sur le portail.

TicTOCs est une base de données britannique ayant pour objectif de fournir un accès rapide et clair aux sommaires des grandes revues scientifiques internationales. Un billet, en avril 2008, vous avait informé de l’ouverture de ce service.

Aujourd’hui, TicTOCs a grandi et permet une recherche sur plus de 12 740 sommaires de revues scientifiques, ainsi que sur les collections de quelques 449 éditeurs. Bien plus, la base s’est désormais enrichie de nouveaux outils facilitant grandement l’accès à ces informations. En effet, TicTOCs offre à ses abonnés, outre un espace de suivi des sommaires de revues les plus intéressantes,  la possibilité d’en exporter le  flux vers leur agrégateur de flux personnel (google reader, netvibes, bloglines, etc.). Il vous est ainsi possible de suivre l’actualité de votre sélection de revues en temps réels, sans devoir vous connecter sur TicTOCs.

Le pôle information scientifique du Cléo travaillant en collaboration avec l’équipe de gestion de TicTOCs, les revues adhérantes à revues.org font partie intégrante de ce service. Le rôle du Cléo est ainsi de veiller à la présence des revues, en relayant les problèmes éventuels, et surtout, de suggérer de nouveaux outils et les nouvelles adhésions afin d’améliorer le référencement.

Pour plus d’informations sur les bases de données internationales et sur l’action du Cléo en référencement, n’hésitez pas à nous contacter à l’adresse suivante:  referencement@revues.org

Du Literary and linguistic computing aux Digital Humanities : retour sur 40 ans de relations entre sciences humaines et informatique

sam, 01/30/2010 - 16:58

Dans le cadre du séminaire Digital Humanities : les transformations numériques du rapport aux savoirs, nous avons reçu le 16 décembre dernier Lou Burnard, qui est directeur de l’Information and support group des Oxford University Computing Services. Figure importante de la communauté TEI, il est co-éditeur des Guidelines for Electronic Text Encoding and Interchange et participe aux travaux du British National Corpus. Il travaille depuis cette année à temps partiel pour le TGE Adonis.

Résumé de la communication

Les sciences humaines sont en train de vivre un tournant majeur en intégrant de manière de plus en plus étroite l’usage des technologies numériques dans leurs pratiques de recherche. Cette évolution est pourtant en marche depuis plusieurs décennies, avec, dès les années 60, la réalisation de l’index Thomisticus par Roberto Busa. Dans son intervention, Lou Burnard revient sur cette évolution historique qu’il propose d’analyser suivant une structuration en trois périodes : Literary & linguistic computing, Humanities computing et enfin Digital humanities. Ces trois moments peuvent être identifiés comme trois pistes et positionnements différents dans la manière d’explorer les relations entre sciences humaines et informatique.

Support de présentation

Du Literary and linguistic computing aux Digital Humanities : retour sur 40 ans de relations entre sciences humaines et informatique

View more presentations from UMS CLEO.

Enregistrement audio de la séance

Notes prises par Marin Dacos au cours de la séance
L’histoire des digital humanities, depuis 40 ans, par la confrontation entre le texte et les données. Dans les années 1970, se posait déjà le problème :

- en traitant le texte comme s’il était des données,

- en traitant les données… comme si elles n’étaient pas du texte! Les données ne sont pourtant rien sans leur contexte.

Nous avons atteint un point de non-retour. Notre infrastructure scientifique est devenue complètement numérique. La structure de la connaissance est numérique, de façon irréversible. Les modèles commerciaux de l’infrastructure des connaissances sont également devenus numériques. Les bouleversements quantitatifs ont eu un impact qualitatif.

Les objets des SHS sont désormais numériques, même si les méthodes n’y parviennent pas encore. Et nos méthodes changent en permanence.

En particulier, nous sommes en train de passer de l’hypertexte à l’hyperdata : d’un web des documents à un web des données. La technologie est à peu près prête, mais les principaux problèmes sont plutôt socio-politico-culturels.

Première période. Literary and linguistic computing (LLC)

C’est l’âge héroïque. Le père Busa, un Jésuite,  en 1949, s’est mis en tête qu’il pourrait se servir de ces grosses machines, les mainframes IBM. Il avait des amis à Rome qui lui ont permis de se servir de l’installation IBM à Londres, pour gérer une nouvelle édition de Thomas d’Aquin. Ils ont tapé l’ouvrage en entier. C’est le premier travail d’édition électronique! Ca a pris beaucoup de temps. L’index Thomasticum est sorti en 1972.

Dix ans plus tard, à l’université de Brown, aux USA, on a construit le premier corpus linguistique. The Brown corpus for use on digital computers. Deux linguistiques américains, Henry Kucera et Nelson Francis, ont créé ce corpus. Il y avait un million de mots dans ce corpus! Là aussi, c’était tapé à la machine, sur des cartes perforées, en lettres majuscules. Ils cherchaient à décrire la langue anglaise contemporaine. Ils ont pris quelques dizaines de livres, dans une bibliothèque, comprenant des fictions et des essais, de nombreux genres. C’est une des étape importante dans l’évolution de l’application des technologies dans les recherches linguistiques.

Ensuite, Thesaurus linguae graecae : corpus de langue grecque ancienne. Un professeur de grec, aux USA, Theodor Brunner, donnait des cours du soir, au grand public, pour présenter la littérature grecque. Un soir, un membre du public lui a demandé ce qu’il lui manquait pour mener des recherches sur les occurrences des mots dans la littérature. C’était David Hewlett (fils de Hewlett de Hewlett Packard). Il a financé Brunner pour enregistrer toute la littérautre. Il rencontra notamment des problèmes d’encodage. A l’époque des cartes perforées, il pouvait décrire les 26 lettres de l’alphabet latin, et quelques autres signes. Mais le grec… Ils ont dû inventer leur propre système d’encodage. Il s’appelait Beta Code. C’est une façon de présenter les lettres de l’ancien grec, sous format déguisé, en ASCII. Cela a posé problème ensuite, avec l’apparition d’Unicode… En ASCII, le A est le 31. Mais en Beta code, c’est un Alpha. C’est une convention qui dit : vous êtes en Beta Code, donc il faut savoir que 31 est l’Alpha. C’est un génial bricolage, qui utilise 256 caractères de l’ASCII. Evidemment, pose de gros problèmes de cohabitation entre Latin et Grec, et entre machines.

Il y a eu bien d’autres projets, qui auraient pu être sélectionnés dans cette histoire.

Construire un corpus… c’est bien. Mais que va-t-on faire avec? A l’époque, l’idée était surtout de quantifier le style : mesurer les régularités statistiques dans le texte (quantification of style). Par exemple, étude de la concordance : la concordance est une invention médiévale, qui permet de savoir comment il faut se servir de tel ou tel mot. Lou montre le British national corpus, et cherche le mot “juxtaposition”. On voit apparaître les régularités des contextes d’apparition du mot, essentiellement les éléments qui le précèdent et qui le suivent. En 1959, les Cornell University Presses publient (sur papier) un nombre de concordances littéraires extraites d’un tri informatique. C’est un travail très lourd, qui donne une ligne par occurrence de chaque mot. Cornell University Press l’a vendu sous forme imprimée, mais ce n’était guère pratique… En 1968, fondation de CETEDOC, à Louvain la Neuve. C’est un des premiers centres de recherche dédié à l’appplication de l’informatique à des études médiévales et classiques. Ce centre fonctionne encore.

Autre cas : recherches portant le style, avec l’idée d’identifier un auteur par son style. Par exemple, ce type de méthode a été appliqué à l’attribution de textes à Saint Paul. A.Q. Morton, Paul, the man and the myth (1966). On étudie la courbe de fréquence des mots de chaque auteur, qui ne correspond pas du tout à une courbe qui serait due au hasard. Selon certains auteurs, il existe des “empreintes digitales” dans la manière dont chaque auteur utilise la langue et les mots. Lou Burnard est un peu sceptique sur cette approche très statistique.

En LLC, ce qui compte… c’est de compter.

En 1974, Robert William Fogel and Stanley L. Engerman, Time on the Cross: The Economics of American Negro Slavery. Boston: Little, Brown and Company, 1974. xviii + 286 pp. L’ouvrage essaie de voir si l’esclavage, en tant que système économique, était plus efficace que la liberté. Leur idéologie était l’idéologie numérique. Pour eux, le plus important étaient les faits, les chiffres, les faits. Ils ont fini par dire que les esclaves n’étaient fouettés que 0,7 fois par an. Ce livre a provoqué une explosion de critiques. C’était méthodologiquement très neuf. Cela reste un texte fondamental dans l’histoire économique et l’histoire des noirs. Ils ont été attaqués comme cliometricians. Cela a porté un coup très dur à la méthode informatique en histoire.

LLC est aussi une revue, fondée en 1976. http://llc.oxfordjournals.org/ Les LLC sont toujours vivantes et particulièrement en France. C’est la textométrie : le texte est considéré comme un phénomène statistique. Ils utilisent l’analyse factorielle et le data mining. Equipe à Lyon.

Deuxième phase. Humanities computing. Les années 1980-1994

Émergence des humanities centers. En Angleterre, se développent les programmes d’informatisation des écoles : “Computers in teaching initiative”. Il y a eu le BBC micro, vendu aux écoles pour que chaque enfant apprenne le Basic. Du côté recherche, “Arts and humanities data service” : une infrastructure pour les centres numériques existants. Est-ce qu’on était en train de faire quelque chose de nouveau?

Ont émergé des communautés. Le Web n’existait pas. Mais le courrier électronique et les liste de discussion se développent. En 1987, fondation de la liste Humanist.

En 1976, Lou Burnard fonde le Oxford text archive. Ils disposaient d’une machine permettant de scanner et de faire de l’OCR sur le corpus. Ils mettaient la machine à disposition des chercheurs anglais. Ils numérisaient pour les chercheurs, à condition qu’ils acceptent qu’un entrepôt de données conserve les textes.

A la même époque, le Projet Gutenberg se développe, mais ce dernier n’étant pas construit très scientifiquement.

En France, Jean-Philippe Genet et d’autres historiens avancent prudemment l’idée que la numérisation des textes permettrait d’extraire des faits pour soutenir une théorie ou une hypothèse. Cela a été systématisé par Manfred Thaller, via Kleio, une base de données textuelle avant la lettre.

Une association internationale pour l’histoire et l’informatique est créée en 1987.

Le défi pour les humanities computing

Est-ce que les Humanities computing ont une théorie? Est-ce que les textes numérisés sont intrinsèquement différents des textes analogiques? Ou est-ce seulement un assemblage de méthodes et d’ingéniéries?

Quand on a une ressource, on l’encode, on fait l’analyse, mais l’analyse comme l’encodage dépendent d’un modèle abstrait. Le modèle abstrait définit ce qu’est un texte : les paragraphes, les divisions, etc.

Dans le domaine universitaire, il ne suffit pas de conserver les octets d’un encodage. On a besoin d’une continuité de compréhension : l’encodage doit être auto-descriptif. C’est le sens et l’importance de la Text encoding initiative (TEI).

TEI est le seul projet d’Humanities computing qui dure toujours aujourd’hui. Il y avait une véritable tour de Babel de formats, avec une absence totale de standardisation, bien que chacun soit s’appuie sur le même modèle conceptuel. Il était difficile de faire converger les modalités pratiques d’encodage. La TEI a émergé comme un simple modèle, encyclopédique, des “significant particularities” des ressources textuelles.

Exemple : les tablettes de Vindolanda, dans un fort romain du mur d’Hadrien. Dans les années 1980, on a trouvé de petites tablettes, avec couche de cire par dessus. Ca permettait d’effacer. Mais on a trouvé des traces d’écritures superposées. Il montre un exemple d’encodage, qui permet de décrire le texte avec toutes ses ambiguités. L’encodage en question est le résultat d’un travail collaboratif de retranscription, débouchant sur un consensus.

Finalement 1995-… : les digital humanities

Et en 1994, le Web est arrivé. Pendant que les humanities computing discutaient… apparition de la numérisation en masse, explosion des capacités informatiques. L’informatique devient une commodité. Dans les années 1980, ça marchait peu ou prou… Emergence du grid computing. Emergence des folksonomies, du cloud computing

La Library of congress a fait un rapport très intéressant sur les folksonomies apportées par le public à photothèque du Library of Congress sur FlickR.

  • Convergence et collaboration : rethinking scholarly editing, redefining the discipline.
  • New infrastructures?
  • The rise of digital library
  • Problème de l’autorité et de “link-rot”.
  • Les biens non rivaux.
  • L’open source.

Est-ce que ce modèle peut marcher pour les ressources numérisées? Il y a des projets qui sont en train d’essayer de faire cela : “Digital humanities manifesto 2.0″ (UCLA). Pour eux, les digital humanities ne sont pas un champ unifié, mais un ensemble de pratiques qui convergent :

  1. L’imprimé n’est plus le seul média permettant la dissémination de la connaissance, de la science. L’imprimé se trouve absorbé par de nouvelles configurations multimédia.
  2. Les digital tools, techniques and media ont modifié la façon de faire de la science.

L’économie des digital humanities est basée sur l’abondance, et non sur la rareté.

The importance of not reading

Que va-t-il pouvoir faire des millions de livres numérisés? John Unsworth : “Although there is still a need for close-reading… we never don’t not read”. Nouvelle synergie de méthodes, comme le corpus linguistiques, les pattern recognition, le data mining, la visualisation…

Conclusion

Les humanities apportent une contribution importante au web sémantique (TEI).

Pour Lou, l’informatique, c’est une discipline des humanités.

Offre de stage au pôle édition du Cléo

mer, 01/27/2010 - 15:36

Le Centre pour l’édition électronique ouverte recrute un(e) stagiaire pour son pôle éditorial pour une durée de 3 à 6 mois.

Missions

Le stagiaire interviendra dans la mise en œuvre du format XML TEI-P5 comme format de stockage et comme format de sortie de la plateforme Revues.org. Les documents concernés sont principalement des articles de revues scientifiques (sciences humaines et sociales) et des recensions.

Le Cléo développe actuellement le logiciel Opentext destiné à convertir des documents issus de traitements de texte au format XML TEI. Opentext permet également d’enrichir les métadonnées du document TEI produit avec une source complémentaire (ici, PRISM et Lodel). Voir les deux schémas ci-dessous :

Crédits : « Fonctionnement d'Opentext », Veronica Holguin, © Surletoit, Tous droits réservés.

Crédits : « Schéma de circulation de l'information dans Lodel », Veronica Holguin, © Surletoit, Tous droits réservés.

Nous proposons au stagiaire de travailler sur deux points particuliers :

1) Produire la documentation officielle de la TEI « Revues.org », c’est-à-dire documenter toutes les balises et attributs utilisés et ainsi obtenir un schéma TEI-Revues.org. Ces balises sont générées dynamiquement par Opentext sur la base du modèle éditorial (modèle de données) utilisé par les revues du portail. Cette documentation fera l’objet d’une publication électronique publique, à destination notamment de nos partenaires
2) Proposer des enrichissements à notre schéma TEI en se basant sur les spécifications de la norme TEI-P5 et les recommandations d’usage (TEI pour l’édition électronique) :

  • pour des objets génériques, il s’agirait par exemple de décrire une recension et l’ouvrage commenté dans un header TEI et de décrire une collection complète (revue/numéro/article) dans le header TEI d’un article.
  • déterminer les balises nécessaires pour une utilisation ultérieure dans un contexte de Web sémantique. Il s’agira par exemple de déterminer quelles balises sont nécessaires pour une exploitation ultérieure de notre TEI en RDFa (établir les correspondances entre la TEI Revues.org existante et la norme RDFa) ; proposer des enrichissements du schéma TEI en vue d’une conversion des données en RDFa.
  • proposer des schémas spécifiques pour des disciplines particulières (par exemple en linguistique, qui nécessite une forte sémantisation de l’information)

Le stagiaire pourra s’appuyer sur la communauté existante, notamment sur la liste de discussion TEI for Scholarly Publishing.

Technologies mises en œuvre : XML TEI-P5

Lieu : Université de Provence, site Saint-Charles, Marseille (13003).

Date de disponibilité : dès que possible.

Rémunération : indemnité de stage 417 € brut prévue

Pour nous poser des questions ou nous transmettre votre candidature, veuillez écrire à : contact@revues.org

L’employeur

Le Cléo est une unité associant le CNRS, l’EHESS, l’Université d’Avignon et l’Université de Provence. Il fait activement partie du réseau constitué par le Très grand équipement-Adonis. Il est installé à l’Université de Provence (site Saint-Charles) et mène des missions de service public : mise à disposition d’une plateforme complète comprenant un portail (Revues.org) de revues scientifiques en libre accès, une plateforme de carnets de recherche en sciences humaines (Hypothèses), développement de fonctionnalités, mise en place d’accords d’interopérabilité. Il met en ligne plus de 35 000 documents structurés en XML, via des sites web éditorialement gérés par plus de deux cents chercheurs, enseignants, documentalistes et éditeurs en sciences humaines. Le nombre de projets éditoriaux, de visiteurs et de fonctionnalités est en forte croissance.

Cléo Revues.org
CNRS/EHESS/UP/UAPV
3, place Victor Hugo, Case n°86,
13331 Marseille Cedex 3
FRANCE
Tél. +33 4 88 57 69 29
Fax +33 4 88 57 69 30
http://cleo.cnrs.fr

Crédits images : « Fonctionnement d’Opentext » et « Schéma de circulation de l’information dans Lodel », par Veronica Holguin, © Surletoit, Tous droits réservés.

Présentation des carnets de recherche et d’Hypothèses à l’INHA

lun, 01/25/2010 - 10:29

Anne-Laure Brisac d’Invisu a invité le Cléo  à présenter la plateforme Hypothèses et les carnets de recherche en sciences humaines et sociales à l’Institut National d’Histoire de l’Art (INHA). On évoquera en à peu près une heure ce qu’est le blogging en sciences humaines et sociales en montrant plusieurs exemples et un point sera fait sur le développement de la plateforme de carnets de recherche Hypothèses.

Ce sera l’occasion pour des équipes de recherche de voir concrètement comment on peut ouvrir très facilement un site web sur cette plateforme permettant de communiquer sur l’activité d’un séminaire, d’un projet de recherche, d’une thèse, d’un projet de publication, d’un chantier de fouilles archéologiques entre autres.

La présentation se déroule mardi 26 janvier à 18h00 à l’INHA, 6 rue des Petits-Champs, salle Vasari. L’entrée est libre.