From 8f083399cf806a132235ff784d08cf8183e30053 Mon Sep 17 00:00:00 2001 From: RochDLY Date: Mon, 19 Aug 2024 00:56:47 +0200 Subject: =?UTF-8?q?mise=20=C3=A0=20jour=20des=20billets=20sur=20la=20saisi?= =?UTF-8?q?e=20du=20texte=20dans=20un=20nouveau=20document=20et=20sur=20le?= =?UTF-8?q?=20medium=20comme=20element=20central=20de=20la=20publication?= =?UTF-8?q?=20savante?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit --- docs/index-cache.html | 2 + ...a-saisie-du-texte-dans-un-nouveau-document.html | 69 ++++++------- .../2024-08-07-l-effacement-par-remplacement.html | 68 ++++++++++++ ...e-medium-au-coeur-des-pratiques-d-ecriture.html | 114 +++++++++++++++++++++ 4 files changed, 214 insertions(+), 39 deletions(-) create mode 100644 docs/posts/2024-08-07-l-effacement-par-remplacement.html create mode 100644 docs/posts/2024-08-07-le-medium-au-coeur-des-pratiques-d-ecriture.html (limited to 'docs') diff --git a/docs/index-cache.html b/docs/index-cache.html index af09480..020ec7d 100644 --- a/docs/index-cache.html +++ b/docs/index-cache.html @@ -42,6 +42,8 @@

Cet exemple montre qu’il y a une certaine économie de l’information implémentée dans le fonctionnement même de GraphQL pour n’aller chercher que les informations nécessaires pour une requête particulière, pour peu que la requête en elle-même soit bien rédigée. D’ailleurs, il s’agit là d’un des écueils potentiels de GraphQL : des requêtes mal formulées peuvent aller à l’encontre de ce principe.

-

Dans Stylo, chaque fonctionnalité, chaque bouton (ou presque) qui réalise une action de lecture ou d’écriture est lié à une requête GraphQL. Le protocole HTTP comporte deux méthodes bien connues pour faire circuler des informations entre un client et un serveur : GET et POST. Un des arguments phares présenté par GraphQL est sa dimension agnostique par rapport au protocole de communication des informations employé, que ce soit HTTP ou des WebSockets ou autre. Pourtant, malgré la capacité de GraphQL à être utilisable avec toutes les méthodes d’HTTP24, une bonne pratique appliquée par la communauté GraphQL est l’emploi du protocole HTTP couplé à la méthode POST pour tous types de requêtes (que ce soit une query, une mutation ou encore une subscription). Lors de la transmission des informations par la méthode GET, toutes les informations sont insérées dans l’URL ce qui 1) les rend visibles (et vulnérables) et 2) impose une limite du nombre de caractères (aux alentours de 2000 au maximum) au risque de déclencher une erreur 414 (URL trop longue). En conséquence, il est préférable d’utiliser la méthode POST pour envoyer ou récupérer des informations car elles ne seront ni visibles ni limitées en longueur. Malgré l’aspect agnostique de GraphQL, la forme textuelle des requêtes implique en elle-même un choix particulier de transmission des informations avec ce qu’il comporte comme avantages et inconvénients.

+

Dans Stylo, chaque fonctionnalité, chaque bouton (ou presque) qui réalise une action de lecture ou d’écriture est lié à une requête GraphQL et au schéma de donnée correspondant. Chacune de ces actions suit en conséquence une modalité d’inscription dans la base données se conformant à l’architecture implémentée lors des développements de Stylo et produit une vision du document.

+

Le protocole HTTP comporte deux méthodes bien connues pour faire circuler des informations entre un client et un serveur : GET et POST. Un des arguments phares présenté par GraphQL est sa dimension agnostique par rapport au protocole de communication des informations employé, que ce soit HTTP ou des WebSockets ou autre. Pourtant, malgré la capacité de GraphQL à être utilisable avec toutes les méthodes d’HTTP24, une bonne pratique appliquée par la communauté GraphQL est l’emploi du protocole HTTP couplé à la méthode POST pour tous types de requêtes (que ce soit une query, une mutation ou encore une subscription). Lors de la transmission des informations par la méthode GET, toutes les informations sont insérées dans l’URL ce qui 1) les rend visibles (et vulnérables) et 2) impose une limite du nombre de caractères (aux alentours de 2000 au maximum) au risque de déclencher une erreur 414 (URL trop longue). En conséquence, il est préférable d’utiliser la méthode POST pour envoyer ou récupérer des informations car elles ne seront ni visibles ni limitées en longueur. Malgré l’aspect agnostique de GraphQL, la forme textuelle des requêtes implique en elle-même un choix particulier de transmission des informations avec ce qu’il comporte comme avantages et inconvénients.

Les spécificités du protocoles HTTP sont définies dans les Request for Comments (RFC) publiés par l’Internet Engineering Task Force (IETF) fondée en 1986 et dont le siège se trouve aux États-Unis. Les documents et leurs contenus sont régulièrements mis à jour par la communauté qui participe à ces commentaires. Le numéro de la RFC en lien avec la méthode POST est le 911025 publié en juin 2022.

La méthode POST est définie dans le paragraphe 9.3.3 comme :

@@ -268,7 +262,7 @@ Du fait de mon implication dans Stylo, le regard que je porte sur ce terrain n "variables":{"userId":"61d62.....", "articleId":"65e0e38129637c0012ef7a", "content":{"md":"Ajout du texte pour la requête HTTP 'POST'"}}} -

Autrement dit, chaque fonctionnalité décrit de manière formelle la structuration des informations dans Stylo, donc ce que Stylo écrit dans la base données et dans les textes puisque ce sont les informations renseignées qui seront intégrées dans les documents exportés. En ce sens, Stylo et ses protocoles pré-construisent la totalité de ce qu’un utilisateur peut saisir dans l’interface et sera enregistré dans la base de données. Cette préconstruction est la vision du document incarnée dans Stylo. Puisqu’il y a une pré-construction du document et du texte, nous pouvons à ce stade présupposer qu’il y a une pré-construction des traces des interactions avec l’utilisateur et de l’intimité qui en résulte et se matérialise dans des fragments comme celui présenté ci-dessus.

+

Autrement dit, chaque fonctionnalité décrit de manière formelle la structuration des informations dans Stylo, donc ce que Stylo écrit dans la base données et dans les textes puisque ce sont les informations renseignées qui seront intégrées dans les documents exportés. En ce sens, Stylo et ses protocoles pré-construisent la totalité de ce qu’un utilisateur peut saisir dans l’interface et sera enregistré dans la base de données. Cette préconstruction est la vision du document incarnée dans Stylo. Puisqu’il y a une pré-construction du document et du texte, nous pouvons à ce stade présupposer qu’il y a une pré-construction des traces issues des interactions avec l’utilisateur et qu’elles se matérialisent dans des fragments comme celui présenté ci-dessus.

Cette description très générale des moyens de communication à l’oeuvre entre les différents modules de Stylo nous montre déjà que l’information saisie dans cet éditeur de texte est formatée par une architecture de données alors que nous n’avons pas encore abordé les conditions de l’écriture avec les trois formats pivots d’un document dans Stylo.

Les formats déterminent la sémantique du texte

[Trouver quelques références sur les formats, ex la these de de Mourat sur le vacillement des formats]

@@ -293,7 +287,7 @@ Du fait de mon implication dans Stylo, le regard que je porte sur ce terrain n

Le terme format est avant tout un terme technique, il délimite les caractéristiques d’un objet. Ces caractéristiques sont formulées par un certain nombres de données, d’instructions, ou de règles. L’objectif est de disposer d’un consensus pour dialoguer autour d’un objet ou de faire communiquer des processus qui traîtent ou qui produisent des formats.

Le format est une contrainte technique dans des environnements qui peuvent être très divers : formats d’objets physiques comme le papier, formats informatiques que nous connaissons par l’extension des fichiers sur nos ordinateurs, ou formats littéraires concernant l’agencement des mots et des phrases. Nous nous concentrons ici sur les formats informatiques. En fonction des nécessités d’un système d’exploitation, d’un programme informatique ou d’une plateforme en ligne, un format caractéristique sera requis pour agencer et organiser les informations selon les règles qui le définissent [bachimont_ingenierie_2007]. Un format qui n’est pas standard (ces caractéristiques doivent être décrites), qui n’est pas ouvert (il est possible de comprendre comment le format fonctionne) ou qui nécessite un environnement très spécifique pour être interprété ou transformé va générer beaucoup d’obstacles pour son utilisation.

La contrainte du format est liée à d’autres contraintes comme la compatibilité (quel format peut être lu par quel programme ou logiciel ?), l’interopérabilité (est-ce que le format peut être utilisé de la même façon quel que soit l’environnement ?), la dépendance (de quoi un système a-t-il besoin pour traiter le format ?) et les droits associées (est-ce que le format peut être lu, modifié ou partagé ?).

-

Si le but du format est de constituer une série d’informations compréhensibles, utilisables et communicables, il reste une contrainte forte pour les chaînes de publication (Mourat, 2020). Que ce soit en tant que format d’entrée, format pivot de transformation ou format de publication – nous reviendrons sur les transformations et les artefacts publiables dans le chapitre 4 –, il déterminera le fonctionnement de la chaîne.

+

Si le but du format est de constituer une série d’informations compréhensibles, utilisables et communicables, il reste une contrainte forte pour les chaînes de publication (Mourat, 2020). Que ce soit en tant que format d’entrée, format pivot de transformation ou format de publication – nous reviendrons sur les transformations et les artefacts publiables dans le chapitre 3 –, il déterminera le fonctionnement de la chaîne.

Comme nous l’avons déjà mentionné, il y a trois formats centraux dans l’éditeur de texte Stylo : le Markdown pour le corps du texte, le YAML pour les métadonnées et le BibTeX pour les références bibliographiques. Chacun de ces formats a sa propre histoire et ses propres spécifications. Afin de mieux comprendre la structuration des informations dans Stylo, nous allons passer en revue certaines des particularités de ces formats et de leur implémentation dans l’éditeur.

Mardown est un langage de balisage léger créé en 2004 par John Gruber28. Sa syntaxe, beaucoup plus légère et moins verbeuse que le HTML dont il est issu, permet de structurer et de décrire sémantiquement le texte. Il a été pensé pour pouvoir être converti facilement vers d’autres formats comme HTML, LaTeX ou PDF. Markdown se distingue des autres langages de balisages légers car il est déclinable en différentes variantes (ou saveurs). Chacune d’entre elles ajoute une particularité dans la syntaxe Markdown. Parmi les plus populaires, on retrouve :

-

Cette capacité à être déclinable et adaptable distingue fortement Markdown des autres langages de balisage. En effet, puisque chaque saveur contient des éléments personnalisés de structuration des contenus – des balises –, il est important de connaître la saveur que l’on doit utiliser dans un environnement au risque de se retrouver avec des balises qui ne sont pas interprétées.

+

Cette capacité à être déclinable et adaptable distingue fortement Markdown des autres langages de balisage. En effet, puisque chaque saveur contient des éléments personnalisés de structuration des contenus – des balises –, il est important de connaître la saveur que l’on doit utiliser dans un environnement au risque de se retrouver avec des balises qui ne sont pas interprétées et qui par extension, n’ont aucune signification pour cet envrionnement.

Par exemple, la saveur Quarto Markdown utilise la structure ci-dessous pour insérer une vidéo dans un texte. Cependant, ce marquage ne sera interprété que lorsque Quarto transformera le document Markdown en un autre document, or dans Stylo cette ligne sera traitée comme un paragraphe et ne sera pas transformée parce que Stylo ne connaît pas cette structure puisque la saveur Quarto de Markdown n’y est pas prise en charge.

{{< video https://www.youtube.com/embed/wo9vZccmqwc >}}

À ce propos, aucune saveur spécifique n’a été implémentée dans Stylo pour laisser le champ libre aux utilisateurs d’employer celle qui leur convient le mieux. Néanmoins, lorsque les sources sont transformées par le module d’export (l’export des sources n’est pas concerné), les utilisateurs doivent respecter les préconisations du logiciel Pandoc puisque c’est ce dernier qui réalise les transformations et conversions des documents. Les saveurs les plus couramment utilisées avec Pandoc sont CommonMark et GitHub Flavored Markdown34.

-

Autrement dit, Stylo n’impose pas de variante de Markdown si l’on s’en sert comme éditeur de texte sans la nécessité d’utiliser le module d’export. Dès qu’une chaîne éditoriale s’appuie sur ce module, comme c’est le cas pour la chaîne Stylo, Métopes, OpenEdition, il devient essentiel d’employer les variantes que traitent Pandoc pour que les transformations et conversions se fassent sans erreur. Pour conclure sur le langage de balisage Markdown, sa possible déclinaison en diverses saveurs fait de ce langage un avantage et un inconvénient. C’est un avantage pour sa plasticité et son adaptibilité aux besoins d’une communauté ou d’un projet. Cependant, si les adaptations réalisées le sont dans une niche, soit parce que la communauté qui en définit les règles comporte trop de peu de membres, soit parce qu’il n’y a qu’un seul environnement qui traite cette saveur, le Markdown perd sa caractéristique interopérable et contraint les usagers à bricoler des équivalences entre les transformations pour préserver la structuration des contenus.

-

La sérialisation des métadonnées est réalisée en YAML qui, dans sa version originale de 2004 avait pour signification Yet Another Markup Language puis se transforme à l’occasion de la publication de sa version 1.1 en YAML Ain’t Markup Language. YAML est un langage de sérialisation de données pour tous les langage de programmation. Un usage récurrent qui en est fait consiste à utiliser YAML pour créer des fichiers de configuration. Dans le cas des outils liés à l’édition numérique, YAML sera utilisé pour enregistrer les métadonnées associées à un document. Le principe de YAML est très facile à assimiler puisqu’il repose sur le même fonctionnement qu’un dictionnaire avec la structure clef: valeur. Chacun a la possibilité de créer de toute pièce son document YAML et de choisir les clefs et les valeurs qui leur sont associées. C’est ensuite l’application qui va parser le contenu en suivant l’architecture des informations dans le fichier YAML. Dans Stylo, les clefs ont été prédéterminées lors des développements de l’interface et les utilisateurs n’ont plus qu’à remplir un formulaire pour déclarer les valeurs qui seront associées aux différentes clefs – un mode permet d’accéder au contenu en YAML brut sans surcouche graphique.

+

Autrement dit, Stylo n’impose pas de variante de Markdown si l’on s’en sert comme éditeur de texte sans la nécessité d’utiliser le module d’export. Dès qu’une chaîne éditoriale s’appuie sur ce module, comme c’est le cas pour la chaîne Stylo utilisant l’export XML TEI conforme au schéma COMMONS commun à Métopes et OpenEdition, il devient essentiel d’employer les variantes que traitent Pandoc pour que les transformations et conversions se fassent sans erreur. Pour conclure sur le langage de balisage Markdown, sa possible déclinaison en diverses saveurs fait de ce langage un avantage et un inconvénient. C’est un avantage pour sa plasticité et son adaptibilité aux besoins d’une communauté ou d’un projet. Cependant, si les adaptations réalisées le sont dans une niche, soit parce que la communauté qui en définit les règles comporte trop de peu de membres, soit parce qu’il n’y a qu’un seul environnement qui traite cette saveur, le Markdown perd sa caractéristique interopérable et contraint les usagers à bricoler des équivalences entre les transformations pour préserver la structuration des contenus.

+

Dans Stylo, la sérialisation des métadonnées est réalisée en YAML qui, dans sa version originale de 2004 avait pour signification Yet Another Markup Language puis se transforme à l’occasion de la publication de sa version 1.1 en YAML Ain’t Markup Language. YAML est un langage de sérialisation de données pour tous les langage de programmation. Un usage récurrent qui en est fait consiste à utiliser YAML pour créer des fichiers de configuration. Dans le cas des outils liés à l’édition numérique, YAML sera utilisé pour enregistrer les métadonnées associées à un document. Le principe de YAML est très facile à assimiler puisqu’il repose sur le même fonctionnement qu’un dictionnaire avec la structure clef: valeur. Chacun a la possibilité de créer de toute pièce son document YAML et de choisir les clefs et les valeurs qui leur sont associées. C’est ensuite l’application qui va parser le contenu en suivant l’architecture des informations dans le fichier YAML. Dans Stylo, les clefs ont été prédéterminées lors des développements de l’interface et les utilisateurs n’ont plus qu’à remplir un formulaire pour déclarer les valeurs qui seront associées aux différentes clefs – un mode graphique permet d’accéder au contenu en YAML brut sans surcouche.

Si nous reprenons l’exemple de l’auteur mentionné précédemment, un auteur est déclaré comme suit dans Stylo :

authors:
   - affiliations: ''
@@ -321,27 +315,27 @@ Du fait de mon implication dans Stylo, le regard que je porte sur ce terrain n
     surname: ''
     viaf: ''
     wikidata: ''
-

Les métadonnées sélectionnées pour représenter l’auteur dans Stylo reflète principalement les besoins émis par les revues, par exemple Sens Public ou Humanités Numériques, ou les plateformes de diffusion telles qu’Érudit et OpenEdition. Dans Stylo, un auteur est donc représenté uniquement par ces informations. Néanmoins, il arrive que certains utilisateurs ou institutions requièrent d’autres informations pour décrire plus précisément un auteur et nécessite des adaptations. Par exemple, la clef YAML affiliations désigne sans distinction l’institution, le laboratoire ou encore le département de rattachement. Pourtant, selon les revues, il peut être important de faire formellement cette différence. Dans Stylo, la notion d’auteur ne s’incarne qu’à travers ce choix qui a été implémenté. L’auteur est donc formellement constitué de 10 entrées au maximum. Ce qui est valable pour les auteurs l’est également pour les autres types de données décrites dans les métadonnées du document. La réduction d’un auteur à quelques mot-clés n’est pas très importante puisqu’elle couvre les besoin de la plupart des revues – ce qui est quand même l’objectif de Stylo –.

+

Les métadonnées sélectionnées pour représenter l’auteur dans Stylo reflète principalement les besoins émis par les revues, par exemple Sens Public ou Humanités Numériques, ou les plateformes de diffusion telles qu’Érudit et OpenEdition. Dans Stylo, un auteur est donc représenté uniquement par ces informations. Néanmoins, il arrive que certains utilisateurs ou institutions requièrent d’autres informations pour décrire plus précisément un auteur et nécessite des adaptations. Par exemple, la clef YAML affiliations désigne sans distinction l’institution, le laboratoire ou encore le département de rattachement. Pourtant, selon les revues, il peut être important de faire formellement cette différence. Dans Stylo, la notion d’auteur ne s’incarne qu’à travers ce choix qui a été implémenté. L’auteur est donc formellement constitué de 10 entrées au maximum. Ce qui est valable pour les auteurs l’est également pour les autres types de données décrites dans les métadonnées du document. La réduction d’un auteur à quelques mot-clés n’est pas très importante puisqu’elle couvre les besoins de la plupart des revues – ce qui est quand même l’objectif de Stylo –.

Au-delà de Stylo, l’utilisation de YAML est toutefois controversée. Contrairement à d’autres langages de structuration de données dont le comportement est pérenne, comme le standard JSON (JavaScript Object Notation) publié pour la première fois en 199935, YAML 1.0 subit des modifications régulières depuis 2004 avec une version 1.1 en 2005 puis une version 1.2 en 2009 et une dernière mise à jour en 2021 avec la version 1.2.2. Là où une certaine stabilité que l’on trouve dans des formats tel que JSON apporte une forme de pérennité pour les applications, malgré une modification mineure en 2005 avec la suppression de la saisie de commentaires dans les documents au format JSON, YAML fait le choix d’évoluer et de s’adapter aux besoins des communautés. Cependant, comme le mentionne Ruud van Asseldonk sur son blog36, ces mises à jour peuvent générer des complications lorsque les fichiers YAML doivent passer d’un environnement à un autre alors que les versions de YAML utilisées sont différentes. Par exemple, Pandoc intègre en juillet 2018 la version 1.2 de YAML37 où nous pouvons y lire :

Update manual for “true” YAML values. Now that we’re using HsYAML and YAML 1.2, the valid true values are true, True, TRUE. NOTE! y, yes, on no longer count as true values.

Le changement de version génère une modification de comportement des valeurs y, yes, on qui signifiaient le booléen true dans la version 1.1 et ne sont plus que des chaînes de caractères à partir de la version 1.2. Or, tous les parseurs de YAML n’ont pas fait cette mise à jour. Par exemple, la très répandue librairie Python PyYaml, dont la dernière mise à jour remonte à juillet 202338, s’appuie toujours sur la version 1.1 de YAML. En somme, si un document doit passer d’un environnement utilisant la version 1.1 ou la version 1.2, les informations structurées ne seront pas traitées de la même manière.

Nous sommes en droit de nous demander pourquoi YAML reste aussi populaire ? Ruud van Asseldonk apporte plusieurs réponses à cette question. La première est que YAML fait partie des plus anciens langages de sérialisation de données et répondait alors à un besoin de toute une génération de développeurs, ensuite il permet l’écriture de commentaires à l’intérieur des documents, c’est-à-dire du texte qui ne sera pas traité par le parseur, alors que JSON ne le permet pas. Des alternatives comme le langage TOML39 ont vu le jour dans les années 2010 (2013 pour le TOML) pour tenter de pallier les problèmes sus-mentionnés. Le langage TOML est par exemple utilisée pour le fichier de configuration du paquet Python “Pressoir-CLI” afin de déclarer différents paramètres, par exemple de mise en page, parsés par le Pressoir et utilisés pour générer des livres au format HTML. Cet outil fera l’objet d’une analyse détaillée dans le prochain chapitre40.

-

Enfin, le dernier format pivot utilisé dans Stylo, le BibTeX, est utilisé pour structurer les références bibliographiques. BiBTeX est un format standard permettant de décrire des listes de références bibliographiques inventé par Oren Patashnik en 1985 pour l’écosystème LaTeX. Au-delà de LaTeX, c’est un format largement utilisé par les gestionnaire de références bibliographiques comme Zotero41 ou eBib42.

-

Le choix d’intégrer BibTeX à Stylo provient de la possibilité d’utiliser l’API de Zotero dans l’éditeur de Stylo pour récupérer les informations des références bibliographiques. Ce fonctionnement entre Zotero et Stylo permet aux utilisateurs de ne passer que rarement par la forme brute du BibTeX, puis il permet de décentraliser la gestion et le nettoyage des informations de chaque références dans Zotero et limite les phases de nettoyage des informations à ce seul espace. Stylo est plutôt prévu pour récupérer des listes de références bibliographiques et procurer des fonctionnalités pour les intégrer dans un texte. L’utilisation du format BibTeX permet d’automatiser la saisie et la transformation des références bibliographiques selon les styles requis pour un document. Pourtant, ce choix pourrait être tout à fait discutable du fait des limites de Zotero et de BibTeX. Lors de la création d’un nouvel objet dans Zotero, le premier élément à saisir est le type d’objet à référencer. Le nombre de types est limité à 17. Cela couvre une bonne partie des besoins académiques mais pas les exceptions qui vont toutes rentrer dans le dernier type @misc pour « tout autre type de document ». Il en va de même pour les informations rattachées à chaque type de données43 : selon les disciplines ou pour certains documents très particuliers, les champs de Zotero peuvent être trop restrictifs alors qu’il serait nécessaire de pouvoir saisir de nouvelles entrées pour enrichir les données bibliographiques tout en préservant leur structuration. Actuellement, la seule possibilité serait d’utiliser le champ Extra pour ajouter une information supplémentaire sous la forme de chaîne de caractères sans avoir de structure explicite.

-

D’autres problèmes peuvent surgir entre la représentation d’une référence bibliographique dans Zotero et dans Stylo/Pandoc. Lors de l’édition d’articles en anglais et en français, nous nous sommes aperçus d’une différence de comportement importante entre ce que prévoit le format BibTeX, son interprétation dans Zotero et celle que l’on en fait dans Stylo.. Avec BibTeX il existe plusieurs paramètres de langues : langid et language. langid permet initialement d’identifier la langue à appliquer à l’entrée (comme traitement) et language sert à déclarer la langue employée dans le document. Stylo et Pandoc prennent les deux paramètres en charge, alors que dans Zotero il n’est possible de renseigner que language et pas langid, language combinant les deux objets. En récupérant les références bibliographiques depuis Zotero, Stylo récupère seulement le paramètre language puisque le paramètre langid n’existe pas dans Zotero. Lors du traitement des informations avec Pandoc, il n’est pas possible de déclarer le traitement à appliquer à la référence bibliographique. Par défaut, Stylo va appliquer la langue du contenu du texte dans Stylo à toutes les références bibliographiques. Dans un texte comme celui-ci, le paramètre par défaut est réglé sur le français. Les références en anglais seront alors transformées selon les règles orthotypographiques françaises et pas selon les normes anglaises. Pour une structure éditoriale telle qu’une revue, ce paramètre n’est pas opérationnel. De ceci découle une discussion entre les membres de l’équipe de développement de Stylo44 sur la conduite à tenir pour informer les usagers de ce problème et trouver une solution pour le contourner. À ce jour, nous avons décidé de renseigner le problème dans la documentation de Stylo45 pour avertir les utilisateurs. Une modification du format ou du fonctionnement du gestionnaire de références bibliographiques serait beaucoup trop lourde en termes d’effets de bord dans Stylo, c’est pour cela qu’à ce stade nous en sommes restés à cette solution.

+

Enfin, le dernier format pivot utilisé dans Stylo, le BibTeX, est utilisé pour structurer les références bibliographiques. BiBTeX est un format standard permettant de décrire des listes de références bibliographiques inventé par Oren Patashnik en 1985 pour l’écosystème LaTeX. Au-delà de LaTeX, c’est un format largement utilisé par les gestionnaires de références bibliographiques comme Zotero41 ou eBib42.

+

Le choix d’intégrer BibTeX à Stylo provient de la possibilité d’utiliser l’API de Zotero dans l’éditeur de Stylo pour récupérer les informations relatives aux références bibliographiques. Ce fonctionnement entre Zotero et Stylo permet aux utilisateurs de ne passer que rarement par la forme brute du BibTeX, puis il permet de décentraliser la gestion et le nettoyage des informations de chaque références dans Zotero et limite les phases de nettoyage des informations à ce seul espace. Stylo est plutôt prévu pour récupérer des listes de références bibliographiques et procurer des fonctionnalités pour les intégrer dans un texte. L’utilisation du format BibTeX permet d’automatiser la saisie et la transformation des références bibliographiques selon les styles requis pour un document. Pourtant, ce choix pourrait être tout à fait discutable du fait des limites de Zotero et de BibTeX. Lors de la création d’un nouvel objet dans Zotero, le premier élément à saisir est le type d’objet à référencer. Le nombre de types est limité à 17. Cela couvre une bonne partie des besoins académiques mais pas les exceptions qui vont toutes rentrer dans le dernier type @misc pour « tout autre type de document ». Il en va de même pour les informations rattachées à chaque type de données43 : selon les disciplines ou pour certains documents très particuliers, les champs de Zotero peuvent être trop restrictifs alors qu’il serait nécessaire de pouvoir saisir de nouvelles entrées pour enrichir les données bibliographiques tout en préservant leur structuration. Actuellement, la seule possibilité serait d’utiliser le champ Extra pour ajouter une information supplémentaire sous la forme de chaîne de caractères sans avoir de structure explicite.

+

D’autres problèmes peuvent surgir entre la représentation d’une référence bibliographique dans Zotero et dans Stylo/Pandoc. Lors de l’édition d’articles en anglais et en français, nous nous sommes aperçus d’une différence de comportement importante entre ce que prévoit le format BibTeX, son interprétation dans Zotero et celle que l’on en fait dans Stylo. Avec BibTeX il existe plusieurs paramètres de langues : langid et language. langid permet initialement d’identifier la langue à appliquer à l’entrée (comme traitement) et language sert à déclarer la langue employée dans le document. Stylo et Pandoc prennent les deux paramètres en charge, alors que dans Zotero il n’est possible de renseigner que language et pas langid, language combinant les deux objets. En récupérant les références bibliographiques depuis Zotero, Stylo récupère seulement le paramètre language puisque le paramètre langid n’existe pas dans Zotero. Lors du traitement des informations avec Pandoc, il n’est pas possible de déclarer le traitement à appliquer à la référence bibliographique. Par défaut, Stylo va appliquer la langue du contenu du texte dans Stylo à toutes les références bibliographiques. Dans un texte comme celui-ci, le paramètre par défaut est réglé sur le français. Les références en anglais seront alors transformées selon les règles orthotypographiques françaises et pas selon les normes anglaises. Pour une structure éditoriale telle qu’une revue, ce paramètre n’est pas opérationnel. De ceci découle une discussion entre les membres de l’équipe de développement de Stylo44 sur la conduite à tenir pour informer les usagers de ce problème et trouver une solution pour le contourner. À ce jour, nous avons décidé de renseigner le problème dans la documentation de Stylo45 pour avertir les utilisateurs. Une modification du format ou du fonctionnement du gestionnaire de références bibliographiques serait beaucoup trop lourde en termes d’effets de bord dans Stylo, c’est pour cela qu’à ce stade nous en sommes restés à cette solution.

Étant strictement définis par des règles, les formats dépassent une simple manière de saisir une données. À travers ces formats et les modes de lectures que l’on peut y adosser, les informations saisies se voient dotées de comportements et peuvent modifier l’interprétation que l’on peut en faire, comme nous l’avons vu avec le YAML.
Le choix des formats dans lesquels les utilisateurs peuvent saisir leurs textes et leurs données n’est pas anodin. Qu’il soit ancien, récent, verbeux ou léger, permissif ou rigide, le format d’écriture conditionne ce que l’on a le droit d’écrire ou non. En ce sens la décision de ce qui peut être saisi est déjà prise avant qu’un texte soit frappé sur le clavier. Par exemple, dans Stylo, le Markdown ne permet pas à un philologue de saisir explicitement un appareil critique. C’est une syntaxe qui n’existe pas alors que c’est le cas pour d’autre environnements comme LaTeX et le paquet ekdosis développé et maintenu par Robert Alessi. Dans ce cas-ci, puisque l’appareil critique n’existe pas en Markdown, il ne peut pas exister dans Stylo sauf si l’utilisateur fait abstraction du format et qu’il change de paradigme pour celui de la page et de la représentation graphique. En faisant cela, l’utilisateur fait également abstraction de la machine et de ce qu’elle peut interpréter du contenu puis écrire dans le texte. Lorsque nous sommes dans un environnement mis à disposition comme Stylo, le risque est que celui-ci ne soit pas complètement adapté à des besoins ou à une intention. Il risque d’y avoir une friction entre les formats imposés par l’environnement et les besoins en écriture.

Co-écriture entre les agents

-

En régissant les procédés de saisi du textes, un rapport de force semble s’instaurer entre les instances éditrices des architextes (que ce soit des collectifs, des institutions ou des entreprises) et les usagers. Dans le cas d’un logiciel de traitement de texte lorsque, par exemple, Microsoft propose une modification de la police utilisée par défaut dans une version actualisée du logiciel MSWord, Microsoft change également les manières d’écrire de tous les individus à travers le monde qui utilisent ce logiciel (et qui ont installé la mise à jour).

+

En régissant les procédés de saisi du textes, un rapport de force semble s’instaurer entre les instances éditrices des architextes (que ce soit des collectifs, des institutions ou des entreprises) et les usagers (souchier?). Dans le cas d’un logiciel de traitement de texte lorsque, par exemple, Microsoft propose une modification de la police utilisée par défaut dans une version actualisée du logiciel MSWord, Microsoft change également les manières d’écrire de tous les individus à travers le monde qui utilisent ce logiciel (et qui ont installé la mise à jour).

Si l’on s’arrête à la vision superficielle du texte, comme le propose J. Goody avec la raison graphique (Goody, 1979), on ne voit que les modifications d’affichage des éléments graphiques mais nous oublions ceux qui sont invisibles et cachés derrière la page.

Certes, les interfaces d’écriture sont présentés sous la forme de gabarits que l’on doit remplir, comme on peut le faire avec des logiciels de création de diapositives dont chacune est découpée en sections contenant tour à tour des images, des titres ou du texte. Dans cet exemple-ci nous avons affaire à une construction visuelle du document : un emplacement pour le titre de la diapositive, un autre pour le texte, un autre pour une image ou pour un graphique, etc. À ce sujet, E. Tufte (2003) a publié un article sur l’utilisation du logiciel PowerPoint et démontre à travers plusieurs cas d’étude les effets du logiciel sur la forme des présentations et des informations qu’elles contiennent. La thèse qu’il y défend est que ce logiciel, en 2003, « […] perturbe, domine et banalise systématiquement le contenu. » 46 notamment parce qu’il « facilite activement la réalisation de présentation légère »47. À travers son analyse des usages de PowerPoint, E. Tufte nous montre qu’il ne s’agit pas d’un manque de fonctionnalité pour enrichir des supports de présentation, que l’auteur qualifie de pauvres, mais que le logiciel lui-même induit ce type de présentation avec des templates préfabriqués, des réalisations de graphiques automatisées ou d’autres fonctionnalités similaires qui appauvrissent les présentations parce que leur fonctionnement est calqué sur un modèle de présentation marketing qui n’est pas adapté aux sciences. Il ne s’agit plus seulement de remplir des gabarits préfabriqués mais également de penser les formes que peuvent prendre l’information, ce que Tufte nomme « The Cognitive Style of PowerPoint », qui n’est pas sans rappeler la raison computationnelle de Bruno Bachimont (2000).

En changeant de paradigme, de la raison graphique pour celui de la raison computationnelle, l’assujetissement à ces architextes dépasse cette surcouche graphique et concerne également toutes les sous-couches (in)visibles de structuration textuelle du texte, mais aussi tout le processus d’inscription du document dans la mémoire, ainsi que les protocoles et méthodes qui permettent d’accéder à ces données. Comme nous l’avons vu précédemment, ce n’est pas l’image du texte affichée à l’écran qui est sauvegardée mais bien une suite de caractères binaires dont l’écriture intermédiaire est une suite de symboles, de chiffres et de lettres.

-

Pourtant, on constate un paradoxe entre le nom d’un logiciel comme Pages, un traitement de texte disponible sous MacOS convoquant la métaphore de la page comme imaginaire en y enfermant les utilisateurs, et le rôle de guide qu’il doit remplir dans le traitement des informations. Dans ce cas-ci, le nom du logiciel ne réfère ni à son fonctionnement ni à son utilité. Alors que dans les années 1980, lors de la génèse des traitements de texte, les lettres WP signifiaient WordPerfect48, et que la plupart des autres concurrents employaient également le mot word dans le nom de leur logiciel, car c’est bien le mot et son traitement informatique qui était au centre des développements, la démarche d’Apple en 2005 nous montre un changement de perspective : on passe du mot à la page. L’attention est porté à un autre endroit, sur une page que génère Pages et qui n’existe pas dans d’autres environnements. La page créée dans cet espace n’est pas reproductible ailleurs même si le document qui en résulte est ouvert, à un autre moment, par le biais d’un autre logiciel. La page de Pages devient un espace délimité qui n’existe sous cette forme qu’à cet endroit. Depuis vingt ans que cet outil est nativement disponible sur les ordinateurs de chez Apple, la compatibilité avec d’autres formats et/ou logiciels à fortement augmentée, en témoigne les arguments de communication mis en avant sur la page web du logiciel49 mais compatible ne veut pas dire identique. En plus de n’être accessible que sous MacOS, cette page ne l’est également que sous Pages : cette formulation courante laisse entendre que l’utilisateur devient alors sujet de son environnement d’écriture, nous dit F. Kittler (2015).

+

Pourtant, on constate un paradoxe entre le nom d’un logiciel comme Pages, un traitement de texte disponible sous MacOS convoquant la métaphore de la page comme imaginaire en y enfermant les utilisateurs, et le rôle de guide qu’il doit remplir dans le traitement des informations. Dans ce cas-ci, le nom du logiciel ne réfère ni à son fonctionnement ni à son utilité. Alors que dans les années 1980, lors de la génèse des traitements de texte, les lettres WP signifiaient WordPerfect48, et que la plupart des autres concurrents employaient également le mot word dans le nom de leur logiciel, car c’est bien le mot et son traitement informatique qui était au centre des développements, la démarche d’Apple en 2005 nous montre un changement de perspective : on passe du mot à la page. L’attention est porté à un autre endroit, sur une page que génère Pages et qui n’existe pas dans d’autres environnements. La page créée dans cet espace n’est pas reproductible ailleurs même si le document qui en résulte est ouvert, à un autre moment, par le biais d’un autre logiciel. La page de Pages devient un espace délimité qui n’existe sous cette forme qu’à cet endroit. Depuis vingt ans que cet outil est nativement disponible sur les ordinateurs de chez Apple, la compatibilité avec d’autres formats et/ou logiciels augmente tardivement, en témoigne les arguments de communication mis en avant sur la page web du logiciel49 mais compatible ne veut pas dire identique. En plus de n’être accessible que sous MacOS, cette page ne l’est également que sous Pages : cette formulation courante laisse entendre que l’utilisateur devient alors sujet de son environnement d’écriture, nous dit F. Kittler (2015).

Cette position kittlerienne, que l’on peut qualifier d’essentialiste, pose les fondations des travaux de K. Hayles (Hayles, 2005), du posthumanisme, et du nouveau matérialisme, courants dans lesquels s’inscrivent en outre les travaux de K. Barad (2007, 2023) et ceux de M. Vitali-Rosati (2021). Pourtant, leur approche du rapport entre humain et machine est radicalement différente de celle de F. Kittler. Alors que F. Kittler identifie la machine et l’utilisateur par une série de propriétés ou définitions avant leur interaction, quasiment de manière décisive, les posthumanistes choisissent de ne pas déterminer les agents préalablement à l’environnement mais comme résultats de l’agencement de plusieurs dynamiques dans un espace donné. C’est en ce sens que sont mobilisées et développées les notions de worldview ches K. Hayles, où Mère Nature devient une Matrice (My Mother was a Computer), l’intra-action à la place d’interaction puisque les agents ne sont pas prédéterminés chez K. Barad et enfin l’éditorialisation chez M. Vitali-Rosati qui propose une ontologie de la médiation (métaontologie) selon laquelle le media n’existe pas, on y retrouve la provocation de Kittler, et que toutes ces dynamiques, ces intra-actions, sont des médiations dont la matérialité, dans un agencement donné, produit du sens (Vitali-Rosati & Larrue, 2019).

Ainsi, l’assujetissement de l’humain aux logiciels que nous avons mentionné, que F. Kittler critique vivement dans ses travaux, n’a plus de raison d’être dans cette perspective non-essentialiste offerte par l’éditorialisation puisque ces entités sont uniquement déterminées lorsqu’il y a intra-action. Les relations entre les agents ne peuvent plus être présupposées et leur détermination est réalisée depuis un référentiel quasiment unique si l’on considère que les paramètres de cet environnement sont variables et que la probabilité d’obtention de conditions strictement identiques est quasi nulle. Depuis cette perspective où l’on considère les différents agents comme des productions de leur agencement dans un écosystème, il devient intéressant d’observer leur relation tout au long de ce processus pour comprendre comment ils s’affectent les uns les autres.

-

Néanmoins, un trouble persiste dans cette relation entre ces agents. Il se manifeste entre ce que l’usager à l’intention d’écrire et le document que produit la machine, qui est structuré selon un certains nombre de normes, formats, etc., implémentés dans un logiciel. Ce trouble nait de la rencontre entre une représentation du texte structurée graphiquement et une représentation du texte structurée par du texte, entre une raison graphique et une raison computationnelle, comme c’est le cas pour une page web interprétée par un navigateur et son pendant au format HTML. En ce sens, nous examinons la possibilité que l’écriture numérique puisse être affublée d’une caractéristique supplémentaire : la cécité. Cette caractéristique nous semble présente dans le fait qu’il y ait plusieurs angles morts entre ces deux conceptions du texte qui ne permettent ni à l’utilisateur ni à la machine de voir le texte dans sa totalité. La piste de ce trouble nous mène également à comprendre l’enjeu de cette relation entre l’usager et son environnement puisque. En le dévoilant, nous mettrons à jour les indices de la rencontre entre un auteur et son environnement d’écriture.

+

Néanmoins, un trouble persiste dans cette relation entre ces agents. Ce dernier se manifeste entre ce que l’usager à l’intention d’écrire et le document que produit la machine, qui est structuré selon un certains nombre de normes, formats, etc., implémentés dans un logiciel. Ce trouble nait de la rencontre entre une représentation du texte structurée graphiquement et une représentation du texte structurée par du texte, entre une raison graphique et une raison computationnelle, comme c’est le cas pour une page web interprétée par un navigateur et son pendant au format HTML. En ce sens, nous examinons la possibilité que l’écriture numérique puisse être affublée d’une caractéristique supplémentaire : la cécité. Cette caractéristique nous semble présente dans le fait qu’il y ait plusieurs angles morts entre ces deux conceptions du texte qui ne permettent ni à l’utilisateur ni à la machine de voir le texte dans sa totalité. La piste de ce trouble nous mène également à comprendre l’enjeu de cette relation entre l’usager et son environnement. En le dévoilant, nous mettrons à jour les indices de la rencontre entre un auteur et son environnement d’écriture.

Dans Stylo, nous savons que le texte est saisi par l’utilisateur en Markdown (YAML et BibTeX également), puis est envoyé sur le serveur au moyen d’une requête GraphQL au format JSON contenue dans une requête HTTP utilisant la méthode POST comme modalité de circulation de l’information. Entre ces étapes persiste une phase qui n’a pas encore été évoquée : la requête POST envoyée au serveur ne s’effectue pas en continu entre le client et le serveur, ce n’est pas un flux et l’on n’écrit pas directement dans la base de données. Une phase latente se glisse dans l’interface Web entre le moment où l’utilisateur frappe les touches de son clavier et le moment où la base de données est mise à jour. Cette phase est rendue visible par l’affichage du message au-dessus de l’éditeur de texte. Lorsque aucune touche du clavier n’est enfoncée pendant un certain laps de temps (quelques secondes), le message “Last saved…” est remplacé par “saving” : la copie de travail vient d’être enregistrée dans la base MongoDB grâce à la requête GraphQL updateWorkingCopy(). Dans ce laps de temps entre la frappe des mots au clavier et l’envoi de la requête au serveur, qu’advient-il du texte ?

Comme cela est mentionné précédemment, l’espace d’écriture de Stylo est un espace web. Pour y accéder, nous avons besoin d’un logiciel particulier – un navigateur ou un fureteur – capable d’interpréter du HTML, du CSS et d’exécuter du Javascript. Lorsque l’on écrit dans Stylo – et de surcroit dans le composant Monaco –, le texte saisi doit être manipulable et interprétable par le navigateur pour pouvoir être envoyé sur le serveur. C’est le rôle de Monaco de traiter cette couche d’informations. À l’écran, l’utilisateur voit s’afficher du Markdown tel qu’il le frappe, pourtant cette information n’est inscrite sur aucun support en dehors du rendu visuel affiché à l’écran. Monaco travaille avec des modèles et ce sont avec eux que l’utilisateur interagit. Chaque modèle est rattaché à une URI (que l’on peut identifier avec l’identifiant des articles) et c’est de cette manière que Monaco peut manipuler le DOM (Document Object Model) du navigateur pour créer le texte et son rendu graphique dans un format de texte brut.

Le DOM est une représentation abstraite d’un document HTML exécutée dans le navigateur. Tous les éléments structurés à l’intérieur de ce document deviennent des objets, des noeuds manipulables avec du Javascript. C’est grâce à ce procédé qu’une page web est rendue dynamique. Puisque la construction du DOM dépend du navigateur employé, nous pouvons en déduire que ce document sera différent selon le navigateur ou les différentes versions d’un même logiciel. Pour accéder à ce DOM il suffit d’ouvrir les outils de développements du navigateur et d’inspecter le contenu de la page HTML.

@@ -371,17 +365,17 @@ Le choix des formats dans lesquels les utilisateurs peuvent saisir leurs textes

Cette formule est empruntée à Louise Merzeau qui l’employait pour parler des […] utilisateurs des grandes plateformes du Web [et de] la perte de contrôle de leurs usages, restreints et conditionnés par les algorithmes et par des interfaces de plus en plus normalisées.

Dans Stylo, les utilisateurs ne sont pas forcément conscients des formes d’écriture internes à cet environnement, ni de la circulation des informations entre les éléments qui le constituent. Cette part de Stylo cachée derrière l’écran relève de cette déprise.

-

Si l’on suit les différentes métamorphoses du texte, on se rend compte que la forme brute n’est inscrite nulle part. On la retrouve soit sous sa forme interprétée par le navigateur (en réalité il s’agit d’un document HTML), soit lors de l’export c’est-à-dire lorsque les documents sortent de l’environnement Stylo. En dehors de cette situation, il n’existe aucun document dont l’extension serait .md et stipulerait que ledit document respecte les règles et normes de ce format.

+

Si l’on suit les différentes métamorphoses du texte, on se rend compte que la forme brute (Markdown, YAML, BibTeX) n’est inscrite nulle part. On la retrouve soit sous sa forme interprétée par le navigateur (en réalité il s’agit d’un document HTML), soit lors de l’export c’est-à-dire lorsque les documents sortent de l’environnement Stylo. En dehors de cette situation, il n’existe aucun document dont l’extension serait .md et stipulerait que ledit document respecte les règles et normes de ce format.

À la différence des systèmes analogiques et continus, la rupture opérée par l’écriture numérique réside entre autre dans cette discrétisation du texte en de multiples documents, où chacun se voit doté d’un paratexte différent pour circuler à travers les canaux de communication du système d’informations.

Dans Stylo, les textes y sont écrits par l’ensemble des protocoles choisis lors de l’établissement de cet environnement. La déprise sur le texte survient lors du choix de l’environnement par l’utilisateur. Lorsqu’un utilisateur écrit dans Stylo, il accorde sa confiance dans les opérations que réalise Stylo sur le texte et dans la matérialité qu’il participe à lui conférer.

-

Toutes ces dynamiques éditorialisent et constituent les premières traces de l’intimité du chercheur. Autrement dit, écrire dans l’environnement Stylo produit quelque chose qui ne serait pas identique dans un autre environnement car les dynamiques observées seraient affectées par d’autres facteurs et produiraient ainsi une autre chose. Le choix de l’environnement d’écriture constitue en conséquence un choix politique puisque cet environnement agit et produit une matérialité singulière.

+

Toutes ces dynamiques éditorialisent et constituent les traces d’une épistémologie du document primaire avant toute transformation par le reste de la chaîne éditoriale. Autrement dit, écrire dans l’environnement Stylo produit quelque chose qui ne serait pas identique dans un autre environnement car les dynamiques observées seraient affectées par d’autres facteurs et produiraient ainsi une autre chose. Le choix de l’environnement d’écriture constitue en conséquence un choix politique puisque cet environnement agit et produit une matérialité singulière.

Conclusion

-

À la question de la place de l’environnement d’écriture dans le processus de saisi d’un texte numérique et de l’intimité du chercheur qui en découle, nous avons émis l’hypothèse que ce dernier dépasse son statut utilitariste de support pour celui de dynamique constitutive du sens de ce texte. En nous appuyant sur le fonctionnement d’un ordinateur et sur les caractéristiques de l’écriture numérique, tant la partie matérielle que la partie logicielle, nous avons écarté la page affichée à l’écran pour nous confronter aux logiciels et aux médiations qu’ils représentent dans la relation entre humain et machine dans l’acte d’écriture.

+

À la question de la place de l’environnement d’écriture dans le processus de saisi d’un texte numérique et du modèle épistémologique qui en découle, nous avons émis l’hypothèse que cet environnement dépasse son statut utilitariste de support pour celui de dynamique constitutive du sens de ce texte. En nous appuyant sur le fonctionnement d’un ordinateur et sur les caractéristiques de l’écriture numérique, tant la partie matérielle que la partie logicielle, nous avons écarté la page affichée à l’écran pour nous confronter aux logiciels et aux médiations qu’ils représentent dans la relation entre humain et machine dans l’acte d’écriture.

En nous appuyant sur la notion d’éditorialisation, telle qu’elle s’inscrit dans le nouveau matérialisme et le posthumanisme, nous avons observé les intra-actions à l’oeuvre dans l’éditeur de texte Stylo. À partir de ce positionnement théorique dont le prisme non-essentialiste ne prédétermine pas les agents en amont de l’interaction, nous avons considéré à la fois l’auteur et et la machine comme deux agents de l’énonciation éditoriale.

Pour réaliser cette étude, nous nous sommes appuyés sur une méthode empruntée au théoricien des médias Friedrich Kittler dont l’analyse repose sur la description technique du fonctionnement des éléments mobilisés.

-

L’observation du phénomène de création d’un document texte dans un environnement d’écriture spécialisé pour l’écriture savante à travers le prisme des strates de l’écriture numérique, du matériel au logiciel, a mis en évidence différents angles morts de la relation entre un auteur et son environnement d’écriture dans lesquels se nichent les traces de leurs interactions. Qu’ils s’incarnent dans des documents temporaires comme le DOM du navigateur ou dans des protocoles de transmissions des informations comme HTTP, ces angles morts de l’écriture numérique, produits par cette relation, nous montrent que certaines parties de cette écriture ne sont finalement pas directement accessibles à ces deux agents alors qu’elles participent à la matérialité conférée au document produit. Il y a une forme de déprise instaurée dans cette relation et que l’auteur accepte, bon ou malgré lui, lorsqu’il emploie un environnement d’écriture numérique. En ce sens, un certain degré de confiance est accordé à l’environnement d’écriture choisi dans le processus de production du document.

-

En observant diverses saisies de fragments de texte selon les formats pivots utilisés dans Stylo, le Markdown, le YAML et le BibTeX, nous nous sommes aperçus qu’ils ne sont jamais inscrit directement selon les formats mentionnés mais qu’ils passent par quatre états différents : la saisie à l’écran, la manipulation par le DOM du navigateur dans l’éditeur Monaco, la requête GraphQL formatée en JSON pour être transporté par la méthode POST du protocole HTTP et le stockage dans la base de données MongoDB. Le texte est ainsi transformé en différents états pour qu’il puisse circuler dans Stylo entre l’espace où il est saisi, que l’on peut retrouver à une adresse unique (l’URL de l’article), et l’espace où il sera stocké dans le serveur de la TGIR Huma-num qui héberge l’application. De nouvelles informations sont alors inscrites dans le texte lors de ces métamorphoses : la structure du document varie à chaque étape. Ainsi, les signes qui constituent le document changent et en modifient profondément le sens. Parmi les quatre états mentionnés, seulement le premier est saisi par l’utilisateur et les autres sont écrits par Stylo. Néanmoins écrire avec Stylo ne nécessite pas de connaître ces différentes phases. Il y aurait donc une relation entre un auteur et Stylo qui prendrait naissance dans une forme de déprise où l’utilisateur accorde sa confiance dans les manipulations du texte que l’application réalise. En se référant à l’éditorialisation, nous pouvons affirmer que chacune de ces quatre phases contribue à la matérialité du texte saisi et qu’en ce sens il y a co-écriture entre l’utilisateur et Stylo.

-

Les marqueurs de cette relation entre un auteur et l’environnement d’écriture Stylo, les traces d’une épistémologie singulière, apparaissent à chacune des phases du document et y sont inscrites à l’intérieur. En suivant le fil de ces traces, il devient possible de suivre l’ensemble des médiations et des conditions de l’environnement numérique produisant le document et son texte, source que traitera la chaîne éditoriale jusqu’à sa publication.

+

L’observation du phénomène de création d’un document texte dans un environnement d’écriture spécialisé pour l’écriture savante à travers le prisme des strates de l’écriture numérique, du matériel au logiciel, a mis en évidence différents angles morts de la relation entre un auteur et son environnement d’écriture dans lesquels se nichent les traces de leurs interactions. Qu’ils s’incarnent dans des documents temporaires comme le DOM du navigateur ou dans des protocoles de transmissions des informations comme HTTP, ces angles morts de l’écriture numérique, produits par cette relation, nous montrent que certaines parties de cette écriture ne sont finalement pas directement accessibles à ces deux agents alors qu’elles participent à la matérialité conférée au document produit. Il y a une forme de déprise instaurée dans cette relation et que l’auteur accepte, bon ou malgré lui, lorsqu’il emploie un environnement d’écriture numérique. En ce sens, un certain degré de confiance (aveugle) est accordé à l’environnement d’écriture choisi dans le processus de production du document.

+

En observant diverses saisies de fragments de texte selon les formats pivots utilisés dans Stylo, le Markdown, le YAML et le BibTeX, nous nous sommes aperçus qu’ils ne sont jamais inscrit directement selon les formats mentionnés mais qu’ils passent par quatre états différents : la saisie à l’écran, la manipulation par le DOM du navigateur dans l’éditeur Monaco, la requête GraphQL formatée en JSON pour être transporté par la méthode POST du protocole HTTP et le stockage dans la base de données MongoDB. Le texte est ainsi transformé en différents états pour qu’il puisse circuler dans Stylo entre l’espace où il est saisi, que l’on peut retrouver à une adresse unique (l’URL de l’article), et l’espace où il sera stocké dans le serveur de la TGIR Huma-num qui héberge l’application. De nouvelles informations sont alors inscrites dans le texte lors de ces métamorphoses : la structure du document varie à chaque étape. Ainsi, les caractères qui constituent le document changent et en modifient profondément le sens. Parmi les quatre états mentionnés, seulement le premier est saisi par l’utilisateur et les autres sont écrits par Stylo. Néanmoins écrire avec Stylo ne nécessite pas de connaître ces différentes phases. Il y aurait donc une relation entre un auteur et Stylo qui prendrait naissance dans une forme de déprise où l’utilisateur accorde sa confiance dans les manipulations du texte que l’application réalise. En se référant à l’éditorialisation, nous pouvons affirmer que chacune de ces quatre phases contribue à la matérialité du texte saisi et qu’en ce sens il y a co-écriture entre l’utilisateur et Stylo.

+

Les marqueurs de cette relation entre un auteur et l’environnement d’écriture Stylo, les traces d’une épistémologie singulière, apparaissent à chacune des phases du document et y sont inscrites à l’intérieur. En suivant le fil de ces traces, il devient possible de suivre l’ensemble des médiations et des conditions de l’environnement numérique produisant le document primaire et son texte, source que traitera la chaîne éditoriale jusqu’à sa publication.

Bibliographie

@@ -483,9 +477,6 @@ Pédauque, R. T. (2006). Le document à la lumiè Sauret, N. (2020). De La Revue Au Collectif : La Conversation Comme Dispositif d’éditorialisation Des Communautés Savantes En Lettres et Sciences Humaines [These de Doctorat]. Paris 10.
-
-Souchier, E. (1998). L’image du texte pour une théorie de l’énonciation éditoriale. Les cahiers de médiologie, 6(2), 137‑145. https://doi.org/10.3917/cdm.006.0137 -
Souchier, E. (2012). La << lettrure >> à l’écran. Lire & écrire au regard des médias informatisés. Communication & langages, 174(4), 85‑108. https://doi.org/10.4074/S0336150012014068
diff --git a/docs/posts/2024-08-07-l-effacement-par-remplacement.html b/docs/posts/2024-08-07-l-effacement-par-remplacement.html new file mode 100644 index 0000000..08775a4 --- /dev/null +++ b/docs/posts/2024-08-07-l-effacement-par-remplacement.html @@ -0,0 +1,68 @@ + + + + + + + + Roch Delannay | L’effacement par remplacement + + + + + + + + + + + + +
+
+
+

L’effacement par remplacement

+ + + +
+
+

Notes pour le billet:

+
    +
  • Le modèle épistémologique établi pendant l’écriture est effacé et remplacé durant le traitement éditorial du document au profit d’un modèle éditorial choisi.
  • +
  • les traces obtenues de la rencontre entre un auteur et un environnement sont alors supprimées.
  • +
  • revenir sur le fonctionnement de l’écriture numérique et sa variabilité (c’est un fonctionnement intrinsèque au numérique). +
      +
    • quelques mots sur le fonctionnement même d’un disque dur et des droits d’écriture / lecture d’un espace numérique.
    • +
  • +
  • exemple du pressoir et du livre Contribution numérique: cultures et savoirs. +
      +
    • les sources reçues en .odt et .docx
    • +
    • transformations via pandoc en markdown + yaml (voir les archives dans gitlab)
    • +
    • la déstructuration du contenu par Pandoc et son AST (explication de ce qu’est un AST)
    • +
    • restructuration en un document pandoc native (représentation de l’AST)
    • +
    • transformations vers le format souhaité et respect d’un autre modèle de représentation du document
    • +
  • +
  • définir transformation et conversion
  • +
+
+
+
+
+

CC BY 4.0 Roch Delannay

+

Créé avec Pandoc et Make

+ Colophon +
+
+ \ No newline at end of file diff --git a/docs/posts/2024-08-07-le-medium-au-coeur-des-pratiques-d-ecriture.html b/docs/posts/2024-08-07-le-medium-au-coeur-des-pratiques-d-ecriture.html new file mode 100644 index 0000000..86b5338 --- /dev/null +++ b/docs/posts/2024-08-07-le-medium-au-coeur-des-pratiques-d-ecriture.html @@ -0,0 +1,114 @@ + + + + + + + + Roch Delannay | Une épistémologie du document centrée sur le medium + + + + + + + + + + + + +
+
+
+
+

Une épistémologie du document centrée sur le medium

+ + + +
+
+

Notes pour le billet :

+
    +
  • potentiel titre de la these:  le <em>mal</em>traitement du texte
  • +
  • du fait de l’importance accordée à l’objet public (publié), aka revue, livre, blog, etc., l’objectif de l’édition est de se concentrer sur un modèle éditorial (un modèle épistémologique) et de transformer un document X pour qu’il soit conforme à ce modèle épistémologie.
  • +
  • ce faisant, nous oublions ou laissons de côté le document source original et les conditions de son élaboration. +
      +
    • peut-être utiliser Bergin et Kirshenbaum pour montrer que depuis l’arrivée de Microsoft, on a un seul modèle du numérique présent et qu’on ne le questionne plus ? trouver d’autres sources.
    • +
  • +
  • un pan des études littéraires, la génétique du texte, se concentre sur cet aspect là, principalement dans le traitement de textes pré-numériques.
  • +
  • Qu’en est-il lorsqu’il s’agit de textes contemporains créés nativement dans un espace numérique ? +
      +
    • L’importance accordée à l’objet publié, héritée de l’imprimé, prime également pour les documents numériques…
    • +
    • la chaîne éditoriale se concentre principalement sur le résultat à obtenir au détriment de documents intermédiaires nécessaires à l’acte de publication.
    • +
    • d’ailleurs, le post-traitement de ces objets publiés ne s’intéresse pas non plus au modèle épistémologique qui le constitue (ex: fouille de texte)
    • +
  • +
  • Pourtant, depuis l’Antiquité et la période hellenistique, le rapport des savants à l’écriture et à leurs textes … (Hadot)
  • +
  • Fait également hérité durant l’époque des Lumières puis des premières revues …. (raconter l’histoire de chacun) jusqu’au numérique
  • +
  • Cette perspective sur le document comme élément au coeur du processus d’écriture (et donc du sens qui en émerge) nous mène vers la théorie des médias …
  • +
  • Nécessité de définir le document
  • +
  • Revue de littérature sur la théorie des médias en partant de McLuhan
  • +
  • Proposer un cadre posthumain pour justifier la valeur accordée au document (si souvent oublié de nos recherches).
  • +
+

Introduction

+

Le texte et les théories qui s’y rapportent fondent leur épistémologie autour du signe (kristeva?). Lorsqu’il s’agit d’étudier un texte, que l’on vienne de la sémiologie, de la philologie ou de la génétique des textes, ce sont les unités sémiotiques, les mots et autres agencements de signes qui constituent l’objet étudié. Cependant, cette perspective ne permet pas de rendre compte de ce que pourrait être une épistémologie du document, celui-ci comprenant à la fois le texte et son support. Les conditions de rédaction d’un texte sur une stèle, un post-it, une ardoise, du papier ou de la silice ne sera pas composé dans Les conditions de l’établissement d’un document durant l’Antiquité ne sont pas comparables aux conditions que l’on connait au 21e siècle avec le numérique. En ce sens

+

Un document … puis un document numérique (zacklad?)

+

Afin de pouvoir

+

Lien entre pratique d’écriture savante et medium

+

À l’instar de Barthes pour qui la centralité du signe dans le texte remonte aux stoïciens (dates …),

+

Dans son ouvrage Exercices spirituels et philosophie antique, Pierre Hadot décrit ce qu’était la philosophie antique durant l’apogée de la civilisation grecque que l’on peut situer à partir de la période des présocratiques (environ 700 av. JC) jusqu’à la fin de la période hellénistique (31 av. JC.). Durant cette période, la philosophie n’était pas seulement un exercice de pensée pour répondre aux questions sur l’existence de l’être et son rapport au monde, mais était un mode de vie qui se pratiquait au quotidien. Elle était pratiquée par celles et ceux qui aimait et désirait la Sagesse. L’objectif n’était pas d’atteindre cette sagesse, car elle est l’apanage des dieux, mais d’en frayer la voie pour s’en rapprocher. Les philosophes de l’antiquité, à la différence de leurs contemporains spécialistes du savoir, les sophistes, modifiaient ainsi leur façon de vivre et l’accordaient à un système de valeurs vertueuses aligné sur les préceptes de l’école ou du courant philosophique auquel ils étaient rattachés. La philosophie pratiquée par les anciens était plus qu’un mode de pensée, elle était une « manière d’être » (Hadot, 2002, p. 77). Afin de parcourir ce chemin vertueux, les différentes écoles et courants ont mis au point des séries d’exercices spirituels que le philosophe pratiquait au quotidien.

+

L’étymologie de ces exercices est strictement identique à celle de l’ascèse chrétienne : askesis. Les deux termes ont une origine commune mais une signification bien différente. À ce propos, P. Hadot nous met en garde quant à la confusion possible entre ces deux askesis. L’askesis chrétienne se rapproche de la définition contemporaine du terme, c’est-à-dire de l’abstinence ou de la restriction de nourriture, de boisson, de relation sexuelle, etc. ; alors que l’askesis grecque ne renvoie qu’aux exercices spirituels que nous avons mentionnés, qualifiés comme étant « une activité intérieure de la pensée et de la volonté » (Hadot, 2002, p. 78). La philosophie antique, à travers l’askesis, agit comme une « thérapeutique des passions » (Hadot, 2002, p. 22). Une pratique assidue permet de se dépouiller de ces dernières et d’opérer une objectivation du monde débarassée des perceptions subjectives et des affects. « L’intériorisation [réalisée à travers cette vie ascétique] est dépassement de soi et universalisation » (Hadot, 2002, p. 330), notamment chez les épicuriens et les stoïciens. En somme, lorsque le philosophe entreprend son parcours, il en vient à se détacher de sa condition humaine et, par un mouvement d’extériorisation, développe une « nouvelle manière d’être-au-monde […] qui consiste a prendre conscience de soi comme partie de la Nature » (Hadot, 2002, p. 330).

+

P. Hadot propose également une liste de ces exercices parmi lesquels on y trouve : la recherche (zetesis), l’examen approfondi (skepsis), la lecture, l’audition (akroasis), l’attention (prosochè), la maîtrise de soi (enkrateia), l’indifférence aux choses indifférentes, les méditations (meletai), les thérapies des passions, le souvenir de ce qui est bien, l’accomplissement des devoirs (Hadot, 2002, p. 26). L’auteur accorde une valeur particulière à l’examen de conscience que suppose l’attention à soi (prosochè). Il s’agit d’un exercice à réaliser quotidiennement, voire même plusieurs fois par journée. Le philosophe prend du recul sur ses actes passés, soit une distance critique vis-à-vis de sa manière d’être qu’il confronte au système de valeurs auquel il prétend appartenir. Une des méthodes pour réaliser cet exercice est l’écriture de soi. Le philosophe couche sur le papier les actions effectuées durant une période précise, il s’y raconte. C’est ce que fait Marc-Aurèle dans les Pensées pour moi-même (Hadot, 2002, p. 149).

+

[ajouter quelques paragraphes sur Marc-Aurèle]

+

En faisant un anachronisme, cette pratique de l’écriture de soi pourrait aisément être confondue avec une écriture diaristique ou se rapprocher du récit autobiographique. Ce qui est également le cas avec Les Confessions de Rousseau ou les Méditations de Descartes. Elles peuvent effectivement être lues comme un récit autobiographique ou alors comme la réalisation d’une askesis où l’auteur utilise l’écriture pour exercer une tension entre un récit de lui-même et des réflexions philosophiques. Le succès de cette méthode qu’est l’écriture perdure pendant plusieurs siècles comme en témoigne les écrits d’Athanase d’Alexandrie dans la Vie d’Antoine vers l’an 360 (soit environ 40 ans avant les Confessions d’Augustin). P. Hadot en cite le passage suivant (Hadot, 2002, p. 90) :

+
+

Que chacun note par écrit, conseille Antoine, les actions et les mouvements de son âme, comme s’il devait les faire connaître aux autres. En effet, poursuit-il, nous n’oserions certainement pas commettre des fautes en public, devant les autres. Que l’écriture tienne donc la place de l’oeil d’autrui.

+
+

Ainsi, l’examen de conscience, dont la finalité est la maîtrise de soi, peut être réalisé par une série d’étapes dont la première est l’introspection qui est accomplie grâce à une mise en récit de soi via un medium, l’écriture, et génère alors une deuxième étape, celle de l’extériorisation de soi. L’écriture dépasse la simple condition de support / outils grâce auquel une information peut être transmise et devient la condition sine qua non de l’accès à l’autre.

+

À titre d’exemple, si nous reprenons le passage cité précédemment de la lettre de Sénèque à Lucilius, Sénèque écrit ceci : « Sans doute l’homme devrait toujours se conduire comme s’il avait des témoins, toujours penser comme si quelqu’un pouvait lire au fond de son coeur ». Exception faite pour l’écriture, la méthode que propose Sénèque est très similaire à celle de Saint-Antoine, et elle s’incarne à travers la lettre qui est employée comme medium. La relecture de la lettre de Sénèque sous le prisme de l’exercice spirituel modifie l’interprétation que l’on peut en faire. De plus, Sénèque nous indique dès le début de la lettre qu’il s’agit de l’exercice de l’examen de soi : « Je vais donc me mettre à m’observer, et, pour plus de sûreté, je ferai le soir la revue de ma journée. » Si nous considérons qu’il s’agit bien là de la réalisation d’un exercice spirituel, et en sachant que Sénèque est un philosophe, nous pouvons en déduire que cette lettre comporte finalement un double enjeu. Le premier est explicite : Sénèque fait une démonstration à Lucilius comme un maître peut le faire avec son élève. Le second est la réalisation de l’exercice pour Sénèque lui-même. En réalisant cet exercice dans le cadre d’une leçon qu’il dispense, Sénèque en profite pour appliquer cette méthode et écrire son examen de conscience qu’il va pouvoir livrer à Lucilius qui, en l’occurrence, incarne l’autre. La conjugaison au futur employée dans la lettre donne à penser que Sénèque prémédite les actions et mouvements qu’il va réaliser dans la journée. Il fait en sorte que ses actions soient vertueuses pour qu’il n’y ait rien dont il puisse avoir honte car il sait que Lucilius sera témoin de son récit.

+

Cet exemple fait émerger plusieurs propriétés de l’intimité qui sont évoquées dans la lettre de Sénèque et que l’on peut, par extension, appliquer à la philosophie antique. Tout d’abord, cette intimité naît de la pratique de la philosophie et des exercices qui l’accompagnent. Ce n’est donc pas quelque chose qui serait donné et pré-existant à soi, mais quelque chose qu’il faut construire. Ensuite, elle nécessite un medium, dans ce cas-ci l’écriture, pour ajouter un mouvement d’extériorisation à une première dynamique introspective. En somme, le philosophe créé un récit de lui-même afin de mobiliser l’autre et se donner à voir, pour mettre en évidence ce qui lui est intérieur.

+

Néanmoins, il ne s’agit pas uniquement de se livrer à autrui, d’ailleurs ce n’est pas le regard que l’autre peut porter sur soi qui importe. Qu’il s’agisse de Sénèque ou d’Antoine, leur méthode convoque un autre qui est soit « public », soit « témoin ». L’autre ainsi convoqué dans ce mouvement d’extériorisation est avant tout un autre social et politique. Finalement, le philosophe se doit d’être irréprochable, sa conduite doit correspondre à l’image attendu d’un philosophe dans l’école mais aussi et surtout dans la cité. Il ne dépend pas du regard que peuvent porter les citoyens sur lui, mais plutôt d’un système de valeurs qui le détermine en tant que philosophe. La question de la maîtrise de soi et de l’examen de conscience est donc fondamentalement éthique.

+

L’intimité n’est donc pas soi et elle ne peut exister que parce qu’il y a présence de l’autre, l’intimité ne serait plus seulement un espace au plus profond de l’être mais un espace qui se trouve entre l’être et l’autre, entre soi et le monde social.

+

Le document numérique au prisme de la théorie des médias

+

Conclusion

+

Pour définir le document comme pièce centrale de la publication scientfique, nous nous sommes appuyés sur la théorie des médias et plus particulièrement sur le courant matérialiste fondé par l’école de Toronto depuis McLuhan, puis repris par Kittler dans les années 1970 en Allemagne, puis par la médiologie en France et notamment par Louise Merzeau. Chez L. Merzeau, nous retrouvons également une affiliation avec la pensée kittlérienne, principalement dans son approche [déterministe/essentialiste]… sur lesquelles reposent ses recherches.

+

Ajouter un mot sur la limite de ce que cette pensée fait au document…

+

Pour dépasser cette position, L. Merzeau s’est tournée vers les sciences de l’information et de la communication (SIC) et a développé ses recherches autour de la notion d’éditorialisation, à la fois depuis le courant francophone provenant des SIC depuis Bachimont (Bachimont, Broudoux) + redocumentarisation (Zacklad) et à la fois depuis le courant qui se développait au Québec par M. Vitali-Rosati, plus proche des sciences humaines et de l’intermédialité montréalaise, un autre courant historique de la théorie des médias où s’y est développé depuis les lettres et les arts une approche de la relation entre les médias (Tadier, Méchoulan).

+

Malgré le fait que L. Merzeau n’ait pas pu achever ses travaux, elle abouti à une théorie du commun dans lequel le document pourrait ….

+

D’autres travaux plus récents sur l’éditorialisation (Vitali-Rosati), propose également une autre forme de dépassement de cette posture essentialiste par la mobilisation de théories provenant du courant posthumaniste (Hayles, Barad) …

+
+
+Hadot, P. (2002). Exercices spirituels et philosophie antique (Nouv éd rev. et augm édition). Albin Michel. +
+
+
+
+ + \ No newline at end of file -- cgit v1.2.3