Wikimedia Enterprise

From Meta, a Wikimedia project coordination wiki
Jump to navigation Jump to search
This page is a translated version of the page Wikimedia Enterprise and the translation is 79% complete.
Outdated translations are marked like this.
Wikimedia Enterprise
enterprise.wikimedia.com
ProjetPage principalePrincipes
Essai & FAQ (mars 2021)
Détails techniquesMediaWikiPhabricator
GitDocumentation API

Wikimedia Enterprise est un nouveau projet interdépartemental de la Wikimedia Foundation. L'objectif du projet est de créer des services pour les réutilisateurs commerciaux à grande échelle du contenu Wikimedia. Le projet était auparavant connu sous le nom d’« Okapi ».

L'accent est mis sur les organisations qui souhaitent réutiliser le contenu Wikimedia dans d'autres contextes, en fournissant des services de données à grande échelle, afin qu'ils soient plus rapides, plus complets, plus fiables et plus sécurisés. Wikimedia Enterprise vise à améliorer l'expérience utilisateur des lecteurs de Wikimedia au-delà de nos propres sites web ; à augmenter la portée et la découvrabilité du contenu ; et à améliorer la notoriété et la facilité d'attribution et de vérifiabilité par les organisations qui réutilisent le plus le contenu Wikimedia, tout cela à travers des services qui s’autofinancent.

Contact the team if you would like to arrange a conversation about this project with your community, at a time and meeting software platform of your choice.

slides
Presentation at the EMWCon Spring 2021 conference

Next public meeting: Friday October 22 @ 1500 UTC on Zoom.

Past public meetings:

...and also at the March Strategic Wikimedia Affiliates Network (SWAN) meeting; the May 2021 Wikimedia Clinic; and at Wikimania 2021. In March 2021 the project was also featured in WIRED.


Il existe une barrière d’entrée très élevée pour l'utilisation des données Wikimedia en dehors des cas d'utilisation courants de lecture ou d'édition. En effet, le contenu est difficile à segmenter et à comprendre pour les machines, ce qui affecte à son tour la portée du contenu Wikimedia au-delà de notre propre écosystème, ainsi que l'ampleur de l'impact qu’il peut avoir.


Les deux recommandations de la stratégie de mouvement « Augmenter la durabilité de notre mouvement » et « Améliorer l'expérience utilisateur » invitent respectivement à « Explorer de nouvelles opportunités pour la génération de revenus et la diffusion gratuite des connaissances grâce à des partenariats et des services facturés, par exemple ... par la mise en place d’API pour les entreprises » et « Rendre la panoplie d'API Wikimedia plus complète, fiable, sécurisée et rapide, en partenariat avec des utilisateurs à grande échelle… et améliorer la notoriété et la facilité d'attribution et de vérifiabilité pour les réutilisateurs de contenu ».

Il est bien connu que quelques grandes entreprises utilisent les données de nos projets. Ces entreprises reconnaissent que sans les projets Wikimedia, elles ne pourraient pas offrir une expérience aussi riche ou fiable à leurs propres utilisateurs. Les membres de la communauté ont depuis longtemps le sentiment que ces entreprises devraient réinvestir davantage dans les communautés Wikimedia en échange des avantages qu'elles tirent du contenu et des ressources qu'elles utilisent.

Cela a conduit à l'idée de développer une nouvelle approche plus durable à long terme et offrant une relation beaucoup plus claire entre Wikimedia et les utilisateurs en entreprise. Tout avantage financier pour Wikimedia ne viendrait probablement que d’un très petit nombre d'utilisateurs commerciaux intensifs, et se répercuterait sur le mouvement Wikimedia.

Au fur et à mesure que cette idée s’est développée, il est devenu clair qu'il est de notre responsabilité de démocratiser notre contenu pour les organisations qui n’ont pas autant de ressources que les utilisateurs les plus intensifs. Cela afin de favoriser un Internet sain et équitable, et ne pas renforcer les monopoles. Un tel service ne devrait pas seulement avantager les startups ou les alternatives aux géants de l'internet, mais aussi les universités et chercheurs universitaires, les archives et archivistes, et le mouvement Wikimedia dans son ensemble.

Wikimedia Enterprise timeline (2020-21).png

Aperçu

Okapi users.png

Wikimedia Enterprise se concentre sur les entreprises qui réutilisent notre contenu, généralement à grande échelle, par exemple quand elles l’intègrent dans des bases de connaissances, des moteurs de recherche, des assistants vocaux, des cartes, des actualités, des outils communautaires, des applications tierces et des études de corpus complet. Augmenter les nombreux ensembles de données de Wikimedia pour structurer notre contenu non structuré permettra à tous nos réutilisateurs de répondre à leurs besoins individuels tout en nous permettant de créer de nouveaux outils et services à l'avenir, accessibles à tous. Les réutilisateurs de notre contenu recherchent trois composants principaux:

  • Fréquence : instantanés réguliers des projets Wikimedia
  • Fiabilité : infrastructure fiable et accessible
  • Qualité : « meilleure version la plus récente »


Mettre l'accent sur des services qui s’autofinancent permet à l'équipe API de Wikimedia (distincte de Wikimedia Enterprise) de se concentrer, comme auparavant, sur les bénévoles, les équipes et les organisations qui cherchent à accéder (et, surtout, à interagir avec) nos ensembles de données. Cela inclut la majorité des outils communautaires de contribution, qui ne seront pas concernés par ce projet. Pour plus d'informations sur les améliorations apportées aux API Wikimedia existantes, consultez la page du projet sur l'initiative « API Gateway ».

Objectifs du programme :

  • Contenu : Rendre le contenu créé par notre mouvement davantage disponible dans des formats cohérents et lisibles par des machines, et disponibles gratuitement pour tous les chercheurs et réutilisateurs.
  • Charge serveur : Faire en sorte que les réutilisateurs les plus intensifs (en termes de fréquence et volume) n’aient pas besoin d’interroger nos serveurs principaux en permanence pour en lire notre contenu
  • Revenu : Offrir aux plus grands réutilisateurs un moyen plus clair et plus cohérent de réinvestir dans le mouvement les bénéfices qu’ils en dérivent, au lieu de faire des dons occasionnels dont la taille varie.

Communauté

Les paragraphes suivants sont extraits d'un essai communautaire beaucoup plus détaillé.

L'essai complet couvre les sujets suivants

 

Les projets Wikimedia sont libres, ont toujours été libres, et resteront toujours libres. En tant que mouvement, nous épousons les principes des œuvres culturelles libres, selon lesquels n'importe qui peut utiliser Wikimedia sans restriction, y compris à des fins commerciales. C’est pourquoi nous rejetons les licences « non commerciales », car elles limiteraient les types de réutilisation possibles. Et c'est pourquoi nous considérons la réutilisation commerciale comme un moyen important de diffuser les connaissances auprès des publics.

De même, les projets Wikimedia sont gratuits, ont toujours été gratuits, et resteront toujours gratuits. La possibilité d'accéder librement aux connaissances disponibles dans tous les projets Wikimedia a toujours été au cœur de la mission de la Fondation et du mouvement. Nous fournissons cet accès non seulement aux personnes qui visitent nos sites web, mais également aux programmes qui interrogent nos serveurs afin que notre contenu puisse être réutilisé dans d'autres environnements. Le corpus complet du contenu de Wikimedia a toujours été mis à disposition pour une réutilisation sous diverses formes, et continuera de l'être (notamment via des sauvegardes de bases de données, des API, et le web scraping) sans frais.

Par conséquent, notre contenu est souvent réutilisé par des organisations commerciales qui en dépendent pour soutenir leurs modèles commerciaux et qui en tirent ainsi des revenus. En dehors des dons corporatifs effectués volontairement à la Fondation Wikimedia, le mouvement n'a jamais reçu de bénéfices de ces revenus grâce à un retour sur investissement. En reconnaissance de cela, sous l’égide de la « Durabilité de notre mouvement », le processus de stratégie du mouvement a demandé à la Wikimedia Foundation d'explorer, entre autres, « des API pour les entreprises [et] des modèles pour les réutilisateurs commerciaux grande échelle, en prenant soin d'éviter la dépendance des revenus ou toute autre influence extérieure indue dans la conception et le développement des produits. » En outre, sous l’égide de l'expérience utilisateur, une autre recommandation invite à « Rendre la panoplie d'API Wikimedia plus complète, fiable, sécurisée et rapide, en partenariat avec des utilisateurs à grande échelle, là où cela correspond à notre mission et à nos principes, pour améliorer l'expérience utilisateur de nos utilisateurs directs et indirects, augmenter la portée et la découvrabilité de notre contenu et le potentiel de retour de données, et améliorer la connaissance et la facilité d'attribution et de vérifiabilité pour les réutilisateurs de contenu. »

L'équipe du projet Enterprise développe une nouvelle ressource destinée aux réutilisateurs commerciaux de contenu, qui ont des exigences en matière de produits, de services et de systèmes qui vont au-delà de ce que nous fournissons gratuitement. L'utilisation de cette offre ne sera pas requise pour la réutilisation commerciale du contenu ; les sociétés peuvent continuer à utiliser gratuitement les outils actuellement disponibles. Tous les revenus de l'API Enterprise seront utilisés sans équivoque pour soutenir la mission Wikimedia, par exemple pour financer des programmes Wikimedia ou aider à développer le fonds de dotation Wikimedia (Wikimedia Endowment).

Ce projet représente un nouveau type d'activité à la Fondation. Le projet est à un stade très précoce qui devrait être considéré comme une période d'apprentissage. Nous aurons des succès, nous ferons des erreurs et nous devrons adapter nos stratégies. L'équipe s'engage à écouter, à s'engager et, dans la mesure du possible, à intégrer les commentaires que nous recevons sur notre travail. Ce document est organique et reflète la réflexion actuelle de l'équipe ; nous essayons de documenter notre travail de façon publique autant que possible. Jusqu'à présent, notre travail a été façonné par une série d'entretiens initiaux avec des membres de la communauté, le conseil d’administration et le personnel de la Wikimedia Foundation, des chercheurs et des réutilisateurs.

... continuez à lire le reste de l'essai communautaire. Voir également la FAQ et les principes.

Compte tenu de la nature du projet, la prise de décision principale incombera à la Wikimedia Foundation. Nous recherchons la contribution de la communauté, en particulier de la communauté technique et de ceux qui ont été impliqués dans le processus de stratégie, tout au long de la vie du projet. Des commentaires techniques ont été recueillis auprès de collègues de la Wikimedia Foundation, de partenaires industriels et de recherche, de partenaires techniques à travers le mouvement et avec les communautés techniques via Phabricator. Les contributions au volet commercial du projet suivront un schéma similaire. Nous continuerons à recueillir des commentaires via des entretiens et des panels, ainsi que des commentaires sur Meta conformément à nos principes.

Détails techniques

Pour plus d'informations sur le fonctionnement du produit, consultez la page d'accueil de la documentation sur MediaWiki.org

Au fil du temps, le « produit » proposé se développera et s'améliorera.

La version Q4 2021 (mai / juin 2021) des API d'entreprise propose ce qui suit:

Type Nom À comparer à Description Nouveautés
Contenu en temps réel API Enterprise « Déluge » EventStream HTTP API Un flux HTTP stable et push de l'activité en temps réel sur les projets WMF basés sur du texte
  • Pousser les modifications vers le client avec une connexion stable
  • Filtrer par projet et par type de page
  • Être averti en temps réel de vandalisme possible
  • Schéma JSON lisible par machine et cohérent
  • Disponibilité garantie, pas de limitation de débit
API Enterprise de contenu structuré API Restbase Version récente et lisible par les machines du contenu de tous les projets WMF basés sur du texte
  • Schéma JSON lisible par machine et cohérent
  • Disponibilité garantie, pas de limitation de débit
Contenu en masse API Enterprise de contenu en masse Dumps Wikimedia Exportations de données WMF récentes et compressées pour l'ingestion de contenu en masse
  • Schéma JSON lisible par machine et cohérent
  • Exportations quotidiennes de corpus entier
  • Exportations d'activité toutes les heures
  • Distribution garantie
  • Historique des versions disponibles au téléchargement

Accès

Pour obtenir l'accès aux données de l'API Enterprise, il existe trois méthodes:

  • Accès payant
    • Contenu en masse et en temps réel. Via le site Web dédié au produit API Enterprise, lors de son lancement.
  • Accès gratuit
  • Contenu en masse. Une mise à jour des données de l'API Enterprise sera disponible pour tous sur https://dumps.wikimedia.org/ toutes les deux semaines

** Contenu en temps réel. L'équipe de Wikimedia Enterprise travaille avec l’équipe Wikimedia Technical Engagement pour ajouter un support communautaire gratuit via les services cloud d'ici juin 2021.

Une capture d'écran du tableau de bord alpha (lorsque le projet était surnommé « Okapi ») où les utilisateurs peuvent télécharger et enregistrer les exportations quotidiennes de HTML à partir de projets Wikimedia basés sur du texte

Équipe

De plus, [$S&F Speed & Function] fournit des services d’ingénierie sous contrat. À ce stade précoce du projet, nous ne sommes pas encore sûrs des besoins d'ingénierie à long terme et nous souhaitons évaluer en profondeur la capacité des projets à devenir autonomes. De cette façon, nous ne perturbons pas excessivement d'autres projets WMF ou ne détournons pas de ressources.

Le conseil d'administration de la société LLC supervisant le projet sous la direction de la fondation Wikimedia est composé de : Grant Ingersoll, Directeur technique; Lisa Seitz-Gruwell, Directrice de l'avancement, Tony Sebro, Avocat général adjoint; et Lane Becker.

Au final, la société LLC est soumise à la gouvernance du conseil d'administration de la Wikimedia Foundation.

The LLC's legal registration can be found at the State of Delaware, Division of Corporations, Entity name: Wikimedia, LLC, File number: 7828447.

See also: FAQ § Legal

Voir aussi

  • API:Main page – la liste centrale de toutes les API de Wikimedia.
  • Wikitech: portail de services de données — Une liste de services destinés à la communauté qui permettent un accès direct aux bases de données et aux dumps de bases de données, ainsi que des interfaces Web pour les requêtes et l'accès automatisé aux bases de données.
  • Hub Enterprise — une page pour ceux qui souhaitent utiliser le logiciel MediaWiki dans des contextes d'entreprise:
    • MediaWiki Stakeholders group - une organisation affiliée indépendante qui défend les besoins des utilisateurs de MediaWiki en dehors de la Wikimedia Foundation, y compris les entreprises commerciales.
    • Enterprise MediaWiki Conference — une série de conférences indépendantes pour cette communauté.