El personal y los contratistas de la Fundación Wikimedia participan junto con la comunidad de voluntarios en el mantenimiento del contenido de esta página.
Wikimedia Enterprise es un servicio de la Wikimedia Foundation, disponible a través de enterprise.wikimedia.com. La meta del servicio es ser a su vez cimiento de servicios para reutilizadores comerciales de alto volumen del contenido de Wikimedia. El servicio se anunció en marzo de 2021 (entrada de blog, artículo de Wired) y lanzado en octubre del mismo año (comunicado de prensa, artículo de OpenFuture).
El enfoque está en las organizaciones que quieren reutilizar el contenido de Wikimedia en otros contextos, proporcionando servicios de datos a gran escala, para que sean más rápidos y completos, fiables y seguros. Wikimedia Enterprise tiene como objetivo mejorar la experiencia de los usuarios de Wikimedia más allá de nuestros propios sitios web; aumentar el alcance y la capacidad de descubrimiento del contenido; y mejorar el conocimiento y la facilidad de atribución y verificabilidad por parte de las organizaciones que más reutilizan el contenido de Wikimedia, a través de servicios de autofinanciación.
Hay una barrera de entrada muy alta para el uso de los datos de Wikimedia, fuera de los casos de uso comunes de lectura o edición. Esto se debe a que el contenido es difícil de segmentar y comprender para máquinas, lo que a su vez afecta al alcance de los datos de Wikimedia más allá de nuestro propio ecosistema, y a la escala de impacto que puede tener.
En las recomendaciones de la Estrategia del Movimiento Aumentar la sostenibilidad de nuestro movimiento y Mejorar la experiencia del usuario están las recomendaciones de, respectivamente "Explorar nuevas oportunidades tanto para la generación de ingresos como para la difusión del conocimiento libre a través de asociaciones e ingresos ganados, por ejemplo... Construir APIs (interfaces de programación de aplicaciones) a nivel empresarial", y "Hacer que el conjunto de APIs de Wikimedia sea más completo, fiable, seguro y rápido, en alianza con usuarios a gran escala.... y mejorar la conciencia y la facilidad de atribución y verificabilidad para los reutilizadores de contenido."
Es bien conocido que unas cuantas empresas masivas utilizan los datos de nuestros proyectos. Esas empresas reconocen que sin los proyectos Wikimedia no podrían ofrecer una experiencia tan rica o fiable a sus propios usuarios. Hace tiempo que los miembros de la comunidad consideran que estas empresas deberían hacer más para reinvertir en las comunidades Wikimedia por los beneficios que obtienen del contenido y los recursos que utilizan.
Esto llevó a la idea de desarrollar un nuevo enfoque que sea más sostenible a largo plazo y que proporcione una relación mucho más clara entre Wikimedia y los usuarios empresariales. La mayor parte de los beneficios financieros para Wikimedia probablemente sólo provendrían de un número muy reducido de grandes usuarios comerciales, y retroalimentaría el movimiento Wikimedia.
A medida que esta idea se desarrollaba, quedó claro que existe la responsabilidad de democratizar nuestros datos para las organizaciones que no poseen los recursos de estos usuarios más grandes, para asegurar que estamos aplicando reglas de juego equitativas y ayudando a fomentar un Internet saludable sin reforzar los monopolios. Los beneficios de este servicio no deberían ser sólo para las start-ups o las alternativas a los gigantes de Internet, sino también para las universidades y los investigadores universitarios; los archivos y los archiveros; junto con el movimiento Wikimedia en general.
Visión general
Wikimedia Enterprise se centra en las empresas que reutilizan nuestro contenido, normalmente a gran escala, por ejemplo, integrado en gráficos de conocimiento, búsqueda, asistentes de voz, mapas, informes de noticias, herramientas comunitarias, aplicaciones de terceros y estudios completos de investigación. Aumentar los numerosos conjuntos de datos de Wikimedia para estructurar nuestros contenidos no estructurados permitirá a todos nuestros reutilizadores de contenidos satisfacer sus necesidades individuales, al tiempo que nos prepara para construir nuevas herramientas y servicios en el futuro, disponibles para todos. Los reutilizadores de nuestros contenidos buscan tres componentes fundamentales:
Frecuencia: Imágenes periódicas y actualizadas de los proyectos de Wikimedia
Fiabilidad: Infraestructura fiable y accesible
Calidad: una "buena versión más reciente"
Hacer hincapié en un conjunto autofinanciado de casos de uso específicos permite al equipo de la API de Wikimedia centrarse en los voluntarios, los equipos y las organizaciones que buscan acceder a nuestros conjuntos de datos (y, sobre todo, interactuar con ellos). Esto incluye la mayoría de las herramientas de edición de la comunidad, que estarán fuera del alcance de este proyecto. Para más información sobre las mejoras de las APIs de Wikimedia existentes, consulte la página del proyecto sobre la iniciativa "API Gateway".
Objetivos del programa:
Contenido: Poner a disposición de todos los investigadores y reutilizadores un mayor número de contenidos de nuestro movimiento en formatos coherentes y legibles por máquinas.
Carga de recursos: Reducir la necesidad de un raspado de sitios de alta intensidad por parte de los reutilizadores de mayor frecuencia y volumen, que actualmente se dirigen a nuestros servidores de producción.
Recaudación de fondos: Proporcionar una forma más clara y coherente para que los mayores reutilizadores reinviertan los beneficios derivados en el movimiento, en lugar de hacer donaciones altruistas ocasionales que varían en tamaño.
Comunidad
Contact the team if you would like to arrange a conversation about this service with your community, at a time and meeting software platform of your choice.
En inglés la palabra “free” tiene dos significados, que en español son dos palabras muy diferentes: Libre y Gratis.
Los proyectos Wikimedia son, han sido y serán siempre libres. Los principios de las obras culturales libres significan que cualquiera puede usar Wikimedia sin restricciones, incluso comercialmente. Como movimiento, aceptamos esto. Por eso rechazamos las licencias "no comerciales", ya que limitarían los tipos de reutilización posibles. Y por eso consideramos que la reutilización comercial es un medio importante para distribuir el conocimiento al público.
Igualmente, los proyectos Wikimedia son, han sido y serán siempre gratuitos. La capacidad de acceder libremente al conocimiento disponible en todos los proyectos de Wikimedia siempre ha sido el núcleo de la misión de la Fundación y del movimiento. Proporcionamos este acceso no sólo a las personas que visitan nuestros sitios web, sino también a las máquinas de forma programada para que nuestro contenido pueda ser reutilizado en otros entornos. El corpus completo del contenido de Wikimedia siempre ha estado, y continuará estando, disponible para su reutilización en varias formas (incluyendo, pero no limitándose, a volcados de bases de datos, APIs y scraping) sin costo alguno.
Como resultado, nuestro contenido es reutilizado con frecuencia por organizaciones comerciales que dependen de él para apoyar sus modelos de negocio, y que, en consecuencia, obtienen ingresos de él. Fuera de las donaciones corporativas voluntarias a la Fundación Wikimedia, el movimiento nunca ha recibido beneficios de ninguno de estos ingresos a través de la inversión de retorno. En reconocimiento de esto, bajo el título de Aumentar la sostenibilidad de nuestro movimiento, el proceso de la Estrategia del Movimiento pidió a la Fundación Wikimedia que explorara, entre otras cosas, "APIs a nivel empresarial... modelos para los reutilizadores comerciales a escala empresarial, teniendo cuidado de evitar las dependencias de los ingresos u otra influencia externa indebida en el diseño y desarrollo del producto". Además, bajo el título Mejorar la experiencia del usuario, otra recomendación decía: "Hacer que el conjunto de APIs de Wikimedia sea más completo, fiable, seguro y rápido, en colaboración con los usuarios a gran escala donde se alinee con nuestra misión y principios, para mejorar la experiencia del usuario tanto de nuestros usuarios directos como indirectos, aumentar el alcance y la capacidad de descubrimiento de nuestro contenido y el potencial de retorno de datos, y mejorar el conocimiento y la facilidad de atribución y verificabilidad para los reutilizadores de contenido."
El equipo del proyecto Enterprise está desarrollando un nuevo recurso dirigido a los reutilizadores de contenidos comerciales, que tienen requisitos de productos, servicios y sistemas que van más allá de lo que ofrecemos gratuitamente. El uso de esta oferta no será necesario para la reutilización de contenidos comerciales; las empresas pueden seguir utilizando las herramientas actuales disponibles sin costo alguno. Todos los ingresos de la API empresarial se utilizarán inequívocamente para apoyar la misión de Wikimedia, por ejemplo, para financiar los programas de Wikimedia o ayudar a aumentar la dotación de Wikimedia.
Este proyecto representa un nuevo tipo de actividad en la Fundación. El proyecto se encuentra en una fase muy temprana que debe considerarse un periodo de aprendizaje. Tendremos éxitos, cometeremos errores y tendremos que adaptar nuestras estrategias. El equipo se compromete a escuchar, participar en diálogos y, en la medida de lo posible, integrar los comentarios que recibamos sobre nuestro trabajo. Este documento es orgánico y refleja el pensamiento actual del equipo; estamos intentando documentar todo el trabajo posible de forma abierta. Hasta ahora, nuestro trabajo ha sido moldeado por una serie de entrevistas iniciales con miembros de la comunidad, la Junta Directiva y el personal de la Fundación Wikimedia, investigadores y reutilizadores.
Dada la naturaleza del proyecto, la toma de decisiones principal recaerá en la Fundación Wikimedia. Buscamos la opinión de la comunidad, en particular de la comunidad técnica y de aquellos que han participado en el proceso de estrategia, a lo largo de la vida del proyecto. Se ha recolectado información técnica de los colegas de la Fundación Wikimedia, de los socios de la industria y la investigación, de los socios técnicos de todo el movimiento y de las comunidades técnicas más amplias a través de Phabricator. Las aportes al componente de desarrollo de la financiación del proyecto seguirán un patrón similar. Seguiremos recopilando información a través de entrevistas de investigación y grupos de discusión, así como comentarios aquí en Meta de acuerdo con nuestros principios.
Acceso
Para obtener acceso a los conjuntos de datos de la API empresarial, existen tres métodos:
*Masivo y en tiempo real. A través del sitio web dedicado del producto Enterprise API, cuando se ponga en marcha.
Gratis
Creating an account via the Enterprise API product website includes 5,000 on-demand API requests that refresh monthly (including the Structured Contents endpoint) and twice-monthly snapshot API files in NDJSON format at no cost (refreshes on the 2nd and 21st of each month).
Several datasets are available outside of the WME website. An update of the Enterprise API data is provided for all every two weeks on the Wikimedia Dumps site. Several Beta datasets are also available on HuggingFace.
** En tiempo real.' El equipo de Wikimedia Enterprise está trabajando con Wikimedia Technical Engagement para añadir soporte gratuito a la comunidad a través de servicios en la nube para junio de 2021.
Those who have a non-commercial and mission-relevant use-case, which cannot be fulfilled by existing free-access APIs/dumps etc, can request expanded access to the API service at either reduced cost or no cost depending on usage and application.
Over time, the "API product" being offered will grow and improve. This information is accurate as of September 2024.
Overview
All of our APIs return the same structured JSON (or ND-JSON) response format making it easy to augment one API with another. Three APIs; same data, different retrieval methods:
Retrieve bulk data with the Snapshot API
Receive changes instantly with Realtime API streaming
Retrieve single articles with the On-demand API
API responses include article data such as summary, image, Wikidata QID, license, and more. Also included is data specific to the last revision, such as editor, size of change, and credibility score with revert probability.
On-demand API
Reusers that use an infrastructure reliant on the EventStream platform depend on services like RESTBase to pull HTML from page titles and current revisions to update their products. High-volume reusers have requested a reliable means to gather this data, as well as structures other than HTML when incorporating our content into their KGs and products.
The Wikimedia Enterprise On-demand API allows users to retrieve single articles from any Wikimedia project at anytime.
Make standard HTTP requests to retrieve documents by ID or name from all projects and languages, or use filters to limit response
Request the latest page data anytime to augment your Realtime or Snapshot API data
A wide range of commercial and consolidated schemas under SLAs
Realtime API
High-volume reusers currently rely heavily on the changes that are pushed from our community to update their products in real time, using EventStream APIs to access such changes. High-volume reusers are interested in a service that will allow them to filter the changes they receive to limit their processing, guarantee stable HTTP connections to ensure no data loss, and supply a more useful schema to limit the number of api calls they need to make per event.
The Enterprise Realtime API allows users to stream updates in real-time from any Wikimedia project.
Streaming: Receive streaming updates (firehose) of every change as they occur in real-time
Batch: Download compressed snapshot files of incremental updates every hour
Instant updates for new content, any edits, deletions, and breaking news events including community-curated visibility changes
Filtering of events by Project or Revision Namespace
A wide range of commercial and consolidated schemas under SLAs with guaranteed connections
Snapshot API
For high volume reusers that currently rely on the Wikimedia Dumps to access our information, we have created a solution to ingest Wikimedia content in near real time without excessive API calls (On-demand API) or maintaining hooks into our infrastructure (Realtime).
The Enterprise Snapshot API allows users to retrieve entire Wikimedia projects as a database dump file.
Download a compressed file containing everything in any project, in any language
Article body in HTML as well as Wikitext
Up to a daily snapshots cadence
24-hour JSON, Wikitext, or HTML compressed dumps of "text-based" Wikimedia projects
A hourly update file with revision changes of "text-based" Wikimedia projects
A wide range of commercial and consolidated schemas under SLAs
SLA and Support
Contracted accounts receive 99% SLA and support response time guarantees. All accounts have access to our introductory onboarding resources and help center faqs.
Equipo
El personal de la Wikimedia Foundation que se dedica en exclusiva a este proyecto es:
Many people from different teams also contribute significantly, including from the WMF Legal, Engineering, Partnerships, Design, Communications teams etc. Additional contract work provided by: PartnerHero provide customer support services; Vuurr are assisting our sales process; and Super Natural Design are the designers of the project website.
Gobernanza
La junta de la LLC que supervisa el proyecto desde la dirección de la Fundación Wikimedia son: Grant Ingersoll, Director Técnico; Lisa Seitz-Gruwell, Directora de Promoción, Tony Sebro, Consejero Legal General Adjunto; y Lane Becker.
En última instancia, la LLC está sujeta al gobierno del Consejo Directivo de la Fundación Wikimedia.
All reports and official documents of the LLC are published on a dedicated Wikimedia Enterprise page on the Wikimedia Foundation Governance website. For convenience, annual reports are also linked here:
Initial Wikimedia Foundation Diff blogpost note: media stories listed below are written and published independently and were neither pre-reviewed nor approved by the WMF
Wikitech: Portal de servicios de datos - Una lista de servicios orientados a la comunidad que permiten el acceso directo a las bases de datos y a los volcados, así como interfaces web para la consulta y el acceso programático a los almacenes de datos.
Enterprise hub - una página para aquellos interesados en utilizar el software MediaWiki en contextos corporativos:
MediaWiki Stakeholders group - una organización afiliada independiente que defiende las necesidades de los usuarios de MediaWiki fuera de la Fundación Wikimedia, incluyendo las empresas comerciales.