Wikimedia Enterprise/Assaig

From Meta, a Wikimedia project coordination wiki
Jump to navigation Jump to search
This page is a translated version of the page Wikimedia Enterprise/Essay and the translation is 100% complete.
Wikimedia Enterprise
Wikimedia Enterprise logo.svg
Construint noves oportunitats tant per a la generació d'ingressos com per a la difusió gratuïta del coneixement a través dels convenis i dels ingressos obtinguts.
enterprise.wikimedia.com
ProjectePortadaPrincipis
Preguntes freqüents & Assaig (març 2021)
TècnicMediaWikiActualitzacionsPhabricatorGit
Documentació API
Aquest assaig sobre l'API de Wikimedia Enterprise
va ser escrit pel seu equip i representa les seves opinions i les de la Fundació Wikimedia. Publicat el març de 2021.


En anglès, la paraula "free" té dos significats, que en català són dues paraules molt diferents: lliure i gratuït.

Els projectes de Wikimedia són, sempre ho han estat i sempre romandran lliures. Els principis de les obres culturals lliures signifiquen que qualsevol persona pugui utilitzar Wikimedia sense restriccions, inclús comercialment. Com a moviment, ho acceptem. És per això que rebutgem les llicències no comercials, ja que limitarien els tipus de reutilització possibles. I és per això que considerem la reutilització comercial com un mitjà important de distribució de coneixement al públic.

Igualment, els projectes Wikimedia són, han estat i seran sempre gratuïts. La capacitat d'accedir lliurement al coneixement disponible a tots els projectes de Wikimedia sempre ha estat el nucli de la missió de la Fundació i del moviment. Proporcionem aquest accés no només a les persones que visiten els nostres llocs web, sinó també a les màquines programades perquè el nostre contingut pugui ser reutilitzat en altres entorns. El corpus complet del contingut de Wikimedia sempre ha estat, i continuarà estant, disponible per a la seva reutilització en diverses formes (incloent-hi, però no limitant-se, a bolcats de bases de dades, API i scraping) sense cap cost.

Com a resultat, el nostre contingut és reutilitzat amb freqüència per organitzacions comercials que en depenen per donar sostenir els seus models de negoci, i que en conseqüència, n'obtenen ingressos. Fora de les donacions corporatives voluntàries a la Fundació Wikimedia, el moviment no ha rebut beneficis de cap d'aquests ingressos a través de la inversió de retorn. Tot reconeixent aquest fet, sota el títol d'Augmentar la sostenibilitat del moviment, el procés d'Estratègia del Moviment va demanar a la Fundació Wikimedia que explorés, entre altres coses, "API a nivell empresarial [...] models per als reutilitzadors comercials a escala empresarial, tot intentant evitar les dependències dels ingressos o una altra influència externa indeguda en el disseny i desenvolupament del producte". A més, sota el títol Millorar l'experiència d'usuari, una altra recomanació deia: "Fer que el conjunt d'API de Wikimedia sigui més complet, fiable, segur i ràpid, en col·laboració amb els usuaris a gran escala on s'alineï amb la nostra missió i principis, per millorar l'experiència d'usuari tant dels usuaris directes com indirectes, augmentar l'abast i la capacitat de descobriment del nostre contingut i el potencial de retorn de dades, i millorar el coneixement i la facilitat d'atribució i verificabilitat per als reutilitzadors de contingut".

L'equip del projecte Enterprise està desenvolupant un nou recurs adreçat als reutilitzadors de continguts amb ànim de lucre, que tenen requisits de producte, servei i sistema que van més enllà del que oferim gratuïtament. Utilitzar aquesta oferta no serà necessari per a reutilitzar continguts comercials; les empreses poden seguir utilitzant les eines actuals disponibles sense cap cost. Tots els ingressos de l'API Enterprise s'utilitzaran inequívocament per donar suport a la missió de Wikimedia, per exemple, per finançar els programes de Wikimedia o ajudar a augmentar la dotació dels projectes.

Aquest projecte representa un nou tipus d'activitat a la Fundació. El projecte es troba en una fase molt primerenca que s'ha de considerar un període d'aprenentatge. Tindrem èxits, cometrem errors i haurem d'adaptar les nostres estratègies. L'equip es compromet a escoltar, participar en diàlegs i, en la mesura del possible, integrar els comentaris que rebem sobre el nostre treball. Aquest document és orgànic i reflecteix el pensament actual de l'equip; estem intentant documentar tot el treball possible de forma oberta. Fins ara, el nostre treball ha estat modelat per una sèrie d'entrevistes inicials amb membres de la comunitat, la Junta Directiva i el personal de la Fundació Wikimedia, investigadors i reutilitzadors de contingut.

Reutilitzadors comercials de Wikimedia

Més enllà de la lectura normal de les pàgines, l'accés al contingut de Wikimedia per part dels reutilitzadors s'aconsegueix actualment a través de tres grans mitjans: scraping de pàgines web; bolcats de dades; i API. Aquests serveis es proporcionen lliurement a tots els usuaris que reutilitzin contingut de Wikimedia. Són i seguirant sent lliures i gratuïts per a tothom.

Les entitats amb ànim de lucre de gran volum, les iniciatives independents més petites i els reutilitzadors voluntaris individuals confien en els mateixos serveis i el mateix ample de banda, al qual s'accedeix al mateix temps i amb els mateixos límits de tarifes i freqüència d'actualització. El que moltes de les organitzacions tecnològiques comercials més grans necessiten per utilitzar eficaçment el contingut de Wikimedia va més enllà del que oferim actualment. En conseqüència, cadascuna d'aquestes grans empreses reconstrueix de forma independent projectes interns de Wikimedia per abordar els seus casos d'ús molt similars. Aquesta important inversió no només suposa un esforç duplicat, sinó que també representa recursos invertits dins de cada empresa en lloc de donar suport a la pròpia Wikimedia o a l'ecosistema de coneixement lliure més ampli.

Alguns exemples coneguts de reutilització comercial de contingut de Wikimedia de gran volum són:

  • Les infotaules o gràfics de coneixement mostrats en els resultats dels cercadors.
  • Assistents virtuals operats per veu, com ara Siri i Alexa.
  • Informació augmentada proporcionada a mapes digitals, com ara sistemes d'entreteniment a bord o telèfons intel·ligents.

L'API de Wikimedia Enterprise és un nou servei centrat en casos d'ús de reutilitzadors de projectes de Wikimedia amb ànim de lucre, que poden utilitzar-se a escala i pels quals se'ls cobrarà.

Per què el canvi?

Sostenibilitat

El procés d'estratègia del moviment Wikimedia ha dut a una direcció estratègica que estableix els reptes finals que volem intentar resoldre. El moviment pretén oferir una plataforma que proporcioni coneixement obert al món, en qualsevol mitjà, eliminant les barreres socials, polítiques i tècniques que impedeixen la creació i l'accés al coneixement lliure. És un repte enorme. Hi ha buits tecnològics que hem de resoldre, buits de coneixement que hem d'omplir i buits en l'accés al coneixement per solucionar. Complementen la direcció estratègica les recomanacions d'estratègia del moviment en què diversos centenars i possiblement milers de persones que han invertit el seu temps i energia, aborden les maneres per afrontar els reptes als quals ens enfrontem per treballar cap a la direcció estratègica.

Des de la perspectiva dels recursos, es tracta de configurar el moviment per prosperar durant les properes dècades, resistir qualsevol tempesta i tenir una oportunitat real per assolir la missió concebuda per primera vegada fa 20 anys. Necessitarem més recursos, més socis i més aliats si assolim els objectius implícits en la nostra declaració de visió i la direcció estratègica del 2030. La clau serà assegurar-se que el suport sigui divers, sense restriccions i fora de cap influència directa del programa. Per això, és important assegurar-se que el moviment es pugui mantenir a si mateix tant ara com per al futur a perpetuïtat.

En conseqüència, una de les recomanacions de l'estratègia del moviment sol·licita específicament la creació del que ara es coneix com a API de Wikimedia Enterprise:

Explorar noves oportunitats tant per a la generació d'ingressos com per a la difusió gratuïta del coneixement a través de col·laboracions i ingressos obtinguts [...] Construir una API a nivell empresarial [...] Implicar els socis en el desenvolupament sempre que sigui apropiat, tot incorporant les necessitats d'un espectre de petits reutilitzadors no comercials, i de corporacions més grans. Explorar tarifes o models de sostenibilitat per als reutilitzadors comercials a escala empresarial, i intentar evitar dependències d'ingressos o altres influències externes indegudes en el disseny i desenvolupament del producte. Desenvolupar les mesures de seguretat adequades per garantir un accés lliure i sense restriccions per a usos no comercials, de recerca i per a usos comercials petits i moderats. — Recomanacions d'estratègia, Millorar la sostenibilitat del moviment

Autofinançament

Atendre les necessitats d'un grup de reutilitzadors intensius de contingut de Wikimedia és ambiciós. Aquestes necessitats són vàlides. No obstant això, utilitzar els recursos financers existents de la Fundació Wikimedia per respondre a aquestes necessitats suposaria subvencionar les necessitats de desenvolupament de programari d'algunes de les organitzacions comercials més grans del món amb diners de donants. L'API de Wikimedia Enterprise ho evita mitjançant l'autofinançament.

El fet que el servei de l'API Enterprise s'autofinanci permet contractar assistència per als clients sense necessitat de reduir els recursos financers existents per donar suport a les necessitats dels lectors i editors voluntaris. A la llarga, això allibera la infraestructura i el personal existents de Wikimedia per centrar-se en les necessitats de la comunitat i el moviment. Els costos de desenvolupament de la plataforma Enterprise, el manteniment continu i les despeses addicionals que se'n derivin quedaran totalment coberts per aquests ingressos.

Mantenir la independència

La Fundació Wikimedia està finançada principalment per lectors de tot el món que donen una mitjana de 15 dòlars per respondre a les peticions a través de bàners i del correu electrònic. Aquest model de finançament ha ajudat el creixement de la fundació mantenint la nostra independència. Aproximadament 8 milions de lectors contribuiran a la Fundació Wikimedia aquest any. Volem ser molt clars: aquest és el millor i més important suport que rep el moviment. Ens dóna independència i ens manté alineats al servei dels nostres lectors. No permetrem ni esperem que els ingressos de l'API de Wikimedia Enterprise eclipsin el generós suport que rebem dels nostres donants. Si es converteix en una font d'ingressos important, tornarem a la comunitat per discutir maneres d'aïllar la Fundació Wikimedia de la influència que en podria derivar.

També és fonamental adonar-se que el model de petites donacions depèn parcialment del trànsit d'escriptori i mòbil. Tot i que l'accés global a Internet continua creixent, els lectors de Wikimedia s'han mantingut estàtics durant els darrers anys. Un dels canvis més importants és que una proporció cada vegada més important d'interaccions amb el contingut de Wikimedia ja no es troba als propis llocs web de Wikimedia. Des del 2015, la Fundació Wikimedia va identificar aquest canvi com una cosa que podria afectar greument la capacitat del moviment per mantenir-se en la seva tasca a llarg termini i en l'actualitat. Com que més gent accedeixi al contingut de Wikimedia més enllà dels nostres propis llocs web (sovint a través de serveis que l'API Enterprise pretén donar suport), és important diversificar les fonts de finançament del moviment. Això augmentarà la resistència del moviment Wikimedia en cas que disminueixi el trànsit a wikipedia.org. Per tant, el projecte contribueix a garantir la sostenibilitat financera del moviment.

Assegurar inversió comercial en el coneixement lliure

És important assegurar-se que les grans organitzacions amb ànim de lucre reconeguin el valor que aporta Wikimedia al seu producte. Els reutilitzadors de gran volum confien cada vegada més en els projectes de Wikimedia, així com en la comunitat de voluntaris de Wikimedia que crea i cura aquests continguts, alhora que es fa cada vegada més rendible. Parlant de les donacions d'empreses, Katherine Maher va afirmar el 2019: "Volem que la gent de tot el món utilitzi, comparteixi, afegeixi i remescli la Viquipèdia [...] Al mateix temps, animem les empreses que utilitzen el contingut de Wikimedia a retornar-ho en esperit de sostenibilitat". Permetre que els usuaris reutilitzadors amb ànim de lucre a gran escala tinguin una relació contractual amb Wikimedia Enterprise significa que, a mesura que augmenti la seva dependència amb Wikimedia, la seva inversió en el moviment Wikimedia augmentarà proporcionalment. Això augmentarà els ingressos disponibles per al moviment Wikimedia per invertir en les recomanacions d'estratègia del moviment, en la nostra direcció estratègica per al 2030 i en Wikimedia Endowment, cosa que garanteix la sostenibilitat a llarg termini dels projectes de Wikimedia. També s'assegurarà que les donacions dels nostres lectors no s'utilitzaran per cobrir les despeses de grans empreses reutilitzadores. Pagaran el seu propi camí i també contribuiran als béns comuns culturals i intel·lectuals de la humanitat.

Quins serveis necessiten els reutilitzadors comercials?

L'API Enterprise es centra en els reutilitzadors de contingut de Wikimedia que volen reutilitzar la totalitat o la majoria del nostre contingut en un entorn amb ànim de lucre. La nostra hipòtesi actual és que aquests usuaris reutilitzadors tenen quatre necessitats immediates d'un servei que admet la reutilització de contingut a gran escala: fiabilitat del sistema, freqüència alta o accés en temps real, integritat del contingut i llegibilitat per màquina. Actualment, oferim alguns d'aquests serveis, però de forma fragmentada i desconnectada. Reunir-los en una plataforma única que ofereixi una millor experiència d'usuari és l'objectiu immediat del projecte Wikimedia Enterprise.

Fiabilitat del sistema

Els usuaris que reutilitzen un volum elevat solen utilitzar el nostre contingut de manera fonamental per fer funcionar els seus serveis. Això significa que la fiabilitat dels seus sistemes i serveis depèn en certa mesura de la fiabilitat dels nostres. Actualment, moltes de les nostres API i serveis de dades (API EventStreams i bolcats) no estan dissenyats tenint en compte els casos d'ús a gran escala dels reutilitzadors amb finalitats de lucre. Els usuaris reutilitzadors amb ànim de lucre esperen que no només hi hagi disponible un volum de contingut extremadament elevat amb una alta fiabilitat del sistema, sinó el més important, una garantia contractual d'aquesta fiabilitat. L'API de Wikimedia Enterprise té com a objectiu proporcionar aquestes garanties de serveis, tot oferint una manera per tal que les entitats i serveis amb ànim de lucre tinguin més confiança en incorporar contingut de Wikimedia en entorns crítics per al negoci.

En aquesta primera etapa del projecte, on la direcció i l'èxit a llarg termini continuen sent incerts, estem construint aquest servei en una infraestructura al núvol (AWS) de propietat i explotació externa juntament amb enginyers contractats. Això garanteix que la nostra pròpia infraestructura i el nostre personal no es vegin carregats ni afectats pel requisit contractual de fiabilitat del sistema que només afecta un nombre molt reduït de reutilitzadors amb finalitats de lucre. També garanteix que els diners dels donants es gastin en la pròpia infraestructura de Wikimedia i que no s'utilitzin per subvencionar els requisits tècnics de les principals empreses.

Freqüència alta o accés en temps real

L'accés a serveis massius de dades a Wikimedia actualment està disponible a través dels nostres bolcats SQL/XML cada quinze dies, mitjançant l'scraping HTML directe de l'usuari i consultant les API de Wikimedia. La selecció d'actualitzacions immediates, com ara els canvis recents, també es pot accedir a través de l'API EventStreams. Proporcionar accés al conjunt de dades de Wikimedia a una cadència més ràpida permetria als reutilitzadors de contingut més flexibilitat a l'hora de fer servir les nostres dades per adaptar-se a les necessitats del seu cas d'ús específic.

Integritat del contingut

Per a certs tipus de contingut de Wikimedia, pot haver-hi tensió entre el contingut recent i el contingut revisat per la comunitat. De vegades, el contingut més recent és més susceptible a vandalismes, informació falsa o desinformació, en comparació amb el contingut que ha estat exposat a diverses hores o dies de visibilitat i a revisió per part de la comunitat.

Segons el seu context de reutilització, alguns reutilitzadors tenen preferència per l'actualitat (com ara un investigador que busca examinar l'estat d'un projecte concret en un moment concret del temps), mentre que d'altres tenen preferència per la precisió (com ara un motor de cerca que vol proporcionar resums biogràfics de persones notables). Oferir una metodologia per la qual els reutilitzadors de contingut puguin escollir accedir al tipus de contingut que necessiten és fonamental per donar suport a una àmplia gamma de casos de reutilització de contingut.

Estructura

Els reutilitzadors de contingut ja fan un ús significatiu del contingut de tots els projectes de Wikimedia, però la manera d'utilitzar, processar i integrar cada projecte (i edició lingüística) per part dels reutilitzadors del corpus complet és única en cada cas: diferents metodologies, diferents formats i diferents freqüències pertanyen a cada cas. Això és en part el resultat de la naturalesa desestructurada de molts dels nostres projectes, però també es deu a pràctiques editorials i opcions de presentació que difereixen fonamentalment de wiki a wiki. Tot i que aquest aspecte fa que Wikimedia sigui increïblement útil, també crea reptes per als usuaris que reutilitzen el corpus complet.

Augmentar el contingut i les dades de Wikimedia per posar una estructura addicional darrere del nostre contingut no estructurat permetrà que els usuaris de contingut s'adaptin més fàcilment als seus requisits individuals, alhora que ens permetrà proporcionar més entrades, incloses les atribucions, llicències i qualitat del contingut, tot en un sol lloc.

L'API de Wikimedia Enterprise no afectarà directament a Wikidata ni al Servei de Consultes (WDQS). A més, en aquesta fase de desenvolupament, l'API Enterprise no proporciona dades de Wikidata ni de Wikimedia Commons. Tot i que el WDQS és un servei important per als reutilitzadors massius de Wikidata per basar els seus gràfics de coneixement, actualment els objectius de l'API Enterprise se centren en la transmissió de contingut gairebé en temps real, que és un servei diferent al del WDQS. Finalment, algunes dades que els clients de l'API Enterprise obtenen mitjançant el WDQS, ara es poden obtenir mitjançant l'API, cosa que pot fer disminuir l'ús del servei WDQS.

Per a què es cobrarà als usuaris de l'API Enterprise?

Basant-nos en entrevistes amb usuaris actuals i potencials clients, estem identificant què necessiten més els reutilitzadors, què estan disposats a pagar i què podem oferir. És probable que la majoria d'elements es proporcionin com a part d'un contracte comercial conegut com a acord de nivell de servei (SLA) amb els usuaris de l'API de Wikimedia Enterprise. Aquest contracte estarà relacionat amb aspectes com la freqüència d'actualitzacions de dades, la fiabilitat [temps d'activitat] del servei i la disponibilitat d'assistència tècnica.

El format del contingut de Wikimedia proporcionat als clients de l'API de Wikimedia Enterprise s'adaptarà més a les necessitats específiques d'ús a gran escala. Això podria incloure l'agrupació i filtratge de múltiples sortides de l'API [disponibles públicament] en un únic "paquet" de contingut, la revisió del contingut de Wikimedia en una sortida diferent (per exemple, HTML en lloc de Wikitext) i la durada del contracte per accedir al servei.

Com que aquest projecte encara es troba en una fase inicial, encara s'està investigant el model de negoci específic i els nivells de preus més adequats. De la mateixa manera, estem explorant la manera més eficaç i eficaç perquè la Junta de la Fundació Wikimedia ho supervisi com a part de les seves responsabilitats de govern estàndard.

A mesura que ho desenvolupem i ajustem en funció dels comentaris, hem elaborat una llista de principis operatius de Wikimedia Enterprise per orientar les seves activitats com a projecte i ajudar a determinar què poden fer els clients amb ànim de lucre.

Accés gratuït per a alguns usuaris

L'API Enterprise està dissenyada per ser utilitzada per clients amb ànim de lucre amb gran volum, però permetrà l'accés gratuït d'alguns usuaris, en els casos en què les API existents no satisfacin necessitats específiques. Altres organitzacions tecnològiques ofereixen tipus similars d'exempcions d'accés lliure als seus serveis de pagament; per exemple, Github Premium està disponible gratuïtament per a organitzacions sense ànim de lucre.

L’equip de Wikimedia Enterprise treballa amb Wikimedia Technical Engagement per afegir assistència gratuïta a la comunitat a través de serveis al núvol abans del juny del 2021. Mentrestant, l'accés als serveis de l'API Enterprise es proporcionarà sense cap cost en casos d'ús que estiguin relacionats amb: la missió de Wikimedia (especialment quan l'ús no és comercial o té accés obert); que requereixen serveis de dades d'alta freqüència no servits per les API existents o els bolcats de bases de dades. La investigació acadèmica i els serveis sense ànim de lucre alineats a la missió són dos d'aquests casos potencials. Els voluntaris i investigadors que vulguin sol·licitar accés gratuït han de contactar directament amb l'equip.

Com s'estructurarà legalment?

De moment, amb l'aprovació de la Junta de la Fundació Wikimedia, la Fundació Wikimedia ha creat una societat de responsabilitat limitada (LLC) als Estats Units, d'un sol membre, per proporcionar aquests serveis. L'ús de filials per part d'organitzacions sense ànim de lucre madures és comú fins i tot dins de FLOSS i del coneixement lliure:

  • Creative Commons té una filial canadenca a efectes contractuals quan opera al Canadà.
  • La Fundació Mozilla una filial de propietat exclusiva amb finalitats de lucre anomenada Corporació Mozilla i centrada en la generació d'ingressos.
  • La Fundació Linux té una sèrie de filials de propietat exclusiva per a diversos propòsits, inclosa la generació d'ingressos mitjançant la prestació de serveis de formació amb ànim de lucre.
  • L'Open Data Institute i l'Open Knowledge Foundation utilitzen ingressos amb finalitats de lucre per finançar les seves activitats.

Basant-nos en l'assessorament de l'equip legal de la Fundació, ens vam basar en l'estructura senzilla de l'LLC per permetre'ns provar aquest model de servei. Aquest enfocament hauria de limitar els costos d'inici i els requisits innecessaris d'informació del govern durant les primeres fases. L'estructura de l'LLC també aïllarà la Fundació dels passius generats pel servei. Dit això, segons la legislació dels Estats Units, la Fundació encara està obligada a difondre públicament els ingressos i les despeses de l'LLC a les nostres declaracions anuals d'impostos (trobeu aquí els informes financers auditats anteriors). A mesura que maduri el projecte, podem canviar l'estructura legal específica, però sempre conservarem els mateixos principis de funcionament. Això podria incloure el trasllat a una estructura legalment més robusta i permanent a llarg termini. L'LLC funcionarà sota els auspicis de la Fundació Wikimedia, tot el seu personal seran treballadors de la Fundació Wikimedia i, en última instància, està sotmesa al govern de la Junta Directiva de la Fundació Wikimedia.

Independentment de l'estructura legal, tots els ingressos de Wikimedia Enterprise s'utilitzaran de manera inequívoca per donar suport a la missió de Wikimedia, per exemple, per finançar programes de Wikimedia o ajudar a fer créixer Wikimedia Endowment.


Per facilitar el debat sobre qualsevol dels problemes plantejats en aquest assaig, l'equip de Wikimedia Enterprise organitzarà reunions en "hores d'oficina" i obertes regularment durant almenys la fase inicial de desenvolupament i continuarà estant disponible a través de canals de comunicació asíncrons (com ara la pàgina de discussió del projecte a Meta).