Wikimedia Enterprise/FAQ

From Meta, a Wikimedia project coordination wiki
Jump to navigation Jump to search
This page is a translated version of the page Wikimedia Enterprise/FAQ and the translation is 66% complete.
Other languages:
Deutsch • ‎English • ‎català • ‎español • ‎français • ‎italiano • ‎русский
Wikimedia Enterprise
enterprise.wikimedia.com
ProjectMain pagePrinciples
Essay & FAQ (March 2021)
TechnicalMediaWikiPhabricator
GitAPI Documentation

Queste FAQ su Wikimedia Enterprise API sono state pubblicate a marzo 2021.

Quelle che seguono delle brevi risposte alle domande più comuni. Per maggiori dettagli o contesto su qualsivoglia argomento, per favore leggete la presentazione, i principi o la documentazione tecnica. Il progetto era originariamente noto come “Okapi”.

Domande generali

Che cos’è?

Wikimedia Enterprise è primariamente una API per contenuti Wikimedia progettata per i requisiti di volumi, velocità e affidabilità elevati di organizzazioni molto grandi, che utilizzano i contenuti Wikimedia nei loro servizi commerciali. Questo servizio verrà fornito con una garanzia contrattuale (un “Accordo sul Livello di Servizio” o “Service Level Agreement” o “SLA”) per i clienti paganti.

Questo avrà effetti su di me come utente o possessore di un bot?

No. Tutto questo non influirà sulle vostre attività di modifica, fatte con le vostre utenze o con i bot. Tutte le API pre-esistenti continueranno a essere disponibili.

L’Enterprise API avrà effetti sui dump e sulle API attuali?

No. Il sistema di dump del database e di API forniti gratuitamente rimane in piedi e continua a essere supportato. Nessun API o dump viene rimossa o modificata a seguito dell’esistenza della nuova API e continuerà a ricevere supporto e sviluppo. Infatti, indipendentemente dalla specifica Enterprise API, il sistema di API esistente è attualmente in fase di rinnovamento per fornire una migliore esperienza nell'ambito dell'iniziativa “API Gateway”. Parte del motivo per cui l'Enterprise API viene costruita separatamente è dovuta proprio al non voler danneggiare il sistema esistente.

Perché si chiama “Enterprise”?

L’API e il progetto in precedenza si chiamavano “Okapi”: si trattava di un nome temporaneo, utilizzato finché non è stato definito il nome ufficiale. Un okapi è un bellissimo mammifero africano, che conteneva le lettere “a-p-i” nel suo nome e che è stato scelto per questo motivo. Il nome “Wikimedia Enterprise” (e “Enterprise API”) sono stati scelti per chiarire da subito chi sono i destinatari del servizio: le organizzazioni a scopo di lucro. Uno dei criteri importanti per la selezione di questo nome era che non implica che il contenuto dell’API sia commerciale o esclusivo o che le API esistenti stessero cambiando. Il nome “Enterprise API” appare anche nella strategia del movimento e quindi è coerente con l'utilizzo precedente nel movimento. Infine, era importante trovare un nome che non interferisse con i nomi esistenti di siti web, affiliati, progetti e team di Wikimedia.

Il progetto, e le API, non devono essere confusi con il MediaWiki Stakeholders group o la Enterprise MediaWiki Conference - rispettivamente, un'organizzazione indipendente affiliata a Wikimedia che difende i bisogni degli utenti MediaWiki al di fuori della Wikimedia Foundation, comprese le imprese commerciali, e una serie di conferenze per quella comunità.

Avrà effetti diretti sui contenuti Wikimedia?

No. Questa API permette l’accesso e il riuso di grandi volumi e a grande velocità di contenuti Wikimedia. Non ha nessun tipo di controllo editoriale o tecnico sui contenuti dei progetti Wikimedia. Ovviamente, coerentemente con i diritti garantiti dal framework di licenza culturale libera di Wikimedia, i riutilizzatori di Wikimedia possono creare opere derivate dai contenuti.

Accedendo ai contenuti di Wikimedia attraverso questo nuovo singolo metodo di importazione e firmando un contratto SLA per esso, saremo in grado di garantire che i riutilizzatori su larga scala siano più coerenti e accurati con la visualizzazione dell'attribuzione e delle licenze di copyright per i contenuti Wikimedia. Qualsiasi riduzione nella ripubblicazione involontaria di vandalismi da parte di riutilizzatori su larga scala va a vantaggio della comunità: rafforza la reputazione della nostra comunità nella cura di contenuti affidabili e riduce la posta in gioco per i membri della comunità dediti alla lotta contro i vandalismi. Nel tempo, il team di Wikimedia Enterprise spera di creare meccanismi per aiutare i riutilizzatori a ridurre la probabilità che inseriscano contenuti vandalici nei loro prodotti. Se questo lavoro si tradurrà in un migliore rilevamento dei vandalismi, eventuali lezioni apprese e/o codice sviluppato verranno condivisi con la comunità al fine di migliorare strumenti e flussi di lavoro e, di conseguenza, migliorare l'integrità della conoscenza.

Sul lungo termine, il team di Wikimedia Enterprise spera anche di esplorare metodi con cui nuove informazioni (ad esempio “microcontribuzioni”) potranno essere fornite ai progetti Wikimedia dal pubblico che utilizza prodotti realizzati dai clienti di Wikimedia Enterprise. Ciò è in accordo con la raccomandazione sulla strategia di movimento Improve User Experience che parla dell'utilizzo delle API per “...il potenziale di ritorno dei dati”. A quel punto, verrà effettuata un'adeguata consultazione della comunità per garantire che tali contributi possano essere richiesti in risposta alle effettive esigenze della comunità e in un modo conforme alla cultura editoriale di Wikimedia, alla politica sulla privacy, ai termini di utilizzo, ecc.

Will this stop errors/vandalism from appearing in search engine results

It will help.

By making a more consistent Wikimedia content-ingestion process for third-party organisations who operate at high scale and high speed, it will reduce the likelihood that they display vandalism and/or reduce the duration that it is displayed. The API feeds will not include exclusive vandalism detection features unavailable to the public, but it will enable existing signals to be more accessible to our reusers (such as ORES scores and the frequency with which an article is currently receiving edits). This will enable Enterprise's customers to have more tools at their disposal in order to make decisions for what to display and when.

Consistent with the principle of free-cultural-works, the Wikimedia Foundation does not control how reusers display Wikimedia projects' content, what context it is displayed, or with what other datasets it is combined. If you find an instance of Wikimedia content being used in an inappropriate context in a search engine result, its operator will have a procedure for providing feedback about it. By way of example, Google has a policy for "how to report a featured snippet".

In che modo questo si collega alla strategia del movimento?

Nelle raccomandazioni sulla strategia di movimento Increase the sustainability of our movement e Improve User Experience ci sono riferimenti, rispettivamente, a “Esplorare nuove opportunità sia per la generazione di entrate, sia per la diffusione gratuita della conoscenza attraverso partnership e ricavi ottenuti per esempio... costruendo API di livello aziendale” e “Rendere la suite di API Wikimedia più completa, affidabile, sicura e veloce, in collaborazione con utenti su larga scala... e migliorare la consapevolezza e la facilità di attribuzione e verificabilità per i riutilizzatori di contenuti”.

Sappiamo che, nel voto della comunità sulla priorità che avrebbero dovuto ricevere le raccomandazioni sul livello di attenzione, queste raccomandazioni sulle API erano piuttosto in basso nell’elenco. Riconosciamo e ci aspettiamo ampiamente che queste raccomandazioni non siano di interesse generale. Questa è un’attività che non impatta direttamente sulla comunità di utenti. Tuttavia, questa è una delle poche raccomandazioni a cui WMF è l’unica ad avere la possibilità esclusiva di rispondere. Questo significa che WMF può iniziare questo progetto immediatamente e indipendentemente da qualsiasi altra attività strategica senza interrompere, distogliere l'attenzione o ridurre la priorità del resto.

Allo stesso tempo, il miglioramento della nostra API contribuisce in modo significativo al nostro progresso verso la nostra direzione strategica e la nostra visione, contribuendo significativamente alla Conoscenza come Servizio e all’Equità della Conoscenza. Nelle parole della raccomandazione, ciò renderà “la suite di API di Wikimedia più completa, affidabile, sicura e veloce, in collaborazione con utenti su larga scala dove ciò è in linea con la nostra missione e i nostri principi”, migliorerà “l'esperienza dei nostri utenti sia diretti, sia indiretti, aumentare la portata e la rilevabilità dei nostri contenuti e il potenziale di restituzione dei dati e migliorare la consapevolezza e la facilità di attribuzione e verificabilità per i riutilizzatori di contenuti”.

Molte delle raccomandazioni strategiche implicano un aumento delle entrate in tutto il movimento: è una strategia ambiziosa e, in definitiva, costosa da attuare. Pertanto, la creazione dell'API Enterprise nei prossimi anni ci consente di sviluppare questo nuovo flusso di entrate, che aiuterà a supportare in modo sostenibile il resto di queste raccomandazioni.

Dove è stato discusso tutto questo in precedenza?

La Wikimedia Foundation ha offerto servizi di dati a pagamento sin dal suo inizio, fornendo feed per consentire a terzi di ospitare i propri database locali. La creazione di questo servizio è stato ciò che ha portato all'assunzione iniziale di Brion Vibber, ed è stato utilizzato per avviare la Wikimedia Foundation nei primi anni. Il servizio è stato chiuso a nuovi clienti nel 2010 e il servizio è stato definitivamente disattivato nel 2014, principalmente per mancanza di manutenzione.

La riconsiderazione di servizi di dati su larga scala per garantire il successo del movimento, indipendentemente dal cambiamento dei metodi di scoperta dei contenuti Wikimedia, è stata discussa come una possibile idea da esplorare nel 2015 e di nuovo [[[mailarchive:wikimedia-l/2016-January/081126.html|su Wikimedia-l nel 2016]]. L'idea è stata avanzata da due gruppi di lavoro durante la fase 2 del processo di strategia di movimento e il lavoro per migliorare l'utilizzo delle API da parte di terzi è stato identificato due volte nelle raccomandazioni strategiche finali (1, 2). L'inizio dei lavori sul progetto Enterprise API è stato annunciato nello specifico su Wikimedia-l a metà del 2020.

[Note: This FAQ was published in March 2021. At that time a Wikimedia blogpost was published, notices were placed in various mailinglists and on wiki, and many mainstream media stories covered it–most notably in WIRED. This resulted in significantly more community discussion on this talkpage, on central discussion hubs on many wikis, and in social media.]

Domande sulla parte finanziaria

Stiamo per caso “vendendo” o “costringendo Big tech a pagare” per Wikipedia?

No. Tutto il contenuto di Wikimedia è disponibile con licenza libera e può essere utilizzato da chiunque per qualsiasi scopo. Ciò non sarà e non può essere modificato. Il servizio Enterprise API è un nuovo metodo per fornire contenuti con volumi e velocità progettati specificamente per le esigenze delle principali organizzazioni commerciali che stanno già utilizzando i contenuti di Wikimedia commercialmente. L’Enterprise API sta vendendo come servizio questo nuovo metodo di accesso, ma non impedisce a nessuno (inclusi i potenziali clienti) di utilizzare i metodi di accesso gratuiti esistenti.

Molti governi e settori professionali (come quello giornalistico) in tutto il mondo stanno attualmente discutendo su come costruire un modello finanziariamente sostenibile mentre si lavora con “Big Tech”. La realizzazione della Wikimedia Enterprise API crea un modo per quelle organizzazioni commerciali che hanno costruito modelli di business dall'uso di contenuti Wikimedia disponibili gratuitamente per investire anche nel movimento Wikimedia in modo affidabile e continuo.

La community potrà accedere all’Enterprise API senza pagare?

Sì. Per l'accesso in blocco, verrà fornita una copia dell'output dell'API tramite il servizio di dump del database pubblico, aggiornato ogni due settimane. Questa è la stessa frequenza già fornita da altri dump XML.

Il team di Wikimedia Enterprise sta anche lavorando con Wikimedia Technical Engagement per aggiungere il supporto gratuito della comunità attraverso i servizi cloud entro giugno 2021. Nel frattempo, l'accesso può essere fornito su richiesta. Per i dettagli, vedere qui.

Come verranno spesi i soldi?

La direzione strategica che miriamo a raggiungere entro il 2030 richiede, tra gli altri obiettivi, un'espansione su larga scala nelle lingue meno servite in tutto il mondo, e ciò richiederà una crescita significativa dei ricavi. Oltre a coprire i costi del progetto stesso, tutti i fondi generati dai clienti Enterprise verranno utilizzati per supportare la mission di Wikimedia. Ciò include investimenti nei progetti Wikimedia, nella comunità, nelle nostre organizzazioni di movimento e in Wikimedia Endowment. In questi primi tempi, è difficile prevedere quando Wikimedia Enterprise raggiungerà la redditività ed è ancora più difficile prevedere con precisione quanto profitto produrrà nei prossimi anni. Una volta che avremo un quadro più chiaro dei tempi e della redditività, il Board della Fondazione potrà pianificare pianificare il modo in cui desidera investire i profitti per sostenere la missione. È probabile che ci voglia almeno un anno per tutto questo.

Quanti soldi sarà in grado di raccogliere questa iniziativa?

Unsurprisingly, this is one of the most important questions from a business-model perspective, and it is also impossible to answer in advance. Significant research has been undertaken to learn what the Enterprise API's potential customers need and want, which has informed the product development and, consequently, the estimates of potential revenue over time. One thing is clear: This will not replace our need to be funded by reader donations. In accordance with the Wikimedia Enterprise operating principle of financial independence, unrelated business income from Wikimedia Enterprise and other sources will not exceed 30% of the Wikimedia Foundation's total revenue. That means that at least 70% of funding will always come from donations and grants etc.

In accordance with the Wikimedia Enterprise operating principle of honesty and transparency we will publish overall revenue and expenses, differentiated from those of the Wikimedia Foundation in general, at least annually. We will also publish a periodically updated register of current for-profit customers whose contract is above the amount where financial gifts to the Wikimedia Foundation would require notice to the Board of Trustees.

Questa iniziativa avrà effetti sulle donazioni o sul fundraising?

No, the Wikimedia Foundation will continue to receive the vast majority of its support from readers. We believe this is important in order for Wikipedia to remain independent. Funding derived from millions of reader donations averaging $15 aligns us to the public interest. Revenue from Wikimedia Enterprise will supplement our reader support, but it will not eclipse it. The Enterprise API is a way for the corporate users who already profit from their reuse of Wikimedia content to contribute to the projects, as well.

Domande sulla parte tecnica

È open source?

Sì. Il codice si trova qui: https://github.com/wikimedia/OKAPI

Perché state utilizzando una infrastruttura cloud/AWS operata da terzi?

A major need for Wikimedia Enterprise is to have the ability to rapidly prototype and build solutions that could scale to the needs of the Enterprise API's intended customers. To do this, we have optimized for fast iteration, infrastructural separation from critical Wikimedia projects, and utilization of downstream Service Level Agreements (SLAs). At the start, external cloud services provide us with these capabilities. While there are many advantages of using an external cloud for our use case, we acknowledge there are also fundamental tensions,  given the culture and principles of how applications are built at the Foundation. The needs of the Enterprise API's potential customers are important for achieving our mission of making knowledge available to all people. However, using the Wikimedia Foundation's existing resources to develop products to respond to those needs would subsidize the hardware requirements of some of the world's largest for-profit organizations.

The Wikimedia Enterprise API is hosted on Amazon Web Services (AWS) – a very commonly used system for this kind of purpose. Nonetheless, it is not contractually, technically, or financially bound to use AWS infrastructure. We are storing publicly available Wikimedia content, general logging data, and lightweight usage data on AWS. We are looking to provide Service Level Agreements (SLAs) to customers with guarantees similar to those of Amazon. We don't have equivalent uptime information from the Wikimedia Foundation's existing infrastructure. However, this is something we are exploring with Wikimedia Site Reliability Engineering.

In the meantime, we are researching alternatives to AWS (and remain open to ideas that might fit our use case) when this project is more established, and we are confident in knowing what the infrastructure needs are in reality. Meanwhile, the WMF hosting infrastructure remains wholly owned, independent, and unaffected by the Enterprise API.

Per la documentazione tecnica, vedi: mw:Wikimedia Enterprise#Application Hosting.

Perché si tratta di un sito .com?

The homepage of the service is enterprise.wikimedia.com, rather than .org like other websites operated by the Wikimedia Foundation, for the following reasons:

1) Data Privacy and Security Boundaries. DNS domains act as technical boundaries for policies on data privacy and security. Since Wikimedia Enterprise operates on separate infrastructure, with separate policies and controls, it is more secure to not blur any of these technical boundaries by hosting Wikimedia Enterprise on a domain such as "wikimedia.org" where the Wikimedia Foundation operates existing sites. The Wikimedia Foundation does not operate any other sites within "wikimedia.com", so this provides a clean boundary.

2) Authenticity. It is permitted for a for-profit project owned by a non-profit organisation to use a .org domain. However, the Wikimedia Enterprise team felt that it is more accurate and honest that the website should be .com since it is a for-profit project.

At present the DNS for all of "wikimedia.com", including "enterprise.wikimedia.com", is served by the Wikimedia Foundation's DNS servers. We are aware this creates a Service-level agreements (SLAs) dependency issue that will need to be resolved before Wikimedia Enterprise can offer SLAs to customers. The plan for achieving DNS independence for Wikimedia Enterprise is a work in progress.

How will this affect Wikidata or the Wikidata Query Service

The Wikimedia Enterprise API will not directly affect Wikidata, or the Wikidata Query Service (WDQS). Also, at this stage of the development, the Enterprise API does not serve data from Wikidata (or Wikimedia Commons). While WDQS is a significant service for bulk Wikidata reusers for baselining their knowledge graphs, currently the goals of the Enterprise API are focused on streaming near real-time content, which is a different service than WDQS. Eventually, some information that Enterprise API customers currently obtain via WDQS might now be obtained via the API instead, which may decrease the amount they use the WDQS service.

Perché non lasciamo che siano gli altri a costruirsi il servizio?

All of the Enterprise API's initial potential customers are already using Wikimedia content in their products to varying degrees. Independently of each other, they invest in extracting, restructuring, and standardizing our content for their needs. However, what they cannot do internally is ensure the speed, consistency, and reliability of how Wikimedia services provide that content. This is something only the Wikimedia Foundation can provide. Furthermore, by providing a product available for any customer, the Enterprise API makes a level playing field for smaller businesses wishing to use Wikimedia content in their services, but which do not have internal resources of their larger competitors to do the necessary data conversions.

Domande sulle questioni legali

Perché questo progetto viene gestito da una compagnia affiliata?

The Wikimedia Foundation has created a single-member limited liability company (LLC), and it is this LLC that will sign contracts with the Enterprise API's customers. The LLC structure will insulate the Foundation from liabilities generated by the service. This is a standard approach when a non-profit organization operates a for-profit activity, and will help us both manage risk and promote transparency. That said, the Foundation is still required under US law to publicly disclose the LLC’s revenues and expenses in our annual tax filings (view the audited financial reports here). The LLC operates under the auspices of the Wikimedia Foundation, its staff are Wikimedia Foundation staff, and is ultimately subject to the governance of the Wikimedia Foundation Board of Trustees. The board of the LLC overseeing the project are from Wikimedia Foundation leadership, representing their WMF staff roles, and the LLC's "president" is the Business Development manager of the WMF. The LLC's legal registration can be found at the State of Delaware, Division of Corporations, Entity name: Wikimedia, LLC, File number: 7828447.

The assessment of appropriate tax treatment of the LLC activities has been coordinated with the Wikimedia Foundation auditors KPMG.

Chi saranno i "clienti"?

The Enterprise API has been initially designed for the needs of a very small number of technology organisations who are some of the world’s largest and richest companies, commonly referred to as "Big Tech", although any company can become a customer. As there will be no exclusive contracts nor exclusive content, developing this product will also help provide the ability for smaller for-profit organizations to have a “more level playing field” to benefit from the use of Wikimedia content in their products.

We will publish and maintain a list of current, paying, customers whose contract is above the amount where financial gifts to the Wikimedia Foundation would require notice to the Board of Trustees (although this list may only be updated periodically). As an organization based in the USA, it is legally not allowed to do business with organizations based in certain proscribed countries, as determined by the Office of Foreign Assets Control.

Cosa c'è nei contratti?

Customer contracts will typically include terms governing the duration of the engagement, the type of customer support and uptime expected, the cost, mechanisms for resolving disputes, assurances on context-appropriate attribution and licensing information, and restrictions on reusing the API to create a competing business (while affirming the content’s underlying free culture license). As described in the principles document, the contract will not grant exclusive content, exclusive access, private/user data, or editorial influence; and it will not include restrictions on how the content can be used which are contrary to the copyleft licenses of the content itself.