Wikimedia Enterprise adalah layanan dari Wikimedia Foundation yang tersedia melalui enterprise.wikimedia.com. Tujuan dari layanan ini adalah untuk membangun layanan bagi pengguna komersial dengan volume tinggi yang menggunakan konten Wikimedia. Layanan ini diumumkan pada Maret 2021 (artikel blog, artikel WIRED) dan diluncurkan pada Oktober 2021 (siaran pers, artikel OpenFutures).
Layanan ini fokus pada organisasi yang ingin memanfaatkan ulang konten Wikimedia dalam konteks lain, dengan menyediakan layanan data dalam skala besar agar lebih cepat, komprehensif, andal, dan aman. Wikimedia Enterprise bertujuan untuk meningkatkan pengalaman pengguna bagi pembaca Wikimedia di luar situs web kami, memperluas jangkauan dan kemudahan penemuan konten, serta meningkatkan kesadaran dan kemudahan atribusi dan verifikasi bagi organisasi yang paling banyak memanfaatkan data proyek Wikimedia melalui layanan yang didanai secara mandiri.
Mengakses data Wikimedia di luar aktivitas membaca dan menyunting masih menjadi tantangan besar. Hal ini disebabkan oleh struktur konten yang sulit dipahami oleh mesin, sehingga membatasi jangkauan data proyek Wikimedia ke luar ekosistem internal, serta membatasi dampak luas yang seharusnya dapat dihasilkannya.
Dalam Rekomendasi Strategi Gerakan untuk meningkatkan keberlanjutan dan pengalaman pengguna, disebutkan pentingnya: "mengeksplorasi peluang baru dalam menghasilkan pendapatan dan menyebarkan pengetahuan bebas melalui kemitraan dan pendapatan jasa, misalnya, dengan membangun API level perusahaan," serta "menjadikan rangkaian API Wikimedia lebih komprehensif, andal, aman, dan cepat dengan melibatkan pengguna skala besar... serta meningkatkan kesadaran dan kemudahan atribusi dan verifikasi bagi pengguna ulang konten."
Beberapa perusahaan teknologi berskala global telah lama mengandalkan data dari proyek Wikimedia untuk memperkaya layanan mereka. Mereka memahami bahwa tanpa kontribusi dari komunitas Wikimedia, mereka tidak dapat menawarkan layanan yang setara dalam hal kualitas dan keandalan. Di sisi lain, terdapat aspirasi dari komunitas agar perusahaan-perusahaan ini turut memberikan kontribusi nyata kepada ekosistem Wikimedia, sebagai wujud tanggung jawab atas manfaat yang mereka peroleh.
Hal ini mendorong lahirnya pendekatan baru yang lebih berkelanjutan, dengan hubungan yang lebih transparan antara Wikimedia dan pengguna tingkat perusahaan. Sebagian besar manfaat finansial dari model ini diharapkan berasal dari segelintir pengguna komersial besar dan akan langsung kembali mendukung gerakan Wikimedia.
Seiring dengan berkembangnya gagasan ini, muncul pula kesadaran akan pentingnya pemerataan akses. Wikimedia memikul tanggung jawab untuk memastikan bahwa layanan data ini juga tersedia bagi organisasi yang tidak memiliki sumber daya sebesar perusahaan raksasa, demi menciptakan ekosistem digital yang adil dan inklusif. Layanan ini tidak hanya ditujukan bagi perusahaan rintisan atau alternatif dari raksasa teknologi, tetapi juga bagi universitas dan para penelitinya, lembaga arsip dan para pengarsip, serta komunitas Wikimedia secara keseluruhan.
Gambaran umum
Wikimedia Enterprise berfokus pada pemanfaatan ulang konten oleh pelaku industri dalam skala besar, misalnya dalam pengembangan grafik pengetahuan, fitur pencarian, asisten suara, layanan peta, pelaporan berita, perkakas komunitas, aplikasi pihak ketiga, hingga penelitian menyeluruh terhadap keseluruhan korpus data. Dengan menyusun ulang konten tak terstruktur Wikimedia ke dalam format yang lebih terstruktur, layanan ini memungkinkan para pengguna ulang untuk memenuhi kebutuhan spesifik mereka. Di saat yang sama, langkah ini membuka jalan bagi pengembangan perkakas dan layanan baru yang dapat digunakan secara luas oleh publik. Para pengguna konten Wikimedia umumnya membutuhkan tiga hal utama:
Frekuensi: Akses rutin terhadap versi terbaru proyek-proyek Wikimedia
Keandalan: Infrastruktur yang stabil dan mudah diakses
Kualitas: "Revisi terakhir terbaik"
Dengan mengarahkan layanan ini pada kasus-kasus penggunaan tertentu yang dapat membiayai operasionalnya secara mandiri, tim API Wikimedia dapat tetap memusatkan perhatian pada kebutuhan sukarelawan, tim teknis, dan organisasi yang ingin tidak hanya mengakses tetapi juga berinteraksi langsung dengan data. Sebagian besar perkakas bantu penyuntingan komunitas tetap berada di luar cakupan layanan ini. Untuk pengembangan API yang sudah ada, informasi lebih lanjut tersedia melalui halaman inisiatif "API Gateway".
Tujuan program:
Konten: Menyediakan lebih banyak konten gerakan Wikimedia dalam format yang seragam dan mudah diproses mesin, agar dapat dimanfaatkan secara bebas oleh peneliti dan pengguna ulang.
Efisiensi sumber daya: Mengurangi beban pada peladen produksi Wikimedia akibat praktik pengambilan data intensif oleh pengguna dengan frekuensi dan volume tinggi.
Pendanaan: Menciptakan cara yang lebih jelas dan konsisten bagi para pengguna ulang berskala besar untuk mengembalikan manfaat yang mereka peroleh kepada gerakan Wikimedia, sebagai pengganti kontribusi sukarela yang tidak terstruktur.
Komunitas
Salindia presentasi Wikimania 2023
Silakan hubungi tim Wikimedia Enterprise jika Anda ingin menjadwalkan diskusi bersama komunitas Anda mengenai layanan ini, sesuai waktu dan platform pertemuan daring yang Anda pilih.
Wikimedia projects are, have always been, and will always remain libre. The principles of free cultural works mean that anyone can use Wikimedia without restriction, including commercially. As a movement, we embrace this. It is why we reject ‘non-commercial’ licenses, as they would limit the kinds of reuse possible. And it is why we consider commercial reuse an important means of distributing knowledge to audiences.
Equally, Wikimedia projects are, have always been, and will always remain gratis. The ability to freely access the knowledge available across all Wikimedia projects has always been core to the mission of the Foundation and the movement. We provide this access not only to individuals visiting our websites but also programmatically to machines so that our content can be repurposed in other environments. The full corpus of Wikimedia content always has been, and will continue to be, made available for reuse in various forms (including but not limited to database dumps, APIs, and scraping) at no cost.
As a result, our content is often repurposed by for-profit organizations that rely on it to support their business models, and which consequently earn revenue from it. Outside of voluntary corporate donations to the Wikimedia Foundation, the movement has never received benefits from any of this revenue through return investment. In acknowledgement of this, under the heading of Increase the sustainability of our movement the Movement Strategy process asked the Wikimedia Foundation to explore, among other things, “enterprise-level APIs...models for enterprise-scale for-profit reusers, taking care to avoid revenue dependencies or other undue external influence in product design and development.” Furthermore, under the heading Improve User Experience, a further recommendation stated, "Make the Wikimedia API suite more comprehensive, reliable, secure, and fast, in partnership with large scale users where that aligns with our mission and principles, to improve the user experience of both our direct and indirect users, increase the reach and discoverability of our content and the potential for data returns, and improve awareness of and ease of attribution and verifiability for content reusers."
The Enterprise project team is developing a new resource aimed at for-profit content reusers, who have product, service, and system requirements that go beyond what we freely provide. Use of this offering will not be required for for-profit content reuse; companies can continue to use the current tools available at no cost. All Enterprise API revenue will unequivocally be used to support the Wikimedia mission—for example, to fund Wikimedia programs or help grow the Wikimedia Endowment.
This project represents a new kind of activity at the Foundation. The project is at a very early stage that should be considered a learning period. We will have successes, we will make mistakes, and we will need to adapt our strategies. The team is committed to listening, engaging, and where possible, integrating the feedback we get on our work. This document is organic and is reflective of the team's current thinking; we are attempting to document as much work as possible in the open. Up until now, our work has been shaped by a series of initial interviews with community members, Wikimedia Foundation Board and staff, researchers, and reusers.
Mengingat sifat layanan ini, keputusan utama akan diambil oleh Wikimedia Foundation. Kami mencari masukan dari komunitas, terutama dari komunitas teknis dan mereka yang terlibat dalam proses strategi, selama masa pengembangan layanan ini. Umpan balik teknis telah dikumpulkan dari rekan-rekan di Wikimedia Foundation, mitra industri dan riset, mitra teknis di seluruh gerakan, serta dari komunitas teknis yang lebih luas melalui Phabricator. Masukan mengenai pengembangan pendanaan layanan ini juga akan mengikuti pendekatan yang sama. Kami akan terus mengumpulkan masukan melalui wawancara riset, kelompok diskusi, dan umpan balik di Meta sesuai dengan prinsip-prinsip kami.
Akses
Terdapat beberapa cara untuk memperoleh akses ke kumpulan data Enterprise API..
Semua konten tersedia dengan lisensi bebas (lihat juga prinsip-prinsip proyek ini).
Berbayar
Akses Realtime API (Batch dan Streaming) serta berkas timbunan harian Snapshot API dalam format NDJSON dapat diperoleh melalui situs web produk Enterprise API: enterprise.wikimedia.com.
Gratis
Bagi Anda yang membutuhkan pembaruan terkini, timbunan pembaruan artikel, atau kemampuan untuk melakukan kueri artikel individu dari timbunan tersebut, Anda dapat mendaftar untuk akun gratis di Wikimedia Enterprise. Pendaftaran melalui situs produk Enterprise API mencakup 5.000 permintaan API sesuai permintaan yang diperbarui setiap bulan (termasuk titik akhir Konten Terstruktur) dan dua berkas Snapshot API dalam format NDJSON yang diperbarui dua kali sebulan (pada tanggal 2 dan 21), tanpa biaya.
Snapshot API dan Realtime (Batch) dapat diakses melalui layanan data oleh siapa saja yang memiliki akun layanan awan Wikimedia. Beberapa kumpulan data Beta juga dapat diakses melalui HuggingFace.
Pengguna dengan kasus penggunaan nonkomersial yang relevan dengan misi, yang tidak dapat dipenuhi oleh API atau timbunan gratis yang ada, dapat mengajukan permintaan untuk mendapatkan akses yang lebih luas ke layanan API ini, dengan biaya yang lebih rendah atau tanpa biaya, tergantung pada penggunaan dan aplikasinya.
Seiring waktu, produk API yang ditawarkan akan berkembang dan meningkat. Informasi ini akurat per September 2024.
Gambaran umum
Semua API kami mengembalikan format respons yang terstruktur dalam JSON (atau ND-JSON), yang memudahkan untuk menggabungkan satu API dengan API lainnya. Tiga API yang tersedia menyajikan data yang sama dengan metode pengambilan yang berbeda:
Snapshot API untuk mengambil data dalam jumlah besar
On-demand API untuk mengambil artikel tunggal
Realtime API streaming untuk menerima pembaruan secara langsung
Muatan respons API mencakup data artikel seperti ringkasan, gambar, QID Wikidata, lisensi, dan metadata revisi terakhir, seperti editor, ukuran perubahan, dan skor kredibilitas dengan probabilitas pengembalian. Semua bidang data dan skema dijelaskan secara mendalam di halaman Kamus Data proyek ini.
Snapshot API
Untuk pengguna dengan volume tinggi yang saat ini mengandalkan Wikimedia Dumps untuk mengakses informasi, kami telah menciptakan solusi untuk mengambil konten Wikimedia secara hampir waktu nyata tanpa melakukan panggilan API berlebihan (On-demand API) atau menghubungkan ke infrastruktur kami (Realtime).
Enterprise Snapshot API memungkinkan pengguna untuk mengambil seluruh proyek Wikimedia dalam bentuk berkas dump database.
Unduh berkas terkompresi yang berisi seluruh konten dalam proyek yang didukung, dalam bahasa apa pun
Konten artikel dalam format HTML serta teks wiki
Cadence snapshot hingga harian
Dump terkompresi 24 jam (dengan teks wiki dan HTML) dari proyek Wikimedia "berbasis teks" yang didukung
Berbagai macam skema komersial dan konsolidasi berdasarkan SLA
SLA dan Dukungan
On-demand API
Pengguna yang mengandalkan infrastruktur berbasis platform EventStream bergantung pada layanan seperti RESTBase untuk menarik HTML dari judul halaman dan revisi terkini untuk memperbarui produk mereka. Pengguna dengan volume tinggi telah meminta cara yang andal untuk mengumpulkan data ini, serta struktur selain HTML ketika mengintegrasikan konten kami ke dalam Knowledge Graphs (KGs) dan produk mereka.
Wikimedia Enterprise On-demand API memungkinkan pengguna untuk mengambil artikel tunggal dari proyek Wikimedia yang didukung kapan saja.
Lakukan permintaan HTTP standar untuk mengambil dokumen berdasarkan nama dari semua proyek dan bahasa yang didukung dengan filter yang tersedia untuk membatasi respons
Meminta data halaman terkini kapan saja untuk melengkapi data Realtime atau Snapshot API Anda
Berbagai macam skema komersial dan konsolidasi berdasarkan SLA
Realtime API
Pengguna dengan volume tinggi saat ini sangat bergantung pada pembaruan yang diterima dari komunitas untuk memperbarui produk mereka secara langsung, menggunakan EventStream API untuk mengakses pembaruan tersebut. Pengguna dengan volume tinggi tertarik pada layanan yang memungkinkan mereka menyaring pembaruan yang diterima untuk membatasi pemrosesan, menjamin koneksi HTTP yang stabil untuk menghindari kehilangan data, dan menyediakan skema yang lebih berguna untuk membatasi jumlah panggilan API yang perlu mereka lakukan per peristiwa.
Enterprise Realtime API memungkinkan pengguna untuk melakukan streaming pembaruan secara langsung dari proyek Wikimedia yang didukung.
Streaming: Menerima pembaruan streaming (firehose) setiap perubahan yang terjadi secara langsung
Batch: Mengunduh berkas snapshot terkompresi dari pembaruan inkremental setiap jam
Pembaruan instan untuk konten baru, setiap perubahan, penghapusan, dan peristiwa berita terkini termasuk perubahan visibilitas yang dikurasi oleh komunitas
Penyaringan peristiwa berdasarkan Proyek atau Ruang Nama Revisi
Berbagai macam skema komersial dan konsolidasi berdasarkan SLA dengan jaminan koneksi
Akun yang telah dikontrak menerima SLA 99% dan jaminan waktu respons dukungan. Semua akun memiliki akses ke sumber daya orientasi pengantar dan pertanyaan umum pusat bantuan kami.
Tim
Staf Wikimedia Foundation yang secara khusus menangani proyek ini:
Nama dalam huruf tebal menandakan posisi manajerial.
Banyak orang dari berbagai tim juga memberikan kontribusi yang signifikan, termasuk dari tim Hukum, Rekayasa, Kemitraan, Desain, Komunikasi, dan lain-lain. Pekerjaan kontrak tambahan diberikan oleh PartnerHero yang menyediakan layanan dukungan pelanggan,
Vuurr yang membantu proses penjualan kami, Super Natural Design yang bertanggung jawab sebagai desainer situs web proyek.
Engineering support was provided in the first years by Speed & Function.
Initial Wikimedia Foundation Diff blogpost note: media stories listed below are written and published independently and were neither pre-reviewed nor approved by the WMF
Wikitech:Layanan Data — Daftar layanan yang berorientasi komunitas yang memungkinkan akses langsung ke basis data dan dump, serta antarmuka web untuk melakukan kueri dan akses programatik ke penyimpanan data.
Enterprise Hub — Halaman untuk mereka yang tertarik menggunakan perangkat lunak MediaWiki dalam konteks perusahaan.
MediaWiki Stakeholders Group — Organisasi afiliasi independen yang memperjuangkan kebutuhan pengguna MediaWiki di luar Wikimedia Foundation, termasuk perusahaan yang berorientasi laba.
Enterprise MediaWiki Conference — Serangkaian konferensi independen yang diselenggarakan untuk komunitas yang tertarik pada penerapan MediaWiki dalam konteks komersial dan perusahaan.