維基媒體基金會年度計劃/2023−2024/產品與技術/目標與關鍵結果

From Meta, a Wikimedia project coordination wiki
This page is a translated version of the page Wikimedia Foundation Annual Plan/2023-2024/Product & Technology/OKRs and the translation is 99% complete.
Outdated translations are marked like this.
請注意 – 維基媒體基金會將每 3 個月維護一次此頁面的翻譯,直至 2024 年中期:
阿拉伯語,法語,葡語,俄語,西班牙語,日語,烏克蘭語,中文,史瓦希利語,印地語

本文件代表維基媒體基金會產品與技術部門 2023-2024 年度計劃流程的「第 2 部分」。這重點關注各部門為 2023-2024 年度計劃制定的「目標和關鍵成果」(OKRs)草案Wikimedia Foundation Annual Plan/2023-2024/Product & Technology「第 1 部分」是對工作組合草案(名義上稱為「工作桶/工作類別」)以及本文檔背後的理論和規劃的解釋。

儘管本文件已完成,但隨著我們吸取的經驗學習,關鍵結果及其基本假設將在 2023-2024 年度計劃年度逐步更新。

工作類別 1:維基體驗

目標 v2 (v1) 主要結果 解釋

WE1: 貢獻者的體驗

透過實現和支援高品質和具可訪問性的體驗,支援世界上語言最多樣化、最值得信賴和最全面的自由知識生態系統中高品質和相關內容的增長。

背景:為了專注於一件事,我們需要權衡另一件事。我們希望專注於支援內容和內容審核者、行動式貢獻、支援線上活動以及減少 IP 封鎖。為了專注於這些事情,我們必須降低實體活動的支援和新編輯生產力的優先順序(有關IP 區塊的關鍵結果除外)。

討論

1. 在具有代表性的維基站點中,將主文章命名空間中未轉換的移動貢獻平均增加 10%。 該關鍵結果為促進行動式內容編輯提供了廣泛的鼓勵,既透過支援其他關鍵結果的活動(例如審核和內容覆蓋),同時透過主要針對行動式貢獻的活動。過去三年,行動網路的內容貢獻增加了約 20%。如果我們能想出辦法在短短一年內將其增加 10%,這將比其自然成長率更快。

該關鍵結果包括網路和應用程式。這是「對一組具有代表性的維基進行平均計算」,以確保我們做出的改進對多個維基專案具有價值,而不僅僅是我們最大的維基專案。我們稍後將選擇哪些維基專案。

2. 全面改進四個工作流程,改善具有擴展權限的編輯(管理員、巡查員、工作人員和其他各類的管理人員)的體驗;擴展他們的創造力;影響至少四個不同的維基專案,並與志願者合作滿足每個改進集合的關鍵結果。 我們尚未知道減少積壓等具體目標是否確實是這些負責審核工作的編輯所需要的。我們希望最終利用我們的資源來提高他們的滿意度並提高他們構建和管理工作流程的能力——這就是「擴展他們的創造力」的含義:這些社群成員構建了令人驚嘆的東西——我們可以提供幫助的一些最佳方式是我們透過平台、端點、模板和其他工具實現創造力的時候。「四個工作流程」這個數字是因為我們可以想像有多少團隊在處理這個關鍵結果。「四個不同的維基」這個數字是為了鼓勵我們在可能的情況下推廣我們跨專案的影響。然後,該關鍵結果將要求我們與受影響的志願者合作,為每項特定的改進設定實際的關鍵結果,以便我們能夠在何時產生影響方面與他們達成一致。請注意,除了進行審核的編輯者之外,對其他使用者所使用的工作流程進行處理仍然可以改善他們的體驗,例如促使新成員創造出更強的第一篇文章的工作可能會減輕巡視新文章的管理員的負擔。
3. 根據「全球品質評分」,在維基百科上新創建或編輯具有可接受品質的高影響力主題文章的比例(同年比)增加 1 個百分點——從代表性不足的地理區域和性別開始。隨著我們了解更多資訊並建立基線,此指標可能會進行調整,包括適應正常化和/或進行調整以補償波動。 此指標重點關注高影響力主題的可接受品質內容的增加。具體而言,我們的目標是以上一年為基準,在維基百科上增加 1% 的關於選定主題(從代表性不足的地理區域和性別開始)可接受品質的文章。例如,在 2022/2023 年所有針對地理區域且達到可接受品質分數的新創建或改進的文章中,28% 關注代表性不足的地區。這意味著,到 2023/2024 年,在所有符合可接受品質分數的地理區域新創建或改進的文章中,29% 應關注代表性不足的地理區域。請注意,目標已從 10% 的同比增長(如前所述)更改為 1% 的同比增長。該指標已更改為同比 1%,是因為考慮到高影響力主題的文章增長趨勢(特別關注維基百科中代表性不足的區域的內容),維基媒體基金會的數據分析師認為該指標更容易實現和更現實。

該指標旨在有助於設定方向,同時能讓團隊靈活地定義策略和追蹤進度。實現這一目標的措施可以專注於提高選定主題的現有文章品質或鼓勵為這些主題創建新的文章。團隊可以透過將季度或全年的結果與一年前同期的結果進行比較來評估其影響。品質和相關性等方面始終難以衡量。文章品質由全球品質評分決定,該分數基於文章的多個參數,例如章節、參考文獻和連結的數量。同樣,文章主題將與從事知識差距分析的團隊合作確定,並將使用他們的數據集——從代表性不足的地理區域和性別開始。

這項工作與維基媒體基金會範圍內的內容指標保持一致,涉及數量和品質——這意味著我們可以透過產生新文章或改進現有文章來影響這項工作。「高影響力主題」是維基媒體運動策略建議 #8 中的一個概念:「識別有影響力的議題」。性別和地理都是我們維基媒體運動強調的具有重要內容差距的主題領域,並且我們的研究團隊有能力進行衡量。

4. 受到上訴的 IP 封鎖份額增加 X%,而解除封鎖的上訴份額保持不變或下降。 IP 封鎖是我們維基媒體運動阻止濫用者濫用我們網站的主要工具,但這會產生阻止許多善意行為的用戶的不幸效果。這對新編輯和社群專案造成特別負面的影響。沒有可靠的方法來衡量有多少人被錯誤地屏蔽,但是我們可以透過有多少人請求豁免(即上訴)被屏蔽來估算,然而這樣做的一個障礙是使用者很難找到並完成我們的申訴流程。因此,本關鍵結果試圖指導我們從兩個方面改善IP封鎖狀況。首先,這要求我們向使用者明確申訴流程,這樣我們就可以看到更多被封鎖的人提出申訴。同時,這呼籲我們首先透過查看未阻止的上訴比例來減少發生的錯誤阻止數量。換句話說,如果我們能夠只阻止正確的用戶,那麼我們將看到很少有人被解除阻止。該關鍵結果可能會引發有關 IP 位址的性質、我們如何使用它們,以及管理這些流程的工作人員的工作負載和工作流程的深入社群和技術討論。當我們與社群成員合作時,我們可能會發現有更好的方法來衡量 IP 區塊問題的進展,並且我們可以重新關注其他指標。 [請查看更新說明]
5. 啟用一個新的維基媒體社群來建立一個開放的功能庫,即「維基功能」,這能夠在維基媒體網站上創建新形式的知識。 該關鍵結果體現了維基媒體基金會創建 Wikifunctions 作為社群構建、使用和維護數據庫平台的策略。維基功能同時將構成抽象維基百科(Abstract Wikipedia)的技術基礎,該計畫旨在以獨立於語言的方式創建和維護維基百科文章。抽象維基百科(Abstract Wikipedia)的最終目標是讓每個人都更容易獲得和使用知識——不論他們的語言或背景。

WE2: 閱讀與媒體體驗

為我們維基專案打造現代化、相關且易於理解的閱讀和媒體體驗。

背景:我們希望專注於增加獨特的設備、增加內部發現和非編輯的參與。為了做到這一點,我們必須優先考慮圖像和音訊以及可訪問性的入站問題。下面的關鍵結果同時反映了這個重點。

討論

1. 根據使用者的個人需求和限制,調整 15% 的總瀏覽量的預設體驗,確保所有使用者獲得優質的閱讀體驗。 這個關鍵結果的重點是讓我們的介面有機會在必要時適應個人需求。這裡的理論是,人們會對能夠根據自己的需求進行調整的網站和介面更加投入。這可以包括深色模式、文字和頁面密度以及字體大小自訂等工作,其中一些適應可以透過介面自動完成——例如:建立功能或工具的回應版本,或確保根據使用者的瀏覽器或裝置設定開啟深色模式。在其他情況下,這種適應可以透過有意的自訂來完成——允許用戶在特定(但有限)的情況下選擇非預設狀態。從可訪問性的角度來看,這將重點關注需要獨立構建的功能,以允許更多的可訪問性,或允許設置更易於訪問的預設值,同時為具有不同偏好的用戶提供客製化的機會。為了設定具體數字「15%」,我們研究了用戶如何適應維基百科 iOS 應用程式中的預設體驗。該應用程式 59% 的用戶使用非預設主題(深色、黑色或棕褐色)。我們使用這個數字作為基準,但考慮到我們的假設,即與零星用戶相比,網路版維基百科的習慣用戶更有可能花時間調整他們的閱讀體驗。
2. 有興趣的讀者將發現並瀏覽更多內容,這是透過代表性的維基專案中內部引用頁面互動增加 10% 來衡量的。 該關鍵結果致力於透過探索不同的內容發現方法或切入點,讓有興趣的讀者更輕鬆地發現內容。目標是在讀者旅程的特定時刻或在表明他們有興趣了解更多資訊的特定行動之後為他們提供這些選項。在這種情況下,「頁面互動」包括使用者與內容互動的所有方式,而不僅僅是查看頁面(頁面預覽就是一個例子)。「內部引用」意味著我們只會計算使用者在我們的網站上開始會話後發生的頁面互動(即不包括他們第一次登陸網站,這通常是透過搜尋引擎引用發生的)。
3. 透過 0.05% 的非編輯參與獨特設備加深讀者與維基百科的互動。 該關鍵結果著重於加深讀者參與度,同時探索讀者可以為我們的非編輯頁面專案做出貢獻的方式。我們假設有些人有興趣參與維基專案,但對他們來說任何類型的編輯都太大了。我們希望這些人能夠更深入地參與其中——也許成為更忠誠的讀者,或者最終變得足夠輕鬆地進行編輯。「非編輯參與」是指使用者可以在維基上進行編輯以外的任何操作(我們同時將討論的編輯視為「編輯」)。雖然我們的網站沒有這些功能,但我們的應用程式具有以閱讀清單或將內容分享到社交媒體的形式。這項工作可以包括讓使用者配置自己的個人閱讀體驗,同時可以專注於在維基上分享內容、策劃並向其他人推薦內容。該關鍵結果包括行動版網站和桌面版網站,以及應用程式上的工作。對於行動版網站和桌面版網站,這可能包括採用應用程式中存在的一些非編輯參與功能。對於應用程式來說,這可能包括改進現有功能或建立新想法。0.05% 這個數字大約是編輯與獨特設備的比例——因此,在該功能集合推出的第一年,我們可能會看到非編輯參與人數的比例與之類似,而這一比例最終會在未來增加到超過編輯人數。 [請查看更新說明]
4. 提高南美洲用戶的網站效能,首先將巴西用戶的 p50 延遲減少至少 100 毫秒 該關鍵結果重點關注提高服務欠缺地區的網站效能。研究表明,網站響應時間的顯著縮短可以提高用戶參與度。作為此關鍵結果的一部分,我們將改善南美洲的網站回應時間,例如透過在該區域部署額外的快取網站。儘管我們預計到本財政年度結束時巴西將產生第一個重大影響,但預計整個地區不久後就會看到顯著的業績效利益。

WE3: 知識平台

透過改進 MediaWiki 的開發流程來提高軟體開發人員之間的協作和效率

討論

1. 減少開發人員工作流程的分散性,使至少一種官方支援的開發人員工具的採用率達到 75%。 這項關鍵成果的目標是提供標準開發工具,以滿足大多數維基媒體開發人員的需求。我們同時希望能夠在開發、測試和部署階段為更多元件複製類似生產的環境。透過實現這一目標,我們將為開發人員提供更好的體驗。這種體驗將使工程師能夠更快地上崗,在遇到困難時互相幫助,並更有信心地將新功能部署到生產環境中。這項工作的目的並不是在第一年為所有開發人員的工作流程提供服務,而是在對開發人員工作效率影響最大的領域進行改進。
2. 在特定的 MediaWiki 資源庫中,將已提交 5 個以上修補程式並部署到生產中的作者數量增加 20%。 增加願意並能夠為 MediaWiki 程式碼資料庫做出貢獻的人數,可以減少在需要修改 MediaWiki 核心時團隊受阻的可能性。這同時會降低變通辦法被創造出來從而增加技術債的可能性。此外,這項指標同時表明,在不產生意外影響的情況下,程式碼資料庫的貢獻變得越來越容易和安全。
3. 解決並記錄技術策略方向/政策/流程的 4 個要點。 產品和技術領導層已經確定了需要策略指導的關鍵領域,以提高技術工作的影響力,例如:確定在維基媒體之外支援 MediaWiki 的方法,以及制定開源軟體政策。為這些主題確定策略方向將意味著提高維基媒體技術方向的效率和凝聚力。

工作類別 2:信號和數據服務

目標 v2 (v1) 主要結果 解釋

SDS1: 定義基本指標

我們的基本指標資料集合中的每個指標和維度都經過科學或經驗支援、標準化、生產化,並在維基媒體基金會內共享。

背景:在維基媒體基金會,有效使用指標來制定策略決策需要我們使用一組通用、可靠且易於理解的指標來衡量和評估工作的影響。確保從事不同維基專案的不同團隊使用具有相同定義的相同指標來了解其工作的影響,這將使我們能夠協調整個維基媒體基金會、維基媒體自治體和社群的工作。這些指標將允許維基媒體基金會工作人員和社群評估專案和產品功能的提案,並監控和評估結果。此外,這能讓支援資料準備和分析工具的工程師透過更精確地定義工作範圍來提供更高標準的服務,使我們現有的資源更易於開展工作。資料只有在可供使用者存取時才有用。我們的指標必須具有最大程度的可近性,才能最大程度地發揮其對所有受眾的效用。我們將收集、組織並提供必要的信息,以指導正確使用並防止濫用。

討論

1. 對於四個核心指標領域中的三個,提供至少 1 個指標,並記錄其對基本指標標準的遵守情況。 這項工作要求我們確定並澄清基本指標的標準,並記錄我們的核心指標符合標準的程度。透過這項工作,我們將找出繼續改進我們的基本指標的差距和機會。

我們的起始假設是,對基本指標的要求包括指標得到科學或經驗支援,並具有明確的定義、計算、資料來源、版本控制和資料管理。當我們開始實施這些指標時,我們可能會確定一組修訂後的標準。這對指導指標選擇和定義更有幫助。

4. 五項年度計畫舉措以核心指標作為調查點,衡量和傳達進展情況,或告知資源的方向。 透過觀察這些指標正在影響整個維基媒體基金會的年度計劃舉措,我們可以發現領導者和員工了解我們的核心年度計劃指標如何與其工作聯繫起來。影響力可能會因團隊和計劃的不同而有所不同,因此我們尋找跨越三個參與度等級的指標。一些領導者可能會將指標作為觀察工具,並進行調查以了解趨勢與其年度計畫舉措的關係。其他人可能會使用這些指標作為廣泛傳達其工作進度或基準的工具,例如透過將指標納入季度審查或年度計劃以達到此目標。在最理想的情況下,年度計劃計劃的領導者直接使用這些指標來指導和評估資源決策,如有關這些決策的內部或外部溝通中所證明的那樣。透過鼓勵在各種年度計劃舉措中多層次地採用我們的核心年度計劃指標,我們使整個組織更接近使用一組共享指標來指導整個維基媒體基金會的協調工作。

SDS2: 做出基於經驗的決策

維基媒體的員工和領導層透過使用基本指標來評估計畫進度和影響力來做出數據驅動的決策

背景:透過使用基本指標來評估計畫進度和影響,我們可以確保我們做出有證據支援的明智決策。這使我們能夠專注於最重要的目標,根據需要進行調整,並隨著時間的推移跟踪我們的進展。” 為了實現這種數據驅動的文化,我們必須先將基本指標和相關流程編入工具和成果之中,使關鍵受眾能夠理解、評估和探索高品質的數據。 這不僅意味著投資開發衡量指標的工具,同時意味著投資數據基礎設施和品質解決方案,使我們能夠提高數據產品的準確性、覆蓋範圍和及時性。我們重點關注兩個關鍵領域:

  • 透過提供共享工具和數據來表達他們的觀點,使高階領導層能夠做出數據驅動的決策。這項工作將包括將 3 個核心指標作為數據產品提供,提供允許相關受眾分析和評估這些指標的工具,以及對數據基礎設施和現有數據產品的必要投資。
  • 簡化與我們的產品和功能相關的數據生成,使我們能夠對產品進行比較和運行實驗。實驗使我們能夠快速學習,並幫助我們與社群一起發展正確的體驗。隨著我們產品組合的增長,我們需要製定一項策略,系統地和透明地驗證我們的決策和投資正在使我們朝著正確的方向前進,以實現維基媒體運動的目標。

討論

5. 四個功能團隊使用共享工具根據使用者互動的經驗數據來評估和改進使用者體驗。 建立功能團隊可以用來衡量功能變更影響的共享工具將減少建立和擷取測量所需的工作量,從而提高我們的效率,並使這些測量更容易與我們的核心指標保持一致。
6. 高階領導可以定期使用共享工具根據核心指標評估維基媒體基金會的進展。 作為目標 1 的一部分,當我們圍繞核心指標調整高階領導時,我們需要提供易於使用的工具,使他們能夠根據核心指標評估和衡量維基媒體基金會的進展。這項工作探討了我們如何透過靜態報告、資料視覺化工具等以及對資料基礎設施和品質的投資來實現這一目標。今年,我們的重點將是服務核心指標。

SDS3: 使用和分發數據

用戶可以可靠地大規模存取和查詢維基媒體的內容

背景:從我們的維基專案提供資料的機制對於成功開發維基體驗以及開發工具、專案分析和其他活動至關重要。我們必須能夠透過可靠、可持續和可擴展的數據產品來提供數據,以滿足自由知識分發、發現、管理和創造的需求。 今年維基媒體基金會的一個重點關注領域將是探索如何提供更永續的知識圖譜解決方案,以可持續和高效的方式繼續支持知識內容的持續獲取和增長,同時保留對知識的訪問現有內容。今年我們將關注:'

  • 探索提高 WDQS 查詢效能和可靠性的方法
  • 解決與 WDQS 相關即將失敗的潛在風險
  • 為擴展快速增長的知識圖譜的長期解決方案奠定基礎

討論

1. 維基數據知識圖譜可在 10 天內重新加載,最多可容納 200 億元組的圖譜。 我們試圖解決的根本問題是維基數據查詢服務的中期可擴展性和穩定性,這可能會阻礙維基數據的查詢能力。維基數據查詢服務在 Blazegraph 之上運行,包含 150 億個三元組。該圖目前正以每年 10 億三倍的速度成長。隨著當前圖表的大小和增長,我們遇到了許多可擴展性問題:
  • 從維基數據轉儲重新載入(重建)圖表需要 2 個多月的時間。部分原因是操作很長,但時間延長是因為一旦圖形達到某個大小,重新載入就會意外崩潰,需要重新啟動進程。
  • WDQS 更頻繁出現穩定性問題
  • 查詢運行時間更長,超時更頻繁

為了確保數據一致性並能夠從潛在的關鍵數據問題中恢復,重新載入圖表的能力是一項關鍵功能。這體現了系統的穩定性和可擴展性。此外,數據重新載入過程的不穩定性與圖的大小直接相關,就像 WDQS 的運行時穩定性與圖的大小相關一樣。

工作類別 3:未來的觀眾

目標 v2 (v1) 主要結果 解釋 研究

FA1: 描述多種潛在策略

透過描述多種潛在策略,維基媒體可以實現我們成為自由知識生態系統的重要基礎設施目標

討論

1. 未來受眾工作的參與者至少配備了三個候選策略,以了解維基媒體專案(特別是維基百科和維基共享資源)在未來如何保持「自由知識的基本基礎設施」——包括他們將會接觸的受眾、他們的假設測試、測試它們的方法。 在「未來受眾」這個工作類別深入調查未來可能的工作之前,我們希望列出我們將要調查的不同策略,並思考需要回答的問題以檢測其可行性。

維基共享資源的社群成員明確要求我們考慮維基共享資源未來的策略——這個關鍵結果確保我們這樣做,但這同時符合更大的產品策略思維。

維基媒體 2023 年外部趨勢概述強調了搜尋和內容創建方面技術和用戶行為的許多變化,這些變化對我們維基媒體運動的可持續性構成了潛在風險。這條工作軌道旨在更深入地探討我們的專案和社群如何在面對不同的潛在未來挑戰時繼續蓬勃發展。

聯繫: User:MPinchuk (WMF)

FA2: 測試假設

從關注第三方內容平台入手,驗證或論證未來的潛在策略

討論

1. 測試一個假設,旨在接觸領先的第三方內容平台上的全球青年受眾,為我們可以在網站內外構建的產品產生創意,這有助於提高他們作為消費者和貢獻者對維基媒體內容的參與度。 我們確定要研究的策略方向之一是在其他平台上傳播自由知識——例如YouTube和Instagram等等。大量知識在這些地方被自由消費,而我們未有這樣做採取任何措施來促進這一點,我們同時沒有關於如何從這些地方獲得參與者和收入的理論。該關鍵結果的語言於 2023 年 10 月 11 日更新,以更清楚地表明該關鍵結果的目的是透過第三方平台(而不是維基媒體品牌)傳播維基媒體內容,並更清楚地表明該關鍵結果正在服務中開發產品創意。隨著內容的傳播,歸屬和品牌隨之傳播同時很重要,這樣維基媒體才能與編輯和捐助者一起維持下去——但這不是這項工作的主要方向。
  • 2022 年的品牌健康調查調查了不同年齡層的人士如何看待維基百科。這指出在一些市場(美國、德國、南非),18-24 歲人群的得分特別低,他們給維基百科的淨推薦值為負值。根據調查:「這對該專案和整個維基媒體運動的未來構成了很高的風險。」
  • 《紐約時報》報導了有證據表明,全球年輕人花在社交應用程式上的時間越來越多,而使用傳統搜尋引擎的時間越來越少(傳統搜尋引擎通常會為我們的專案帶來大量新受眾)。

聯繫:User:MPinchuk (WMF)

2. 測試圍繞對話式人工智慧知識搜尋的假設,探索人們如何發現和參與維基媒體專案的內容 我們確定要研究的另一個策略方向是對話式人工智慧,這項技術看起來將改變自由知識生態系統——並不是所有使用大型語言模型和聊天機器人的工作都屬於這個策略方向,而只是那些研究對話式人工智慧的工作,將自由知識帶給那些無法體驗維基媒體內容的受眾。
  • 路透社報稱,截至 2023 年 2 月,上線 2 個月後,ChatGPT 已擁有 1 億活躍用戶,顯示其吸引力巨大且成長迅速。
  • GPT-4 和其他 LLMs 現在被用來支援許多新工具,包括線上搜尋和內容創建。我們維基媒體運動中的許多人都對我們的工作和專案如何在人工智慧工具日益複雜的世界中繼續蓬勃發展感興趣並關心。

聯繫:User:MPinchuk (WMF)