データ・ダンプ
Appearance
ウィキメディア財団はデータ・ダンプのアクセスが増えるように、ご協力をお願い致します。帯域幅があれば是非ミラーをホスト奉仕してください。
ウィキメディア・ダンプについて
ウィキメディアは、各ウィキのコンテンツ・検索インデックス・短縮URLのマッピングといった関連データの公開ダンプを提供しています。このダンプは研究者やオフライン読者用プロジェクト、内容のアーカイブ、ウィキのボットによる編集、簡単にクエリ可能な形式でデータを提供する、などの多様な目的で利用されます。ダンプのダウンロードや再使用は自由に可能です。
データダンプはバックアップではないし、一貫性も完全性も保証されていません。たとえ、そうだとしても、有用なのです。
何をいつダンプするか
- 各ウィキメディアプロジェクトのコンテンツおよびメタデータ
- 各ウィキメディアプロジェクトのCirrus検索インデックス
- ウィキデータのエンティティ
- 短縮URLのマッピング
- ダンプの頻度
- その他...
ダンプの取得
- ファイルサイズに関する警告
- ダウンロード用ミラーおよびトレント
- ダウンロード:XML/SQL ダンプ(ウィキのメタデータやコンテント)
- ダウンロード:ウィキデータのエンティティ
- ダウンロード:その他のダンプやデータセット
- 旧版ダンプ
- ダウンロードのためのツール
- ダンプの実行状況の確認
ダンプの利用と再利用
ヘルプ
- 一般的なダンプ関連の質問用メーリングリスト:Xmldatadumps-l
- より広範な技術的議論のためのメーリングリスト:wikitech
- バグ報告用 Phabricatorプロジェクト(アカウント要)
- #wikimedia-tech接続 リアルタイムチャット用IRCチャンネル:#wikimedia-techconnect(タイムゾーンによる)
- 一般的なインポート問題に関する支援
FAQ・さらなる資料
- ダンプに関するFAQ
- ウィキペディア・ダンプのヘルプページ
- ウィキデータ・ダンプ情報
- その他