Wiktionary Cognate Dashboard/ja

From Meta, a Wikimedia project coordination wiki
This page is a translated version of the page Wiktionary Cognate Dashboard and the translation is 88% complete.

ようこそ! こちらはWiktionary 同語源ダッシュボードの説明文書です。

ダッシュボードでは、ウィクショナリーの編集者や周辺のコミュニティに対して、それぞれのプロジェクトでまだ手を付けていない部分 あるいは未着手の項目探し に取り組む場を提供します。

概要

ウィクショナリー同語源ダッシュボードを開発したウィキメディア・ドイツ支部は、Wiktionary編集者とコミュニティに下記の機能を提供することを目標にしていました。

  • ウィクショナリーの項目で、言語間リンクが最も多いのに特定の言語版にページを立項してないものはどれか検出する。
  • ウィクショナリーの複数の言語版を任意に選んで、言語間リンクを数的に把握する。
  • 特定の言語版にない項目が、他の何件の言語版に登録されているか把握する。
  • 特定の言語版を別の言語版1件と対照し、未登録項目のうち他方に登録されている項目を抽出する。
  • 複数の言語版のウィクショナリーの関連性について、重点情報を視覚的に理解する。

ダッシュボードの機能はすべてタブで管理します(ダッシュボードの画面左に常に表示)。以下に各タブを1件ずつ取り上げ、用途と機能を説明します。ダッシュボードそのものには詳細な使用ガイドが付いています。

マイ・ウィクショナリー

利用者がドロップダウン・メニューからウィクショナリーを選択 すると、ダッシュボードがデータを3種類出力します。表を画面左に2件(垂直方向)右に1件表示します。

1番目の表 (青い線)はウィクショナリー上位25件と、特定のウィクショナリーを対照して最他のリンク を示します。対照先のウィクショナリー群を2文字の略号で示して水平軸に配置します。水平軸に示した数値は、対照元のウィクショナリーに対するリンク数です。

Decreasing statistical curve
図1:共有リンクが最も多い。ウィクショナリー同語源ダッシュボード

2番目の表(赤い線)は1番目の表の直下に作成され、対照元のウィクショナリーとのリンク数が最も少ない 25件のウィクショナリーを表します。水平軸に並べてあり、垂直軸は共有リンクの件数を示します。

Decreasing statistical curve
図2:共有リンクが最も少ない。ウィクショナリー同語源ダッシュボード

ウィクショナリーのリンクデ-タセット の表には項目が3列あり、上記2件の表の隣に作成されます。(1) ソース (対照元)とは利用者が選択したウィクショナリーのこと。(2) ターゲット(対照先)とは前者を除くすべてのウィクショナリー群。(3) リンク数 とはソースとターゲットの相関関係をリンク数で示します。ダウンロード (csv) ボタンを使うと、利用者は表全体を出力します。

どの欄を指標にしても並べ替えができ、ウィクショナリー欄あるいはリンク数欄の数値で検索します。初期設定ではウィクショナリー25件をソース(利用者が選択したウィクショナリー)との共有リンク数の降順に並べます。利用者はページ単位で表を閲覧する(表の右下辺にあるボタンを利用)、もしくはページごとに表示するウィクショナリーを25件以上に設定する(テーブル上部の「項目表示」ボタン)ことができます。

ハブ型のタブ

このタブはウィクショナリー間にネットワークを築き、ウィクショナリー1件をノード1個で表してそれぞれの2文字の言語コードを添えてあります。それぞれの「ノード」(ウィクショナリー)から、他のウィクショナリーで共有リンクが最大の3件に矢印が伸びています。共有リンクが多いほど、ウィクショナリー同士を結ぶ線が太くなります。

この方法で表示されるネットワークは、重要な「ハブ」を認識するのに役立ちます。矢印が最も多く集まるウィクショナリーは、他のウィクショナリーとの共有リンクが最も多く、ノードの大きさにそれが正確に反映しています。「共有リンクが最多のウィクショナリーとは、そのウィクショナリーを表すノードが大きく、そのウィクショナリーへとつながる矢印の数が多い」という意味です。

このネットワークに表現されるノード数とリンク数に応じて、利用者の相互作用 は複雑さが変わります。ノードをドラッグ したり移動 したりでき、特定のウィクショナリーを取り出してその「隣接関係」を検討できます(そのウィクショナリーからリンクが発するか到着するか)。特定のウィクショナリーをクリック すると直近の「隣接関係」のみ示し、ネットワークの他の部分には影がかかります。マウスのホイールを利用してネットワークの表示をズームインズームアウト できます。利用者はラベルで選択 ドロップダウンメニューから特定のウィクショナリーを選んで検証できます。

ノードが同色 のウィクショナリーは、他のウィクショナリーとの相互作用のパターンが相似です。

図3:ウィクショナリー同語源ダッシュボード

非ハブ型のタブ

このタブは、ハブ型タブとまったく同じ機能を備え、矢印が伸びる先は、共通リンクが最少 のウィクショナリー3件に向かいます。これにより、リンク関係がもっとも希薄なウィクショナリーを認識することができます。

言語間リンクのデータセット用タブ

このタブを利用すると、利用者はリンクのデータセット全体 の閲覧と並べ替え、検索とダウンロードができます。出力される表に次の欄があります。対照元対照先リンク数 の3つで、この説明文書の「マイ・ウィクショナリー」タブに記された構文論と同じ意味を持ちます。ウィクショナリー同士の組み合わせ可能なペアを一覧にしました(どのウィクショナリーも対照元と対照先になり得ることから、各ペアは表に2回ずつ示されます)。表の列見出しのすぐ上に検索フィールドが配置され、利用者はこれを使うと、特定のウィクショナリーを対照元(ターゲット)と他のウィクショナリーとのどんな関係性を把握したいか、ニーズに正確に合わせて検査することができます。

足りないものタブ

利用者はドロップダウン・メニューから特定のウィクショナリーを選択します。するとダッシュボードはその他のウィクショナリーには存在するが、対照元のウィクショナリーにはない項目1,000件 を表に示します。さらにデスクトップ番で表の上部にあるドロップダウンボタン (csv) を押すと、カンマ区切りのファイル(たとえばLibre Calcなど、さまざまな表計算ソフトで開くファイル)。

対照用タブ

最初に利用者は対照元 を選択し、対照先 のウィクショナリーはドロップダウン・メニューから指定します。次に作成ボタンを押します 。するとダッシュボードが対照元のウィクショナリーにはないが参照先に存在するすべての項目を表に抽出 します。ここでダウンロードボタン (csv) を押すと、利用者は抽出結果をカンマ区切りのファイルとして、ローカルで作業ができます。規模の大きな(つまり大量の項目を含む)ウィクショナリーを考察に加える場合には、このオプションの使用が強く推奨されます

この機能はまだ実験段階です。抽出結果は正確ですが、小規模もしくは中規模のウィクショナリー同士と比べると、規模の大きな場合の比較には時間がかかります。改善が行われるまでは、利用者には辛抱強く待っていただくほかありません(対照作業中に作成 ボタンを押し、画面右下角に表示されるフィードバックを利用してダッシュボードにフィードバックをお送りください)。対照作業の効率向上のために、日々、努力を続けています。

Most popular tab

This table presents the entries that have the biggest number of links in Cognate. For performance reasons, the list is constrained to encompass only the entries that appear in at least 10 Wiktionaries.

関連情報

ウィクショナリー同語源ダッシュボードはプログラム言語Rを使って開発し、 RStudio Shiny技術のサポート対象で、フロントエンドはRStudio Shiny Serverの無料のオープンソース版で走らせています。ウィクショナリーの基本情報が依拠するデータベースはMediaWiki Cognate 拡張機能であり - 名前にCognate と付く由来になっています。ダッシュボードのUIには改善の余地があります。

典拠は直接、 同語源公開データセットから開くこともできます。

フィードバック

問題点やご質問、新機能の提案はトークページにて投稿をお待ちしています。