Template:Model card wikidata item quality/de

From Meta, a Wikimedia project coordination wiki
Model card
This page is an on-wiki machine learning model card.
A diagram of a neural network
A model card is a document about a machine learning model that seeks to answer basic questions about the model.
Model Information Hub
Model creator(s)Aaron Halfaker (User:EpochFail) and Amir Sarabadani
Model owner(s)WMF Machine Learning Team (ml@wikimediafoundation.org)
Model interfaceOres homepage
CodeORES Github, ORES training data und ORES model binaries
Uses PIINo
In production?Yes
Which projects?{{{language}}} {{{project}}}
Dieses Modell verwendet 'Daten über eine Revision' um zu prognostizieren 'die Wahrscheinlichkeit, dass der Posten einer bestimmten en:WP:Content Assessment ist


Motivation[edit]

Diese Modellkarte beschreibt ein Modell zur Vorhersage der Qualität von Wikidata-Elemente. Sie verwendet Strukturmerkmale, die aus dem Elemente extrahiert werden, um Wikidata -Elemente mit einem Wahrscheinlichkeitspunkt für jede Elemente-Qualitätsklasse zu kennzeichnen.

Wikidata-Elemente reichen in Qualität von reichen, gut illustrierten, vollständig verfassten Elemente, die ihr Thema vollständig abdecken und leicht zu lesen sind, bis hin zu Stuben, die das Thema des Elements definieren, aber nicht viel mehr Informationen bieten. Es ist sehr nützlich, zwischen diesen Extremen und den verschiedenen Qualitätsstadien entlang dieses Spektrums zuverlässig zu unterscheiden. Wikidata -Editoren haben reiche Rubriken entwickelt, um die Qualität von Wikidata Elemente zu bewerten und bewerten ständig die Qualität des Elements, um die Koordinierung der Arbeit an den Wikis zu unterstützen. Die Redakteure verwenden diese Qualitätswerte, um ihre Arbeit zu bewerten. Forscher verwenden diese qualitativwerte, um die Dynamik von Inhalten zu verstehen. Entwickler verwenden diese Qualitätsaufzeichnungen als Filter, wenn sie Empfehlungssysteme oder andere Werkzeuge erstellen.

Wikidata verändert sich ständig, was es für Redakteure zeitaufwendig (und weitgehend unmöglich) macht, diese Qualitätsbewertungen vollständig und aktuell zu halten. Ein automatisches Qualitätsmodell kann dazu beitragen, diese Lücken zu füllen, indem die Qualität von Artikeln bewertet wird, die nicht bewertet wurden oder sich seit ihrer letzten Bewertung wesentlich verändert haben.

Nutzer und Nutzung[edit]

Use this model for
  • Analyse von hochrangigen Entwicklungen in der Qualität der Artikel
  • Filterung / Ranking von Elementen in Werkzeugen - z.B. nur niedrigwertige Elemente in einem Empfehlungssystem angezeigt
  • die Identifizierung potenzieller Möglichkeiten zur Verbesserung von Punkten - z.B. die Verwendung des niedrigsten Werts von dem Modell als Empfehlung
Don't use this model for
  • Projekte außerhalb von Wikidata
  • Wikipedia:Namenraum
Current uses

Dieses Modell ist Teil von ORES und ist allgemein über API zugänglich. Es wird für die Analyse von Wikidata, Plattformforschung und andere Aufgaben auf Wiki verwendet.

Example API call:
{{{model_input}}}

Ethische Überlegungen, Vorsichtsmaßnahmen und Empfehlungen[edit]

  • Die Quelldaten für dieses Modell sind mehrere Jahre alt - Datentrieb kann die aktuellen Ergebnisse im Vergleich zu den Schuldaten verzerren.
  • Das Modell berücksichtigt derzeit nicht die Qualität des spezifischen Schreibens, so dass ein detaillierter Artikel mit vielen falschen Angaben als hochwertig eingestuft werden kann.
  • Verschiedene Wikis haben verschiedene Kennzeichnungsscheme - verwenden Sie dieses Modell nicht in Verbindung mit anderen Modellen, um eine Interwiki-Analyse durchzuführen.

Modell[edit]

Leistung[edit]

Test data confusion matrix: {{{confusion_matrix}}}

Test data sample rates: {{{sample_rates}}}

Test data performance: {{{performance}}}

Durchführung[edit]

Model architecture
{{{model_architecture}}}
Output schema
{{{model_output_schema}}}
Example input and output
Input:
{{{model_input}}}

Output:

{{{model_output}}}

Daten[edit]

Data pipeline
Die Etiketten wurden aus den Urteilen der Qualität von Artikeln auf der Wiki gesammelt und dann mit Revisionsfunktionen zusammengefasst, um einen Quelldatensatz zu erstellen.
Training data
Die Zugdaten wurden automatisch von den Testdaten mit Hilfe der Funktionalität des Revscoring-Repositoriums getrennt.
Test data
Die Testdaten wurden automatisch und zufällig von den Zugdaten abgetrennt, indem sie Funktionen aus dem Reverscoring-Repository nutzten und während des Trainingsprozesses aufgehalten wurden.

Lizenzen[edit]

Zitat[edit]

Cite this model card as:

@misc{
  Triedman_Bazira_2023_{{{language}}}_{{{project}}}_article_topic,
  title={ {{{language}}} {{{project}}} article topic model card },
  author={ Triedman, Harold and Bazira, Kevin },
  year={ 2023 },
  url={ https://meta.wikimedia.org/wiki/Model_card_wikidata_item_quality/de }
}