Template:Model card ORES damaging edit/de

From Meta, a Wikimedia project coordination wiki
Model card
This page is an on-wiki machine learning model card.
A diagram of a neural network
A model card is a document about a machine learning model that seeks to answer basic questions about the model.
Model Information Hub
Model creator(s)Aaron Halfaker (User:EpochFail) and Amir Sarabadani
Model owner(s)WMF Machine Learning Team (ml@wikimediafoundation.org)
Model interfaceOres homepage
CodeORES Github, ORES training data und ORES model binaries
Uses PIINo
In production?Yes
Which projects?{{{language}}} {{{project}}}
Dieses Modell verwendet 'Daten über eine Revision' um zu prognostizieren 'die Wahrscheinlichkeit, dass die Revision schädlich ist'.


Motivation[edit]

Einige gutvertraute Bearbeitungen schädigen einen Artikel, und nicht alle schädlichen Bearbeitungen sind in schlechtem Glauben.

Dieses Modell hilft, die Überprüfung potenziell schädlicher Bearbeitungen oder Vandalismus zu priorisieren. Es bietet eine Vorhersage darüber, ob eine bestimmte Revision schädlich ist oder nicht, und bietet einige Wahrscheinlichkeiten, als Maß für ihr Vertrauensniveau zu dienen.

Nutzer und Nutzung[edit]

Use this model for
  • Dieses Modell sollte zur Priorisierung der Überprüfung und der möglichen Rückkehr von Vandalismus auf der Deutschen Wikipedia verwendet werden.
  • Dieses Modell sollte zur Erkennung schädlicher Beiträge von Redaktoren auf der deutschen Wikipedia verwendet werden.
Don't use this model for
  • Dieses Modell sollte nicht als letzter Schiedsrichter verwendet werden, ob eine Bearbeitung als schädlich betrachtet werden sollte oder nicht.
  • Das Modell darf nicht außerhalb der deutschen Wikipedia verwendet werden.
Current uses
  • Die deutsche Wikipedia nutzt das Modell als Dienstleistung zur Erleichterung einer effizienten Vandalismus-Triation, zum Bearbeiten von Bewertungen oder zur Unterstützung neuer Anfänger.
  • Jeder kann eine ordnungsgemäß formatierte API-Anruf zur Revision an ORES übermitteln und das Ergebnis dieses Modells erhalten.
Example API call:
{{{model_input}}}

Ethische Überlegungen, Vorsichtsmaßnahmen und Empfehlungen[edit]

Die deutsche Wikipedia beschloss, dieses Modell zu verwenden.

Dieses Modell ist bekannt, um neueren Redakteuren eine höhere Wahrscheinlichkeit zu geben, dass schädliche Bearbeitungen.

Interne oder externe Änderungen, die dieses Modell veraltet oder nicht mehr nutzbar machen könnten, sind:

  • Datendrift bedeutet, dass die Trainingsdaten für das Modell nicht mehr nutzbar sind.
  • Er erfüllt nicht die gewünschten Leistungsindikatoren in der Produktion.
  • Die deutsche Wikipedia-Community beschließt, dieses Modell nicht mehr zu verwenden.

Modell[edit]

Leistung[edit]

Test data confusion matrix: {{{confusion_matrix}}}

Test data sample rates: {{{sample_rates}}}

Test data performance: {{{performance}}}

Durchführung[edit]

Model architecture
{{{model_architecture}}}
Output schema
{{{model_output_schema}}}
Example input and output
Input:
{{{model_input}}}

Output:

{{{model_output}}}

Daten[edit]

Data pipeline
Tabellendaten über Bearbeitungen werden aus der Mediawiki API gesammelt, vorverarbeitet (durch Log-Transformationen, mit öffentlichen Editordaten verbunden usw.), und mit benutzergenerierten Goodfaith-/Schädlichkeitsetiketten verbunden.
Training data
Dieses Modell wurde mit handverzeichneten Trainingsdaten ausgerüstet, die mehrere Jahre alt sind.
Test data
Die hier ermittelten Statistiken wurden durch die Auswahl einer zufälligen Aufteilung der Ausbildungsdaten berechnet, die sich aus dem Ausbildungsprozess herausstellen soll.

Lizenzen[edit]

Zitat[edit]

Cite this model card as:

@misc{
  Triedman_Bazira_2023_{{{language}}}_{{{project}}}_damaging,
  title={ {{{language}}} {{{project}}} damaging model card },
  author={ Triedman, Harold and Bazira, Kevin },
  year={ 2023 },
  url={ https://meta.wikimedia.org/wiki/Model_card_ORES_damaging_edit/de }
}