Template:Model card ORES damaging edit/cs

Model card
Model card
This page is an on-wiki machine learning model card.
	A model card is a document about a machine learning model that seeks to answer basic questions about the model.
Model Information Hub
Model creator(s)	Aaron Halfaker (User:EpochFail) and Amir Sarabadani
Model owner(s)	WMF Machine Learning Team (ml@wikimediafoundation.org)
Model interface	Ores homepage
Code	ORES Github, ORES training data, a ORES model binaries
Uses PII	No
In production?	Yes
Which projects?	{{{language}}} {{{project}}}
	Tento model používá 'data o revizi' k předpovědi 'pravděpodobnosti, že revize je škodlivá'.
	v; t; e;

Motivace

Některé úpravy dobré víry škodí článku a ne všechny škodlivé úpravy jsou špatné víry. Tento model (spolu s modelem dobré víry) je určen k rozlišení mezi úpravami, které jsou úmyslně škodlivé (zlé víry/vandalismus) a úpravami které jsou zamýšleny být škodlivé (dobré úpravy/zlé víra).

Tento model pomáhá přednostně posuzovat potenciálně škodlivé úpravy nebo vandalismus. Poskytuje předpověď o tom, zda je daná revize škodlivá, a poskytuje určité pravděpodobnosti, aby sloužila jako měřítko její úrovně důvěry.

Uživatelé a použití

Use this model for

Tento model by měl být použit pro stanovení priorit pro přezkoumání a případné reverzi vandalismu na české Wikipedii.
Tento model by měl být použit pro odhalení škodlivých příspěvků redaktorů na české Wikipedii.

Don't use this model for

Tento model by neměl být použit jako konečný rozhodčí, zda by úprava měla být nebo není považována za škodlivou.
Model by neměl být používán mimo českou Wikipedii.

Current uses

Česká Wikipedie používá model jako službu pro usnadnění efektivního triage vandalismu, úpravy recenzí nebo podpory nově příchozích.

Každý může na individuální bázi předložit správně formátovanou výzvu API ORES k danému přepracování a získat výsledek tohoto modelu.

Example API call:

{{{model_input}}}

Etické úvahy, upozornění a doporučení

Česká Wikipedie se rozhodla používat tento model.

Tento model je známý tím, že dává novějším editorům vyšší pravděpodobnost škodlivých úprav.

Vnitřní nebo vnější změny, které by mohly způsobit, že tento model bude zastaralý nebo už nebude použitelný, jsou:

Dátový drift znamená, že údaje o výcviku pro model již nejsou použitelné.
Neplní požadované výkonnostní metry v produkci.

Česká Wikipedie se rozhodla už tento model nepoužívat.

Model

Výkon

Test data confusion matrix: {{{confusion_matrix}}}

Test data sample rates: {{{sample_rates}}}

Test data performance: {{{performance}}}

Provádění

Model architecture

{{{model_architecture}}}

Output schema

{{{model_output_schema}}}

Example input and output

Input:

{{{model_input}}}

Output:

{{{model_output}}}

Údaje

Data pipeline

Tabulární údaje o úpravách jsou shromažďovány z Mediawiki API, předem zpracovány (přístupněním přeměny protokolu, připojení k datům veřejného editora atd.), a připojeny k uživatelsky generovaným štítkám dobré víry/škodné.

Training data

Tento model byl vyškolen pomocí rukově označených výcvikových dat starých několik let.

Test data

Zpráva o výcviku byla vypočítavá náhodným rozdělením výcvikových údajů, které se vypočítají z výcvikového procesu.

Licence

Code: MIT license
Model: MIT license

Citát

Cite this model card as:

@misc{
  Triedman_Bazira_2023_{{{language}}}_{{{project}}}_damaging,
  title={ {{{language}}} {{{project}}} damaging model card },
  author={ Triedman, Harold and Bazira, Kevin },
  year={ 2023 },
  url={ https://meta.wikimedia.org/wiki/Model_card_ORES_damaging_edit/cs }
}