Jump to content

Template:Model card ORES goodfaith edit/he

From Meta, a Wikimedia project coordination wiki
Model card
This page is an on-wiki machine learning model card.
A diagram of a neural network
A model card is a document about a machine learning model that seeks to answer basic questions about the model.
Model Information Hub
Model creator(s)Aaron Halfaker (User:EpochFail) and Amir Sarabadani
Model owner(s)WMF Machine Learning Team (ml@wikimediafoundation.org)
Model interfaceOres homepage
CodeORES Github, ORES training data, and ORES model binaries
Uses PIINo
In production?Yes
Which projects?{{{language}}} {{{project}}}
מודל זה משתמש בנתונים על תיקון כדי לחזות את הסיכוי שהתיקון הוא בכוונה טובה.


מניע

[edit]

לא כל העדונים הנורעים הם ונדליזם. מודל זה נועד להבדיל בין עדונים הנרעים בכוונה (בדיקות/ונדליזם) לבין עדונים שנועדו להיות נורעים (עדונים טובים/זיקות ברצינות טובה). מודל זה מספק ניחוש על כך שכן או לא עורך נתון ברצינות, ומספק כמה סבירות כדי לשמש כמדוד של רמת האמון שלו. מודל הזה נשאף על ידי מחקר של מערכת בקרת איכות וקיפידיה ואת הפוטנציאל של מודלים זיהוי ונדלימיות שימשו גם כמערכות זיהוי חדשנים ברצינות.

משתמשים ושימוש

[edit]
Use this model for
  • מודל זה צריך לשמש כדי להעדפות את הביקורת והההפוך הפוטנציאלי של הפגיעה בוויקיפדיה העברית.
  • מודל זה צריך להיות בשימוש כדי לזהות תרומות ברצינות של עורכים בוויקיפדיה העברית.
Don't use this model for
  • מודל זה לא צריך להיות משמש כמבחן הסופי של אם תיקון צריך להיות נחשב לבנה.
  • המודל לא צריך לשמש מחוץ לוויקיפדיה העברית.
Current uses
  • ויקיפדיה העברית משתמשת במודל כשירות להקל על ביקורות עריכה יעילות או תמיכה של נוכחים חדשים.
  • על בסיס אינדיבידואלי, כל אחד יכול להגיש בקשה API פורמטת כראוי ל-ORES עבור תיקון נתון ולחזור לתוצאה של המודל הזה.
Example API call:
{{{model_input}}}

שיקולים, אזהרות וסיפורים אתיים

[edit]

ויקיפדיה העברית החליטה להשתמש במודל זה. עם הזמן, המודל הוכשר באמצעות שימוש בקהילה.

מודל זה ידוע כי נותן לעוררים חדשים סיכוי נמוך יותר לעקוב בכוונה טובה.

שינויים פנימיים או חיצוניים שיכולים להפוך את המודל הזה לשווא או לא שימושי יותר הם:

  • דריף נתונים פירושו נתונים אימונים למודל כבר לא ניתן להשתמש.
  • לא עונה למתרי ביצועים הרצויים בתפקוד.
  • קהילת ויקיפדיה העברית מחליטה לא להשתמש במודל הזה יותר.

דגם

[edit]

ביצועים

[edit]

Test data confusion matrix: {{{confusion_matrix}}}

Test data sample rates: {{{sample_rates}}}

Test data performance: {{{performance}}}

יישום

[edit]
Model architecture
{{{model_architecture}}}
Output schema
{{{model_output_schema}}}
Example input and output
Input:
{{{model_input}}}

Output:

{{{model_output}}}

נתונים

[edit]
Data pipeline
נתונים טבולריים על תיקונים נאספים מ-Mediawiki API, מעובדים מראש (דרך שינויים בלוג, חיבור עם נתונים של עורכים ציבוריים, וכו') ומושלבים עם תוויות טובות/נזקים שנוצרו על ידי המשתמש.
Training data
מודל זה הוכשר באמצעות נתונים אימונים ידניים שמותגים שיש להם שנים רבות.
Test data
הסטטיסטיקה שהוצגה כאן נחשדה על ידי בחירת חלוקה אקראית של נתוני הכשרה כדי לעמוד בתהליך הכשרה. המודל עושה אז תחזית על נתונים אלה, אשר נשווה לאמת הקרקע הבסיסית.

רישיונות

[edit]

ציטוט

[edit]

Cite this model card as:

@misc{
  Triedman_Bazira_2023_{{{language}}}_{{{project}}}_goodfaith,
  title={ {{{language}}} {{{project}}} goodfaith model card },
  author={ Triedman, Harold and Bazira, Kevin },
  year={ 2023 },
  url={ https://meta.wikimedia.org/wiki/Model_card_ORES_goodfaith_edit/he }
}