Jump to content

Template:Model card ORES article quality/fa

From Meta, a Wikimedia project coordination wiki
Model card
This page is an on-wiki machine learning model card.
A diagram of a neural network
A model card is a document about a machine learning model that seeks to answer basic questions about the model.
Model Information Hub
Model creator(s)Aaron Halfaker (User:EpochFail) and Amir Sarabadani
Model owner(s)WMF Machine Learning Team (ml@wikimediafoundation.org)
Model interfaceOres homepage
CodeORES Github, ORES training data, و ORES model binaries
Uses PIINo
In production?Yes
Which projects?{{{language}}} {{{project}}}
این مدل از دادهای مربوط به یک نظرسنجی برای پیش بینی احتمال اینکه مقاله یک ارزیابی خاص باشد استفاده می کند


انگیزه ها

[edit]

این کارت مدل یک مدل برای پیش بینی کیفیت مقالات ویکیپدیایی را توصیف می کند. از ویژگی های ساختاری استخراج شده از مقال برای برچسب گذاری مقالات ویکپیڈیا با نمره احتمال برای هر کلاس کیفیت مقاله استفاده می کند.

مقالات ویکی پدیا از مقالات غنی، با تصاویر و مرجع کامل که به طور کامل موضوع خود را پوشش می دهند و آسان برای خواندن هستند تا یک جمله استب های که موضوع مقال را تعریف می کنند اما اطلاعات بیشتری ارائه نمی دهند. بسیار مفید است که می توان با اطمینان بین این افراط ها و مراحل مختلف کیفیت در طول این طیف را تشخیص داد. ویرایشگران ویکی پدیه Rubrics غنی برای چگونگی ارزیابی کیفیت مقالات ویکپیڈیا توسعه داده اند و به طور مداوم کیفیت مقالات را ارزیابی می کنند تا به هماهنگی کار در ویکی ها کمک کنند. ویرایش کنندگان از این امتیازات کیفیت برای ارزیابی و اولویت بندی کار خود استفاده می کنند. محققان از این امتیاز های کیفیت برای درک پویایی محتوا استفاده می کنند . توسعه دهندگان از این امتیاز ها به عنوان فیلتر های کیفیت هنگام ساخت سیستم های توصیه کننده یا ابزارهای دیگر استفاده می کنند

ویکی پدیا همیشه در حال تغییر است، که باعث می شود که برای ویرایشگران زمان گیر (و تا حد زیادی غیرممکن) باشد که این ارزیابی های کیفیت را کامل و به روز نگه دارند. یک مدل کیفیت خودکار می تواند با ارزیابی کیفیت مقالات که ارزیابی نشده اند یا از آخرین ارزیابی به طور قابل توجهی تغییر کرده اند، به پر کردن این شکاف ها کمک کند. در این کار، می تواند محققان و توسعه دهندگان ابزار را با داده های سازگار تر فراهم کند و حتی به طور بالقوه به ویرایشگران کمک کند مقالات را که از ارزیابی انسانی بهره مند می شوند شناسایی کنند.

استفاده کنندگان و استفاده ها

[edit]
Use this model for
  • تحلیل های سطح بالا از روند کیفیت مقاله
  • فیلتر کردن / رتبه بندی مقالات در ابزار - به عنوان مثال فقط مقالات با کیفیت پایین را در یک سیستم توصیه کننده نشان می دهد
  • شناسایی راه های بالقوه برای بهبود مقالات - به عنوان مثال استفاده از کمترین ارزش از مدل به عنوان یک توصیه
Don't use this model for
Current uses

این مدل بخشی از ORES است و به طور کلی از طریق API قابل دسترسی است. برای تجزیه و تحلیل سطح بالا ویکیپدیا، تحقیقات سیستم عامل و سایر وظایف ویکی استفاده می شود.

Example API call:
{{{model_input}}}

ملاحظات اخلاقی، احتیاط ها و توصیه ها

[edit]
  • داده های منبع برای این مدل چندین سال قدیمی است - انحراف داده ها ممکن است تولیدات فعلی نسبت به داده های آموزش را تغییر دهد.
  • مدل در حال حاضر کیفیت نوشته های خاص را در نظر نمی گیرد، بنابراین یک مقاله طولانی با بسیاری از کلمات جعلی به عنوان کیفیت بالا ثبت می شود. با این حال، ساختار را در نظر می گیرد، بنابراین اگر مقاله طولانی دارای بخش های زیادی نباشد یا به طور ضعیف اشاره شود مجازات می شود.
  • ویکی های مختلف طرح های مختلف برچسب گذاری دارند - از این مدل در ترکیب با مدل های دیگر برای انجام تجزیه و تحلیل بین ویکی استفاده نکنید.

مدل ها

[edit]

عملکرد

[edit]

Test data confusion matrix: {{{confusion_matrix}}}

Test data sample rates: {{{sample_rates}}}

Test data performance: {{{performance}}}

اجرای آن ها

[edit]
Model architecture
{{{model_architecture}}}
Output schema
{{{model_output_schema}}}
Example input and output
Input:
{{{model_input}}}

Output:

{{{model_output}}}

داده ها

[edit]
Data pipeline
برچسب ها از قضاوت های کیفیت مقاله در ویکی جمع آوری شده و سپس با ویژگی های تجدید نظر برای ایجاد یک مجموعه داده منبع ترکیب شده اند.
Training data
داده های قطار به طور خودکار از داده های آزمایش با استفاده از قابلیت های ذخیره سازی revscoring جدا شده است.
Test data
داده های آزمایش به طور خودکار و تصادفی از داده های قطار با استفاده از قابلیت های ذخیره سازی revscoring و در طول فرآیند آموزش جدا شده و در طول این فرآیند نگهداری می شود. مدل سپس بر اساس این داده ها پیش بینی می کند که برای محاسبه آمار عملکرد با حقیقت زیربنایی زمین مقایسه می شود.

مجوز ها

[edit]

نقل قول

[edit]

Cite this model card as:

@misc{
  Triedman_Bazira_2023_{{{language}}}_{{{project}}}_article_quality,
  title={ {{{language}}} {{{project}}} article quality model card },
  author={ Triedman, Harold and Bazira, Kevin },
  year={ 2023 },
  url={ https://meta.wikimedia.org/wiki/Model_card_ORES_article_quality/fa }
}