Research:Revision scoring as a service/Word lists/fa

From Meta, a Wikimedia project coordination wiki
This is an archived version of this page, as edited by Dexbot (talk | contribs) at 12:13, 8 August 2015 (Bot: update results). It may differ significantly from the current version.


ISO code Language Generated list Badwords Informal words Stopwords Dictionary Stemmer Contact person Wiki labels Interface Forms Campaign Needs
fa فارسی (Wikipedia) 250 21 - - enchant.Dict - See: Word lists translated no no almost complete [1] -
Generated list [2]

Words in the generated list commonly appear in reverted revisions but not in others. This list is generated using a TF-IDF approach.

  1. آستارایی
  2. آسترکی
  3. آشكار
  4. آقاي
  5. آله
  6. آنكه
  7. آن‌هو
  8. آيا
  9. آيات
  10. آينده
  11. آی‌ام‌دی‌بی
  12. اایران
  13. اجازه‌
  14. اجازه‌نامه‌ای
  15. اختيار
  16. ادعاي
  17. ادغامت
  18. افتخار‌آفرینی
  19. افرادي
  20. افريد
  21. افكار
  22. اكنون
  23. السلام
  24. الهي
  25. اميد
  26. انديشه
  27. انكار
  28. ايد
  29. ايرانيان
  30. ايشان
  31. ايم
  32. ايمان
  33. اينجا
  34. اينكه
  35. اينها
  36. اچمی
  37. ایتالیک
  38. ایکا
  39. باحضوراستادان
  40. بارثبت
  41. باشيد
  42. باشيم
  43. بايد
  44. بجرم
  45. بدين
  46. برقرارذی
  47. برووتو
  48. بزرگي
  49. بسم
  50. بسياري
  51. بعضي
  52. بلكه
  53. بهرامسری
  54. بوديم
  55. بيان
  56. بياوريد
  57. بيت
  58. بيرون
  59. بيشتري
  60. بگويد
  61. بگيرد
  62. تالشان
  63. تدين
  64. تربيتي
  65. ترك
  66. تروریستش
  67. تغییرکتاب
  68. تقدیرازتمامی
  69. تقدیرازر
  70. تقدیرازمجمع
  71. تلویزبون
  72. تمامي
  73. توانيد
  74. جاي
  75. جايي
  76. جمهورمحترم
  77. جنده
  78. حالي
  79. حتي
  80. حركت
  81. حقيقت
  82. حق‌
  83. حكومت
  84. حمايت
  85. حکایتها
  86. خداي
  87. خواهيد
  88. خواهيم
  89. خوبي
  90. خويش
  91. خيانت
  92. خيلي
  93. داديم
  94. دارستانی
  95. داريد
  96. داريم
  97. دراستراسبورگ
  98. درسمینارمولانا
  99. درك
  100. دروغ
  101. دلايل
  102. دنيا
  103. دهيد
  104. دهيم
  105. ديد
  106. ديدم
  107. ديدند
  108. ديديم
  109. دين
  110. ديگران
  111. ديگري
  112. ذكر
  113. ذلل
  114. رسيد
  115. رسيدن
  116. رسيده
  117. رضوانهشر
  118. رهبري
  119. روزي
  120. زماني
  121. زياد
  122. زيادي
  123. زيرا
  124. زیت
  125. زیرصفحه
  126. سختي
  127. سعي
  128. سوي
  129. سیبلی
  130. شايد
  131. شايسته
  132. شخصي
  133. شماست
  134. شنکجه
  135. شهادت
  136. شويد
  137. شويم
  138. شیرینم
  139. صحيح
  140. ضعيف
  141. عضوبسیج
  142. عقيده
  143. عليه
  144. فدارل
  145. فردي
  146. فرمایید
  147. فرمود
  148. فرمودند
  149. فرموده
  150. فرودگاهی
  151. فرودگاه‌های
  152. فرياد
  153. فكر
  154. قالب‌بندی‌نشده
  155. قوي
  156. كارها
  157. كافر
  158. كجا
  159. كدام
  160. كردم
  161. كردن
  162. كرديد
  163. كرديم
  164. كسان
  165. كساني
  166. كسي
  167. كشيد
  168. كشيدن
  169. كمتر
  170. كنم
  171. كنيد
  172. كنيم
  173. لعنت
  174. مامورهای
  175. مبتکرشیوه
  176. محک
  177. مدیربخش
  178. مشارکت‌ها
  179. مشاورمدیرکل
  180. منو
  181. ميل
  182. مي‌گويد
  183. میشه
  184. نبايد
  185. نتيجه
  186. نداريم
  187. نزديك
  188. نظامي
  189. نفرستید
  190. نكته
  191. نكرده
  192. نكند
  193. نكنيد
  194. نمايد
  195. نمايند
  196. نمي
  197. نورمحمدی
  198. نوعي
  199. نيست
  200. نيستند
  201. هستيد
  202. هستيم
  203. هلاك
  204. همزیستس
  205. هميشه
  206. همگ
  207. هنگامي
  208. هيچ
  209. هيچگونه
  210. ه‌کننده
  211. واحدتهران
  212. وارمن
  213. وتاثیردرنظام
  214. وجشنواره
  215. وسیصدهزار
  216. وشاهدوایثارگران
  217. وصندوق
  218. وقتي
  219. ولي
  220. ياد
  221. ياري
  222. يعني
  223. پاك
  224. پاي
  225. پيامبر
  226. پيدا
  227. چتاپ
  228. چنين
  229. چيز
  230. چيزي
  231. چيست
  232. ژینگیاو
  233. کرسنگی
  234. کشورباپیام
  235. کشوروبین
  236. کومونیوس
  237. کون
  238. کونی
  239. کیر
  240. کیرم
  241. گاه
  242. گرذدید
  243. گروهي
  244. گفتيم
  245. گمراه
  246. گويد
  247. گيري
  248. گگردیده
  249. یاتا
  250. یونسکودرایران
Generated common words

Common words appear on all revisions reverted or otherwise. In the English language this would include words like 'the' or 'is' which are meaningless on their own. This list is generated using a TF-IDF approach.

  1. آثار
  2. آری
  3. آغاز
  4. آمریکا
  5. آنها
  6. اثر
  7. اساس
  8. است
  9. استان
  10. استفاده
  11. اسلام
  12. اسلامی
  13. اشاره
  14. اصلی
  15. اطلاعات
  16. افراد
  17. اما
  18. امکان
  19. انبار
  20. انجام
  21. اند
  22. اندازه
  23. انگلیسی
  24. اهالی
  25. اهل
  26. اول
  27. اولین
  28. اين
  29. اگر
  30. ایالات
  31. ایران
  32. ایرانی
  33. این
  34. بار
  35. بازیابی
  36. باشد
  37. بانی
  38. باید
  39. بخش
  40. بدون
  41. برای
  42. برخی
  43. بزرگ
  44. بسیار
  45. بسیاری
  46. بعد
  47. بنا
  48. بناهای
  49. بندانگشتی
  50. بود
  51. بودند
  52. بوده
  53. بیرون
  54. بیش
  55. بیشتر
  56. بین
  57. تاریخ
  58. تاریخی
  59. ترتیب
  60. ترتیب‌پیش‌فرض
  61. ترین
  62. تشکیل
  63. تصویر
  64. تغییر
  65. تغییرمسیر
  66. تلفن
  67. تمام
  68. تنها
  69. تهران
  70. توجه
  71. توسط
  72. جای‌های
  73. جستارهای
  74. جعبه
  75. جلالی
  76. جمله
  77. جنگ
  78. جهان
  79. جهانی
  80. حال
  81. حدود
  82. حذف
  83. حروف
  84. خرد
  85. خود
  86. داد
  87. داده
  88. دارای
  89. دارد
  90. دارند
  91. داشت
  92. داشته
  93. دانشگاه
  94. درباره
  95. درگذشتگان
  96. دست
  97. دلیل
  98. دهد
  99. دور
  100. دوران
  101. دوره
  102. دوم
  103. دیرینگی
  104. دیگر
  105. دیگری
  106. راه
  107. ربات
  108. رباتیک
  109. رده
  110. رسمی
  111. روز
  112. روی
  113. روی‌نقشه
  114. زادگان
  115. زبان
  116. زمان
  117. زمانی
  118. زمینه
  119. زنده
  120. زندگی
  121. زیادی
  122. زیر
  123. ساخت
  124. ساخته
  125. سازمان
  126. سال
  127. سال‌های
  128. سده
  129. سرعت
  130. سپتامبر
  131. سیاسی
  132. شامل
  133. شدن
  134. شدند
  135. شده
  136. شده‌است
  137. شرکت
  138. شهر
  139. شهرستان
  140. شود
  141. صفحه
  142. صورت
  143. طول‌جغرافیایی
  144. عرض‌جغرافیایی
  145. علی
  146. عنوان
  147. غیر
  148. فارسی
  149. فعالیت
  150. فعلی
  151. فهرست
  152. فوریه
  153. قبل
  154. قدیمی
  155. قرار
  156. مالک
  157. مانند
  158. ماه
  159. متحده
  160. محل
  161. محلی
  162. محمد
  163. مختلف
  164. مدرک
  165. مردم
  166. مرمت
  167. مرکز
  168. مرکزی
  169. مرگ
  170. مسکونی
  171. مسیر
  172. معروف
  173. مقاله
  174. مقاله‌های
  175. ملی
  176. منابع
  177. مناطق
  178. منبع
  179. منطقه
  180. مورد
  181. میان
  182. میان‌ویکی
  183. میلادی
  184. می‌باشد
  185. می‌توان
  186. می‌دهد
  187. می‌شود
  188. می‌شوند
  189. می‌کند
  190. می‌کنند
  191. نادرست
  192. ناشر
  193. نام
  194. نام‌های
  195. نشان
  196. نشانی
  197. نشریه
  198. نظر
  199. نفر
  200. نوع
  201. نویسنده
  202. نیز
  203. نیست
  204. های
  205. هزار
  206. هستند
  207. همان
  208. همراه
  209. همه
  210. همچنین
  211. همین
  212. وابسته
  213. واقع
  214. وبگاه
  215. وب‌گاه
  216. وجود
  217. ولی
  218. ویکی
  219. ویکی‌انبار
  220. ویکی‌سازی
  221. ویکی‌پدیای
  222. پانویس
  223. پایان
  224. پایه
  225. پرونده
  226. پیش
  227. پیوند
  228. چند
  229. چون
  230. ژورنال
  231. کار
  232. کاربری
  233. کتاب
  234. کرد
  235. کردن
  236. کردند
  237. کرده
  238. کشور
  239. کشورهای
  240. کند
  241. کنند
  242. کنونی
  243. گرفت
  244. گرفته
  245. گروه
  246. گفته
  247. یادکرد
  248. یافت
  249. یونسکو
  250. یکی
Bad words

Bad words are words that would be commonly associated with vandalism. They are generally used to insult or be vulgar. This includes curse words, racial slurs, assertions of- and prejudices against sexual preferences.

  1. جنده
  2. کاکاسیاه
  3. آشغال
  4. آله
  5. السلام
  6. ایتالیک
  7. بخواب
  8. برووتو
  9. جمهورمحترم
  10. فرمود
  11. فرمودند
  12. فرموده
  13. لعنت
  14. مشنگ
  15. ننتو
  16. کون
  17. کونی
  18. کیر
  19. گائیدم
  20. گوزیده
  21. کیرم

Informal words

Informal words are words unwelcome on article namespace but would be acceptable on talk pages. This would include words such as 'hello' or 'hahaha' which would be fine in discussions but not in articles.

Needs informal words... Use |list-informal=