Research:Revision scoring as a service/Word lists/af

From Meta, a Wikimedia project coordination wiki


ISO code Language Generated list Badwords Informal words Stopwords Dictionary Stemmer Contact person Wiki labels Interface Forms Campaign Needs
af Afrikaans (Wikipedia) 250 - - 250 - - See: Word lists requested no no no -
Generated list [1]

Words in the generated list commonly appear in reverted revisions but not in others. This list is generated using a TF-IDF approach.

  1. active
  2. aktivierte
  3. allemaal
  4. allgemeinverst
  5. amanbir
  6. anderen
  7. ark
  8. arzt
  9. auffassung
  10. autobiografie
  11. awesome
  12. ayan
  13. beantwortung
  14. beitrag
  15. belirli
  16. benzer
  17. best
  18. brin
  19. bulmu
  20. bulunan
  21. bulundu
  22. bölgelerde
  23. ccsa
  24. daha
  25. daim
  26. darstellung
  27. dingen
  28. discography
  29. dizin
  30. dwalings
  31. edildi
  32. edilir
  33. edilmi
  34. eeuwen
  35. ekle
  36. elde
  37. erisinde
  38. etmek
  39. etnik
  40. etti
  41. fazla
  42. fikir
  43. filmography
  44. formun
  45. forschung
  46. fterran
  47. fuck
  48. fucking
  49. gay
  50. gazete
  51. gazeteler
  52. gebeurtenissen
  53. geboren
  54. geldi
  55. gelmi
  56. gemeenteraad
  57. gemeinderat
  58. gen
  59. geometrik
  60. gesamtschule
  61. geschriften
  62. gesundheit
  63. goog
  64. googlepleks
  65. gportal
  66. grewal
  67. grundbegriffe
  68. guugal
  69. haber
  70. haline
  71. hello
  72. her
  73. herhangi
  74. hesab
  75. heute
  76. heutigen
  77. hij
  78. hikaye
  79. hikayeler
  80. hlt
  81. hoca
  82. hoi
  83. humanistisches
  84. ihre
  85. ilk
  86. imi
  87. inden
  88. indir
  89. inin
  90. iniuria
  91. inneren
  92. jaccoud
  93. jaoren
  94. jaren
  95. je
  96. jullie
  97. justizirrtümer
  98. kak
  99. kald
  100. karger
  101. kashmiri
  102. kattegerie
  103. kill
  104. kolay
  105. kont
  106. kontrolü
  107. krankheitsgeschehens
  108. ktan
  109. kullan
  110. kullanarak
  111. labilir
  112. lachanf
  113. lachens
  114. lanan
  115. landesring
  116. lanmas
  117. larak
  118. larda
  119. layan
  120. lerin
  121. licht
  122. lil
  123. lmas
  124. lol
  125. love
  126. minaj
  127. moehrlen
  128. musikerlebens
  129. musiktherapie
  130. möglichkeiten
  131. möhrlen
  132. ndan
  133. ndlicher
  134. neuken
  135. niggaz
  136. niggers
  137. noktalar
  138. nominations
  139. noted
  140. occupation
  141. oku
  142. olan
  143. olarak
  144. oldu
  145. olmad
  146. olmak
  147. olmas
  148. olmayan
  149. olmu
  150. olu
  151. olup
  152. olur
  153. onderliggend
  154. ortam
  155. overdrukken
  156. oyun
  157. oyunlar
  158. palestinearab
  159. pathophysiologie
  160. penis
  161. pennevrug
  162. pitaval
  163. plaudereien
  164. plwha
  165. poes
  166. produktedb
  167. prolegomena
  168. psychologische
  169. psychosomatik
  170. psychosomatischen
  171. raped
  172. rihanna
  173. rochaix
  174. rtschi
  175. sarkisozleri
  176. sarkisozu
  177. schlossrued
  178. schulreform
  179. schönen
  180. shit
  181. sipari
  182. siyasi
  183. snl
  184. songwriter
  185. sonsuz
  186. sonunda
  187. sorunlar
  188. spacebirdy
  189. stupid
  190. suck
  191. sucks
  192. summa
  193. sutermeister
  194. szilva
  195. sözleri
  196. sözü
  197. sürekli
  198. tanz
  199. taraf
  200. tarihinde
  201. tekrar
  202. temsil
  203. tercih
  204. termos
  205. this
  206. tied
  207. tijdschriftartikelen
  208. toplist
  209. typ
  210. tüm
  211. unless
  212. unu
  213. useprivacy
  214. usseren
  215. uut
  216. uygun
  217. varl
  218. vermi
  219. verzameling
  220. viaf
  221. viagra
  222. vocals
  223. wandlungen
  224. weinens
  225. weltanschauung
  226. welten
  227. wirklichkeitsfragen
  228. wohlfahrt
  229. wonnen
  230. yanl
  231. yatay
  232. yeri
  233. yerine
  234. yerini
  235. yerle
  236. yla
  237. yolo
  238. you
  239. your
  240. zamanda
  241. zamanla
  242. zijn
  243. zugleich
  244. önemli
  245. öyle
  246. üsü
  247. üzere
  248. üzerine
Generated common words

Common words appear on all revisions reverted or otherwise. In the English language this would include words like 'the' or 'is' which are meaningless on their own. This list is generated using a TF-IDF approach.

  1. aan
  2. accessdate
  3. afrika
  4. afrikaanse
  5. al
  6. align
  7. almanak
  8. amptelike
  9. and
  10. ander
  11. animalia
  12. april
  13. augustus
  14. authority
  15. baie
  16. beeld
  17. beeldbyskrif
  18. beeldgrootte
  19. begin
  20. bekend
  21. bestaan
  22. bevolking
  23. bevolkingsdigtheid
  24. binomial
  25. border
  26. breedtegraad
  27. bron
  28. by
  29. bynaam
  30. caption
  31. center
  32. chordata
  33. cite
  34. classis
  35. com
  36. commonskategorie
  37. daar
  38. dae
  39. dat
  40. deel
  41. defaultsort
  42. desember
  43. deur
  44. di
  45. die
  46. dis
  47. dit
  48. drie
  49. dst
  50. duimdrukkeretiketposisie
  51. duimdrukkerkaart
  52. duimdrukkerkaartbyskrif
  53. duimnael
  54. een
  55. eerste
  56. egter
  57. eksterne
  58. embleem
  59. engels
  60. familia
  61. februarie
  62. flag
  63. gebied
  64. geboortedatum
  65. geboorteplek
  66. gebruik
  67. geen
  68. gehad
  69. genoem
  70. genus
  71. geskiedenis
  72. gewone
  73. gregoriaanse
  74. groot
  75. grootste
  76. het
  77. hierdie
  78. hoogte
  79. html
  80. http
  81. hul
  82. hulle
  83. image
  84. in
  85. inheemse
  86. inligting
  87. inligtingskas
  88. inlyn
  89. isbn
  90. jaar
  91. januarie
  92. jare
  93. joohr
  94. jpg
  95. julie
  96. junie
  97. kaart
  98. kalender
  99. kan
  100. kategorie
  101. keer
  102. kinders
  103. klein
  104. kom
  105. laat
  106. land
  107. later
  108. left
  109. leiernaam
  110. leiertitel
  111. lengtegraad
  112. ligging
  113. link
  114. links
  115. lys
  116. lêer
  117. maak
  118. maande
  119. maar
  120. maart
  121. map
  122. meer
  123. mei
  124. mense
  125. met
  126. myl
  127. naam
  128. name
  129. nasionale
  130. nb
  131. nbsp
  132. nedersetting
  133. nedersettings
  134. net
  135. ng
  136. nie
  137. nog
  138. noord
  139. november
  140. ns
  141. nuwe
  142. of
  143. oktober
  144. old
  145. onder
  146. onderskrif
  147. ook
  148. oor
  149. op
  150. oppervlak
  151. ordo
  152. org
  153. ow
  154. party
  155. persent
  156. phylum
  157. plaaslike
  158. png
  159. punt
  160. px
  161. ref
  162. regeringstipe
  163. regnum
  164. regs
  165. right
  166. saadjie
  167. saam
  168. september
  169. sib
  170. sien
  171. skakelkode
  172. skakels
  173. slagspreuk
  174. slegs
  175. soos
  176. species
  177. staan
  178. stad
  179. state
  180. status
  181. ste
  182. sterfteplek
  183. stigting
  184. style
  185. suid
  186. svg
  187. sy
  188. taal
  189. taxobox
  190. teen
  191. terwyl
  192. the
  193. thumb
  194. tipe
  195. titel
  196. title
  197. toe
  198. tot
  199. totaal
  200. tussen
  201. twee
  202. tweede
  203. tyd
  204. tydens
  205. tydsone
  206. uit
  207. url
  208. van
  209. vanaf
  210. veral
  211. verenigde
  212. verwysings
  213. vir
  214. vlag
  215. voet
  216. voetnotas
  217. volgens
  218. voor
  219. waar
  220. was
  221. wat
  222. water
  223. web
  224. webwerf
  225. weer
  226. wes
  227. width
  228. word
  229. www

Bad words

Bad words are words unwelcome on any page. This would include curse words, spam and other content that would be reverted regardless of where it is inserted.

Needs bad words... Use |list-badwords=

Informal words

Informal words are words unwelcome on article namespace but would be acceptable on talk pages. This would include words such as 'hello' or 'hahaha' which would be fine in discussions but not in articles.

Needs informal words... Use |list-informal=