Research:Revision scoring as a service/Word lists/da

From Meta, a Wikimedia project coordination wiki
Jump to navigation Jump to search


ISO code Language Generated list Badwords Informal words Stopwords Dictionary Stemmer Contact person Wiki labels Interface Forms Campaign Needs
da dansk (Wikipedia) 250 - - - - - See: Word lists requested no no no -
Generated list [1]

Words in the generated list commonly appear in reverted revisions but not in others. This list is generated using a TF-IDF approach.

  1. abe
  2. aka
  3. amanbir
  4. anal
  5. anus
  6. arslonga
  7. ass
  8. awesome
  9. barnetøj
  10. bentøj
  11. bieber
  12. bitch
  13. blowjob
  14. bolle
  15. bollede
  16. boller
  17. bollet
  18. bums
  19. bøsse
  20. bøsser
  21. bøsserøv
  22. bøsserøve
  23. cest
  24. cet
  25. cock
  26. dejlig
  27. dejlige
  28. dejligt
  29. dick
  30. dig
  31. dildo
  32. dildoer
  33. diller
  34. dillermand
  35. din
  36. dum
  37. dumme
  38. elskede
  39. elsker
  40. example
  41. faggot
  42. fandme
  43. fed
  44. fede
  45. fedeste
  46. fisse
  47. fissen
  48. fisser
  49. fjogh
  50. forresten
  51. fritidstøj
  52. fuck
  53. fucker
  54. fucking
  55. fyrretøj
  56. gay
  57. gays
  58. gider
  59. grewal
  60. grim
  61. grimme
  62. grimt
  63. hader
  64. haha
  65. hahaha
  66. hahahah
  67. hahahaha
  68. hahahahaha
  69. hallo
  70. heeej
  71. heej
  72. hehe
  73. hehehe
  74. hej
  75. hejhej
  76. hejsa
  77. hey
  78. hihi
  79. hilsen
  80. hoar
  81. homo
  82. homoer
  83. husk
  84. hva
  85. hækletøj
  86. iala
  87. idiot
  88. idioter
  89. ikk
  90. indsæt
  91. jaja
  92. jeg
  93. jer
  94. joggingtøj
  95. kage
  96. kazanov
  97. kbhparker
  98. kedeligt
  99. klam
  100. klamme
  101. klamt
  102. kludetøj
  103. klunker
  104. knep
  105. kneppe
  106. kneppede
  107. knepper
  108. kneppet
  109. kursiv
  110. kusse
  111. kussen
  112. kæft
  113. kælling
  114. latex
  115. lide
  116. liderlig
  117. liderlige
  118. lol
  119. lort
  120. lorte
  121. lorten
  122. ludder
  123. luder
  124. ludere
  125. lugtede
  126. lugter
  127. lækker
  128. lækkert
  129. lækre
  130. lækreste
  131. løgn
  132. mega
  133. messi
  134. muhaha
  135. mundtøj
  136. nakkeost
  137. nar
  138. nederen
  139. nedern
  140. neger
  141. nice
  142. nigga
  143. noob
  144. noobs
  145. nosser
  146. nowiki
  147. numse
  148. numsen
  149. numser
  150. okay
  151. omg
  152. onanere
  153. ost
  154. ostemad
  155. overskrift
  156. overstreget
  157. palnatoke
  158. patter
  159. penis
  160. perker
  161. perkere
  162. pik
  163. pikhoved
  164. pikke
  165. pikkemand
  166. pikkemænd
  167. pikken
  168. pis
  169. pisse
  170. pornhub
  171. porno
  172. pornostjerne
  173. praematur
  174. propagandaløgne
  175. prut
  176. prutter
  177. præmatur
  178. prøv
  179. puha
  180. pussy
  181. pølle
  182. pøller
  183. pøls
  184. pølse
  185. pølsemad
  186. pølsemix
  187. pølser
  188. redtube
  189. rigtig
  190. røv
  191. røven
  192. røvhul
  193. røvhuller
  194. røvhullet
  195. sej
  196. seje
  197. sejeste
  198. sejt
  199. sex
  200. sgu
  201. shit
  202. sjov
  203. sjovt
  204. sked
  205. skid
  206. skide
  207. skider
  208. skiftetøj
  209. sku
  210. slikke
  211. slikker
  212. smager
  213. snavsetøj
  214. spasser
  215. sperm
  216. spiser
  217. sseite
  218. stenkunst
  219. stinker
  220. stripper
  221. suck
  222. sucks
  223. sut
  224. sutte
  225. suttede
  226. sutter
  227. suttet
  228. svin
  229. swag
  230. sygeste
  231. sytøj
  232. sæd
  233. sød
  234. sødeste
  235. tekstblok
  236. tis
  237. tisse
  238. tissekone
  239. tissemand
  240. tissemanden
  241. tissemænd
  242. tisser
  243. troldetøj
  244. tsmir
  245. tøjvås
  246. udetøj
  247. ulækker
  248. wallah
  249. wikifaggots
  250. wikiformateres
  251. yolo
Generated common words

Common words appear on all revisions reverted or otherwise. In the English language this would include words like 'the' or 'is' which are meaningless on their own. This list is generated using a TF-IDF approach.

  1. alder
  2. alle
  3. alt
  4. and
  5. anden
  6. andet
  7. andre
  8. april
  9. artikel
  10. aspx
  11. august
  12. autoritetsdata
  13. billede
  14. billedtekst
  15. blandt
  16. blev
  17. blevet
  18. blive
  19. bliver
  20. både
  21. børn
  22. center
  23. cite
  24. class
  25. com
  26. commonscat
  27. commonskat
  28. coor
  29. coord
  30. dag
  31. danmark
  32. danmarks
  33. dansk
  34. danske
  35. date
  36. dato
  37. december
  38. defaultsort
  39. del
  40. dem
  41. den
  42. denne
  43. der
  44. deres
  45. derfor
  46. dermed
  47. desuden
  48. det
  49. dette
  50. disse
  51. dms
  52. dog
  53. død
  54. døde
  55. efter
  56. eks
  57. eksterne
  58. eller
  59. end
  60. engelsk
  61. erne
  62. etableret
  63. familie
  64. februar
  65. fik
  66. fil
  67. file
  68. findes
  69. fire
  70. flagikon
  71. flere
  72. for
  73. forbindelse
  74. fordi
  75. forhold
  76. form
  77. forskellige
  78. fra
  79. frem
  80. får
  81. født
  82. før
  83. først
  84. første
  85. gamle
  86. gang
  87. gange
  88. gennem
  89. gik
  90. grad
  91. grund
  92. går
  93. ham
  94. han
  95. hans
  96. har
  97. havde
  98. have
  99. hele
  100. helt
  101. henvisninger
  102. her
  103. historie
  104. hjemmeside
  105. hos
  106. htm
  107. html
  108. http
  109. hvad
  110. hver
  111. hvilket
  112. hvis
  113. hvor
  114. igen
  115. ikke
  116. image
  117. ind
  118. inden
  119. index
  120. indtil
  121. infoboks
  122. ingen
  123. isbn
  124. især
  125. januar
  126. jpg
  127. juli
  128. juni
  129. kan
  130. kategori
  131. kendt
  132. kendte
  133. kilde
  134. kilder
  135. kom
  136. kommer
  137. kommune
  138. kort
  139. kun
  140. kunne
  141. københavn
  142. land
  143. landmark
  144. lang
  145. left
  146. levende
  147. lige
  148. ligger
  149. lille
  150. link
  151. længde
  152. maj
  153. man
  154. mange
  155. mangler
  156. marts
  157. med
  158. meget
  159. mellem
  160. men
  161. mens
  162. mere
  163. mest
  164. mindre
  165. mod
  166. name
  167. navn
  168. navnet
  169. ned
  170. noget
  171. nogle
  172. noter
  173. november
  174. nye
  175. når
  176. ofte
  177. også
  178. oktober
  179. old
  180. omkring
  181. org
  182. over
  183. personer
  184. php
  185. png
  186. publisher
  187. redirect
  188. ref
  189. referencer
  190. reflist
  191. region
  192. right
  193. række
  194. samme
  195. sammen
  196. samt
  197. selv
  198. senere
  199. september
  200. set
  201. side
  202. siden
  203. sidste
  204. sig
  205. sin
  206. sine
  207. sit
  208. skal
  209. skulle
  210. som
  211. sprog
  212. stadig
  213. sted
  214. stedet
  215. stor
  216. store
  217. style
  218. større
  219. størrelse
  220. største
  221. svg
  222. således
  223. tallet
  224. the
  225. thumb
  226. tid
  227. tidligere
  228. til
  229. tilbage
  230. titel
  231. title
  232. tjek
  233. tre
  234. type
  235. tyskland
  236. uden
  237. udgivet
  238. uge
  239. under
  240. url
  241. usa
  242. var
  243. ved
  244. verden
  245. vil
  246. ville
  247. være
  248. været
  249. web
  250. www

Bad words

Bad words are words unwelcome on any page. This would include curse words, spam and other content that would be reverted regardless of where it is inserted.

Needs bad words... Use |list-badwords=

Informal words

Informal words are words unwelcome on article namespace but would be acceptable on talk pages. This would include words such as 'hello' or 'hahaha' which would be fine in discussions but not in articles.

Needs informal words... Use |list-informal=