Research:Revision scoring as a service/Word lists/sh

From Meta, a Wikimedia project coordination wiki


ISO code Language Generated list Badwords Informal words Stopwords Dictionary Stemmer Contact person Wiki labels Interface Forms Campaign Needs
sh srpskohrvatski / српскохрватски (Wikipedia) 250 - - - - - See: Word lists requested no no no -
Generated list [1]

Words in the generated list commonly appear in reverted revisions but not in others. This list is generated using a TF-IDF approach.

  1. aktivistica
  2. align
  3. amoralnom
  4. apsurdno
  5. aušvic
  6. background
  7. banditov
  8. banditova
  9. banditovim
  10. banditovo
  11. bankar
  12. bankarom
  13. bavila
  14. bačenih
  15. blink
  16. bold
  17. bolnica
  18. bombardovanjima
  19. border
  20. bosanskohercegovačka
  21. bottom
  22. bošnjačkoj
  23. bre
  24. brisanje
  25. broken
  26. budala
  27. buhenvald
  28. cak
  29. celebrity
  30. center
  31. cest
  32. cet
  33. covek
  34. deborah
  35. decoration
  36. devojčice
  37. diana
  38. div
  39. djomla
  40. dobrovoljačka
  41. doprinosi
  42. dozivaju
  43. dvoje
  44. efić
  45. ejup
  46. ejupa
  47. ekonomista
  48. example
  49. family
  50. filantropija
  51. filantropske
  52. float
  53. font
  54. fterran
  55. fuck
  56. ganić
  57. ganića
  58. govna
  59. govno
  60. gušit
  61. haiti
  62. happened
  63. hatreds
  64. hrvatski
  65. humanitarne
  66. irnis
  67. isečenog
  68. ispravimo
  69. istakla
  70. istaknutih
  71. italic
  72. izbjegla
  73. izdale
  74. izradila
  75. izradom
  76. iživljavanja
  77. jasenovačkog
  78. jebanje
  79. jebe
  80. jebem
  81. jebo
  82. jenkins
  83. jenkinsom
  84. jezivu
  85. jos
  86. kaliforniji
  87. kapital
  88. kauciju
  89. kaze
  90. knjizaratrikona
  91. kolevku
  92. kompaniju
  93. korenu
  94. kostima
  95. kupaćih
  96. kurac
  97. kurca
  98. langedok
  99. left
  100. letovanje
  101. linka
  102. ludački
  103. majdanek
  104. majke
  105. mališana
  106. margin
  107. mauthauzen
  108. moze
  109. nabija
  110. najveci
  111. nam
  112. načinje
  113. našom
  114. nedovršenih
  115. negodovanjem
  116. neka
  117. neljudskog
  118. neljudskom
  119. nemoj
  120. nemojmo
  121. nenormalno
  122. neopisivog
  123. neosu
  124. nepoželjnu
  125. nepristajanju
  126. nesto
  127. nezaboravnu
  128. nezalečivoj
  129. nigde
  130. nista
  131. odjekuje
  132. odojčadi
  133. odreagujete
  134. olan
  135. opeva
  136. opravdanim
  137. oprostimo
  138. oproštenog
  139. oreolom
  140. ostavimo
  141. očajne
  142. padding
  143. pamćenju
  144. peder
  145. penn
  146. pennom
  147. pečatu
  148. picka
  149. picku
  150. pise
  151. platila
  152. pobijene
  153. pocinili
  154. podsećanje
  155. poduzetnica
  156. poduzetnici
  157. poginuti
  158. poharanom
  159. pokaju
  160. poklanih
  161. policyreview
  162. polomljenih
  163. poludelih
  164. popaljenom
  165. populacija
  166. portrete
  167. postoji
  168. potjernici
  169. potresne
  170. potresom
  171. počinjeno
  172. predstavimo
  173. preduboku
  174. preduzmemo
  175. prekinutih
  176. prerezanih
  177. prećutanog
  178. prizvanih
  179. prokletu
  180. propustimo
  181. provela
  182. proživljenih
  183. pružanjem
  184. pusi
  185. računovo
  186. really
  187. rodjen
  188. rogerom
  189. roman
  190. room
  191. rukovodioc
  192. sanela
  193. sarthehe
  194. sean
  195. seanom
  196. size
  197. solid
  198. solitera
  199. spaljenu
  200. span
  201. speremo
  202. sramota
  203. sranje
  204. srbe
  205. srbima
  206. srbin
  207. srpsko
  208. srpskom
  209. sta
  210. ste
  211. stečen
  212. sto
  213. strahota
  214. studirala
  215. style
  216. susjednu
  217. svetu
  218. tacno
  219. takodje
  220. tavna
  221. tačnije
  222. text
  223. times
  224. top
  225. treblinku
  226. tvrtki
  227. upornom
  228. upućenu
  229. uspješnih
  230. uverenje
  231. vam
  232. vas
  233. vavilonsku
  234. vise
  235. volim
  236. vratimo
  237. vrginmosta
  238. weight
  239. width
  240. wikipedia
  241. zaboravimo
  242. zaboravljenoj
  243. zamislili
  244. zanemela
  245. zastaje
  246. zgražanjem
  247. zivi
  248. ćatić
  249. škotskim
Generated common words

Common words appear on all revisions reverted or otherwise. In the English language this would include words like 'the' or 'is' which are meaningless on their own. This list is generated using a TF-IDF approach.

  1. accessdate
  2. administrativna
  3. administrativnog
  4. age
  5. ali
  6. amerikanci
  7. američke
  8. američkih
  9. and
  10. archive
  11. bez
  12. bila
  13. bili
  14. bilo
  15. bio
  16. biografija
  17. biografije
  18. birth
  19. biti
  20. blason
  21. broj
  22. broju
  23. carstvo
  24. category
  25. center
  26. cite
  27. com
  28. commonscat
  29. county
  30. dan
  31. dana
  32. danas
  33. date
  34. datoteka
  35. datum
  36. death
  37. decenijama
  38. demografija
  39. desno
  40. dio
  41. doga
  42. dok
  43. druga
  44. druge
  45. drugi
  46. drugim
  47. država
  48. države
  49. dva
  50. eksterni
  51. ena
  52. eni
  53. enja
  54. enje
  55. enju
  56. file
  57. first
  58. flag
  59. for
  60. francuske
  61. gdje
  62. geografija
  63. glavni
  64. godina
  65. godine
  66. gra
  67. grad
  68. gradova
  69. gradovi
  70. grafika
  71. historija
  72. htm
  73. html
  74. http
  75. iako
  76. ili
  77. ima
  78. image
  79. imao
  80. ime
  81. imena
  82. index
  83. infokutija
  84. istorija
  85. izme
  86. izvori
  87. jedan
  88. jedna
  89. jer
  90. jezik
  91. još
  92. jpg
  93. jugoslaveni
  94. kada
  95. kako
  96. kao
  97. kasnije
  98. kategorija
  99. klica
  100. knjiga
  101. kod
  102. koja
  103. koje
  104. koji
  105. kojima
  106. kojoj
  107. koju
  108. kraj
  109. kraljevstvo
  110. kroz
  111. lat
  112. left
  113. lifetime
  114. link
  115. linkovi
  116. literatura
  117. ljudi
  118. manje
  119. mesta
  120. mini
  121. mjesto
  122. mogu
  123. može
  124. nacija
  125. najveći
  126. nakon
  127. nalazi
  128. name
  129. narodna
  130. naselja
  131. naseljena
  132. naziv
  133. nego
  134. neki
  135. nekoliko
  136. net
  137. nije
  138. nisu
  139. njegov
  140. njegova
  141. njih
  142. novi
  143. odnosno
  144. oko
  145. okruzi
  146. old
  147. ona
  148. oni
  149. opis
  150. opštine
  151. org
  152. ostali
  153. ova
  154. ovaj
  155. ove
  156. ovo
  157. oznaka
  158. period
  159. php
  160. png
  161. pod
  162. podela
  163. podjela
  164. popis
  165. portal
  166. postao
  167. povezano
  168. početak
  169. preko
  170. prema
  171. preusmjeri
  172. pri
  173. prije
  174. protiv
  175. prva
  176. prvi
  177. publisher
  178. put
  179. rat
  180. rata
  181. ref
  182. refbegin
  183. refend
  184. reference
  185. reflist
  186. republika
  187. right
  188. sad
  189. sajt
  190. sam
  191. samo
  192. saveznih
  193. sazvijež
  194. sjedinjene
  195. sjedinjenih
  196. slika
  197. slike
  198. smatra
  199. smrti
  200. spisak
  201. stanovništvo
  202. statusa
  203. strane
  204. style
  205. sve
  206. svg
  207. svi
  208. svih
  209. svjetski
  210. svoj
  211. svoje
  212. svojim
  213. svoju
  214. tada
  215. taj
  216. tako
  217. teritorija
  218. the
  219. thumb
  220. title
  221. toga
  222. tokom
  223. tom
  224. tome
  225. tri
  226. uglavnom
  227. url
  228. utim
  229. vanjske
  230. velika
  231. velike
  232. veliki
  233. veze
  234. već
  235. vidi
  236. vijek
  237. više
  238. vrijeme
  239. web
  240. www
  241. year
  242. zajedno
  243. zanimanje
  244. zbog
  245. zemlja
  246. često
  247. četveroslovnik
  248. širina
  249. što

Bad words

Bad words are words unwelcome on any page. This would include curse words, spam and other content that would be reverted regardless of where it is inserted.

Needs bad words... Use |list-badwords=

Informal words

Informal words are words unwelcome on article namespace but would be acceptable on talk pages. This would include words such as 'hello' or 'hahaha' which would be fine in discussions but not in articles.

Needs informal words... Use |list-informal=