Research:Revision scoring as a service/Word lists/sl

From Meta, a Wikimedia project coordination wiki


ISO code Language Generated list Badwords Informal words Stopwords Dictionary Stemmer Contact person Wiki labels Interface Forms Campaign Needs
sl slovenščina (Wikipedia) 250 - - - - - See: Word lists requested no no no -
Generated list [1]

Words in the generated list commonly appear in reverted revisions but not in others. This list is generated using a TF-IDF approach.

  1. abortion
  2. acquitted
  3. adc
  4. aja
  5. analno
  6. anals
  7. apokalipso
  8. astral
  9. babysatantransbkg
  10. balsamic
  11. bedarija
  12. besedilo
  13. biljonov
  14. biu
  15. bla
  16. blo
  17. bobbled
  18. boldly
  19. bolster
  20. bomo
  21. booths
  22. borrow
  23. boste
  24. bralnici
  25. brezveze
  26. budala
  27. budale
  28. burek
  29. car
  30. carstvom
  31. cigani
  32. closes
  33. coale
  34. cock
  35. cocky
  36. cvru
  37. cyclical
  38. debil
  39. derstvenšek
  40. dildo
  41. domination
  42. drek
  43. dreka
  44. drnovšeka
  45. familijo
  46. fistu
  47. florjanska
  48. flown
  49. frutka
  50. fuck
  51. fucking
  52. fuk
  53. fuka
  54. fukal
  55. fukanje
  56. fukat
  57. ful
  58. gallegly
  59. gay
  60. gej
  61. german
  62. geschwader
  63. gey
  64. gotof
  65. gradit
  66. gunca
  67. haha
  68. hahaha
  69. hehe
  70. hodite
  71. hotu
  72. hočm
  73. hvala
  74. izposojevalnica
  75. jackals
  76. jasn
  77. jaz
  78. jebač
  79. jebe
  80. jebem
  81. jebemti
  82. jebi
  83. jebite
  84. jebo
  85. jebote
  86. jst
  87. kakec
  88. kastelica
  89. kasteličev
  90. kej
  91. kept
  92. koji
  93. krepko
  94. kreten
  95. krotit
  96. kul
  97. kurac
  98. kurba
  99. kurbe
  100. kurbico
  101. kurc
  102. kurca
  103. kurci
  104. kurcu
  105. kučana
  106. lajf
  107. lep
  108. ležeče
  109. lisa
  110. loans
  111. lohk
  112. lol
  113. lovroizem
  114. lovroizma
  115. lovrota
  116. lovrotova
  117. lovrotu
  118. mastermind
  119. materna
  120. matrna
  121. mašino
  122. medmrežje
  123. mileage
  124. mindcontroller
  125. mocen
  126. mona
  127. morit
  128. mtko
  129. mystical
  130. nadpisano
  131. naredu
  132. nasledno
  133. naslovne
  134. nategnu
  135. neoblikovano
  136. neoboroženih
  137. nowiki
  138. obesite
  139. odpru
  140. ogg
  141. peder
  142. pedr
  143. pedri
  144. penis
  145. penisov
  146. pizda
  147. pizde
  148. pizdo
  149. pička
  150. pičke
  151. pičko
  152. pičku
  153. pišite
  154. planetky
  155. podle
  156. pofukan
  157. pofukana
  158. pofukane
  159. pofukani
  160. porno
  161. potalala
  162. poznate
  163. prasci
  164. prasica
  165. prdec
  166. prečrtano
  167. prežvel
  168. prispevki
  169. prosim
  170. pršu
  171. putting
  172. puši
  173. rad
  174. radi
  175. raftov
  176. razdvojba
  177. razstrelu
  178. redtube
  179. rejst
  180. reqphoto
  181. respect
  182. respond
  183. rešla
  184. rešujte
  185. rit
  186. riti
  187. robbing
  188. rugbyfootball
  189. satanovim
  190. satanovo
  191. sex
  192. sexy
  193. sežgov
  194. shit
  195. skavtje
  196. sla
  197. slonba
  198. smeju
  199. smrdi
  200. sniping
  201. softened
  202. sorodnega
  203. soulful
  204. spletninaslov
  205. sranje
  206. ste
  207. strašit
  208. studiofaca
  209. submarine
  210. suck
  211. sundown
  212. thank
  213. tiča
  214. tle
  215. tožba
  216. tut
  217. ubesu
  218. uencč
  219. unterseeboot
  220. usi
  221. vam
  222. vegovce
  223. vegovcev
  224. vira
  225. vložena
  226. vnesi
  227. vnesite
  228. vrjet
  229. vrstice
  230. walked
  231. wikiality
  232. yeah
  233. you
  234. zajebu
  235. zažgite
  236. zdej
  237. zdj
  238. zgled
  239. zibki
  240. ziblki
  241. zlataleta
  242. znoru
  243. čaku
  244. članka
  245. šanse
  246. šotorišče
  247. šupak
  248. žret
  249. žru
  250. žvet
Generated common words

Common words appear on all revisions reverted or otherwise. In the English language this would include words like 'the' or 'is' which are meaningless on their own. This list is generated using a TF-IDF approach.

  1. accessdate
  2. ali
  3. amerike
  4. and
  5. bil
  6. bila
  7. bile
  8. bili
  9. bilo
  10. bioslika
  11. birth
  12. bolj
  13. brez
  14. caption
  15. category
  16. celo
  17. center
  18. cerkev
  19. city
  20. class
  21. com
  22. coor
  23. dan
  24. danes
  25. date
  26. december
  27. defaultsort
  28. del
  29. dela
  30. delitev
  31. delo
  32. delu
  33. dms
  34. druga
  35. druge
  36. drugi
  37. drugih
  38. drugipomeni
  39. drugo
  40. države
  41. dva
  42. dve
  43. dveh
  44. eden
  45. ena
  46. eno
  47. etnična
  48. file
  49. first
  50. footnotes
  51. for
  52. francija
  53. geopedia
  54. glavni
  55. glej
  56. hrvaške
  57. htm
  58. html
  59. http
  60. ikonazastave
  61. ima
  62. image
  63. imajo
  64. ime
  65. index
  66. infobox
  67. infopolje
  68. isbn
  69. islike
  70. italija
  71. jezik
  72. jih
  73. jpg
  74. kar
  75. kasneje
  76. kategorija
  77. katerega
  78. katerem
  79. kateri
  80. katerih
  81. ker
  82. kjer
  83. kljub
  84. kontrola
  85. koordinate
  86. kot
  87. kraljestvo
  88. label
  89. lahko
  90. last
  91. latd
  92. latm
  93. latns
  94. lats
  95. left
  96. let
  97. leta
  98. letih
  99. leto
  100. letoma
  101. letu
  102. lifetime
  103. link
  104. ljubljana
  105. ljudje
  106. location
  107. longd
  108. longew
  109. longm
  110. longs
  111. med
  112. mesta
  113. mesto
  114. mestu
  115. nad
  116. naj
  117. najbolj
  118. najdisi
  119. name
  120. napis
  121. nato
  122. navedi
  123. nbsp
  124. nekaj
  125. nemčija
  126. niso
  127. njegov
  128. njegova
  129. njegovo
  130. normativna
  131. nova
  132. novo
  133. okoli
  134. old
  135. opombe
  136. org
  137. oseba
  138. oziroma
  139. php
  140. place
  141. png
  142. pod
  143. poleg
  144. pomeni
  145. portal
  146. postal
  147. povezave
  148. povrsina
  149. prav
  150. prebivalcev
  151. prebivalci
  152. pred
  153. predvsem
  154. preusmeritev
  155. pri
  156. primer
  157. proti
  158. prva
  159. prve
  160. prvi
  161. prvič
  162. prvo
  163. publisher
  164. različnih
  165. razločitev
  166. ref
  167. republika
  168. republike
  169. right
  170. rojeni
  171. saj
  172. samo
  173. seznam
  174. sicer
  175. sklici
  176. skupaj
  177. slika
  178. slog
  179. slovenci
  180. slovenija
  181. slovenije
  182. sloveniji
  183. slovenska
  184. slovenske
  185. slovenski
  186. slovenskih
  187. smrti
  188. splet
  189. spolu
  190. sta
  191. stoletja
  192. stran
  193. strani
  194. stub
  195. style
  196. svg
  197. svoje
  198. svojo
  199. tako
  200. tega
  201. teh
  202. tem
  203. ter
  204. the
  205. thumb
  206. title
  207. tri
  208. tudi
  209. type
  210. umrli
  211. upravna
  212. upravno
  213. url
  214. vedno
  215. velika
  216. velike
  217. veliki
  218. veliko
  219. vendar
  220. več
  221. vir
  222. viri
  223. vojaška
  224. vojaštvo
  225. vojna
  226. vse
  227. vseh
  228. web
  229. work
  230. www
  231. year
  232. zaradi
  233. zato
  234. zbirka
  235. zbirki
  236. zda
  237. združene
  238. združeno
  239. zelo
  240. zemljevid
  241. zgodovina
  242. zunanje
  243. čas
  244. časa
  245. času
  246. čeprav
  247. škrbina
  248. število
  249. živeči
  250. življenje

Bad words

Bad words are words unwelcome on any page. This would include curse words, spam and other content that would be reverted regardless of where it is inserted.

Needs bad words... Use |list-badwords=

Informal words

Informal words are words unwelcome on article namespace but would be acceptable on talk pages. This would include words such as 'hello' or 'hahaha' which would be fine in discussions but not in articles.

Needs informal words... Use |list-informal=