PetScan

From Meta, a Wikimedia project coordination wiki
This page is a translated version of the page PetScan and the translation is 98% complete.
Outdated translations are marked like this.
Coolest Tool Award 2022 logo
PetScan

2022 Coolest Tool
Award Winner

in the category
Reusable

PetScan är ett kraftfullt sökfrågeverktyg. En sökfråga förbereds PetScans inlämningsformulär. Läs också syftet med verktyget.

Inledning

PetScan är ett verktyg som kan generera listor från Wikipedia (och relaterade projekt) eller Wikidataobjekt som matchar vissa kriterier, som alla sidor i en viss kategori, eller alla objekt med en viss egenskap, extrahera och analysera data från Wikimediaprojekt. PetScans kan också kombinera vissa temporära listor (kallas här källor) på olika sätt för att skapa en ny. Källor innebär:

Sidor från Wikimedia/Wikipedia

Dessa definieras i flikarna Kategorier, Sidegenskaper och Mallar&länkar. Du kan fråga efter sidor i kategoriträd, med en viss mall eller länkar från/till en sida; begränsa din resultat till en särskild namnrymd, robot-/mänskliga redigeringar, nya redigeringar/sidor, osv. Dessa trädflikar representerar den tidigare CatScan2-funktionaliteten. Dess sökfrågeresultat bevaras därefter i kategorikällan.

Andra källor

I denna flik kan du lägga till fler källor, som sökfrågor i Wikidata SPARQL (WDQS) eller PagePile-länkar. Du kan också definiera hur du kombinerar flera källor; som standard returneras delmängden (det vill säga, endast sidor som förekommer i alla källor) i slutresultatet. Du kan också ange vilken wiki du vill att din lista ska gå till, t.ex. om du kombinerar Wikipedia och Wikidata-resultat.

Wikidata

I denna flik kan du märka eller filtrera dina resultat vidare, t.ex. bara returnera Wikidataobjekt som inte har några uttalanden. Använder du ett av dessa filter konverteras din lista till Wikidata.

Utmatning

Här kan du ange alternativ för din lista, t.ex. formatet (webbsida, wiki, PagePile, osv.). Du kan också ytterligare filtrera dina resultat, t.ex. med reguljära uttryck på sidtitlar/objektetiketter. Du kan också byta ut resultatlistan mot en rankad lista över saknade ämnen ("rödlänkar").

Definiera din sökfråga

Fälten som kan ställas in i frågeformuläret är följande:

Fält Betydelse Standard Not
Språk Välj projektspråkets kod, t.ex. "fr" för franska eller "sv" för svenska. Välj "commons" för Wikimedia Commons "en"
Projekt Wikimediaprojekt som ska sökas igenom (wikipedia, wiktionary, wikiversity, etc.) "wikipedia"
Djup Djup på kategorierna som ska sökas igenom. 0 betyder underkategorier inte ska användas. "0"
Kategorier Lista över kategorier, en per rad utan "kategori:" delen. Tom Lägg till '|' och ett nummer så anges djupet för kategoriträdet, vilket åsidosätter det som valts i Djup-fältet. Genom att ange en kategori kan du koka ner sökresultaten och fokusera på sidor som rör ett visst ämne.
Negativa kategorier Lista över kategorier som ovan. Endast artiklar som inte inkluderats i dessa kategorier accepteras. Tom
Kombination Hur kategorierna ovan bör användas:
  • Kategorilista: listar underkategorier
  • Skärningspunkt: alla sidor i alla kategoriträd
  • Union: alla sidor i minst ett kategoriträd
  • Skillnad: alla sidor i bara ett kategoriträd
  • Åtminstone (N): alla sidor i minst N kategoriträd

Alla tillgängliga alternativ är för närvarande "delmängd" eller "union".

"delmängd"
Namnrymder Namnrymden som ska användas som potentiella sidor Artiklar
Omdirigeringar Antingen
Mallar Endast sidor som
  • Ruta 1: innehåller alla av de angivna mallarna
  • Ruta 2: innehåller en av de angivna mallarna
  • Ruta 3: innehåller inga av de angivna mallarna

Ange en mall per rad, utan "mall:"-prefix. Varje ruta kan kvalificeras genom att välja "Använd diskussionssida istället"

Tom Det här alternativet verkar bara kompatibelt med mallar som definierats i "mall:"-namnrymden. Den kan inte användas med mallar som definierats i "Användare:"-namnrymden. Den kan inte användas i "Creator:"- eller "Institution:"-namnrymden som används på Wikimedia Commons
Länkas från:
Senaste redigering Visa sidor vars senaste redigering utfördes, eller inte, av en robot, av en oinloggad användare eller har flaggats. Antingen, antingen, antingen
Senaste ändring Datum eller tidsperiod för sidans senaste ändring i formatet ÅÅÅÅMMDDTTMMSS (kortare tillåts) "Endast sidor som skapats under den angivna tidsrymden" låter dig leta efter första ändringen istället
Storlek Filstorlek eller storleksspann i byte Tom Tillåter urval av artiklar vars filer är större än ett gränsvärde och/eller mindre än ett annat gränsvärde
Länkar Antal eller spann av interna länkar på en sida Tom Tillåter urval av artiklar med många eller färre länkar
Rödlänkar
Toppkategorier Funktion som ännu inte är tillgänglig.
Sortera Funktion som ännu inte är tillgänglig som skulle ange sorteringskriterier för utmatnin.
Manuell lista Låter en ange en lista över (namnrymdsprefigerade) sidnamn eller Wikidataobjekt från särskilda projekt Det svåra med att ange projekt är vilken kod man ska använda, exempel:
  • Svenskspråkiga Wikipedia: "svwiki"
  • Tyskspråkiga Wikisource: "dewikisource" eller "dewikisourcewiki"
  • Grekiskspråkiga Wiktionary: elwiktionarywiki
  • Ryskspråkiga Wikinews: "ruwikinews"
  • Wikidata: "wikidatawiki"
Wikidata Hämta Wikidata om det går.
Format Utmatningsformat för sökresultat:
HTML: webbsidor
CSV: värden i citattecken, separerade av komman
TSV: Värden separerade av flikar
WIKI: som en wikitabell
PHP: som en PHP-fil
XML: som en XML-fil
Gör det! Tryck här att köra sökfrågan du definierat.

Sakkunskap

PetScan-ID (PSID)

Sedan 2016-04-04 sparas alla sökfrågor som körs i PetScan (anonymt!) och tilldelas en unik, stabil, numerisk identifierare som heter PSID. Du kan använda detta PSID för att

  • köra denna PetScan-sökfråga som en inmatning i verktyg som stödjer PSID (som WD-FIST)
  • fylla i en "kort URL": https://petscan.wmflabs.org/?psid=PSID kommer köra sökfrågan med PSID, med alla dess inställningar
  • programmatiskt bygga vidare på en tidigare sökfråga genom att "åsidosätta" parametrar: https://petscan.wmflabs.org/?format=wiki&psid=PSID kommer köra samma sökfråga som tidigare men utmatningsformatet kommer vara wiki (istället för standard HTML, vilket som valts ursprungligen).

Fotnoter:

  • Endast sökfrågan lagras, inte dess resultat!
  • Större sökfrågor (t.ex. med många manuella objekt) lagras inte. Då visas inte heller något PSID.
  • Resultat med en tom ruta har möjliga matchningar inom Wikidata-delmängen.
  • interwiki-länken petscan: kan användas för att generera genvägar för permanenta sökfrågor, t.ex. [[petscan:PSID]]
  • sökfrågor som lagras "avdupliceras" inte, så ett nytt PSID genereras varje gång så länge inte en befintlig PSID åkallas utan ändring.

Skapa Wikidataobjekt för Wikipediaartiklar som ännu inte har någon (skaparfunktion)

  • Ställ upp en sökfråga som returnerar en lista över Wikipediaartiklar (eller andra, projekt som inte är Wikidata), eller klistra in en lista i "Andra källor/Manuell lista"
  • Under fliken "Sidegenskaper", ska du välja "Redirects=No" Detta sker automatiskt nu; du kan ändra tillbaka det om du verkligen vill ha omdirigeringar i din lista!
  • Under fliken "Wikidata", välj "Endast sidor utan objekt" för alternativet "Wikidata"
  • Kör sökfråga
  • Dina resultat kommer ha ytterligare element bredvid rubriken "resultat" (så länge du inte är inloggad på WiDaR, i sådana fall kommer du se en passande länk istället)
  • Alla sidor som det inte finns någon exakt matchning för i varken etikett eller alias på Wikidata kontrolleras som standard.
  • Du kan bocka i/ur rutorna manuellt nu, om det behövs.
  • Du kan lägga till standarduttalanden i uttalanderutan, som läggs till på ditt nya objekt. Så om du bara vill skapa objekt för människor, lägg till P31:Q5. Du kan lägga till flera uttalanden på det här sättet (en per rad). Kom ihåg att P/Q måste vara versaler – annars misslyckas den i tystnad.
  • Klicka på den gröna "Starta QS"-knappen. Detta öppnar en ny sida.
  • Du kan klicka på "Kör" för att köra en ny körning i din webbläsare, eller "Kör i bakgrunden" för att köra dem från en Wikimediaserver. Läs Help:QuickStatements för mer information.


Lägg till/ta bort uttalanden på Wikidataobjekt

Det går att lägga till eller ta bort uttalanden från Wikidataobjekt med PetScans. För att göra det är det viktigt att du väljer "Wikidata" i "Andra källor -> Använd Wiki". Sen kommer du se en kommandorad bredvid talet och kan fortsätta som beskrivet i tidigare avsnitt.

Hänvisa

(Bara V2) Om du öppnar PetScan från ett annat verktyg för att låta användaren formulera en sökfråga, kan du passera parametrarna referrer_url och referrer_name (leder till referrer_url). referrer_url borde ha en {PSID}-sträng som kommer ersättas av det PSID som användaren ser. När en sökfråga körts kommer en ruta längst upp på sidan uppmana användaren att återvända till det ursprungliga verktyget med det PSID-modifierade referrer_url.

Exempel

Artiklar på ett WikiProjekt

En begäran på diskussionssidan för denna manual: Hitta alla artiklar i huvudnamnrymden inom "WikiProjekt geografi Storbritannien". Börja med ett standard-PetScan-formulär, och lägg bara till "WikiProjekt geografi Storbritannien" i den första mallraden, och, precis som nedan, välj "Använd diskussionssidor istället". Här är sökfrågan ifylld. Tryck "Gör det!" längst ner. När det kördes den 16 augusti 2015 tog sökfrågan 1.5 sekunder att köra och resulterade i 21,408 artiklar. Listan visas UNDER formuläret (som stannar kvar på din skärm), så du behöver skrolla ner för att se resultaten.

Dablinks inom ett WikiProjekt

Redigerare som arbetar på förgreningar försöker ragga medlemmar i ett innehållsområdes WikiProjekt, speciellt WikiProjekt Kanada, för att hjälpa till. En PetScan-rapport utformas för att hitta alla artiklar som har förgreningslänkar som ligger inom WikiProjektet. Tillämpade kriterier:

  1. Artiklar som har förgreningslänkar ligger i "Kategori:Alla artiklar med länkar som behöver särskiljas", så klistra in "Kategori:Alla artiklar med länkar som behöver särskiljas" i PetScans kategorifält.
  2. Djup anges arbiträrt som 9, vilket betyder att artiklar så långt som 9 underkategorier ner från föräldrakategorin "behöver särskiljas" kommer hittas. (Det är inte nödvändigt att söka så långt, men i det här fallet skadar det inte.)
  3. Artiklar inom WikiProjekt Kanada har "Mall:WikiProjekt Kanada" på sina diskussionssidor, så klistra in "WikiProjekt Kanada" i PetScans fält "Har några av dessa mallar", och precis nedan välj "Använd diskussionssidor istället" som en bestämning.
  4. Endast vanliga artiklar, inte förgreningar, önskas, och förgreningar särskiljs genom att att ha mall:förgrening, så klistra in "Förgrening" i PetScans fält "Har inga av dessa mallar", och se till att "Använd diskussionssidor istället" inte valts.
  • Dessa kriterier tillämpas av detta PetScan-formulär, ifyllt. För att skicka in sökfrågan, välj "Gör det!" längst ner.
  • När den skickades in den 16 augusti 2015, tog sökfrågan 31 sekunder att köra, och resulterade i en lista på 255 artiklar. Resultaten visas UNDER formuläret, vilket stannar kvar, så du kanske ser någon skillnad på din skärm. Du behöver veta att du ska skrolla ner för att hitta resultaten! Den begäran kördes med standard

utmatningsformuläret "HTML".

  • För att hämta åt resultaten i en wikitabell, för att dela dem på en undersida till WikiProjektet, skulle begäran kunna omarbetas genom att välja formatet "WIKI". Den här gången ersätter resultaten, i wikitabellformat, PetsScan-formuläret på din skärm.
  • För att skapa en mer användbar lista för förgreningsarbetare, ställ in så att DabSolver, när ett objekt klickas på, öppnar en flerstegsprocess som kan följas. Här kan resultaten sparas i flik-separerade format istället och sedan tas till Excel, sen byggdes en kolumn som then a column was composed which enkla sammanfogade textsträngar med resultaten, sen kopierades och klistrades den resultattabellen in. Resultaten klistrades över till engelskspråkiga Wikipediaartikeln w:Wikipedia:Canadian Wikipedians' notice board/ArticlesNeedingDisambiguation2015-08-17 och postades också i ett skrollande fönster på diskussion på WikiProjekt Kanadas diskussionssida. --Doncram (diskusison) 19:50, 24 augusti 2015 (UTC) länken har justerats. DexDor (diskussion) 06:58, 29 mars 2016 (UTC)

Upptäcka sidor som har en onormal kombination av namnrymd och kategorier

PetScan kan användas för att hitta sidor som ligger i en kategori (eller kombinationer av kategorier) som inte är lämpliga för sidor i en viss namnrymd - t.ex. Wikipediaadministratörssidor som ligger i en kategori som bara borde innehålla encyklopediska artiklar. Detta kan sedan åtgärdas (t.ex. genom att flytta en artikel till rätt namnrymd eller genom att redigera en diskussion för att lägga ett uteblivet ":" där en kategori åsyftades). Det första steget i denna process är att identifiera kategorier (med PetScan) som orsakar felaktig kategorisering (t.ex. Wikipediaadministratörskategorier som ligger i artikelkategorier).

Hitta okategoriserade bildbidrag på Commons på angivet språk

(Baserat på Grants:Learning patterns/Treasures or landmines: detecting uncategorized, language-specific uploads in Commons. Läs motiveringen och en fullständig förklaring där! Tack till wikimediaanvändaren User:Spiritia och andra bidragsgivare/debattörer som bidrog!)

Kör en sökfråga med PetScan med följande inställningar:

Language = commons
Project = wikimedia
Depth = 1
Categories = Media som behöver kategorier
Combination = ☑ Subset
Namespaces = ☑ File
Templates : Has all of these templates = <din språkkod> 
Format:  ☑ Extended data for files     ☑ File usage data

Den svenska språkkoden är "sv"; den rumänska språkkoden är "ro". För att hitta okategoriserade bilder uppladdade av användare som använder rumänska, är en version av sökfrågan (med html-utmatning, och utan autokör):

https://petscan.wmflabs.org/?language=commons&project=wikimedia&depth=1&categories=Media+needing+categories&ns%5B6%5D=1&templates_yes=ro&ext_image_data=1&file_usage_data=1

Den 15 mars 2016, efter att du tryckt "kör" kräver sökfrågan runt 105 sekunder att slutföra och 1748 hittade 1748 okategoriserade bilder.

Fotnoter:

  1. Fältet "Language =" används inte för att välja önskar språk; önskat språk ställs in i fältet "Template" istället.
  2. Språkkoden i sökfrågan är skiftlägeskänslig! Så använd till exempel "ro" och inte "RO".
  3. För att generera resultaten där, valdes Format: ☑ Wiki istället för standardutmatningen, Html.

Ha så kul! Tack än en gång till User:Spiritia!

Objekt utan uttalanden

Alternativet "Har inga uttalanden" kan användas för att hitta:

d:Help:Import Template:Bio from itwiki

Steg för att importera mallen, vissa med PetScan.

Hämta webbplatslänkar för att visst projekt från en SPARQL-sökfråga

  • Indikerar projektet i fliken "Kategorier", t.ex. de för Language och wikipediaProject för att använda tyskspråkiga Wikipedia.
  • Skriv din SPARQL-sökfråga i "Andra källor"
  • Se till att välja Från kategorier från alternativen Använd wiki
  • Tryck Gör det!

Detta kan vara användbart för att hämta sidvisningar av vissa grupper sidor, baserat på en SPARQL-sökfråga. Du kan spara detta i en Pagepile (kontrollera fliken Utmatning), skriv sedan in Pagepile-ID i Massviews Analysis (välj "Page Pile" i rullgardinsmenyn Källa).

Hämta en list över Wikidataobjekt med undantag baserat på en SPARQL-sökfråga

Låt oss säga att du har en lista över folk med Wikidata-ID:n (QID:n) som du vill lägga till ett yrke (P106) med "smyckesformgivare" (Q2519376), kanske med ett verktyg som QuickStatements. Men du vill inte lägga till den om det redan finns ett yrke där med det värdet. Så här kan du göra det med PetScan:

  • Ha din lista över QID:n i en textfil, varje QID på en ny rad
  • Klistra in texten i fältet "Manuell lista" i fliken "Andra källor",
  • Skriv in strängen wikidatawiki i formuläret "Wiki"
  • Skriv in din SPARQL-sökfråga i fältet "SPARQL". I det här exemplet ger sökfrågan alla människor med yrket "smyckesformgivare":
    select ?item where { ?item wdt:P31 wd:Q5; wdt:P106 wd:Q2519376. }
  • Till sist gör du ett undantag, så lägg till strängen manual NOT sparql i fältet "Kombination" för att hämta alla QID:n från "manuell lista", men utan objektet från SPARQL-sökfrågan.
  • Tryck "Gör det!"

Lägg till ditt exempel här...

Bug reports, feature requests, code base

Se även