PetScan

From Meta, a Wikimedia project coordination wiki
This page is a translated version of the page PetScan and the translation is 76% complete.
Outdated translations are marked like this.
Coolest Tool Award 2022 logo
PetScan

2022 Coolest Tool
Award Winner

in the category
Reusable

PetScan es una poderosa herramienta de consulta. En el formulario de envío de PetScan se elabora una consulta. También, echa un vistazo a las razones detrás de esta herramienta.

Introducción

PetScan puede generar listas de páginas de Wikipedia (o proyectos relacionados) o elementos de Wikidata que cumplan ciertos criterios, como todas las páginas de una categoría determinada, o todos los elementos con una propiedad determinada. PetScan también puede combinar listas temporales (llamadas "sources") de diferentes maneras para crear una nueva. Las sources incluyen:

Páginas de Wiki(m|p)edia

Se definen en las pestañas «Categories», «Page properties» y «Templates&links». Puede obtener páginas en árboles de categorías, con plantillas o enlaces específicos desde/hacia páginas específicas; limite sus resultados a espacios de nombres específicos, modificaciones humanas/bots, creaciones de páginas, modificaciones recientes, etc. Estas tres pestañas representan la funcionalidad CatScan2 en sí misma. el resultado de la consulta se guarda como «category source».

Otros sources

En esta pestaña, puede agregar más sources, como peticiones Wikidata SPARQL (WDQS) o listas PagePile lists. También puede definir cómo combinar varios sources; por defecto, el subconjunto (es decir, sólo las páginas presentes en todas las fuentes) se devuelve al resultado final. También puedes especificar a qué wiki quieres que apunte tu lista, por ejemplo si combinas los resultados de Wikipedia y Wikidata.

Wikidata

En esta pestaña, puede anotar o filtrar sus resultados, por ejemplo, devolviendo sólo aquellos elementos de Wikidata que no tienen declaraciones. Usando cualquiera de estos filtros convertirá su lista a Wikidata.

Salida

Aquí puede especificar opciones para su lista, como el formato (página web, wiki, PagePile, etc.). También puede filtrar aún más sus resultados, por ejemplo, con expresiones regulares en los títulos de página/etiquetas de artículo. También puede sobrescribir la lista de resultados con una lista de temas que faltan («enlaces rojos»).

Defina su consulta

Los campos que se pueden rellenar en el formulario de consulta son los siguientes:

Campo Significado Valor por defecto Nota
Idioma Seleccione el código de idioma del proyecto, por ejemplo «es» para español o «en» para inglés. Seleccione «Commons» para Wikimedia Commons "en"
Proyecto Proyecto Wikimedia en el que buscar (wikipedia, wiktionary, wikiversity, etc.) "wikipedia"
Profundidad Profundidad de árboles de categoría a buscar. 0 significa no utilizar subcategorías. "0"
Categorías Lista de categorías, una por línea sin la parte «categoría:» Vacío Agregue '|' y un número, esto establecerá la profundidad para este árbol de categoría, sobrescribiendo lo que se ha seleccionado en el campo Profundidad.
Categorías a excluir Lista de categorías como arriba. Solo se aceptarán los artículos que no estén incluidos en estas categorías. Vacío
Combinación Cómo se deben utilizar las categorías anteriores:
  • Lista de categorías: Lista de subcategorías
  • Intersección: Todas las páginas que están en todos los árboles de categorías
  • Unión: Todas las páginas que están al menos en un árbol de categorías
  • Diferencia: Todas las páginas que están en sólo uno de los árboles de categorías
  • Al menos (N): Todas las páginas que están en al menos N árboles de categorías

Las opciones disponibles actualmente son "intersección" o "unión".

"intersección"
Espacios de nombres Los espacios de nombres a utilizar como páginas potenciales Artículos
Redirecciones Ambos
Plantillas Utilice solo las páginas que
  • Caja 1: contiene todas las plantillas dadas
  • Caja 2: contiene una de las plantillas dadas
  • Caja 3: no contenga ninguna de las plantillas dadas

Introduzca una plantilla por línea, sin el prefijo "template:". Cada casilla puede calificarse seleccionando "Usar páginas de discusión"

Vacío Esta opción solo parece compatible con las plantillas definidas en el espacio de nombres "template:". No se puede utilizar con plantillas definidas en el espacio de nombres "User:". No se puede utilizar en los espacios de nombres "Creator:" o "Institution:" que se utilizan en Wikimedia Commons
Enlazado desde
Última edición Mostrar las páginas cuya última edición fue o no realizada por un bot, por un usuario anónimo o está marcada Cualquiera de ellos
Último cambio Fecha o período de tiempo del último cambio en la página en el formato YYYYMMDDHHMMSS (más corto permitido) "Solo las páginas creadas durante la ventana de tiempo" le permite buscar la primera modificación en su lugar
Tamaño Tamaño del archivo o rango de tamaño en bytes Vacío Permite seleccionar los artículos cuyos archivos son mayores que un límite y/o menores que otro límite
Enlaces Número o rango de enlaces internos en la página Vacío Permite la selección de artículos con muchos o pocos enlaces
Enlaces rojos
Categorías superiores Característica que aún no está disponible.
Ordenar Característica que aún no está disponible, que permitiría establecer un criterio de ordenamiento para los datos de salida.
Lista manual Permite ofrecer una lista de nombres de páginas (con su espacio de nombres como prefijo) o elementos de Wikidata desde el proyecto especificado La parte complicada es especificar los proyectos, los códigos correctos son:
  • Wikipedia en inglés: enwiki
  • Wikisource en alemán: dewikisource o dewikisourcewiki
  • Wikcionario en griego: elwiktionarywiki
  • Wikinoticias en inglés: enwikinews
  • Wikidata: wikidatawiki
Wikidata Obtener Wikidata, en caso de estar disponible.
Formato Formato de salida de los resultados de búsqueda:
HTML: páginas web
CSV: valores entre comillas, separados por comas
TSV: valores separados por tabulaciones
WIKI: como una wikitabla
PHP: como un archivo PHP
XML: como un archivo XML
¡Adelante! Presiona esto para ejecutar la consulta que definiste.

Conocimientos

Identificador de PetScan (PSID)

A partir del 04/04/2016, todas las consultas que se ejecutan en PetScan se registran (¡de forma anónima!) Y se les asigna un identificador numérico único y estable llamado "PSID". Puede utilizar el PSID para

  • ejecutar esta consulta PetScan como entrada en herramientas que admiten PSID (como WD-FIST)
  • complete una "URL corta": https://petscan.wmflabs.org/?psid=PSID ejecutará la consulta con PSID ' ', con todas sus configuraciones
  • expandir programáticamente en una consulta anterior, "sobrescribiendo" los parámetros: https://petscan.wmflabs.org/?format=wiki&psid=PSID se ejecutará la misma consulta que antes, pero el formato de salida será wiki (en lugar del HTML predeterminado, o lo que se eligió originalmente).

Notas:

  • ¡Solo se almacenará la consulta, no sus resultados!
  • Las consultas grandes (por ejemplo, con muchos elementos manuales) no se almacenarán. En ese caso, no se mostrará ningún "PSID".
  • Los resultados con una casilla de verificación vacía tienen posibles coincidencias dentro del conjunto de Wikidata.
  • el enlace interwiki petscan: se puede utilizar para generar accesos directos para consultas permanentes, por ejemplo [[petscan:PSID]]
  • las consultas registradas no se deduplican, por lo que se generará un nuevo PSID cada vez, a menos que se llame a un PSID existente sin modificaciones.

Crear elementos de Wikidata para artículos de Wikipedia que aún no tienen uno (función de creador)

  • Configura una consulta que devuelva una lista de páginas de Wikipedia (u otro proyecto que no sea de Wikidata) o pega una lista en "Otras fuentes/Lista manual"
  • En la pestaña "Propiedades de la página", debes seleccionar "Redirecciones = No" Esto se hace automáticamente ahora; ¡puedes volver a cambiarlo si realmente quieres redireccionamientos en tu lista!
  • En la pestaña "Wikidata", selecciona "Solo páginas sin elemento" para la opción "Wikidata".
  • Ejecutar consulta
  • Sus resultados tendrán elementos adicionales al lado del encabezado "resultados" (a menos que no haya iniciado sesión en WiDaR, en cuyo caso verás un enlace apropiado en su lugar)
  • Todas las páginas para las que no hay una coincidencia exacta en ninguna etiqueta o alias en Wikidata están marcadas de forma predeterminada.
  • Puedes marcar/desmarcar casillas manualmente ahora, si es necesario.
  • Puedes agregar declaraciones predeterminadas en el cuadro de declaraciones, que se agregarán a todos sus elementos nuevos. Entonces, si solo creas elementos para personas, agrega P31:Q5. Puedes agregar varias declaraciones de esta manera (una por línea). Ten en cuenta que el caso de P/Q debe estar en mayúsculas; de lo contrario, fallará silenciosamente.
  • Haz clic en el botón verde "Iniciar QS". Esto abrirá una nueva página.
  • Puedes hacer clic en "Ejecutar" para ejecutar un lote en tu navegador, o "Ejecutar en segundo plano" para ejecutarlos desde un servidor Wikimedia. Consulta Ayuda: QuickStatements para obtener más información.


Añadir o quitar declaraciones para elementos de Wikidata

Es posible añadir o quitar declaraciones de elementos de Wikidata con PetScan. Para ello es fundamental elegir "Wikidata" en "Otras fuentes -> Usar wiki". Después de esto aparecerá la caja de comandos al lado del número y permitirá continuar como se describió en la sección anterior.

Referrer

(V2 only) If you open PetScan from another tool to let the user create a query, you can pass the referrer_url and referrer_name (defaults to referrer_url) parameters. referrer_url should have a {PSID} string which will be replaced with the PSID the user sees. Once a query was run, a box at the top of the page will prompt the user to return to the original tool, using the PSID-modified referrer_url.

Ejemplos

Articles in a WikiProject

A request on the Talk page of this Manual: Find all mainspace articles within "WikiProject UK geography". Starting with a default PetScan submission form, just add "WikiProject UK geography" to the first box of the Templates row, and, just below, select "Use talk pages instead". Here is the query filled out. Hit "Do it!" at bottom. When run on 16 August 2015, the query required 1.5 seconds to run, and yielded a list of 21,408 articles. The list appears BELOW the submission form (which remains on your screen), so you have to scroll down to see the results.

Dablinks within a WikiProject

Editors working on disambiguation seek to enlist members of a content area WikiProject, specifically WikiProject Canada, to help. A PetScan report is designed to find all articles having ambiguous links that are within the given WikiProject. Criteria applied:

  1. Articles having ambiguous links are within "Category:All articles with links needing disambiguation", so paste "All articles with links needing disambiguation" into the PetScan Categories field.
  2. Depth is set arbitrarily to 9, meaning that articles as far as 9 subcategories down from the "needing disambiguation" parent category will be found. (Searching to that depth is not necessary in this case but doesn't hurt.)
  3. Articles within WikiProject Canada have "Template:WikiProject Canada" on their talk pages, so paste "WikiProject Canada" into PetScan's "Has any of these templates" field, and just below select "Use talk pages instead" as a qualifier.
  4. Only regular articles, not disambiguation pages, are wanted, and disambiguation pages are distinguished by having template:disambiguation, so paste "Disambiguation" into PetScan's "Has none of these templates" field, and make sure "Use talk pages instead" is not selected.
  • These criteria are implemented by this PetScan submission form, filled out. To submit the query, select "Do it!" at the bottom.
  • When submitted on 16 August 2015, the query took 31 seconds to run, and results were a list of 255 articles. The results show BELOW the PetScan submission form, which remains in place, so you may see no change on your screen. You have to know to scroll down to find the results! That request was run with default Output format "HTML".
  • To obtain the results in a Wikitable, in order to share them at a subpage of the WikiProject, the request could be revised to select Format "WIKI". This time the results, in wikitable markup, replace the PetScan submission form on your screen.
  • To make a more useful list for disambiguators, set up so that DabSolver will open up on any item clicked, a several step process can be followed. Here the results were saved to Tab-Separated format instead, then brought into Excel, then a column was composed which concatenated simple text strings with the results, then that resulting column was copy-pasted. The results were pasted over to the English language Wikipedia page w:Wikipedia:Canadian Wikipedians' notice board/ArticlesNeedingDisambiguation2015-08-17 and were posted also within a scrolling window in discussion at the WikiProject Canada talk page. --Doncram (talk) 19:50, 24 August 2015 (UTC) link adjusted. DexDor (talk) 06:58, 29 March 2016 (UTC)[reply]

Detecting pages that have an anomalous combination of namespace and category/ies

PetScan can be used to find pages that are in a category (or combination of categories) that is not appropriate for pages in a particular namespace - e.g. Wikipedia administration pages that are in a category that should only contain encyclopedic articles. This can then be fixed (e.g. by moving an article to the correct namespace or by editing a discussion to insert a missing ":" where a category is being referred to). The first step in this process is to identify (using PetScan) categories that cause incorrect categorization (e.g. Wikipedia administration categories that are in article categories).

Find uncategorized photo contributions in Commons in a given language

(Based on Grants:Learning patterns/Treasures or landmines: detecting uncategorized, language-specific uploads in Commons. See the motivation and full explanation there! Thank you to wikimedia user User:Spiritia and other contributors/commenters there for contributing this! )

Run a query using PetScan with the following settings:

Language = commons
Project = wikimedia
Depth = 1
Categories = Media needing categories
Combination = ☑ Subset
Namespaces = ☑ File
Templates : Has all of these templates = <your language code> 
Format:  ☑ Extended data for files     ☑ File usage data

The English language code is "en"; the Romanian language code is "ro". To find uncategorized photos uploaded by users using Romanian language, a version of the query (with html output, and without autorun) is:

https://petscan.wmflabs.org/?language=commons&project=wikimedia&depth=1&categories=Media+needing+categories&ns%5B6%5D=1&templates_yes=ro&ext_image_data=1&file_usage_data=1

As of 15 March 2016, after hitting "run" the query requires about 105 seconds to finish, and yields 1748 uncategorized photos.

Notes:

  1. The "Language =" field is not used to select the desired language; the desired language code is set in the "Template" field instead.
  2. The language code is case-sensitive in the query! So for example use "ro" not "RO".
  3. To generate the results there, Format: ☑ Wiki was chosen, instead of the default output of Html.

Enjoy! Thanks again to User:Spiritia especially!

Elementos sin declaraciones

The option "Has no statements" can be used to find:

Steps to import the template, some with PetScan.

Get the sitelinks for a certain project from a SPARQL query

  • Indicate the project on the 'Categories' tab. E.g. de for Language and wikipedia in Project to use the German language edition of Wikipedia.
  • In Other sources enter your SPARQL query
  • Make sure to select From categories from the Use wiki options
  • Press Do it

This could be useful to get the pageviews of a specific set of pages, based on a SPARQL query. You can save this to a Pagepile (check the Output tab), then enter that Pagepile ID in Massviews Analysis (select 'Page Pile' from the Source dropdown).

Obtener una lista de elementos de Wikidata con exclusiones según una consulta SPARQL

Supongamos que tienes una lista de personas con ID de Wikidata (QID) a las que deseas agregar una ocupación (P106) de 'diseñador de joyas' (Q2519376), tal vez con una herramienta como QuickStatements. Sin embargo, no deseas agregar esta ocupación a elementos que ya "tienen esa ocupación". A continuación, te indicamos cómo hacerlo con Petscan:

  • Ten tu lista de QID en un archivo de texto, con cada QID en una nueva línea
  • En la pestaña 'Otras fuentes', pega este texto en el campo llamado 'Lista manual'
  • En el formulario 'Wiki' ingresa la cadena wikidatawiki
  • En el campo 'SPARQL' ingresa tu consulta SPARQL. En este ejemplo, esta consulta dará a todos los humanos con una ocupación de 'diseñador de joyas':
    select ?item where { ?item wdt:P31 wd:Q5; wdt:P106 wd:Q2519376. }
  • Finalmente, deseas hacer una exclusión, por lo que en el campo 'Combinación' agrega la cadena manual NOT sparql para obtener todos los QID de la 'lista manual', pero sin los elementos de la consulta SPARQL.
  • Presiona '¡Hazlo!'

Añade tu ejemplo aquí...

Bug reports, feature requests, code base

Véase también