PetScan
PetScan은 강력한 쿼리 도구입니다. PetScan 제출 양식에 쿼리가 준비되어 있습니다. 또한 이 도구의 근거를 확인하세요.
소개
PetScan은 사용자가 데이터를 추출하고, 특정 범주의 모든 페이지 또는 특정 속성을 가진 모든 항목과 같이 특정 기준과 일치하는 위키백과(및 관련 프로젝트) 페이지 또는 위키데이터 항목 목록을 생성하고, 위키미디어 프로젝트에서 데이터를 추출 및 분석할 수 있는 도구입니다. PetScan은 또한 다양한 방법으로 일부 임시 목록(여기서는 "출처"라고 함)을 결합하여 새로운 목록을 생성할 수 있습니다. 출처는 다음과 같습니다:
위키미디어/위키백과의 페이지
이들은 "분류", "페이지 속성" 및 "틀 및 링크" 탭에서 정의됩니다. 특정 틀이 있는 분류 트리의 페이지 또는 특정 페이지와의 링크를 요청할 수 있습니다. 결과를 특정 이름공간, 봇/인간 편집, 최근 편집/페이지 생성 등으로 제한합니다. 이 세 탭은 이전 CatScan2 기능을 나타냅니다. 쿼리 결과는 이후에 "분류 출처"로 고정됩니다.
기타 출처
이 탭에서 위키데이터 SPARQL(WDQS) 쿼리 또는 PagePile 목록과 같은 더 많은 출처를 추가할 수 있습니다. 여러 출처를 결합하는 방법을 정의할 수도 있습니다. 기본적으로 하위 집합(즉, 모든 출처에서 발생하는 페이지만)이 최종 결과로 반환됩니다. 목록이 가리키는 위키를 지정할 수도 있습니다. 위키백과와 위키데이터 결과를 결합하는 경우.
위키데이터
이 탭에서 결과에 추가로 주석을 달거나 "필터링"할 수 있습니다. 예를 들어 문이 없는 위키데이터 항목만 반환합니다. 이 필터 중 하나를 사용하면 목록이 위키데이터로 변환됩니다.
출력
여기에서 목록에 대한 옵션을 지정할 수 있습니다. 형식(웹 페이지, 위키, PagePile 등). 예를 들어 결과를 추가로 필터링할 수도 있습니다. 페이지 제목/항목 레이블에 정규식을 사용합니다. 결과 목록을 누락된 항목의 순위 목록("빨간색 링크")으로 바꿀 수도 있습니다.
검색어 정의
쿼리 양식에서 설정할 수 있는 필드는 다음과 같습니다:
필드 | 의미 | 기본값 | 참고 |
---|---|---|---|
언어 | 프로젝트 언어 코드를 선택합니다. 영어는 "en", 독일어는 "de"입니다. 위키미디어 공용의 경우 "commons"를 선택하십시오. | "en" | |
프로젝트 | 검색할 위키미디어 프로젝트(위키백과, 위키낱말사전, 위키배움터 등) | "wikipedia" | NOTE: If you choose "Commons," be sure to go to the "Page properties" tab and check the "File" namespace to get useful results. |
깊이 | 검색할 분류 트리의 깊이입니다. 0은 하위 분류를 사용하지 않음을 의미합니다. | "0" | |
분류 | 분류 목록, "분류:" 부분 없이 한 줄에 하나씩. | 빈 | '|' 추가 숫자는 이 분류 트리의 깊이를 설정하여 깊이 필드에서 선택한 항목을 재정의합니다. 분류를 지정하면 검색 결과의 범위를 좁히고 특정 주제와 관련된 페이지에 집중할 수 있습니다. |
제외 분류 | 위와 같은 분류 목록입니다. 이 분류에 포함되지 않은 문서만 허용됩니다. | 빈 | |
콤비네이션 | 위 분류를 사용하는 방법:
현재 사용 가능한 옵션은 "하위 집합" 또는 "합집합"입니다. |
"하위집합" | |
이름공간 | 잠재적인 페이지로 사용할 이름공간 | 문서 | |
넘겨주기 | 어느 하나 | ||
틀 | 다음 페이지만 사용
"template:" 접두사 없이 한 줄에 하나의 틀을 입력합니다. 각 상자는 "대신 토론 페이지 사용"을 선택하여 자격을 얻을 수 있습니다. |
빈 | 이 옵션은 "template:" 이름공간에 정의된 틀과만 호환되는 것 같습니다. "User:" 이름공간에 정의된 틀과 함께 사용할 수 없습니다. 위키미디어 공용에서 사용되는 "Creator:" 또는 "Institution:" 이름공간에서는 사용할 수 없습니다. |
링크: | |||
마지막 편집 | 마지막 편집이 봇, 익명 사용자 또는 플래그가 지정된 페이지 표시 | Either, either, either | |
마지막 변경 | YYYYMMDDHHMMSS 형식의 페이지에서 마지막으로 변경된 날짜 또는 기간(더 짧게 허용됨) | "위 기간 동안 생성된 페이지만"을 사용하면 대신 "첫 번째 변경"을 찾을 수 있습니다. | |
크기 | 파일 크기 또는 크기 범위(바이트) | 빈 | 파일이 하나의 컷오프보다 크거나 다른 컷오프보다 작은 문서를 선택할 수 있습니다. |
링크 | 페이지의 내부 링크 수 또는 범위 | 빈 | 링크가 많거나 적은 문서를 선택할 수 있습니다. |
레드링크 | |||
상위 분류 | 아직 사용할 수 없는 기능입니다. | ||
정렬 | 아직 사용할 수 없는 기능으로 출력에 대한 정렬 기준을 설정합니다. | ||
매뉴얼 목록 | 지정된 프로젝트의 (이름공간 접두사) 페이지 이름 또는 위키데이터 항목 목록을 제공할 수 있습니다. | 까다로운 부분은 올바른 코드가 다음과 같은 프로젝트를 지정하는 것입니다:
| |
위키데이터 | 가능한 경우 위키데이터를 가져옵니다. | ||
형식 | 검색 결과 출력 형식: HTML: 웹페이지 CSV: 쉼표로 구분된 따옴표로 묶인 값 TSV: 탭으로 구분된 값 WIKI: 위키테이블로 PHP: PHP 파일로 XML: XML 파일로 |
||
하세요! | 정의한 제출을 실행하려면 이것을 누르십시오. |
노하우
PetScan ID (PSID)
2016-04-04부터 PetScan에서 실행되는 모든 쿼리는 (익명으로!) 기록되고 "PSID"라는 고유하고 안정적인 숫자 식별자가 할당됩니다. "PSID"를 사용하여 다음을 수행할 수 있습니다:
- 이 PetScan 쿼리를 PSID를 지원하는 도구(예: WD-FIST)에서 입력으로 실행합니다.
- "짧은 URL" 입력:
https://petscan.wmflabs.org/?psid=PSID
은 모든 설정과 함께 "PSID"로 쿼리를 실행합니다. - 매개변수를 "덮어쓰기"하여 이전 쿼리에서 프로그래밍 방식으로 확장:
https://petscan.wmflabs.org/?format=wiki&psid=PSID
는 이전과 동일한 쿼리를 실행하지만 출력 형식은 wiki(기본 HTML 또는 원래 선택된 항목 대신)입니다.
"참고:"
- 쿼리만 저장되며 결과는 저장되지 않습니다!
- 큰 쿼리(예: 수동 항목이 많은 쿼리)는 저장되지 않습니다. 이 경우 "PSID"가 표시되지 않습니다.
- 체크박스가 비어 있는 결과는 위키데이터 세트 내에서 일치 가능성이 있습니다.
- 인터위키 링크petscan:를 사용하여 영구적인 쿼리 예를 들어 [[petscan:PSID]]에 대한 바로가기를 생성할 수 있습니다.
- 기록된 쿼리는 중복 제거되지 않으므로 기존 PSID를 수정 없이 호출하지 않는 한 매번 새로운 PSID가 생성됩니다.
아직 없는 위키백과 문서에 대한 위키데이터 항목 생성(작성자 기능)
- 위키백과(또는 기타 비 위키데이터 프로젝트) 페이지 목록을 반환하는 쿼리를 설정하거나 목록을 "기타 출처/매뉴어 목록"에 붙여넣습니다.
"페이지 속성" 탭에서 "넘겨주기=아니요"를 선택해야 합니다."이것은 이제 자동으로 수행됩니다. 목록에서 넘겨주기를 원하는 경우 다시 변경할 수 있습니다!"- "위키데이터" 탭에서 "위키데이터" 옵션에 대해 "항목이 없는 페이지만"을 선택하십시오.
- 쿼리 실행
- 결과는 "결과" 헤더 옆에 추가 요소가 있습니다(WiDaR에 로그인하지 않은 경우 대신 적절한 링크가 표시됨).
- 위키데이터의 레이블이나 별칭에 정확히 일치하지 않는 모든 페이지가 기본적으로 선택됩니다.
- 이제 필요한 경우 상자를 수동으로 선택/선택 취소할 수 있습니다.
- 모든 새 항목에 추가될 명세서 상자에 기본 명세서를 추가할 수 있습니다. 따라서 사람들을 위한 항목만 만드는 경우
P31:Q5
를 추가합니다. 이 방법으로 여러 문을 추가할 수 있습니다(한 줄에 하나씩). P/Q의 대소문자는 대문자여야 합니다. 그렇지 않으면 조용히 실패합니다. - 독일어 설명의 경우
Dde:"some description"
와 같이 새 항목에 기본 설명을 추가할 수 있습니다. - 녹색 "QS 시작" 버튼을 클릭합니다. 새 페이지가 열립니다.
- "실행"을 클릭하여 브라우저에서 배치를 실행하거나 "백그라운드에서 실행"을 클릭하여 위키미디어 서버에서 실행할 수 있습니다. 자세한 내용은 도움말:QuickStatements를 참조하십시오.
2020년 7월 현재 "백그라운드에서 실행"에는 다양한 버그가 있습니다(예: 중복 항목이 생성될 수 있음). 가능하면 프런트엔드 모드를 사용하세요! |
위키데이터 항목에 대한 설명 추가/제거
PetScan을 사용하여 위키데이터 항목에 대한 설명을 추가하거나 제거할 수 있습니다. 이를 위해 "기타 출처 -> 위키 사용"에서 "위키데이터"를 선택하는 것이 중요합니다. 그러면 숫자 옆에 명령 상자가 표시되고 이전 섹션에서 설명한 대로 계속할 수 있습니다.
참조자
"(V2 전용)" 사용자가 쿼리를 만들 수 있도록 다른 도구에서 PetScan을 열면, referrer_url
및 referrer_name
(기본값은 referrer_url
) 매개변수를 전달할 수 있습니다. referrer_url
에는 사용자에게 표시되는 PSID로 대체될 {PSID}
문자열이 있어야 합니다. 쿼리가 실행되면 페이지 상단의 상자에 PSID 수정 referrer_url
을 사용하여 원래 도구로 돌아가라는 메시지가 표시됩니다.
예시
위키프로젝트의 문서
이 매뉴얼의 토론 페이지에 대한 요청: "위키프로젝트 영국 지리" 내의 모든 메인스페이스 문서를 찾으십시오. 기본 PetScan 제출 양식으로 시작하여 틀 행의 첫 번째 상자에 "WikiProject UK geography"를 추가하고 바로 아래에서 "대신 토론 페이지 사용"을 선택하십시오. "여기에 쿼리가 작성되었습니다." 맨 아래의 "실행!"을 누르십시오. 2015년 8월 16일에 실행했을 때 쿼리를 실행하는 데 1.5초가 걸렸고 21,408개의 문서 목록이 생성되었습니다. 목록은 제출 양식(화면에 남아 있음) 아래에 나타나므로 결과를 보려면 아래로 스크롤해야 합니다.
위키프로젝트 내의 Dblink
명확성을 위해 작업하는 편집자는 콘텐츠 영역 위키프로젝트, 특히 위키프로젝트 캐나다의 구성원에게 도움을 요청합니다. PetScan 보고서는 주어진 위키프로젝트 내에 있는 모호한 링크가 있는 모든 문서를 찾도록 설계되었습니다. 적용 기준:
- 모호한 링크가 있는 문서는 "분류:명확성이 필요한 링크가 있는 모든 문서" 내에 있으므로 PetScan 분류 필드에 "모든 문서 링크가 필요한 명확성이 필요한 문서"를 붙여넣습니다.
- 깊이는 임의로 9로 설정되며, 이는 "명확성이 필요한" 상위 분류에서 최대 9개의 하위 분류까지 문서를 찾을 수 있음을 의미합니다. (이 경우 해당 깊이까지 검색할 필요는 없지만 문제가 되지는 않습니다.)
- 위키프로젝트 캐나다 내의 문서는 토론 페이지에 "틀:위키프로젝트 캐나다"가 있으므로 PetScan의 "다음 틀 중 하나가 있음" 필드에 "위키프로젝트 캐나다"를 붙여넣습니다. 바로 아래에서 한정자로 "대신 토론 페이지 사용"을 선택합니다.
- 동음이의어 페이지가 아닌 일반 문서만 원하며 명확성 페이지는 틀:동음이의를 가짐으로써 구분되므로 PetScan의 "이러한 틀이 없습니다." 필드에 "동음이의"를 붙여넣고 "토론 페이지 사용"을 확인하십시오. 대신"이 선택되지 않았습니다.
- 이러한 기준은 "이 PetScan 제출 양식, 작성됨"에 의해 구현됩니다. 쿼리를 제출하려면 하단의 "실행!"을 선택합니다.
- 2015년 8월 16일에 제출했을 때 쿼리를 실행하는 데 31초가 걸렸고 결과는 255개의 문서 목록이었습니다. 결과는 그대로 남아 있는 PetScan 제출 양식 아래에 표시되므로 화면에 변경 사항이 표시되지 않을 수 있습니다. 결과를 찾으려면 아래로 스크롤해야 합니다! 해당 요청은 기본 출력 형식 "HTML"로 실행되었습니다.
- 위키테이블에서 결과를 얻으려면 위키프로젝트의 하위 페이지에서 공유하기 위해 "위키" 형식을 선택하도록 요청을 수정할 수 있습니다. 이번에는 위키테이블 마크업의 결과가 화면의 PetScan 제출 양식을 대체합니다.
- 모호성 제거기에 대한 보다 유용한 목록을 만들려면 DabSolver가 클릭한 모든 항목에서 열리도록 설정하고 여러 단계 프로세스를 따를 수 있습니다. 여기에서 결과는 대신 탭으로 구분된 형식으로 저장된 다음 엑셀로 가져온 다음 간단한 텍스트 문자열을 결과와 연결하는 열을 구성한 다음 결과 열을 복사하여 붙여넣었습니다. 결과는 영어 위키백과 페이지 w:Wikipedia:Canadian Wikipedians' notice board/ArticlesNeedingDisambiguation2015-08-17에 붙여넣어졌고 위키프로젝트 캐나다 토론 페이지에서 토론 중인 스크롤 창에도 게시되었습니다. --Doncram (토론) 2015년 8월 24일 19:50 (UTC) link adjusted. DexDor (토론) 2016년 3월 29일 06:58 (UTC)
이름공간과 분류의 비정상적인 조합이 있는 페이지 감지
PetScan은 특정 이름공간의 페이지에 적합하지 않은 분류(또는 분류 조합)에 있는 페이지를 찾는 데 사용할 수 있습니다. 백과사전 문서만 포함해야 하는 분류에 있는 위키백과 관리 페이지입니다. 그런 다음 이 문제를 해결할 수 있습니다(예: 문서를 올바른 이름공간으로 이동하거나 토론을 편집하여 분류를 참조하는 위치에 누락된 ":"을 삽입). 이 프로세스의 첫 번째 단계는 잘못된 분류(예: 문서 분류에 있는 위키백과 관리 분류)를 유발하는 분류를 식별(PetScan 사용)하는 것입니다.
특정 언어로 공용에서 분류되지 않은 사진 기여 찾기
(보조금:학습 패턴/보물 또는 지뢰: 공용에서 분류되지 않은 언어별 업로드 감지를 기반으로 합니다. 여기에서 동기 부여와 전체 설명을 확인하세요! 기여해 주신 위키미디어 사용자 User:Spiritia 및 기타 기여자/코멘터에게 감사드립니다! )
다음 설정으로 PetScan을 사용하여 쿼리를 실행합니다:
Language = commons
Project = wikimedia
Depth = 1
Categories = 분류되지 않은 파일
Combination = ☑ Subset
Namespaces = ☑ File
Templates : Has all of these templates = <언어 코드>
Format: ☑ Extended data for files ☑ File usage data
영어 코드는 "en"입니다. 루마니아어 코드는 "ro"입니다. 루마니아어를 사용하여 사용자가 업로드한 분류되지 않은 사진을 찾기 위한 쿼리 버전(html 출력 포함, 자동 실행 없음)은 다음과 같습니다.
2016년 3월 15일 기준으로 "실행"을 누른 후 쿼리를 완료하는 데 약 105초가 필요하며 분류되지 않은 1748개의 사진이 생성됩니다.
참고:
- "언어 =" 필드는 원하는 언어를 선택하는 데 사용되지 않습니다. 대신 "틀" 필드에 원하는 언어 코드가 설정됩니다.
- 언어 코드는 쿼리에서 대소문자를 구분합니다! 예를 들어 "RO"가 아닌 "ro"를 사용하십시오.
- 결과를 생성하기 위해 형식: ☑ Html의 기본 출력 대신 위키가 선택되었습니다.
좋았습니다! 특히 User:Spiritia님께 다시 한 번 감사드립니다!
설명이 없는 항목
"설명 없음" 옵션을 사용하여 다음을 찾을 수 있습니다:
- 위키백과의 분류에 대한 설명이 없는 항목(샘플: en:분류:미국의 지리 토막글)
- 전체 위키백과 언어 버전에 대한 설명이 없는 항목(샘플: "sowiki")
틀을 가져오는 단계(일부는 PetScan 사용).
SPARQL 쿼리에서 특정 프로젝트에 대한 사이트링크 가져오기
- '분류' 탭에 프로젝트를 표시합니다. 예를 들어, 위키백과의 독일어 버전을 사용하려면 언어에서
de
, 프로젝트에서wikipedia
를 지정합니다 - 기타 출처에 SPARQL 쿼리를 입력하세요.
- 위키 사용 옵션에서 분류에서를 선택해야 합니다.
- 실행을 누르세요.
이는 SPARQL 쿼리를 기반으로 특정 페이지 집합의 페이지뷰를 가져오는 데 유용할 수 있습니다. 이를 Pagepile에 저장한 다음(출력 탭 확인) 대량 조회수 분석에 해당 Pagepile ID를 입력할 수 있습니다(출처 드롭다운에서 'Page Pile' 선택).
SPARQL 쿼리를 기반으로 제외 항목이 있는 위키데이터 항목 목록 가져오기
QuickStatements와 같은 도구를 사용하여 '보석 디자이너'(Q2519376)의 직업(P106)을 추가하려는 위키데이터 ID(QID)가 있는 사람의 목록이 있다고 가정해 보겠습니다. 그러나 이미 "해당 직업이 있는" 항목에 이 직업을 추가하고 싶지는 않습니다. PetScan으로 수행하는 방법은 다음과 같습니다:
- QID 목록을 텍스트 파일에 포함하고 각 QID는 줄 바꿈
- '기타 출처' 탭에서 '수동 목록' 필드에 이 텍스트를 붙여넣습니다.
- '위키' 형식에
wikidatawiki
문자열을 입력합니다. - 'SPARQL' 필드에 SPARQL 쿼리를 입력합니다. 이 예에서 이 쿼리는 '보석 디자이너'라는 직업을 가진 모든 사람을 제공합니다.
select ?item where { ?item wdt:P31 wd:Q5; wdt:P106 wd:Q2519376. }
- 마지막으로, 제외를 원하므로 '조합' 필드에
manual NOT sparql
문자열을 추가하여 '수동 목록'에서 모든 QID를 가져오지만 SPARQL 쿼리에서 항목은 "제외"합니다. - '실행!'을 누르세요.
여기에 예제를 추가하세요...
버그 보고서, 기능 요청, 코드 베이스
같이 보기
외부 링크