추상 위키백과/업데이트/2021-07-29

From Meta, a Wikimedia project coordination wiki
This page is a translated version of the page Abstract Wikipedia/Updates/2021-07-29 and the translation is 100% complete.
추상 위키백과 업데이트 Translate

메일링 리스트를 통한 추상 위키백과 IRC의 추상 위키백과 텔레그램의 위키함수 마스토돈의 위키함수 트위터의 위키함수 페이스북의 위키함수 유튜브의 위키함수 위키함수 웹사이트 Translate

추상적인 설명.

추상 위키백과의 목표는 모든 사람이 모든 언어로 읽을 수 있는 모든 언어로 콘텐츠를 작성할 수 있도록 하는 것입니다. 궁극적으로 우리가 목표로 하는 주요 콘텐츠 형식은 모든 사람이 편향되지 않은 최신의 포괄적인 백과사전 지식을 공평하게 보유하고 기여할 수 있도록 하는 위키백과 문서입니다.

앞으로 몇 달 안에 우리는 그 목표를 향한 중요한 이정표를 세울 것입니다. 오늘 저는 우리의 길에서 하나의 가능한 이정표를 스케치하고 싶습니다. 바로 위키데이터에 대한 추상적인 설명입니다.

위키데이터의 모든 항목에는 각 언어의 레이블과 간단한 설명다른 이름이 있습니다. 항목 Q836805를 살펴보겠습니다. 영어에서 해당 항목에는 “Chalmers University of Technology”이라는 레이블과 “university in Gothenburg, Sweden”에 대한 설명이 있습니다. 스웨덴어에서는 “Chalmers tekniska högskola”“universitet i Göteborg, Sverige”입니다. 레이블의 목표는 항목의 공통 이름이 되는 것이며 설명과 함께 세계에서 항목을 고유하게 식별해야 합니다. 그렇기 때문에 여러 항목이 동일한 레이블을 가질 수 있지만 세계의 사물은 동일하게 불릴 수 있지만 다를 수 있으므로 두 개의 항목이 주어진 언어로 동일한 레이블과 동일한 설명을 모두 가질 수는 없습니다. 다른 이름(별칭)은 검색 경험을 개선하는 데 사용됩니다.

여러 언어에 걸친 설명의 의미는 종종 동일하며 그렇지 않은 경우 의도적이지 않은 경우도 있지만 대개 우연히 다릅니다. 위키데이터에 9,400만 개 이상의 항목이 있고 위키데이터가 430개 이상의 언어를 지원한다는 점을 감안할 때, 이는 우리가 완벽한 적용 범위를 갖는다면 400억 개 이상의 레이블과 많은 설명을 갖게 된다는 것을 의미합니다. 그리고 이러한 모든 레이블과 설명을 만드는 것은 엄청난 양의 작업일 뿐만 아니라 유지 관리도 필요합니다. 이러한 품질을 확인하는 기여자가 충분하지 않으면 불행히도 문서 훼손 행위에 잠입하기 쉽습니다.

위키데이터 커뮤니티는 이 문제를 오랫동안 알고 있었고 이를 수정하기 위해 많은 노력을 기울였습니다. 마그누스 만스케(Magnus Manske)의 오토데스크(AutoDesc)와 같은 길라잡이와 Edoderoobot, Mr.Ibrahembot, MatSuBot과 같은 봇(이들은 "무작위 항목"을 클릭하고 기록을 보고 선택됨) 및 기타 많은 사람들이 적용 범위를 늘리기 위해 노력했습니다. 그리고 그것은 보여 줍니다: 이 봇은 종종 "설명"을 대상으로 하므로 위키데이터 항목의 10% 이상에서 "레이블"이 있는 언어는 6개에 불과하지만 설명에 대한 적용 범위는 무려 64개 언어입니다! 현재 위키데이터에는 20억 개 이상의 설명이 있습니다.

이러한 봇은 일반적으로 항목의 기존 설명을 기반으로 설명을 생성합니다. 그리고 그것은 훌륭합니다. 그러나 여러 언어에서 오류를 수정하는 쉬운 방법은 없으며 문서 훼손 행위가 침입하지 않도록 하는 쉬운 방법도 없습니다. 또한 봇은 비교적 작은 봇 운영자 그룹에게 과도한 책임을 부여합니다. 우리의 목표는 그 책임을 다시 민주화하고 더 많은 사람들이 기여할 수 있도록 하는 것입니다.

위키데이터의 설명은 일반적으로 명사구이며, 이는 어쨌든 추상 위키백과에 대해 수행할 수 있어야 하는 것입니다. 우리는 이 기능을 구현하는 방법에 대해 생각하기 시작하고 거기에서 위키함수와 위키데이터에서 발생해야 하는 일을 도출하려고 합니다. 이 작업은 위키데이터 팀, 위키데이터와 위키함수의 커뮤니티와 긴밀한 협력 하에 이루어져야 합니다. 이것은 추상 위키백과의 더 넓은 비전을 향한 우리의 능력을 향상시키는 방법을 나타낼 것입니다. 시간적으로, 우리는 2022년에 이를 달성하기를 희망합니다.

이것이 정확히 어떻게 작동할지는 아직 모릅니다. 다음은 몇 가지 생각입니다. 그러나 추상적인 설명을 위한 디자인을 함께 작업할 수 있도록 여러분을 초대합니다:

  • 주어진 언어에 대한 설명을 덮어쓸 수 있어야 합니다
  • 주어진 언어에 대한 로컬 덮어쓰기를 취소할 수 있어야 합니다.
  • 레이블과 설명 쌍은 여전히 고유해야 합니다
  • 이것을 구현하는 것이 큰 노력이 아니라면 좋을 것입니다
  • 목표는 자동으로 설명을 만드는 것이 아니라 추상적인 설명을 만드는 것입니다

마지막 요점은 미묘합니다: 자동 설명은 항목의 주어진 명령문에서 자동으로 생성된 설명입니다. 그것은 가치 있고 매우 어려운 작업입니다. 예를 들어, 위에서 언급한 자동설명(AutoDesc)은 다음과 같이 영어 더글라스 아담스에 대한 설명을 시작합니다: "영국의 극작가, 시나리오 작가, 소설가, 아동문학가, SF 작가, 코미디언, 작가(1952–2001) ♂; 풋라이트와 그루초 클럽 회원; 크리스토퍼 더글라스 아담스와 자넷 아담스의 자녀; 제인 벨슨의 배우자". Q42 항목의 현재 매뉴얼 영어 설명은 훨씬 더 간결한 “English writer and humorist”입니다. 주어진 항목에 대한 설명을 생성하기 위해 많은 미묘한 결정과 편집상의 판단이 내려질 수 있으며, 저는 우리가 이것에 대해 작업해야 한다고 생각합니다. 그러나 나중에.

대신 추상적인 설명을 지원하고자 합니다: 설명은 수동으로 생성되었지만 특정 자연어로 작성되는 대신 위키함수의 추상 표기법으로 인코딩된 다음 렌더러를 사용하여 자연어 텍스트를 생성합니다. 이를 통해 커뮤니티는 설명의 내용을 직접 제어할 수 있습니다.

다음은 대화를 시작하기 위한 몇 가지 아이디어입니다:

  • 새로운 언어 코드 qqz를 소개합니다. 해당 코드는 로컬 사용을 위해 예약된 범위에 있으며 미디어위키, qqqqqx의 다른 더미 언어 코드와 유사합니다. 위키데이터는 설명을 위해 qqz 언어 코드를 지원합니다.
  • qqz 설명의 내용은 추상적인 내용입니다. 기술적으로 “Z12367(Q3918, Q25287, Q34)”와 같은 문자열 표기법으로 저장할 수 있습니다. 또는 JSON Z객체를 저장할 수 있습니다.
  • 추상적인 설명은 추상 콘텐츠 편집을 위해 위키함수를 위해 개발한 것과 동일한 Vue 구성 요소를 사용하여 편집됩니다.
  • 추상 설명은 설명이 없는 언어에 대한 대체입니다. 해당 언어로 설명을 제공하여 덮어쓸 수 있습니다.
  • 렌더러 함수 또는 기본 사전식 데이터가 변경될 때마다 관련 제너레이션도 다시 트리거해야 합니다.
  • 한 가지 질문은 생성된 설명을 항목에 저장해야 하는지, 그렇다면 추상 설명에서 설명을 생성된 것으로 표시하기 위해 데이터 모델을 변경하는 방법입니다.
  • 또한 변경 사항을 추적하는 데 관심이 있는 모든 사람에게 변경 사항을 보고하는 방법을 알아내야 합니다. 위에서 제안한 대로 생성된 설명을 저장하면 현재 시스템에 피기백(Piggyback)할 수 있습니다.

이 모든 것은 토론을 위한 아이디어일 뿐입니다. 주요 질문 중 일부는 생성된 모든 설명을 항목에 저장할지 여부, 항목의 편집 히스토리에 이를 표시하는 방법, 생성된 설명의 캐싱 및 다시 트리거를 설계하는 방법 등입니다.

어떻게 생겼을까요?

지나치게 단순화된 예를 살펴보겠습니다. 샬머스(Chalmers)에 대한 영어 설명은 “university in Gothenburg, Sweden”입니다. “Z12367(Q3918, Q25287, Q34)” 형식의 추상 콘텐츠로 쉽게 템플릿화할 수 있는 합리적으로 간단한 경우처럼 보이며, 여기서 Z12367(ZID는 구성됨)은 영어로 된 추상적인 내용 “(institution) in (city), (country)”, Q3918은 대학의 QID, Q25287은 예테보리의 QID, Q34는 스웨덴의 QID를 나타냅니다. (실제로, 이 틀은 실제로 보이는 것만큼 간단하지 않습니다. 우리는 다가오는 주간 뉴스레터에서 이에 대해 더 논의할 것입니다. 지금은 이것이 매우 간단하다고 가정하겠습니다.)

그런 다음 렌더러는 이 추상 콘텐츠를 사용하고 각 언어에 대해 설명을 생성합니다(이 경우 영어의 경우 “university in Gothenburg, Sweden”, 크로아티아어의 경우 “sveučilište u Göteborgu u Švedskoj”). 이미 영어 설명이 있으므로 텍스트를 저장하거나 실제로 생성하지 않지만 크로아티아어에서는 텍스트를 생성, 저장하고 생성된 설명으로 표시합니다.

우리는 이것을 직접적으로 유용한 결과와 함께 추상 위키백과로 가는 길에 좋은 이정표라고 생각합니다. 여러분의 생각은 어떻습니까? 토론 페이지에서 이 아이디어를 논의하는 데 참여하세요.


테스터와 구현이 함께 작동하는 방식을 보여주는 상태

다른 뉴스에서 린제이는 테스트 통과 여부를 보여주기 위해 테스터와 구현이 함께 작동하는 방법이라는 새로운 기능에 대한 동영성을 만들었습니다.

동영상은 그녀가 구현을 변경하고 테스터를 여러 번 다시 실행하는 방법을 보여줍니다. 테스터는 위키함수의 품질을 보장하는 주요 구성 요소입니다.

우리와 만나 질문할 수 있는 다음 기회는 위키마니아에서 있을 것입니다. 8월 14일 17:00 UTC에 위키함수 및 추상 위키백과에 대한 1.5시간 세션을 주최합니다. 올해 위키마니아는 완전히 가상 행사가 될 예정이며 등록은 무료입니다. 위키마니아 2021에 질문과 토론을 가져오세요.

다음 주에는 주간 업데이트를 건너뜁니다.