Wikipédia Abstrata/Discussão sobre licenciamento

From Meta, a Wikimedia project coordination wiki
This page is a translated version of the page Abstract Wikipedia/Licensing discussion and the translation is 72% complete.
Outdated translations are marked like this.

A Wikipédia Abstrata é um projeto de longo prazo com o objetivo de combinar conteúdo de projetos novos e existentes da Wikimedia para permitir que os contribuidores criem e mantenham artigos da Wikipédia independentemente da língua. A Wikipédia Abstrata será construída usando funções de software criadas por contribuidores e conteúdo de outros projetos da Wikimedia, principalmente o Wikidata, para gerar texto em vários idiomas.

A Wikifunções, como outros projetos da Wikimedia, dependerá fortemente do conteúdo enviado por contribuidores. A Wikifunções também dependerá fortemente da tomada de decisões orientada por colaboradores em torno do desenvolvimento de políticas de todos os projetos. Portanto, devemos decidir juntos quais licenças usar para os componentes da Wikipédia Abstrata.

You can learn more about Abstract Wikipedia and Wikifunctions at Abstract Wikipedia.

A equipe da Wikipédia Abstrata pediu ao departamento jurídico da Fundação Wikimedia uma opinião sobre quais licenças seriam uma opção aceitável para cada camada dentro da Wikifunções e quais outros riscos legais deveriam ser considerados na escolha de uma licença. Este documento é baseado em suas recomendações e orientações.

Esta página descreve primeiro o que são esses diferentes componentes. Em seguida, descreve quais licenças fazem sentido para cada componente. Isso é seguido por uma discussão sobre as diferentes opções e suas interações entre si. A página é encerrada com declarações de opiniões individuais.

Visão geral e solicitação

(Updated: 2021-12-03)

Todas as contribuições para a Wikifunções e os projetos mais amplos da Wikipédia Abstrata serão publicadas sob licença livre. Recomendamos publicar o conteúdo abstrato sob a mesma licença do conteúdo da Wikipédia, ou seja, CC BY-SA. Além disso, recomendamos a publicação de conteúdo textual no Wikifunções sob a mesma licença, para publicar assinaturas de funções sob CC-0 e implementações de funções sob a licença Apache.

Gostaríamos de saber se você apoia essas recomendações ou se tem outras sugestões, comentários, preocupações, etc. Por favor comente na página de discussão.

We plan to summarise the discussion and opinions sometime around December 16, to leave the draft summary and draft decision up until December 20, and finalise the decision just after or during the office hour, assuming the feedback is positive.

Componentes

Um passo importante em direção à Wikipédia Abstrata são as Wikifunções, uma wiki de funções de software que podem ser combinadas com itens da Wikidata. A Wikifunções será uma plataforma de hospedagem de software, permitindo aos usuários escrever e executar códigos a partir de seus navegadores. A Wikifunções permitirá que os usuários enviem e executem funções que podem incorporar conteúdo de outros projetos da Wikimedia.

Por uma questão de licenciamento, discutimos o conteúdo em quatro níveis:

  • Assinaturas de função: A definição de uma função, ou seja, seu nome, número e tipos de argumentos de entrada e o tipo de saída;
  • Implementação de função: O código que é chamado e executado dentro da Wikifunções, que pode incluir código enviado pelo contribuidor e bibliotecas disponíveis na plataforma;
  • Conteúdo abstrato: A representação abstrata de texto ou fragmentos de texto, que é essencialmente um conjunto de chamadas de funções especializadas para produzir uma saída; e
  • Conteúdo final: O texto produzido por meio da chamada de implementações de função em conteúdo abstrato e, frequentemente, puxando conteúdo do Wikidata.

Um exemplo de cada um é fornecido na seção abaixo.

A imagem a seguir esboça os diferentes componentes da Wikipédia Abstrata relevantes para a discussão. Descrevemos os diferentes componentes no texto subsequente.

Arquitetura de como as Wikifunções serão usadas para gerar texto

Wikifunções consistirão em assinaturas de funções, implementações de funções e outros objetos. Esses outros objetos podem ser de vários tipos e o conjunto de tipos é extensível. Objetos terão documentação.

As assinaturas de função são como APIs, fornecem o nome da função e argumentos, bem como os tipos de argumentos e do resultado. Implementações são o código-fonte das funções — elas dizem ao computador como transformar os argumentos em uma resposta. A documentação pode ser feita para qualquer assinatura, implementação e qualquer outro objeto na Wikifunções. Outros objetos na Wikifunções podem ser testadores, strings individuais, listas, tipos, conteúdo abstrato, etc.

Some of the functions will be functions that take abstract content and generate output content (often natural language text) out of it. Some of the functions will access data in Wikidata or other locations and generate natural language text out of it. The functions may use lexicographic data from Wikidata in order to generate the text.

O texto gerado pode ser integrado em cada Wikipédia para preencher lacunas de conhecimento.

Exemplo dos componentes

Nota: Esses exemplos são altamente simplificados e mostram valores de exemplo em inglês que seriam tecnicamente QIDs do Wikidata para internacionalização (exemplos).

Given a constructor Superlative with the keys subject, quality, class, and location constraint, we can have the following abstract content:

Superlative(
  subject: Jupiter,
  quality: large,
  class: planet,
  location constraint: Solar System)

Na Wikifunções, teríamos a seguinte assinatura de função:

generate text(superlative, language) : text

Ou seja, uma função que pega um objeto superlativo (como fornecido no conteúdo abstrato acima) e um idioma (como o inglês) e retorna um texto.

Isso poderia ser uma possível implementação de função em Python:

def generate_text(superlative, language):
  if language == English:
    subject = get_label(superlative.subject, language)
    adjective = superlative_form(superlative.quality, language)
    class = singular_form(superlative.class, language)
    location_clause = make_location_clause(superlative.location_constraint, language)
    text = ‘ ‘.join(subject, ‘is the’, adjective, class, location_clause)
    return text.capitalize_first(text)
  if language == Hausa:
    ...
  ... 

A aplicação da função ao conteúdo abstrato resultaria no seguinte conteúdo final:

(em inglês) Jupiter is the largest planet in the Solar System.

(em croata) Jupiter je najveći planet u Sunčevom sustavu.

Este texto pode então ser mostrado por uma edição linguística da Wikipédia para fornecer uma base comum de conhecimento sobre Júpiter.

Análise jurídica e padrões de direitos autorais por tipo de conteúdo

O movimento Wikimedia adotou uma política de licenciamento geral que favorece as licenças de cultura livre e licenças de software de código aberto. A escritura Creative Commons Zero (CC0) fornece uma isenção que visa garantir que o conteúdo seja de domínio público (ou o equivalente local de uma jurisdição para o domínio público) em todo o mundo. A licença Creative Commons Atribuição-CompartilhaIgual (CC BY-SA) permite que as pessoas usem o conteúdo cumprindo com os requisitos mínimos de atribuição e garantindo que as adaptações subsequentes sejam lançadas sob os termos de uma licença compatível. Finalmente, para software, a Wikimedia segue a lista de licenças aprovadas da Open Source Initiative (OSI).

Fatos

Os fatos em si geralmente não podem ser protegidos pela lei de direitos autorais. Nos Estados Unidos, a Suprema Corte descreveu este princípio em Feist Publications Inc. vs Rural Telephone Service Co.: “O axioma mais fundamental da lei de direitos autorais é que 'autor não pode ter os direitos autorais de suas ideias ou dos fatos que narra.'” Este é um elemento básico da lei de direitos autorais que se aplica independentemente do conteúdo ser explicitamente liberado sob uma licença.

Os projetos da Wikimedia adotaram CC0 para projetos que são projetados para coletar fatos básicos. Por exemplo, isso inclui itens ou propriedades no Wikidata ou dados estruturados no Wikimedia Commons. CC0 fornece uma renúncia internacional básica de direitos autorais para garantir que o conteúdo factual seja livre para ser usado sem restrições. Isso torna mais fácil para o conteúdo ser descoberto, reutilizado e citado em outro lugar. Esta licença também pode incorporar fatos desprotegíveis que são copiados de fontes sob outras licenças, como texto da Wikipédia que está disponível sob CC BY-SA.

Software

O software geralmente pode ser protegido pela lei de direitos autorais, embora nem todos os aspectos do software devam ser tratados da mesma forma. A Wikimedia assumiu a posição de que a organização e a função básica das APIs não são protegidas por direitos autorais de acordo com a lei dos Estados Unidos.

Para software com direitos autorais, a Fundação adota uma licença de software de código aberto para permitir que ele seja reutilizado livremente sob condições mínimas. O princípio orientador sobre liberdade e código aberto da Wikimedia prevê que a Fundação deve liberar todo o código que cria sob uma licença de código aberto aplicável. Em áreas onde a Wikimedia oferece suporte a softwares criados por usuários, como os serviços em nuvem da Wikimedia, também é necessário que o software seja lançado sob uma licença de código aberto. Há uma grande variedade de licenças que se qualificam como código-fonte aberto, então, para esclarecer este requisito, a Wikimedia normalmente recorre à lista de licenças de software aprovadas pela OSI.

Para MediaWiki, a licença de software principal é a GNU General Public License (versão 2.0 ou posterior). Para outros projetos, a Wikimedia geralmente adota uma licença mais permissiva, como a Licença Apache (versão 2.0) que tem sido usada para projetos individuais, extensões e aplicativos móveis.

Texto ou conteúdo de mídia

De acordo com a política de licenciamento de conteúdo da Wikimedia, os projetos da Wikimedia podem hospedar conteúdo que está disponível sob uma licença livre, em domínio público (como copyright expirado ou outro conteúdo não protegido por copyright) ou justificativa de uso justo (em alguns circunstâncias limitadas; fair use em inglês). Para a maioria dos projetos da Wikimedia, incluindo a Wikipédia, isso significa que o texto e a mídia estão disponíveis sob CC BY-SA (versão 3.0).

Recomendação do departamento jurídico da WMF

A Wikimedia deve estabelecer a licença para cada tipo de conteúdo por meio de políticas claras e simples para as funções da Wikimedia. A Wikimedia deve criar documentação que explique as licenças para cada tipo de conteúdo, incluindo o motivo para selecionar esta licença. Para software em particular, deve haver orientação sobre a importação de código de terceiros somente sob uma licença aceitável. A interface do usuário deve incluir uma concessão de licença apropriada para cada conteúdo.

Function Signatures

Recomendação: as assinaturas de função devem ser CC0.

Function signatures should be composed of basic components (e.g., a list of parameters) that are based on underlying functionality. The actual content of the function signatures is unlikely to be protectable by copyright, or where it is protectable, it may be used under fair use in the US. CC0 is an appropriate license for information that may not be eligible for copyright at all. Use of CC0 avoids creating confusion or misleading reusers to believe there are copyright limitations where none exist. Additionally, CC0 will ensure maximum interoperability with the other open source or free culture licenses.

Function Implementation

Recomendação: a implementação da função deve estar sob a Licença Apache.

A implementação da função deve estar sob uma licença aprovada pelo OSI. Se a equipe do Wikifunções e a comunidade desejam limitar isso a uma licença, a Licença Apache forneceria um nível ideal de flexibilidade permissiva.

Além disso, a Wikifunções podem permitir outras licenças que são compatíveis com a Licença Apache, como a Licença MIT ou Licença BSD (cláusula 3). Permitir um conjunto adicional de opções de licença pode permitir que os usuários importem mais conteúdo de outras fontes de terceiros. No entanto, também exigiria a criação de requisitos de software adicionais, como uma interface de usuário para selecionar uma licença e exibir os avisos da licença escolhida. A Wikifunções pode escolher uma única licença, por uma questão de simplicidade, durante o lançamento inicial e, em seguida, considerar a adição de suporte para várias licenças posteriormente com base na necessidade.

Conteúdo abstrato

Recomendação: o conteúdo abstrato deve ser licenciado sob CC BY-SA ou CC0.

O conteúdo abstrato pode ser lançado sob uma licença CC BY-SA ou qualquer outra licença igualmente permissiva que se adapte aos objetivos do projeto e atenda à política de licenciamento da Wikimedia. A Wikimedia tem autonomia significativa na escolha da melhor licença para o conteúdo abstrato.

A escolha de CC BY-SA seria uma escolha padrão e ofereceria o benefício de consistência com a Wikipédia e a maioria dos outros projetos da Wikimedia. Isso permitiria aos usuários copiar e incorporar o conteúdo da Wikipédia ao conteúdo abstrato de alguma forma. No entanto, também exigiria a preservação de um histórico de edição ou algum mecanismo de histórico de contribuição equivalente para o conteúdo abstrato, para permitir que as pessoas forneçam atribuição à lista de autores do conteúdo.

Como alternativa, o conteúdo abstrato pode ser liberado de acordo com os termos CC0 mais permissivos. Isso permitiria que o software contornasse os requisitos de atribuição, mas limitaria a capacidade dos usuários de copiar ou incorporar quaisquer partes protegíveis dos artigos da Wikipédia ou de outras fontes.

Output Content

Recommendation: Output Content should be licensed under CC BY-SA or CC0.

Since Output Content is generated via software that combines multiple data sources, there may be questions about whether the resulting product is copyrightable at all. In 2019, the US Copyright Office requested comments about how content created by AI algorithms or processes should be handled under copyright law. In the Wikimedia Foundation's submission in response, we explained that AI algorithms should be treated like any other software tool and that the tool's user should be considered the copyright holder. Following the same principle, Wikimedia may consider Output Content as a work of creativity by the authors of the Abstract Content. It would therefore likely be most effective if the output content is licensed consistently with existing Wikimedia projects, and can be discussed by the communities as to which of the licenses currently in use would be preferred.

Recomendações da equipe de desenvolvimento

A equipe de desenvolvimento recomenda seguir as recomendações do Jurídico, ou seja, escolher CC0 como a licença para assinaturas de função; Apache para implementações de função (e para começar com uma única licença, e somente quando reconhecemos a necessidade de múltiplas licenças para estender Wikifunções para suportar múltiplas licenças); para escolher CC0 ou CC BY-SA para o conteúdo abstrato e o conteúdo final.

Para documentação e outro conteúdo textual da Wikifunções, escolheremos CC BY-SA para preservar a compatibilidade com a maioria dos outros projetos da Wikimedia em relação ao conteúdo textual. Para outros objetos em Wikifunções além de implementações, nós o manteremos consistente com a escolha de assinaturas de função.

A equipe de desenvolvimento recomenda ainda a escolha de CC BY-SA para o conteúdo abstrato e conteúdo final. Considerando que se poderia argumentar que o conteúdo abstrato é mais semelhante aos dados estruturados da Wikidata do que ao texto em linguagem natural da Wikipédia, pensamos que há uma série de fatores que tornam o conteúdo abstrato suficientemente semelhante ao texto:

  1. Os editores têm uma seleção muito refinada de quais fatos estão sendo exibidos e quais não são. No Wikidata, nós nos esforçamos para sermos completos em vez de uma seleção cuidadosa.
  2. Os editores têm um controle muito refinado da ordem em que os fatos estão sendo exibidos, constituindo elementos narrativos, que não estão disponíveis no Wikidata.
  3. Esperamos que a geração de linguagem natural permita que os editores expressem com certo grau de ênfase e seleção de palavras.

Tudo isso aponta para que o conteúdo abstrato seja mais semelhante a um texto do que a uma coleção de fatos e, portanto, sugerimos que sigamos a mesma licença que usamos para o texto na Wikipédia, que é CC BY-SA. Por outro lado, pode-se argumentar que, ao colocar o conteúdo abstrato em CC0, abrimos espaço para uma maior quantidade de reutilização possível em aplicativos que nem mesmo podemos imaginar, muito menos decidir adequadamente a estrutura legal dele. O CC0 certamente permite a maior liberdade na reutilização do conteúdo abstrato.

Request for input

Gostaríamos de convidar a comunidade para discutir essas recomendações e esperamos encontrar um consenso sobre a decisão de licenciamento. O objetivo é manter a discussão aberta por cerca de quatro semanas e, se necessário, ampliá-la e reestruturá-la. Caso isso se revele insuficiente para chegar a um consenso, podemos reestruturar a discussão sobre licenciamento para focar apenas nas Wikifunções por enquanto e então prosseguir com uma discussão sobre a Wikipédia Abstrata.

Para orientar a escolha da licença, pode ser útil considerar e discutir as seguintes questões:

  1. Quais são os objetivos de longo prazo dos projetos e como uma licença de direitos autorais pode apoiar esses objetivos?
  2. As pessoas envolvidas na criação de conteúdo abstrato devem receber crédito?
  3. Qual é o valor de preservar a consistência e a compatibilidade com as licenças da Wikipédia?

(Updated: 2021-12-03)

A questão específica para a comunidade é se deve seguir as recomendações fornecidas ou se uma proposta diferente seria mais do agrado da comunidade. Questões de interesse específicas envolvem o licenciamento de implementações de função e o licenciamento do conteúdo abstrato (e, portanto, conteúdo final).

Mesmo se você estiver apenas apoiando as recomendações acima, seria ótimo ver sua voz expressa de forma explícita, a fim de obter uma melhor compreensão das tendências da comunidade. Se nenhum consenso aproximado for alcançado, organizaremos uma votação formal.

Comentários são bem-vindos em qualquer idioma.