Jump to content

Lista de desejos tecnológicos da lusofonia/2025/Propostas/Utilização de IA generativa para a produção de textos alternativos: do Wikidata (P180) para a Wikipédia, Wikilivros...

From Meta, a Wikimedia project coordination wiki
Utilização de IA generativa para a produção de textos alternativos: do Wikidata (P180) para a Wikipédia, Wikilivros...
Logo do projeto
Utilização de IA generativa para a produção de textos alternativos: do Wikidata (P180) para a Wikipédia, Wikilivros...
Data de proposiçãoApril 9, 2025, às 12:50 (UTC)
Propositor(es)
Tópico(s)
Projetos associados
Prioritário1 voto
Importante5 votos
Neutro(a)0 votos
Não prioritário0 votos
Propostas
Independência ou Morte, de Pedro Américo.
Fundação de São Vicente, de Benedito Calixto.
  • Desafio: Qual é a principal dificuldade, obstáculo ou problema enfrentado? Descreva a situação e o que precisa ser resolvido.

Investir em acessibilidade garante que o conhecimento que produzimos seja verdadeiramente livre, inclusivo e disponível para todas as pessoas, independentemente de suas condições físicas, cognitivas, sociais ou tecnológicas. Historicamente, temos pouco engajamento comunitário na produção de interfaces e conteúdos acessíveis. A proposta que detalho abaixo traz consigo a dificuldade de transformar semi-automaticamente dados estruturados do Wikidata — como o uso da propriedade P180 (retrata) — em textos coerentes adequados para projetos como a Wikipédia ou o Wikilivros.

Isso cria um duplo problema: (1) desenvolver uma forma confiável de conversão dos dados em linguagem natural, mantendo a fidelidade à informação original, e (2) garantir que o conteúdo gerado possa ser integrado aos projetos Wikimedia sem comprometer a qualidade e a governança editorial já estabelecida. Não acredito que seja necessário gerar o áudio descritivo, já que leitores de tela os gera.

  • Solução: Que ação ou iniciativa você considera que devam ser adotadas para resolver esse desafio?

Proponho o desenvolvimento de uma ferramenta baseada em inteligência artificial generativa que seja capaz de transformar dados estruturados do Wikidata em textos acessíveis e contextualizados, especialmente conteúdo de GLAMs. Por exemplo, a propriedade P180, que indica as representações presentes em uma obra de arte, pode conter informações valiosas — como o fato de uma pintura retratar uma figura histórica, uma cena mitológica ou um evento religioso —, mas esses dados aparecem de forma crua, fragmentada e muitas vezes inacessível para o público geral. Uma IA bem treinada, usando como obras foram descritas em projetos variados, como Audiodescrição de obras do Museu do Ipiranga, poderia interpretar essas informações e gerar uma descrição em linguagem natural.

Essa abordagem permitiria, por exemplo, que uma imagem presente em uma página da Wikipédia fosse acompanhada de uma descrição textual mais completa, útil tanto para leitores comuns quanto para pessoas com deficiência visual que utilizam leitores de tela. Além disso, textos alternativos poderiam ser incorporados em projetos como o Wikilivros ou o Wikimedia Commons, para uma experiência mais rica e inclusiva. No geral, essa proposta permitirá que imagens tenham descrições textuais, que possam ser usados para textos alternativos na Wikipédia e catálogos acessíveis de instituições no Wikilivros. (Mas acredito que pudesse ser usado em outros projetos também...)

  • Beneficiários: Quais pessoas, grupos ou projetos seriam impactados positivamente por essa proposta?

A ferramenta deve ser construída em diálogo com a comunidade Wikimedia e com usuários de tecnologias assistivas, garantindo que os conteúdos gerados respeitem os princípios de verificabilidade, imparcialidade e clareza, além de estarem alinhados com as diretrizes editoriais dos projetos da Wikimedia.

Acredito que a proposta terá impacto direto e positivo sobre diversos públicos. Em primeiro lugar, pessoas com deficiência visual ou com outras limitações cognitivas, que terão acesso a descrições textuais mais ricas e acessíveis, permitindo que possam compreender obras de arte, imagens históricas e cenas culturais presentes nos projetos Wikimedia. Isso pode ser relevante para profissionais de educação inclusiva.

Também pode gerar um engajamento simples para novos editores, interessados em descrição de imagens. Acredito que poderíamos ter uma interface para validações e revisões que permitisse o engajamento de novos públicos.

Instituições culturais poderiam integrar esses recursos às suas próprias iniciativas de democratização do acervo, aproximando o público das obras por meio de descrições colaborativas acessíveis.

  • Mais comentários: Deseja acrescentar algo? Use este espaço para compartilhar informações adicionais sobre a sua proposta.

Algumas referências úteis sobre projetos de acessibilidade:


Editar proposta

Discussão


Participar da discussão


Votação

Prioritário: Esta proposta é uma prioridade da comunidade e deve ser implementada o mais rápido possível!
Importante: Esta proposta é importante, mas não é uma prioridade da comunidade e deve ser implementada em um futuro próximo
Neutro(a): Esta proposta pode ser importante, mas não é uma prioridade da comunidade e pode ser implementada em um outro momento
Não prioritário: Esta proposta não parece ser uma prioridade da comunidade e não é urgente

Prioritário Importante Neutro(a) Não prioritário

  • Importante A ideia do uso de IA generativa para produção de textos que possam facilitar as legendas de determinadas informações em projetos Wikimedia mostra ser algo interessante. WikiFer msg 00:52, 17 May 2025 (UTC)[reply]