User:TiagoLubiana/Webinar HumaniData 2025
Como o conhecimento flui nas ciências biomédicas e o que o Wikidata tem a ver com isso?
[edit]A primeira coisa a dizer é que (1) é complicado e (2) o Wikidata nada tem a ver com isso para a maioria das pessoas.
A segunda é o que se segue.
Estamos aqui para falar, em primeiro lugar, Ciência Aberta, e nenhuma das duas partes é simples: nem o que é algo ser "ciência", nem o que é algo ser "aberto".
Sobre o que pode ser ciência, o livro "O que é ciência afinal?", de Alan Chalmers, dá boas indicações:
...sugiro que a pergunta que constitui o título desse livro é enganosa e arrogante. Ela supõe que exista uma única categoria “ciência” e implica que várias áreas do conhecimento, a física, a biologia, a história, a sociologia e assim por diante se encaixam ou não nessa categoria. Não sei como se poderia estabelecer ou defender uma caracterização tão geral da ciência. Os filósofos não têm recursos que os habilitem a legislar a respeito dos critérios que precisam ser satisfeitos para que uma área do conhecimento seja considerada aceitável ou “científica”. Cada área do conhecimento pode ser analisada por aquilo que é. Ou seja, podemos investigar quais são seus objetivos – que podem ser diferentes daquilo que geralmente se consideram ser seus objetivos – ou representados como tais, e podemos investigar os meios usados para conseguir estes objetivos e o grau de sucesso conseguido.
— Alan Chalmers
Isso já nos afasta de acepções mais ingênuas de ciência como uma mera geração de hipóteses falseáveis e testes objetivos. A concepção de ciência como um processo a partir de afirmações falseáveis vem de interpretações do trabalho de Karl Popper, da primeira metade do século XX. Em particular, do livro "A Lógica da Pesquisa Científica". Um texto sólido, o qual consegui ler a metade e entender, talvez, um quinto, mas ainda assim, gostei bastante. Ainda assim, está longe de ser uma verdade universal em si, ou universalmente aceita.
Minhas primeiras aulas de metodologia científica na USP, em 2014, apresentaram Popper não como um sistema de pensamento, mas fundamentalmente como o sistema de pensamento para as ciências biomédicas. A falseabilidade e os experimentos, diziam, são a parede que separa a pseudociência e o misticismo da solidez da pesquisa científica.
Ideias geram hipóteses que são submetidas a rigorosos testes, e somente as hipóteses mais fortes sobrevivem. Essas hipóteses valentes, que vencem por seus próprios méritos, propagam-se entre as mentes científicas.
E assim, diziam, que o conhecimento biomédico é construído, livre do açoite das metáforas e outros subterfúgios. Uma espécie de physics envy, buscando uma solidez matemática para a fluidez das células, organismos e suas interrelações.
Vale dizer, eram professores excelentes, com carreiras bonitas e que muito produziram em termos de pesquisa, ensino e extensão. Hoje apenas discordo do modelo deles de como o conhecimento flui, como a ciência se constitui, seja a biomédica, seja qualquer outra.
Esta linha é infinita e, mesmo para as ciências biomédicas, não há respostas claras, analíticas.
O melhor que posso fazer é pintar o quadro e dar elementos para buscarem respostas.
Mas antes de caminhar para os fluxos de conhecimento e o que o Wikidata pode ter a ver com isso, vamos à questão da ciência aberta, que também é também curiosa.
Na Wikipédia em Português, o artigo sobre ciência aberta foi criado em 2013 pelo usuário Sturm em um esboço bom, que dizia:
A expressão ciência aberta faz referência a um modelo de prática científica que, em consonância com o desenvolvimento da cultura digital, visa a disponibilização das informações em uma rede de forma oposta à pesquisa fechada em laboratórios. Nesse contexto, novas iniciativas de publicação e revisão por pares, como o Peerage of Science, o arXiv e a PLoS confirmam essa tendência que agora desponta também nas redes sociais.
— Sturm
Uma outra referência que tenho para essa conceituação vem do livro Ciência Abertas, Questões Abertas, cujo um dos autores, oUtilizador:Solstag está inclusive como parte da comissão do programa da WikiCon Brasil 2025 Há também um portal de Ciência Aberta no Wikiversidade, com vários materiais interessantes, também feito em grande parte pelo Solstag: https://pt.wikiversity.org/wiki/Portal:Ciência_Aberta .
O prólogo por Sarita Albagli, que aproxima a ciência aberta com a ideia mais de uma ciência libre:
O movimento pela ciência aberta deve ser pensado no contexto dos movimentos sociais que emergem em meio a mudanças nas condições de produção e circulação da informação, do conhecimento e da cultura, e que vêm desestabilizando arcabouços epistemológicos e institucionais vigentes. Trata-se de refletir sobre os desafios que essas mudanças trazem às dinâmicas científicas, seus valores e práticas, e sobre os novos olhares que se impõem para melhor compreender e lidar com tais desafios. Ciência aberta é aqui entendida como processo, algo em construção, que mobiliza interesses e pontos de vista distintos (e, em alguns aspectos, antagônicos); e que também permite múltiplas (e por vezes conflituosas) interpretações.
Neste capítulo propõe-se pensar o movimento pela ciência aberta, a partir de duas grandes vertentes. Uma delas é a tensão hoje existente entre a socialização do conhecimento, da informação e da cultura, de um lado, e sua privatização, de outro. Considera-se que este constitui um dos principais pontos de conflitos e lutas que atravessam o que se chama sociedade em rede ou informacional, capitalismo digital ou, ainda, capitalismo cognitivo. Parte-se do suposto de que essas diferentes formas de apropriação (social ou privada) são constitutivas dos antagonismos que caracterizam o atual regime de informação em ciência e tecnologia.
(...)
À medida que avança, o movimento pela ciência aberta modifica-se e incorpora novos elementos à sua agenda. Ciência aberta passa a constituir um termo guarda-chuva, que vai além do acesso livre a publicações científicas e inclui outras frentes, como dados científicos abertos, ferramentas científicas abertas, hardware científico aberto, cadernos científicos abertos, wikipesquisa, ciência cidadã, educação aberta.
— Sarita Albagli
É um livro maravilhoso, que adquiri em algum seminário sobre Ciência Aberta na USP em de 2015. Coincidência ou não, o evento está também documentado no Wikiversidade.
Há analogias claras da ciência aberta com a cultura aberta em geral, como a cultura do software livre e a cultura Wiki de conhecimento livre.
Mas veja, não existe, até onde conheço, um movimento forte de ciência libre, com uma postura política mais forte.
O aberto da descrição acima me parece distinto, por exemplo do conceituado pelo site Ciência Aberta USP, que coloca como subtítulo --- Uma iniciativa USP pelo acesso aberto ao conhecimento científico, e uma definição como:
A Ciência Aberta (Open Science) é um movimento mundial que tem por objetivo tornar o conhecimento científico aberto e compartilhado para a comunidade científica de diferentes países e para toda a sociedade. A maior acessibilidade ao conhecimento científico proporciona mais cooperação, reutilização de dados e maior inclusão de todas as partes interessadas, promovendo avanço mais rápido do conhecimento científico e maior retorno de benefícios para a sociedade.
Agora posso estar começando a ser implicante, mas a minha impressão com o termo "ciência aberta" é que, no diálogo geral, foi se igualando a duas coisas:
- Ao acesso gratuito a publicações científicas ou
- A ciência confiável e reprodutível por meio de transparência
E, assim, ambas acepções me parecem limitadas. Não há necessariamente um rompimento com uma perspectiva mercantilista/capitalista da ciência, nem uma postura mais radical em relação a softwares e hardwares utilizados, nem como as formas de produção do conhecimento em si. É, talvez, uma ciência gratis, sem necessariamente almejar uma ciência libre.
Claro, no meio dessa mistura, há pessoas que verdadeiramente abraçam o espírito de abertura e colaboratividade. Para quem tiver curiosidade, o Prof. Olavo Amaral e outros colegas organizavam um evento bem disruptivo sobre ciência aberta / colaborativa, o no-budget science hack week, que foi juntando várias dessas pessoas. Vale a pena dar uma olhada no histórico e nos vídeos, disponíveis no YouTube.
Apesar dessas iniciativas, vejo pairar na pesquisa biomédica, no geral, um medo terrível de ser scooped, de publicarem algo antes e, assim, ganhar os louros da vitória. A academia ocidental vive de um certo desejo por glória (lust for glory) que acaba conflitando com perspectivas mais amplas de ciência libre. A abundância de métricas e seu uso por sistemas de avaliação e progressão de carreira acabam cortando a ciência libre na raiz. Um estado permanente de escassez (aparente) de glória que força uma dinâmica hobbesiana de cada um por si. O empreendedorismo acadêmico, o self-made man científico, me parece prevalente e em direta oposição com a ciência libre.
As editoras acadêmicas — em especial as biomédicas — aproveitaram o trem da Open Science, em particular do Open Access, para capitalizar. Para tornar publicações abertas, os pesquisadores têm que pagar taxas exorbitantes. A taxa atual para um artigo Open Access na revista Nature é de, pasmem, mais de 12,000 dólares.
Com a pandemia, repositórios como o bioRxiv e medRxiv se popularizaram, mas ainda não contam para as avaliações institucionais, como as promovidas pela FAPESP.
Bem, então um pequeno resumo até agora:
- Há muitas formas de derivar conhecimento que podem ser entendidas como ciência. Nas ciências biomédicas, contudo, não vejo uma abertura para uma diversidade de interpretações sobre como o conhecimento flui.
- Ciência aberta é um termo em disputa e, muitas vezes, usado de forma fraca, sem pautar mudanças radicais no status quo.
Eu sou adepto de uma visão forte de ciência aberta como mecanismo de avanço epistêmico e social. Isso implica não só uma abertura de elementos de acesso restrito por mesquinhez (como dados, metadadods, produções textuais e afins) como uma abertura a novas formas de produzir e compartilhar.
Novas formas coletivas por definição, colaborativas, construidas a muitas mãos. Formas semi-anônimas, fundamentadas em pilares e sistemas de valores voltados a criação comunitária.
E por essa crença, talvez ingênua, que cheguei a Wikipédia e ao Wikidata.
A longa introdução é necessária, pois o ponto principal desta fala, talvez o único, é que as plataformas Wikimedia, apesar de 25 anos de história, ainda são demasiadamente radicais para os fluxos oficiais de conhecimento biomédico.
Assim como a Wikipédia, o Wikidata é a-institucional, não é possível tomar posse das estruturas desenvolvidas. O conhecimento está solto, por aí. Com padrões de qualidade altíssimos, mas está solto. E não conta para métricas institucionais, não cabe nem no Currículo Lattes nem no ORCID. A menos que você, claro, publique um artigo acadêmico tradicional sobre o que foi feito.
O que vejo sobre Wikidata e Wikipédia nos fluxos de conhecimento científico não estão, contudo, nos fluxos oficiais.
Por fluxos oficiais aqui, me refiro ao sistema que organiza pessoas, ideias e projetos em alunos, pós-graduandos, professores, bolsas, programas de pesquisa, títulos, prêmios, glória, publicações, congressos, divulgação científica, jornais, livros, manuais etc.
O fluxo no qual o cientista primeiro lê e aprende sobre o que existe e, só então, a ciência é feita. E depois compartilhada com pares, aí publicada e divulgada para a sociedade. Passa-se um tempo, as publicações são revisadas e agregadas, são feitas meta-análises rigorosas e as conclusões são novamente publicadas e divulgadas para a sociedade.
Eu tenho uma pulga atrás da orelha sobre esse modelo de fluxo de conhecimento.
Vejo a situação um tanto mais fluida: todos desenvolvemos sistemas de crenças, baseados na nossa história vida e nas pessoas que interagimos. Isso nos traz perspectivas de mundo, opiniões, palpites. Na ciência biomédica não é, nem pode ser, diferente. Bebemos de muitas fontes de conhecimento, batemos papo em botecos, discutimos e criticamos artigos e ideias. Tentamos organizar as coisas em modelos, tentamos provar nossos pontos, tentamos pagar as contas, tentamos ter um senso de propósito. Usamos metáforas para explicar todos esses sistemas complexos. Produzimos figuras bonitas e tentamos convencer revistas a publicar pela estética.
Como diz o ditado, o papel aceita tudo. Mas como diz o ditado também, a Wikipédia não é papel.
E a Wikipédia não aceita tudo, assim como o Wikidata não aceita tudo.
Fiz meu doutorado, de 2020 a 2024, estudando o Wikidata e seu uso nas ciências biomédicas. Cataloguei mais de 5000 classes de células distintas, na unha, nessa plataforma, devido à velocidade data pelo formato. É uma plataforma linda para agregar e refinar conhecimentos, mas lá as disputas são ao vivo e é preciso ser claro.
É uma grande arena, onde é preciso convergir em uma modelagem de informações sólida agregando as visões de múltiplas pessoas.
Os dados estruturados no Wikidata abrem espaço limitado para a vagueza.
Como um grande grafo de conhecimento, o Wikidata almeja organizar tudo em triplas de sujeito --> predicado --> objeto (usados aqui de forma técnica). Por exemplo:
Fumar --> causa --> Câncer de Pulmão.
Hemácias --> Transportam --> Oxigênio.
Humanos --> Possuem --> Olhos.
Radical! Pare um momento e pense no universo de ideias em cada uma dessas palavras. O Wikidata obriga as pessoas a concordarem, encontrarem um meio termo, para definir os conceitos e suas relações. No Wikidata, o rei está nu. É preciso ao menos concordar que há uma discordância e, assim, buscar uma forma que agrade a gregos e troianos.
O conteúdo e suas formas podem evoluir com o tempo, dependendo de quem está em atividade e onde paira o foco das pessoas. Tudo isso às claras, com inconsistências são expostas ao vivo.
Minha provocação final é que as plataformas Wikimedia apresentam uma instância viva do que a ciência libre pode ser.
Isso não significa que cientistas biomédicos devam publicar em Wikis (mas podem) nem que devam publicar conclusões como nanopublicações usando o Wikidata (mas podem).
Mas acredito no Wikidata como um catalisador para o conhecimento biomédico fluir de forma ordenada e compreensível. O Wikidata nos força a explicar tudo em termos técnicos e precisos a ponto de permitir buscas em linguagem SPARQL. No mundo de Inteligência Artificial em tudo que é lugar, tragando e cuspindo textos com aparente genialidade, o Wikidata apresenta duas funções paralelas: a organização formal de conceitos e resolução de conflitos epistêmicos. Conflitos que o texto, o papel, aceita e esconde, mas que os dados estruturados trazem à tona.
Além disso, faz todo esse conhecimento disponível através de uma clara licença CC0, de domínio público total. Força uma entrega libre, uma contribuição despersonalizada e coletiva.
O ecossistema do fluxo do conhecimento biomédico têm vários agentes alinhados com essa ideias que o Wikidata traz, de estruturação do conhecimento. Biocuradores e ontologistas biomédicos organizam conceitos em sites, plataformas, bancos de dados independentes, usados por cientistas em uma base diária.
O mesmo fazem bibliotecários, organizando as produções acadêmicas e acervos em sistemas digitais complexos, facilitanto tanto o compartilhamento destes produtos científicos quando o desenvolvimento de métricas.
O Wikidata como uma arena viva de organização ainda é um sonho, uma promessa, com muitos projetos piloto, como o meu doutorado, tentando encaixar as pessas. Se os cientistas™ já largamente ignoram a Wikipédia, que é uma enciclopédia, um formato velho e academicíssimo, o Wikidata, então, coitado, ainda tem muito chão pela frente.
Por sorte, isso não é o caso para todos os públicos. Biocuradores, ontologistas, bibliotecários e outros profissionais que pensam em gestão de conhecimento e até engenharia de conhecimento já vem bebendo da infraestrutura sociotécnica revolucionária do Wikidata.
Em particular, o Wikidata se apresenta como uma grande central de identificadores. O Wikidata conecta acervos de diferentes museus e bibliotecas, assim como diferentes projetos e bancos de dados.
O Wikidata é a Constantinopla dos identificadores únicos, uma ponte entre os continentes de dados organizados.
Por exemplo, uma das organizações mais importante do planeta em gestão de dados de biodiversidade, o Global Biodiversity Information Facility (GBIF), usa o Wikidata direto em seu website. Sem filtros locais, pura confiança.
Se vamos na página para "Capivara" no GBIF, lá embaixo temos os identificadores, puxados em tempo real do Wikidata. Esses identificadores são organizados manualmente, com sistemas semi-automáticos (via Mix'n'Match), ou até por bots. Tudo isso de forma livre e gratuita.
O mesmo começa a se ver para identificadores biomédicos, com muita cobertura feita por projetos como o Gene Wiki. Esses identificadores fluem para a Wikipédia, por exemplo, sendo visibilizados e auxiliando a conectar as peças do ecossistema acadêmico.
Dessa maneira, o Wikidata, por seu papel de central de identificadores, catalisa o encontro e troca de informações. E, também, serve como base para conflitos de sistemas de organização, pois é preciso que os identificadores conversem, mesmo se identificam ideias levemente diferentes.
Bibliotecários e meta-cientistas, como o pessoal do WikiCite, que já têm informações de forma extremamente estruturada, se beneficiam dos pontos extras elegantes de qualidade do Wikidata. Sendo uma plataforma de padrão 5 estrelas de dados abertos, o Wikidata tem, lá no fundo, bases técnicas extremamente sólidas, que também atraem experts de gestão de dados.
Bem, com isso, caminho para um encerramento desta apresentação.
- A "ciência aberta" nas ciências biomédicas tem vertentes mais conservadoras, sobre puro acesso gratuito, e mais radicais, sobre transformações profundas nos processos de geração e troca de conhecimento.
- O Wikidata provê um ferramental sociotécnico poderoso para agregação e consolidação do conhecimento de forma radicalmente aberta.
- Isso ainda é estranho aos ouvidos acadêmicos médios, que estão mais preocupados em sobreviver dentro do sistema tradicional, no máximo com floreios e mudanças incrementais.
- Apesar disso, as pessoas que trabalham com gestão do conhecimento científico já se encantam com o Wikidata e vêm usando a plataforma inclusive em sistemas em produção
E, por fim, vos convido a ir ao Wikidata e editar, pois a potência da plataforma vêm justamente da ausência de crachás ou catracas. Um pedacinho de ciência (seja o que isso significar) fortemente aberta, libre, que você pode contribuir agora e a qualquer momento.
Assim doamos um pouco mais de força para a ideia lindamente radical de uma organização científica libre.