Quantos mestres e doutores temos no Brasil? Desses, quantos trabalham efetivamente com pesquisa científica? Quem são os principais pesquisadores atuantes em determinada área, que moram em uma região específica do país? Quantas patentes foram concedidas a pesquisadores brasileiros em uma determinada instituição? Como posso verificar a qualidade de um artigo científico? Como encontrar uma revista científica de qualidade que não cobre taxa de publicação na minha área de atuação?
Essas perguntas, aparentemente simples, não têm respostas de fácil localização e extração nas bases de dados da ciência e tecnologia no Brasil. É difícil chegar a uma conclusão, pois todo caminho online que se busca não leva rapidamente a uma resposta. Para se ter uma ideia de como é complexo validar dados para responder à primeira questão simples que abre esta notícia, seria necessário acessar seis bases de dados para validar a informação (CV Lattes, Orcid, Oasisbr, Portal de dados abertos da Capes, OpenAIRE Research Graph e NDLTD). Durante a programação do II Seminário de Ciência de Dados para a Ciência, realizado na Fiocruz Brasília, nos dias 31 de agosto e 1 de setembro, este tema esteve em pauta.
O coordenador de Tratamento, Análise e Disseminação da Informação Científica do Instituto Brasileiro de Informação em Ciência e Tecnologia (IBICT), Washington Segundo, apresentou a parceria entre a Fiocruz e o IBICT por meio do estudo de caso Fiocruz Plataforma BrCris, que promete acesso unificado a informações do ecossistema de ciência brasileiro. Utilizando a plataforma LA Referência, se coletam informações de diferentes bases de dados, que são transportados para um espaço único para produção de dashboards, painéis visuais com informações, métricas e indicadores relevantes apresentados de maneira objetiva e clara para embasar a tomada de decisão. O foco não é só o resultado da pesquisa, mas buscar dados do projeto, do financiamento, do pesquisador, entre outros.
A representante da Coordenação de Informação e Comunicação da Vice-Presidência de Educação, Informação e Comunicação da Fiocruz, Vanessa Jorge, apresentou o Observatório em Ciência, Tecnologia e Inovação em Saúde da Fiocruz, criado para ampliar o olhar sobre a pesquisa, mapeando e avaliando resultados que vão além da produção científica e dos avanços do conhecimento, por meio de novas abordagens aliadas às já tradicionalmente utilizadas, gerando e agregando conteúdo de forma acessível e transparente. A iniciativa contribui para a gestão e formação de políticas institucionais em ciência, tecnologia e inovação com indicadores, métricas, análises e conteúdo de comunicação em formato interativo e faz parte de um movimento em prol da ciência aberta e transparência pública e atualmente, quatro indicadores são monitorados: produção científica, trabalhadores da Fiocruz, fomento à pesquisa em saúde e patentes. A partir da parceria com o IBICT, se vislumbra a criação de um banco de dados relacional com todos os atributos e informações institucionais unificados, a identificação de grupos de pesquisa a partir de dados da Plataforma do CNPq e currículo lattes, com construção de indicadores de grupos de pesquisa institucional além da possibilidade de estudo temático para melhor direcionamento das pesquisas e gestão de recursos institucionais. Ela elencou como desafios nessa implementação a qualidade dos dados e informações nas bases de dados nacionais, os mecanismos de governança e sustentabilidade, e a avaliação da ciência, que precisa incorporar métricas favoráveis à ciência aberta, incluindo o compartilhamento de dados.
Outro pesquisador do Observatório Fiocruz, Waldeyr Mendes Cordeiro, apresentou que, na área de informações científicas, a correta identificação da instituição a qual o trabalho ou os pesquisadores estão vinculados é um problema recorrente, já que cada pessoa pode escolher como inserir esses dados nas plataformas. Apesar de a classificação humana de textos ser eficaz e baseada na interpretação do texto, não é eficiente para grandes volumes de dados. Pelo computador, essa classificação extrai características do texto de maneira a distinguir os dados uns dos outros, até classificá-los com alguma acurácia. Para se ter uma ideia, quando se busca algo da Fiocruz, há muitas variações no formato com que os pesquisadores descrevem isso nas bases de dados. Uns podem colocar a sigla, outro por extenso, outros detalhar a unidade e setor a que pertencem. Os pesquisadores então vêm trabalhando para “treinar a máquina”, em uma constante evolução, pois quanto mais dados se fornecem, melhor para a inteligência artificial.
A plataforma multimídia digital do Observatório em Ciência, Tecnologia e Inovação em Saúde da Fiocruz está disponível neste link.