Sistema Eletrônico de Administração de Conferências ANCIB, XXIV ENCONTRO NACIONAL DE PESQUISA E PÓS-GRADUAÇÃO EM CIÊNCIA DA INFORMAÇÃO

Tamanho da fonte: 
COLETA E INTEGRAÇÃO DE FONTES DE DADOS HETEROGÊNEAS SOBRE PATENTES
Raulivan Rodrigo da Silva, Thiago Magela Rodrigues Dias, Washington Luís Ribeiro de Carvalho Segundo

Última alteração: 2025-02-03

Resumo


No campo da ciência da informação e ciência de dados, a integração e padronização de múltiplas fontes de dados são cruciais para garantir a consistência e comparabilidade dos resultados. Este trabalho aborda a necessidade de integrar dados heterogêneos relacionados a patentes coletadas de diferentes repositórios, destacando os desafios e benefícios dessa prática. Assim, este trabalho tem como objetivo principal estabelecer por meio do processo metodológico fundamento em estudo de caso, um processo sistemático de integração de dados relacionado a patentes provenientes de três fontes distintas: Espacenet, INPI e currículos da Plataforma Lattes. Como resultado, mediante as estratégias delineadas neste estudo foi possível estabelecer um esquema composto por oito entidades que visam normalizar os dados e estabelecer relacionamentos entre as diferentes fontes, de tal forma a viabilizar análises de diversas magnitudes. Embora tenha-se focado em dados oriundos da Espacenet, INPI e Plataforma Lattes, o modelo proposto pode ser adaptado para outras fontes de dados.

Texto completo: PDF