Exportar este item: EndNote BibTex

Use este identificador para citar ou linkar para este item: http://bibliotecatede.uninove.br/handle/tede/2788
Tipo do documento: Tese
Título: Aplicação de ciência de dados na análise do posicionamento autoral e contribuições científicas em artigos
Autor: Souza, Edson Melo de 
Primeiro orientador: Storopoli, José Eduardo
Primeiro membro da banca: Storopoli, José Eduardo
Segundo membro da banca: Bido, Diógenes de Souza
Terceiro membro da banca: Chalco, Jesús Pascual Mena
Quarto membro da banca: Vils, Leonardo
Quinto membro da banca: Marns, Fellipe Silva
Resumo: Contexto: Nos últimos anos houve crescimento do número de autores listados em artigos e a questão do posicionamento autoral e das contribuições científicas ainda se encontra em aberto na literatura, uma vez que não há definição ou recomendação formal para o posicionamento dos autores. Objetivo: Neste trabalho foram estudadas as categorias de contribuição e a questão da posição autoral em relação às contribuições dos autores em publicações científicas na área de ciências biológicas e medicina. Método: O estudo foi realizado utilizando técnicas estatísticas, em especial Análise Fatorial, e de ciência de dados, em especial Regressão Linear sobre os dados de 2.024 artigos contendo 17.385 au- tores das fontes de dados: SCImago, Scopus e dos periódicos da área de ciências biológicas e medicina Annals of Internal Medicine (Anna. Intern. Med.), Journal of the American Medical Association (JAMA) e PLoS Medicine (PLoS Med). Para coleta e limpeza dos dados foram desenvolvidos robôs com técnicas de raspagem de dados para automatização dos processos. Resultados: O estudo mostrou a existência de dois grupos de contri- buição (“Theory” e “Methodology/Logistic” ), além da proposta de um modelo universal de contribuições com três categorias: teórica, metodológica e logística. Ademais, foram desenvolvidos algoritmos para automatização dos tratamentos de dados coletados pelos robôs. Conclusão As técnicas de ciência de dados permitiram a construção de robôs para automatização da coleta de dados em bases e publicações científicas em conjunto com os algoritmos desenvolvidos, reduzindo substancialmente o tempo de coleta e melhorando a acurácia dos processos. O agrupamento das contribuições científicas evidenciou que as maiores contribuições se encontram no grupo teórico, sinalizando que a experiência aca- dêmica dos autores é um fator preponderante, enquanto as contribuições metodológicas e logísticas representam contribuições substanciais. O modelo categórico proposto para o estudo da relação entre o posicionamento autoral e as contribuições científicas mostrou que autores com contribuições teóricas tendem a ser o primeiro autor. Já as contribuições logísticas tendem a posicionar um autor como último. As contribuições metodológicas não evidenciam impacto no posicionamento autoral. Por fim, o pequeno efeito registrado na correlação entre as variáveis de contribuição evidencia que o posicionamento autoral não é definido pelas contribuições dos autores.
Abstract: In recent years, there has been an increase in the number of authors listed in articles and the issue of authorship and scientific contributions is still open in the literature since there is no formal definition or recommendation for the authors’ position. Objective: In this dissertation, I’ve scrutinized the relationship between scientific contribution and authorship ethical issues. My main objective was to study contributions types and its impact in authorship position. Methodology: I’ve collected 2, 024 articles containing 17, 385 authors from the following data sources: SCImago, Scopus, and the following jour- nals: Annals of Internal Medicine (Ann. Intern. Med.), Journal of the American Medical Association (JAMA), and PLoS Medicine (PLoS Med.). All of those being journals from the biological sciences and medicine areas. To analyze the data I’ve employed statisti- cal techniques, specifically Factor Analysis; and also data science techniques, specifically Linear Regression. Furthermore, for data collection and cleaning automation, I’ve deve- loped robots with data scraping techniques. Results: My study revealed the existence of mainly two scientific contribution categories (“Theory” and “Methodology/Logistics” ). I’ve also proposed an universal categorical model of scientific contribution based on th- ree main categories: theory, methodology, and logistic. Furthermore, I’ve also developed algorithms to automate data collection by robots/crawler. Conclusion: Data science te- chniques have allowed the construction of robots to automate data collection in scientific databases and publications together with developed algorithms, substantially reducing the collection time and improving the accuracy of the processes. The grouping of sci- entific contributions showed that the largest contributions are found in the theoretical group, indicating that the academic experience of the authors is a major factor, while the methodological and logistical contributions represent substantial contributions. The categorical model proposed for the study of the relationship between authorial positioning and scientific contributions shows that authors who contribute theoretically tend to be the first authors. Logistic contributions, on the other hand, tend to place an author last. Methodological contributions do not have an impact on author position. Finally, the small effect registered in the correlation between the contribution variables evidences that the author’s position is not defined by the authors’ contributions.
Palavras-chave: ciência de dados
posição autoral
lista de contribuições
byline
data science
author position
contribution list
byline
Área(s) do CNPq: CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO
Idioma: por
País: Brasil
Instituição: Universidade Nove de Julho
Sigla da instituição: UNINOVE
Departamento: Informática
Programa: Programa de Pós-Graduação em Informática e Gestão do Conhecimento
Citação: Souza, Edson Melo de. Aplicação de ciência de dados na análise do posicionamento autoral e contribuições científicas em artigos. 2021. 119 f. Tese( Programa de Pós-Graduação em Informática e Gestão do Conhecimento) - Universidade Nove de Julho, São Paulo.
Tipo de acesso: Acesso Aberto
URI: http://bibliotecatede.uninove.br/handle/tede/2788
Data de defesa: 28-Jun-2021
Aparece nas coleções:Programa de Pós-Graduação em Informática e Gestão do Conhecimento

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
Edson Melo de Souza.pdfEdson Melo de Souza8,35 MBAdobe PDFBaixar/Abrir Pré-Visualizar


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.