@PHDTHESIS{ 2021:791775918, title = {Aplicação de ciência de dados na análise do posicionamento autoral e contribuições científicas em artigos}, year = {2021}, url = "http://bibliotecatede.uninove.br/handle/tede/2788", abstract = "Contexto: Nos últimos anos houve crescimento do número de autores listados em artigos e a questão do posicionamento autoral e das contribuições científicas ainda se encontra em aberto na literatura, uma vez que não há definição ou recomendação formal para o posicionamento dos autores. Objetivo: Neste trabalho foram estudadas as categorias de contribuição e a questão da posição autoral em relação às contribuições dos autores em publicações científicas na área de ciências biológicas e medicina. Método: O estudo foi realizado utilizando técnicas estatísticas, em especial Análise Fatorial, e de ciência de dados, em especial Regressão Linear sobre os dados de 2.024 artigos contendo 17.385 au- tores das fontes de dados: SCImago, Scopus e dos periódicos da área de ciências biológicas e medicina Annals of Internal Medicine (Anna. Intern. Med.), Journal of the American Medical Association (JAMA) e PLoS Medicine (PLoS Med). Para coleta e limpeza dos dados foram desenvolvidos robôs com técnicas de raspagem de dados para automatização dos processos. Resultados: O estudo mostrou a existência de dois grupos de contri- buição (“Theory” e “Methodology/Logistic” ), além da proposta de um modelo universal de contribuições com três categorias: teórica, metodológica e logística. Ademais, foram desenvolvidos algoritmos para automatização dos tratamentos de dados coletados pelos robôs. Conclusão As técnicas de ciência de dados permitiram a construção de robôs para automatização da coleta de dados em bases e publicações científicas em conjunto com os algoritmos desenvolvidos, reduzindo substancialmente o tempo de coleta e melhorando a acurácia dos processos. O agrupamento das contribuições científicas evidenciou que as maiores contribuições se encontram no grupo teórico, sinalizando que a experiência aca- dêmica dos autores é um fator preponderante, enquanto as contribuições metodológicas e logísticas representam contribuições substanciais. O modelo categórico proposto para o estudo da relação entre o posicionamento autoral e as contribuições científicas mostrou que autores com contribuições teóricas tendem a ser o primeiro autor. Já as contribuições logísticas tendem a posicionar um autor como último. As contribuições metodológicas não evidenciam impacto no posicionamento autoral. Por fim, o pequeno efeito registrado na correlação entre as variáveis de contribuição evidencia que o posicionamento autoral não é definido pelas contribuições dos autores.", publisher = {Universidade Nove de Julho}, scholl = {Programa de Pós-Graduação em Informática e Gestão do Conhecimento}, note = {Informática} }