Proximidade documental em repositórios acadêmicos: exploração intelectual de coleções por meio de análise léxica
DOI:
https://doi.org/10.34096/ics.i54.17955Palavras-chave:
Repositórios institucionais, Organização do conhecimento, Lexicometria, Análise Fatorial de Correspondências, Navegação semânticaResumo
Apresenta-se uma análise lexicométrica de 121 resumos de teses de doutorado em psicologia obtidos de repositórios de universidades nacionais da Argentina. O objetivo foi observar se a distribuição do vocabulário permite relacionar documentos sem utilizar descritores temáticos nem citações. Assim, os documentos foram organizados em uma matriz termo-documento. A associação entre documentos e vocabulário resultou significativa e de intensidade moderada-alta (χ² = 526.047,12; gl = 353.640; V de Cramér = 0,431). A Análise Fatorial de Correspondências permitiu recriar um espaço geométrico para localizar documentos com base na distância χ². Dessa forma, identificaram-se trabalhos próximos e distantes a partir de padrões de coocorrência léxica. Trabalhos semanticamente semelhantes tendem a utilizar terminologia similar tanto em suas construções teóricas quanto metodológicas. Esse achado aborda uma dificuldade operacional dos repositórios acadêmicos quanto à classificação e ao agrupamento da informação. A coleção não funciona apenas como um arquivo de registros, mas também como uma rede interna de relações. Essas relações oferecem uma alternativa para reconhecer antecedentes e situar trabalhos dentro da literatura disponível por meio de uma navegação semântica.
Downloads
Referências
Ahlgren, Per y Cristian Colliander. 2009. Document-document similarity approaches and science mapping: Experimental comparison of five approaches. En Journal of Informetrics. Vol. 3, no. 1, 49–63. <https://doi.org/10.1016/j.joi.2008.11.003>
Argentina. 2013. Ley 26.899. Repositorios digitales institucionales de acceso abierto, propios o compartidos. En Boletín Oficial de la República Argentina, 13 de noviembre de 2013. <https://www.argentina.gob.ar/normativa/nacional/ley-26899-222648> [Consulta: 10 mayo 2025].
Baeza-Yates, Ricardo y Berthier Ribeiro-Neto. 1999. Modern information retrieval. Reading: Addison-Wesley.
Bates, Marcia J. 1989. The design of browsing and berrypicking techniques for the online search interface. En Online Review. Vol. 13, no. 5, 407–424. <https://doi.org/10.1108/eb024320>
Benzécri, Jean-Paul. 1973. L’analyse des données. Tome 2: L’analyse des correspondances. Paris: Dunod.
Börner, Katy, Chaomei Chen y Kevin W. Boyack. 2003. Visualizing knowledge domains. En Annual Review of Information Science and Technology. Vol. 37, no. 1, 179–255. <https://doi.org/10.1002/aris.1440370106>
Callon, Michel, Jean-Pierre Courtial y Françoise Laville. 1991. Co-word analysis as a tool for describing the network of interactions between basic and technological research: The case of polymer chemistry. En Scientometrics. Vol. 22, no. 1, 155–205. <https://doi.org/10.1007/BF02019280>
Greenacre, Michael. 1984. Theory and applications of correspondence analysis. London: Academic Press.
Greenacre, Michael. 2017. Correspondence analysis in practice. 3rd ed. Boca Raton: Chapman & Hall/CRC. <https://doi.org/10.1201/9781315369984>
Hjørland, Birger. 2016. Knowledge organization (KO). En Knowledge Organization. Vol. 43, no. 6, 475–484. <https://doi.org/10.5771/0943-7444-2016-6-475>
Husson, François, Sébastien Lê y Jérôme Pagès. 2017. Exploratory multivariate analysis by example using R. 2nd ed. Boca Raton: Chapman & Hall/CRC. <https://doi.org/10.1201/b21874>
Hyland, Ken. 2000. Disciplinary discourses: Social interactions in academic writing. London: Longman.
Lebart, Ludovic y André Salem. 1994. Statistique textuelle. Paris: Dunod.
Lebart, Ludovic, André Salem y Lisette Berry. 1998. Exploring textual data. Dordrecht: Kluwer Academic Publishers.
Leydesdorff, Loet. 2001. The challenge of scientometrics: The development, measurement, and self-organization of scientific communications. Boca Raton: Universal Publishers.
Manning, Christopher D., Prabhakar Raghavan y Hinrich Schütze. 2008. Introduction to information retrieval. Cambridge: Cambridge University Press. <https://doi.org/10.1017/CBO9780511809071>
Marchionini, Gary. 1995. Information seeking in electronic environments. Cambridge: Cambridge University Press. <https://doi.org/10.1017/CBO9780511626388>
Marchionini, Gary. 2006. Exploratory search: From finding to understanding. En Communications of the ACM. Vol. 49, no. 4, 41–46. <https://doi.org/10.1145/1121949.1121979>
Morin, Annie. 2006. Intensive use of Factorial Correspondence Analysis for text mining: application with statistical education publications. En Proceedings of the Seventh International Conference on Teaching Statistics (ICOTS-7). Estados Unidos: International Association for Statistical Education.
Murtagh, Fionn. 2005. Correspondence analysis and data coding with Java and R. Boca Raton: Chapman & Hall/CRC. <https://doi.org/10.1201/9781420034943>
Noyons, Ed C. M. 2012. Using bibliometric maps of science in a science policy context. En Em Questão. Vol. 18, edición especial, 15–27.
Petrović, Saša, Bojana Dalbelo Bašić, Annie Morin, Blaž Zupan y Jean-Hugues Chauchat. 2009. Textual features for corpus visualization using correspondence analysis. En Intelligent Data Analysis. Vol. 13, no. 5, 795–813. <https://doi.org/10.3233/IDA-2009-0393>
Price, Derek J. de Solla. 1965. Networks of scientific papers. En Science. Vol. 149, no. 3683, 510–515. <https://doi.org/10.1126/science.149.3683.510>
Salton, Gerard y Michael J. McGill. 1983. Introduction to modern information retrieval. New York: McGraw-Hill.
Small, Henry. 1973. Co-citation in the scientific literature: A new measure of the relationship between two documents. En Journal of the American Society for Information Science. Vol. 24, no. 4, 265–269. <https://doi.org/10.1002/asi.4630240406>
Swales, John M. 1990. Genre analysis: English in academic and research settings. Cambridge: Cambridge University Press.
Van Raan, Anthony F. J. 2005. For your citations only? Hot topics in bibliometric analysis. En Measurement: Interdisciplinary Research and Perspectives. Vol. 3, no. 1, 50–62. <https://doi.org/10.1207/s15366359mea0301_7>
Downloads
Publicado
Edição
Seção
Licença
Copyright (c) 2026 Chris Moreno

Este trabalho está licenciado sob uma licença Creative Commons Attribution-ShareAlike 4.0 International License.
Los autores/as que publiquen en esta revista aceptan las siguientes condiciones:
- Los autores/as conservan los derechos de autor y ceden a la revista el derecho de la primera publicación, con el trabajo registrado con la Licencia Creative Commons Atribución-CompartirIgual 4.0 Internacional, que permite a terceros utilizar lo publicado siempre que mencionen la autoría del trabajo y a la primera publicación en esta revista.
- Los autores/as pueden realizar otros acuerdos contractuales independientes y adicionales para la distribución no exclusiva de la versión del artículo publicado en esta revista (p. ej., incluirlo en un repositorio institucional o publicarlo en un libro) siempre que indiquen claramente que el trabajo se publicó por primera vez en esta revista.
- Se permite y recomienda a los autores/as a publicar su trabajo en Internet (por ejemplo en páginas institucionales o personales).






















