Predicción del rendimiento académico con un modelo de clasificación: una comparación entre estudiantes rurales y urbanos de educación media superior
Resumen
Este trabajo de investigación tuvo como propósito predecir el aprovechamiento académico por debajo de la meta esperada, definida a partir del promedio mínimo aprobatorio establecido por la institución, en estudiantes de nivel medio superior en Puebla a través del uso de modelos predictivos de aprendizaje automático supervisado, basados en técnicas de clasificación y minería de datos. En este estudio, el término aprovechamiento académico se emplea como indicador del rendimiento académico de los estudiantes. Para ello, se procesaron dos conjuntos de información provenientes de una preparatoria rural y una urbana de la Benemérita Universidad Autónoma de Puebla (BUAP). Se empleó el algoritmo de clasificación de bosques aleatorios (Random Forest) propuesto por Breiman (2001), el cual fue entrenado y evaluado de manera independiente en ambos conjuntos de datos, utilizando como métricas de desempeño la precisión y la sensibilidad (recall). En ambos conjuntos de datos se obtuvo una precisión del 0.72, lo que indica un desempeño comparable del modelo en los contextos rural y urbano. El modelo permitió identificar elementos clave relacionados con el aprovechamiento académico, tales como, la asistencia a clases y el aprovechamiento anticipado en algunas materias, los cuales mostraron una correspondencia descriptiva con el nivel de escolaridad. Asimismo, los hallazgos revelaron algunas diferencias entre ambos contextos, lo que sugiere la necesidad de implementar propuestas de mejora adaptadas a cada contexto, pero que sean muy particulares a cada entorno. A partir de estos resultados, se derivan implicaciones directas para las organizaciones educativas y el sector público, particularmente en el diseño de estrategias orientadas a la prevención del rezago académico y con ello, la deserción escolar en ambos contextos.
Descargas
Citas
Aguilar-Reyes, J. E., Mejía-Peñafiel, E. F., Morocho-Barrionuevo, T. P., & Velasco Castelo, G.-M. (2025). Estudio del rendimiento académico mediante la comparación de modelos de regresión y árboles de clasificación. Telos: Revista de estudios Interdisciplinarios en ciencias sociales, 27(1), 94-115. https://ve.scielo.org/scielo.php?script=sci_arttext&pid=S1317-05702025000100094
Ausubel, D. P. (1968). Educational psychology: A cognitive view. Holt, Rinehart and Winston. https://archive.org/details/in.ernet.dli.2015.112045/page/n3/mode/2up?utm_source=chatgpt.com
Bandura, A. (2001). Social cognitive theory: An agentic perspective. Annual Review of Psychology, 52, 1–26. https://doi.org/10.1146/annurev.psych.52.1.1
Breiman, L. (2001). Random forests. Machine Learning, 45(1), 5–32. https://doi.org/10.1023/A:1010933404324
Bourdieu, P., & Passeron, J.-C. (1990). Reproduction in education, society and culture. SAGE Publications. https://archive.org/details/reproductionined0000bour
Buschini, J. D. (2023). Niklas Luhmann y la teoría general de los sistemas sociales. En A. A. M. Camou (Coord.), Cuestiones de teoría social contemporánea (pp. 443–471). La Plata: Universidad Nacional de La Plata; EDULP. https://www.memoria.fahce.unlp.edu.ar/libros/pm.5846/pm.5846.pdf
Chapman, P., Clinton, J., Kerber, R., Khabaza, T., Reinartz, T., Shearer, C., & Wirth, R. (2000). CRISP‑DM 1.0: Step‑by‑step data mining guide. CRISP‑DM Consortium. https://www.kde.cs.uni-kassel.de/wp-content/uploads/lehre/ws2012-13/kdd/files/CRISPWP-0800.pdf
Castrillón, O. D., Sarache, W., & Ruiz-Herrera, S. (2020). Predicción del rendimiento académico por medio de técnicas de inteligencia artificial. Formación Universitaria, 13(1), 93–102. https://doi.org/10.4067/S0718-50062020000100093
Cedillo-Arce, J. M., Beltrán-Abreo, H. M., Saltos-Arce, M. I., & Soriano-Barzola, F. R. (2024). Explorando la minería de datos en la gestión educativa superior: desafíos y oportunidades en la era digital. Reincisol, 3(5), 1368–1385. https://doi.org/10.59282/reincisol.V3(5)1367-1385
Choque-Aguilar, M. R. (2024). Red neuronal para predecir el rendimiento académico. Revista Simón Rodríguez, 4(8), 22–35. https://doi.org/10.62319/simonrodriguez.v.4i8.31
CONEVAL. (2023). Informe de pobreza multidimensional 2022: Resultados nacionales y por entidad federativa. Consejo Nacional de Evaluación de la Política de Desarrollo Social. https://www.coneval.org.mx
Contreras-Bravo, L. E., Fuentes-López, H. J., & Rivas-Trujillo, E. (2021). Análisis del rendimiento académico mediante técnicas de aprendizaje automático con métodos de ensamble. Boletín Redipe, 10(13) 171–190. https://doi.org/10.36260/rbr.v10i13.1737
Cortez, P., & Silva, A. (2008). Using data mining to predict secondary school student performance. En A. Brito & J.Teixeira (Eds.), Proceedings of the 5th Annual Future Business Technology Conference (pp. 5-12). EUROSIS. https://doi.org/10.24432/C5TG7T
Díaz-Martínez, M. A., Ahumada-Cervantes, M. de los Ángeles, & Melo-Morín, J. P. (2021). Árboles de decisión como metodología para determinar el rendimiento académico en educación superior. Revista Lasallista de Investigación, 18(2), 94–104. https://revistas.unilasallista.edu.co/index.php/rldi/article/view/2724
Gil-Vera, V. D., & Quintero-López, C. (2021). Predicción del rendimiento académico estudiantil con redes neuronales artificiales. Información Tecnológica, 32(6), 221–228. https://doi.org/10.4067/s0718-07642021000600221
Hernández Sampieri, R., Fernández Collado, C., & Baptista Lucio, P. (2014). Metodología de la investigación (6.ª ed.). McGraw-Hill. https://uniclanet.unicla.edu.mx/assets/contenidos/254857_DOC_2023-03-01_18:46:18.pdf
INEGI. (2022). Encuesta Nacional sobre Disponibilidad y Uso de Tecnologías de la Información en los Hogares (ENDUTIH 2022). Instituto Nacional de Estadística y Geografía. https://www.inegi.org.mx/programas/dutih/
Merceron, A., & Tato, A. (2023). Introduction to neural networks and uses in educational data mining. En M. Feng, T. Käser, & P. Talukdar (Eds.), Proceedings of the 16th International Conference on Educational Data Mining (pp. 578–581). International Educational Data Mining Society. https://doi.org/10.5281/zenodo.8115774
Ordoñez-Avila, R., Salgado Reyes, N., Meza, J., & Ventura, S. (2023). Data mining techniques for predicting teacher evaluation in higher education: A systematic literature review. Heliyon, 9(3), e13939. https://doi.org/10.1016/j.heliyon.2023.e13939
Peña-Ayala, A. (2014). Educational data mining: A survey and a data mining-based analysis of recent works. Expert Systems with Applications, 41(4), 1432-1462. https://doi.org/10.1016/j.eswa.2013.08.042
Pérez Pérez, A. M., Custodio Valenzuela, M., Cerón Garnica, C., Mila Avendaño, V. M., & Moyao Martínez, Y. (2025). La gestión académica en centros educativos urbanos marginales y zonas rurales orientada a la preparación del docente para la alfabetización inicial. Edutec. Revista Electrónica de Tecnología Educativa, 33(1), 1–12. https://doi.org/10.58299/edutec.v33i1.335
Piaget, J. (1972). Psychology and epistemology: Towards a theory of knowledge. Penguin. https://books.google.com.mx/books/about/Psychology_and_Epistemology.html?id=7DkdAQAAMAAJ&redir_esc=y
Rico-Páez, Andrés. (2022). Modelos predictivos progresivos del rendimiento académico de estudiantes universitarios. RIDE. Revista Iberoamericana para la Investigación y el Desarrollo Educativo, 12(24), e044. https://doi.org/10.23913/ride.v12i24.1196
Romero, C., & Ventura, S. (2020). Educational data mining and learning analytics: An updated survey. Wiley Interdisciplinary Reviews: Data Mining and Knowledge Discovery, 10(3), e1355. https://doi.org/10.1002/widm.1355
Ryan, R. M., & Deci, E. L. (2000). Self-determination theory and the facilitation of intrinsic motivation, social development, and well-being. American Psychologist, 55(1), 68–78. https://doi.org/10.1037/0003-066X.55.1.68
Secretaría de Educación Pública. (2023). Estadística e indicadores educativos: Puebla, ciclo escolar 2022–2023. Gobierno de México. https://planeacion.sep.gob.mx
Secretaría de Educación Pública. Dirección General de Planeación, Programación y Estadística Educativa. (2024). Estadística educativa. Puebla. Ciclo escolar 2023–2024 [Informe]. https://planeacion.sep.gob.mx/Doc/estadistica_e_indicadores/EstIndEntFed2023/21_PUE.pdf
Taylor, R. S., Martin, T., & Rossi, L. M. (2016). Educational data mining and learning analytics. En A. A. Rupp & J. P. Leighton (Eds.), The Handbook of Cognition and Assessment: Frameworks, methodologies, and applications (pp. 379–396). John Wiley & Sons.
https://doi.org/10.1002/9781118956588.ch16
Macías-Ureta, K. T., & Ordóñez-Valencia, E. V. (2025). Metodologías activas para el desarrollo de habilidades matemáticas: Un análisis bibliográfico. LATAM Revista Latinoamericana de Ciencias Sociales y Humanidades, 6(2), 3431–3450. https://doi.org/10.56712/latam.v6i2.3917
Vygotsky, L. S. (1978). Mind in society: The development of higher psychological processes (M. Cole, V. John-Steiner, S. Scribner & E. Souberman, Eds. & Trans.). Harvard University Press. https://autismusberatung.info/wp-content/uploads/2023/09/Vygotsky-Mind-in-society.pdf

Esta obra está bajo licencia internacional Creative Commons Reconocimiento 4.0.
Con el propósito de promover el desarrollo y divulgación de la investigación en educación en América Latina, en La Revista Iberoamericana para la Investigación y el Desarrollo Educativo (RIDE) se adhirió a la Iniciativa de Acceso Abierto de Budapest, por lo que se identifica como una publicación de acceso abierto. Esto significa que cualquier usuario puede leer el texto completo de los artículos, imprimirlos, descargarlos, copiarlos, enlazarlos, distribuirlos y usar los contenidos para otros fines. Las licencias Creative Cummons, permiten especificar los derechos de uso de una revista de acceso abierto disponible en Internet de tal manera que los usuarios conocen las reglas de publicación.
Los autores/as que publiquen en esta revista aceptan las siguientes condiciones:
Los autores/as conservan los derechos de autor y ceden a la revista el derecho de la primera publicación, con el trabajo registrado con la licencia de atribución de Creative Commons, que permite a terceros utilizar lo publicado siempre que mencionen la autoría del trabajo y a la primera publicación en esta revista.
Los autores/as pueden realizar otros acuerdos contractuales independientes y adicionales para la distribución no exclusiva de la versión del artículo publicado en esta revista (p. ej., incluirlo en un repositorio institucional o publicarlo en un libro) siempre que indiquen claramente que el trabajo se publicó por primera vez en esta revista.
Se permite y recomienda a los autores/as a publicar su trabajo en Internet (por ejemplo en páginas institucionales o personales) antes y durante el proceso de revisión y publicación, ya que puede conducir a intercambios productivos y a una mayor y más rápida difusión del trabajo publicado
