Predicción del rendimiento académico con un modelo de clasificación: una comparación entre estudiantes rurales y urbanos de educación media superior

  • Yolanda Moyao Martínez Benemérita Universidad Autónoma de Puebla
  • Carmen Cerón Garnica Benemérita Universidad Autónoma de Puebla

Resumen

Este trabajo de investigación tuvo como propósito predecir el aprovechamiento académico por debajo de la meta esperada, definida a partir del promedio mínimo aprobatorio establecido por la institución, en estudiantes de nivel medio superior en Puebla a través del uso de modelos predictivos de aprendizaje automático supervisado, basados en técnicas de clasificación y minería de datos. En este estudio, el término aprovechamiento académico se emplea como indicador del rendimiento académico de los estudiantes. Para ello, se procesaron dos conjuntos de información provenientes de una preparatoria rural y una urbana de la Benemérita Universidad Autónoma de Puebla (BUAP). Se empleó el algoritmo de clasificación de bosques aleatorios (Random Forest) propuesto por Breiman (2001), el cual fue entrenado y evaluado de manera independiente en ambos conjuntos de datos, utilizando como métricas de desempeño la precisión y la sensibilidad (recall). En ambos conjuntos de datos se obtuvo una precisión del 0.72, lo que indica un desempeño comparable del modelo en los contextos rural y urbano. El modelo permitió identificar elementos clave relacionados con el aprovechamiento académico, tales como, la asistencia a clases y el aprovechamiento anticipado en algunas materias, los cuales mostraron una correspondencia descriptiva con el nivel de escolaridad. Asimismo, los hallazgos revelaron algunas diferencias entre ambos contextos, lo que sugiere la necesidad de implementar propuestas de mejora adaptadas a cada contexto, pero que sean muy particulares a cada entorno. A partir de estos resultados, se derivan implicaciones directas para las organizaciones educativas y el sector público, particularmente en el diseño de estrategias orientadas a la prevención del rezago académico y con ello, la deserción escolar en ambos contextos.

Descargas

La descarga de datos todavía no está disponible.

Citas

Acosta-Gonzaga, Elizabeth, & Ramirez-Arellano, Aldo. (2020). Estudio comparativo de técnicas de analítica del aprendizaje para predecir el rendimiento académico de los estudiantes de educación superior. CienciaUAT, 15(1), 63-74. Epub 22 de diciembre de 2020. https://doi.org/10.29059/cienciauat.v15i1.1392

Aguilar-Reyes, J. E., Mejía-Peñafiel, E. F., Morocho-Barrionuevo, T. P., & Velasco Castelo, G.-M. (2025). Estudio del rendimiento académico mediante la comparación de modelos de regresión y árboles de clasificación. Telos: Revista de estudios Interdisciplinarios en ciencias sociales, 27(1), 94-115. https://ve.scielo.org/scielo.php?script=sci_arttext&pid=S1317-05702025000100094

Ausubel, D. P. (1968). Educational psychology: A cognitive view. Holt, Rinehart and Winston. https://archive.org/details/in.ernet.dli.2015.112045/page/n3/mode/2up?utm_source=chatgpt.com

Bandura, A. (2001). Social cognitive theory: An agentic perspective. Annual Review of Psychology, 52, 1–26. https://doi.org/10.1146/annurev.psych.52.1.1

Breiman, L. (2001). Random forests. Machine Learning, 45(1), 5–32. https://doi.org/10.1023/A:1010933404324

Bourdieu, P., & Passeron, J.-C. (1990). Reproduction in education, society and culture. SAGE Publications. https://archive.org/details/reproductionined0000bour

Buschini, J. D. (2023). Niklas Luhmann y la teoría general de los sistemas sociales. En A. A. M. Camou (Coord.), Cuestiones de teoría social contemporánea (pp. 443–471). La Plata: Universidad Nacional de La Plata; EDULP. https://www.memoria.fahce.unlp.edu.ar/libros/pm.5846/pm.5846.pdf

Chapman, P., Clinton, J., Kerber, R., Khabaza, T., Reinartz, T., Shearer, C., & Wirth, R. (2000). CRISP‑DM 1.0: Step‑by‑step data mining guide. CRISP‑DM Consortium. https://www.kde.cs.uni-kassel.de/wp-content/uploads/lehre/ws2012-13/kdd/files/CRISPWP-0800.pdf

Castrillón, O. D., Sarache, W., & Ruiz-Herrera, S. (2020). Predicción del rendimiento académico por medio de técnicas de inteligencia artificial. Formación Universitaria, 13(1), 93–102. https://doi.org/10.4067/S0718-50062020000100093

Cedillo-Arce, J. M., Beltrán-Abreo, H. M., Saltos-Arce, M. I., & Soriano-Barzola, F. R. (2024). Explorando la minería de datos en la gestión educativa superior: desafíos y oportunidades en la era digital. Reincisol, 3(5), 1368–1385. https://doi.org/10.59282/reincisol.V3(5)1367-1385

Choque-Aguilar, M. R. (2024). Red neuronal para predecir el rendimiento académico. Revista Simón Rodríguez, 4(8), 22–35. https://doi.org/10.62319/simonrodriguez.v.4i8.31

CONEVAL. (2023). Informe de pobreza multidimensional 2022: Resultados nacionales y por entidad federativa. Consejo Nacional de Evaluación de la Política de Desarrollo Social. https://www.coneval.org.mx

Contreras-Bravo, L. E., Fuentes-López, H. J., & Rivas-Trujillo, E. (2021). Análisis del rendimiento académico mediante técnicas de aprendizaje automático con métodos de ensamble. Boletín Redipe, 10(13) 171–190. https://doi.org/10.36260/rbr.v10i13.1737

Cortez, P., & Silva, A. (2008). Using data mining to predict secondary school student performance. En A. Brito & J.Teixeira (Eds.), Proceedings of the 5th Annual Future Business Technology Conference (pp. 5-12). EUROSIS. https://doi.org/10.24432/C5TG7T

Díaz-Martínez, M. A., Ahumada-Cervantes, M. de los Ángeles, & Melo-Morín, J. P. (2021). Árboles de decisión como metodología para determinar el rendimiento académico en educación superior. Revista Lasallista de Investigación, 18(2), 94–104. https://revistas.unilasallista.edu.co/index.php/rldi/article/view/2724

Gil-Vera, V. D., & Quintero-López, C. (2021). Predicción del rendimiento académico estudiantil con redes neuronales artificiales. Información Tecnológica, 32(6), 221–228. https://doi.org/10.4067/s0718-07642021000600221

Hernández Sampieri, R., Fernández Collado, C., & Baptista Lucio, P. (2014). Metodología de la investigación (6.ª ed.). McGraw-Hill. https://uniclanet.unicla.edu.mx/assets/contenidos/254857_DOC_2023-03-01_18:46:18.pdf

INEGI. (2022). Encuesta Nacional sobre Disponibilidad y Uso de Tecnologías de la Información en los Hogares (ENDUTIH 2022). Instituto Nacional de Estadística y Geografía. https://www.inegi.org.mx/programas/dutih/

Merceron, A., & Tato, A. (2023). Introduction to neural networks and uses in educational data mining. En M. Feng, T. Käser, & P. Talukdar (Eds.), Proceedings of the 16th International Conference on Educational Data Mining (pp. 578–581). International Educational Data Mining Society. https://doi.org/10.5281/zenodo.8115774

Ordoñez-Avila, R., Salgado Reyes, N., Meza, J., & Ventura, S. (2023). Data mining techniques for predicting teacher evaluation in higher education: A systematic literature review. Heliyon, 9(3), e13939. https://doi.org/10.1016/j.heliyon.2023.e13939

Peña-Ayala, A. (2014). Educational data mining: A survey and a data mining-based analysis of recent works. Expert Systems with Applications, 41(4), 1432-1462. https://doi.org/10.1016/j.eswa.2013.08.042

Pérez Pérez, A. M., Custodio Valenzuela, M., Cerón Garnica, C., Mila Avendaño, V. M., & Moyao Martínez, Y. (2025). La gestión académica en centros educativos urbanos marginales y zonas rurales orientada a la preparación del docente para la alfabetización inicial. Edutec. Revista Electrónica de Tecnología Educativa, 33(1), 1–12. https://doi.org/10.58299/edutec.v33i1.335

Piaget, J. (1972). Psychology and epistemology: Towards a theory of knowledge. Penguin. https://books.google.com.mx/books/about/Psychology_and_Epistemology.html?id=7DkdAQAAMAAJ&redir_esc=y

Rico-Páez, Andrés. (2022). Modelos predictivos progresivos del rendimiento académico de estudiantes universitarios. RIDE. Revista Iberoamericana para la Investigación y el Desarrollo Educativo, 12(24), e044. https://doi.org/10.23913/ride.v12i24.1196

Romero, C., & Ventura, S. (2020). Educational data mining and learning analytics: An updated survey. Wiley Interdisciplinary Reviews: Data Mining and Knowledge Discovery, 10(3), e1355. https://doi.org/10.1002/widm.1355

Ryan, R. M., & Deci, E. L. (2000). Self-determination theory and the facilitation of intrinsic motivation, social development, and well-being. American Psychologist, 55(1), 68–78. https://doi.org/10.1037/0003-066X.55.1.68

Secretaría de Educación Pública. (2023). Estadística e indicadores educativos: Puebla, ciclo escolar 2022–2023. Gobierno de México. https://planeacion.sep.gob.mx

Secretaría de Educación Pública. Dirección General de Planeación, Programación y Estadística Educativa. (2024). Estadística educativa. Puebla. Ciclo escolar 2023–2024 [Informe]. https://planeacion.sep.gob.mx/Doc/estadistica_e_indicadores/EstIndEntFed2023/21_PUE.pdf

Taylor, R. S., Martin, T., & Rossi, L. M. (2016). Educational data mining and learning analytics. En A. A. Rupp & J. P. Leighton (Eds.), The Handbook of Cognition and Assessment: Frameworks, methodologies, and applications (pp. 379–396). John Wiley & Sons.
https://doi.org/10.1002/9781118956588.ch16

Macías-Ureta, K. T., & Ordóñez-Valencia, E. V. (2025). Metodologías activas para el desarrollo de habilidades matemáticas: Un análisis bibliográfico. LATAM Revista Latinoamericana de Ciencias Sociales y Humanidades, 6(2), 3431–3450. https://doi.org/10.56712/latam.v6i2.3917

Vygotsky, L. S. (1978). Mind in society: The development of higher psychological processes (M. Cole, V. John-Steiner, S. Scribner & E. Souberman, Eds. & Trans.). Harvard University Press. https://autismusberatung.info/wp-content/uploads/2023/09/Vygotsky-Mind-in-society.pdf
Publicado
2026-02-17
Cómo citar
Moyao Martínez, Y., & Cerón Garnica, C. (2026). Predicción del rendimiento académico con un modelo de clasificación: una comparación entre estudiantes rurales y urbanos de educación media superior. RIDE Revista Iberoamericana Para La Investigación Y El Desarrollo Educativo, 16(32), e1045. https://doi.org/10.23913/ride.v16i32.2841
Sección
Artículos Científicos