Please use this identifier to cite or link to this item: http://hdl.handle.net/11458/5778
Title: Aplicación de técnicas de minería de datos para predecir la deserción estudiantil en la Institución Educativa 00116 Alto Perú - Moyobamba
Authors: Lopez Rodriguez, Carlos Enrique
Flores Satalaya, Jules Mao
Keywords: Técnicas
Minería de datos
Predicción
Deserción estudiantil
Issue Date: 1-Feb-2024
Source: Flores-Satalaya, J. M. (2024). Aplicación de técnicas de minería de datos para predecir la deserción estudiantil en la Institución Educativa 00116 Alto Perú - Moyobamba. Tesis para optar el título de Ingeniero de Sistemas e Informática. Facultad de Ingeniería de Sistemas e Informática, Universidad Nacional de San Martín, Tarapoto, Perú.
Abstract: El presente estudio tuvo como objetivo determinar la influencia de los algoritmitos aprendizaje supervisado en la deserción estudiantil de la Escuela de Posgrado - Universidad Enrique Guzmán y Valle; el estudio fue de tipo aplicado, nivel descriptivo y diseño metodológico no experimental. La población compuesta por 10659 estudiantes, la muestra fue dada por conveniencia siendo el total de 5758 estudiantes. Las técnicas fueron el análisis documental y la observación, los instrumentos correspondieron a la ficha documental y el cuadro de resumen de predicciones. Se analizaron 110 archivos donde registran la deserción estudiantil, que mediante procedimientos de ETL se pudo consolidar un dataset con información de 387 estudiantes, asimismo se determinó que la situación de matrícula, los cursos aprobados, los cursos desaprobados, el comportamiento, grado culminado y el nacimiento registrado son variables influyentes en gran significancia en la deserción estudiantil. Seguidamente se analizaron 5 técnicas de minería de datos, siendo los algoritmos J48, Random Forest, Vecinos Mas Cercanos, Función Logística y Perceptrón Multicapa, desempeñándose con mayor efectividad el algoritmo J48. Se evaluaron 116 casos, de los cuales el modelo basado en técnicas de minería de datos no acertó 5 casos, siendo equivalente al 4.31%. Por lo tanto se concluyó que la deserción estudiantil se puede predecir a través de los datos académicos y sociales, utilizando los algoritmos de aprendizaje automático hasta en un 95.69% de efectividad.
The objective of this study was to apply data mining techniques to predict student dropout in the Educational Institution 00116 Alto Perú - Moyobamba; the study was applied, with a descriptive level and non-experimental methodological design. The population consisted of 412 students, the sample was given by convenience making a total of 387 students. The techniques used were documentary analysis and observation; the instruments used were the documentary file and the prediction summary table. A total of 110 files recording student desertion were analyzed, and a dataset with information on 387 students was consolidated by means of ETL procedures. It was also determined that enrollment status, courses passed, courses failed, behavior, grade completed and birth registered are highly significant influential variables in student desertion. Subsequently, 5 data mining techniques were analyzed, being the J48, Random Forest, Nearest Neighbors, Logistic Function and Multilayer Perceptron algorithms, with the J48 algorithm performing more effectively. A total of 116 cases were evaluated, of which the model based on data mining techniques failed in 5 cases, equivalent to 4.31%. Therefore, it was concluded that academic performance can be predicted through academic and social data, using machine learning algorithms up to 95.69% of effectiveness.
URI: http://hdl.handle.net/11458/5778
Appears in Collections:(Br.) Ingeniería de Sistemas e Informática

Show full item record

Google ScholarTM

Check


This item is licensed under a Creative Commons License Creative Commons