Please use this identifier to cite or link to this item:
http://hdl.handle.net/11458/5778
Title: | Aplicación de técnicas de minería de datos para predecir la deserción estudiantil en la Institución Educativa 00116 Alto Perú - Moyobamba | Authors: | Lopez Rodriguez, Carlos Enrique Flores Satalaya, Jules Mao |
Keywords: | Técnicas Minería de datos Predicción Deserción estudiantil |
Issue Date: | 1-Feb-2024 | Source: | Flores-Satalaya, J. M. (2024). Aplicación de técnicas de minería de datos para predecir la deserción estudiantil en la Institución Educativa 00116 Alto Perú - Moyobamba. Tesis para optar el título de Ingeniero de Sistemas e Informática. Facultad de Ingeniería de Sistemas e Informática, Universidad Nacional de San Martín, Tarapoto, Perú. | Abstract: | El presente estudio tuvo como objetivo determinar la influencia de los algoritmitos aprendizaje supervisado en la deserción estudiantil de la Escuela de Posgrado - Universidad Enrique Guzmán y Valle; el estudio fue de tipo aplicado, nivel descriptivo y diseño metodológico no experimental. La población compuesta por 10659 estudiantes, la muestra fue dada por conveniencia siendo el total de 5758 estudiantes. Las técnicas fueron el análisis documental y la observación, los instrumentos correspondieron a la ficha documental y el cuadro de resumen de predicciones. Se analizaron 110 archivos donde registran la deserción estudiantil, que mediante procedimientos de ETL se pudo consolidar un dataset con información de 387 estudiantes, asimismo se determinó que la situación de matrícula, los cursos aprobados, los cursos desaprobados, el comportamiento, grado culminado y el nacimiento registrado son variables influyentes en gran significancia en la deserción estudiantil. Seguidamente se analizaron 5 técnicas de minería de datos, siendo los algoritmos J48, Random Forest, Vecinos Mas Cercanos, Función Logística y Perceptrón Multicapa, desempeñándose con mayor efectividad el algoritmo J48. Se evaluaron 116 casos, de los cuales el modelo basado en técnicas de minería de datos no acertó 5 casos, siendo equivalente al 4.31%. Por lo tanto se concluyó que la deserción estudiantil se puede predecir a través de los datos académicos y sociales, utilizando los algoritmos de aprendizaje automático hasta en un 95.69% de efectividad. The objective of this study was to apply data mining techniques to predict student dropout in the Educational Institution 00116 Alto Perú - Moyobamba; the study was applied, with a descriptive level and non-experimental methodological design. The population consisted of 412 students, the sample was given by convenience making a total of 387 students. The techniques used were documentary analysis and observation; the instruments used were the documentary file and the prediction summary table. A total of 110 files recording student desertion were analyzed, and a dataset with information on 387 students was consolidated by means of ETL procedures. It was also determined that enrollment status, courses passed, courses failed, behavior, grade completed and birth registered are highly significant influential variables in student desertion. Subsequently, 5 data mining techniques were analyzed, being the J48, Random Forest, Nearest Neighbors, Logistic Function and Multilayer Perceptron algorithms, with the J48 algorithm performing more effectively. A total of 116 cases were evaluated, of which the model based on data mining techniques failed in 5 cases, equivalent to 4.31%. Therefore, it was concluded that academic performance can be predicted through academic and social data, using machine learning algorithms up to 95.69% of effectiveness. |
URI: | http://hdl.handle.net/11458/5778 |
Appears in Collections: | (Br.) Ingeniería de Sistemas e Informática |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
1. Tesis Mao Version Final_compressed.pdf | 1.77 MB | Adobe PDF | View/Open | |
4. Formato no Exclusivo Mao_compressed.pdf.crdownload.pdf | 52.5 kB | Adobe PDF | View/Open | |
5. Reporte de Turnitin - Jules Flores_compressed.pdf | 4.32 MB | Adobe PDF | View/Open |
Google ScholarTM
Check
This item is licensed under a Creative Commons License