Please use this identifier to cite or link to this item: http://hdl.handle.net/11458/5264
Title: Categorización a estudiantes universitarios en niveles de riesgo de deserción en base al algoritmo de aprendizaje no supervisado basado en densidad
Authors: Valles Coral, Miguel Angel
Salazar Ramirez, Luis Gerardo
Keywords: Clusterización
DBSCAN
Algoritmo de aprendizaje no supervisado
Riesgo de deserción
PCA
Issue Date: 9-Dec-2022
Publisher: Universidad Nacional de San Martín. Fondo Editorial
Source: Salazar- Ramirez, L. G. (2022). Categorización a estudiantes universitarios en niveles de riesgo de deserción en base al algoritmo de aprendizaje no supervisado basado en densidad. Tesis para optar el grado de Ingeniero de Sistemas e Informática. Facultad de Ingeniería de Sistemas e Informática, Universidad Nacional de San Martín, Tarapoto, Perú.
Abstract: La etapa de formación superior universitaria, es un proceso que expone a los estudiantes a un estrés físico y mental prolongado, así como también a la autoexigencia con el fin de superar los retos que supone una carrera universitaria. Estos estímulos, de manera prolongada, van calando en su salud y estabilidad, tanto física como mental. Dicho desgaste, los expone a un determinado riesgo de deserción, el cual, posteriormente resulta crucial en la consecución o finalización de sus estudios. Es por esto que se planteó como objetivo categorizar a los estudiantes de la Universidad Nacional de San Martín en función al riesgo de deserción. Por lo cual, se realizó un estudio aplicado y de nivel descriptivo, bajo un diseño no experimental, utilizando una muestra de 670 estudiantes a los cuales se les proporcionó un conjunto de preguntas mediante una interfaz de chatbot sobre una plataforma web. Tras recopilar sus respuestas, estas fueron organizadas en una tabla de datos dentro de un archivo portable para que mediante un conjunto de técnicas de limpieza y normalización, fueran preprocesadas, esto con el fin de ser posteriormente sometidas al algoritmo DBSCAN. Luego de este procedimiento, los resultados fueron redimensionados para su visualización mediante PCA, así como también, fueron sometidos a técnicas de validación: a través de la proyección de los clústeres en la nube de puntos, y el análisis del coeficiente de Silhouette. Como resultado se obtuvieron 5 clústeres, con un coeficiente de Silhouette de 0.478, siendo finalmente etiquetadas y jerarquizadas con ayuda de un experto. Es así como se concluye que, se logró categorizar exitosamente a los estudiantes de la Universidad Nacional de San Martín en función al riego de deserción.
Higher education stage is a process that exposes students to prolonged physical and mental stress, as well as self-demanding in order to overcome the challenges of a university career. These stimuli, over a prolonged period, affect both physical and mental health and stability. Such attrition exposes students to a certain risk of dropping out, which subsequently proves to be crucial in the achievement or completion of their studies. The objective of this study was to categorize the students of the National University of San Martín according to their dropout risk. An applied and descriptive study was conducted under a non-experimental design, using a sample of 670 students who were provided with a set of questions through a chatbot interface on a web platform. Their responses were then organized into a data table in a portable file and preprocessed through a set of cleaning and normalization techniques in order to be subsequently subjected to the DBSCAN algorithm. After this procedure, the results were resized for visualization through PCA, as well as subjected to validation techniques, through cluster projection in the point cloud and Silhouette coefficient analysis. As a result, 5 clusters were obtained, with a Silhouette coefficient of 0.478, being finally labeled and hierarchized with the help of an expert. In conclusion, it was possible to successfully categorize the students of the National University of San Martín according to the risk of desertion.
URI: http://hdl.handle.net/11458/5264
Appears in Collections:(Br.) Ingeniería de Sistemas e Informática

Files in This Item:
File Description SizeFormat 
TESIS- Luis Gerardo Salazar Ramírez.pdf2.11 MBAdobe PDFView/Open
Formato de autorización NO EXCLUSIVA.pdf448.36 kBAdobe PDFView/Open
Show full item record

Google ScholarTM

Check


This item is licensed under a Creative Commons License Creative Commons