qwertyuiopasdfghjklzxcvbnmqwe rtyuiopasdfghjklzxcvbnmqwertyui opasdfghjklzxcvbnmqwertyuiopa Instituto Tecnológico De Piedras Negras sdfghjklzxcvbnmqwertyuiopasdfg Materia: Tópicos Avanzados de Bases de Datos hjklzxcvbnmqwertyuiopasdfghjklz Imparte: M.I. Juan Ramón Olague Sánchez xcvbnmqwertyuiopasdfghjklzxcv TRABAJ TRA BAJO O FIN F INAL AL—“WEK —“WEKA” A” bnmqwertyuiopasdfghjklzxcvbnm Alumno: Pedro Cruz Vázquez qwertyuiopasdfghjklzxcvbnmqwe rtyuiopasdfghjklzxcvbnmqwertyui opasdfghjklzxcvbnmqwertyuiopa sdfghjklzxcvbnmqwertyuiopasdfg hjklzxcvbnmqwertyuiopasdfghjklz xcvbnmqwertyuiopasdfghjklzxcv bnmqwertyuiopasdfghjklzxcvbnm qwertyuiopasdfghjklzxcvbnmqwe rtyuiopasdfghjklzxcvbnmrtyuiopa
[INSTITUTO TECNOLÓGICO DE PIEDRAS NEGRAS] NEGRAS ] ISC
PARTE 1.
El Sigui Siguien ente te Trab Trabajo ajo tiene tiene como como fin Invest Investig igar ar una una base base de datos datos o tabla tabla de datos datos depurada, en este caso de la INGI, la cual muestra los usuarios y suscriptores de servicios servicios de telecomuni telecomunicacio caciones nes en México, México, durante durante el periodo periodo de 1998-2009 1998-2009, la siguiente imagen muestra la tabla y su contenido:
PARTE 2 A continuación se busca realizar un análisis de minería de datos sobre un grupo de registros en particular, a fin de obtener uno o varios patrones que indiquen el estado general del grupo de registros estudiados, dicho análisis se desarrollara con el apoyo de la herramienta herramienta weka, la cual es entorno para Análisis del Conocimiento, es un conocido software para aprendizaje automático y minería de datos escrito en Java en Java y desarrollado desarrollado Tópicos Avanzados de Bases de DatosPágina 2
[INSTITUTO TECNOLÓGICO DE PIEDRAS NEGRAS] NEGRAS ] ISC en la Universidad de Waikato. Waikato . WEKA es un software libre distribuido bajo licencia GNUGPL. GPL.
Weka, contie contiene ne una una colecc colecció ión n de herram herramien ientas tas de visua visuali lizac zació ión n y algoritmos para análisis de datos y modelado modelado predictivo predictivo , unidos a una interfaz gráfica de usuario para acceder fácilmente a sus funcionalidades
Entorno de Trabajo Weka. Weka Weka cuan cuanta ta con con un ento entorn rno o de trab trabaj ajo o graf grafic ico, o, el cual cual faci facili lita ta la oper operac ació ión n de aplicación, a continuación detallare los pasos que seguí para desarrollar mi trabajo final. 1. Esta es la ventana ventana principal principal de weka para para iniciar iniciar damos clic en el botón Explorer. Explorer.
2. Ya estando dentro de la ventana weka explorer nos ubicamos El panel
"Preprocess" el cual dispone de opciones para importar datos de una base de datos, datos, de un fichero CSV, CSV, etc., y para pre procesar estos datos utilizando los denominados algoritmos de filtrado. Estos filtros se pueden utilizar para transformar los datos (por ejemplo convirtiendo datos numéricos en valores discretos) y para eliminar registros o atributos según ciertos criterios previamente especificados.
3. Ahora Abrimos nuestro archivo, dando clic en el botón open file en la parte
superior izquierda de la ventana. Seleccionamos la ruta de nuestro archivo el cual Tópicos Avanzados de Bases de DatosPágina 3
[INSTITUTO TECNOLÓGICO DE PIEDRAS NEGRAS] NEGRAS ] ISC está en Excel con una extensión .csv (archivo delimitado por comas), para el mejor tratamiento de la información.
4. Ya que contamos contamos con la la tabla dentro dentro de weka procedem procedemos os a seleccionar seleccionar los campos con los que se va a trabajar para sacar el resultado.
Tópicos Avanzados de Bases de DatosPágina 4
[INSTITUTO TECNOLÓGICO DE PIEDRAS NEGRAS] NEGRAS ] ISC
5. Ya seleccionados los campos nos vamos a El panel "Cluster" el cual da acceso a las
técnicas de clustering o agrupamiento de Weka como por ejemplo el algoritmo Kmeans. means. Este es sólo una implementación del algoritmo expectación-maximización para aprender una mezcla de distribuciones normales. normales .
Tópicos Avanzados de Bases de DatosPágina 5
[INSTITUTO TECNOLÓGICO DE PIEDRAS NEGRAS] NEGRAS ] ISC 6. Yo utilizare el algoritmo FarthestFirst, FarthestF irst, para seleccionarlo presionamos el botón
Choose y elegimos la opción del algoritmo FarthestFirst.
7. Ya seleccionado nuestro algoritmo presionamos en el cuadro de texto donde esta
el nombre de FarthestFrist, para seleccionar el numero de clustres que deseamos en este caso 5 lo ponemos y damos clic en OK.
Tópicos Avanzados de Bases de DatosPágina 6
[INSTITUTO TECNOLÓGICO DE PIEDRAS NEGRAS] NEGRAS ] ISC 8. Ya contando contando con los campos campos seleccionados, seleccionados, el algoritmo algoritmo y el numero numero de Clusters, Clusters, damos clic en el botón Start para hacer el análisis.
Tópicos Avanzados de Bases de DatosPágina 7
[INSTITUTO TECNOLÓGICO DE PIEDRAS NEGRAS] NEGRAS ] ISC 9. Ahora ya con con el resultado resultado que nos nos arrojo solo nos queda interpret interpretar ar los datos.
Grafica de Tabla de Porcentaje
Tópicos Avanzados de Bases de DatosPágina 8
[INSTITUTO TECNOLÓGICO DE PIEDRAS NEGRAS] NEGRAS ] ISC
CONCLUSION Los resultados obtenidos de la implementación de una herramienta como weka, en una minería de datos, en este caso los usua suarios y suscriptores de telecomunicaciones, arrojan que en el año 2003 fue cuando se disparo el uso de las telecomun telecomunicac icacion iones, es, princip principalme almente nte las de la telefoní telefonía a móvil móvil televisi televisión ón por satéli satélite. te. Aunq Aunque ue tamb también ién fue cuand cuando o algu algunas nas cosas cosas fuero fueron n qued quedánd ándose ose en el camino como los radiolocalizadores personales.
La utilización de una herramienta herramienta como weka es de gran apoyo cuando se trata de realizar trabajos con grandes cantidades de datos.
Tópicos Avanzados de Bases de DatosPágina 9
[INSTITUTO TECNOLÓGICO DE PIEDRAS NEGRAS] NEGRAS ] ISC
Tópicos Avanzados de Bases de DatosPágina 10