BIG-DATA
INTEGRANTES:
PEÑARANDA JENNY TOAPANTA ADRIANA
-BIG-DATA -
PROPUESTA PARA ANÁLISIS DE MADRES ADOLESCENTES EMBARAZADAS EN EL ECUADOR – BIGDATA
2
-BIG-DATA -
Historial de Cambios Versión
Fecha
Autor
Cambios
Peñaranda Jenny 1.0
26-05-2015
Emisión inicial Toapanta Adriana
PROYECTO Nombre:
Análisis Sentimientos-BigData
Ubicación:
Universidad Central del Ecuador
Tipo:
Redes Sociales REPRESENTANTES LEGALES
Nombres:
Peñaranda Jenny Toapanta Adriana
Dirección
Universidad Central del Ecuador
Celular:
0995923633
Email:
[email protected] [email protected]
PROPIEDADES DEL DOCUMENTO Autor:
Adriana Toapanta
Título:
Análisis Sentimental
Fecha Creación:
26-05-2015
Fecha Actualización:
28-05-2015
3
-BIG-DATA -
Historial de Cambios .............................................................................................................................................3 Resumen Ejecutivo ............................................................................................................................................... 5 Contexto ...............................................................................................................................................................6 Introducción .........................................................................................................................................................6 Objetivo General ..................................................................................................................................................6 Objetivos Específicos ............................................................................................................................................ 6 Alcance del Proyecto ............................................................................................................................................6 ARQUTECTURA DE LA SOLUCIÓN: ........................................................................................................................7
4
-BIG-DATA -
ANÁLISIS DE MADRES ADOLESCENTES - BIGDATA Resumen Ejecutivo BigData se está convirtiendo en todos los entornos informatizados en el gran tema del momento, también lo va a ser en la educación. Con “BigData” nos referimos al hecho de que la producción y almacenamiento de
información on-line está creciendo de forma tan desmesurada que las soluciones que en general han gestionado esta información a nivel corporativo, ya no son suficientes. Así como los profesionales y los modelos que tienen que analizar estos datos y convertirlos en elementos que resulten útiles para la toma de decisiones. Con esta data se puede hacer algunas apreciaciones importantes para poder tener información y en si conocimiento. El objetivo general de este proyecto es revelar la tendencia actual y futura sobre modelos basados en bigdata que ayuden al análisis de las cifras de embarazos precoces registrados en niñas y adolescentes de 10 a 19 años son preocupantes, tanto para padres de familia como para autoridades y organizaciones sociales e internacionales.
5
-BIG-DATA -
Contexto El proyecto se basa en el desarrollo de conocimiento sobre la tecnología innovadora de BigData y el análisis de los modelos necesarios sobre dicha tecnología que aportan valor agregado a las Entidades.
Introducción Por Big data nos referimos exactamente al tratamiento y análisis de enormes repositorios de datos, tan desproporcionadamente grandes y desestructurados que resulta imposible tratarlos c on las herramientas de bases de datos y analíticas convencionales. La tendencia se encuadra en un entorno que no nos suena para nada extraño: la proliferación de páginas web, aplicaciones de imagen y vídeo, redes sociales, dispositivos móviles, aplicaciones, sensores, internet de las cosas, etc. capaces de generar gran cantidad de información de diferente tipo. Los análisis de la base de datos , podemos acceder a una gran variedad de información. En nuestro caso hemos tomado como referencia el análisis de los bebes nacidos.
Objetivo General Aprender herramientas del manejo de grandes volúmenes de datos y con ellas realizar el cálculo que se quiere obtener.
Objetivos Específicos Encontrar la Data necesaria para alcanzar nuestro objetivo principal. Presentar los resultados. Realizar las configuraciones necesarias en la plataforma Hadoop, sin inutilizar su estructura al realizar el proceso de mapreduce.
Alcance del Proyecto Lograr implementar la estructura necesaria para realizar nuestro proyecto Tomar como referencia la edad y la provincia de nuestra base de datos como variables refentes para nuestro análisis. Tener un promedio general por provincia de las madres adolescentes
6
-BIG-DATA -
ARQUTECTURA DE LA SOLUCIÓN: Luego de un análisis previo de conceptos de Hadoop se realiza la siguiente arquitectura, la cual esta previamente configurada para comunicarse por medio de SSH y permitir que Hadoop pueda ser ejecutado. Los principales puntos: -Un servidor el cual controla los procesos y los nodos (HadoopMaster); es el encargado de controlar a los nodos y procesos que incluyen el map-reduce, enviando el archivo .txt y el programa .jar para que sean debidamente procesados. -3 Nodos (DataNode) que se encargaran de realizar el procesamiento que le asigna el hadoopMaster. -Configuraciones de archivos (Core-Site.xml, HDFS-site.xml, yarn-site.xml, Hadoop-enb.sh, mapred-side.xml) en la versión de Hadoop 2.5.2 más actualizada; que son los principales archivos que permiten la correcta utilización de Hadoop. -Archivos txt obtenidos de la base de datos de INEC del año 2013
7