Tutorial básico de minería de datos SQL Server 2014
Otras versiones Este es el Tutorial básico de minería de datos de Microsoft Analysis Services. Microsoft SQL Server proporciona un entorno integrado para crear modelos de minería de datos y realiar predicciones. En este tutorial! completará un escenario de una campa"a de envío de correo directo en el #ue se utilia aprendia$e automático para analiar y predecir el comportamiento de compra de los clientes. En el tutorial se muestra c%mo utiliar tres de los algoritmos más importantes de minería de datos& agrupaci%n en cl'steres! árboles de decisi%n y (ayes )aive. Tambi*n aprenderá a analiar los +allagos con los visores de modelo de minería de datos! y crear predicciones y gráficos gráficos de precisi%n precisi%n con las +erramientas +erramientas de minería de datos #ue se incluyen en Microsoft SQL Server Analysis Services. La compa"ía ficticia! Adventure Adventure ,or-s ycles! se utilia en todos los e$emplos. uando se sienta c%modo con el uso de las +erramientas de minería de datos! se recomienda #ue complete tambi*n el Tutoria Tutoriall intermedio de minería de datos /Analysis Services 0 Minería de datos1 datos1.. En las lecciones se muestra c%mo utiliar el pron%stico! análisis de la cesta de compras! series temporales! modelos de asociaci%n! tablas anidadas y cl'steres de secuencia. secuencia.
Escenario del tutorial
En este tutorial! será un empleado de Adventure ,or-s ycles con la tarea de obtener más informaci%n sobre los clientes de la compa"ía basándose en el +istorial de compras y utiliando a continuaci%n ese datos +ist%ricos para realiar predicciones #ue se puedan utiliar en el mercado. La compa"ía no +a traba$ado previamente con minería de datos! por lo #ue debe crear una nueva nueva base de datos datos específica para para minería de datos y configurar varios modelos de minería de datos.
Aprendizaje
Este tutorial le ense"a a crear diferentes tipos de m*todos de aprendia$e automático y a traba$ar con ellos. Tambi*n Tambi*n aprenderá a crear una copia de un modelo de minería de datos y aplicar un filtro a los datos de entrada para obtener resultados diferentes. 2espu*s! puede comparar los resultados de ambos modelos mediante un gráfico de elevaci%n. 3or 'ltimo! utiliará la obtenci%n de detalles para recuperar datos adicionales de la estructura de minería de datos subyacente.
La minería de datos de Microsoft Analysis Services incluye las siguientes características #ue ayudan con facilidad a desarrollar y comparar varios modelos predictivos y a tomar medidas posteriormente en funci%n de los resultados& on$untos de pruebas de datos de e4clusi%n& al crear una estructura de minería de datos! a+ora puede dividir los datos de la estructura en con$untos de prueba y de entrenamiento. Esto permite probar modelos en con$untos de datos similares y comparar la precisi%n de los modelos relacionados. 5iltros de modelo de minería de datos& a+ora puede ad$untar filtros a un modelo de minería de datos y aplicar el filtro durante el entrenamiento y las pruebas. Esto permite con facilidad generar modelos relacionados en diferentes subcon$untos de datos. Obtenci%n de detalles para casos de estructura y columnas de estructura& a+ora puede cambiar fácilmente de los patrones generales del modelo de minería de datos al detalle procesable en el origen de datos.
•
•
•
El tutorial está compuesto por las lecciones siguientes& Lecci%n 6& 3reparar la base de datos de Analysis Services /tutorial básico de minería de datos1 En esta lecci%n! aprenderá a crear una nueva base de datos de Analysis Services! agregar un origen de datos y una vista del origen de datos! y preparar la nueva base de datos #ue se va a utiliar para la minería de datos. Lecci%n 7& 8enerar una estructura de distribuci%n de correo directo /Tutorial básico de minería de datos1 En esta lecci%n! aprenderá a crear una estructura de modelos de minería de datos #ue se puede utiliar como parte de un escenario de distribuci%n de correo directo. Lecci%n 9& Agregar y procesar los modelos En esta lecci%n obtendrá informaci%n sobre c%mo agregar modelos a una estructura. Los modelos #ue crea se generan con los algoritmos siguientes& • • •
:rboles de decisi%n de Microsoft Agrupaci%n en cl'steres de Microsoft (ayes naive de Microsoft
Lecci%n ;& E4plorar los modelos de correo directo /tutorial básico de minería de datos1 En esta lecci%n obtendrá informaci%n sobre c%mo e4plorar e interpretar los +allagos de cada modelo usando los visores. Lecci%n <& 3robar los modelos /Tutorial básico de minería de datos1 En esta lecci%n! realia una copia de uno de los modelos de distribuci%n de correo directo! agrega un filtro de modelo de minería de datos para restringir los datos de
entrenamiento a un con$unto determinado de clientes y! a continuaci%n! eval'a la viabilidad del modelo. Lecci%n =& rear y traba$ar con predicciones /Tutorial básico de minería de datos1 En esta lecci%n final del Tutorial básico de minería de datos! utilia el modelo para predecir #u* clientes tienen más probabilidad de comprar una bicicleta. A continuaci%n! obtendrá detalles de los casos subyacentes para conseguir informaci%n de contacto.
e!uisitos
Aseg'rese de #ue los siguientes componentes est*n instalados& • • •
Microsoft SQL Server 7>6; Microsoft SQL Server Analysis Services en modo multidimensional La base de datos Adventure,or-s2,7>67
on ob$eto de me$orar la seguridad! las bases de datos de e$emplo no se instalan con SQL Server. 3ara instalar las bases de datos oficiales para Microsoft SQL Server! visite la página (ases de datos de e$emplo de Microsoft SQL y seleccione SQL Server 7>6;.
Lección 1: Preparar la base de datos de Analysis Services (tutorial básico de minería de datos) SQL Server 2014
Otras versiones
Suponga #ue es un nuevo empleado de Adventure ,or-s ycles #ue se le +a encargado la tarea de dise"ar una aplicaci%n de (usiness ?ntelligence en SQL Server 7>6;. Adventure ,or-s ycles espera aprovec+ar su e4periencia en minería de datos de Analysis Services para detectar informaci%n interesante y procesable sobre las personas #ue +an comprado bicicletas. Quieren #ue prevea #u* clientes tienen más probabilidad de comprar una bicicleta en el futuro. El dise"o de esta aplicaci%n de SQL Server se inicia con la creaci%n en SQL Server 2ata Tools /SS2T1 de un proyecto de SQL Server Analysis Services basado en la plantilla de proyecto de Analysis Services para el modelado multidimensional y la minería de datos. 2espu*s de crear un proyecto de Analysis Services! tiene #ue definir uno o varios orígenes de datos. A continuaci%n! definirá una sola vista de los metadatos denominada vista del origen de datos! a partir de las tablas y vistas seleccionadas en los orígenes de datos.
En esta lecci%n! creará un proyecto de Analysis Services! definirá un solo origen de datos y agregará un subcon$unto de tablas a una vista del origen de datos. Esta lecci%n incluye las tareas siguientes& rear un proyecto de Analysis Services /Tutorial básico de minería de datos1 rear un origen de datos /Tutorial básico de minería de datos1 rear una vista del origen de datos /Tutorial básico de minería de datos1 Primera tarea de la lección
rear un proyecto de Analysis Services /Tutorial básico de minería de datos1 Lección siguiente
Lecci%n 7& 8enerar una estructura de distribuci%n de correo directo /Tutorial básico de minería de datos1
rear un proyecto de Analysis Services (!utorial básico de minería de datos) SQL Server 2014
Otras versiones
ada proyecto de Microsoft SQL Server Analysis Services define los ob$etos de una sola base de datos de Analysis Services. @na base de datos de Analysis Services puede contener muc+os tipos diferentes de ob$etos •
Modelos multidimensionales /cubos1
•
Estructuras de minería de datos y modelos de minería de datos
•
Ob$etos au4iliares como orígenes de datos! vistas del origen de datos y ensamblados personaliados
Tenga en cuenta #ue no se necesita un cubo para realiar tareas de minería de datos. Si necesita realiar minería de datos en un cubo e4istente! debe agregar los modelos de minería de datos al mismo proyecto #ue utili% para generar el cubo. Sin embargo! para la mayoría de los fines se pueden generar los modelos en orígenes de datos relacionales! como un almacenamiento de datos! y obtener me$or rendimiento si no se emplea un cubo. En este tutorial utiliará un almacenamiento de datos relacional! Adventure,or-s2,7>67 ! como origen de datos. ?mplementará todos los ob$etos de
minería de datos en una base de datos de Analysis Services denominada (asic2ataMining! #ue se utilia solamente para minería de datos. 2e forma predeterminada! Analysis Services usa la instancia local+ost para los proyectos nuevos. Si está utiliando una instancia con nombre o un servidor diferente! debe crear y abrir el proyecto primero y! a continuaci%n! cambiar el nombre de instancia. 3ara obtener más informaci%n acerca de los proyectos de Analysis Services! vea rear un proyecto de Analysis Services . Para crear un proyecto de Analysis Services
6. Abra SQL Server 2ata Tools /SS2T1. 7. En el men' Arc+ivo! seleccione )uevo y +aga clic en 3royecto. 9. ompruebe #ue la opci%n 3royectos de (usiness ?ntelligence est* seleccionada en el panel Tipos de proyecto. ;. En el panel 3lantillas! seleccione 3royecto multidimensional y de minería de datos de Analysis Services. <. En el cuadro )ombre! asigne al nuevo proyecto el nombre (asic2ataMining. =. aga clic en Aceptar. Para cambiar la instancia donde se almacenan los ob"etos de minería de datos
6. En SQL Server 2ata Tools /SS2T1! en el men' 3royecto! seleccione 3ropiedades. 7. En el lado i#uierdo del panel 3áginas de propiedades! en 3ropiedades de configuraci%n! +aga clic en ?mplementaci%n. 9. En el lado derec+o del panel 3áginas de propiedades! en 2estino! compruebe #ue el nombre de Servidor es local+ost. Si usa una instancia diferente! escriba el nombre de la instancia. aga clic en Aceptar.
rear un origen de datos (!utorial básico de minería de datos) SQL Server 2014
Otras versiones
@n origen de datos es una cone4i%n de datos guardada y administrada en el proyecto e implementada en la base de datos de Microsoft SQL Server Analysis Services. El origen
de datos contiene los nombres del servidor y la base de datos donde residen los datos de origen! además de otras propiedades de cone4i%n necesarias. Importante
El nombre de la base de datos es Adventure,or-s2,7>67 . Si a'n no +a instalado esta base de datos! vea la página de (ases de datos de e$emplo de Microsoft SQL. Para crear un origen de datos
6. En el E4plorador de soluciones! +aga clic con el bot%n secundario en la carpeta Orígenes de datos y seleccione )uevo origen de datos. 7. En la página de inicio del Asistente para orígenes de datos! +aga clic en Siguiente. 9. En la página Seleccionar c%mo definir la cone4i%n! +aga clic en )ueva para agregar una cone4i%n a la base de datos de Adventure,or-s2,7>67 . ;. En la lista 3roveedor del Administrador de cone4iones! seleccione OLE 2( nativoBSQL Server )ative lient 66.>. <. En el cuadro )ombre del servidor! escriba o seleccione el nombre del servidor en el #ue instal% Adventure,or-s2,7>67 . 3or e$emplo! escriba local+ost ! si la base de datos se +ospeda en el servidor local. =. En el grupo ?niciar sesi%n en el servidor! seleccione @tiliar autenticaci%n de ,indoCs. Importante
Siempre #ue sea posible! los implementadores deberían utiliar la autenticaci%n de ,indoCs! ya #ue proporciona un m*todo de autenticaci%n más seguro #ue la autenticaci%n de SOL Server. Sin embargo! la autenticaci%n de SQL Server se proporciona por motivos de compatibilidad con versiones anteriores. 3ara obtener más informaci%n acerca de los m*todos de autenticaci%n! vea onfiguraci%n del motor de base de datos 0 Aprovisionamiento de cuentas. D. En la lista Seleccione o escriba un nombre de base de datos! seleccione Adventure,or-s2,7>67 y +aga clic en Aceptar. . aga clic en Siguiente. F. En la página ?nformaci%n de suplantaci%n! +aga clic en @tiliar la cuenta de servicio y! a continuaci%n! +aga clic en Siguiente.
En la página 5inaliaci%n del asistente! observe #ue de forma predeterminada el origen de datos se denomina Adventure ,or-s 2, 7>67. 6>. aga clic en 5inaliar. El nuevo origen de datos! Adventure ,or-s 2, 7>67! aparece en la carpeta Orígenes de datos del E4plorador de soluciones.
rear una vista del origen de datos (!utorial básico de minería de datos) SQL Server 2014
Otras versiones
@na vista del origen de datos se genera en un origen de datos y define un subcon$unto de los datos! #ue puede usar en las estructuras de minería de datos. Tambi*n puede usar la vista del origen de datos para agregar columnas! crear columnas calculadas y agregados! y agregar vistas con nombre. Mediante el uso de vistas del origen de datos! puede seleccionar los datos relacionados con un proyecto! establecer relaciones entre tablas y modificar la estructura de los datos sin modificar el origen de datos original. 3ara obtener más informaci%n! vea Gistas del origen de datos en modelos multidimensionales. Para crear una vista del origen de datos
6. En el E4plorador de soluciones! +aga clic con el bot%n secundario en Gistas del origen de datos y seleccione )ueva vista del origen de datos. 7. En la página Asistente para vistas del origen de datos! +aga clic en Siguiente. 9. En la página Seleccionar un origen de datos! en Orígenes de datos relacionales! seleccione el origen de datos Adventure ,or-s 2, 7>67 #ue cre% en la 'ltima tarea. aga clic en Siguiente. Nota
Si desea crear un nuevo origen de datos! +aga clic con el bot%n secundario en Orígenes de datos y! a continuaci%n! +aga clic en )uevo origen de datos para iniciar el Asistente para orígenes de datos. ;. En la página Seleccionar tablas y vistas! seleccione los ob$etos siguientes y! a continuaci%n! +aga clic en la flec+a derec+a para incluirlos en la nueva vista del origen de datos&
o
o
3rospective(uyer /dbo1& la tabla de compradores probables de una bicicleta vTargetMail /dbo1& la vista de datos +ist%ricos sobre los compradores de una bicicleta en el pasado
<. aga clic en Siguiente. =. En la página 5inaliaci%n del asistente! la vista del origen de datos tendrá el nombre Adventure ,or-s 2, 7>67 de forma predeterminada. ambie el nombre por Targeted Mailing y! a continuaci%n! +aga clic en 5inaliar. La nueva vista del origen de datos se abre en la pesta"a Targeted Mailing.dsv H2esignI.
Lección #: $enerar una estructura de distribución de correo directo (!utorial básico de minería de datos) SQL Server 2014
Otras versiones
El departamento de mar-eting de Adventure ,or-s ycles desea aumentar las ventas dirigiendo una campa"a de correo directo a clientes específicos. La base de datos de la empresa contiene una lista de clientes antiguos y otra de nuevos clientes potenciales. Mediante el análisis de los atributos de clientes anteriores! la empresa espera detectar los patrones #ue posteriormente se aplicarán a los clientes potenciales. 3or e$emplo! pueden utilian tendencias anteriores para predecir #u* clientes potenciales tienen más probabilidades de comprar una bicicleta de Adventure ,or-s ycles! o crear segmentos de clientes para campa"as de mar-eting futuras. En esta lecci%n utiliará el Asistente para minería de datos con el fin de crear la estructura de distribuci%n de correo directo. 2espu*s de completar las tareas de esta lecci%n! tendrá una estructura de minería de datos con un modelo sencillo. 2ado #ue la creaci%n de una estructura conlleva muc+os pasos y conceptos importantes! +emos separado este proceso en las tres tareas siguientes& rear una estructura del modelo de minería de datos de distribuci%n de correo directo /Tutorial básico de minería de datos1 Especificar el tipo de datos y el tipo de contenido /Tutorial básico de minería de datos1 Especificar un con$unto de datos de pruebas para la estructura /Tutorial básico de minería de datos1
rear una estructura del modelo de minería de datos de distribución de correo directo (!utorial básico de minería de datos) SQL Server 2014
Otras versiones
El primer paso para crear un escenario de correo directo /Targeted Mailing1 consiste en usar el Asistente para minería de datos de SQL Server 2ata Tools /SS2T1 con el fin de crear una estructura de minería de datos y un modelo de minería de datos de árbol de decisi%n. En esta tarea configurará una nueva estructura de minería de datos y agregará un modelo de minería de datos inicial basándose en el algoritmo de :rboles de decisi%n de Microsoft. 3ara crear la estructura! primero seleccionará las tablas y las vistas! y a continuaci%n identificará #u* columnas se usarán para el entrenamiento y cuáles para las pruebas. Para crear una estructura de minería de datos para un escenario de distribución de correo directo
6. En el E4plorador de soluciones! +aga clic con el bot%n secundario en Estructuras de minería de datos y seleccione )ueva estructura de minería de datos para iniciar el Asistente para minería de datos. 7. En la página de inicio del Asistente para minería de datos! +aga clic en Siguiente. 9. En la página Seleccionar el m*todo de definici%n! compruebe #ue la opci%n A partir de una base de datos relacional o del almacenamiento de datos se +a seleccionado y! a continuaci%n! +aga clic en Siguiente. ;. En la página rear la estructura de minería de datos! en JQu* t*cnica de minería de datos desea utiliarK! seleccione :rboles de decisi%n de Microsoft. Nota
Si aparece una advertencia de #ue no se puede encontrar ning'n algoritmo de minería de datos! puede #ue las propiedades del proyecto no est*n configuradas correctamente. Esta advertencia se produce cuando el proyecto intenta recuperar una lista de algoritmos de minería de datos del servidor de Analysis Services y no puede encontrarlo. 2e forma predeterminada! SQL Server 2ata Tools utiliará el +ost local como servidor. Si está utiliando una instancia diferente o una instancia con nombre! debe cambiar las propiedades del proyecto. 3ara obtener más informaci%n! vea rear un proyecto de Analysis Services /Tutorial básico de minería de datos1.
<. aga clic en Siguiente. =. En la página Seleccionar vista del origen de datos! en el panel Gistas del origen de datos disponibles! seleccione Targeted Mailing. 3uede +acer clic en E4plorar para ver las tablas de la vista del origen de datos y! a continuaci%n! +acer clic en errar para volver al asistente. D. aga clic en Siguiente. . En la página Especificar tipos de tablas! active la casilla de la columna aso! correspondiente a vTargetMail para usarla como tabla de casos y! a continuaci%n! +aga clic en Siguiente. @tiliará la tabla 3rospective(uyer posteriormente para pruebas olvídese de ella por a+ora. F. En la página Especificar los datos de aprendia$e! identificará al menos una columna de predicci%n! una columna de clave y una columna de entrada para el modelo. Active la casilla de la columna 2e predicci%n en la fila (i-e(uyer. Nota
Observe la advertencia en la parte inferior de la ventana. )o podrá navegar a la página siguiente +asta #ue seleccione una columna 2e predicci%n y Entrada! como mínimo. 6>. aga clic en Sugerir para abrir el cuadro de diálogo Sugerir columnas relacionadas. El bot%n Sugerir está +abilitado siempre #ue se +aya seleccionado al menos un atributo predecible. El cuadro de diálogo Sugerir columnas relacionadas enumera en una lista las columnas más relacionadas con la columna predecible y ordena los atributos por su correlaci%n con el atributo predecible. Las columnas con una correlaci%n significativa /con una confiana mayor del F<1 se seleccionan automáticamente para incluirse en el modelo. Nevise las sugerencias y! a continuaci%n! +aga clic en ancelar paraomitirlas. Nota
Si +ace clic en Aceptar! todas las sugerencias enumeradas se marcarán como columnas de entrada en el asistente. Si está de acuerdo con solamente algunas de las sugerencias! debe cambiar los valores manualmente. 66. ompruebe #ue la casilla de la columna ey está seleccionada en la fila ustomerey. Nota
Si la tabla de origen de la vista del origen de datos muestra una clave! el Asistente para minería de datos elegirá automáticamente esa columna como clave para el modelo.
67. Active las casillas de la columna Entrada en las filas siguientes. 3uede activar varias columnas resaltando un rango de celdas y presionando TNL mientras activa una casilla. o
Age
o
ommute2istance
o
Englis+Education
o
Englis+Occupation
o
8ender
o
8eograp+yey
o
ouseOCner5lag
o
MaritalStatus
o
)umberarsOCned
o
)umber+ildrenAtome
o
Negion
o
Total+ildren
o
Pearly?ncome
69. En la columna i#uierda de la página! active las casillas de las filas siguientes. o
AddressLine6
o
AddressLine7
o
2ate5irst3urc+ase
o
EmailAddress
o
5irst)ame
o
Last)ame
Aseg'rese de #ue estas filas solo tienen marcas en la columna i#uierda. Estas columnas se agregarán a la estructura! pero no se incluirán en el modelo. Sin embargo! una ve generado el modelo! estarán disponibles para la obtenci%n de
detalles y las pruebas. 3ara obtener más informaci%n acerca de la obtenci%n de detalles! vea onsultas de obtenci%n de detalles /minería de datos1. 6;. aga clic en Siguiente.
%speci&car el tipo de datos y el tipo de contenido (!utorial básico de minería de datos) SQL Server 2014
Otras versiones
A+ora #ue +a seleccionado #u* columnas utiliar para generar la estructura y entrenar los modelos! realice los cambios necesarios en los datos predeterminados y tipos de contenido #ue establece el asistente. 'evisar y modi&car el tipo de contenido y el tipo de datos de cada columna
6. En la página Especificar el contenido y el tipo de datos de las columnas! +aga clic en 2etectar para e$ecutar un algoritmo #ue determine los tipos de contenido y los datos predeterminados de cada columna. 7. Nevise las entradas de las columnas Tipo de contenido y Tipo de datos! y cámbielas si es necesario para asegurarse de #ue la configuraci%n es igual #ue la #ue se muestra en la tabla siguiente. )ormalmente! el asistente detectará n'meros y asignará un tipo de datos num*rico adecuado! pero +ay varias situaciones en las #ue podría desear tratar un n'mero como te4to. 3or e$emplo! 8eograp+yey se debería tratar como te4to! por#ue no sería apropiado realiar operaciones matemáticas en este identificador. "olumna
Tipo de contenido
Tipo de datos
Address Line6
2iscreto
Te4t
Address Line7
2iscreto
Te4t
Age
ontinuo
Long
(i-e (uyer
2iscreto
Long
ommute 2istance
2iscreto
Te4t
ustomerey
lave
Long
2ateLast3urc+ase
ontinuo
2ate
Email Address
2iscreto
Te4t
Englis+ Education
2iscreto
Te4t
Englis+ Occupation
2iscreto
Te4t
5irst)ame
2iscreto
Te4t
8ender
2iscreto
Te4t
8eograp+y ey
2iscreto
Te4t
ouse OCner 5lag
2iscreto
Te4t
Last )ame
2iscreto
Te4t
Marital Status
2iscreto
Te4t
)umber ars OCned
2iscreto
Long
)umber +ildren At ome
2iscreto
Long
Negion
2iscreto
Te4t
Total +ildren
2iscreto
Long
Pearly ?ncome
ontinuo
2ouble
9. aga clic en Siguiente.
%speci&car un con"unto de datos de pruebas para la estructura (!utorial básico de minería de datos) SQL Server 2014
Otras versiones
En las pantallas finales del Asistente para minería de datos dividirá los datos en un con$unto de pruebas y en un con$unto de entrenamiento. 2espu*s! asignará nombre a la estructura y +abilitará la obtenci%n de detalles en el modelo. %speci&car un con"unto de pruebas
Al separar los datos en con$untos de entrenamiento y de pruebas cuando se crea una estructura de minería de datos! es posible evaluar fácilmente la precisi%n de los modelos de minería de datos #ue se crean despu*s. 3ara obtener más informaci%n sobre los con$untos de pruebas! vea on$untos de datos de entrenamiento y de prueba. Para especi&car el con"unto de pruebas
6. En la página rear con$unto de pruebas! en 3orcenta$e de datos para pruebas! de$e el valor predeterminado 9>. 7. En )'mero má4imo de casos en el con$unto de datos de prueba! escriba 6>>>. 9. aga clic en Siguiente. %speci&car la obtención de detalles
La obtenci%n de detalles puede +abilitarse en los modelos y en las estructuras. La casilla de este cuadro de diálogo +abilita la obtenci%n de detalles en el modelo con nombre. @na ve procesado el modelo! podrá recuperar informaci%n detallada de los datos de entrenamiento usados para crear el modelo. Si la estructura de minería de datos subyacente tambi*n se +a configurado para permitir la obtenci%n de detalles! puede recuperar informaci%n detallada tanto de los casos de modelos como de la estructura! incluidas las columnas #ue no estaban incluidas en el modelo de minería de datos. 3ara obtener más informaci%n! vea onsultas de obtenci%n de detalles /minería de datos1. Para denominar el modelo y la estructura y especi&car la obtención de detalles
6. En la página 5inaliaci%n del asistente! en )ombre de la estructura de minería de datos! escriba Targeted Mailing. 7. En )ombre del modelo de minería de datos! escriba TM2ecisionTree. 9. Active la casilla 3ermitir obtenci%n de detalles. ;. Nevise el panel Gista previa. Observe #ue se muestran solo las columnas seleccionadas como lave! Entrada o 2e predicci%n. Las otras columnas #ue seleccion% /por e$emplo! AddressLine61 no se usan para generar el modelo! pero estarán disponibles en la estructura subyacente y se pueden consultar una ve procesado e implementado el modelo. <. aga clic en 5inaliar.
Lección : Agregar y procesar los modelos SQL Server 2014
Otras versiones
La estructura de minería de datos #ue cre% en la lecci%n anterior contiene un modelo de minería de datos individual #ue se basa en el algoritmo de árboles de decisi%n de Microsoft. 3uede usar este modelo para identificar clientes para la campa"a de envío de correo directo. Sin embargo! para asegurarse de #ue el análisis es detallado! se suelen crear modelos relacionados usando algoritmos diferentes y comparar sus resultados. 2e esta manera! puede obtener diferentes puntos de vista. 3or consiguiente! creará dos modelos adicionales y luego los procesará e implementará. En esta lecci%n! creará un con$unto de modelos de minería de datos #ue sugerirá los clientes #ue tienen una mayor probabilidad de serlo entre una lista de clientes potenciales. 3ara completar las tareas de esta lecci%n! utiliará el Algoritmo de cl'steres de Microsoft y el Algoritmo (ayes naive de Microsoft. Esta lecci%n contiene las tareas siguientes& Agregar modelos nuevos a la estructura de correo de destino /tutorial básico de minería de datos1 3rocesar los modelos de la estructura de distribuci%n de correo directo /Tutorial básico de minería de datos1
Agregar modelos nuevos a la estructura de correo de destino (tutorial básico de minería de datos) SQL Server 2014
Otras versiones
En esta tarea! definirá dos modelos adicionales mediante la pesta"a Modelos de minería de datos del 2ise"ador de minería de datos. 3ara crear los modelos! se usarán el algoritmo (ayes naive y el algoritmo de cl'steres de Microsoft. Estos dos algoritmos se +an seleccionado debido a su capacidad de predecir un valor discreto /por e$emplo! la compra de una bicicleta1. 3ara obtener más informaci%n sobre estos algoritmos! vea Algoritmo de cl'steres de Microsoft y Algoritmo (ayes naive de Microsoft. Para crear un modelo de minería de datos de agrupación en cl*steres
6. ambie a la pesta"a Modelos de minería de datos del 2ise"ador de minería de datos en SQL Server 2ata Tools /SS2T1.
Observe #ue el dise"ador muestra dos columnas& una para la estructura de minería de datos y otra para el modelo de minería de datos TM2ecisionTree! #ue cre% en la tarea anterior de esta lecci%n. 7. aga clic con el bot%n secundario en la columna Estructura y seleccione )uevo modelo de minería de datos. 9. En el cuadro de diálogo )uevo modelo de minería de datos! en )ombre del modelo! escriba TMlustering. ;. En )ombre del algoritmo! seleccione Agrupaci%n en cl'steres de Microsoft. <. aga clic en Aceptar. A+ora aparece el modelo nuevo en la pesta"a Modelos de minería de datos del 2ise"ador de minería de datos. Este modelo! integrado con el algoritmo de cl'steres de Microsoft! agrupa los clientes con características similares en cl'steres y predice la compra de una bicicleta en cada cl'ster. Aun#ue puede modificar el uso y las propiedades de la columna para el modelo nuevo! en este tutorial no es necesario +acer cambios en el modelo TMlustering. Para crear un modelo de minería de datos +ayes naive
6. En la pesta"a Modelos de minería de datos del 2ise"ador de minería de datos! +aga clic con el bot%n secundario enla columna Estructura y seleccione )uevo modelo de minería de datos. 7. En el cuadro de diálogo )uevo modelo de minería de datos! en )ombre del modelo! escriba TM)aive(ayes. 9. En )ombre del algoritmo! seleccione (ayes naive de Microsoft y +aga clic en Aceptar. Aparece un mensa$e #ue indica #ue el algoritmo (ayes naive de Microsoft no admite las columnas Age y Pearly ?ncome! #ue son continuas. ;. aga clic en Sí para confirmar el mensa$e y continuar. Aparece un modelo nuevo en la pesta"a Modelos de minería de datos del 2ise"ador de minería de datos. Aun#ue puede modificar el uso y las propiedades de las columnas para todos los modelos de la pesta"a! en este tutorial no es necesario +acer cambios en el modelo TM)aive(ayes.
Procesar los modelos de la estructura de distribución de correo directo (!utorial básico de minería de datos) SQL Server 2014
Otras versiones
3ara poder e4aminar o traba$ar con los modelos de minería de datos #ue +a creado! se debe implementar el proyecto de Analysis Services y procesar la estructura y los modelos de minería de datos. •
•
En la implementaci%n se envía el proyecto a un servidor y se crean en el servidor los ob$etos de ese proyecto. El procesamiento rellena ob$etos de Analysis Services con datos procedentes de orígenes de datos relacionales.
Los modelos no se pueden utiliar +asta #ue se +ayan implementado y procesado. Además! cuando se realia cual#uier cambio en el modelo! como agregar datos nuevos! se debe volver a implementar y procesar los modelos. Asegurarse de la co,erencia con -oldoutSeed
Al implementar un proyecto y procesar la estructura y los modelos! a las filas individuales de la estructura de datos se les asigna el con$unto de entrenamiento o el con$unto de pruebas seg'n un valor de inicialiaci%n num*rico. 2e forma predeterminada! el valor de inicialiaci%n num*rico se calcula en funci%n de los atributos de la estructura de datos. Sin embargo! si alguna ve cambia algunos aspectos del modelo! el valor de inicialiaci%n cambiaría! lo #ue produciría resultados ligeramente diferentes. 3or tanto! para asegurarse de #ue los resultados son los mismos #ue los descritos a#uí! asignaremos arbitrariamente un valor de inicialiaci%n de e4clusi%n fi$o de 67. El valor de inicialiaci%n de e4clusi%n se utilia para inicialiar el algoritmo de muestreo y garantia #ue los datos se reparten apro4imadamente de la misma manera para todas las estructuras de minería de datos y sus modelos. Este valor no afecta al n'mero de casos del con$unto de entrenamiento simplemente garantia #ue se usará el mismo m*todo de partici%n siempre #ue se genere el modelo. 3ara obtener más informaci%n sobre valor de inicialiaci%n de e4clusi%n! vea on$untos de datos de entrenamiento y de prueba. Para establecer el valor de iniciali.ación de e/clusión
6. aga clic en la pesta"a Estructura de minería de datos o Modelos de minería de datos en el 2ise"ador de minería de datos de SQL Server 2ata Tools /SS2T1. Estructura de minería de datos Targeted Mailing aparece en el panel 3ropiedades. 7. Aseg'rese de #ue el panel 3ropiedades está abierto presionando 5;. 9. Aseg'rese de #ue ac+eMode está establecido en eepTrainingases.
;. Escriba 67 en oldoutSeed. 0mplementar y procesar los modelos
En el 2ise"ador de minería de datos! puede decidir #u* ob$etos procesar! seg'n el ámbito de los cambios #ue +a realiado en el modelo o en los datos subyacentes& En esta tarea! puesto #ue los datos y los modelos son nuevos! procesará la estructura y todos los modelos al mismo tiempo. Para implementar el proyecto y procesar todos los modelos de minería de datos
6. En el men' Modelo de minería de datos ! seleccione 3rocesar estructura de minería de datos y todos los modelos. Si +a realiado cambios en la estructura! se le pedirá #ue genere e implemente el proyecto antes de procesar los modelos. aga clic en Sí. 7. En el cuadro de diálogo 3rocesando estructura de minería de datos& Targeted Mailing! +aga clic en E$ecutar. Se abre el cuadro de diálogo 3rogreso del proceso para mostrar los detalles del procesamiento del modelo. El procesamiento del modelo podría tardar alg'n tiempo! seg'n el e#uipo. 9. aga clic en errar en el cuadro de diálogo 3rogreso del proceso cuando el procesamiento de los modelos se +aya completado. ;. aga clic en errar en el cuadro de diálogo 3rocesando estructura de minería de datos 0 Restructura.