Capítulo 8: Administración de recursos de datos
Casos de estudio La EPA asea ase a su propio desorden desorden con una almacén de datos La Environmental Protection Agency (EPA, Agencia Agenci a de Protección Ambiental de Estados Unidos) Unid os) tiene la misión de d e monitorear y limpiar el entorno, supervisando más de 700,000 sitios que incluyen negocios locales. La misma EPA tenía un viejo desorden que necesitaba aseo. Este organismo consta de varias divisiones divisi ones dedicadas dedi cadas a hacer cumplir diversas partes de la legislación l egislación ecológica. Al paso de los años, la EPA había construido construido una serie de bases de datos en respuesta a leyes aprobadas por el Congreso. Se establecieron bases de datos individuales para apoyar cada ley contra la contaminación: la Ley del Aire Limpio; permisos para descargar aguas de desecho; la Ley de Autorización de Supe rfondo, rfondo, para limpiar tiraderos de desechos peligrosos; la clasificaci ón de más de 300 sustancias químicas químicas como tóxicas, que han sido o podrían ser liberadas en el entorno; la emisión de más de 450,000 permisos locales para actividades de limpieza peligrosas; el mantenimiento de expedientes sobre las más de 675,000 instalaciones reguladas regula das o monitoreadas por la EPA, y un índice de los datos da tos químicos químicos en las l as diversas bases de datos. da tos. Dichas bases de datos estaban tan aisladas aisla das unas de otras que usaban cinco sistemas de administración de bases de datos distintos, incluidos incluid os Oracle Oracle y DB2 de d e IBM. No era fácil obtener ob tener dichos datos. Sólo los usuarios usu arios registrados, que representaban representaban una pequeña fracción de los empleados emplead os de la EPA, EP A, tenían tenían acceso a ellos. ell os. Y los que tenían acceso a veces tenían problemas para entenderlos porque las di versas bases de datos se apoyaban en tecnologías diferentes. Si un ciudadano solicitaba información acerca de las fuentes de contaminació contaminación n en su comunidad, el personal de la EPA E PA tenía que producir informes de múltiples bases de datos para juntar ju ntar esa información. información. Los datos da tos a veces se presentaban en formas poco naturales, difíciles de entender. Por eje mplo, no había forma forma de localizar con precisión a los contaminadores, así que la EPA proporcionaba explicaciones y capacitación para p ara poder interpretar interpretar los datos numéricos y dar a los ciudadanos ciudada nos respuestas que pudieran pudi eran comprender. comprender. Muchos miles de personas, como como empleados de la EPA, E PA, trabajadores de la industria química, miembros miembros de organizaciones organizaci ones ecológicas ecol ógicas y residentes resid entes de áreas específicas, querían alguna parte p arte de la información información que estaba almacenada al macenada en esas bases de datos. Sin embargo, como como los datos d atos no estaban integrados, in tegrados, era era en extremo difícil acceder a ellos. el los. Quienes querían acceso (grupo que incluía inclu ía a la mayoría de los empleados de la l a EPA) EPA ) tenían tenían que llamar ll amar a un especialista en sistemas de información información de la l a EPA, que entonces tenía que recuperar los datos solicitados, lo cual era una operación muy lenta y costosa. Los directivos encontr encon traron aron una mejor forma, apoyándose en tecnología de información más avanzada que incluye Internet. Internet. El primer problema, problema, la necesidad necesi dad de integrar i ntegrar los datos, se resolvió con una base de datos llamada Envirofacts. Aunque siguen existiendo las bases de datos independientes, indepen dientes, se terminó terminó una base de datos integrada en un almacén de datos en 1995, la cual combina datos da tos de cinco de las bases de datos de la EP A. Pronto se añadirán más bases de datos. El almacén Envirofact Envi rofacts s puede mostrar mapas de los 700,000 sitios si tios que manejan sustancias potencialmente potencial mente peligrosas e identificar los contaminantes. Los datos datos almacenados en Envirofacts E nvirofacts se actuali actualizan zan automáticamente automáticamente cada mes a partir de las cinco bases de datos aisladas. aislada s. Los empleados empleados de la l a EPA obtienen ob tienen acceso a través de una
interfase propia llamada Gateway. Con la ayuda de Gateway y Envirofacts, los empleados de la EPA pueden acceder rápidamente a casi todos los datos que necesitan. La interfase Gateway se instaló en muchas de las 24,000 PC de escritorio de la E PA, y el acceso a Envirofacts se hace a través de una red. Quienes no son empleados también pueden acceder a los datos directamente a través de una línea de marcado telefónico. El nuevo sistema no sólo permitió a muchas personas obtener rápidamente los datos que necesitaban, sino que también redujo considerablemente la carga de trabajo del personal de sistemas de información de la EPA, dejándolo libre para realizar un trabajo más productivo que la simple recuperación de datos. No obstante, persistían problemas. El apoyo para Gateway, instalado en miles de máquinas, ocupaba mucho tiempo del personal de sistemas de información. Además, para quienes no eran empleados de la EPA, el acceso a través de una línea de marcado telefónico era lento, difícil y costoso. Por ello, los directivos recurrieron a Internet para ofrecer acceso a todo el mundo. Internet tiene varias ventajas. Primera, no se necesita una interfase especial, como Gateway. Lo único que se necesita es un navegador de Web que mucha gente usa para todo su acceso a Internet. Además, el público ya no necesita obtener acceso a través de una línea de marcado telefónico de la EPA, pues utiliza sus propios proveedores de servicio de Internet. Los empleados de la EPA también obtienen acceso por esta vía. En algún momento, la EPA va a descontinuar el uso de Gateway, pero ello se hará lentamente para que los empleados que prefieren acceder por esa vía puedan seguir haciéndol o. Tarde o temprano, Gateway se retirará totalmente y el acceso será exclusivamente por Internet. Envirofacts emplea un servidor Alpha de Digital Equipment Corporation (DEC) basado en UNIX, para la plataforma de almacén de datos, y una macrocomputadora IBM ES/9000, empleando herramientas de software de cuarta generación, como Natural, Focus y Reporting Facility de Platinum Technology, para extraer los datos de las diversas bases de datos antiguas de la EPA. Un servidor de Web Oracle 7.3 proporciona acceso basado en Web a la base de datos. Se usa un servidor Netscape Enterprise como anfitrión de los sitios Web de la EPA y de Envirofacts. He aquí algunos ejemplos de cómo se está usando Envirofacts: Un abogado ecológico puede acceder a Envirofacts para seguir la pista a sus clientes y posibles clientes. Por ejemplo, él podría buscar una planta que produce objetos de metal y averiguar qué tipos de disolventes usa y los problemas de cumplimiento con las normas que enfrenta. Un reportero puede usar Envirofacts para investigar un artículo acerca del nivel de emisiones carcinogénicas en su comunidad. El personal de la EPA de diversas divisiones puede compartir datos más fácilmente. En los años noventa, la EPA comenzó a adoptar una perspectiva más holística de la contaminación en áreas geográficas, lo que requirió integrar datos de diversas fuentes. La agencia ahora rastrea la contaminación de todas las fuentes que afectan a una región específica. Por ejemplo, los especialistas en agua podrían usar un navegador de Web para analizar la forma en que un tiradero municipal contribuye a la contaminación de un río cercano. Antes, los especialistas tenían que obtener informes en papel de la macrocomputadora, lo cual podía tardar días. El proyecto de almacén de datos Envirofacts costó cerca de $24 millones en un periodo de cinco años. El sistema recibe más de 300,000 visitas al mes y atiende 500 solicitudes de mapas a la semana. Al proporcionar una interfase común para sistemas de bases de datos que antes no estaban conectados, Envirofacts ha ahorrado costos internos, ha mejorado la productividad y ha ayudado a servir al público. Al ofrecer a los ciudadanos formas de obtener datos de la EPA por su cuenta, la dependencia ha reducido en casi 20% el número
de solicitudes que su personal debe atender bajo la Ley de Libertad de Información. De este modo se ahorran más de $9 millones en costos de mano de obra al año. Se ahorran otros $30 a $40 millones al año al contar con una arquitectura de bajo costo para vincular sistemas dispares. Sin embargo, las cifras no bastan para explicar el pleno valor de Envirofacts. La EPA también piensa que la mayor conciencia pública engendrará más esfuerzos por eliminar la contaminación. Además de añadir más bases de datos a Envirofacts, la EPA ha lanzado otro proyecto para mejorar el acceso a los datos que la gente necesita. La agencia estará añadiendo a su sitio Web vínculos directos a otras dependencias del gobierno y universidades, que proporcionan datos ecológicos al público. De ese modo, tanto la EPA como otras organizaciones de todo tipo tendrán acceso fácil y rápido a los datos que necesitan para ayudar a li mpiar y proteger el entorno. PREGUNTAS DEL CASO DE ESTUDIO
1. ¿Qué problemas enfrentaba la EPA? ¿Qué factores de administración, organización y tecnología fueron causantes de estos problemas? 2. Evalúe el almacén de datos Envirofacts como solución a estos problemas. 3. ¿Qué problemas de administración, organización y tecnología fueron necesarios resolver para construir el almacén de datos Envorifacts? 4. ¿Hasta qué grado es la construcción de un almacén de datos una decisión técnica, y hasta qué grado es una decisión de negocios? Explique.
PHLIP was originally conceived and developed for Prentice Hall with the expertise of Dan W. Cooper of Active Le arning Techno logies, Inc. and Scott R. Lyman.
© 2000 by Prentice-Hall, Inc. A Pe arson Company Distance Le arning at Prentice Hall Legal Notice