Temario 2 Técnicos Axiliares de Informática de La Admnistración

RE/C2/DG/9-51

A CREA TI

V

FO

AD

M

ID

E

AL NT

ET

AU

TOR

RESP A

EL

DERECHO

D

E

Será perseguida de acuerdo con la legislación vigente la reproducción total o parcial de esta obra por cualquier medio, existente o de próxima invención, incluido el tratamiento informático, transformación, plagio, distribución, fotocopia o comunicación de cualquier forma, ya sea por métodos electrónicos, mecánicos o por registro, sin el permiso previo y por escrito de los editores y titulares del ©. No está permitida cualquier otra forma de cesión de uso del ejemplar.

CONSEJO DE REDACCIÓN

MAQUETACIÓN E ILUSTRACIÓN DE CUBIERTA

José Manuel Aragón Rodríguez Javier Hernando Muñoz

Ana Mª Muñoz Estebaranz Verónica Seoane López

Victor Martín Tapias de Miguel Magalí Riera Roca

Ignacio Velasco Marugán

© Centro de Estudios Adams www.adams.es ISBN: 978-84-9084-428-1 Depósito legal: M-28723-2015 Imprime: Centro de Estudios Adams Ediciones Valbuena, S.A. Impreso en España. Printed in Spain

Diríjase a CEDRO (Centro Español de Derechos Reprográficos, wwww.cedro.org) si necesita fotocopiar, escanear o hacer copias digitales de algún fragmento de esta obra.

Anagrama «LUCHA CONTRA LA PIRATERIA» propiedad de Unión Internacional de Escritores.

PRESENTACIÓN

Con la edición del presente volumen queremos facilitar al opositor poder presentarse a las pruebas selectivas para ingresar en el Cuerpo de Técnicos Auxiliares de Informática de la Administración General del Estado. Esta edición se ha realizado combinando los programas de la última convocatoria del turno libre (2008) y los de la promoción interna de los últimos años. En este Temario 2 encontrará los temas del Bloque III (Desarrollo de Sistemas) y del Bloque IV (Sistemas y Comunicaciones). En la elaboración de los temas hemos pretendido facilitar al opositor no sólo la comprensión de los conceptos básicos y los más más complejos, sino también su memorización. Para conseguir tal objetivo, cada tema presenta la siguiente estructura: —

Títulos o epígrafes que lo integran.

—

Referencias legislativas, al comienzo de cada tema, que deberán tenerse en cuenta para su estudio.

—

Guión-resumen, que proporciona una visión escueta del contenido del tema, a través de la enumeración de todos sus apartados.

—

Exposición del tema, en el que se desarrolla y analiza el contenido del programa.

—

Gráficos-diagramas, esquemas, etc., que intentan resumir y exponer de forma ordenada las partes de cada tema a las que deberá prestar mayor atención.

Le recordamos que puede adquirir, junto con este temario, el Temario 1 y los volúmenes de Cuestionarios y Supuestos Prácticos, que completan la colección. En nuestra página, www.adams.es, podrá estar al día de todo en cuanto a información sobre oposiciones, productos y servicios relacionados se refiere, y a través de [email protected] le ofrecemos la posibilidad de dirigirnos cualquier consulta o sugerencia. Además, puede usted acudir a la página web del Ministerio de Hacienda y Administraciones Públicas (www.minhap.es) para conocer los cambios legislativos, de procesos selectivos o de otro orden que se produzcan. Esperando haber cumplido el objetivo propuesto, expresamos al opositor nuestros mejores deseos de éxito en la tarea emprendida.

ADAMS

5

CONTENIDO III. Desarrollo de Sistemas Tema 1.

Modelo conceptual de datos. Entidades, atributos y relaciones. Reglas de modelizacion. Diagramas de flujo de datos. Reglas de construcción. Descomposición en niveles. Flujogramas.

Tema 2.

Diseño de bases de datos. Diseño lógico y físico. El modelo lógico relacional. Normalización.

Tema 3.

Lenguajes de programación. Representación de tipos de datos. Operadores. Instrucciones condicionales. Bucles y recursividad. Procedimientos, funciones y parámetros. Vectores y registros. Estructura de un programa.

Tema 4.

Lenguajes de interrogación de bases de datos. Estándar ANSI SQL.

Tema 5.

Diseño y programación orientada a objetos. Elementos y componentes software: objetos, clases, herencia, métodos, sobrecarga. Ventajas e inconvenientes. Patrones de diseño y lenguaje de modelado unificado (UML).

Tema 6.

Lenguajes de programación. Características, elementos y funciones en entornos Java, C, y C++ y .Net.

Tema 7.

Arquitectura cliente/servidor. Modelo de 2 capas. Modelo de 3 capas. Componentes y operación. Arquitecturas de servicios web (WS).

Tema 8.

Aplicaciones Web. Tecnologías de programación. JavaScript, applets, servlets y servicios web. Lenguajes de descripción de datos: HTML, XML y sus derivaciones. Navegadores y lenguajes de programacion web. Lenguajes de script.

Tema 9.

Accesibilidad, diseño universal y usabilidad. Acceso y usabilidad de las tecnologias, productos y servicios relacionados con la sociedad de la información. Confidencialidad y disponibilidad de la información en puestos de usuario final.

Tema 10.

Herramientas CASE: características. Repositorios: estructura y actualización. Generación de código y documentación. Programas para control de versiones.

IV. Sistemas y comunicaciones Tema 1.

Administración del Sistema operativo y software de base. Funciones y responsabilidades. Control de cambios de los programas de una instalación.

Tema 2.

Administración de bases de datos. Funciones y responsabilidades. Administración de servidores de correo electrónico. Protocolos de Correo electrónico.

Tema 3.

Administracion de redes de área local. Gestión de usuarios. Gestión de dispositivos. Monitorización y control de tráfico.

7

Tema 4.

Conceptos de seguridad de los sistemas de información. Seguridad física. Seguridad lógica. Amenazas y vulnerabilidades. Infraestructura física de un CPD: acondicionamiento y equipamiento. Sistemas de gestión de incidencias. Control remoto de puestos de usuario.

Tema 5.

Comunicaciones. Medios de transmisión. Modos de comunicación. Equipos terminales y equipos de interconexión y conmutación.

Tema 6.

Redes de Comunicaciones. Redes de Conmutación y Redes de Difusión. Comunicaciones móviles y redes inalámbricas.

Tema 7.

El modelo de referencia de interconexión de sistemas abiertos (OSI) de ISO. Protocolos TCP/IP.

Tema 8.

Internet: arquitectura de red. Origen, evolución y estado actual. Servicios: correo electrónico, WWW, FTP, Telnet y otros. Protocolos HTTP, HTTPS y SSL/TLS.

Tema 9.

Seguridad y protección en redes de comunicaciones. Sistemas de cortafuegos. Redes Privadas Virtuales (VPN). Seguridad en el puesto del usuario.

Tema 10.

Redes locales. Tipología. Métodos de acceso. Dispositivos de interconexión.

8

III. Desarrollo de Sistemas

Tema 1 Modelo conceptual de datos. Entidades, atributos y relaciones. Reglas de modelización. Diagramas de flujo de datos. Reglas de construcción. Descomposición en niveles. Flujogramas.

Desarrollo de Sistemas

Guión-resumen

1. Modelo conceptual de datos 2. Entidades, atributos y relaciones 2.1. Concepto de entidad 2.2. Concepto de relación 2.3. Concepto de atributo 3. Análisis entidad/relación (reglas de modelización) 4. Diagramas de flujo de datos: reglas de construcción 4.1. Organigramas 4.2. Ordinogramas 4.3. Pseudocódigo 4.4. Paso de pseudocódigo a diagrama de flujo y viceversa

1-2

5. Descomposición en niveles. Flujogramas 5.1. Diagramas de Flujo de Datos (DFD) 5.2. Modelos de datos 5.3. Diagramas de datos (DED) 6. Conclusiones

Modelo conceptual de datos

1.


Un Modelo de datos es una representación gráfica orientada a la obtención de las estructuras de datos de una forma metódica y a la vez sencilla. El modelo se suele representar con el modelo Entidad/Relación de Chen. Este modelo percibe el mundo real como una serie e objetos que se relaciona entre sí y pretende representarlos gráficamente mediante un mecanismo de abstracción basado en símbolos, reglas y métodos El diseño conseguido no es el nexo de unión entre el mundo del usuario (nivel externo) y el mundo del ordenador (nivel interno). Sólo es una representación de las propiedades lógicas de los datos y por tanto, dicha información no es accesible directamente por el SGBD. Es un método de representación abstracta del mundo real y por lo tanto no es directamente traducible a una SGBD, sino que necesita una traducción al modelo relacional de dicho SGBD. En esta etapa se debe construir un esquema de la información que se usa en la empresa, independientemente de cualquier consideración física. A este esquema se le denomina esquema conceptual. Al construir el esquema, los diseñadores descubren la semántica (significado) de los datos de la empresa: encuentran entidades, atributos y relaciones. El objetivo es comprender: —

La perspectiva que cada usuario tiene de los datos.

—

La naturaleza de los datos, independientemente de su representación física.

—

El uso de los datos a través de las áreas de aplicación.

El esquema conceptual se puede utilizar para que el diseñador transmita a la empresa lo que ha entendido sobre la información que ésta maneja. Para ello, ambas partes deben estar familiarizadas con la notación utilizada en el esquema. La más popular es la notación del modelo entidad-relación, que se describirá en el capítulo dedicado al diseño conceptual. El esquema conceptual se construye utilizando la información que se encuentra en la especificación de los requisitos de usuario. El diseño conceptual es completamente independiente de los aspectos de implementación, como puede ser el SGBD que se vaya a usar, los programas de aplicación, los lenguajes de programación, el hardware disponible o cualquier otra consideración física. Durante todo el proceso de desarrollo del esquema conceptual éste se prueba y se valida con los requisitos de los usuarios. El esquema conceptual es una fuente de información para el diseño lógico de la base de datos.

2.

Entidades, atributos y relaciones

El Modelo Entidad/Relación tiene sus estructura propias que son conocidas con el nombre de Diagramas Entidad/ Relación Los elementos que componen dicho Modelo son las entidades, los atributos y las relaciones.

2.1.

Concepto de entidad

Cualquier tipo de objeto (físico) o concepto del cual se pueda extraer información. Las entidades se representan mediante rectángulos. Por ejemplo un bote de bebida es un objeto del que emana gran cantidad de información: 1-3


la marca, el sabor, la capacidad, los ingredientes, la caducidad, etc. A este paso se le denomina abstracción; después, toda esta información hay que organizarla; ¿cómo?, en tablas, por ejemplo. Una entidad sólo aparece una vez en el modelo conceptual. Se denomina ocurrencia de entidad a la implementación concreta de una entidad.

2.2.

Concepto de relación

Es la asociación entre dos o más entidades. Se representan gráficamente entre rombos con el nombre dentro. Al número de participantes se le llama grado de la relación (binaria, ternaria, etc).

2.3.

Concepto de atributo

Es una característica de interés de la entidad, por ejemplo la marca, la capacidad o el sabor. Cada atributo tiene un conjunto de valores asociados que se les denomina dominio y se encarga de definir todos los valores posibles que puede tomar un atributo. Los atributos pueden ser simples o compuestos. Se dice que un atributo es simple cuando éste sólo tiene un componente, por lo cual no se puede dividir en partes más pequeñas. El atributo es compuesto cuando éste consta de componentes que a su vez se pueden dividir en partes más pequeñas. Se representa con una elipse. En función de sus características respecto a la Entidad se distinguen dos tipos de atributos: Atributo descriptor. Caracteriza una ocurrencia pero no la distingue del resto. Se representa por una elipse o círculo sin relleno. La clave primaria o identificador. Conjunto de atributos pertenecientes a la misma entidad y que hacen único el acceso a cada ocurrencia de la entidad. Se representa mediante un círculo relleno. Es posible pensar en la existencia de varias claves sobre la misma entidad. Al conjunto de todas ellas se las denomina Claves Candidatas. Sólo una de ellas conformará la Clave Primaria. Por el hecho de estar formada por un solo atributo o varios se llamará clave simple o múltiple (compuesta).

personas

nombre apellidos dirección tfno localidad…

1-4

compran

es una tabla de relación donde se guardan el código de las personas y el código de la casa

casas

precio m2 exterior zona descripción


3.

Análisis entidad/relación (reglas de modelización)

Es el modelo más utilizado para el diseño conceptual de bases de datos. El análisis entidad-relación (E/R) abstrae las tablas en forma de objetos y enlaza dichos objetos mediante punteros de relación de la misma forma que enlazaríamos objetos si estuvieran en la memoria de nuestro PC. Veamos un ejemplo: nos plantean un problema que consiste en crear una base de datos para llevar el control de una gestoría de inmuebles. Necesitaremos como mínimo dos entidades, una donde quede plasmada la información de las personas (clientes) y otra donde quede plasmada la información de las viviendas (casas). En un principio son dos entidades diferentes pero si se pretende acceder a la información para visualizar las casas vendidas y sus compradores, no queda más remedio que relacionarlas. Una acción que vincula a las personas con las viviendas es, por ejemplo, que éstas son compradas por parte de las anteriores. El análisis entidad/relación quedaría así: Ahora lo abstraemos a sus respectivas tablas: casas

personas idpersona

nombre

direcc

Tfno

idpersona

decripción

1

Juan

C/Pez nº 20

917885522

1

Chalet

2

María

C/Córdoba nº 60 913225577

2

Piso

3

Pedro

Avda Jucal nº 12 917184051

3

Caserón

Idpersona

Idcasa

1

1

2

1

3

2

3

3

metros

Zona

250 La Moraleja 90 Pinar Chamartín 300 El clavín

tabla de referencia (ventas)

Juan y María comparten chalé. Pedro ha comprado el caserón y el piso. Ahora vamos a añadir otra entidad.

personas

compran

casas

coches

1-5


A) Identificador único Los identificadores de casa y persona están duplicados. Esto puede generar problemas cuando queramos expresar relaciones con la tabla de coches. Para solucionar esto necesitamos dos cosas: 1.

Identificador único: nunca debe de haber dos identificadores iguales para objetos (instancias) del mismo o diferente tipo.

2.

Que en el identificador vaya implícita la información sobre el tipo de objeto: los identificadores de personas empiezan por 1000, los de casas por 2000 y los de coches por 3000. personas

idpersona

casas

nombre

direcc

Tfno

idpersona

decripción

1001

Juan

C/Pez nº 20

917885522

2001

Chalet

1002

María

C/Córdoba nº 60 913225577

2002

Piso

1003

Pedro

Avda Jucal nº 12 917184051

2003

Caserón

Idpersona

Id objeto

1001

2001

1002

2001

tabla de referencias (ventas)

metros

Zona

250 La Moraleja 90 Pinar Chamartín

idcoche

300 El clavín

marca

modelo

3001

Bmw

850

Mercedes

400

Audi

A3

1003

2002

3002

1003

2003

3003

1001

3003

1002

3003

1003

3001

1003

3002

coches

De este modo podemos tener tablas (tipos) que almacenan diferentes objetos (instancias) de diferente tipo. B) Relaciones recursivas La relación recursiva es la que relaciona objetos consigo mismo. Un claro ejemplo es el de una empresa que tiene varios departamentos y éstos, a su vez, tienen subdepartamentos. empresa finanzas contabilidad

producción facturación

el análisis entidad/relación quedaría así:

empresa

1-6

departamentos


En este caso no hay una tabla de relación, pues una empresa puede tener varios departamentos, pero un departamento no tiene varias empresas. C) Simbología de cardinalidad La cardinalidad es la proporción de relaciones entre objetos. relación forzosa 1 a 1 relación de 1 a muchos (n) relación de 0 ó 1 a 1 relación de 0 ó 1 a muchos relación de 0 ó 1 a 0 o muchos

Una empresa puede tener varios departamentos (1 a n). Un departamento puede tener o no varios subdepartamentos (1 ó 0 a n) y así con el resto de las combinaciones. No todos los analistas y programadores utilizan la misma simbología, aunque ésta es la más utilizada. El modelo entidad/relación ha dado origen al modelo relacional, que es el de mayor aceptación en la actualidad. D) Metodología de diseño conceptual Como hemos comentado anteriormente, es el primer paso para crear la base de datos. Este esquema se construye mediante la información que nos da el usuario, examinando programas, formularios e informes ya existentes que se utilizan en la empresa y siguiendo el flujo de información con la que trabajan esos usuarios. A estas visiones de la información se las llama vistas. Puede haber varias vistas recogidas de varios usuarios, por ejemplo de distintos departamentos, por lo cual se suelen crear varios esquemas conceptuales, llamados locales. Cada uno de estos esquemas se compone de entidades, relaciones, atributos, dominios de atributos e identificadores. Los pasos que se deben seguir para la creación de estos esquemas son: 1.

Identificar las entidades: se buscan objetos existentes, como los empleados, clientes, proveedores, etc.

2.

Identificar las relaciones: una vez identificadas las entidades se debe buscar la forma de relacionarlas y qué tipo de cardinalidad surge. 1-7


4.

3.

Identificar los atributos y asociarlos a entidades y relaciones: se buscan nombres para plasmar la información, por ejemplo idempleado, nombre, apellidos o mejor apellido1 y apellido2, dirección, etc. La mejor técnica para encontrar los atributos es hacerse la pregunta “si necesito visualizar... ¿qué atributo necesito?” Así, por ejemplo, si queremos un listado de las empleadas, necesitaremos un atributo, por ejemplo, mujer. Si necesito un listado de los empleados más veteranos, necesitaremos un atributo fecha_incorporación, etc. De cada atributo se debe ir anotando el nombre que se le asignará, el tamaño, el tipo de dato que albergará, si se permiten valores nulos, etc.

4.

Determinar los dominios de los atributos: valores que puede tomar ese atributo, su tamaño, formato y tipos de operaciones que se pueden realizar sobre ellos.

5.

Determinar los identificadores: cada entidad por lo menos ha de tener un identificador o clave. A las entidades que no tienen identificador se las denomina débiles.

6.

Determinar las jerarquías de generalización (si las hay): en este paso se deben analizar las entidades existentes, pues pueden dar origen a otras entidades o subentidades.

7.

Dibujar el diagrama entidad-relación: cuando tengamos identificados los conceptos anteriores se procede a dibujar la estructura de las base de datos mediante un diagrama.

8.

Revisar el esquema conceptual local con el usuario: presentarle el esquema al usuario (o cliente) para revisarlo y comentar los posibles cambios.

Diagramas de flujo de datos: reglas de construcción

Para el diseño de algoritmos se utilizan técnicas de representación. Una de estas técnicas son los denominados diagramas de flujo, que se definen como la representación gráfica que, mediante el uso de símbolos estándar conectados o unidos mediante líneas de flujo, muestran la secuencia lógica de las operaciones o acciones que debe realizar un ordenador, así como la corriente o flujo de datos en la resolución de un programa. Los diseños deben de ser normalizados para facilitar el intercambio de documentación entre el personal informático (analistas y programadores). Para ello existen normas en las que basarse, dictadas por distintas organizaciones, como la ISO (International Standard Organization), ANSI (American National Standard Institute), etc. Los diagramas de flujo se pueden clasificar en dos grandes grupos: a)

Organigramas.

b)

Ordinogramas.

Una de las principales diferencias entre ambos, es que pertenecen a distintas fases o etapas de la resolución de un programa. Mientras que los organigramas corresponden a la fase de análisis, los ordinogramas corresponden a la fase de diseño. 1-8


4.1.

Organigramas

También denominados diagramas de flujo de sistemas o diagramas de flujo de configuración. Son representaciones gráficas del flujo de datos e información entre los periféricos o soportes físicos (de entrada/salida) que maneja un programa. Todo organigrama debe reflejar: a)

Las distintas áreas o programas en los que se divide la solución del problema, así como el nombre de cada uno de ellos.

b)

Las entradas y salidas de cada área, indicando los soportes que serán utilizados para el almacenamiento tanto de los datos pendientes de elaborar o procesar como de los resultados obtenidos.

c)

El flujo de los datos.

Todo ello debe proporcionar: —

Una visión global de la solución del problema.

—

Una fácil realización de futuras correcciones.

—

Un control de todas las posibles soluciones

Los organigramas deben respetar las siguientes reglas de representación: —

En la parte central del diseño debe figurar el símbolo de proceso.

—

En la parte superior del diseño, y siempre por encima del símbolo de proceso, deben figurar los soportes de entrada.

—

En la parte inferior del diseño, y siempre por debajo del símbolo de proceso, deben figurar los soportes de salida.

—

A izquierda y derecha del diseño y, por tanto, a ambos lados del símbolo de proceso, figurarán los soportes que son tanto de entrada como de salida.

La simbología que se utiliza es la siguiente: A) Símbolos de soporte de información SÍMBOLO

DENOMINACIÓN

TIPO

DE DISPOSITIVO

Teclado

Entrada

Soporte magnético

Entrada

1-9


SÍMBOLO

DENOMINACIÓN

TIPO

DE DISPOSITIVO

Pantalla/crt

Salida

Impresora

Salida

Tarjeta perforada

Entrada/Salida

Cinta de papel

Entrada/Salida

Disco magnético

Entrada/Salida

Disco magnético

Entrada/Salida

Cinta magnética

Entrada/Salida

Cinta magnética

Entrada/Salida

Disco flexible

Entrada/Salida

Tambor magnético

Entrada/Salida

B) Símbolos de proceso SÍMBOLO

FUNCIÓN Proceso u operación. Clasificación u ordenación de datos en un fichero. Fusión o mezcla de dos o más ficheros en uno solo. Partición o extracción de datos de un fichero. Manipulación de uno o varios ficheros (intercalación).

1-10


C) Líneas de flujo de datos SÍMBOLO

FUNCIÓN Dirección del proceso o flujo de datos. Líneas de teleproceso (transmisión de datos). Línea conectora. Permite la unión entre unidades o elementos de información.

4.2.

Ordinogramas

También denominados diagramas de flujo de programas. Son representaciones gráficas que muestran la secuencia lógica y detallada de las operaciones que se van a realizar en la ejecución de un programa. Se puede decir que los diseños resultantes, por estética, deben guardar cierto equilibrio y simetría, facilitando así, en la medida en la que sea posible, su entendimiento y comprensión, procurando limitar al máximo el uso de comentarios aclaratorios. El diseño de todo ordinograma debe reflejar: a)

Un principio o inicio que marca el comienzo de ejecución del programa y que viene determinado por la palabra “INICIO”.

b)

La secuencia de operaciones, lo más detallada posible y siguiendo siempre el orden en el que se deberán ejecutar (de arriba-abajo y de izquierda-derecha).

c)

Un fin que marca la finalización de ejecución del programa y que viene determinado por la palabra “FIN”.

Las reglas que hay que seguir para la confección de un ordinograma son las siguientes: a)

Todos los símbolos utilizados en el diseño deben estar conectados por medio de líneas de conexión o líneas de flujo de datos.

b)

Queda terminantemente prohibido el cruce de líneas de conexión, pues ello indica que el ordinograma no está correctamente diseñado.

c)

A un símbolo de proceso pueden llegarle varias líneas de conexión o flujo, pero de él sólo puede salir una.

d)

A un símbolo de decisión pueden llegarle varias líneas de conexión o flujo de datos, pero de él sólo puede salir una línea de cada una de las dos posibilidades existentes (verdadero o falso). 1-11


e)

A un símbolo de inicio de proceso no llega ninguna línea de conexión o flujo y de él sólo puede partir una línea de conexión.

f)

A un símbolo de final de proceso o ejecución de programa pueden llegar muchas líneas de conexión pero de él no puede partir ninguna.

La simbología utilizada es la siguiente: A) Símbolos de operación o proceso SÍMBOLO

FUNCIÓN Terminal (marca el inicio, final o una parada necesaria realizada en la ejecución del programa). Operación de E/S en general (utilizada para mostrar la introducción de datos desde un periférico a la memoria del ordenador y la salida de resultados desde la memoria del ordenador a un periférico). Proceso u operación en general (utilizado para mostrar cualquier tipo de operación durante el proceso de elaboración de los datos depositados en la memoria). Subprograma o subrutina (utilizado para realizar una llamada a un subprograma o proceso, es decir, un módulo independiente cuyo objetivo es realizar una tarea y devolver el control de ejecución del programa al módulo principal).

B) Símbolos de decisión SÍMBOLO

FUNCIÓN Decisión de dos salidas (indica operaciones lógicas o comparativas seleccionando en función del resultado entre dos caminos alternativos que se pueden seguir). Decisión múltiple con “n” salidas (indica el camino que se puede seguir entre varias posibilidades según el resultado de la operación lógica o comparación establecida). Bucle definido, empleado para modificar una instrucción del bloque de instrucciones que a su vez producen una alteración o modificación en el comportamiento del programa.

1-12


C) Líneas de flujo SÍMBOLO

FUNCIÓN Flechas indicadoras de la dirección del flujo de datos. Línea conectora, también llamada línea de flujo de datos (permite la conexión entre los diferentes símbolos utilizados en el diseño).

D) Símbolos de conexión SÍMBOLO

FUNCIÓN Conector (este símbolo es utilizado para el reagrupamiento de líneas de flujo).

Nº

Nº

Conector de líneas de flujo en la misma página (utilizado para enlazar dos partes cualesquiera del diseño a través de un conector de salida y un conector de entrada). Conector de líneas de flujo en distintas páginas (utilizado para enlazar dos partes cualesquiera del diseño a través de un conector de salida y un conector de entrada).

E) Símbolos de comentarios SÍMBOLO

FUNCIÓN Permite escribir comentarios a lo largo del diseño realizado.

4.3. Pseudocódigo Para evitar el exceso de espacio de los métodos anteriores, y hacer una primera visión del desarrollo de un programa, nació el pseudocódigo, que consiste en una técnica para expresar mediante lenguaje natural (sujetas a unas determinadas normas) el lógico desarrollo de un programa, es decir, su flujo de control. Cuentan con la ventaja de poder ser desarrollados con mayor facilidad y en poco tiempo, y luego sirven de soporte a la programación real al ser utilizados como base para la codificación del algoritmo en el lenguaje de programación que más nos interese. 1-13


El pseudocódigo ha de ser considerado como una herramienta para el diseño de programas y no como una notación para la descripción de los mismos. Gracias a su flexibilidad permite obtener la solución de un problema mediante aproximaciones sucesivas, es decir, mediante el denominado diseño descendente. Todo pseudocódigo debe permitir la descripción de: •

Las instrucciones de Entrada/Salida.

•

Las Instrucciones de proceso.

•

Las sentencias de control de flujo de ejecución.

•

Acciones compuestas que hay que refinar posteriormente.

•

Cualquier proceso relacionado con los datos: —

Describir datos.

—

Definir tipos de datos.

—

Definir y usar constantes y variables.

—

Archivos.

—

Objetos.

4.3.1. Acciones simples También denominadas instrucciones primitivas, son aquellas que el procesador ejecuta de forma inmediata: •

Asignación

variable_valor

•

Entrada

leer variable

•

Salida

escribir expresión

4.3.2. Sentencias de control También denominadas sentencias estructuradas, son aquellas que controlan el flujo de ejecución de otras instrucciones. •

Secuencial. Se ejecutan en el mismo orden en el que aparecen escritas. Leer nota suma=suma+nota media=suma/5 escribir media

1-14


•

Alternativa —

Simple Si condicion entonces Acción1 Acción2 finsi

—

Doble Si condicion entonces Acción1 Acción2 Sino Acción3 Acción4 finsi

—

Múltiple Según sea expresión V1 hacer a1;a2 V2 hacer a3;a4 ….. otro hacer a5;a6 Fin según

•

Repetitiva —

Mientras Mientras condición hacer Acción1 Acción2 finMientras

1-15


—

Repetir Repetir Acción1 Acción2 Hasta que condición

—

Para

Para contador de min a max con incremento in hacer Acción1 Acción2 FinPara

4.3.3. Acciones compuestas Es una acción que ha de ser realizada dentro del algoritmo, pero que aún no está resuelta en términos de acciones simples y sentencias de control. Se denominan subprogramas.

4.3.4

Comentarios

Son líneas aclarativas cuyo fin es el de aclarar la comprensión del programa. Estas líneas son ignoradas a la hora de ejecutar el programa. Se escribirán en cualquier línea a partir de un símbolo que los identifique, como por ejemplo **. ** Comentario aclarativo de cualquier aspecto del programa

4.3.5. Datos del programa La finalidad primordial de un programa es la de realizar cálculos con una serie de datos. La información, ya sea de entrada o generada como salida, debe guardarse en algún lugar. Es necesario saber previamente cuál será su cantidad, sus nombres y sus tipos con lo que podré limitar el conjunto de operaciones que se podrán realizar con ellos a lo largo del programa. Este conjunto de datos se denomina entorno. 1-16


Entorno: I es numérica entera Euros es numérica real Apellidos es alfanumérica

4.3.6. Programa Es la solución final de un problema. Consiste en la unión del entorno y del algoritmo precedido cada uno de una etiqueta. Programa Nombre_Programa Entorno: ** Descripción de los datos … Algoritmo: ** Descripción de las acciones … FinPrograma

Idéntico para los programas

SubPrograma Nombre_Programa Entorno: ** Descripción de los datos … Algoritmo: ** Descripción de las acciones … FinSubPrograma

1-17


4.4.

Paso de pseudocódigo a diagrama de flujo y viceversa • PSEUDOCÓDIGO

Variable=Expresión

ORDINOGRAMA

Variable_Expresi–n

Leer Variable

Escribir Expresión

Acción 1

Acción 2

Acción 3

Acci–n1

Acci–n2

Acci–n3

Sin condición entonces Acción 1 Acción 2 Finsi Acciones

1-18


Sin condición entonces Acción 1 Acción 2 Condición

Sino Acción 3

Acciones

Acciones

Acción 4 Finsi

Según sea expresión V1 hacer a1;a2 V1 hacer a3;a4 … Acciones

Acciones

Acciones

otro hacer a5;a6 Fin según

Mientras condición hacer Acción1 Acción2 FinMientras Acciones

1-19


Repetir Acción1

Acciones

Acción2 Hasta que condición

C_inicio

Para C de inicio a fin con incremento inc hacer

fin

Acción1 Acción2

Acciones

FinPara C_C+Inc

Acción compuesta

**Comentario

1-20

Nombre

Comentario


Programa NombrePrograma

Inicio

Entorno **Datos

Acciones

Algoritmo Acción1 Acción2

..... Acciones

… FinPrograma

5.

Fin

Descomposición en niveles. Flujogramas

5.1.

Diagramas de Flujo de Datos (DFD)

Se utilizan fundamentalmente en la fase de Análisis para la elaboración del modelo lógico de procesos. En un DFD se representa, definiendo los límites del sistema en estudio, el movimiento o flujo de la información a través del sistema, los procesos que transforman dicha información, y los almacenamientos intermedios que son necesarios; todo ello desde un punto de vista puramente lógico, sin tener en cuenta ni representar ninguna restricción o aspecto físico ni ningún tipo de secuencia u orden de ejecución. Los DFD se utilizan para representar los sucesivos niveles de descomposición realizados durante el análisis del sistema, comenzando con una descripción muy general del sistema denominada de nivel 0 (DFD-0) a partir de la cual se producen sucesivos diagramas con niveles de detalle cada vez mayor (DFD-1, DFD-2, etc). Así, en un DFD-0, también conocido como diagrama de contexto, figura un único proceso que representa al sistema completo y las entidades externas que interaccionan con él; en el DFD-1 se representan los subsistemas; en los DFD-2 (uno por subsistema) las funciones de cada subsistema, en el DFD-3 las subfunciones asociadas a los eventos del sistema; y, finalmente, en el DFD4, último nivel al que normalmente llegará la descomposición, los procesos necesarios para el tratamiento de cada subfunción. Los componentes que aparecen en un DFD son: —

Las Entidades Externas (simbolizadas mediante rectángulos o elipses e identificadas por su nombre) que representan otros sistemas, organizaciones o personas externas al sistema pero que interaccionan con él recibiendo o aportando información. Las entidades externas proporcionan la conexión del sistema con el mundo exterior.

—

Los Procesos (rectángulos que encierran la identificación del proceso) que representan las actividades que suponen transformación o

1-21


manipulación de datos. Un proceso no puede ser ni fuente ni sumidero de datos, por lo que un proceso siempre tendrá al menos un flujo de datos de entrada y al menos uno de salida. —

Los Almacenes de Datos (dos líneas paralelas con una identificación) que representan depósitos de información dentro del sistema, ya sean permanentes por afectar a información que el sistema debe guardar, o transitorios, por ser información que se utiliza en un proceso diferente del que la produce con el que no está sincronizado (recuérdese que no se tienen en cuenta restricciones físicas). Siempre deberá existir un proceso entre una entidad externa y un almacén de datos. Los almacenes de datos sirven de enlace del DFD con el modelo lógico de datos: cada almacén principal de un DFD representa un conjunto completo de entidades del modelo de datos (una o varias entidades), y cada entidad del modelo de datos pertenece a un único almacén principal de un DFD; esto facilitará las validaciones cruzadas entre los dos diagramas.

—

Los Flujos de Datos (flechas con la identificación de la información que transportan), que representan la comunicación entre procesos, almacenes y entidades externas. Los flujos de datos portan información, no son activadores de procesos.

5.2.

Modelos de datos

Los modelos de datos se usan en diferentes fases del desarrollo. Nos referiremos aquí al modelo conceptual de datos, descripción de alto nivel utilizada en la fase de Planificación de Sistemas, para la que se recomienda utilizar la técnica del modelo entidad relación, y al modelo lógico de datos elaborado en la fase de análisis de sistemas, para la que se recomienda la técnica del diagrama de estructura de datos (DED). En ambos casos se trata de representaciones del nivel lógico de los datos, válidas para describir las necesidades de información mediante estructuras no redundantes, sin inconsistencias, seguras e íntegras, y desprovistas de todo tipo de condicionantes, como pudieran ser los impuestos por los procesos que deba sufrir, o de tipo físico, como almacenamientos, etc. Será en la fase de diseño del sistema cuando el modelo lógico de datos servirá de base para especificar las estructuras de datos físicas (esquema interno) que deben implantarse para el almacenamiento de datos, normalmente sobre un SGBDR (Sistema Gestor de Bases de Datos Relacional) y las visiones específicas de los datos (esquema externo) precisadas por los diferentes componentes o programas del sistema. Las dos técnicas son muy similares en cuanto a los elementos que las constituyen, por lo que su descripción se centrará en la del modelo entidad-relación, señalándose seguidamente las diferencias para el diagrama de estructura de datos. En un modelo entidad-relación (MER) aparecen los elementos siguientes: •

1-22

Las Entidades, simbolizadas con cajas rectangulares e identificadas por un nombre, que representan objetos o conceptos del mundo acerca de los cuales el sistema precisa manejar información. Dicha


información se modeliza como atributos de dichas entidades. Por ejemplo, un sistema de gestión de pedidos representará la entidad CLIENTE con, entre otros atributos, el nombre del cliente, la dirección, teléfono, etc.; la entidad PEDIDO, con atributos número de pedido, estado del mismo; la entidad PRODUCTO, serie, precio, etc. •

5.3.

Las Relaciones entre entidades, simbolizadas por rombos sobre las líneas que enlazan las entidades relacionadas e identificadas por un nombre, que representan las interrelaciones existentes entre entidades. Las relaciones se caracterizan por su cardinalidad (1:1, 1:N ó N:M), según sean una o varias las ocurrencias de las entidades de cada lado que participan en las instancias de la relación (así un pedido puede consistir de varios [M] productos y cualquier producto puede figurar en pedidos diferentes [N]). Las relaciones pueden ser obligatorias (cuando exigen al menos una ocurrencia de cada una de las entidades que participan), opcionales (cuando la ocurrencia de la entidad opcional no es necesaria) o exclusiva (cuando la ocurrencia de una de las relaciones de la entidad implica que no tiene lugar la ocurrencia de otras posibles relaciones con otras entidades).

Diagramas de datos (DED) Las diferencias fundamentales en el diagrama de estructura de datos son:

6.

•

En el DED sólo se admiten relaciones de cardinalidad 1:N. Las relaciones 1:1 dan lugar a una única entidad. Las relaciones N:M se representan definiendo una entidad adicional sin correspondencia con un objeto real que sirve de enlace con las dos entidades originales mediante relaciones (1:N) y (1:M) respectivamente.

•

Las relaciones son de tipo binario, esto es, sólo entre dos entidades, mientras que en el modelo entidad relación pueden existir relaciones entre más de dos entidades, razón por la cual su riqueza descriptiva es mayor y se prefiere este modelo para representar modelos del nivel conceptual.

Conclusiones

En línea con lo expresado en los apartados anteriores, y con objeto de dotar a las diferentes Unidades de Tecnología de la Información de la Administración de un entorno que facilite la construcción de sus sistemas de información siguiendo prácticas metodológicas, el Consejo Superior de Informática y para el impulso de la Administración Electrónica, en el desarrollo de su línea estratégica de mejora de la calidad y productividad en el desarrollo de software, promovió la elaboración de una metodología para el desarrollo de sistemas de información para su uso en proyectos informáticos de las Administraciones Públicas. Fruto de ello es la metodología MÉTRICA, actualmente en su versión 3, conocida como MÉTRICA 3. La metodología esta constituida por fases. Cada una de esta fases, a su vez, se estructura en módulos de contenido homogéneo para los que se des-

1-23


criben las actividades y tareas a realizar, así como los productos a obtener y una recomendación sobre la posible o posibles técnicas a utilizar en cada punto. La identificación de los productos a obtener en cada momento facilita la introducción de hitos en el proyecto de desarrollo, elemento imprescindible para la planificación y el seguimiento y control de la ejecución del proyecto. Por otro lado, estos productos permiten enlazar con las actividades de garantía de calidad previstas en el Plan General de Garantía de Calidad que se describen más adelante en este tema. Aún siendo altamente formal en su planteamiento, MÉTRICA 3 es una metodología que pretende tener un carácter flexible en su adaptación a una amplia variedad de proyectos de desarrollo de sistemas de información, debiéndose en cada caso, en función de las características específicas de cada proyecto, adoptar el modelo de ciclo de vida que es más apropiado para efectuar el desarrollo y, a partir de esta elección, decidir qué actividades han de efectuarse, qué productos obtenerse, etc, con qué énfasis y en qué secuencia. La utilización de herramientas CASE que soporten, de una manera completa, las técnicas propuestas en la metodología, permitirá optimizar considerablemente el esfuerzo de desarrollo. En la siguiente web puedes consultar: http://administracionelectronica.gob.es/pae_Home/pae_Documentacion/ pae_Metodolog/pae_Metrica_v3#.VaTZ9vvhdM4.

1-24

Tema 2 Diseño de bases de datos. Diseño lógico y físico. El modelo lógico relacional. Normalización.


Guión-resumen

1. Diseño de bases de datos 1.1. Diseño conceptual de bases de datos

4. Normalización 5. Integridad de la base de datos 5.1. Integridad del dominio

2. Diseño lógico y físico

5.2. Integridad de entidad

2.1. Diseño lógico 2.2. Diseño físico 3. El modelo lógico relacional 3.1. Introducción 3.2. Metodología de diseño lógico en el modelo relacional

2-2

5.3. Integridad referencial 6

El Modelo físico Relacional 6.1. Introducción 6.2. Metodología de diseño físico para bases de datos relacionales

Diseño de bases de datos

1.


1.1.

Diseño conceptual de bases de datos

Es una etapa bastante compleja sobre todo para el diseñador de la base de datos. En esta etapa se tiene que construir un esquema de la información que utiliza la empresa, independientemente de cualquier consideración física (esquema conceptual). El diseñador debe comprender muy bien los datos que utiliza la empresa para de ahí poder obtener las tablas, las relaciones, los tipos de campos, etc. El objetivo es comprender: —

La naturaleza de los datos.

—

La perspectiva que cada usuario tiene de los datos.

—

El uso de los datos a través de las áreas de aplicación.

Este es un período de mucha conversación entre el diseñador y la empresa; el objetivo es que las dos partes entiendan la notación utilizada en el esquema. La más popular es la notación del modelo entidad/relación. El esquema conceptual se construye utilizando la información que se encuentra en la especificación de los requisitos de usuario. Este diseño es completamente independiente de los aspectos de implementación, como puede ser el SGBD que se vaya a usar, los programas de aplicación, los lenguajes de programación, el hardware disponible o cualquier otra consideración física. Durante todo el proceso de desarrollo de este esquema se deben de realizar pruebas y validarlas con los requisitos de los usuarios. El esquema conceptual es una fuente de información para el posterior diseño lógico de la base de datos.

2-3

2-4

ENTRE NIVELES

INDEPENDENCIA

MODELOS

Es una descripción de la implementación en memoria secundaria. FÍSICO *Obterner tablas. *Estructuras de datos. *Restricciones. *Modelos de seguridad.

Es una fuente de info para el físico.

LÓGICO Normalizar en una técnica que el módelo lógico relacional utiliza para evitar las redundancias.

Construir un esquema de la información siguiendo un módelo lógico independiene del SGBD.

INTERNO

CONCEPTUAL

EXTERNO

ANSI/SPARK

MODELO RELACIONAL

Cada elemento del modelo LÓGICO ha de convertirse en un objeto del modelo FÍSICO. Ha de describir cómo se implementa la BBDO en Memoria Secundaria (LDD). CREATE TABLE CREATE INDEX

Especifica CÓMO y DÓNDE van a guardarse los datos.

Que ha de convertirse en un Modelo Lógico de Datos (Relacional), en el que especificamos QUÉ ha de guardarse.

Crear una vición conceptual/abstracta.

MODELO ENTIDAD/RELACIÓN

Reflejar la estructura y las relaciones existentes entre los datos que queremos guardar. Aislar el nivel externo del interno. Se ha de crear el esquema conceptual que ha de: Identificar las estructuras de datos. Identificar las relaciones. Identificar las restricciones. Los pasos que habitualmente se dan son utilizar dos modelos y usar uno para crear el otro.

Guardar vista la de la información de los usuarios y/o aplicaciones. Aislar al usuario de los datos reales dentro del sistema. Aumentar la seguridad de los datos.



2. 2.1.

Diseño lógico y físico Diseño lógico

El diseño lógico es el proceso de construir un esquema de la información que utiliza la empresa, basándose en un modelo de base de datos específico, independiente del SGBD concreto que se vaya a utilizar y de cualquier otra consideración física. En esta etapa, se transforma el esquema conceptual en un esquema lógico que utilizará las estructuras de datos del modelo de base de datos en el que se basa el SGBD que se vaya a utilizar, como puede ser el modelo relacional, el modelo de red, el modelo jerárquico o el modelo orientado a objetos. Conforme se va desarrollando el esquema lógico, éste se va probando y validando con los requisitos de usuario. La normalización es una técnica que se utiliza para comprobar la validez de los esquemas lógicos basados en el modelo relacional, ya que asegura que las relaciones (tablas) obtenidas no tienen datos redundantes. Esta técnica se presenta en el capítulo dedicado al diseño lógico de bases de datos. El esquema lógico es una fuente de información para el diseño físico. Además, juega un papel importante durante la etapa de mantenimiento del sistema, ya que permite que los futuros cambios que se realicen sobre los programas de aplicación o sobre los datos, se representen correctamente en la base de datos. Tanto el diseño conceptual, como el diseño lógico, son procesos iterativos, tienen un punto de inicio y se van refinando continuamente. Ambos se deben ver como un proceso de aprendizaje en el que el diseñador va comprendiendo el funcionamiento de la empresa y el significado de los datos que maneja. El diseño conceptual y el diseño lógico son etapas clave para conseguir un sistema que funcione correctamente. Si el esquema no es una representación fiel de la empresa, será difícil, sino imposible, definir todas las vistas de usuario (esquemas externos), o mantener la integridad de la base de datos. También puede ser difícil definir la implementación física o el mantener unas prestaciones aceptables del sistema. Además, hay que tener en cuenta que la capacidad de ajustarse a futuros cambios es un sello que identifica a los buenos diseños de bases de datos. Por todo esto, es fundamental dedicar el tiempo y las energías necesarias para producir el mejor esquema que sea posible

2.2.

Diseño físico

Proceso que produce la descripción de la implementación de la base de datos en memoria secundaria: estructura de almacenamiento y métodos de acceso a los datos. Antes de empezar esta etapa se tiene que tener ya decidido el SGBD a utilizar, pues el esquema físico se adapta a él. En definitiva, el esquema físico es la implementación del esquema lógico. La mayoría de las veces se suele modificar el esquema físico para mejorar la base de datos (al fin y al cabo, es el momento cumbre) con lo cual el esquema lógico también suele sufrir modificaciones. Concretamente el diseño físico en el modelo relacional consiste en: 2-5


3.

—

Obtener un conjunto de relaciones (tablas) y las restricciones que se deben cumplir sobre ellas.

—

Determinar las estructuras de almacenamiento y los métodos de acceso que se van a utilizar para conseguir unas prestaciones óptimas.

—

Diseñar el modelo de seguridad del sistema.

El modelo lógico relacional

A continuación se describen los pasos para llevar a cabo el diseño lógico. Ya que aquí se trata el diseño de bases de datos relacionales, en esta etapa se obtiene un conjunto de relaciones (tablas) que representen los datos de interés. Este conjunto de relaciones se valida mediante la normalización.

3.1.

Introducción

El objetivo del diseño lógico es convertir los esquemas conceptuales locales en un esquema lógico global que se ajuste al modelo de SGBD sobre el que se vaya a implementar el sistema. Mientras que el objetivo fundamental del diseño conceptual es la comprensión y expresividad de los esquemas conceptuales locales, el objetivo del diseño lógico es obtener una representación que use, del modo más eficiente posible, los recursos que el modelo de SGBD posee para estructurar los datos y para modelar las restricciones. Los modelos de bases de datos más extendidos son el modelo relacional, el modelo de red y el modelo jerárquico. El modelo orientado a objetos es también muy popular, pero no existe un modelo estándar orientado a objetos. El modelo relacional (y los modelos previos) carecen de ciertos rasgos de abstracción que se usan en los modelos conceptuales. Por lo tanto, un primer paso en la fase del diseño lógico consistirá en la conversión de esos mecanismos de representación de alto nivel en términos de las estructuras de bajo nivel disponibles en el modelo relacional.

3.2.

Metodología de diseño lógico en el modelo relacional

La metodología que se va a seguir para el diseño lógico en el modelo relacional consta de dos fases, cada una de ellas compuesta por varios pasos que se detallan a continuación: 1.

2-6

Construir y validar los esquemas lógicos locales para cada vista de usuario. •

Convertir los esquemas conceptuales locales en esquemas lógicos locales.

•

Derivar un conjunto de relaciones (tablas) para cada esquema lógico local.

•

Validar cada esquema mediante la normalización.

•

Validar cada esquema frente a las transacciones del usuario.


2.

•

Dibujar el diagrama entidad-relación.

•

Definir las restricciones de integridad.

•

Revisar cada esquema lógico local con el usuario correspondiente.

Construir y validar el esquema lógico global. •

Mezclar los esquemas lógicos locales en un esquema lógico global.

•

Validar el esquema lógico global.

•

Estudiar el crecimiento futuro.

•

Dibujar el diagrama entidad-relación final.

•

Revisar el esquema lógico global con los usuarios.

En la primera fase, se construyen los esquemas lógicos locales para cada vista de usuario y se validan. En esta fase se refinan los esquemas conceptuales creados durante el diseño conceptual, eliminando las estructuras de datos que no se pueden implementar de manera directa sobre el modelo que soporta el SGBD, en el caso que nos ocupa, el modelo relacional. Una vez hecho esto, se obtiene un primer esquema lógico que se valida mediante la normalización y frente a las transacciones que el sistema debe llevar a cabo, tal y como se refleja en las especificaciones de requisitos de usuario. El esquema lógico ya validado se puede utilizar como base para el desarrollo de prototipos. Una vez finalizada esta fase, se dispone de un esquema lógico para cada vista de usuario que es correcto, comprensible y sin ambigüedad.

3.2.1. Convertir los esquemas conceptuales locales en esquemas lógicos locales En este paso, se eliminan de cada esquema conceptual las estructuras de datos que los sistemas relacionales no modelan directamente: a)

Eliminar las relaciones de muchos a muchos, sustituyendo cada una de ellas por una nueva entidad intermedia y dos relaciones de uno a muchos de esta nueva entidad con las entidades originales. La nueva entidad será débil, ya que sus ocurrencias dependen de la existencia de ocurrencias en las entidades originales.

b)

Eliminar las relaciones entre tres o más entidades, sustituyendo cada una de ellas por una nueva entidad (débil) intermedia que se relaciona con cada una de las entidades originales. La cardinalidad de estas nuevas relaciones binarias dependerá de su significado.

c)

Eliminar las relaciones recursivas, sustituyendo cada una de ellas por una nueva entidad (débil) y dos relaciones binarias de esta nueva entidad con la entidad original. La cardinalidad de estas relaciones dependerá de su significado. 2-7


d)

Eliminar las relaciones con atributos, sustituyendo cada una de ellas por una nueva entidad (débil) y las relaciones binarias correspondientes de esta nueva entidad con las entidades originales. La cardinalidad de estas relaciones dependerá del tipo de la relación original y de su significado.

e)

Eliminar los atributos multievaluados, sustituyendo cada uno de ellos por una nueva entidad (débil) y una relación binaria de uno a muchos con la entidad original.

f)

Revisar las relaciones de uno a uno, ya que es posible que se hayan identificado dos entidades que representen el mismo objeto (sinónimos). Si así fuera, ambas entidades deben integrarse en una sola.

g)

Eliminar las relaciones redundantes. Una relación es redundante cuando se puede obtener la misma información que ella aporta mediante otras relaciones. El hecho de que haya dos caminos diferentes entre dos entidades no implica que uno de los caminos corresponda a una relación redundante, eso dependerá del significado de cada relación.

Una vez finalizado este paso, es más correcto referirse a los esquemas conceptuales locales refinados como esquemas lógicos locales, ya que se adaptan al modelo de base de datos que soporta el SGBD escogido.

3.2.2. Derivar un conjunto de relaciones (tablas) para cada esquema lógico local En este paso, se obtiene un conjunto de relaciones (tablas) para cada uno de los esquemas lógicos locales en donde se representen las entidades y relaciones entre entidades, que se describen en cada una de las vistas que los usuarios tienen de la empresa. Cada relación de la base de datos tendrá un nombre, y el nombre de sus atributos aparecerá, a continuación, entre paréntesis. El atributo o atributos que forman la clave primaria se subrayan. Las claves ajenas, mecanismo que se utiliza para representar las relaciones entre entidades en el modelo relacional, se especifican aparte indicando la relación (tabla) a la que hacen referencia. A continuación, se describe cómo las relaciones (tablas) del modelo relacional representan las entidades y relaciones que pueden aparecer en los esquemas lógicos. a)

Entidades fuertes. Crear una relación para cada entidad fuerte que incluya todos sus atributos simples. De los atributos compuestos incluir sólo sus componentes. Cada uno de los identificadores de la entidad será una clave candidata. De entre las claves candidatas hay que escoger la clave primaria; el resto serán claves alternativas. Para escoger la clave primaria entre las claves candidatas se pueden seguir estas indicaciones: •

2-8

Escoger la clave candidata que tenga menos atributos.


•

Escoger la clave candidata cuyos valores no tengan probabilidad de cambiar en el futuro.

•

Escoger la clave candidata cuyos valores no tengan probabilidad de perder la unicidad en el futuro.

•

Escoger la clave candidata con el mínimo número de caracteres (si es de tipo texto).

•

Escoger la clave candidata más fácil de utilizar desde el punto de vista de los usuarios.

b)

Entidades débiles. Crear una relación para cada entidad débil incluyendo todos sus atributos simples. De los atributos compuestos incluir sólo sus componentes. Añadir una clave ajena a la entidad de la que depende. Para ello, se incluye la clave primaria de la relación que representa a la entidad padre en la nueva relación creada para la entidad débil. A continuación, determinar la clave primaria de la nueva relación.

c)

Relaciones binarias de uno a uno. Para cada relación binaria se incluyen los atributos de la clave primaria de la entidad padre en la relación (tabla) que representa a la entidad hijo, para actuar como una clave ajena. La entidad hijo es la que participa de forma total (obligatoria) en la relación, mientras que la entidad padre es la que participa de forma parcial (opcional). Si las dos entidades participan de forma total o parcial en la relación, la elección de padre e hijo es arbitraria. Además, en caso de que ambas entidades participen de forma total en la relación, se tiene la opción de integrar las dos entidades en una sola relación (tabla). Esto se suele hacer si una de las entidades no participa en ninguna otra relación.

d)

Relaciones binarias de uno a muchos. Como en las relaciones de uno a uno, se incluyen los atributos de la clave primaria de la entidad padre en la relación (tabla) que representa a la entidad hijo, para actuar como una clave ajena. Pero ahora, la entidad padre es la de “la parte del muchos” (cada padre tiene muchos hijos), mientras que la entidad hijo es la de “la parte del uno” (cada hijo tiene un solo padre).

Una vez obtenidas las relaciones con sus atributos, claves primarias y claves ajenas, sólo queda actualizar el diccionario de datos con los nuevos atributos que se hayan identificado en este paso.

3.2.3. Validar cada esquema mediante la normalización La normalización se utiliza para mejorar el esquema lógico, de modo que satisfaga ciertas restricciones que eviten la duplicidad de datos. La normalización garantiza que el esquema resultante se encuentra más próximo al modelo de la empresa, que es consistente y que tiene la mínima redundancia y la máxima estabilidad. 2-9


La normalización es un proceso que permite decidir a qué entidad pertenece cada atributo. Uno de los conceptos básicos del modelo relacional es que los atributos se agrupan en relaciones (tablas) porque están relacionados a nivel lógico. En la mayoría de las ocasiones, una base de datos normalizada no proporciona la máxima eficiencia, sin embargo, el objetivo ahora es conseguir una base de datos normalizada por las siguientes razones: —

Un esquema normalizado organiza los datos de acuerdo a sus dependencias funcionales, es decir, de acuerdo a sus relaciones lógicas.

—

El esquema lógico no tiene por qué ser el esquema final. Debe representar lo que el diseñador entiende sobre la naturaleza y el significado de los datos de la empresa. Si se establecen unos objetivos en cuanto a prestaciones, el diseño físico cambiará el esquema lógico de modo adecuado. Una posibilidad es que algunas relaciones normalizadas se desnormalicen. Pero la desnormalización no implica que se haya malgastado tiempo normalizando, ya que mediante este proceso el diseñador aprende más sobre el significado de los datos. De hecho, la normalización obliga a entender completamente cada uno de los atributos que se han de representar en la base de datos.

—

Un esquema normalizado es robusto y carece de redundancias, por lo que está libre de ciertas anomalías que éstas pueden provocar cuando se actualiza la base de datos.

—

Los equipos informáticos de hoy en día son mucho más potentes, por lo que en ocasiones es más razonable implementar bases de datos fáciles de manejar (las normalizadas), a costa de un tiempo adicional de proceso.

—

La normalización produce bases de datos con esquemas flexibles que pueden extenderse con facilidad.

El objetivo de este paso es obtener un conjunto de relaciones que se encuentren en la forma normal de Boyce-Codd. Para ello, hay que pasar por la primera, segunda y tercera formas normales. El proceso de normalización se describe en el apartado 7.3.

3.2.4. Validar cada esquema frente a las transacciones del usuario El objetivo de este paso es validar cada esquema lógico local para garantizar que puede soportar las transacciones requeridas por los correspondientes usuarios. Estas transacciones se encontrarán en las especificaciones de requisitos de usuario. Lo que se debe hacer es tratar de realizar las transacciones de forma manual utilizando el diagrama entidad-relación, el diccionario de datos y las conexiones que establecen las claves ajenas de las relaciones (tablas). Si todas las transacciones se pueden realizar, el esquema queda validado. Pero si alguna transacción no se puede realizar, seguramente será porque alguna entidad, relación o atributo no se ha incluido en el esquema.

2-10


3.2.5. Dibujar el diagrama entidad-relación En este momento, se puede dibujar el diagrama entidad-relación final para cada vista de usuario que recoja la representación lógica de los datos desde su punto de vista. Este diagrama habrá sido validado mediante la normalización y frente a las transacciones de los usuarios.

3.2.6. Definir las restricciones de integridad Las restricciones de integridad son reglas que se quieren imponer para proteger la base de datos, de modo que no pueda llegar a un estado inconsistente. Hay cinco tipos de restricciones de integridad. a)

Datos requeridos. Algunos atributos deben contener valores en todo momento, es decir, no admiten nulos.

b)

Restricciones de dominios. Todos los atributos tienen un dominio asociado, que es el conjunto los valores que cada atributo puede tomar.

c)

Integridad de entidades. El identificador de una entidad no puede ser nulo, por lo tanto, las claves primarias de las relaciones (tablas) no admiten nulos.

d)

Integridad referencial. Una clave ajena enlaza cada tupla de la relación hijo con la tupla de la relación padre que tiene el mismo valor en su clave primaria. La integridad referencial dice que si una clave ajena tiene un valor (si es no nula), ese valor debe ser uno de los valores de la clave primaria a la que referencia. Hay varios aspectos a tener en cuenta sobre las claves ajenas para lograr que se cumpla la integridad referencial. 1.

¿Admite nulos la clave ajena? Cada clave ajena expresa una relación. Si la participación de la entidad hijo en la relación es total, entonces la clave ajena no admite nulos; si es parcial, la clave ajena debe aceptar nulos.

2.

¿Qué hacer cuando se quiere borrar una ocurrencia de la entidad padre que tiene algún hijo? O lo que es lo mismo, ¿qué hacer cuando se quiere borrar una tupla que está siendo referenciada por otra tupla a través de una clave ajena? Hay varias respuestas posibles: •

Restringir: no se pueden borrar tuplas que están siendo referenciadas por otras tuplas.

•

Propagar: se borra la tupla deseada y se propaga el borrado a todas las tuplas que le hacen referencia.

•

Anular: se borra la tupla deseada y todas las referencias que tenía se ponen, automáticamente, a nulo (esta respuesta sólo es válida si la clave ajena acepta nulos).

2-11


3.

e)

•

Valor por defecto: se borra la tupla deseada y todas las referencias toman, automáticamente, el valor por defecto (esta respuesta sólo es válida si se ha especificado un valor por defecto para la clave ajena).

•

No comprobar: se borra la tupla deseada y no se hace nada para garantizar que se sigue cumpliendo la integridad referencial.

¿Qué hacer cuando se quiere modificar la clave primaria de una tupla que está siendo referenciada por otra tupla a través de una clave ajena? Las respuestas posibles son las mismas que en el caso anterior. Cuando se escoge propagar, se actualiza la clave primaria en la tupla deseada y se propaga el cambio a los valores de clave ajena que le hacían referencia.

Reglas de negocio. Cualquier operación que se realice sobre los datos debe cumplir las restricciones que impone el funcionamiento de la empresa.

Todas las restricciones de integridad establecidas en este paso se deben reflejar en el diccionario de datos para que puedan ser tenidas en cuenta durante la fase del diseño físico.

3.2.7. Revisar cada esquema lógico local con el usuario correspondiente Para garantizar que cada esquema lógico local es una fiel representación de la vista del usuario lo que se debe hacer es comprobar con él que lo reflejado en el esquema y en la documentación es correcto y está completo. • Relación entre el esquema lógico y los diagramas de flujo de datos El esquema lógico refleja la estructura de los datos a almacenar que maneja la empresa. Un diagrama de flujo de datos muestra cómo se mueven los datos en la empresa y los almacenes en donde se guardan. Si se han utilizado diagramas de flujo de datos para modelar las especificaciones de requisitos de usuario, se pueden utilizar para comprobar la consistencia y completitud del esquema lógico desarrollado. Para ello: —

Cada almacén de datos debe corresponder con una o varias entidades completas.

—

Los atributos en los flujos de datos deben corresponder a alguna entidad.

Los esquemas lógicos locales obtenidos hasta este momento se integrarán en un solo esquema lógico global en la siguiente fase para modelar los datos de toda la empresa.

3.2.8. Mezclar los esquemas lógicos locales en un esquema lógico global En este paso, se deben integrar todos los esquemas locales en un solo esquema global. En un sistema pequeño, con dos o tres vistas de usuario y unas pocas entidades y relaciones, es relativamente sencillo comparar los 2-12


esquemas locales, mezclarlos y resolver cualquier tipo de diferencia que pueda existir. Pero en los sistemas grandes, se debe seguir un proceso más sistemático para llevar a cabo este paso con éxito: 1.

Revisar los nombres de las entidades y sus claves primarias.

2.

Revisar los nombres de las relaciones.

3.

Mezclar las entidades de las vistas locales.

4.

Incluir (sin mezclar) las entidades que pertenecen a una sola vista de usuario.

5.

Mezclar las relaciones de las vistas locales.

6.

Incluir (sin mezclar) las relaciones que pertenecen a una sola vista de usuario.

7.

Comprobar que no se ha omitido ninguna entidad ni relación.

8.

Comprobar las claves ajenas.

9.

Comprobar las restricciones de integridad.

10. Dibujar el esquema lógico global. 11. Actualizar la documentación.

3.2.9. Validar el esquema lógico global Este proceso de validación se realiza, de nuevo, mediante la normalización y mediante la prueba frente a las transacciones de los usuarios. Pero ahora sólo hay que normalizar las relaciones que hayan cambiado al mezclar los esquemas lógicos locales y sólo hay que probar las transacciones que requieran acceso a áreas que hayan sufrido algún cambio.

3.2.10. Estudiar el crecimiento futuro En este paso, se trata de comprobar que el esquema obtenido puede acomodar los futuros cambios en los requisitos con un impacto mínimo. Si el esquema lógico se puede extender fácilmente, cualquiera de los cambios previstos se podrá incorporar al mismo con un efecto mínimo sobre los usuarios existentes.

3.2.11. Dibujar el diagrama entidad-relación final Una vez validado el esquema lógico global, ya se puede dibujar el diagrama entidadrelación que representa el modelo de los datos de la empresa que son de interés. La documentación que describe este modelo (incluyendo el esquema relacional y el diccionario de datos) se debe actualizar y completar.

2-13


3.2.12. Revisar el esquema lógico global con los usuarios Una vez más, se debe revisar con los usuarios el esquema global y la documentación obtenida para asegurarse de que son una fiel representación de la empresa.

4.

Normalización

Este proceso tiene como objetivo comprobar que las tablas que forman la base de datos cumplen unas determinadas condiciones. La principal condición es evitar la redundancia (se entiende por redundancia la repetición de los datos albergados en la BD) y una cierta coherencia en la configuración mediante un esquema relacional de las entidades y relaciones del modelo conceptual (diagrama E-R). Gracias a la normalización se pueden evitar errores de diseño y anomalías en la actualización y borrado en las tablas de la base de datos, facilitando la gestión del administrador de la misma y de los desarrolladores de aplicaciones. Esquema relacional: conjunto de tablas con sus atributos. Se pretende comprobar si ese esquema es funcionalmente mejorable por medio de las reglas de normalización. Se dice que una tabla está en una determinada forma normal si satisface un cierto número de restricciones impuestas por esa regla. El número de estas reglas puede variar hasta seis (dependiendo de autores) pero hay tres de ellas que resultan básicas. Una tabla normalizada de acuerdo a la primera regla se dice que está en la primera forma normal (1NF). Una tabla normalizada de acuerdo a la segunda regla se dice que está en la segunda forma normal (2NF). Una tabla debe cumplir la primera forma antes que la segunda, y la segunda antes que la tercera pero después que la primera. Las normalizaciones mayores tratan con situaciones específicas y especiales, que los programadores suelen adaptar de forma individual. Primeramente veamos unos errores muy comunes en el diseño de bases de datos: Tenemos una base de datos con la cual pretendemos “controlar” a los propietarios de vehículos de una determinada localidad. Necesitamos, en principio, una tabla para almacenar dicha información.

2-14


DNI

Nombre

Apellidos

Dirección

Marca

Modelo

Matrícula

5042211

Jorge

Arrainz

C/ Ronda

Audi

A3

abc9090

4012123

Eva

Vall

C/ Tórtola

SEAT

Ibiza

11221bb

5042211

Jorge

Arrainz

C/ Ronda

BMW

850

m-2277-uv

3555655

Ana

Martín

C/ Jadraque

Mercedes

600

434344bb

8989888

Alicia

Márquez

C/ Hita

SEAT

Ibiza

454544as

El error más visible, como se puede apreciar, es la duplicidad de datos. Jorge, que es propietario de dos vehículos ocupa dos registros (1º y 3º), por lo cual se repiten varios campos: DNI, Nombre, Apellidos y Dirección. ¿No sería ocupar espacio de almacenamiento en demasía? Pensemos en otra posibilidad. DNI

Nomb

Marca

Model

Matric

5042211

Jorge

Audi

A3

abc9090

4012123

Eva

SEAT

Ibiza

11221bb

3555655

Ana

Mercedes

600

434344bb

8989888

Alicia

SEAT

Ibiza

454544as

Marca2 BMW

Modelo2 850

Matricu2 m-2277uv

Esta tabla resulta aún peor. Al intentar evitar la duplicidad de los datos en la tabla, se está introduciendo duplicidad en la misma estructura de la tabla. Además debemos preguntarnos ¿cuántas personas son propietarias de dos o más vehículos? ¿En cuántas filas los campos Marca2, Modelo2 y Matrícula2 quedarían vacíos? En miles, pues la inmensa mayoría de gente no tiene dos o más vehículos por persona. Primera forma normal Una tabla no debe contener grupos repetidos. Basándonos en el segundo ejemplo anterior, no podríamos tener los campos matrícula y matrícula2, modelo y modelo2, etc. 2-15


Por lo cual un propietario con dos o más vehículos se almacenaría así: DNI

Nombre

Apellidos

Dirección

Marca

Modelo

Matrícula

5042211

Jorge

Arrainz

C/ Ronda

Audi

A3

abc9090

4012123

Eva

Vall

C/ Tórtola

SEAT

Ibiza

11221bb

5042211

Jorge

Arrainz

C/ Ronda

BMW

850

m-2277-uv

3555655

Ana

Martín

C/ Jadraque

Mercedes

600

434344bb

8989888

Alicia

Márquez

C/ Hita

SEAT

Ibiza

454544as

La primera forma normal no requiere que se divida la tabla en otras. En vez de eso, convierte algunas de las columnas de la tabla en filas adicionales. Ventajas que tiene, siempre dentro de que se puede mejorar, claro está: —

Carece de campos vacíos.

—

Carece de limitaciones. Si un propietario tiene, por ejemplo, seis vehículos, tendríamos que haber utilizado seis campos matrícula, seis campos modelo, etc. De esta forma, el propietario aparecería en seis filas.

Una vez que la tabla se encuentra en la primera forma normalizada, se debe pasar a la segunda regla de normalización. Segunda forma normal La segunda regla de normalización dice que cualquier campo que no dependa totalmente de la clave principal se debe mover a otra tabla. Aplicándolo a nuestro ejemplo: Tabla propietarios DNI

2-16

Nombre

Apellidos

Dirección

5042211

Jorge

Arrainz

C/ Ronda

4012123

Eva

Vall

C/ Tórtola

3555655

Ana

Martín

C/ Jadraque

8989888

Alicia

Marquez

C/ Hita


Tabla vehículos DNI

Marca

Modelo

Matrícula

5042211

Audi

A3

abc9090

4012123

SEAT

Ibiza

11221bb

5042211

BMW

850

m-2277-uv

3555655

Mercedes

600

434344bb

8989888

SEAT

Ibiza

454544as

Ahora las tablas quedan mejor estructuradas. Por medio del campo clave DNI podemos acceder a la información de un propietario y/o de su vehículo/s, y los datos apenas se repiten, salvo el DNI que es clave primaria y que en una relación de uno a varios (un propietario, uno o más vehículos) es imposible de evitar. Vamos a ampliar la tabla de vehículos con dos nuevos campos: cilindrada e impcircu (impuesto de circulación, según cilindrada). Tabla vehículos DNI

Marca

Modelo

Matrícula

Cilindrada

impcircu

5042211

Audi

A3

abc9090

1900

105

4012123

SEAT

Ibiza

11221bb

1600

82

5042211

BMW

850

m-2277-uv

3000

203

3555655

Mercedes

600

434344bb

3000

203

8989888

SEAT

Ibiza

454544as

1600

82

Ahora imaginémonos que cambian el importe del campo de impuestos para algunas determinadas cilindradas. La tabla necesita una modificación, pero esa modificación se va a repetir innecesariamente en algún registro (SEAT Ibiza), ya que existen registros iguales. Tercera forma normal Esta tercera regla dice que no debe haber dependencias entre campos que no sean clave. Aquí el problema reside en que los relativos a las caracte2-17


rísticas del vehículo se repiten en demasía y pecan de tener una dependencia de un campo no clave, impcircu. Volvamos a normalizar. Tabla vehículos Idvehículo

Marca

Modelo

Cilindrada

Au31901

Audi

A3

1900

Seibi1603

SEAT

Ibiza

1600

Bm850i

BMW

850

3000

Me600se

Mercedes

600

3000

Tabla impuestos Cilindrada

Impuesto_circulación

EmisiónCO2

Características

1100

50

6%

Bajo consumo…

1200

55

8%

Motor ecológico…

1600

82

15%

Versiones con turbo…

1900

105

18%

Consumo alto, turbo…

3000

203

25%

Alto consumo…

Esta tabla, además de no repetir tanta marca y cilindrada, muestra más información a cerca del tipo de motor. El campo cilindrada es la clave principal. Tabla propietarios DNI

2-18

Nombre

Apellidos

Dirección

5042211

Jorge

Arrainz

C/ Ronda

4012123

Eva

Vall

C/ Tórtola

3555655

Ana

Martín

C/ Jadraque

8989888

Alicia

Marquez

C/ Hita


Esta tabla pasaríamos a normalizarla, para que no aparezcan varias veces los datos personales de un mismo propietario, sino gracias al DNI poder acceder a la tabla de los datos personales. Tabla contribuyentes DNI

IDvehículo

5042211

Au31901

4012123

Seibi1603

3555655

Me600se

8989888

Seibi1603

5042211

Bm850i

Con esta tabla tenemos acceso a los datos personales y a los datos del vehículo, y como las otras tablas están relacionadas entre sí, podemos acceder a la información de todas las tablas a la vez. La segunda y tercera forma son prácticamente iguales (de hecho algunos autores las tratan como una sola). El diagrama de relaciones de una base de datos normalizada quedaría así:

La mejor forma es la intuición y el sentido común para dividir los datos en tablas diferentes. Use una tabla diferente para cada entidad; posteriormente establezca las relaciones entre las tablas, siempre que se pueda. Si alguna tabla no tiene campo común con otra tabla para poder relacionarlas, deberá crearse una tabla intermedia que contenga dos campos; los 2-19


campos clave de ambas tablas. Algo parecido a la tabla contribuyentes de nuestro ejemplo, que permite relacionar la tabla propietarios con las demás. Forma Normal de Boyce-Codd (BCFN) Una relación está en la forma normal de Boyce-Codd si, y sólo si, todo determinante es una clave candidata. La 2FN y la 3FN eliminan las dependencias parciales y las dependencias transitivas de la clave primaria. Pero este tipo de dependencias todavía pueden existir sobre otras claves candidatas, si éstas existen. La BCFN es más fuerte que la 3FN, por lo tanto, toda relación en BCFN está en 3FN. La violación de la BCFN es poco frecuente ya que se da bajo ciertas condiciones que raramente se presentan. Se debe comprobar si una relación viola la BCFN, si tiene dos o más claves candidatas compuestas que tienen al menos un atributo en común. Respecto a la normalización y vínculos Cada vez que conecta dos tablas con una clave común, DBMS (Data Base Manager System o lo que es lo mismo, Sistema Gestor de Bases de Datos) debe llevar a cabo una operación conocida como unión. Esta unión se realiza por medio de las claves principal (Primary Key) y externa (Foreign Key). Esta operación de unir “momentáneamente” tablas es muy costosa, debido a su lentitud, por lo cual se aconseja usarla lo menos posible. Es normal que algunas bases de datos utilicen incluso seis uniones para acceder a una información, aunque SQL permite hasta 16 uniones. En verdad existe un conflicto entre normalización y uniones. Si creamos un gran número de tablas, tendremos que crear un gran número de uniones. Hay muchos administradores y programadores de bases de datos que prefieren repetir un “poco” la información utilizando menos tablas con tal de poder acceder más rápidamente a los datos. Que quede claro que para esto no hay reglas, sólo el criterio personal y estudiar muy bien el tipo y número de accesos o peticiones que se van a realizar sobre las tablas.

5.

Integridad de la base de datos

Diseñar la base de datos es sólo el primer paso, el mayor problema es que la bases de datos se mantenga en perfecto estado, operativa. Para el mantenimiento y protección de la base de datos los SGBD se ayudan de unas determinadas reglas de integridad y los administradores y programadores son los encargados de aplicarlas.

5.1.

Integridad del dominio

Es una regla de integridad muy simple que indica que cada columna (campo) debe tener un tipo único de datos. Por ejemplo, si la columna suel2-20


do está definida como campo de tipo numérico, el usuario no podrá introducir fechas en él. El gestor devolverá un error y el usuario deberá actuar en consecuencia.

5.2.

Integridad de entidad

Significa que cada entidad (tabla) deberá tener una clave principal válida. Por ejemplo, si se permite valores nulos (null) para esa clave principal, obviamente no se podrán conectar otras tablas a esta fila. Que ocurra esto es muy difícil, pues ningún DBMS permite que si el campo es clave, pueda contener un valor null. A la hora de creación de la tabla y a la hora de introducir datos, obligan a cumplimentar dicho campo.

5.3.

Integridad referencial

Es una regla de integridad que se encarga de asegurar que las distintas relaciones entre tablas tengan siempre validez. Por ejemplo, tenemos una tabla llamada Vendedores y otra llamada Ventas. En la tabla Vendedores el campo clave es el campo DNI. En la tabla Ventas habrá que tener un campo DNI para conocer qué empleado ha realizado la venta, además de ser el campo que relaciona esta tabla con la de Vendedores. Tomemos como ejemplo que, a la hora de dar de alta un pedido (tabla Pedidos), el usuario, sin querer, introduzca un DNI de vendedor que no exista en la tabla de Vendedores. A la hora de pedir información de quién efectuó esa venta, no podríamos conocer los datos del vendedor, más que nada porque dicho vendedor no existe. Si exigimos integridad referencial, cuando procedemos a introducir un DNI en la tabla de Ventas que no está dado de alta en la tabla de Vendedores, el gestor envía automáticamente un mensaje indicando el error de integridad. Lo mismo pasaría si damos de baja a un vendedor en la tabla de Vendedores. ¿Qué sucedería con sus ventas? Algunos gestores tienen la posibilidad de activar la opción de borrado o actualización en cascada. Si se borra o modifica la clave principal, todos sus registros de la tabla relacionada se borrarán o modificarán de forma automática. SQL Server no soporta actualizaciones en cascada porque usa un mecanismo aún mejor: desencadenantes. Un desencadenante es un procedimiento que se invoca automáticamente, como un evento. Por ejemplo, si un vendedor realiza una nueva venta, se puede usar un desencadenante para que el importe de la misma se acumule en el campo total_venta_acumulada de la tabla Vendedores. Un desencadenante es un conjunto de sentencias de programación, como son los bucles, las sentencias de control de flujo, las variables, etc., mezclados con SQL. Como es de imaginar, la integridad referencial se debe indicar antes de introducir la información, en caso contrario, nos podría dar bastantes errores de datos que no coincidan en ambas tablas, errores que el usuario, con paciencia, debe solucionar. 2-21


6

El Modelo físico Relacional

6.1.

Introducción

El diseño de una base de datos se descompone en tres etapas: diseño conceptual, lógico y físico. La etapa del diseño lógico es independiente de los detalles de implementación y dependiente del tipo de SGBD que se vaya a utilizar. La salida de esta etapa es el esquema lógico global y la documentación que lo describe. Todo ello es la entrada para la etapa que viene a continuación, el diseño físico. Mientras que en el diseño lógico se especifica qué se guarda, en el diseño físico se especifica cómo se guarda. Para ello, el diseñador debe conocer muy bien toda la funcionalidad del SGBD concreto que se vaya a utilizar y también el sistema informático sobre el que éste va a trabajar. El diseño físico no es una etapa aislada, ya que algunas decisiones que se tomen durante su desarrollo, por ejemplo para mejorar las prestaciones, pueden provocar una reestructuración del esquema lógico.

6.2.

Metodología de diseño físico para bases de datos relacionales

El objetivo de esta etapa es producir una descripción de la implementación de la base de datos en memoria secundaria. Esta descripción incluye las estructuras de almacenamiento y los métodos de acceso que se utilizarán para conseguir un acceso eficiente a los datos. El diseño físico se divide de cuatro fases, cada una de ellas compuesta por una serie de pasos: 1)

Traducir el esquema lógico global para el SGBD específico.

2)

Diseñar la representación física.

3)

4)

2-22

•

Analizar las transacciones.

•

Escoger las organizaciones de ficheros.

•

Escoger los índices secundarios.

•

Considerar la introducción de redundancias controladas.

•

Estimar la necesidad de espacio en disco.

Diseñar los mecanismos de seguridad. •

Diseñar las vistas de los usuarios.

•

Diseñar las reglas de acceso.

Monitorizar y afinar el sistema.


6.2.1. Traducir el esquema lógico global La primera fase del diseño lógico consiste en traducir el esquema lógico global en un esquema que se pueda implementar en el SGBD escogido. Para ello, es necesario conocer toda la funcionalidad que éste ofrece. Por ejemplo, el diseñador deberá saber: —

Si el sistema soporta la definición de claves primarias, claves ajenas y claves alternativas.

—

Si el sistema soporta la definición de datos requeridos (es decir, si se pueden definir atributos como no nulos).

—

Si el sistema soporta la definición de dominios.

—

Si el sistema soporta la definición de reglas de negocio.

—

Cómo se crean las relaciones base.

• Diseñar las relaciones base para el SGBD específico Las relaciones base se definen mediante el lenguaje de definición de datos del SGBD. Para ello, se utiliza la información producida durante el diseño lógico: el esquema lógico global y el diccionario de datos. El esquema lógico consta de un conjunto de relaciones y, para cada una de ellas, se tiene: —

El nombre de la relación.

—

La lista de atributos entre paréntesis.

—

La clave primaria y las claves ajenas, si las tiene.

—

Las reglas de integridad de las claves ajenas.

En el diccionario de datos se describen los atributos y, para cada uno de ellos, se tiene: —

Su dominio: tipo de datos, longitud y restricciones de dominio.

—

El valor por defecto, que es opcional.

—

Si admite nulos.

—

Si es derivado y, en caso de serlo, cómo se calcula su valor.

A continuación, se muestra un ejemplo de la definición de la relación INMUEBLE con el estándar SQL. CREATE CREATE CREATE CREATE CREATE CREATE

DOMAIN DOMAIN DOMAIN DOMAIN DOMAIN DOMAIN

pnum enum onum inum calle area

AS AS AS AS AS AS

VARCHAR(5); VARCHAR(5); VARCHAR(3); VARCHAR(5); VARCHAR(25); VARCHAR(15);

2-23


CREATE DOMAIN poblacion AS VARCHAR(15); CREATE DOMAIN tipo AS VARCHAR(1) CHECK(VALUE IN (‘A’,`C’,`D’,`P’,`V’)); CREATE DOMAIN hab AS SMALLINT CHECK(VALUE BETWEEN 1 AND 15); CREATE DOMAIN alquiler AS DECIMAL(6,2) CHECK(VALUE BETWEEN 0 AND 9999); CREATE TABLE inmueble ( inum INUM NOT NULL, CALLE NOT NULL, calle area AREA, poblacion POBLACION NOT NULL, tipo TIPO NOT NULL DEFAULT `P’, hab HAB NOT NULL DEFAULT 4, alquiler ALQUILER NOT NULL DEFAULT 350, pnum PNUM NOT NULL, enum ENUM, onum ONUM NOT NULL, PRIMARY KEY (inum), FOREIGN KEY (pnum) REFERENCES propietario ON DELETE no action ON UPDATE cascade, FOREIGN KEY (enum) REFERENCES plantilla ON DELETE set null ON UPDATE cascade, FOREIGN KEY (onum) REFERENCES oficina ON DELETE no action ON UPDATE cascade );

• Diseñar las reglas de negocio para el SGBD específico Las actualizaciones que se realizan sobre las relaciones de la base de datos deben observar ciertas restricciones que imponen las reglas de negocio de la empresa. Algunos SGBD proporcionan mecanismos que permiten definir estas restricciones y vigilan que no se violen. Por ejemplo, si no se quiere que un empleado tenga más de diez inmuebles asignados, se puede definir una restricción en la sentencia CREATE TABLE de la relación INMUEBLE: CONSTRAINT inmuebles_por_empleado CHECK (NOT EXISTS (SELECT enum FROM inmueble GROUP BY enum HAVING COUNT(*)>10))

2-24


Otro modo de definir esta restricción es mediante un disparador (trigger): CREATE TRIGGER inmuebles_por_empleado ON inmueble FOR INSERT,UPDATE AS IF ((SELECT COUNT(*) FROM inmueble i WHERE i.inum=INSERTED.inum)>10) BEGIN PRINT “Este empleado ya tiene 10 inmuebles asignados” ROLLBACK TRANSACTION END

Hay algunas restricciones que no las pueden manejar los SGBD, como por ejemplo “a las 20:30 del último día laborable de cada año archivar los inmuebles vendidos y borrarlos”. Para estas restricciones habrá que escribir programas de aplicación específicos. Por otro lado, hay SGBD que no permiten la definición de restricciones, por lo que éstas deberán incluirse en los programas de aplicación. Todas las restricciones que se definan deben estar documentadas. Si hay varias opciones posibles para implementarlas, hay que explicar por qué se ha escogido la opción implementada.

6.2.2. Diseñar la representación física Uno de los objetivos principales del diseño físico es almacenar los datos de modo eficiente. Para medir la eficiencia hay varios factores que se deben tener en cuenta: —

Productividad de transacciones. Es el número de transacciones que se quiere procesar en un intervalo de tiempo.

—

Tiempo de respuesta. Es el tiempo que tarda en ejecutarse una transacción. Desde el punto de vista del usuario, este tiempo debería ser el mínimo posible.

—

Espacio en disco. Es la cantidad de espacio en disco que hace falta para los ficheros de la base de datos. Normalmente, el diseñador querrá minimizar este espacio.

Lo que suele suceder, es que todos estos factores no se pueden satisfacer a la vez. Por ejemplo, para conseguir un tiempo de respuesta mínimo, puede ser necesario aumentar la cantidad de datos almacenados, ocupando más espacio en disco. Por lo tanto, el diseñador deberá ir ajustando estos factores para conseguir un equilibrio razonable. El diseño físico inicial no será el definitivo, sino que habrá que ir monitorizándolo para observar sus prestaciones e ir ajustándolo como sea oportuno. Muchos SGBD proporcionan herramientas para monitorizar y afinar el sistema. Hay algunas estructuras de almacenamiento que son muy eficientes para cargar grandes cantidades de datos en la base de datos, pero no son eficientes para el resto de operaciones, por lo que se puede escoger dicha estructura de almacenamiento para inicializar la base de datos y cambiarla, a continuación, 2-25


para su posterior operación. Los tipos de organizaciones de ficheros disponibles varían en cada SGBD. Algunos sistemas proporcionan más estructuras de almacenamiento que otros. Es muy importante que el diseñador del esquema físico sepa qué estructuras de almacenamiento le proporciona el SGBD y cómo las utiliza. Para mejorar las prestaciones, el diseñador del esquema físico debe saber cómo interactúan los dispositivos involucrados y cómo esto afecta a las prestaciones: —

Memoria principal. Los accesos a memoria principal son mucho más rápidos que los accesos a memoria secundaria (decenas o centenas de miles de veces más rápidos). Generalmente, cuanta más memoria principal se tenga, más rápidas serán las aplicaciones. Sin embargo, es aconsejable tener al menos un 5% de la memoria disponible, pero no más de un 10%. Si no hay bastante memoria disponible para todos los procesos, el sistema operativo debe transferir páginas a disco para liberar memoria (paging). Cuando estas páginas se vuelven a necesitar, hay que volver a traerlas desde el disco (faltas de página). A veces, es necesario llevar procesos enteros a disco (swapping) para liberar memoria. El hacer estas transferencias con demasiada frecuencia empeora las prestaciones.

—

CPU. La CPU controla los recursos del sistema y ejecuta los procesos de usuario. El principal objetivo con este dispositivo es lograr que no haya bloqueos de procesos para conseguirla. Si el sistema operativo, o los procesos de los usuarios, hacen muchas demandas de CPU, ésta se convierte en un cuello de botella. Esto suele ocurrir cuando hay muchas faltas de página o se realiza mucho swapping.

—

Entrada/salida a disco. Los discos tienen una velocidad de entrada/salida. Cuando se requieren datos a una velocidad mayor que ésta, el disco se convierte en un cuello de botella. Dependiendo de cómo se organicen los datos en el disco, se conseguirá reducir la probabilidad de empeorar las prestaciones. Los principios básicos que se deberían seguir para repartir los datos en los discos son los siguientes:

—

•

Los ficheros del sistema operativo deben estar separados de los ficheros de la base de datos.

•

Los ficheros de datos deben estar separados de los ficheros de índices.

•

Los ficheros con los diarios de operaciones deben estar separados del resto de los ficheros de la base de datos.

Red. La red se convierte en un cuello de botella cuando tiene mucho tráfico y cuando hay muchas colisiones.

Cada uno de estos recursos afecta a los demás, de modo que una mejora en alguno de ellos puede provocar mejoras en otros. • Analizar las transacciones Para realizar un buen diseño físico es necesario conocer las consultas y las transacciones que se van a ejecutar sobre la base de datos. Esto incluye tanto información cualitativa, como cuantitativa. Para cada transacción, hay que especificar: 2-26


—

La frecuencia con que se va a ejecutar.

—

Las relaciones y los atributos a los que accede la transacción, y el tipo de acceso: consulta, inserción, modificación o eliminación. Los atributos que se modifican no son buenos candidatos para construir estructuras de acceso.

—

Los atributos que se utilizan en los predicados del WHERE de las sentencias SQL. Estos atributos pueden ser candidatos para construir estructuras de acceso dependiendo del tipo de predicado que se utilice.

—

Si es una consulta, los atributos involucrados en el join de dos o más relaciones. Estos atributos pueden ser candidatos para construir estructuras de acceso.

—

Las restricciones temporales impuestas sobre la transacción. Los atributos utilizados en los predicados de la transacción pueden ser candidatos para construir estructuras de acceso.

• Escoger las organizaciones de ficheros El objetivo de este paso es escoger la organización de ficheros óptima para cada relación. Por ejemplo, un fichero desordenado es una buena estructura cuando se va a cargar gran cantidad de datos en una relación al inicializarla, cuando la relación tiene pocas tuplas; también cuando en cada acceso se deben obtener todas las tuplas de la relación, o cuando la relación tiene una estructura de acceso adicional, como puede ser un índice. Por otra parte, los ficheros dispersos (hashing) son apropiados cuando se accede a las tuplas a través de los valores exactos de alguno de sus campos (condición de igualdad en el WHERE). Si la condición de búsqueda es distinta de la igualdad (búsqueda por rango, por patrón, etc.), la dispersión no es una buena opción. Hay otras organizaciones, como la ISAM, InnoDB para MySQL o los árboles B+ para Oracle. Las organizaciones de ficheros elegidas deben documentarse, justificando en cada caso la opción escogida. • Escoger los índices secundarios Los índices secundarios permiten especificar caminos de acceso adicionales para las relaciones base. Por ejemplo, la relación INMUEBLE se puede haber almacenado en un fichero disperso a través del atributo inum. Si se accede a menudo a esta relación a través del atributo alquiler, se puede plantear la creación de un índice sobre dicho atributo para favorecer estos accesos. Pero hay que tener en cuenta que estos índices conllevan un coste de mantenimiento que hay que sopesar frente a la ganancia en prestaciones. A la hora de seleccionar los índices, se pueden seguir las siguientes indicaciones: —

Construir un índice sobre la clave primaria de cada relación base.

—

No crear índices sobre relaciones pequeñas.

—

Añadir un índice sobre los atributos que se utilizan para acceder con mucha frecuencia. 2-27


—

Añadir un índice sobre las claves ajenas que se utilicen con frecuencia para hacer joins.

—

Evitar los índices sobre atributos que se modifican a menudo.

—

Evitar los índices sobre atributos poco selectivos (aquellos en los que la consulta selecciona una porción significativa de la relación).

—

Evitar los índices sobre atributos formados por tiras de caracteres largas.

Los índices creados se deben documentar, explicando las razones de su elección. • Considerar la introducción de redundancias controladas En ocasiones puede ser conveniente relajar las reglas de normalización introduciendo redundancias de forma controlada, con objeto de mejorar las prestaciones del sistema. En la etapa del diseño lógico se recomienda llegar, al menos, hasta la tercera forma normal para obtener un esquema con una estructura consistente y sin redundancias. Pero, a menudo, sucede que las bases de datos así normalizadas no proporcionan la máxima eficiencia, con lo que es necesario volver atrás y desnormalizar algunas relaciones, sacrificando los beneficios de la normalización para mejorar las prestaciones. Es importante hacer notar que la desnormalización sólo debe realizarse cuando se estime que el sistema no puede alcanzar las prestaciones deseadas. Y, desde luego, la necesidad de desnormalizar en ocasiones no implica eliminar la normalización del diseño lógico: la normalización obliga al diseñador a entender completamente cada uno de los atributos que se han de representar en la base de datos. Por lo tanto, hay que tener en cuenta los siguientes factores: —

La desnormalización hace que la implementación sea más compleja.

—

La desnormalización hace que se sacrifique la flexibilidad.

—

La desnormalización puede hacer que los accesos a datos sean más rápidos, pero ralentiza las actualizaciones.

Por regla general, la desnormalización de una relación puede ser una opción viable cuando las prestaciones que se obtienen no son las deseadas y la relación se actualiza con poca frecuencia, pero se consulta muy a menudo. Las redundancias que se pueden incluir al desnormalizar son de varios tipos: se pueden introducir datos derivados (calculados a partir de otros datos), se pueden duplicar atributos o se pueden hacer joins de relaciones. El incluir un atributo derivado dependerá del coste adicional de almacenarlo y mantenerlo consistente con los datos de los que se deriva, frente al coste de calcularlo cada vez que se necesita. No se pueden establecer una serie de reglas que determinen cuándo desnormalizar relaciones, pero hay algunas situaciones muy comunes en donde puede considerarse esta posibilidad:

2-28


—

Combinar relaciones de uno a uno. Cuando hay relaciones (tablas) involucradas en relaciones de uno a uno, se accede a ellas de manera conjunta con frecuencia y casi no se les accede separadamente, se pueden combinar en una sola relación (tabla).

—

Duplicar atributos no clave en relaciones de uno a muchos para reducir los joins. Para evitar operaciones de join, se pueden incluir atributos de la relación (tabla) padre en la relación (tabla) hijo de las relaciones de uno a muchos.

—

Tablas de referencia. Las tablas de referencia (lookup) son listas de valores, cada uno de los cuales tiene un código. Por ejemplo, puede haber una tabla de referencia para los tipos de inmueble, con las descripciones de estos tipos y un código asociado. Este tipo de tablas son un caso de relación de uno a muchos. En la relación INMUEBLE habrá una clave ajena a esta tabla para indicar el tipo de inmueble. De este modo, es muy fácil validar los datos, además de que se ahorra espacio escribiendo sólo el código y no la descripción para cada inmueble, además de ahorrar tiempo cuando se actualizan las descripciones. Si las tablas de referencia se utilizan a menudo en consultas críticas, se puede considerar la introducción de la descripción junto con el código en la relación (tabla) hijo, manteniendo la tabla de referencia para validación de datos.

—

Duplicar claves ajenas en relaciones de uno a muchos para reducir los joins. Para evitar operaciones de join, se pueden incluir claves ajenas de una relación (tabla) en otra relación (tabla) con la que se relaciona (habrá que tener en cuenta ciertas restricciones).

—

Duplicar atributos en relaciones de muchos a muchos para reducir los joins. Durante el diseño lógico se eliminan las relaciones de muchos a muchos introduciendo dos relaciones de uno a muchos. Esto hace que aparezca una nueva relación (tabla) intermedia, de modo que si se quiere obtener la información de la relación de muchos a muchos, se tiene que realizar el join de tres relaciones (tablas). Para evitar algunos de estos joins se pueden incluir algunos de los atributos de las relaciones (tablas) originales en la relación (tabla) intermedia.

—

Introducir grupos repetitivos. Los grupos repetitivos se eliminan en el primer paso de la normalización para conseguir la primera forma normal. Estos grupos se eliminan introduciendo una nueva relación (tabla), generando una relación de uno a muchos. A veces, puede ser conveniente reintroducir los grupos repetitivos para mejorar las prestaciones.

—

Creación de Vistas Materializadas. Son vistas sobre tablas muy grandes en las que hay que definir y/o programar cuándo han de refrescarse para que sean consistentes los datos redundantes con los originales. Su razón de ser es la de otorgar velocidad de acceso ante una tabla con muchas filas (millones de filas) y sobre la que hay que realizar una consulta muy costosa en cuanto a ordenaciones o condiciones a cumplir cuya ejecución en tiempo real lo hace inviable. De este modo se accede a una tabla que es una redundancia de una tabla y que cumple unas ciertas condiciones. 2-29


Todas las redundancias que se introduzcan en este paso se deben documentar y razonar. El esquema lógico se debe actualizar para reflejar los cambios introducidos. • Estimar la necesidad de espacio en disco En caso de que se tenga que adquirir nuevo equipamiento informático, el diseñador debe estimar el espacio necesario en disco para la base de datos. Esta estimación depende del SGBD que se vaya a utilizar y del hardware. En general, se debe estimar el número de tuplas de cada relación y su tamaño. También se debe estimar el factor de crecimiento de cada relación.

6.2.3. Diseñar los mecanismos de seguridad Los datos constituyen un recurso esencial para la empresa, por lo tanto su seguridad es de vital importancia. Durante el diseño lógico se habrán especificado los requerimientos en cuanto a seguridad que en esta fase se deben implementar. Para llevar a cabo esta implementación, el diseñador debe conocer las posibilidades que ofrece el SGBD que se vaya a utilizar. • Diseñar las vistas de los usuarios El objetivo de este paso es diseñar las vistas de los usuarios correspondientes a los esquemas lógicos locales. Las vistas, además de preservar la seguridad, mejoran la independencia de datos, reducen la complejidad y permiten que los usuarios vean los datos en el formato deseado. • Diseñar las reglas de acceso El administrador de la base de datos asigna a cada usuario un identificador que tendrá una palabra secreta asociada por motivos de seguridad. Para cada usuario o grupo de usuarios se otorgarán permisos para realizar determinadas acciones sobre determinados objetos de la base de datos. Por ejemplo, los usuarios de un determinado grupo pueden tener permiso para consultar los datos de una relación base concreta y no tener permiso para actualizarlos.

6.2.4. Monitorizar y afinar el sistema Una vez implementado el esquema físico de la base de datos, se debe poner en marcha para observar sus prestaciones. Si éstas no son las deseadas, el esquema deberá cambiar para intentar satisfacerlas. Una vez afinado el esquema, no permanecerá estático, ya que tendrá que ir cambiando conforme lo requieran los nuevos requisitos de los usuarios. Los SGBD proporcionan herramientas para monitorizar el sistema mientras está en funcionamiento.

2-30

Tema 3 Lenguajes de programación. Representación de tipos de datos. Operadores. Instrucciones condicionales. Bucles y recursividad. Procedimientos, funciones y parámetros. Vectores y registros. Estructura de un programa.


Guión-resumen

1. Lenguaje de Programación 1.1. Introducción

5. Clasificación general de instrucciones

1.2. Concepto de programa

5.1. Instrucciones de definición de datos

1.3. Características de los programas

5.2. Instrucciones primitivas

1.4. Los lenguajes de programación

5.3. Instrucciones compuestas

2. Elementos de un programa

5.4. Instrucciones de control

2.1. Objetos

6. Recursividad

2.2. Identificadores

7. Procedimientos, funciones y parámetros

2.3. Datos 2.4. Constantes 2.5. Variables 2.6. Operadores 2.7. Expresiones 2.8. Sentencias 2.9. Comentarios 3. Tipos de Datos 3.1. Datos básicos 3.2. Dato derivado (puntero) 3.3. Datos estructurados

3-2

4. Operadores

7.1. Procedimientos 7.2. Funciones 7.3. Parámetros 8. Vectores y registros 8.1. Vectores 8.2. Registros 9. Estructura de un programa 9.1. Elementos auxiliares de programación 9.2. Prueba de programas 9.3. Verificación y validación

Lenguajes de programación

1.

Lenguaje de Programación

1.1.

Introducción

Los ordenadores son máquinas que disponen de gran rapidez para efectuar operaciones, poseen precisión y memoria pero son carentes de inteligencia natural. Son máquinas preparadas para realizar el proceso que se le indique mediante un programa (un conjunto de instrucciones). Estas instrucciones que forman el programa deben traducirse de un lenguaje comprensible por los humanos a un lenguaje comprensible para la máquina. El componente principal del ordenador, el único que realiza el trabajo de cálculo (computación), es la Unidad Central de Proceso (CPU). Es la CPU la que se encarga de ejecutar los programas.

1.2.

Concepto de programa

Un programa es una serie o secuencia de instrucciones que el ordenador debe ejecutar para realizar la tarea prevista por el programador. Cuando nos planteamos un problema complejo y queremos resolverlo con la utilización del ordenador, necesitamos descomponerlo en una serie de tareas simples que se irán repitiendo a lo largo de un proceso hasta la resolución del problema; el ordenador ha realizado una tarea compleja, a partir de instrucciones simples. Dicho conjunto de tareas simples sería el programa, y su elaboración es lo que entendemos por programación. Cuando nos disponemos a programar una de las primeras decisiones que hemos de tomar es la elección del lenguaje a emplear, es decir la forma en la que el programador tiene que escribir las operaciones a realizar por el ordenador. Veamos a continuación algunas definiciones útiles para seguir avanzando: —

Se denomina instrucción al conjunto de reglas o normas dadas para la realización o empleo de algo. En informática, instrucción es la información que indica a un ordenador una acción elemental que ha de realizar. Para poder realizar algún proceso de utilidad debe indicarse al ordenador un conjunto organizado de instrucciones.

—

Un algoritmo es un conjunto ordenado de operaciones necesarias para resolver un problema.

—

Un programa es un conjunto ordenado de instrucciones, perfectamente legibles por el ordenador, que le permiten realizar un trabajo o resolver un problema. El programa es la descripción de un algoritmo en un lenguaje inteligible por la máquina.

Los programas contienen frecuentemente conjuntos de instrucciones que pueden intervenir varias veces en la ejecución del mismo o que realizan una tarea específica. Es posible agrupar dichas instrucciones de modo que formen una unidad independiente del programa a la cual se haga referencia en aquellos puntos del programa donde sea necesario. En esto consiste una subrutina. En la traducción del programa a lenguaje máquina se establecerá el mecanismo para que al encontrar la referencia a ese conjunto de instrucciones, la subrutina, aquéllas se ejecuten como si estuvie-

3-3


ran en el propio programa. Las subrutinas pueden ser llamadas por un solo programa pero también puede hacerse referencia a las mismas desde programas distintos.

1.3.

Características de los programas

La determinación de la calidad de los programas estará en función de las ventajas de su utilización; para ello existen unas características que determinan a priori si el programa tendrá vida larga y productiva: —

Legible. Todo programa debe ser de fácil comprensión no sólo por los futuros usuarios, sino por cualquier programador.

—

Flexible. Capaz de adaptarse con facilidad a los cambios que puedan producirse en el planteamiento inicial.

—

Portable. Facilidad para compilarse o interpretarse en distintas máquinas y sistemas operativos, también un factor a tener en cuenta sería su facilidad para ser traducido a otros lenguajes de programación.

—

Fiable. El programa debe ser capaz de recuperar el control cuando su utilización no sea la adecuada.

—

Eficaz. El programa ha de utilizar eficazmente los recursos de que disponga, tanto del sistema operativo como del equipo en que trabaje. Características de los programas:

1.4.

Legibilidad

(comprendido por diferentes programadores)

Flexibilidad

(adaptarse a los cambios)

Portabilidad

(compilable dif. Máquinas / S.O / lenguajes)

Fiabilidad

(recuperación del control por errores)

Eficiencia

(aprovechamiento recursos S.O.)

Los lenguajes de programación

El lenguaje de programación es la forma en la que el programador escribe las operaciones que el ordenador debe realizar. Es el conjunto de notaciones, símbolos y reglas sintácticas para posibilitar la escritura de un algoritmo que posteriormente será interpretado por el hardware de un ordenador. La CPU esta preparada para manejar unas instrucciones escritas en un tipo de lenguaje muy simple llamado lenguaje máquina. Cada modelo de CPU posee su propio lenguaje máquina, y puede ejecutar un programa sólo si está escrito en ese lenguaje. Para poder ejecutar programas escritos en otros lenguajes, es necesario primero trasladarlos a lenguaje máquina a través de un proceso de compilación o interpretación. 3-4


Interfaz grafica del programa

Código fuente del programa

Un lenguaje de programación es una notación o conjunto de símbolos y caracteres combinados conforme una sintaxis ya predefinida. En función de su parecido con el lenguaje natural, podemos hablar de lenguajes de bajo nivel y lenguajes de alto nivel. En los primeros la sintaxis está más próxima al lenguaje máquina que al lenguaje humano y en los de alto nivel es todo lo contrario. Cuando un programa es ejecutado directamente por el ordenador, es decir, está en código máquina, decimos que es un lenguaje de bajo nivel. Casi todos los programas son escritos por los programadores en lenguajes de alto nivel. Nota. Los lenguajes de programación, en especial C, C++, Java y la plataforma .Net serán estudiados con detalle en el tema 6.

2.

Elementos de un programa

En la elaboración de un programa utilizamos diferentes elementos que cubrirán diferentes funciones. Los diferentes elementos son:

2.1.

—

Objetos.

—

Identificadores.

—

Datos.

—

Constantes.

—

Variables.

—

Operadores.

—

Expresiones.

—

Sentencias.

—

Comentarios.

Objetos

Llamaremos objetos a todos los elementos que utilizaremos en la programación, susceptibles de ser manejados por las instrucciones y sentencias del programa. 3-5


Todas las cosas pueden ser objetos, siempre que puedan ser individualizables e identificables, pudiendo ser cosas reales o abstractas, pero siempre representarán un papel definido en el problema. Los objetos tendrán tres atributos que los diferencien: el nombre que los identifique e individualice; el tipo, que determina el contenido o la clase de objeto; y su valor, que será el contenido en concreto que lo distingue de otros objetos de la misma clase.

2.2.

Identificadores

Los identificadores o etiquetas son palabras escogidas por el programador para designar los distintos elementos de un programa tales como las variables, funciones, etc.

2.3.

Datos

Consideramos como datos toda la información que se va a procesar en el ordenador. Serían datos los objetos anteriormente mencionados susceptibles de manipulación por las instrucciones del programa; también consideramos como datos aquellos elementos simples que utilizamos para comunicarnos, pudiendo ser de tipo: —

2.4.

Carácter. Son las unidades utilizadas en la información: •

alfabéticas (a, A, b, B, ...)

•

numéricas (0, 1, 2, ...)

•

especiales (+, -, *, ...)

—

Numérico. Son los valores o cantidades representados por los caracteres numéricos. Pueden ser de tipo entero o real.

—

Alfanumérico. Son conjuntos de caracteres alfabéticos, numéricos o especiales.

—

Lógico o booleano. Son datos lógicos que sólo pueden tomar dos valores: 1/0, cierto/falso, sí/no, ...

Constantes

Las constantes son aquellos datos utilizados en los programas que permanecerán invariables en todo el proceso de ejecución del programa, no pudiéndose alterar su valor o composición ni por parte del usuario ni del ordenador.

2.5.

Variables

Las variables son datos cuyo valor es modificable durante la ejecución del programa. Dicha variación sólo afectará al valor de la variable, no así al lugar

3-6


que ocupe en la memoria del ordenador, al tipo de información que represente ni a la identificación de la misma. Son datos cuya información va a ir cambiando a lo largo de la ejecución del programa. Pueden ser de diversos tipos: —

Inicializadas o no inicializada, según se les asigne o no un valor inicial de partida.

—

Globales o locales, según tengan validez para todo el programa o sólo para una parte del mismo.

2.6.

Operadores

Los operadores son símbolos que representan las distintas operaciones que pueden realizarse sobre los datos. Pueden clasificarse en: —

Aritméticos: suma, resta, multiplicación, etc.

—

Alfanuméricos: concatenación.

—

De asignación: establece los valores de las variables.

—

De relación: permiten comparaciones: igual que, menor o igual que...

—

Lógicos: AND, OR, OR exclusiva, NOT...

2.7.

Expresiones

En programación, una expresión es una combinación de operadores y datos u objetos (constantes o variables) cuyo resultado es un valor, que puede, por ejemplo, ser asignado a una variable. Los conceptos que estamos considerando (expresiones, variables, constantes, etc.) son muy similares a los convenios matemáticos.

2.8.

Sentencias

Las sentencias son las actuaciones que deseamos que ejecute el programa; se corresponderán con las operaciones estudiadas en el algoritmo, y estarán de acuerdo con la sintaxis establecida en el lenguaje concreto de programación que se esté utilizando. Podemos clasificar las sentencias utilizadas en la programación como instrucciones de: —

Asignación. Fijarán el valor que deban tomar las variables en un momento determinado.

—

Entrada. Permitirán la recogida de datos desde un dispositivo externo: teclado, ratón, etc., asignando valores a las variables.

—

Salida. Lo utilizaremos para visualizar externamente los valores o datos del programa: pantalla, archivo, impresora, etc. 3-7


2.9.

—

Condicionales. Nos permitirá la comparación del valor de variables, posibilitando la toma de decisiones por parte del ordenador.

—

Repetitivas. Son aquellas que posibilitarán la repetición de un conjunto de sentencias; dicha repetición se realizará un determinado número de veces, o mientras se cumpla una condición.

—

Salto.

Comentarios

Son líneas de texto que el compilador o el intérprete no consideran como parte del código, con lo cual no están sujetas a restricciones de sintaxis y sirven para aclarar partes de código en posteriores lecturas y, en general, para anotar cualquier cosa que el programador considere oportuno. Un programador debe tener como prioridad documentar nuestro código fuente ya que al momento de depurar nos ahorrará mucho tiempo de análisis para su corrección o estudio. Se deben documentar los programas con encabezados de texto (encabezados de comentarios) en donde describen la función que va a realizar dicho programa, la fecha de creación, el nombre del autor y en algunos casos las fechas de revisión y el nombre del revisor. Se puede hacer uso de llamadas a subprogramas dentro de una misma aplicación por lo que cada subprograma debería estar documentado, describiendo la función que realizan cada uno de estos subprogramas dentro de la aplicación.

3.

Tipos de Datos

Se llama estructura de datos al conjunto de datos con una misma denominación, y que se utilizan como una sola unidad. Las estructuras de datos pueden ser internas o externas dependiendo del lugar de almacenamiento, memoria central del ordenador o dispositivo de almacenamiento externo: Estructuras de datos internas. Los arrays son estructuras de datos internas, compuestos por un número fijo de elementos del mismo tipo; son almacenados en posiciones consecutivas de memoria y pueden ser llamados como una sola unidad o conjunto compacto, pero también pueden ser llamados como variables independientes considerándolos de forma individualizada. Estructuras de datos externas, son archivos o ficheros almacenados en un dispositivo de almacenamiento externo; son necesarios como forma de almacenamiento de información de forma masiva y permanente necesarios para el funcionamiento de un programa. Dichos archivos se componen de registros equivalentes a fichas con los datos que componen la información a tratar; los archivos son conjuntos de registros del mismo tipo que el programa utilizará y modificará a medida que se vaya ejecutando. Para el diseño de un programa es importante establecer cuáles son las estructuras de los datos que se van a utilizar, con el objeto de establecer las 3-8


operaciones que sobre dichos datos se pueden realizar. Para ello, debemos proporcionar al sistema información sobre los mismos. Es decir, que los datos manejados en un programa deben llevar asociados un identificador, un tipo y un valor. •

Identificador. Es el nombre utilizado en un programa para referenciar un dato. Existen ciertas normas generales para su empleo, siendo posible destacar las siguientes: a)

Pueden estar constituidos por letras y dígitos y en algunos casos por el carácter subrayado (_).

b)

Deben comenzar por una letra.

c)

No deben contener espacios.

d)

El número máximo de caracteres y nombres reservados que se pueden emplear dependen del compilador utilizado.

e)

El nombre asignado debe tener relación con la información que contiene, pudiéndose emplear abreviaturas que sean significativas.

•

Tipo. Establece el rango o intervalo de valores que puede tomar el dato. El tipo determina el espacio de memoria que se reservará para el dato. Un tipo de datos define un conjunto de valores y las operaciones sobre estos valores. Casi todos los lenguajes de programación explícitamente incluyen la notación del tipo de datos, aunque lenguajes diferentes pueden usar terminología diferente. La mayor parte de los lenguajes de programación permiten al programador definir tipos de datos adicionales, normalmente combinando múltiples elementos de otros tipos y definiendo las operaciones del nuevo tipo de dato.

•

Valor. Elemento que debe pertenecer al rango o intervalo de valores según el tipo definido. Entero Real

Numéricos Datos Básicos

Carácter Lógico

Dato derivado

Puntero

Estáticos

Datos estructurados

Internos

Lineales

Tabla

Lineales

Lista Pila Cola

No lineales

Árbol Grafo

Dinámicos

Externos

Fichero Base de datos

3-9


3.1.

Datos básicos —

Numéricos. Se utilizan para contener magnitudes y pueden ser de dos tipos: enteros y reales.

—

Carácter. Se emplean para representar un carácter dentro de un conjunto definido por el fabricante del equipo, de forma que cada uno de ellos se corresponde con un valor numérico entero sin signo, siguiendo un determinado código (EBCDIC, ASCII...).

—

Lógico. Se emplean para representar únicamente dos valores, 1 ó 0, Verdadero o Falso.

3.2.

Dato derivado (puntero)

Se emplea para contener la dirección de memoria de otra variable. Una variable tipo puntero debe ser definida con el mismo tipo de la variable que va a referenciar o apuntar. Este tipo de variable es de gran utilidad para realizar operaciones con estructuras y para llamadas a módulos.

3.3.

Datos estructurados Podemos encontrar varios tipos de datos estructurados: •

Datos internos Son los que residen en la memoria principal del ordenador. Por ejemplo, una tabla bidimensional de números reales.

•

Datos externos Son los que residen en un soporte externo a la memoria principal, es decir, memoria auxiliar; por ejemplo un fichero guardado en disco duro.

•

Datos estáticos Son aquellos cuyo tamaño queda definido en la compilación del programa y no se puede modificar durante la ejecución del mismo. Por ejemplo una tabla de alumnos.

•

Datos dinámicos Son aquellos cuyo tamaño puede ser modificado durante la ejecución del programa. Por ejemplo, una lista, una pila, una cola, etc.

•

Datos lineales Son los que pueden estar enlazados con un solo elemento anterior y uno sólo posterior. Por ejemplo una pila.

3-10


•

Datos no lineales Son los que pueden enlazarse con más de un elemento anterior y más de uno posterior. Por ejemplo, un árbol.

•

Datos compuestos Son los formados por el programador a base de tipos de datos básicos y derivados, pudiendo ser internos o externos.

4.

Operadores

Los operadores son símbolos que sirven para conectar los datos facilitando la realización de diversas clases de operaciones. Pueden ser: OPERADOR Paréntesis

Aritméticos

Alfanuméricos

Relacionales

Lógicos

SÍMBOLO ( )

SIGNIFICADO Paréntesis

** , ^ * / div , \ % , mod + -

Potencia Producto División División entera Módulo (resto de la división entera) Signo positivo o suma Signo negativo o resta

+ -

Concatenación Concatenación eliminando espacios

= = , = ! = , < > < <= > >= ! , NOT, no &&, AND, y I I , OR, o

Igual a Distinto a Menor que Menor o igual que Mayor que Mayor o igual que Negación Conjunción Disyunción

• Orden de prioridad de los operadores Dentro de las expresiones hay que respetar un orden de prioridad entre operadores que depende del lenguaje utilizado, pero de forma general se puede establecer el siguiente orden: 1. Paréntesis (comenzando por los más internos). 3-11


2. Signo. 3. Potencia. 4. Producto, división y módulo (con la misma prioridad). 5. Suma y resta (con la misma prioridad). 6. Concatenación. 7. Relacionales. 8. Negación. 9. Conjunción. 10. Disyunción.

5.

Clasificación general de instrucciones

Una instrucción puede ser considerada como un hecho o suceso de duración limitada que genera unos cambios previstos en la ejecución de un programa, por lo que debe ser una acción previamente estudiada y definida.

5.1.

Instrucciones de definición de datos

Son aquellas instrucciones utilizadas para informar al procesador del espacio que debe reservar en memoria, con la finalidad de almacenar un dato mediante el uso de variables simples o estructuras de datos más complejas como, por ejemplo, tablas. La definición consiste en indicar un nombre a través del cual haremos referencia al dato y un tipo a través del cual informaremos al procesador de las características y espacio que deberá reservar en memoria.

Ejemplo.- int x;

5.2.

Instrucciones primitivas

Se consideran como tal las instrucciones de asignación y las instrucciones de entrada/salida. •

Instrucciones de entrada Son aquellas instrucciones encargadas de recoger el dato de un periférico o dispositivo de entrada (por ejemplo el teclado, un ratón, un escáner, etc.) y seguidamente almacenarlo en memoria en una variable previamente definida, para la cual se ha reservado suficiente espacio en memoria.

Ejemplo.- scanf (“%d”, &x); 3-12


En el supuesto de leer varios valores consecutivos, con la intención de almacenarlos en variables diferentes, lo indicaremos situando uno a continuación del otro separados por comas. •

Instrucciones de asignación Son aquellas instrucciones cuyo cometido es almacenar un dato o valor simple obtenido como resultado de evaluar una expresión, en una variable previamente definida y declarada.

Ejemplo.- x=9; •

Instrucciones de salida Son aquellas instrucciones encargadas de recoger datos procedentes de variables o los resultados obtenidos de expresiones evaluadas y depositarlos en un periférico o dispositivo de salida (por ejemplo, la pantalla, una impresora, un plotter, etc.).

Ejemplo.- printf (“El resultado es: %d”, x); En el supuesto de escribir varios valores o resultados de forma consecutiva, lo indicaremos situando uno a continuación del otro y separados por comas, de la misma forma que ocurría con las instrucciones de entrada.

5.3.

Instrucciones compuestas

Son aquellas instrucciones que no pueden ser ejecutadas directamente por el procesador, y están constituidas por un bloque de acciones agrupadas en subrutinas, subprogramas, funciones o módulos.

5.4.

Instrucciones de control

Son utilizadas para controlar la secuencia de ejecución de un programa, así como determinados bloques de instrucciones. Se clasifican en:

5.4.1. Instrucciones de Salto Son aquellas que alteran o rompen la secuencia normal de ejecución de un programa, permitiendo la posibilidad de retornar el control de ejecución al punto de llamada. Pueden ser: • Condicionales Son aquellas que alteran la secuencia de ejecución sólo cuando una condición especificada sea cierta. 3-13


• Incondicionales Son aquellas que alteran la secuencia normal de ejecución siempre, ya que no van acompañadas de ninguna condición para que se produzcan.

Es necesario indicar, que si bien muchos lenguajes de programación las mantienen entre sus instrucciones por mera compatibilidad no es deontológicamente correcto utilizarlas porque rompen toda lógica de seguimiento del programa cuando hablamos de programación tanto estructurada como orientada a objetos. En la actualidad estas instrucciones son utilizadas en el lenguaje 3-14


ensamblador que utiliza las instrucciones JMP, que es el acrónimo de salto.

5.4.2. Instrucciones condicionales Son aquellas que controlan la ejecución o la no ejecución de una o más instrucciones en función de que se cumpla o no una condición previamente establecida. •

Sí

No

Alternativa simple

if (condición) { instrucciones } •

Alternativa doble

if(condición){ instrucciones }else{ instrucciones } Sí

•

No

Alternativa múltiple Es similar a la doble pero con más de dos posibilidades de salida del flujo del programa.

3-15


if(condición){ instrucciones } else if(condición){ instrucciones

switch(x){ case 1: instrucciones break; case 2: instrucciones break;

} else if(condición){ instrucciones

… case n:

}

instrucciones break; default: break;

… else { instrucciones }

•

}

Alternativa anidada (condicionales anidados)

if(condición){ instrucciones if(condición){ instrucciones if(condición){ instrucciones } } } 5.4.3. Instrucciones repetitivas (bucles) Son aquellas que permiten variar o alterar la secuencia de un programa haciendo posible que un grupo de acciones se ejecute más de una vez de forma consecutiva. Reciben el nombre de bucles.

No

Sí

•

Estructura Mientras

while(condicion) { … instrucciones

3-16


…. } Permite ejecutar un bloque de instrucciones entre 0 y n veces. •

Estructura Repetir-Mientras

do{ … instrucciones … } while(condición); Permite ejecutar un bloque de instrucciones entre 1 y n veces.

•

Sí

No

Estructura Para

for (inicialización; condición _ final; incremento o decremento){ … instrucciones … } Permite ejecutar un bloque de instrucciones una cantidad de veces fijada de antemano.

6.

Recursividad

La recursividad es una técnica muy potente de programación que puede utilizarse en sustitución de las iteraciones (instrucciones repetitivas) o bucles en ciertos problemas. Esta técnica consiste, básicamente, en permitir que un subprograma se llame a sí mismo. El uso de la recursividad es adecuado en problemas a resolver que tengan una clara, definición recursiva (como, por ejemplo, el factorial de un número) y permite desarrollar programas más simples y elegantes. A pesar de ello la recursividad es menos eficiente que los bucles. Diremos entonces que un método es recursivo si entre sus instrucciones tiene una llamada a sí mismo, en la cual mantiene una pila con los valores procesados.

3-17


función f (parámetros) { … instrucciones; … f(parámetros); } Ejemplo del Cálculo del factorial de 5 escrito en Java:

public class Factoriales { static int factorial(int numero){ if ( numero <= 1 ) { return 1; } else { return numero*factorial(numero-1); } } public static void main(String args[]){ System.out.println(factorial(5)); } }

7.

Procedimientos, funciones y parámetros

El diseño descendente o top-down consiste en una serie de descomposiciones sucesivas del programa inicial, que describen el refinamiento progresivo del repertorio de instrucciones que configuran un programa. Un programa diseñado con top-down quedará claramente constituido por dos partes claramente diferenciadas:

3-18

•

Programa principal: describe la solución completa del problema y consta principalmente de llamadas a subprogramas. También puede contener otras instrucciones.

•

Subprogramas: se encuentran agrupados en diferente lugar que el programa principal. Su estructura básica coincide con la de un programa, con algunas diferencias en su encabezamiento y finalización. La función de un subprograma es resolver de modo independiente una parte del problema. Un subprograma sólo se ejecuta cuando es llamado por el programa principal o por otro subprograma.


Esta división en módulos se debe terminar cuando en los módulos se definan tareas específicas a realizar. La parte de interconexión entre las subrutinas no debe de tener problemas si el paso de datos (parámetros) entre ellos se especifica claramente. Estos módulos pueden estar ya creados por otros programadores y almacenados en librerías, con lo cual nosotros solo tendríamos que invocarlos para poder usarlos. Como consecuencia de esta técnica de diseño surgen conceptos como:

7.1.

—

Parámetros.

—

Procedimientos.

—

Funciones.

—

Recursividad.

Procedimientos

Un procedimiento es un subprograma que realiza una tarea específica y que puede ser definido mediante cero, uno o “n” parámetros. Tanto la entrada como la devolución de resultados desde el procedimiento al programa llamador se realizará a través de los parámetros. El nombre de un procedimiento no está asociado a ninguno de los resultados que obtiene. Esta compuesto por un grupo de sentencias a las que se asigna un nombre (identificador) y constituye una unidad de programa. La tarea determinada al procedimiento se ejecuta siempre que se encuentra el nombre del procedimiento. La declaración indica las instrucciones a ejecutar. Su sintaxis es:

procedimiento nombreproc (lista de parametros) declaraciones locales inicio cuerpo del procedimiento (instrucciones) fin. Un procedimiento es llamado en un programa o dentro de otro procedimiento directamente por su nombre. Supongamos que queremos calcular el valor medio de tres datos. Definimos un procedimiento “lolo”:

Void lolo(par1, par2, par3){ //inicio procedimiento aux= (par1+ par2+ par3)/3 printf (“ El resultado es: “, aux); }fin procedimiento 3-19


Este supuesto programa nos imprime la media de tres elementos. Nos permiten su utilización sistemática tantas veces como queramos sin necesidad de escribir las instrucciones tantas veces como veces queremos utilizarla. Podría ser utilizada en cualquier lugar de nuestro programa haciendo una llamada del siguiente tipo: lolo(7,6,2) y nos imprimirá en pantalla: 5. Pero en este caso el modulo que ha llamado a este procedimiento no recibe ningún valor de retorno.

7.2.

Funciones

Una función es un subprograma que realiza una tarea específica y devuelve un resultado en el propio nombre de la función. Podría ser definida como un conjunto de instrucciones que permiten procesar las variables para obtener un resultado. Recibe como parámetros (argumentos) datos y devuelve un único resultado. Esta característica le diferencia esencialmente de un procedimiento. Su formato es el siguiente:

tipo_develto funcion nombrefuncion (p1,p2,...) : declaraciones locales inicio cuerpo de la función nombrefuncion // valor a devolver fin Una función es llamada por medio de su nombre, en una sentencia de asignación o en una sentencia de salida. Supongamos que queremos calcular el valor medio de tres datos. Definimos una función “lolo”:

int lolo(par1, par2, par3){ //inicio función aux= (par1+ par2+ par3)/3 return(aux) }fin función Este supuesto programa nos permitiría calcular la media de tres elementos. Lo interesante de utilizar este tipo de funciones es que ellas nos permiten su utilización sistemática tantas veces como queramos sin necesidad de escribir las instrucciones tantas veces como veces queremos utilizarla. Esta función suma podría ser utilizada en cualquier lugar de nuestro programa haciendo una llamada del siguiente tipo: lolo(7,6,2) El modulo llamante recibiría como valor de retorno: 15

3-20


7.3.

Parámetros

Un subprograma puede realizar, al igual que un programa, operaciones de E/S. Sin embargo, es frecuente que sus datos de entrada y sus resultados provengan y sean enviados del y al programa o subprograma llamante, respectivamente. Para ello, se utilizan los parámetros. Cada vez que se realiza una llamada a un subprograma, los datos de entrada le son pasados por medio de una variable, y, de forma análoga, cuando termina la ejecución del subprograma, los resultados se devuelven mediante esas mismas variables o mediante otras. Existen dos tipos de parámetros: •

Parámetros formales: variables locales de un subprograma, utilizados tanto en la emisión de datos como en la recepción.

•

Parámetros actuales: variables y datos enviados en cada llamada de subprograma, por el programa o subprograma llamante.

Los parámetros formales son siempre fijos para cada subprograma, mientras que los parámetros actuales pueden ser modificados en cada llamada. En cualquier caso, tiene que haber una correspondencia entre los parámetros formales y los actuales. El proceso de emisión y recepción de datos y resultados mediante variables de enlace se denomina paso de parámetros. Se pueden pasar parámetros de dos formas diferentes:

8. 8.1.

—

Por valor: en este caso, el parámetro actual no puede ser modificado por su programa, el cual copia su valor en el parámetro formal correspondiente para poder utilizarlo.

—

Por referencia: cuando un parámetro actual se pasa por referencia se proporciona la dirección o referencia de la variable, con lo que el subprograma llamante la utiliza como propia, modificándola si es necesario. La utilización de esta forma de pasar parámetros supone un ahorro de memoria, debido a que la variable local correspondiente no existe físicamente, sino que es asociada a la global en cada llamada. Es evidente que también supone el riesgo de modificar de forma indeseada una variable global.

Vectores y registros Vectores

Un array o vector es una estructura de datos constituida por un número fijo de elementos, todos ellos del mismo tipo y ubicados en direcciones de memoria físicamente contiguas. 3-21


A las estructuras de datos cuyos elementos son del mismo tipo, con las mismas características, y que se referencian bajo un nombre o identificador común, reciben el nombre de vectores. Generalmente se definen los vectores como tablas de dimensión uno (unidimensionales). Al igual que las tablas unidimensionales, una tabla bidimensional es un conjunto de elementos del mismo tipo y características, que se referencian bajo un mismo nombre. Este tipo de estructuras también reciben el nombre de matrices. También reciben el nombre de poliedros aquellas tablas de tres o más dimensiones que al igual que las tablas unidimensionales y bidimensionales están constituidas por elementos del mismo tipo y características.

8.2.

Registros

Como ya hemos definido en otros capítulos un fichero es un conjunto de información relacionada entre sí y estructurada en unidades más pequeñas. A estas unidades mas pequeñas en las cuales podemos descomponer un fichero se les denomina “registros” que forman un bloque que puede ser manipulado de forma unitaria. Se pueden clasificar en: •

Registro lógico: las estructuras de datos homogéneas referentes a una misma entidad o cosa, dividida a su vez en elementos más pequeños denominados campos que pueden ser del mismo o diferente tipo. El registro es considerado en sí mismo como una unidad de tratamiento dentro del fichero.

•

Registro físico: también llamado bloque, es la cantidad de información que el sistema puede transferir como unidad, en una sola operación de E/S, entre la memoria principal del ordenador y los periféricos o dispositivos de almacenamiento. El tamaño del bloque o registro físico dependerá de las características del ordenador.

•

Registro bloqueado: un registro físico puede constar de un número variable de registros lógicos. Por tanto, suponiendo que utilizáramos como soporte de almacenamiento el disco, se podrían transferir varios registros lógicos de la memoria al disco y del disco a la memoria en una sola operación de E/S. Este fenómeno recibe el nombre de bloqueo y el registro físico así formado se llama bloque. Se conoce como factor de bloqueo al número de registros lógicos contenidos en un bloque o registro físico.

•

Registro expandido: es justamente el concepto contrario de registro bloqueado, es decir, cuando el registro lógico ocupa varios bloques se le da la denominación de registro expandido.

Los ficheros son estructuras de datos jerarquizadas.

3-22


9.

Estructura de un programa

Todo programa está constituido por un conjunto de órdenes o instrucciones capaces de manipular un conjunto de datos. Estas órdenes o instrucciones pueden ser divididas en tres grandes bloques claramente diferenciados, correspondientes cada uno de ellos a una parte del diseño de un programa: •

Entrada de datos En este bloque se engloban todas aquellas instrucciones que toman datos de un dispositivo o periférico externo, depositándolos posteriormente en memoria central o principal para poder ser procesados.

•

Proceso o algoritmo Engloba todas aquellas instrucciones encargadas de procesar la información o aquellos datos pendientes de elaborar y que previamente habían sido depositados en memoria principal para su posterior tratamiento. Finalmente, todos los resultados obtenidos en el tratamiento de dicha información son depositados nuevamente en memoria principal, quedando de esta manera disponibles. En definitiva, se puede considerar como una especie de caja negra capaz de albergar unos datos de entrada, realizar unos cálculos previamente definidos y proporcionar unos resultados adecuados. De cara al usuario del programa, cómo se realicen las operaciones de cálculo o se procesen los datos de entrada no es importante, siempre y cuando los resultados obtenidos sean los correctos.

•

Salida de datos o resultados Este bloque está formado por todas aquellas instrucciones que toman los resultados depositados en memoria principal una vez procesados los datos de entrada, enviándolos seguidamente a un dispositivo o periférico externo.

9.1.

Elementos auxiliares de programación

Los elementos auxiliares de programación son variables o conjuntos de variables creadas por el programador con el fin de facilitar la resolución del problema; no forman parte de los datos originales del problema. Entre los elementos auxiliares de programación podemos considerar:

9.1.1. Contadores Contadores son variables que se incrementan o decrementan en una cantidad constante cuando el flujo de control del programa pasa por una determinada posición; en dicho punto encontramos una sentencia del tipo: variable = variable ± incremento

Un contador suele estar asociado a un bucle que determina el número de iteraciones y por tanto de incrementos se tienen que producir para alcan3-23


zar la condición de salida del bucle y continuar; dicho contador no necesariamente es un número de veces, sino un valor determinado a alcanzar por la variable.

9.1.2. Acumuladores Acumuladores son variables que cambian su valor en dependiendo de una función matemática determinada en el programa; esta variable se diferencia de la variable tipo contador en que la variación no es fija, sino que adopta el valor determinado por una ecuación. La sentencia que lo determina es del tipo: variable = variable expresión (operación aritmética)

9.1.3. Interruptores Un interruptor o switch es una variable que solo puede tomar uno entre dos valores posibles: 1/0, si/no, on/off, verdadero/falso...; este tipo de variable permite la toma de decisión en el programa, de forma que cambie de valor cada vez que el flujo del programa pase por un punto determinado, mediante la siguiente sentencia: switch = 1 ... switch = switch * -1

9.2.

Prueba de programas

El objetivo específico de la fase de pruebas es encontrar la mayor cantidad posible de errores. La prueba ideal de un sistema sería exponerlo en todas las situaciones posibles. Así garantizaríamos su respuesta ante cualquier caso que se le presente en la ejecución real. Esto es imposible desde todos los puntos de vista. Probar un programa es someterle a todas las posible variaciones de los datos de entrada, tanto si son válidos como si no lo son. Probar es buscarle los fallos a un programa. La fase de pruebas absorbe una buena porción de los costes de desarrollo de software.

9.2.1. Prueba de unidades La prueba de unidades se plantea a pequeña escala, y consiste en ir probando uno a uno los diferentes módulos que constituyen una aplicación. Los criterios más habituales son los denominados de caja negra y de caja blanca. Se dice que una prueba es de caja negra cuando prescinde de los detalles del código y se limita a lo que se ve desde el exterior. Intenta descubrir casos y circunstancias en los que el módulo no hace lo que se espera de él. Por oposición al término "caja negra" se suele denominar "caja blanca" al caso contrario, es decir, cuando lo que se mira con lupa es el código que 3-24


está ahí escrito y se intenta que falle. Quizás sea más propia la denominación de "pruebas de caja transparente". A) Caja blanca o pruebas estructurales o pruebas de caja transparente Las pruebas de caja blanca consisten en probar el código fuente que forma la aplicación. Con la cobertura intentamos formalizar el código probándolo todo de principio a fin. Las pruebas de caja blanca nos sirven para aseverarnos de que un programa hace de modo adecuado los diferentes pasos para los cuales ha sido creado, pero no nos aseveran que haga bien lo que deseamos que haga el programa en su globalidad, la finalidad para la cual ha sido creado el programa. Tenemos varios tipos de coberturas: —

Cobertura de segmentos o cobertura de sentencias. Por segmento se entiende una secuencia de sentencias sin puntos de decisión. Como el ordenador está obligado a ejecutarlas una tras otra, es lo mismo decir que se han ejecutado todas las sentencias o todos los segmentos. El número de sentencias de un programa es finito. Se puede diseñar un plan de pruebas que vaya ejercitando más y más sentencias, hasta que hayamos probado todas.

—

Cobertura de ramas. Se trata de una ampliación de la cobertura de segmentos consistente en recorrer todas las posibles salidas de los puntos de decisión.

—

Cobertura de condición/decisión. Se trata de nuevo de una ampliación de la cobertura de ramas consistente en probar todos las posibles condiciones aunque estas estean formadas por expresiones complejas, como es el caso de una expresión dentro de un “if” que contenga un “||” (o).

—

Cobertura de bucles. Se trata de probar las sentencias de control de iteración, que tanta cantidad de errores suelen acarrear. Pueden llevar consigo expresión booleanas complejas.

En la práctica conviene acercarse al 100% de los segmentos del programa, logrando una buena cobertura de ramas, esto supone, juegos para probar entre el 60 y el 80% del código y dependiendo de la criticidad de la aplicación (sanitarias, centrales nucleares, aplicaciones militares) superar el 90% de segmentos. La ejecución de pruebas de caja blanca puede llevarse a cabo con un depurador (que permite le ejecución paso a paso o el uso de puntos de interrupción el los lugares que el programador desee). Esta tarea es muy tediosa, pero puede ser automatizada a través de la generación de los diversos valores que toman los distintos elementos del programa como son por ejemplo las ventanas de inspección. 3-25


B) Caja negra o pruebas de caja opaca o pruebas funcionales o pruebas de entrada/salida o pruebas inducidas por los datos Un programa puede estar perfecto en todos sus términos, y sin embargo no servir a la función que se pretende. Las pruebas de caja negra se centran en lo que se espera de un módulo, es decir, intentan encontrar casos en que el módulo no se atiene a su especificación. Por ello se denominan pruebas funcionales, y el probador se limita a suministrarle datos como entrada y estudiar la salida, sin preocuparse de lo que pueda estar haciendo el módulo por dentro. Las pruebas de caja negra se apoyan en la especificación de requisitos del módulo. De hecho, se habla de “cobertura de especificación” para dar una medida del número de requisitos que se han probado. El problema con las pruebas de caja negra no suele estar en el número de funciones proporcionadas por el módulo (que siempre es un número muy limitado en diseños razonables); sino en los datos que se le pasan a estas funciones. El conjunto de datos posibles suele ser muy amplio (por ejemplo, un entero). A la vista de los requisitos de un módulo, se sigue una técnica algebraica conocida como “clases de equivalencia”. Esta técnica trata cada parámetro como un modelo algebraico donde unos datos son equivalentes a otros. Si logramos partir un rango excesivamente amplio de posibles valores reales a un conjunto reducido de clases de equivalencia, entonces es suficiente probar un caso de cada clase, pues los demás datos de la misma clase son equivalentes. Una forma de identificar estas clases de equivalencia son aquellas que respondan a: •

Por debajo/en el/por encima del rango especificado para un tipo de dato.

•

Por debajo/en el/por encima de un valor concreto.

•

Que se encuentre en el conjunto o fuera de él.

•

Que sea verdadero o falso.

•

Utilización de los mismos criterios para los datos de salida.

Lograr una buena cobertura con pruebas de caja negra es un objetivo deseable; pero no suficiente a todos los efectos. Un programa puede pasar con holgura millones de pruebas y sin embargo tener defectos internos que surgen en el momento más inoportuno.

9.2.2

Pruebas de integración

Las pruebas de integración y de aceptación son pruebas a mayor escala, que puede llegar a dimensiones industriales cuando el número de módulos es muy elevado, o la funcionalidad que se espera del programa es muy compleja. 3-26


Las pruebas de integración se centran en probar la coherencia semántica entre los diferentes módulos, tanto de semántica estática (se importan los módulos adecuados; se llama correctamente a los procedimientos proporcionados por cada módulo), como de semántica dinámica (un módulo recibe de otro lo que esperaba). Normalmente estas pruebas se van realizando por etapas, englobando progresivamente más y más módulos en cada prueba. Las pruebas de integración se pueden empezar en cuanto tenemos unos pocos módulos, aunque no terminarán hasta disponer de la totalidad. En un diseño descendente (topdown) se empieza a probar por los módulos más generales; mientras que en un diseño ascendente se empieza a probar por los módulos de base. El planteamiento descendente tiene la ventaja de estar siempre pensando en términos de la funcionalidad global. El planteamiento ascendente evita tener que escribirse módulos ficticios, pues vamos construyendo pirámides más y más altas con lo que vamos teniendo. Las pruebas de integración se llevan a cabo durante la construcción del sistema, involucran a un número creciente de módulos y terminan probando el sistema como conjunto. Estas pruebas se pueden plantear desde un punto de vista estructural o funcional. Las pruebas estructurales de integración son similares a las pruebas de caja blanca; pero trabajan a un nivel conceptual superior. En lugar de referirnos a sentencias del lenguaje, nos referiremos a llamadas entre módulos. Se trata pues de identificar todos los posibles esquemas de llamadas y ejercitarlos para lograr una buena cobertura de segmentos o de ramas. Las pruebas funcionales de integración son similares a las pruebas de caja negra. Aquí trataremos de encontrar fallos en la respuesta de un módulo cuando su operación depende de los servicios prestados por otros módulos. Según nos vamos acercando al sistema total, estas pruebas se van basando más y más en la especificación de requisitos del usuario. Las pruebas finales de integración cubren todo el sistema y pretenden cubrir plenamente la especificación de requisitos del usuario. Además, a estas alturas ya suele estar disponible el manual de usuario, que también se utiliza para realizar pruebas hasta lograr una cobertura aceptable. En todas estas pruebas funcionales se siguen utilizando las técnicas de partición en clases de equivalencia y análisis de casos límite.

9.2.3. Pruebas de aceptación Las pruebas de aceptación son las que se plantea el cliente final, que decide qué pruebas va a aplicarle al producto antes de darlo por bueno y pagarlo. El objetivo del que prueba es encontrar los fallos lo antes posible, en todo caso antes de pagarlo y antes de poner el programa en producción.

3-27


Estas pruebas las realiza el cliente. Son básicamente pruebas funcionales, sobre el sistema completo, y buscan una cobertura de la especificación de requisitos y del manual del usuario. Estas pruebas no se realizan durante el desarrollo, pues sería impresentable de cara al cliente; sino una vez pasadas todas las pruebas de integración por parte del desarrollador. —

Las pruebas alfa consisten en invitar al cliente a que venga al entorno de desarrollo a probar el sistema. Se trabaja en un entorno controlado y el cliente siempre tiene un experto a mano para ayudarle a usar el sistema y para analizar los resultados.

—

Las pruebas beta vienen después de las pruebas alfa, y se desarrollan en el entorno del cliente, un entorno que está fuera de control. Aquí el cliente se queda a solas con el producto y trata de encontrarle fallos de los que informa al desarrollador.

Las pruebas alfa y beta son habituales en productos que se van a vender a muchos clientes. Algunos de los potenciales compradores se prestan a estas pruebas bien por ir entrenando a su personal con tiempo, bien a cambio de alguna ventaja económica. La experiencia muestra que estas prácticas son muy eficaces.

9.3.

Verificación y validación La verificación y validación tiene por objetivo: —

Detectar y corregir los defectos cuanto antes, disminuir los riesgos y las desviaciones.

—

Mejorar la calidad y la fiabilidad de los productos “software”.

—

Mejorar la visibilidad de la gestión y valorar rápidamente los cambios propuestos.

—

Detectar y corregir los defectos en el ciclo de vida del “software”.

—

Valorar rápidamente los cambios propuestos y sus consecuencias.

No es por ejemplo un objetivo deducir el tamaño y el tiempo de ejecución del “software”. Verificación y validación no son términos equivalentes que puedan usarse indistintamente cuando se habla del software. VERIFICACIÓN VALIDACIÓN

productos correctos los productos correctos acordes con los requerimientos

El objetivo de la validación del software es la corrección del producto final respecto a las necesidades del usuario. La técnica más tradicional de validación son las pruebas del software. 3-28


Las principales técnicas de verificación son las revisiones y auditorias de “software”. Entre las actividades de verificación se encuentran comprobar la adecuación de los requisitos, determinar la adecuación del diseño y aplicar los datos de prueba. Una de las actividades de la verificación seria realizar análisis de valores límites. El objetivo de las revisiones técnicas es evaluar un producto intermedio para ver que se ajusta a las especificaciones, para comprobar que el desarrollo se está haciendo de acuerdo con los planes y que los cambios en el producto se realizan adecuadamente. Uno de los objetivos principales de las inspecciones es comprobar si el producto satisface sus especificaciones o los atributos de calidad fijados. El objetivo de la inspección es detectar y registrar los defectos. Uno de los objetivos principales del” walktrhough” es la evaluación de un producto para mejorarlo. El objetivo del “walktrough” es la evaluación de un producto para buscar defectos, omisiones y contradicciones, para mejorar el producto, para evaluar conformidad con normas y considerar posibles soluciones y alternativas a los problemas encontrados.

9.4.

Otras pruebas —

Aleatorias: basadas en que la probabilidad de descubrir un error es similar si se eligen pruebas al azar que si se utilizan criterios de cobertura.

—

Solidez (robustness testing): probando la reacción del sistema ante datos de entrada erróneos.

—

Aguante (stress testing): se trata de probar hasta donde aguanta un programa por razones internas, como puede ser trabajar con una carga de CPU del 90%, un disco con el 90% de espacio ocupado, con memoria ocupada forzando “swapping”.

—

Prestaciones (performance testing): se miden parámetros de consumo de consumo en cuanto a tiempo de respuesta, memoria ocupada, espacio en disco...

—

Interoperabilidad (interoperability testing): Buscan problemas de comunicación entre nuestra aplicación y otras con las que debe trabajar.

3-29

Tema 4 Lenguajes de interrogación de bases de datos. Estándar ANSI-SQL.


Guión-resumen

1. Lenguajes de interrogación de bases de datos 2. Subconjuntos de ANSI-SQL 2.1. Formas de utilizar ANSI-SQL 2.2. Sentencias SQL 3. Consultas de selección 3.1. Consultas básicas 3.2. Agrupamiento de registros y cálculo de totales con funciones agregadas 3.3. Subconsultas 3.4. Unión de consultas 3.5. Consultas de Combinación entre tablas 4. Funciones 4.1. Funciones colectivas 4.2. Funciones escalares

4-2

5. Mantenimiento de los datos. DML 6. Definición de los datos. DDL 6.1. Crear objetos 6.2. Modificar objetos 6.3. Eliminar objetos 7. Conceptos de interés 7.1. Variables 7.2. Control de ejecución 7.3. Transacciones 7.4. Cursores 7.5. Procedimientos almacenados (Store procedure) 7.6. Desencadenadores (triggers) 7.7. Bloqueos

Lenguajes de interrogación de bases de datos

1.


SQL (Structure Query Language o lenguaje estructurado de consulta) es un lenguaje que permite realizar operaciones diversas sobre datos almacenados en bases de datos relacionales, en los que la información se almacena en tablas bidimensionales, con los datos dispuestos en filas y columnas. Las sentencias de SQL permiten manejar conjuntos de registros, en lugar de un registro cada vez. La mayoría de los gestores, tanto los basados en una arquitectura cliente/servidor como otros entornos de programación, usan SQL como medio para acceder a los datos. SQL tiene una estructura relativamente simple, que le otorga una gran flexibilidad y potencia. El número de sentencias existentes en este lenguaje es muy reducido, por lo que facilita el aprendizaje del mismo. La versión original fue desarrollada por IBM y se denominaba SEQUEL; tenía unas pocas palabras reservadas utilizables con una sintaxis muy sencilla. Cada nuevo producto ha ido incorporando nuevas palabras reservadas, dando paso a nuevos “dialectos” de un mismo lenguaje (SQL de ORACLE, SQL/400 de IBM, Transact SQL Server de Microsoft, etc.). SQL ha sido estandarizado para lograr así un lenguaje más o menos común para todos los gestores de bases de datos, pero cada uno de estos lenguajes tiene algunos mandatos “propios” que no están incluidos en la lista de palabras reservadas por el American National Standard Institute SQL, o lo que es lo mismo, ANSI-SQL. Los mandatos se escriben en inglés, y no importa que estén en mayúsculas, minúsculas o intercaladas. Hay que respetar en todo momento el orden sintáctico de las sentencias, no sólo escribir los mandatos correctamente.

2.

Subconjuntos de ANSI-SQL

El uso principal de ANSI-SQL es consultar y modificar los datos almacenados en bases de datos relacionales, aunque el lenguaje permite realizar otras tareas. La clasificación de estas tareas permite hacer lo propio con el lenguaje, que se clasifica en: —

Consulta de datos (Data Query Language). DQL. Consta de sentencias que se encargan de visualizar, organizar y seleccionar los datos de las tablas. La sentencia principal es SELECT.

—

Manipulación de datos (Data Manipulation Language). DML. Son sentencias que permiten añadir, modificar y borrar filas sobre las tablas. Estas sentencias son INSERT (para añadir), UPDATE (para modificar) y DELETE (para borrar).

4-3


—

Definición de datos (Data Definition Language). DDL. Son sentencias para crear, modificar, renombrar o borrar objetos (CREATE, ALTER, RENAME y DROP), otorgar restricciones a los campos de las tablas (CHECK, CONSTRAINT y NOT NULL), establecer relaciones entre tablas (PRIMARY KEY, FOREIGN KEY y REFERENCES).

—

Control de datos (DATA CONTROL LANGUAGE). DCL. Controla la seguridad de los datos; por ejemplo, otorga permisos a usuarios para acceder a los datos. Las sentencias que realizan esto son GRANT Y REVOKE.

—

Procesado de transacciones (Transaction-Processing Language). TPL. Son sentencias encargadas de vigilar mandatos del DML para que funcionen de forma coherente. COMMIT, ROLLBACK y BEGIN TRANSACTION.

—

Control de cursores (Cursor-Control Language). CCL. Opera sobre filas individuales de una tabla, resultado que afecta a varios registros; FETCH INTO, UPDATE WHERE CURRENT, DECLARE CURSOR.

2.1.

Formas de utilizar ANSI-SQL

Los mandatos de SQL pueden ejecutarse en diferentes entornos y lenguajes de programación. Los métodos de uso son: •

Estáticos: —

SQL interactivo Las sentencias se escriben directamente por parte del usuario y el gestor las responde de manera directa. Un gestor, por ejemplo Access, nos brinda la posibilidad de ejecutar los mandatos directamente (dentro de la sección de consultas, vista SQL), en lugar de utilizar las opciones de los menús.

—

SQL inmerso en programas (Embedded SQL) Lenguajes de programación como C, Visual Basic, ASP o JavaScript permiten insertar mandatos de SQL entre sus líneas de código. Cuando se ejecuta el programa, un precompilador interpreta estas órdenes sql y las envía al Gestor de la base de datos. Por ejemplo SQLJ permite embeber sentencia SQL en programas escritos en Java. Un programa con SQL embebido es mucho más potente y rápido que si se utiliza el código del propio lenguaje, pues sql es el lenguaje que utilizan la mayoría de los gestores y la orden la ejecuta directamente.

—

SQL modular Permite compilar sentencias SQL por separado del lenguaje de programación, para posteriormente enlazarlas (link) con el resto de módulos del programa.

4-4


•

Dinámico: —

SQL dinámico Se dice que los anteriores son “sql estáticos”, pues los mandatos ya están escritos. Un ejemplo sería que, una vez que está corriendo un programa, éste permitiera al usuario escribir un sentencia sql y enviarla al gestor.

2.2.

Sentencias SQL Una sentencia SQL está compuesta por: —

Palabras predefinidas: tienen un significado propio. Todas las sentencias empiezan por una palabra predefinida. Ejemplos: SELECT, ORDER BY, etc.

—

Nombres de campos y de tablas: son meros identificadores inventados al crear la tabla y sus campos.

—

Contantes (literales): representan un valor predeterminado. Los datos alfanuméricos (texto) van entre apóstrofes.

—

Delimitadores: sirven para delimitar o separar a los anteriores. Son los paréntesis, las comas, espacio en blanco, etc.

—

Tipos de datos: •

Numéricos: VALOR

LONGITUD

DESCRIPCIÓN

BIT

1 byte

Valores enteros con un valor de 0 o 1

SMALLINT

2 bytes

Un entero corto entre -32,768 y 32,767

INT

4 bytes

Un entero largo entre -2,147,483,648 y 2,147,483,647

DECIMAL

4 bytes

Números de precisión y escala fija con valores de -10^38+1 a 10^38-1

REAL

4 bytes

Valores de precisión flotante desde -3,40E+38 a 3,40E+38

FLOAT

8 bytes

Valores de precisión flotante desde -1,79E+308 a 1,79E308

4-5


•

Alfanuméricos: VALOR

•

LONGITUD

DESCRIPCIÓN

CHAR

1 byte por carácter

Campos de caracteres de longitud fija por carácter Unicode con un tamaño máximo de 8.000 caracteres.

NCHAR


Datos Unicode de longitud fija con un tamaño máximo de 4.000 caracteres.

VARCHAR


Campos de caracteres de longitud variable no Unicode con un tamaño máximo de 8.000 caracteres.

NVARCHAR


Datos Unicode de longitud variable con un tamaño máximo de 4.000 caracteres.

TEXT


Campos de caracteres de longitud variable no Unicode con un tamaño máximo de 2.147.483.647 caracteres.

LONGITUD

DESCRIPCIÓN

Fecha y hora: VALOR

•

DATETIME

8 bytes

Valores de fecha y hora desde el 1 de enero de 1753 al 31 de Diciembre de 9999.

TIMESTAMP

8 bytes

Captura del sistema, un Instante.

Binarios: VALOR BINARY

4-6

LONGITUD 1 byte

DESCRIPCIÓN Datos binarios de longitud fija con un tamaño máximo de 8.000 bytes.


—

Operadores: •

Lógicos: OPERADOR

•

USO

AND

Es el "y" lógico. Evalúa dos condiciones y devuelve un valor de verdad solo si ambas son ciertas.

OR

Es el "o" lógico. Evalúa dos condiciones y devuelve un valor de verdad si alguna de las dos es cierta.

NOT

Negación lógica. Devuelve el valor contrario de la expresión.

Relacionales o de comparación: OPERADOR

•

USO

<

Menor que.

>

Mayor que.

<>

Distinto de.

<=

Menor o igual que.

>=

Mayor o igual que.

=

Igual que.

BETWEEN

Utilizado para especificar un intervalo de valores.

LIKE

Utilizado en la comparación de un modelo.

IN

Utilizado para especificar registros de una base de datos.

Aritméticos: OPERADOR

USO

()

Paréntesis

*

Multiplicación

/

División

+

Suma

-

Resta

%

Módulo

4-7


—

Cláusulas: Las cláusulas son condiciones de modificación utilizadas para definir los datos que desea seleccionar o manipular. CLÁUSULA

—

FROM

Utilizada para especificar la tabla de la cual se van a seleccionar los registros.

WHERE

Utilizada para especificar las condiciones que deben reunir los registros que se van a seleccionar.

GROUP BY

Utilizada para separar los registros seleccionados en grupos específicos.

HAVING

Utilizada para expresar la condición que debe satisfacer cada grupo.

ORDER BY

Utilizada para ordenar los registros seleccionados de acuerdo con un orden específico.

Funciones de Agregado: Las funciones de agregado se usan dentro de una clausura SELECT en grupos de registros para devolver un único valor que se aplica a un grupo de registros. FUNCIÓN

4-8

DESCRIPCIÓN

DESCRIPCIÓN

AVG

Utilizada para calcular el promedio de los valores de un campo determinado.

COUNT

Utilizada para devolver el número de registros de la selección.

SUM

Utilizada para devolver la suma de todos los valores de un campo determinado.

MAX

Utilizada para devolver el valor más alto de un campo especificado.

MIN

Utilizada para devolver el valor más bajo de un campo especificado


3.

Consultas de selección

SELECT [ predicado ] { * | tabla.* | [ tabla. ] campo1 [ AS alias1 ] [ , tabla.]campo2 [ AS alias2 ] [ , ... ] } FROM tabla [ , ... ] [ WHERE criterio ] [ NOT ] [ IN ] [ ( valor1, [ valor2, [ ... ] ] ) ] [ GROUP BY expresion_group ] [ HAVING criterio ] [ ORDER BY expresion_order [ ASC | DESC ] ] [ cláusula_subconsulta [cláusula_subconsulta [ ... ] ] ] Predicado

Palabra clave (ALL, DISTINCT, TOP) que puede seguir a la cláusula SELECT para restringir el número de registros que se obtienen.

Tabla

Nombre de la tabla de la que vamos a obtener los campos.

campo_n

Nombre de los campos que van a ser mostrados.

AS

The keyword that is used to signify that an alias is to be used in the place of the field name.

Alias

Nombre alternativo utilizado al mostrar los campos.

Criterio

Condición que determina que registros van a aparecer en la consulta.

NOT

Palabra clave que, utilizada como parte de un criterio o junto con el IN, permite indicar qué valores NO han de obtenerse en una consulta.

IN

Palabra clave que permite indicar una lista de valores dentro de la cual vamos a buscar.

Valor1

Parámetro usado en la cláusula IN para indicar la lista de valores en la que queremos buscar.

Expresion_group

Parámetro que especifica por qué campo(s) vamos a crear grupos.

Expresion_order

Parámetro que indica qué campo(s) vamos a utilizar para ordenar los resultados y con qué criterio.

ASC | des

Especifica que los resultados de la consultas van a ser ordenados en orden ASC Ascendente o DESC Descendente.

Clausula_subconsulta Una consulta anidada.

4-9


Las consultas de selección se utilizan para indicar al motor de datos que devuelva información de las bases de dato. Si la tabla estuviera vacía, no mostraría datos o iría acompañado de un mensaje indicando los 0 registros encontrados. Todos los ejemplos de consultas van a utilizar la tabla árboles: CLAVE

3.1.

TIPO ALTURA PRECIO

VENDIDO

FECHA

1 pino

2 10,00 €

No 01/01/2008

2 abeto

3 12,00 €

Sí 01/01/2008

3 pino

2 15,00 €

No 01/01/2008

4 cerezo

3 14,00 €

No 01/01/2008

5 pino

4 13,00 €

Sí 01/01/2008

6 abeto

3 18,00 €

No 02/01/2008

7 pino

2 15,00 €

No 02/01/2008

8 pino

5 14,00 €

No 02/01/2008

9 abeto

6 16,00 €

No 02/01/2008

10 cerezo

4 17,00 €

Sí 02/01/2008

Consultas básicas SELECT campos FROM tabla

TIPO ALTURA pino

2

abeto

3

pino

2

Podemos preceder del nombre del campo del nombre de la tabla en el caso de que varios campos coincidan en el nombre.

cerezo

3

pino

4

SELECT Clientes.Nombre, Clientes.Teléfono FROM Clientes

abeto

3

pino

2

pino

5

abeto

6

cerezo

4

Donde campos es la lista de campos que se deseen recuperar y tabla es el origen de los mismos, por ejemplo: SELECT Tipo, Altura FROM Arboles

4-10


En determinadas ocasiones nos puede interesar incluir una columna con un texto fijo en una consulta de selección; por ejemplo, supongamos que tenemos una tabla de empleados y deseamos recuperar sus tarifas semanales, podríamos realizar la siguiente consulta: SELECT Tipo,’Total:’, [Precio]+10 FROM arboles;

TIPO

EXPR1001

EXPR1002

pino

Total:

20,00 €

abeto

Total:

22,00 €

pino

Total:

25,00 €

...

...

...

TIPO

Total:

pino

20,00 €

abeto

22,00 €

pino

25,00 €

cerezo

24,00 €

...

...

También podemos darle una Alias al nuevo campo calculado del siguiente modo: SELECT Tipo, [Precio]+10 AS Total FROM arboles; Adicionalmente se puede especificar el orden en que se desean recuperar los registros de las tablas mediante la cláusula ORDER BY lista de campos. En donde lista de campos representa los campos a ordenar. Ejemplo:

TIPO ALTURA PRECIO

SELECT Tipo, Precio FROM arboles ORDER BY Precio; Se pueden ordenar los registros por más de un campo, como por ejemplo: SELECT CodigoPostal, Nombre, Telefono FROM Clientes ORDER BY CodigoPostal, Nombre

pino

2 10,00 €

abeto

3 12,00 €

pino

4 13,00 €

pino

5 14,00 €

cerezo

3 14,00 €

pino

2 15,00 €

pino

2 15,00 €

pino

6 16,00 €

cerezo

4 17,00 €

abeto

3 18,00 €

4-11


TIPO ALTURA PRECIO

Incluso se puede especificar el orden de los registros: ascendente mediante la cláusula (ASC - se toma este valor por defecto) o descendente (DESC) SELECT Tipo, Altura,Precio FROM arboles ORDER BYAltura DESC ,Precio;

abeto

2 10,00 €

pino

3 12,00 €

pino

4 13,00 €

cerezo

5 14,00 €

abeto

3 14,00 €

cerezo

2 15,00 €

abeto

2 15,00 €

pino

6 16,00 €

pino

4 17,00 €

pino

3 18,00 €

El predicado se incluye entre la cláusula y el primer nombre del campo a recuperar, los posibles predicados son: TIPO pino abeto pino cerezo pino abeto pino pino abeto cerezo

—

ALL: si no se incluye ninguno de los predicados se asume ALL. El Motor de base de datos selecciona todos los registros que cumplen las condiciones de la instrucción SQL y devuelve todos y cada uno de sus campos. No es conveniente abusar de este predicado ya que obligamos al motor de la base de datos a analizar la estructura de la tabla para averiguar los campos que contiene, es mucho más rápido indicar el listado de campos deseados. SELECT ALL Tipo FROM arboles SELECT * Tipo FROM arboles

4-12


—

TOP: devuelve un cierto número de registros que entran entre al principio o al final de un rango especificado por una cláusula ORDER BY (sino devolvería 4 registros elegidos arbitrariamente). Supongamos que queremos recuperar los 4 primeros registros de árboles ordenados por altura en descendente:

ALTURA 6 5 4 3

SELECT TOP 4 Altura FROM arboles ORDER BY Altura DESC

El predicado TOP no distingue entre valores iguales. No confundamos la anterior consulta con la consulta “obtener las cuatro alturas mayores de la tabla”. Vemos que el 4 sale dos veces. Tendríamos que utilizar DISTINCT para eliminar duplicados.

ALTURA 6 5 4

SELECT DISTINCT TOP 4 Altura FROM arboles ORDER BY Altura DESC

—

DISTINCT: omite los registros que contienen datos duplicados en los campos seleccionados. DISTINCT devuelve aquellos registros cuyos campos indicados en la cláusula SELECT posean un contenido diferente. SELECT DISTINCT Tipo FROM arboles

3

TIPO abeto cerezo pino

La cláusula WHERE puede usarse para determinar qué registros de las tablas enumeradas en la cláusula FROM aparecerán en los resultados de la instrucción SELECT. Después de escribir esta cláusula se deben especificar las condiciones expuestas en los dos primeros apartados de este capítulo. Si no se emplea esta cláusula, la consulta devolverá todas las filas de la tabla. WHERE es opcional, pero cuando aparece debe ir a continuación de FROM. SELECT Apellidos, Salario FROM Empleados WHERE Salario > 21000 SELECT Id, Existencias FROM Productos WHERE Existencias <= Pedido SELECT Apellidos, Nombre FROM Empleados WHERE Apellidos = 'King' SELECT * FROM Empleados WHERE Edad > 25 AND Edad < 50 SELECT * FROM Empleado WHERE (Edad > 25 AND Edad < 50) OR SUELDO=1 SELECT * FROM Empleados WHERE NOT Estado = 'Soltero' SELECT * FROM Empleados WHERE (Sueldo > 100 AND Sueldo < 500) OR (Provincia = 'Madrid' AND Estado = 'Casado') 4-13


Intervalos de Valores: para indicar que deseamos recuperar los registros, según el intervalo de valores de un campo, emplearemos el operador BETWEEN cuya sintaxis es: campo [NOT] BETWEEN valor1 AND valor2 (la condición Not es opcional) En este caso la consulta devolvería los registros que contengan en “campo” un valor incluido en el intervalo valor1, valor2 (ambos inclusive). Si anteponemos la condición Not devolverá aquellos valores no incluidos en el intervalo. SELECT * FROM Pedidos WHERE CodPostal BETWEEN 28000 AND 28999 (Devuelve los pedidos realizados en la provincia de Madrid) SELECT Apellidos, Salario FROM Empleados WHERE Salario BETWEEN 200 AND 300 SELECT Apellidos, Salario FROM Empl WHERE Apellidos BETWEEN 'Lon' AND 'Tol'; El Operador LIKE: se utiliza para comparar una expresión de cadena con un modelo en una expresión SQL. Su sintaxis es: expresión LIKE modelo En donde expresión es una cadena modelo o campo contra el que se compara expresión. Se puede utilizar el operador LIKE para encontrar valores en los campos que coincidan con el modelo especificado. Por modelo puede especificar un valor completo (Ana María), o se pueden utilizar caracteres comodín como los reconocidos por el sistema operativo para encontrar un rango de valores (LIKE ‘An%’). CARÁCTER

4-14

COMODÍN

DESCRIPCIÓN

%

Cualquier cadena compuesta por uno o más caracteres.

_ (underscore)

Cualquier carácter (sólo uno).

[ rango]

Cualquier carácter especificado dentro del rango.

[ ^ rango]

Cualquier carácter que no aparezca dentro del rango..

#

Cualquier dígito.

a-z

Rango de valores de la ‘a’ a la ‘z’ ambos inclusive


El operador LIKE se puede utilizar en una expresión para comparar un valor de un campo con una expresión de cadena. Por ejemplo, si introduce LIKE ‘C%’ en una consulta SQL, la consulta devuelve todos los valores de campo que comiencen por la letra C. El ejemplo siguiente devuelve los datos que comienzan con la letra P seguido de cualquier letra entre A y F y de tres dígitos: LIKE 'P[A-F]###' Este ejemplo devuelve los campos cuyo contenido empiece con una letra de la A a la D seguidas de cualquier cadena: LIKE '[A-D]%' En la tabla siguiente se muestra cómo utilizar el operador LIKE para comprobar expresiones con diferentes modelos. El Operador IN. Este operador devuelve aquellos registros cuyo campo indicado coincide con alguno de los en una lista. Su sintaxis es: expresión [NOT] IN (valor1, valor2, . . .) SELECT * FROM Pedidos WHERE Provincia IN ('Madrid', 'Barcelona', 'Sevilla') SELECT Nombre FROM Empleados WHERE Ciudad IN ('Sevilla', 'Los Angeles')

3.2.

Agrupamiento de registros y cálculo de totales con funciones agregadas

La cláusula GROUP BY combina los registros con valores idénticos, en la lista de campos especificados, en un único registro. Para cada grupo se calcula un totalizado si se incluye una función SQL agregada, como por ejemplo SUM o COUNT dentro de la instrucción SELECT. GROUP BY es opcional. A menos que contenga un dato Memo u Objeto OLE, un campo de la lista de campos GROUP BY puede referirse a cualquier campo de las tablas que aparecen en la cláusula FROM, incluso si el campo no está incluido en la instrucción SELECT, siempre y cuando la instrucción SELECT incluya al menos una función SQL agregada. Todos los campos de la lista de campos de SELECT deben, o bien incluirse en la cláusula GROUP BY o, como argumentos de una función SQL agregada. SELECT Id_Familia, SUM(Stock) FROM Productos GROUP BY Id_Familia Una vez que GROUP BY ha combinado los registros, HAVING muestra cualquier registro agrupado por la cláusula GROUP BY que satisfaga las condiciones de la cláusula HAVING. Se utiliza la cláusula WHERE para excluir aquellas filas que no desea agrupar, y la cláusula HAVING para filtrar sobre los valores calculados como totales. 4-15


SELECT Id_Familia SUM(Stock) FROM Productos WHERE NombreProducto LIKE BOS% GROUP BY Id_Familia HAVING SUM(Stock) > 100 —

AVG: función agregada que calcula la media aritmética de un conjunto de valores contenidos en un campo especificado de una consulta. Su sintaxis es AVG (expr) donde expr representa el campo que contiene los datos numéricos para los que se desea calcular la media o una expresión que realiza un cálculo utilizando los datos de dicho campo. La media calculada por AVG es la media aritmética (la suma de los valores dividido por el número de valores). La función AVG no incluye ningún campo Null en el cálculo. SELECT AVG (Gastos) AS Promedio FROM Pedidos WHERE Gastos > 100

—

COUNT: calcula el número de registros que hemos obtenido al ejecutar la consulta. Su sintaxis es COUNT(expr) donde expr contiene el nombre del campo que desea contar. Los operandos de expr pueden incluir el nombre de un campo de una tabla, una constante o una función (la cual puede ser intrínseca o definida por el usuario pero no otras de las funciones agregadas de SQL). Puede contar cualquier tipo de datos incluso texto. Aunque expr puede realizar un cálculo sobre un campo, COUNT simplemente cuenta el número de registros sin tener en cuenta qué valores se almacenan en los registros. La función COUNT no cuenta los registros que tienen campos null a menos que expr sea el carácter comodín asterisco (*). Si utiliza un asterisco, COUNT calcula el número total de registros, incluyendo aquellos que contienen campos null. COUNT (*) es considerablemente más rápida que COUNT (Campo). No se debe poner el asterisco entre dobles comillas ('*'). SELECT COUNT(*) AS Total FROM Pedidos Si expr identifica a múltiples campos, la función COUNT cuenta un registro sólo si al menos uno de los campos no es Null. Si todos los campos especificados son Null, no se cuenta el registro. Hay que separar los nombres de los campos con ampersand (&). SELECT COUNT(FechaEnvío & Transporte) AS Total FROM Pedidos Podemos hacer que el gestor cuente los datos diferentes de un determinado campo: SELECT COUNT(DISTINCT Localidad) AS Total FROM Pedidos

—

4-16

MAX y MIN: devuelven el mínimo o el máximo de un conjunto de valores contenidos en un campo específico de una consulta. Su sintaxis es MIN(expr) y MAX(expr), en donde expr es el campo sobre


el que se desea realizar el cálculo. Expr puede incluir el nombre de un campo de una tabla, una constante o una función (la cual puede ser intrínseca o definida por el usuario pero no otras de las funciones agregadas de SQL). SELECT MIN(Gastos) AS ElMin FROM Pedidos WHERE Pais = 'España' SELECT MAX(Gastos) AS ElMax FROM Pedidos WHERE Pais = 'España' —

SUM: devuelve la suma del conjunto de valores contenido en un campo específico de una consulta. Su sintaxis es: SUM(expr) en donde expr representa el nombre del campo que contiene los datos que desean sumarse o una expresión que realiza un cálculo utilizando los datos de dichos campos. Los operandos de expr pueden incluir el nombre de un campo de una tabla, una constante o una función (la cual puede ser intrínseca o definida por el usuario pero no otras de las funciones agregadas de SQL). SELECT SUM(PrecioUnidad * Cantidad) AS Total FROM DetallePedido

Ejemplos de Totalizados sobre la tabla árboles. SELECT Count(Clave) AS CuentaDeClave FROM arboles Contamos el campo clave y nos devuelve 10 registros. No hemos agrupado por ningún campo, razón por la cual los diez registros forman un único grupo y obtenemos un único totalizado.

CONSULTA1 CuentaDeClave 10

SELECT Count(Clave) AS CuentaDeClave,Tipo FROM arboles GROUP BY Tipo; Ídem al anterior, pero agrupando por Tipo. Como tenemos tres tipos distintos de árboles, por cada grupo obtenemos un total que nos dice cuántos registros hay en cada grupo.

CONSULTA1 CuentaDeClave

Tipo

3

Abeto

2

Cerezo

5

Pino

SELECT Tipo, Count(Clave) AS CuentaDeClave, Max(Altura) AS MáxDeAltura, Min(Altura) AS MínDeAltura, Avg(Altura) AS PromedioDeAltura FROM arboles GROUP BYTipo; CONSULTA1 Tipo

CuentaDeClave

MáxDeAltura

MínDeAltura

PromedioDeAltura

Abeto

3

6

3

4

Cerezo

2

4

3

3,5

Pino

5

5

2

3

4-17


SELECT Tipo,Altura, Sum(Precio) AS SumaDePrecio FROM arboles GROUP BY Tipo,Altura; CONSULTA1 Tipo

Altura

Suma De Precio

Abeto

3

30,00 €

Abeto

6

16,00 €

Cerezo

3

14,00 €

Cerezo

4

17,00 €

Pino

2

40,00 €

Pino

4

13,00 €

Pino

5

14,00 €

Primer ejemplo de un totalizado en el que se agrupa por dos campos a la vez, El tipo de árbol y la Altura del mismo. Se han de hacer grupos en los que coincidan el tipo y la altura. Por ello obtenemos abetos de 3 y de 6.

SELECT Tipo, Sum(Precio) AS SumaDePrecio FROM arboles WHERE Tipo="pino" GROUP BY arboles.Tipo; CONSULTA1 Tipo

Suma De Precio

En este caso añadimos un criterio con Where para limitar el número de registros que intervienen en la consulta. Sólo quiero totalizar los pinos.

67,00 €

Pino

SELECT Tipo, Sum( Precio) AS Suma arboles GROUP BYTipo HAVING Sum(.Precio)>40 CONSULTA1 Tipo

Suma

Abeto

46,00 €

Pino

67,00 €

3.3.

Y ahora ponemos un criterio al totalizado utilizando HAVING. Sólo quiero aquellas sumas mayores de 40.

Subconsultas

Una subconsulta es una instrucción SELECT anidada dentro de una instrucción SELECT, SELECT...INTO, INSERT...INTO, DELETE, o UPDATE o dentro de otra subconsulta. Puede utilizar tres formas de sintaxis para crear una subconsulta: comparación [ANY | ALL | SOME] (instrucción sql) expresión [NOT] IN (instrucción sql) 4-18


[NOT] EXISTS (instrucción sql) Tablas que van a utilizarse en los ejemplos de consultas anidadas. PADRES

HIJOS

Dni

Nombre

Altura

Fecha Nacimiento

1

Luis

123

12/01/1987

1

p1

12

1

2

Ana

145

13/04/2000

2

p2

10

3

3

Jose

167

17/08/2001

3

p3

6

2

4

Alberto

187

23/04/1998

4

p1

7

4

5

Ana María

123

26/02/1986

5

p2

5

3

6

Alba

156

17/08/2001

6

p3

8

5

7

Santiago

159

23/04/1998

7

p1

9

4

8

Adolfo

100

01/01/2000

8

p2

4

6

9

p3

12

7

10

p1

19

1

11

p2

9

2

12

p3

8

3

13

p1

5

2

14

p2

4

4

15

p3

6

5

Factura Producto Cantidad

Dni

Se puede utilizar una subconsulta en lugar de una expresión en la lista de campos de una instrucción SELECT o en una cláusula WHERE o HAVING. En una subconsulta, se utiliza una instrucción SELECT para proporcionar un conjunto de uno o más valores especificados para evaluar en la expresión de la cláusula WHERE o HAVING. Se puede utilizar el predicado ANY o SOME, los cuales son sinónimos, para recuperar registros de la consulta principal, que satisfagan la comparación con cualquier otro registro recuperado en la subconsulta. El ejemplo siguiente devuelve todos los productos cuyo precio unitario es mayor que el de cualquier producto vendido con un descuento igual o mayor al 25 por ciento:

4-19


SELECT * FROM PADRES WHERE DNI = ANY (SELECT DNI FROM HIJOS WHERE PRODUCTO LIKE 'P3');

Dni

Nombre

Altura

Fecha Nacimiento

2

Ana

145

13/04/2000

Este ejemplo nos permite mostrar toda la información disponible de aquellos padres que han comprado el producto p3.

2

Jose

167

17/08/2001

5

Ana María

123

26/02/1986

7

Santiago

159

23/04/1998

El predicado ALL se utiliza para recuperar únicamente aquellos registros de la consulta principal que satisfacen la comparación con todos los registros recuperados en la subconsulta. Esto es mucho más restrictivo. SELECT * FROM Padres WHERE Dni<>All (SELECT dni from Hijos where Producto like 'P3');

Dni

Nombre

Altura

Fecha Nacimiento

1

Luis

123

12/01/1987

4

Alberto

187

23/04/1998

6

Alba

156

17/08/2001

El predicado IN se emplea para recuperar únicamente aquellos registros de la consulta principal para los que algunos registros de la subconsulta contienen un valor igual. SELECT * FROM Padres WHERE DNI IN (SELECT dni from Hijos where Producto like 'P3'); Este ejemplo nos permite mostrar toda la información disponible de aquellos padres que han comprado el producto p3. Como podemos observar es idéntica a la anterior.

Dni

Nombre

Altura

Fecha Nacimiento

2

Ana

145

13/04/2000

3

Jose

167

17/08/2001

5

Ana María

123

26/02/1986

7

Santiago

159

23/04/1998

=ANY es igual que IN Igualmente se puede utilizar NOT IN para recuperar únicamente aquellos registros de la consulta principal para los que no hay ningún registro de la subconsulta que contenga un valor igual. SELECT * FROM PADRES WHERE DNI IN (SELECT DNI FROM HIJOS WHERE PRODUCTO LIKE 'P3');

4-20

Dni

Nombre

Altura

Fecha Nacimiento

1

Luis

123

12/01/1987

4

Alberto

187

23/04/1998

6

Alba

156

17/08/2001


El predicado EXISTS (con la palabra reservada NOT opcional) se utiliza en comparaciones de verdad/falso para determinar si la subconsulta devuelve algún registro. SELECT * FROM PADRES WHERE EXISTS (SELECT * FROM HIJOS WHERE HIJOS.DNI=PADRES.DNI)

Dni

Nombre

Altura

Fecha Nacimiento

1

Luis

123

12/01/1987

2

Ana

145

13/04/2000

3

Jose

167

17/08/2001

4

Alberto

187

23/04/1998

5

Ana María

123

26/02/1986

6

Alba

156

17/08/2001

7

Santiago

159

23/04/1998

Esta consulta es equivalente a esta otra: SELECT * FROM padres WHERE DNI IN (SELECT DNI FROM HIJOS)

Utilizando NOT podemos buscar los padres que no tienen hijos. SELECT * FROM PADRES WHERE NOT EXISTS (SELECT * FROM HIJOS WHERE HIJOS.DNI=PADRES.DNI); Que es equivalente a: SELECT * FROM PADRES WHERE PADRES.DNI NOT IN (SELECT DNI FROM HIJOS);

Dni

Nombre

Altura

Fecha Nacimiento

8

Adolfo

100

01/01/2000

Se puede utilizar también alias del nombre de la tabla en una subconsulta para referirse a tablas listadas en la cláusula FROM fuera de la subconsulta. El ejemplo siguiente devuelve los nombres de los empleados cuyo salario es igual o mayor que el salario medio de todos los empleados con su mismo título. A la tabla Empleados se le ha dado el alias T1: SELECT Apellido, Nombre, Titulo, Salario FROM Empleados AS T1 WHERE Salario >= (SELECT AVG(Salario) FROM Empleados WHERE T1.Titulo =Empleados.Titulo) ORDER BY Titulo En el ejemplo anterior, la palabra reservada AS es opcional. SELECT Apellidos, Nombre, Cargo, Salario FROM Empleados WHERE Cargo LIKE 'Agente Ven*' AND Salario >ALL (SELECT Salario FROM Empleados WHERE Cargo LIKE '*Jefe*' OR Cargo LIKE *Director*' ) (Obtiene una lista con el nombre, cargo y salario de todos los agentes de ventas cuyo salario es mayor que el de todos los jefes y directores.) 4-21


SELECT DISTINCT NombreProducto, Precio_Unidad FROM Productos WHERE PrecioUnidad = (SELECT PrecioUnidad FROM Productos WHERE NombreProducto = 'Almíbar anisado') (Obtiene una lista con el nombre y el precio unitario de todos los productos con el mismo precio que el almíbar anisado.) SELECT Nombre, Apellidos FROM Empleados AS E WHERE EXISTS (SELECT * FROM Pedidos AS O WHERE O.IdEmpleado = E.IdEmpleado) (Selecciona el nombre de todos los empleados que han reservado al menos un pedido.) SELECT DISTINCT Pedidos.Id_Producto, Pedidos.Cantidad, (SELECT Productos.Nombre FROM Productos WHERE Productos.IdProducto = Pedidos.IdProducto) AS ElProducto FROM Pedidos WHERE Pedidos.Cantidad = 150 ORDER BY Pedidos.Id_Producto (Recupera el Código del Producto y la Cantidad pedida de la tabla pedidos, extrayendo el nombre del producto de la tabla de productos.) SELECT NumVuelo, Plazas FROM Vuelos WHERE Origen = 'Madrid' AND Exists (SELECT T1.NumVuelo FROM Vuelos AS T1 WHERE T1.PlazasLibres > 0 AND T1.NumVuelo=Vuelos.NumVuelo) (Recupera números de vuelo y capacidades de aquellos vuelos con destino Madrid y plazas libres) Supongamos ahora que tenemos una tabla con los identificadores de todos nuestros productos y el stock de cada uno de ellos. En otra tabla se encuentran todos los pedidos que tenemos pendientes de servir. Se trata de averiguar qué productos no se pueden servir por falta de stock. SELECT PedidosPendientes.Nombre FROM PedidosPendientes GROUP BY PedidosPendientes.Nombre

4-22


HAVING SUM(PedidosPendientes.Cantidad > (SELECT Productos.Stock FROM Productos WHERE Productos.IdProducto = PedidosPendientes.IdProducto)) Supongamos que en nuestra tabla de empleados deseamos buscar todas las mujeres cuya edad sea mayor a la de cualquier hombre: SELECT Empleados.Nombre FROM Empleados WHERE Sexo = 'M' AND Edad > ANY (SELECT Empleados.Edad FROM Empleados WHERE Sexo ='H' ) o lo que sería lo mismo: SELECT Empleados.Nombre FROM Empleados WHERE Sexo = 'M' AND Edad > (SELECT Max( Empleados.Edad )FROM Empleados WHERE Sexo ='H' )

3.4.

Unión de consultas

Se utiliza la operación UNION para crear una consulta de unión, combinando los resultados de dos o más consultas o tablas independientes. Su sintaxis es: [TABLE] consulta1 UNION [ALL] [TABLE] consulta2 [UNION [ALL] [TABLE] consultaN [ ... ]] En donde: consulta1, consulta2, consultaN son instrucciones SELECT, el nombre de una consulta almacenada o el nombre de una tabla almacenada precedido por la palabra clave TABLE. Puede combinar los resultados de dos o más consultas, tablas e instrucciones SELECT, en cualquier orden, en una única operación UNION. El ejemplo siguiente combina una tabla existente llamada Nuevas Cuentas y una instrucción SELECT: TABLE [Nuevas Cuentas] UNION ALL SELECT * FROM Clientes WHERE [Cantidad pedidos] > 1000 Si no se indica lo contrario, no se devuelven registros duplicados cuando se utiliza la operación UNION, no obstante puede incluir el predicado ALL para asegurar que se devuelven todos los registros. Esto hace que la consulta se ejecute más rápidamente. Todas las consultas en una operación UNION deben pedir el mismo número de campos, no obstante los campos no tienen por qué tener el mismo tamaño o el mismo tipo de datos. Se puede utilizar una cláusula GROUP BY y/o HAVING en cada argumento consulta para agrupar los datos devueltos. Puede utilizar una cláusula ORDER BY al final del último argumento consulta para visualizar los datos devueltos en un orden específico. SELECT [Nombre de compañía], Ciudad FROM Proveedores 4-23


WHERE País = 'Brasil' UNION SELECT [Nombre de compañía], Ciudad FROM Clientes WHERE País = "Brasil" (Recupera los nombres y las ciudades de todos proveedores y clientes de Brasil) SELECT [Nombre de compañía], Ciudad FROM Proveedores WHERE País = 'Brasil' UNION SELECT [Nombre de compañía], Ciudad FROM Clientes WHERE País = 'Brasil' ORDER BY Ciudad (Recupera los nombres y las ciudades de todos proveedores y clientes radicados en Brasil, ordenados por el nombre de la ciudad) SELECT [Nombre de compañía], Ciudad FROM Proveedores WHERE País = 'Brasil' UNION SELECT [Nombre de compañía], Ciudad FROM Clientes WHERE País = 'Brasil' UNION SELECT [Apellidos], Ciudad FROM Empleados WHERE Región = 'América del Sur' (Recupera los nombres y las ciudades de todos los proveedores y clientes de Brasil y los apellidos y las ciudades de todos los empleados de América del Sur) TABLE [Lista de clientes] UNION TABLE [Lista de proveedores] (Recupera los nombres y códigos de todos los proveedores y clientes)

3.5.

Consultas de Combinación entre tablas

Las vinculaciones entre tablas se realiza mediante la cláusula INNER que combina registros de dos tablas siempre que haya concordancia de valores en un campo común. Su sintaxis es: Se puede utilizar una operación INNER JOIN en cualquier cláusula FROM. Esto crea una combinación por equivalencia, conocida también como unión interna. Las combinaciones equivalentes son las más comunes; éstas combinan los registros de dos tablas siempre que haya concordancia de valores en un campo común a ambas tablas. Se puede utilizar INNER JOIN con las tablas Departamentos y Empleados para seleccionar todos los empleados de cada departamento. Por el contrario, para seleccionar todos los departamentos (incluso si alguno de ellos no tiene ningún empleado asignado) se emplea LEFT OUTER JOIN (la tabla resultado incluye todas las filas de la tabla especificada a la izquierda o tabla dominante. Si los campos de la tabla no tienen correspon4-24


dencia en la subordinada, se completan con valores NULL) o todos los empleados (incluso si alguno no está asignado a ningún departamento), en este caso RIGHT OUTER JOIN (la tabla resultado incluye todas las filas de la tabla situada a la derecha o tabla dominante. Si los campos de la tabla no tienen correspondencia en la subordinada, se completan con valores NULL). Si se intenta combinar campos que contengan datos Memo u Objeto OLE, se produce un error. Se pueden combinar dos campos numéricos cualesquiera, incluso si son de diferente tipo de datos. El ejemplo siguiente muestra cómo podría combinar las tablas Categorías y Productos basándose en el campo IDCategoria: SELECT Nombre_Categoría, NombreProducto FROM Categorias INNER JOIN Productos ON Categorias.IDCategoria = Productos.IDCategoria En el ejemplo anterior, IDCategoria es el campo combinado, pero no está incluido en la salida de la consulta ya que no está incluido en la instrucción SELECT. Para incluir el campo combinado, incluir el nombre del campo en la instrucción SELECT, en este caso, Categorias.IDCategoria. También se pueden enlazar varias cláusulas ON en una instrucción JOIN, utilizando la sintaxis siguiente: SELECT campos FROM tabla1 INNER JOIN tabla2 ON tb1.campo1 comp tb2.campo1 AND ON tb1.campo2 comp tb2.campo2) OR ON tb1.campo3 comp tb2.campo3) También puede anidar instrucciones JOIN utilizando la siguiente sintaxis: SELECT campos FROM tb1 INNER JOIN (tb2 INNER JOIN [( ]tb3 [INNER JOIN [( ]tablax [INNER JOIN ...)] ON tb3.campo3 comp tbx.campox)] ON tb2.campo2 comp tb3.campo3) ON tb1.campo1 comp tb2.campo2 Un LEFT OUTER JOIN o un RIGHT OUTER JOIN puede anidarse dentro de un INNER JOIN, pero un INNER JOIN no puede anidarse dentro de un LEFT OUTER JOIN o un RIGHT OUTER JOIN. 4-25


Por ejemplo: SELECT DISTINCT SUM([Precio unidad] * [Cantidad]) AS [Ventas], [Nombre] & " " & [Apellidos] AS [Nombre completo] FROM [Detalles de pedidos], Pedidos, Empleados, Pedidos INNER JOIN [Detalles de pedidos] ON Pedidos. [ID de pedido] = [Detalles de pedidos].[ID de pedido], Empleados INNER JOIN Pedidos ON Empleados.[ID de empleado] = Pedidos.[ID de empleado] GROUP BY [Nombre] & " " & [Apellidos] Crea dos combinaciones equivalentes: una entre las tablas Detalles de pedidos y Pedidos, y la otra entre las tablas Pedidos y Empleados. Esto es necesario ya que la tabla Empleados no contiene datos de ventas y la tabla Detalles de pedidos no contiene datos de los empleados. La consulta produce una lista de empleados y sus ventas totales. Si empleamos la cláusula INNER en la consulta se seleccionarán sólo aquellos registros de la tabla de la que hayamos escrito a la izquierda de INNER JOIN que contengan al menos un registro de la tabla que hayamos escrito a la derecha. Para solucionar esto tenemos dos cláusulas que sustituyen a la palabra clave INNER, estas cláusulas son LEFT OUTER y RIGHT OUTER. LEFT OUTER toma todos los registros de la tabla de la izquierda aunque no tengan ningún registro en la tabla de la izquierda. RIGHT OUTER realiza la misma operación pero al contrario, toma todos los registros de la tabla de la derecha aunque no tenga ningún registro en la tabla de la izquierda. •

Consultas de Auto combinación La auto combinación se utiliza para unir una tabla consigo misma, comparando valores de dos columnas con el mismo tipo de datos. La sintaxis en la siguiente: SELECT alias1.columna, alias2.columna, ... FROM tabla1 as alias1, tabla2 as alias2 WHERE alias1.columna = alias2.columna AND otras condiciones Por ejemplo, para visualizar el número, nombre y puesto de cada empleado, junto con el número, nombre y puesto del supervisor de cada uno de ellos se utilizaría la siguiente sentencia: SELECT t.num_emp, t.nombre, t.puesto, t.num_sup,s.nombre, s.puesto FROM empleados AS t, empleados AS s WHERE t.num_sup = s.num_emp

•

Consultas de Combinaciones no Comunes La auto combinación se utiliza para unir una tabla consigo misma, comparando La mayoría de las combinaciones están basadas en la igualdad de valores de las columnas que son el criterio de la combinación. Las no comunes se basan en otros operadores de combinación, tales como NOT, BETWEEN, <>, etc.

4-26


La auto combinación se utiliza para unir una tabla consigo misma, comparando, por ejemplo, para listar el grado salarial, nombre, salario y puesto de cada empleado ordenando el resultado por grado y salario habría que ejecutar la siguiente sentencia: SELECT grados.grado,empleados.nombre, empleados.salario, empleados.puesto FROM empleados, grados WHERE empleados.salario BETWEEN grados.salarioinferior AND grados.salariosuperior ORDER BY grados.grado, empleados.salario Para listar el salario medio dentro de cada grado salarial habría que lanzar esta otra sentencia: SELECT grados.grado, AVG(empleados.salario) FROM empleados, grados WHERE empleados.salario BETWEEN grados.salarioinferior AND grados.salariosuperior GROUP BY grados.grado •

SELF JOIN SELF JOIN es una técnica empleada para conseguir el producto cartesiano de una tabla consigo misma. Su utilización no es muy frecuente, pero pongamos algún ejemplo de su utilización: Supongamos la siguiente tabla (el campo autor es numérico, aunque para ilustrar el ejemplo utilice el nombre): CÓDIGO (CÓDIGO

DEL LIBRO)

AUTOR (NOMBRE

B0012

1. Francisco López

B0012

2. Javier Alonso

B0012

3. Marta Rebolledo

C0014

1. Francisco López

C0014

2. Javier Alonso

D0120

2. Javier Alonso

D0120

3. Marta Rebolledo

DEL

AUTOR)

4-27


Queremos obtener, para cada libro, parejas de autores: SELECT A.Codigo, A.Autor, B.Autor FROM Autores A, Autores B WHERE A.Codigo = B.Codigo El resultado es el siguiente: AUTOR

AUTOR

1. Francisco López

1. Francisco López

1. Francisco López

2. Javier Alonso

1. Francisco López

3. Marta Rebolledo

2. Javier Alonso

2. Javier Alonso

2. Javier Alonso

1. Francisco López

2. Javier Alonso

3. Marta Rebolledo

3. Marta Rebolledo

3. Marta Rebolledo

3. Marta Rebolledo

2. Javier Alonso

3. Marta Rebolledo

1. Francisco López

1. Francisco López

1. Francisco López

1. Francisco López

2. Javier Alonso

2. Javier Alonso

2. Javier Alonso

2. Javier Alonso

1. Francisco López

2. Javier Alonso

2. Javier Alonso

2. Javier Alonso

3. Marta Rebolledo

3. Marta Rebolledo

3. Marta Rebolledo

3. Marta Rebolledo

2. Javier Alonso

Como podemos observar, las parejas de autores se repiten en cada uno de los libros, podemos omitir estas repeticiones de la siguiente forma: SELECT A.Codigo, A.Autor, B.Autor FROM Autores A, Autores B WHERE A.Codigo = B.Codigo AND A.Autor < B.Autor

4-28


El resultado ahora es el siguiente: AUTOR

AUTOR

1. Francisco López

2. Javier Alonso

1. Francisco López

3. Marta Rebolledo

1. Francisco López

2. Javier Alonso

2. Javier Alonso

3. Marta Rebolledo

Ahora tenemos un conjunto de resultados en formato Autor-CoAutor. Si en la tabla de empleados quisiéramos extraer todas las posibles parejas que podemos realizar, utilizaríamos la siguiente sentencia: SELECT Hombres.Nombre, Mujeres.Nombre FROM Empleados Hombre, Empleados Mujeres WHERE Hombre.Sexo = 'Hombre' AND Mujeres.Sexo = 'Mujer' AND Hombres.Id <>Mujeres.Id Para concluir supongamos la tabla siguiente: ID

NOMBRE

SUBJEFE

1

Marcos

6

2

Lucas

1

3

Ana

2

4

Eva

1

5

Juan

6

6

Antonio

Queremos obtener un conjunto de resultados con el nombre del empleado y el nombre de su jefe: SELECT Emple.Nombre, Jefes.Nombre FROM Empleados Emple, Empleados Jefe WHERE Emple.SuJefe = Jefes.Id

4.

Funciones

Una función representa un valor único que se obtiene aplicando unas determinadas operaciones a otros valores (argumentos). Hay dos tipos de funciones: 4-29


4.1.

Funciones colectivas Dan como resultado un único valor después de aplicar la función a un grupo de valores. SELECT AVG(sueldo), SUM (sueldo) MAX (sueldo) MIN (sueldo) COUNT (sueldo) FROM (empleados).

Da como resultado un único registro con cinco columnas. La primera columna dará como resultado la media aritmética de los sueldos de los empleados, la segunda el total del sueldo de todos los empleados, la tercera el sueldo máximo, la cuarta el sueldo mínimo y la quinta el total de registros que tiene la tabla.

4.2.

Funciones escalares Operan sobre un único dato y devuelven un único valor como resultado. FUNCIÓN

•

DESCRIPCIÓN

DATE

Obtiene la fecha y hora actual del sistema.

DAY (fecha)

Obtiene el día de una fecha como un valor entero.

MONTH(fecha)

Obtiene el mes de una fecha como un valor entero.

YEAR(fecha)

Obtiene el año de una fecha como un valor entero.

Funciones matemáticas FUNCIÓN

4-30

DESCRIPCIÓN

ABS(x)

Valor absoluto. Convierte números negativos en positivos, o deja sólo números positivos.

ACOS(x)

Obtiene el arcoseno.

ATAN(x)

Obtiene la arcotangente.

CEIL(x)

Obtiene el menor entero, mayor o igual que x. Redondeo hacia arriba.

COS(x)

Obtiene el coseno trigonométrico.

COT(x)

Obtiene la cotangente trigonométrica.

EXP(x)

Obtiene el valor del exponente.

FLOOR(x)

Obtiene el mayor entero, menor o igual que x. Redondeo hacia abajo.

INT(x)

Devuelve la parte entera.


FUNCIÓN

•

DESCRIPCIÓN

LOG(x)

Obtiene el logaritmo natural.

LOG10(x)

Obtiene el logaritmo base 10.

MOD(x,y)

Obtiene el resto de dividir x entre y.

PI

Obtiene el valor de la constante pi.

POWER(x,y)

Obtiene el valor de x elevado a y.

ROUND(x,y)

Redondea x a y lugares decimales. Si se omite y, x se redondea al entero más próximo.

SIGN(x)

Devuelve +1 si la x es positivo, 0 si es cero y -1 si es negativo.

SIN(x)

Obtiene el seno trigonométrico.

SQUARE(x)

Obtiene el cuadrado.

SQRT(x)

Obtiene la raíz cuadrada.

TAN(x)

Obtiene la tangente.

Funciones de cadena FUNCIÓN

DESCRIPCIÓN

ASCII(x)

Obtiene el código ASCII de x.

CHAR(x)

Obtiene el carácter ASCII cuyo código entero corresponde a x.

LEFT(x,y)

Obtiene los y caracteres de la izquierda de x.

LEN(x)

Obtiene el número de caracteres de x.

LOWER(x)

Obtiene x con todos sus caracteres convertidos a minúsculas.

LTRIM(x)

Obtiene x quitándoles los espacios iniciales.

REPLACE(x,y,z)

Encuentra todas las apariciones de y en x, reemplazándolas por z.

RIGHT(x,y)

Obtiene los y caracteres de la derecha de x.

RTRIM(x)

Obtiene x sin espacios a la derecha.

SPACE(x)

Obtiene x espacios.

SUBSTRING(x,y,z)

Obtiene z caracteres de x, comenzando en la posición y.

UPPER(x)

Obtiene x con todos sus caracteres convertidos a mayúsculas.

4-31


•

Funciones de conversación FUNCIÓN

5.

DESCRIPCIÓN

CTOD(x)

Convierte una cadena de caracteres a una fecha. Se puede utilizar un segundo parámetro para especificar el formato de la fecha devuelta: 0 (por defecto devuelve MM/DD/YY, 1 devuelve DD/MM/YY y 2 devuelve YY/MM/DD.

CAST(x,y)

Convierte la cadena y, pasada como argumento, en el tipo especificado x (si es posible).

DTOC(x)

Convierte una fecha x, a una cadena de caracteres. Un segundo parámetro opcional determina el formato del resultado: 0 (por defecto) devuelve MM/DD/YY,1 devuelve DD/MM/YY, 2 devuelve YY/MM/DD, 10 devuelve MM/DD/YYYY, 11 devuelve DD/MM/YYYY, 12 devuelve YYYY/MM/DD. Puede existir un tercer parámetro opcional para determinar el carácter que se quiere utilizar como separador. Si no se especifica se toma el (/).

STR(x,y)

Convierte un número x en una cadena. Devuelve y posiciones (incluyendo el punto decimal). Opcionalmente se puede incluir un tercer parámetro para indicar el número de dígitos a la derecha del punto decimal.

STRVAL(x)

Convierte un valor de cualquier tipo a una cadena de caracteres.

Mantenimiento de los datos. DML

El Lenguaje de Manipulación de Datos (DML) se compone de las instrucciones para crear y recuperar datos. Son sentencias que no devuelven ningún registro. Son las encargadas de mantener actualizados los datos que están almacenados en las tablas. •

DELETE La sentencia DELETE se utiliza para borrar registros de una tabla de la base de datos. No es posible eliminar el contenido de algún campo en concreto. Su sintaxis es: DELETE FROM Tabla [WHERE { condición }] La cláusula WHERE sigue el mismo formato que la vista en la sentencia SELECT y determina qué registros se borrarán. Cada sentencia DELETE borra los registros que cumplen la condición impuesta o todos si no se indica cláusula WHERE. DELETE FROM Empleados

4-32


Con el ejemplo anterior se borrarían todos los registros de la tabla Empleados. Se llama vaciado y sólo quedaría la estructura de la tabla. DELETE FROM Empleados WHERE Cargo = 'Vendedor' •

INSERT La sentencia INSERT se utiliza para añadir registros a las tablas de la base de datos. Puede ser de dos tipos: Insertar un único registro o insertar en una tabla los registros contenidos en otra tabla. Para insertar un único registro, la sintaxis es la siguiente: INSERT INTO Tabla (campo1, campo2, ..., campoN) VALUES (valor1, valor2, ..., valorN) Esta sentencia graba en el campo1 el valor1, en el campo2 y valor2 y así sucesivamente. Para insertar registros de otra tabla, la sintaxis es la siguiente: INSERT INTO Tabla (campo1, campo2, , campoN) SELECT TablaOrigen.campo1, TablaOrigen.campo2,,TablaOrigen.campoN FROM TablaOrigen En este caso se seleccionarán los campos 1,2,..., n de la TablaOrigen y se grabarán en los campos 1,2,.., n de la Tabla. La condición SELECT puede incluir la cláusula WHERE para filtrar los registros a copiar. Si Tabla y TablaOrigen poseen la misma estructura podemos simplificar la sintaxis a: INSERT INTO Tabla SELECT TablaOrigen.* FROM TablaOrigen De esta forma los campos de TablaOrigen se grabarán en Tabla, para realizar esta operación es necesario que todos los campos de TablaOrigen estén contenidos con igual nombre en Tabla. Con otras palabras que Tabla posea todos los campos de TablaOrigen (igual nombre e igual tipo). En este tipo de sentencia hay que tener especial atención con los campos contadores o autonuméricos puesto que al insertar un valor en un campo de este tipo se escribe el valor que contenga su campo homólogo en la tabla origen, no incrementándose como le corresponde. Si la tabla destino contiene una clave principal, hay que asegurarse que es única, y con valores no nulos; si no es así, no se agregarán los registros. INSERT INTO Empleados (Nombre, Apellido, Cargo) VALUES ('Luis', 'Sánchez', 'Becario')

4-33


INSERT INTO Empleados SELECT * FROM Vendedores WHERE Provincia = 'Madrid' INSERT INTO Oils (OilName, Latiname, Simple) VALUES(‘Super’, NULL, NULL) INSERT INTO MyOils (OilName, LatinName) SELECT OilName, LatinName FROM Oils WHERE (LEFT(OilName), 2) = ‘98’) •

UPDATE La sentencia UPDATE se utiliza para cambiar el contenido de los registros de una tabla de la base de datos. Su sintaxis es: UPDATE Tabla SET Campo1=Valor1, Campo2=Valor2, ... CampoN=ValorN [WHERE { condición }] UPDATE es especialmente útil cuando se desea cambiar un gran número de registros o cuando éstos se encuentran en múltiples tablas. Puede cambiar varios campos a la vez. La cláusula WHERE sigue el mismo formato que la vista en la sentencia SELECT y determina qué registros se modificarán. El ejemplo siguiente incrementa los valores Cantidad pedidos en un 10% y los valores Transporte en un 3% para aquellos que se hayan enviado al Reino Unido: UPDATE Pedidos SET Pedido = Pedidos * 1.1, Transporte = Transporte * 1.03 WHERE PaisEnvío = 'ES' UPDATE Empleados SET Grado = 5 WHERE Grado = 2 UPDATE Productos SET Precio = Precio * 1.1 WHERE Proveedor = 8 AND Familia = 3 Si en una consulta de actualización suprimimos la cláusula WHERE todos los registros de la tabla señalada serán actualizados. UPDATE Empleados SET Salario = Salario * 1.1 UPDATE Libros SET Precio = (SELECT AVG(Precio) FROM Libros WHERE Precio IS NOT NULL) WHERE Precio IS NULL

4-34


Con esta última sentencia se ha puesto precio a todos los libros que no lo tenían. Ese precio ha sido el resultante de calcular la media entre los libros que sí lo tenían. •

SELECT...INTO Esta sentencia se utiliza para seleccionar registros e insertarlos en una tabla nueva. Su sintaxis es: SELECT campo1, campo2, ..., campoN INTO NuevaTabla FROM TablaOrigen [WHERE { condición }] Las columnas de la nueva tabla tendrán el mismo tipo y tamaño que las columnas origen, y se llamarán con el nombre de alias de la columna origen o en su defecto con el nombre de la columna origen, pero no se transfiere ninguna otra propiedad del campo o de la tabla como por ejemplo las claves e índices. La sentencia SELECT puede ser cualquier sentencia SELECT sin ninguna restricción, puede ser una consulta multitabla, una consulta de resumen, una UNION ... SELECT * INTO Programadores FROM Empleados WHERE Categoria = 'Programador' Esta consulta crea una tabla nueva llamada Programadores con igual estructura que la tabla Empleados y copia aquellos registros cuyo campo Categoria sea “Programador”. Por ejemplo: Queremos enviarle a un representante una tabla con todos los datos personales de sus clientes para que les pueda enviar cartas etc... SELECT Numclie AS Codigo, Nombre, Direccion, Telefono INTO Susclientes FROM Clientes WHERE Repclie = '103' En el ejemplo anterior la nueva tabla tendrá cuatro columnas llamadas Codigo, Nombre, Direccion, Telefono y contendrá las filas correspondientes a los clientes del representante 103.

•

MERGE Se utiliza para seleccionar filas de una o más fuentes para la actualización o inserción en una tabla o vista. Puede especificar las condiciones para determinar si se debe actualizar o insertar en la tabla de destino o vista. MERGE es una afirmación determinista. No se puede actualizar la misma fila de la tabla de destino varias veces en la misma instrucción MERGE. Esta sentencia se utiliza para seleccionar registros e insertarlos en una tabla nueva. Su sintaxis es:

4-35


MERGE INTO tabla_destino USING tabla_origen ON (condición) WHEN MATCHED THEN UPDATE SET campo1 = valor1, campoN = valorN WHEN NOT MATCHED THEN INSERT (campo1, ...., campoN) VALUES (valor1, ..., valorN); Veamos un ejemplo: MERGE INTO clientes cli USING datos_cli dac ON (cli.cliente_id = dac.cliente_id) WHEN MATCHED THEN UPDATE SET cli.nombre = dac.nombre, cli.direccion = dac.direccion WHEN NOT MATCHED THEN INSERT (cliente_id, nombre, direccion) VALUES (dac.cliente_id, dac.nombre, dac.direccion); En este ejemplo cuando encontremos un cliente que exista en ambas tablas mediante su "id" actualizará su nombre y dirección. En caso de que no exista alguno de los clientes que exista en la tabla "datos_cli" que no exista en la tabla "clientes" los insertará.

6.

Definición de los datos. DDL

El Lenguaje de Definición de Datos (DDL) consta de las sentencias utilizadas para crear los objetos dentro de la base de datos y cambiar las propiedades y atributos de la propia base de datos.

4-36


COMANDO

6.1.

DESCRIPCIÓN

CREATE

Utilizado para crear objetos de base de datos.

DROP

Utilizado para eliminar un objeto de la base de datos.

ALTER

Utilizado para modificar o alterar un objeto de la base de datos.

TRUNCATE

Elimina el contenido de una tabla, la vacía pero no modifica su estructura.

Crear objetos

Los objetos de base de datos se crean utilizando la sentencia CREATE. Su sintaxis exacta varía para cada objeto. SINTAXIS

•

OBJETO

CREADO

CREATE DATABASE nombre

Crea una base de datos.

CREATE DEFAULT nombre AS expresión

Crea una propiedad determinada.

CREATE FUNCTION nombre RETURNS valor AS sentencias

Crea una función definida por el usuario.

CREATE INDEX nombre ON tabla (columnas)

Crea un índice sobre una tabla.

CREATE PROCEDURE nombre AS sentencias

Crea un procedimiento almacenado.

CREATE RULE nombre AS expresión

Crea una regla de base de datos.

CREATE TABLE nombre (definición)

Crea una tabla.

CREATE TRIGGER nombre {FOR | AFTER | INSTEAD OF} acción AS sentencias

Crea un desencadenador.

CREATE VIEW nombre AS sentencia_select

Crea una vista.

Crear una tabla De las sentencias CREATE descritas, la más compleja es la sentencia CREATE TABLE, a causa del número de elementos diferentes que comprenden una definición de tabla. Debe añadir columnas, por supuesto, y cada definición de columna debe tener al menos un nombre y un tipo de datos. Opcionalmente puede especificar si la columna admite nulos, su valor por defecto, cualquier restricción aplicable a la columna...etc. Su sintaxis simplificada es:

4-37


CREATE TABLE Tabla (campo1 tipo (tamaño) índice1 , campo2 tipo (tamaño) índice2 , ..., índice multicampo , ... ) En donde: PARTE

DESCRIPCIÓN

Tabla

Es el nombre de la tabla que se va a crear.

campo1 campo2

Es el nombre del campo o de los campos que se van a crear en la nueva tabla. La nueva tabla debe contener, al menos, un campo.

Tipo

Es el tipo de datos de campo en la nueva tabla. (Ver Tipos de Datos)

Tamaño

Es el tamaño del campo y sólo se aplica para campos de tipo texto.

índice1 índice2

Es una cláusula CONSTRAINT que define el tipo de índice a crear. Esta cláusula es opcional.

índice multicampos

Es una cláusula CONSTRAINT que define el tipo de índice multicampos a crear. Un índice multicampo es aquel que está indexado por el contenido de varios campos. Esta cláusula es opcional.

CREATE TABLE Empleados (Nombre TEXT (25) , Apellidos TEXT (50)) Crea una nueva tabla llamada Empleados con dos campos, uno llamado Nombre de tipo texto y longitud 25 y otro llamado apellidos con longitud 50. CREATE TABLE Empleados (Nombre TEXT (10), Apellidos TEXT, Fecha_Nacimiento DATETIME) CONSTRAINT IndiceGeneral UNIQUE ([Nombre], [Apellidos], [Fecha_Nacimiento]) Crea una nueva tabla llamada Empleados con un campo Nombre de tipo texto y longitud 10, otro con llamado Apellidos de tipo texto y longitud predeterminada y uno más llamado Fecha_Nacimiento de tipo Fecha/Hora. También crea un índice único (no permite valores repetidos) formado por los tres campos. CREATE TABLE Empleados (ID INT CONSTRAINT IndicePrimario PRIMARY, Nombre TEXT, Apellidos TEXT, Fecha_Nacimiento DATETIME) Crea una tabla llamada Empleados con un campo Texto de longitud predeterminada llamado Nombre y otro igual llamado Apellidos, crea otro campo llamado Fecha_Nacimiento de tipo Fecha/Hora y el campo ID de tipo entero el que establece como clave principal.

4-38


•

La cláusula CONSTRAINT Se utiliza la cláusula CONSTRAINT en las instrucciones ALTER TABLE y CREATE TABLE para crear o eliminar índices. Existen dos sintaxis para esta cláusula dependiendo de si desea crear o eliminar un índice de un único campo o si se trata de un campo multiíndice. Para los índices de campos únicos: CONSTRAINT nombre {PRIMARY KEY | UNIQUE | REFERENCES tabla externa [(campo externo1, campo externo2)]} Para los índices de campos múltiples: CONSTRAINT nombre {PRIMARY KEY (primario1[, primario2 [, ...]]) | UNIQUE (único1[, único2 [, ...]]) | FOREIGN KEY (ref1[, ref2 [, ...]]) REFERENCES tabla externa [(campo externo1 [,campo externo2 [, ...]])]} PARTE

DESCRIPCIÓN

nombre

Es el nombre del índice que se va a crear.

primarioN

Es el nombre del campo o de los campos que forman el índice primario.

únicoN

Es el nombre del campo o de los campos que forman el índice de clave única.

refN

Es el nombre del campo o de los campos que forman el índice externo (hacen referencia a campos de otra tabla).

tabla externa

Es el nombre de la tabla que contiene el campo o los campos referenciados en refN

campos externosN

Es el nombre del campo o de los campos de la tabla externa especificados por ref1, ref2, ..., refN

4-39


Si se desea crear un índice para un campo cuando se esta utilizando las instrucciones ALTER TABLE o CREATE TABLE la cláusula CONSTRAINT debe aparecer inmediatamente después de la especificación del campo indexado. Si se desea crear un índice con múltiples campos cuando se está utilizando las instrucciones ALTER TABLE o CREATE TABLE la cláusula CONSTRAINT debe aparecer fuera de la cláusula de creación de tabla. TIPO

DESCRIPCIÓN

DE ÍNDICE

UNIQUE

Genera un índice de clave única. Lo que implica que los registros de la tabla no pueden contener el mismo valor en los campos indexados.

PRIMARY KEY

Genera un índice primario el campo o los campos especificados. Todos los campos de la clave principal deben ser únicos y no nulos, y cada tabla sólo puede contener una única clave principal.

FOREIGN KEY

Genera un índice externo (toma como valor del índice campos contenidos en otras tablas). Si la clave principal de la tabla externa consta de más de un campo, se debe utilizar una definición de índice de múltiples campos, listando todos los campos de referencia, el nombre de la tabla externa, y los nombres de los campos referenciados en la tabla externa en el mismo orden que los campos de referencia listados. Si los campos referenciados son la clave principal de la tabla externa, no tiene que especificar los campos referenciados, el motor se comporta como si la clave principal de la tabla externa fueran los campos referenciados.

CREATE TABLE Empleados (DNI CHAR(10), nombemp CHAR(15), Apellemp CHAR(40), sueldo DECIMAL, CONSTRAINT pk_dni PRIMARY KEY (DNI)) Donde pk_dni es el nombre de la restricción (nombre de uso interno para el gestor) y DNI es el campo a vincular (índice primario). CREATE TABLE Ventas (numventa INT IDENTITY (100,1), DNI CHAR(10), Fecha DATETIME, codart CHAR(5), CONSTRAINT pk_dni FOREIGN KEY (DNI)) Esta orden crea una tabla Ventas en la cual se otorga al campo DNI el atributo de clave externa (índice externo). El campo numventa es autonumérico, empieza a contar desde 100 con un incremento de 1. •

Crear una vista Es una sentencia SELECT a la que se otorga un nombre y se guarda en el catálogo. El resultado es una tabla y pueden realizarse operaciones sobre ella, pero no es propiamente una tabla, ni tiene datos propios. Se pueden utilizar sobre ella los mandatos SELECT habituales. Sirve para preservar los datos de la tabla “verdadera”.

4-40


CREATE VIEW suspensos AS SELECT * FROM alumnos WHERE nota < 5 Crea una vista con los suspensos de la tabla alumnos. CREATE VIEW VistaSimple AS SELECT IDRelacionada, DescripcionSimple, DescripcionRelacionada FROM TablaRelacionada INNER JOIN TablaSimple ON TablaRelacionada.IDSimple = TablaSimple.IDSimple •

Crear un índice Los índices son unos atributos de ordenación interna para campos de tipo fecha, numéricos y alfanuméricos (no memo). Las búsquedas basadas en campos indexados se realizan de una forma más rápida, entre otras ventajas. No es bueno que existan muchos campos indexados en una misma tabla, pues debido a la longitud que tomaría el registro interno, puede incluso hacer que una búsqueda sea más tediosa o lenta, justo el efecto contrario a lo que se pretende. Existen dos tipos de índices: índice único, para campos que no permiten valores iguales en una misma columna, también llamado sin duplicados (UNIQUE) y los llamados índices con duplicados. Su sintaxis es: CREATE [ UNIQUE ] INDEX índice ON tabla (campo [ASC | DESC][, campo [ASC | DESC], ...]) [WITH { PRIMARY | DISALLOW NULL | IGNORE NULL }]

En donde: PARTE

DESCRIPCIÓN

TABLA

Es el nombre del índice a crear. Es el nombre de una tabla existente en la que se creará el índice.

CAMPO

Es el nombre del campo o lista de campos que constituyen el índice.

ASC | DESC

Indica el orden de los valores de los campos. ASC indica un orden ascendente (valor predeterminado) y DESC un orden descendente.

UNIQUE

Indica que el índice no puede contener valores duplicados.

DISALLOW NULL

Prohíbe valores nulos en el índice.

IGNORE NULL

Excluye del índice los valores nulos incluidos en los campos que lo componen.

PRIMARY

Asigna al índice la categoría de clave principal, en cada tabla sólo puede existir un único índice que sea "Clave Principal". Si un índice es clave principal implica que no puede contener valores nulos ni duplicados.

ÍNDICE

4-41


CREATE INDEX MiIndice ON Empleados (Prefijo, Telefono) Crea un índice llamado MiIndice en la tabla Empleados con los campos Prefijo y Telefono. CREATE UNIQUE INDEX MiIndice ON Empleados (ID) WITH DISALLOW NULL Crea un índice en la tabla Empleados utilizando el campo ID, obligando que el campo ID no contenga valores nulos ni repetidos.

6.2.

Modificar objetos

Del mismo modo que la sentencia CREATE crea un nuevo objeto, la sentencia ALTER proporciona el mecanismo para alterar una definición de objeto. No todos los objetos creados por una instrucción CREATE tienen su correspondiente sentencia ALTER. Su sintaxis exacta varía para cada objeto. SINTAXIS

OBJETO

• CREADO

ALTER DATABASE nombre especif_archivo

Modifica los archivos utilizados para almacenar la base de datos.

ALTER FUNCTION nombre RETURNS valor AS sentencias

Cambia las sentencias SQL que componen la función.

ALTER PROCEDURE nombre AS sentencias

Cambia las sentencias SQL que componen el procedimiento almacenado.

ALTER TABLE nombre (definición)

Cambia la definición de una tabla.

ALTER TRIGGER nombre {FOR | AFTER | INSTEAD OF} acción AS sentencias

Cambia las sentencias SQL que componen el desencadenador.

ALTER VIEW nombre AS sentencia_select

Cambia la sentencia SELECT que crea la vista.

Modificar una tabla La sentencia ALTER TABLE es compleja por la misma razón que la sentencia CREATE TABLE: hay varias partes diferentes en una definición de tabla. Su sintaxis simplificada es: ALTER TABLE Tabla {ADD | ALTER {COLUMN tipo de campo[(tamaño)] [CONSTRAINT índice] CONSTRAINT índice multicampo} | DROP {COLUMN campo [CONSTRAINT nombre del índice]} } 4-42


En donde: PARTE

DESCRIPCIÓN

tabla

Es el nombre de la tabla que se desea modificar.

campo

Es el nombre del campo que se va a añadir o eliminar.

tipo

Es el tipo de campo que se va a añadir.

tamaño

El tamaño del campo que se va a añadir (sólo para campos de texto).

índice

Es el nombre del índice del campo (cuando se crean campos) o el nombre del índice de la tabla que se desea eliminar.

índice multicampo

Es el nombre del índice del campo multicampo (cuando se crean campos) o el nombre del índice de la tabla que se desea eliminar.

OPERACIÓN

DESCRIPCIÓN

ADD COLUMN

Se utiliza para añadir un nuevo campo a la tabla, indicando el nombre, el tipo de campo y opcionalmente el tamaño (para campos de tipo texto).

ADD

Se utiliza para agregar un índice de multicampos o de un único campo.

DROP COLUMN

Se utiliza para borrar un campo. Se especifica únicamente el nombre del campo.

DROP

Se utiliza para eliminar un índice. Se especifica únicamente el nombre del índice a continuación de la palabra reservada CONSTRAINT.

ALTER TABLE Empleados ADD COLUMN Salario DECIMAL Agrega un campo Salario de tipo Numérico a la tabla Empleados. ALTER TABLE Empleados DROP COLUMN Salario. Elimina el campo Salario de la tabla Empleados. ALTER TABLE Pedidos ADD CONSTRAINT RelacionPedidos FOREIGN KEY (ID_Empleado) REFERENCES Empleados (ID_Empleado) Agrega un índice externo a la tabla Pedidos. El índice externo se basa en el campo ID_Empleado y se refiere al campo ID_Empleado de la tabla Empleados. En este ejemplo no es necesario indicar el campo 4-43


junto al nombre de la tabla en la cláusula REFERENCES, pues ID_Empleado es la clave principal de la tabla Empleados. ALTER TABLE Pedidos DROP CONSTRAINT RelacionPedidos Elimina el índice de la tabla Pedidos. ALTER TABLE TablaSimple ADD COLUMN ColumnaNueva VARCHAR(20) Agrega un campo ColumnaNueva de tipo carácter variable a la tabla TablaSimple. ALTER TABLE TablaSimple ALTER COLUMN ColumnaNueva VARCHAR(10) Modifica la longitud del campo ColumnaNueva de la tabla TablaSimple. ALTER TABLE TablaSimple DROP COLUMN ColumnaNueva Elimina el campo ColumnaNueva de la tabla TablaSimple.

6.3.

Eliminar objetos

La sentencia DROP elimina un objeto de la base de datos. Al contrario que las sentencias CREATE y ALTER, todas las sentencias DROP tienen la misma sintaxis: DROP tipo_objeto nombre Donde tipo_objeto puede ser cualquier objeto de la base de datos. DROP DATABASE Alumnos DROP TABLE Productos DROP INDEX MiIndice DROP VIEW Suspensos La sentencia TRUNCATE elimina el contenido de una tabla dejándola vacía de filas sin modificar su estructura. La sintaxis es la siguiente: TRUNCATE tabla;

7. 7.1.

Conceptos de interés Variables

Las variables se identifican por el prefijo @; por ejemplo, @miVariable. Tienen dos niveles de ámbito: local y global, identificando las variables globales con una doble@: @@VERSION.

4-44


•

Variables locales Las variables locales se crean utilizando la sentencia DECLARE, con la siguiente sintaxis: DECLARE @variable_local tipo_datos Se pueden crear varias variables locales con una sola instrucción DECLARE separándolas con comas: DECLARE @var1 INT, @var2 INT Cuando se crea una variable local, inicialmente tiene el valor NULL. Puede asignar un valor a una variable de las siguientes formas: —

Utilizando el comando SET con una constante o expresión: SET @miVariableChar = ‘Hola, mundo’

—

Utilizando el comando SELECT con una constante o expresión: SELECT @miVariableChar = ‘Hola, mundo’

—

Utilizando el comando SELECT con otra sentencia SELECT: SELECT @miVariableChar = MAX(OilName) FROM Oils

Observe que en la tercera forma (el SELECT con otro SELECT), el operador de asignación (=) reemplaza a la segunda palabra reservada SELECT; no se repite. •

Variables globales Las variables globales, identificadas con un doble signo @ (@@VERSION) las proporciona SQL y el usuario no puede crearlas. Existen docenas de variables globales. La mayoría de ellas proporcionan información sobre el estado actual de SQL.

•

Utilizar variables Las variables pueden utilizarse en expresiones a lo largo y ancho del lenguaje SQL. En cualquier caso, no pueden utilizarse en lugar de un nombre de objeto o palabra reservada. Así las siguientes sentencias son correctas: DECLARE @elAceite CHAR(20) SET @elAceite = ‘Basil’ -- Se ejecutará este comando SELECT OilName, Descripction FROM Oils WHERE OilName = @elAceite

4-45


Sin embargo, las siguientes sentencias SELECT provocarán errores: DECLARE @elComando CHAR(10), @elCampo CHAR(10) SET @elComando = ‘SELECT’ SET @elCampo = ‘OilName’ -- Este comando fallará @elComando * from Oils -- Igual que éste SELECT @elCampo FROM Oils

7.2.

Control de ejecución

A menos que especifique lo contrario, SQL procesa las sentencias desde el comienzo del script hasta el final, pasando por todas ellas. Esto no es siempre lo que usted necesita. Algunas veces querrá que se ejecute una instrucción únicamente si son verdaderas ciertas condiciones. Otras querrá que una instrucción se ejecute un número de veces, o se repita hasta que se cumpla alguna condición. Los comandos de flujo de SQL le proporcionan la posibilidad de controlar la ejecución de esta forma. Cuando comience a manipular el modo en que SQL ejecuta las instrucciones, es conveniente tratar un conjunto de sentencias en bloque. SQL se lo permite mediante la pareja de comando BEGIN...END. Escribir el comando BEGIN tras cualquier comando de control de flujo provoca que SQL aplique el comando a todas las sentencias entre el BEGIN y su correspondiente END. •

PROCESAMIENTO CONDICIONAL IF...ELSE La sentencia IF es la más sencilla entre los comandos de fluido condicionales. Si la expresión lógica que sigue al comando IF se evalúa a TRUE, se ejecutarán la sentencia o bloque de sentencias que lo siguen. Si la expresión lógica se evalúa a FALSE, se salta la sentencia o bloque de sentencias que los sigan. El comando opcional ELSE le permite especificar una sentencia o grupo de sentencias a ejecutar sólo si la expresión lógica se evalúa a FALSE. DECLARE @primeraLetra CHAR(2) SELECT @primeraLetra = LEFT(MIN(OilName), 1) FROM Oils

4-46


IF @primeraLetra = ‘A’ PRINT ‘Es una A’ ELSE PRINT ‘No es una A’ CASE En la mayoría de los lenguajes de programación, CASE es una forma sofisticada de la sentencia IF que le permite especificar múltiples expresiones lógicas en una única sentencia. En SQL, CASE es una función, no un comando. No se utiliza por sí mismo como IF; en su lugar, se utiliza como parte de una sentencia SELECT o UPDATE. Las sentencias que incluyen CASE pueden hacerlo en una de sus dos formas sintácticas, dependiendo de si la expresión a evaluar cambia. La forma más simple asume que la expresión lógica a evaluar siempre tiene la siguiente forma: Valor = expresión El valor puede ser tan complejo como quiera. Puede utilizar una constante, un nombre de columna o una expresión compleja, o cualquier cosa que necesite. El operador de comparación siempre es la igualdad. La sintaxis simple de CASE es: CASE valor WHEN expresión_uno THEN resultado_expresión_uno WHEN expresión_dos THEN resultado_expresión_dos ... WHEN expresión_n THEN resultado_expresión_n [ELSE resultado_expresión_else] END En esta forma del CASE, se obtiene solo el resultado_expresión si la expresión que sigue a la palabra clave WHEN es lógicamente igual al valor especificado. Puede tener cualquier número de cláusulas WHEN en la expresión. La cláusula ELSE es opcional y actúa como un resultado “comodín” (se ejecuta sólo si todas las cláusulas WHEN se evalúan a FALSE). Compara un valor contra varios valores diferentes es extremadamente común, pero en algunas ocasiones necesitará más flexibilidad. En este caso, puede utilizar la llamada sintaxis CASE de búsqueda, con esta forma: 4-47


CASE WHEN expresión_lógica_uno THEN resultado_expresión_uno WHEN expresión_ lógica_dos THEN resultado_expresión_dos ... WHEN expresión_ lógica_n THEN resultado_expresión_n [ELSE resultado_expresión_else] END Utilizar un CASE simple: SELECT OilName, CASE PlantPartID WHEN 1 THEN ‘Uno’ WHEN 2 THEN ‘Dos’ WHEN 3 THEN ‘Tres’ WHEN 7 THEN ‘Siete’ WHEN 8 THEN ‘Ocho’ END AS Categoria FROM Oils ORDER BY Categoria Utilizar un CASE de búsqueda: SELECT TOP 10 OilName, LatinName CASE WHEN LEFT(OilName,1) = ‘B’ THEN ‘Nombre B’ WHEN LEFT(LatinName,1) = ‘C’ THEN ‘Nombre Latino C’ ELSE ‘Ninguno de los dos’ FROM Oils ORDER BY OilName •

BUCLES El último comando de control de flujo le permite hacer que una sentencia o bloque de sentencias se ejecuten hasta que se cumpla determinada condición.

4-48


Bucle WHILE simple La forma más simple del bucle WHILE especifica una expresión lógica y una sentencia o bloque de sentencias. Las instrucciones se repiten hasta que la expresión lógica se evalúa a FALSE. Si la expresión lógica es FALSE la primera vez que se evalúa la sentencia WHILE, la instrucción o grupo de instrucciones no se ejecutará nunca. DECLARE @contador INT SET @contador = 1 WHILE @contador < 11 BEGIN PRINT @contador SET @contador = @contador + 1 END Bucle WHILE complejo La sintaxis de la sentencia WHILE puede realizar procesos más complejos que el mostrado en el ejemplo anterior. La cláusula BREAK sale del bucle; la ejecución continúa por la sentencia que sigue a la cláusula END del bloque de sentencias WHILE. La cláusula CONTINUE devuelve la ejecución al comienzo del bucle, ocasionando que las sentencias que le siguen en el bloque de instrucciones no se ejecuten. Ambas sentencias BREAK y CONTINUE se suelen ejecutar condicionalmente, dentro de una instrucción IF. Utilizar WHILE…BREAK: DECLARE @contador INT SET @contador = 1 WHILE @contador < 25 BEGIN PRINT @contador SET @contador = @contador + 1 IF @contador > 10 BREAK END Utilizar WHILE...CONTINUE:

4-49


DECLARE @contador INT SET @contador = 0 WHILE @contador < 11 BEGIN SET @contador = @contador + 1 IF (@contador % 2) = 0 CONTINUE PRINT @contador END

7.3.

Transacciones

Una transacción es una serie de cambios en la base de datos que deben ser tratadas como una sola. En otras palabras, que se realicen todos o que no se haga ninguno, pues de lo contrario se podrían producir inconsistencias en la base de datos. Cuando no se tiene activada una transacción el gestor de base de datos ejecuta inmediatamente cada sentencia INSERT, UPDATE o DELETE que se le encomiende, sin posibilidad de deshacer los cambio en caso de ocurrir cualquier percance. Cuando se activa una transacción los cambios que se van realizando quedan en un estado de provisionalidad hasta que se realiza un COMMIT, el cual hará definitivos los cambios o hasta realizar un ROLLBACK que deshará todos los cambios producidos desde que se inició la transacción.

7.4.

Cursores

Una de las características que definen las bases de datos relacionales es que las operaciones se ejecutan sobre un conjunto de filas. Un conjunto puede estar vacío, o contener una sola fila, pero aún así se considera un conjunto. Esto es necesario y útil en operaciones relacionales, pero en algunas ocasiones puede no ser conveniente para las aplicaciones. Por ejemplo, dado que no hay un modo de apuntar a una fila específica de un conjunto, mostrar cada vez una fila al usuario puede ser difícil. Para manejar estas situaciones, SQL admite los cursores. Un cursor es un objeto que apunta a una fila específica dentro de un conjunto. Dependiendo de la naturaleza del cursor que cree, puede mover el cursor por el conjunto y modificar o borrar datos. Su sintaxis es: DECLARE nombre-cursor CURSOR FOR especificación-consulta DECLARE MiCursor CURSOR FOR SELECT num_emp, nombre, puesto, salario FROM Empleados WHERE num_dept = 'informatica' 4-50


Este comando es meramente declarativo, simplemente especifica las filas y columnas que se van a recuperar. La consulta se ejecuta cuando se abre o se activa el cursor. •

Variables cursor SQL permite declarar variables de tipo CURSOR. En este caso, la sintaxis estándar DECLARE no crea el cursor, debe explícitamente establecer (SET) la variable al cursor. DECLARE MiCursor CURSOR FOR SELECT OilName FROM Oils DECLARE @miVariableCursor CURSOR SET @miVariableCursor = MiCursor

•

Abrir un cursor Al declarar un cursor crea el objeto cursor, pero no crea el conjunto de registros que manipulará el cursor (el conjunto de cursor). El conjunto de cursor no se crea hasta que abre el cursor. Para abrir o activar un cursor se utiliza el comando OPEN, la sintaxis es la siguiente: OPEN nombre_cursor Al abrir el cursor se evalúa la consulta que aparece en su definición, utilizando los valores actuales de cualquier parámetro referenciado en la consulta, para producir una colección de filas. El puntero se posiciona delante de la primera fila de datos (registro actual), esta sentencia no recupera ninguna fila.

•

Cerrar un cursor Una vez ha terminado de utilizar un cursor, deberá cerrarlo. La sentencia CLOSE libera los recursos utilizados en mantener el conjunto de cursor. Este comando hace desaparecer el puntero sobre el registro actual. La sintaxis es: CLOSE nombre_cursor

•

Liberar un cursor Para liberar un cursor, se utiliza la sentencia DEALLOCATE. Este comando borra el identificador del cursor o la variable cursor, pero no borra necesariamente el cursor. El cursor en sí mismo no se elimina hasta que todos los identificadores que lo referencian se hayan liberado o salgan fuera de su ámbito o se elimine el cursor. La sintaxis es: DEALLOCATE nombre_cursor

4-51


Por ejemplo: -- Crea el cursor DECLARE MiCursor CURSOR FOR SELECT * FROM Oils -- Crea una variable de cursor DECLARE @variableCursor CURSOR -- Crea el conjunto de cursor OPEN MiCursor -- Asigna la variable al cursor SET @variableCursor = MiCursor -- Liberar el cursor DEALLOCATE MiCursor Después de liberar el cursor, el identificador MiCursor deja de estar asociado con el conjunto de cursor, pero dado que el conjunto de cursor aun está referenciado por la variable @variableCursor, el cursor y conjunto de cursor no se liberan. A menos que explícitamente libere también la variable cursor, el cursor y conjunto de cursor continuarán existiendo hasta que la variable salga de su ámbito o se elimine definitivamente el cursor. •

Eliminar un cursor Para eliminar el cursor se utiliza el comando DROP CURSOR. Su sintaxis es la siguiente: DROP CURSOR nombre_cursor

•

Manipular filas mediante un cursor Los cursores no serían interesantes si no pudiera hacer algo con ellos. Existen tres comandos diferentes para trabajar con cursores: FETCH, UPDATE y DELETE. El comando FETCH recupera una fila específica del conjunto del cursor. En su forma más simple el comando FETCH tiene la sintaxis: FETCH cursor_o_variable Este comando obtiene la fila en la cual está posicionado el cursor (la fila actual). En lugar de obtener una fila directamente, el comando FETCH le permite almacenar los valores obtenidos de las columnas en variables. Para almacenar los resultados del FETCH en una variable, utilice la siguiente sintaxis:

4-52


FETCH cursor_o_variable INTO lista_variables La lista_variables es una lista separada por comas de identificadores de variable. Debe declarar las variables antes de ejecutar el comando FETCH. La lista_variables debe incluir una variable por cada columna de la sentencia SELECT que define el cursor, y los tipos de datos de las variables deben ser igual o compatibles con los tipos de datos de la columna. -- Crea el cursor y algunas variables DECLARE CursorSimple CURSOR FOR SELECT OilName, Latíname FROM Oils DECLARE @Nombre CHAR(20), @NombreLatin CHAR(50) -- Crea el conjunto de cursor OPEN CursorSimple -- Recupera los valores en variables FETCH CursorSimple INTO @Nombre, @NombreLatin -- Muestra los resultados PRINT RTRIM(@Nombre) + ‘ es el nombre’ PRINT RTRIM(@NombreLatin) + ‘ es el nombre latín’ -- Cierra el conjunto de resultados CLOSE CursorSimple -- Libera el cursor DEALLOCATE CursorSimple En el ejemplo anterior hemos utilizado la sentencia FETCH para obtener la fila actual. La sintaxis de la sentencia FETCH proporciona también un número de palabras reservadas para especificar una fila diferente. Cuando utiliza una de estas palabras clave la sentencia FETCH obtendrá la fila especificada y convierte esa fila en la actual. Tres palabras clave le permiten especificar una posición absoluta en el conjunto de cursor. Las palabras reservadas FIRST y LAST obtienen la primera y última fila respectivamente, mientras que ABSOLUTE n especifica una fila n filas desde el comienzo (si n es positivo) o el final (si n es negativo) del conjunto de cursor. Puede expresar el valor de n como una constante (3) o una variable (@laFila). -- Crea el cursor y algunas variables DECLARE CursorSimple CURSOR FOR SELECT OilName FROM Oils 4-53


DECLARE @Nombre CHAR(20) -- Crea el conjunto de cursor OPEN CursorSimple -- Recupera la primera fila en la variable FETCH FIRST FROM CursorSimple INTO @Nombre -- Muestra los resultados PRINT RTRIM(@Nombre) + ‘es el primer nombre’ -- Recupera la quinta fila FETCH ABSOLUTE 5 FROM CursorSimple INTO @Nombre -- Muestra los resultados PRINT RTRIM(@Nombre) + ‘es el quinto nombre’ -- Cierra el conjunto de resultados CLOSE CursorSimple -- Libera el cursor DEALLOCATE CursorSimple Además de las palabras clave que le permiten recuperar una fila basándose en su posición absoluta, la sentencia FETCH le proporciona tres palabras clave que le permiten recuperar una fila basándose en su posición relativa con respecto a la fila actual. FETCH NEXT obtiene la siguiente fila, FETCH PRIOR obtiene la fila anterior, y FETCH RELATIVE n obtiene una fila n filas desde la fila actual. Como FETCH ABSOLUTE n, FETCH RELATIVE n puede especificar el número de filas antes de la fila actual, si n es negativo, o después de la fila actual, si n es positivo. DECLARE CursorSimple CURSOR FOR SELECT OilName FROM Oils DECLARE @Nombre CHAR(20) OPEN CursorSimple -- Recupera la fila en la variable FETCH FIRST FROM CursorSimple INTO @Nombre -- Muestra los resultados PRINT RTRIM(@Nombre) + ‘es el primer nombre’

4-54


-- Recupera la siguiente fila FETCH RELATIVE 1 FROM CursorSimple INTO @Nombre -- Muestra los resultados PRINT RTRIM(@Nombre) + ‘es el siguiente nombre’ CLOSE CursorSimple DEALLOCATE CursorSimple •

Monitorizar un cursor

@@FETCH_STATUS obtiene información sobre el último comando FETCH ejecutado. VALOR

DE

RETORNO

SIGNIFICADO

0

El comando FETCH se ejecutó correctamente.

-1

El comando FETCH falló.

-2

La fila leída desapareció.

--Abrir un cursor y recorrerlo DECLARE EmployeeCursor CURSOR FOR SELECT LastName, FirstName FROM Employees WHERE LastName LIKE 'B*' OPEN EmployeeCursor FETCH NEXT FROM EmployeeCursor WHILE @@FETCH_STATUS = 0 BEGIN FETCH NEXT FROM EmployeeCursor END CLOSE EmployeeCursor DEALLOCATE EmployeeCursor --Recorrer un cursor guardando los valores en variables DECLARE @au_lname VARCHAR(40) 4-55


DECLARE @au_fname VARCHAR(20) DECLARE authors_cursor CURSOR FOR SELECTau_lname, au_fname FROM authors WHERE au_lname LIKE "B*" ORDER BY au_lname, au_fname OPEN authors_cursor FETCH NEXT FROM authors_cursor INTO @au_lname, @au_fname WHILE @@FETCH_STATUS = 0 BEGIN PRINT "Author: " + @au_fname + " " + @au_lname FETCH NEXT FROM authors_cursor INTO @au_lname, @au_fname END CLOSE authors_cursor DEALLOCATE authors_cursor

7.5.

Procedimientos almacenados (Store procedure)

Es una colección de sentencias SQL precompiladas que pueden devolver y tomar parámetros, algo así como un fichero de ejecución por lotes. Son lotes de sentencias almacenadas en el servidor. Los procedimientos almacenados no son la única forma de ejecutar sentencias SQL. Hemos visto los script SQL, pero los procedimientos almacenados se ejecutan de forma optimizada, dando lugar a una ejecución más rápida. Los procedimientos almacenados proporcionan dos métodos de comunicación con procesos externos: parámetros y valores de retorno. Los parámetros son una clase especial de variable local declarada como parte del procedimiento almacenado. Puede utilizar parámetros para pasar información al procedimiento almacenado (parámetros de entrada) o recibir valores desde el procedimiento almacenado (parámetros de salida). Un valor de retorno es similar al resultado de una función, y pueden asignarse a una variable local de la misma forma. Los valores de retorno siempre son enteros. Pueden utilizarse teóricamente para devolver cualquier resultado, pero por convención se utilizan para devolver el estado de la ejecución del procedi-

4-56


miento almacenado. Por ejemplo, un procedimiento almacenado podría devolver 0 si todo fue bien, o -1 si hubo algún error. Los procedimientos almacenados más sofisticados pueden devolver valores de retorno diferentes para indicar la naturaleza del error encontrado. Es importante no confundir los parámetros y los códigos de retorno con cualquier otro conjunto de resultados que podría devolver un procedimiento almacenado. Un procedimiento almacenado puede contener cualquier número de sentencias SELECT que devolverían conjuntos de resultados. No tiene que utilizar un parámetro para recibirlos, se devuelven a la aplicación de forma independiente. Los procedimientos almacenados vienen de dos formas: los procedimientos de sistema creados por el propio SQL (todos ellos comienzan con los caracteres sp_) que nos devuelven información acerca del sistema, sus tablas, contenidos y estructura de los campos, almacenamiento de los datos, etc. (por ejemplo, sp_tables, sp_columns, sp_spaceused, sp_who, sp_helpdb, etc.) y los procedimientos almacenados definidos por el usuario. •

Utilizar procedimientos almacenados Se utiliza la sentencia EXECUTE para invocar un procedimiento almacenado tanto de sistema como definido por el usuario. Si el procedimiento almacenado no tiene parámetros o si no devuelve ningún resultado, la sintaxis es muy simple: EXECUTE nombre_procedimiento Por ejemplo: EXECUTE sp_helpdb Si el procedimiento almacenado acepta parámetros de entrada puede indicárselos por posición o por nombre. Para indicar parámetros por posición, simplemente lístelos después del nombre del procedimiento almacenado, separando cada parámetro individual con comas: EXECUTE nombre_procedimiento parámetro [, parámetro…] Por ejemplo: EXECUTE sp_dboption ‘MiBasedeDatos’, ‘read only’

•

Crear procedimientos almacenados Los procedimientos almacenados se crean utilizando la sentencia CREATE PROCEDURE. Su sintaxis es: CREATE PROCEDURE nombre_procedimiento [lista_parámetros] AS sentencias_procedimiento Cada parámetro en la lista_parámetros tiene la estructura:

4-57


@nombre_parámetro tipo_dato [= valor_defecto] [OUTPUT] Los nombres de parámetros comienzan siempre con @, como una variable local. De hecho, los parámetros son variables locales; sólo son visibles dentro del procedimiento almacenado. El valor_defecto es el valor que utilizará el procedimiento almacenado si el usuario no especifica el valor del parámetro de entrada en la llamada al procedimiento almacenado. La palabra reservada OUTPUT, también opcional, define los parámetros que se devolverán al script de llamada. Las sentencias_procedimiento que siguen al AS en la sentencia CREATE definen las acciones a ejecutar cuando se llame al procedimiento almacenado. Los procedimientos almacenados pueden llamar a otros procedimientos almacenados, en un proceso conocido como anidamiento. Crear un procedimiento almacenado simple CREATE PROCEDURE SPSimple AS SELECT OilName, LatinName FROM Oils Para ejecutar este procedimiento almacenado: EXECUTE SPSimple Crear un procedimiento almacenado con un parámetro de entrada CREATE PROCEDURE SPInput @OilName CHAR(50) AS SELECT OilName, LatinName FROM Oils WHERE OilName = @OilName Para ejecutar este procedimiento almacenado: EXECUTE SPInput ‘Basil’ Crear un procedimiento almacenado con un valor por defecto CREATE PROCEDURE SPDefault @OilName CHAR(50) = ‘Fennel’ AS SELECT OilName, LatinName FROM Oils WHERE OilName = @OilName Para ejecutar este procedimiento almacenado: EXECUTE SPDefault Crear un procedimiento almacenado con un parámetro de salida CREATE PROCEDURE SPOutput @VarSalida CHAR(6) OUTPUT AS SET @VarSalida = ‘Salida’

4-58


Para ejecutar este procedimiento almacenado: DECLARE @miSalida CHAR(6) EXECUTE SPOutput @miSalida OUTPUT SELECT @miSalida Los valores de retorno se definen utilizando la sentencia RETURN, que tiene la forma: RETURN (int) En la sentencia RETURN, int es un valor entero. Como vimos anteriormente, los valores de retorno se utilizan la mayoría de las veces para devolver el estado de ejecución de un procedimiento almacenado, con 0 indicando ejecución correcta, y cualquier otro número indicando un error. Puede comprobar los errores utilizando la variable global @@ERROR, que devuelve el estado de ejecución del comando SQL más reciente: 0 para ejecución correcta, o un número distinto de cero indicando el error que ha ocurrido. Crear un procedimiento almacenado con un parámetro de entrada CREATE PROCEDURE SPError AS -- Crea una variable para almacenar el código de error DECLARE @codigoRetorno INT SELECT OilName, LatinName FROM Oils -- Atrapa cualquier error SET @codigoRetorno = @@ERROR RETURN (@codigoRetorno) Para ejecutar este procedimiento almacenado: DECLARE @elError INT EXECUTE @elError = SPError SELECT @elError AS ‘Valor retorno’

7.6.

Desencadenadores (triggers)

Un desencadenador o trigger es un tipo especial de procedimiento almacenado que se ejecuta desatendidamente y automáticamente cuando un usuario realiza una acción con la tabla de una base de datos que lleve asociado este trigger. Se pueden crear triggers para las sentencias de SQL INSERT, UPDATE Y DELETE. 4-59


SQL impone algunas restricciones en el proceso que pueden ejecutar los desencadenadores. No puede CREATE, ALTER o DROP una base de datos utilizando un desencadenador; ni restaurar una base de datos o archivo de transacciones; y no puede ejecutar ciertas operaciones que cambien la configuración de SQL. •

Utilizar el comando CREATE TRIGGER Los desencadenadores se crean utilizando la sentencia CREATE TRIGGER. Su sintaxis es: CREATE TRIGGER nombre_desencadenador ON tabla FOR lista_comandos AS sentencias_sql La Lista de comandos es cualquier combinación de los comandos INSERT, UPDATE o DELETE. Si indica más de un comando, sepárelos con comas. Las sentencias_sql que siguen a la palabra reservada AS definen el proceso a ejecutar por el desencadenador, igual que en los procedimientos almacenados excepto que un desencadenador no admite parámetros. CREATE TRIGGER afterUpdate ON Oils FOR UPDATE AS INSERT INTO TriggerMessages (TriggerName, MessageText) VALUES (‘afterUpdate’, ‘enviado por el desencadenador afterUpdate’)

•

Utilizar la función UPDATE SQL proporciona una función especial, UPDATE, que puede utilizarse dentro de un desencadenador para comprobar si se ha modificado una columna específica de una fila. La sintaxis es: UPDATE (nombre_columna) Devolverá TRUE si se ha modificado el valor de los datos para la columna especificada para cualquiera de los comandos INSERT o UPDATE. CREATE TRIGGER UpdateFunc ON Oils FOR UPDATE AS IF UPDATE (Descripcion) INSERT INTO TriggerMessages (TriggerName, MessageText)

4-60


VALUES (‘UpdateFunc’, ‘Descripción modificada’) IF UPDATE (OilName) INSERT INTO TriggerMessages (TriggerName, MessageText) VALUES (‘UpdateFunc’, ‘OilName modificado’) •

Utilizar las tablas Inserted y Deleted SQL crea dos tablas para ayudarle a manipular los datos durante la ejecución del desencadenador. Las tablas Inserted y Deleted son tablas temporales residentes en memoria que contienen los valores de las filas afectadas por el comando que invocó al desencadenador. Cuando se llama un desencadenador desde un comando DELETE, la tabla Deleted contendrá las filas que se borraron de la tabla. Para un comando INSERT, la tabla Inserted contendrá una copia de las nuevas filas. Físicamente, una sentencia UPDATE es un DELETE seguido de un INSERT, así que la tabla Deleted contendrá los valores antiguos, y la tabla Inserted los valores nuevos. Puede hacer referencia a los contenidos de estas tablas desde dentro del desencadenador pero no modificarlas.

7.7.

Bloqueos

Los bloqueos nos proporcionan información acerca de qué recursos individuales están bloqueados. Los bloqueos en filas leídas o modificadas durante una transacción se utilizan para evitar que varias transacciones utilicen simultáneamente los mismos recursos y puedan estropear los datos. Por ejemplo, si una transacción mantiene un bloqueo exclusivo en una fila de una tabla ninguna otra transacción podrá modificar esa fila hasta que se libere el bloqueo. Para lograr estos objetivos el SQL tiene cuatro modos de asilamiento (isolation levels). •

¿Qué se bloquea? SQL dispone de varios niveles de bloqueo lo que permite a una transacción bloquear diferentes tipos de recursos. Para minimizar el costo de los bloqueos y aumentar la simultaneidad, SQL bloquea automáticamente los recursos en el nivel apropiado para la tarea. El bloqueo de menor granularidad, como es el caso de las filas, aumenta la simultaneidad. Sin embargo, se produce una sobrecarga mayor porque cuantas más filas se bloquean, más bloqueos se deben mantener y esto requiere que nuestro servidor utilice recursos adicionales del sistema. Bloquear con una granularidad mayor, como las tablas, es costoso en términos de simultaneidad debido a que bloquear una tabla completa restringe los accesos de las demás transacciones a cualquier parte de la tabla, pero produce una sobrecarga menor (menos recursos utilizados) debido a que se mantienen menos bloqueos.

4-61


Veamos que tipo de recursos puede bloquear SQL: RID

Identificador de fila. Se utiliza para bloquear una sola fila de una tabla.

CLAVE

Bloqueo de una fila en un índice. Se utilizan únicamente en transacciones que operan en el nivel de transacción serializable.

PÁGINA

La página de datos o página de índices (8 Kb).

EXTENSIÓN

Grupo contiguo de ocho páginas de datos o páginas de índice.

TABLA

Tabla completa, con todos los datos e índices.

BASE DE DATOS

Base de datos.

Estos recursos se pueden bloquear con diferentes modos de bloqueo que determinarán cómo transacciones simultáneas pueden tener acceso a esos recursos. •

¿Cómo se bloquea? Una vez que hemos visto los recursos sobre los que SQL mantiene bloqueos, vamos a ver los tipos de bloqueo de los que disponemos: —

SHARED (S): Compartido.

—

UPDATE (U): Actualizar.

—

EXCLUSIVE (X): Exclusivo.

—

BULK UPDATE (BU): Actualización masiva.

—

SCHEMA: Esquema.

Estos tipos de bloqueo son los que SQL utiliza para alcanzar los cuatro niveles de aislamiento. El nivel de aislamiento estándar es el COMMITED READ aunque con la instrucción: SET TRANSACTION ISOLATION LEVEL { COMMITTED READ | UNCOMMITTED READ | REPEATABLE READ | SERIALIZABLE } podemos cambiar este comportamiento. •

Bloqueo compartido Los bloqueos compartidos (SHARED, S) se utilizan para operaciones de lectura de datos.

4-62


Durante los bloqueos compartidos (S) varias transacciones concurrentes pueden leer un recurso pero no pueden modificar ese recurso mientras ese bloqueo compartido exista. Si no hemos cambiado el nivel de aislamiento de nuestra transacción, cosa que en general no haremos, en cuanto se haya producido la lectura de los datos los recursos bloqueados quedan libres. Si hemos colocado el nivel de aislamiento de nuestra transacción en REPEATABLE READ o en SERIALIZABLE, el recurso quedará bloqueado hasta que termine la transacción en la que estamos trabajando. •

Bloqueo de actualización Los bloqueos de actualización (UPDATE, U) se utilizan cuando el SQL tiene intención de modificar una fila o una página y posteriormente promociona este bloqueo a un bloqueo exclusivo (X). Este tipo de bloqueos se utiliza para evitar el problema de los interbloqueos. Veámoslo con un ejemplo: Supongamos que tenemos dos transacciones que intentarán actualizar la misma fila. Cada una de nuestras transacciones obtendrá un bloqueo compartido (S) sobre la fila, la leerá y posteriormente intentará obtener sobre esa fila un bloqueo exclusivo. Pero la obtención de un bloqueo exclusivo no es compatible con la existencia de un bloqueo compartido, así que la primera transacción esperará a que la segunda libere su bloqueo compartido, y la segunda espera a que la primera libere su bloqueo compartido para obtener uno exclusivo. Este es un ejemplo típico de interbloqueo. Para evitar esta situación tenemos este tipo de bloqueos de actualización (U). Dos transacciones no pueden obtener simultáneamente un bloqueo de actualización (U) para un recurso, y si una transacción modifica un recurso, el bloqueo de actualización (U) se convierte en bloqueo exclusivo (X). En caso contrario, el bloqueo se convierte en bloqueo de modo compartido.

•

Bloqueos exclusivos Los bloqueos exclusivos (EXCLUSIVE, X) se utilizan para realizar modificaciones con sentencias INSERT, UPDATE y DELETE. La principal característica de este bloqueo es que otras transacciones no pueden leer ni modificar los registros bloqueados. Asimismo si hay un bloqueo compartido(S) sobre un recurso ninguna transacción puede obtener un bloqueo exclusivo sobre ese recurso.

•

Bloqueos de actualización masiva Los bloqueos de actualización masiva (BULK UPDATE, BU) se utilizan durante la inserción masiva de datos en una tabla. Este tipo de bloqueos permiten que se copien datos concurrentemente en la misma tabla mientras que se impide que otros procesos accedan a esa tabla.

4-63


•

Bloqueos de Esquema Los bloqueos de esquema (SCHEMA) se usan cuando se realiza una operación que modifica el esquema de nuestra base de datos. Por ejemplo al ejecutar una sentencia DDL como ALTER TABLE se adquiere un bloqueo de modificación de esquema en la tabla para garantizar que ninguna otra conexión haga referencia ni siquiera a los metadatos de la tabla durante el cambio.

4-64

Tema 5 Diseño y programación orientada a objetos. Elementos y componentes software: objetos, clases, herencia, métodos, sobrecarga. Ventajas e inconvenientes. Patrones de diseño y lenguaje de modelado unificado (UML).


Guión-resumen

1. Diseño y programación orientada a objetos 1.1. Diseño orientado a objetos 2. Elementos y componentes software: objetos, clases, herencia, métodos, sobrecarga 2.1. Evolución de los objetos 2.2. La programación orientada a objetos (POO-OOP) 2.3. La abstracción 2.4. El encapsulado 2.5. La herencia 2.6. El poliformismo 2.7. Clase 2.8. Objeto 2.9. Propiedades y métodos 2.10. Mensajes 2.11. Identidad 2.12. Reutilización o reusabilidad 2.13. Jerarquía 2.14. Concurrencia, persistencia y tipificado 2.15. Modularidad 2.16. Relaciones entre los conceptos asociados al modelo de objetos

5-2

3. Ventajas e inconvenientes 3.1. Ventajas de POO 3.2. Inconvenientes de la POO 4. Patrones de diseño y lenguaje de modelado unificado (UML) 4.1. UML 4.2. Diagramas

Diseño y programación orientada a objetos

1.


La programación orientada a objetos y todos los lenguajes que la usan (entre los cuales destacaremos: C++, C # y JAVA) han cobrado gran renombre, no quizás tanto por su funcionalidad, sino por la revolución que causaron en la forma de pensar el programador y que con gran seguridad marcarán los lenguajes del futuro. La idea es tan sencilla como: si quiero hacer miles de bicicletas qué sería mejor: 1.

¿Ir haciendo “una a una” hasta alcanzar la cantidad prevista?

2.

¿Crear un molde (clase) para hacer bicicletas (objetos) y a partir de ese molde crear las bicicletas?

Está claro, la segunda opción es la ideal. Es más, si nos paramos a pensar: todas las bicicletas que salgan del molde serán exactamente iguales a no ser que modifiquemos el molde. A las bicicletas que quiera una vez creadas les pudo acoplar los atributos que se desee. Si le ponemos un atributo nuevo al molde todas las nuevas bicicletas tendrán ese nuevo atributo. Podríamos seguir citando ventajas durante folios y folios de este libro, pero lo que se debe es comprender la idea. El término objeto surgió a principios de los sesenta en varios campos de la informática, para referirse a nociones que eran diferentes en su apariencia, pero relacionados entre sí. Cada concepto que usamos los humanos es una idea particular o una comprensión de nuestro mundo, los conceptos adquiridos nos permiten sentir y razonar acerca de las cosas en el mundo. A estas cosas a las que se aplican nuestros conceptos se las llama objetos. Un objeto puede ser real (ejemplo: una piedra, un avión) o abstracto (ejemplo: organización). De manera formal decimos: un objeto es cualquier cosa, real o abstracta, a cerca de la cual almacenamos datos y los métodos que controlan dichos datos. Un objeto puede estar compuesto por otros objetos; estos últimos, a su vez, pueden estar compuestos de objetos, del mismo modo que una máquina está formada por partes y éstas, también, están formadas por otras partes. Esta estructura intrincada de los objetos permite definir objetos muy complejos. Las técnicas orientadas a objetos permiten que el software se construya a partir de objetos de comportamiento específico. El elemento fundamental de la OOP-POO (OOP en inglés, POO en español) es, como su nombre lo indica, el objeto. Podemos definir un objeto (en programación) como un conjunto complejo de datos y programas que poseen estructura y forman parte de una organización. Esta definición especifica varias propiedades importantes de los objetos. En primer lugar, un objeto no es un dato simple, sino que contiene en su interior cierto número de componentes bien estructurados. En segundo lugar, cada objeto no es un ente aislado, sino que forma parte de una organización jerárquica o de otro tipo. Un objeto puede considerarse como una especie de cápsula dividida en tres partes:

5-3


—

Las relaciones permiten que el objeto se inserte en la organización y están formadas esencialmente por punteros a otros objetos.

—

Las propiedades distinguen un objeto determinado de los restantes que forman parte de la misma organización y tiene valores que dependen de la propiedad de que se trate. Las propiedades de un objeto pueden ser heredadas a sus descendientes en la organización.

—

Los métodos son las operaciones que pueden realizarse sobre el objeto, que normalmente estarán incorporados en código que el objeto es capaz de ejecutar y que también pone a disposición de sus descendientes a través de la herencia.

1.1.

Diseño orientado a objetos

1.1.1. Introducción El proceso de desarrollo de software es aquel en el que las necesidades del usuario son traducidas en requisitos de “software”, éstos transformados en diseño y el diseño implementado en código. Podemos definir el diseño en el software como el proceso de aplicar distintas técnicas y principios con el propósito de definir un producto con los suficientes detalles como para permitir su realización física. Con el diseño se pretende construir un sistema que satisfaga determinada especificación del sistema, se ajuste a las limitaciones impuestas por el medio de destino y respete requisitos sobre forma, rendimiento, utilización de recursos… A través del diseño producimos un modelo o representación técnica del “software” que se va a desarrollar. El diseño es uno de los procesos básicos sobre el que se asienta la calidad del “software”. Se trata de un proceso iterativo a través del cual se traducen los requisitos en una representación del “software”. Se representa a un alto nivel de abstracción, un nivel que se puede seguir hasta requisitos específicos de datos, funcionales y de comportamiento.

1.1.2. Metodologías de diseño —

Diseño de datos. Modelo de información a estructuras de datos.

—

Diseño arquitectónico. Define las relaciones entre los elementos estructurales del programa.

—

Diseño procedimental. Se transforman los elementos estructurales del programa en una descripción procedimental del software.

—

Diseño de interfaz. Describe cómo se comunica el software consigo mismo y con su entorno.

1.1.3. Directrices de diseño —

5-4

El diseño debe implementar todos los requisitos explícitos contenidos en el modelo de análisis y debe acomodar todos los requisitos implícitos que desee el cliente.


—

El diseño debe ser una guía que puedan leer y entender los que construyan el código y los que prueban y mantienen el “software”.

—

El diseño debería proporcionar una completa idea de lo que es el “software”, enfocando los dominios de datos, funcional y de comportamiento desde la perspectiva de la implementación.

1.1.4. Principios básicos de diseño —

El diseñador debe considerar enfoques alternativos juzgando a cada uno en relación a los requisitos del problema, los resultados disponibles y los criterios de calidad interna.

—

Se deben seguir los pasos de diseño hasta el modelo de análisis.

—

El diseño no va a reinventar nada que ya esté inventado.

—

El diseño debería presentar uniformidad de integración.

—

Debe estructurarse para admitir cambios.

—

El diseño no es escribir código y escribir código no es diseñar.

—

Se debería valorar la calidad del diseño mientras se crea, no después de terminado.

1.1.5. Patrones de diseño Un patrón describe un problema que ocurre una y otra vez en nuestro entorno, para describir después el núcleo de la solución a ese problema, de tal manera que esa solución pueda ser usada varias veces sin hacerlo dos veces de la misma forma. Un patrón aborda un problema de diseño recurrente que aparece en situaciones específicas de diseño y presenta una solución para éste. Los patrones identifican y especifican abstracciones que están por encima del nivel de las clases e instancias, o de componentes. Un patrón tiene 4 elementos esenciales: —

El nombre del patrón se usa para describir un problema de diseño, sus soluciones y consecuencias en una o dos palabras.

—

El problema describe cuándo aplicar el patrón. Explica el problema y su contexto. Podría describir problemas específicos de diseño del tipo de cómo representar algoritmos como objetos. Podría describir estructuras de clases u objetos que son síntomas de un diseño inflexible.

—

La solución describe los elementos que construyen el diseño, sus relaciones, responsabilidades y colaboraciones. El patrón proporciona una descripción abstracta de un problema de diseño y cómo una disposición general de elementos lo resuelve.

5-5


—

Las consecuencias son los resultados e inconvenientes de aplicar el patrón. Aunque las consecuencias se ignoran cuando describimos las decisiones de diseño, son críticas para evaluar las alternativas de diseño y para entender los costes y beneficios de aplicar el patrón.

1.1.6. Tipos de patrones A) Patrones de creación Los patrones de creación conciernen el proceso de creación de objetos. Los patrones de creación proporcionan ayuda a la hora de crear objetos, principalmente cuando esta creación requiere tomar decisiones. Esta toma de decisiones puede ser dinámica. Estos patrones ayudan a estructurar y encapsular estas decisiones. En algunas ocasiones existe más de un patrón que se puede aplicar a la misma situación. En otras ocasiones se pueden combinar múltiples patrones convenientemente. Un patrón de creación asociado a clases usa la herencia para variar la clase que se instancia, mientras que un patrón de creación asociado a objetos delegará la instanciación a otro objeto. Hay dos formas de clasificar los patrones de creación basándose en las clases de objetos que se crean. Una es clasificar las clases que crean los objetos (Factory Method), otra forma está relacionada con la composición de objetos; definir un objeto que es responsable de conocer las clases de los objetos producto, en esta característica se apoyan los patrones Abstract Factory, Builder o Prototype. —

Factory method proporciona una interfaz para crear un objeto, pero deja a las subclases decidir cuál clase instanciar. Permite a una clase delegar la instanciación a las subclases.

—

Abstract Factory proporciona una interfaz para crear familias de objetos relacionados o dependientes sin especificar su clase concreta.

—

Builder separa la construcción de un objeto complejo de su representación para que el mismo proceso de construcción pueda crear diferentes representaciones.

—

Prototype especifica el tipo de objetos a crear usando una instancia prototipo, y crea nuevos objetos copiando este prototipo.

—

Singleton asegura que una clase sólo tiene una instancia, y proporciona un punto de acceso global a ésta.

B) Patrones estructurales Tratan de la composición de clases y objetos. Los patrones estructurales están relacionados con cómo las clases y los objetos se combinan para dar lugar a estructuras más complejas. Puede hacerse aquí la misma distinción que hacíamos en los patrones de creación y hablar de patrones estructurales asociados a clases (Adapter) y asociados a objetos (Bridge, Composite, Decorator, Facade, Flyweight, Proxy), los primeros utilizarán la herencia, los segundos la composición. 5-6


Los patrones estructurales asociados con objetos describen formas de componer los objetos para conseguir nueva funcionalidad. La flexibilidad de la composición de objetos viene de la posibilidad de cambiar la composición en tiempo de ejecución, lo que es imposible con la composición estática de clases. —

Adapter convierte la interfaz de una clase en otra interfaz que espera el cliente. Permite trabajar juntas a clases que de otra forma no podrían hacerlo por incompatibilidad de “interfaces”.

—

Bridge desacopla una abstracción de su implementación para que los dos puedan variar independientemente.

—

Composite compone objetos en estructuras de árbol para representar jerarquías parte-todo. Permite a los usuarios tratar objetos individuales y composiciones de manera uniforme.

—

Decorator agrega responsabilidades adicionales a un objeto dinámicamente. Proporcionan una alternativa flexible a las subclases para extender funcionalidad.

—

Facade proporciona una interfaz unificada a un conjunto de interfaces en un subsistema. Define una interfaz de alto nivel que hace el subsistema más fácil de usar.

—

Flyweight comparte para proporcionar un gran número de objetos pequeños eficientemente.

—

Proxy proporciona un sustituto para otro objeto, para controlar el acceso a él.

C) Patrones de comportamiento Los de comportamiento caracterizan las maneras en las que las clases u objetos interactúan y se distribuyen las responsabilidades. Estos patrones de diseño están relacionados con algoritmos y asignación de responsabilidades a los objetos. Los patrones de comportamiento describen no sólamente patrones de objetos o clases sino también patrones de comunicación entre ellos. Nuevamente se pueden clasificar en función de que trabajen con clases (Template Method, Interpreter) u objetos (Chain of Responsability, Command, Iterator, Mediator, Memento, Observer, State, Strategy, Visitor). La variación de la encapsulación es la base de muchos patrones de comportamiento. Cuando un aspecto de un programa cambia frecuentemente, estos patrones definen un objeto que encapsula dicho aspecto. Los patrones definen una clase abstracta que describe la encapsulación del objeto. —

Observer define una dependencia uno a varios entre objetos de manera que cuando un objeto cambia su estado, todos los objetos dependientes son notificados y actualizados automáticamente.

—

Mediator define un objeto que encapsula cómo un conjunto de objetos interactúan. Promueve bajo acoplamiento evitando que los 5-7


objetos se refieran entre ellos explícitamente, y permite variar su interacción independientemente. —

Chain of Responsibility evita el acoplamiento del emisor de una petición a su receptor dando a más de un objeto una oportunidad para manejar la petición. Encadena los objetos receptores y pasa la petición a lo largo de la cadena hasta que un objeto la maneja.

—

Template Method define un esqueleto de un algoritmo en una operación, aplazando algunos pasos a las subclases. Permite a las subclases redefinir ciertos pasos de un algoritmo sin cambiar la estructura del algoritmo.

—

Interpreter, dado un lenguaje, define una representación para su gramática y un intérprete que usa la representación para interpretar las sentencias en el lenguaje.

—

Strategy define una familia de algoritmos, encapsulados individualmente, y los hace intercambiables. Permite a un algoritmo cambiar independientemente de los usuarios que lo usen.

—

Visitor representa una operación que va a ejecutarse sobre elementos de una estructura de objetos. Permite definir una nueva operación sin cambiar las clases de los elementos con los que opera.

—

State permite a un objeto alterar su comportamiento cuando cambia su estado interno. El objeto aparenta cambiar su clase.

—

Command encapsula una petición como objeto, por lo tanto permite valorar o analizar los usuarios con diferentes peticiones, colas o peticiones de conexión, y permite operaciones que se pueden deshacer.

—

Iterator proporciona un medio para acceder a los elementos de un objeto agregado secuencialmente sin exponer su representación subyacente.

El ámbito especifica cuando los patrones se aplican principalmente a las clases o a los objetos. Los patrones de clase tratan con relaciones entre las clases y sus subclases. Estas relaciones se establecen a través de la herencia, así que son estáticas, fijas en tiempo de compilación. Los patrones de objetos tratan con las relaciones de objetos, que pueden cambiar en tiempo de ejecución y son más dinámicos. Casi todos los patrones utilizan la herencia en algún punto. Los patrones de clase de creación delegan alguna parte de la creación a subclases, mientras que los de objeto delegan en otro objeto. Los estructurales de clases usan la herencia para componer las clases, mientras que los de objeto describen maneras de reunir objetos. Los patrones de clase de comportamiento usan herencia para describir algoritmos y flujo de control, mientras que los de objeto describen cómo un grupo de objetos cooperan para realizar una tarea que no podría llevar a cabo un objeto sólo. Los métodos de diseño orientados a objetos favorecen varios enfoques. Se puede escribir el problema y extraer nombres y verbos como clases y ope-

5-8


raciones. Se puede modelar desde el punto de vista de las colaboraciones y responsabilidades en el sistema. Se puede modelar el mundo real y trasladar los objetos encontrados en el análisis al diseño. Los patrones de diseño ayudan a identificar las abstracciones menos obvias y los objetos que pueden capturarlas. D) Interfaces Cada operación declarada por un objeto especifica el nombre de una operación, los objetos que toma como parámetros y lo que devuelve. A esto se le llama signatura. Al conjunto de todas las signaturas definidas por las operaciones de un objeto se le llama la interfaz del objeto. La interfaz de un objeto caracteriza el conjunto completo de peticiones que se le pueden mandar a un objeto. Cualquier petición que coincida con una signatura de la interfaz de un objeto puede ser mandada a ese objeto. Un tipo es el nombre que se suele usar para denotar una interfaz determinada. Un objeto puede tener varios tipos, y objetos muy diferentes pueden ser del mismo tipo. Dos objetos del mismo tipo sólo necesitan compartir parte de sus interfaces. Las interfaces pueden contener otras interfaces como subconjuntos. Se dice que un tipo es un subtipo de otro si su interfaz contiene la interfaz de su supertipo (herencia). Los “interfaces” son fundamentales en los sistemas orientados a objetos. Los objetos sólo son conocidos a través de sus interfaces. No hay manera de saber nada acerca de un objeto o de pedirle que haga algo sin pasar a través de su interfaz. La interfaz de un objeto no dice nada acerca de su implementación, pues diferentes objetos pueden implementar las peticiones de manera diferente. Cuando una petición se envía a un objeto, la operación que se realiza depende tanto de la petición como del objeto que la recibe. La asociación en tiempo de ejecución de una petición a un objeto y la operación se llama ligadura dinámica. La ligadura dinámica significa que hacer una petición no se asocia a una implementación particular hasta tiempo de ejecución. Por lo tanto, se pueden escribir programas que esperen un objeto con una interfaz particular, sabiendo que cualquier objeto que tenga la interfaz correcta aceptará la petición. Es más, la ligadura dinámica permite sustituir objetos que tienen interfaces idénticas entre sí en tiempo de ejecución (polimorfismo). El polimorfismo simplifica las definiciones de los usuarios, desacopla los objetos entre sí, y permite que varíen sus relaciones en tiempo de ejecución. Los patrones de diseño ayudan a definir interfaces identificando sus elementos principales y los tipo de datos que pueden ser enviados a través de una interfaz. Un patrón de diseño puede indicar también qué es lo que no se debe poner en una interfaz. El patrón memento describe cómo encapsular y salvar el estado interno de un objeto para que este pueda ser restaurado posteriormente. El patrón estipula que los objetos memento deben definir dos interfaces: una restringida para los usuarios, y otra privilegiada para que únicamente el objeto original pueda guardar y recuperar su estado. 5-9


Los patrones de diseño también especifican las relaciones entre “interfaces”. En particular, muchas veces necesitan que algunas clases tengan “interfaces” similares, o añaden restricciones a las interfaces de algunas clases. Existen dos beneficios al manipular los objetos en términos de su interfaz definida por una clase abstracta: —

Los usuarios ignoran en tipo específico de objeto que están usando, mientras que respondan a la interfaz que el cliente espera.

—

Los usuarios ignoran las clases que implementan los objetos. Únicamente deben conocer la clase abstracta que definen el interfaz.

Esto reduce significativamente las dependencias de implementación entre los subsistemas. Los patrones de creación abstraen el proceso de creación, de manera que ofrecen diferentes maneras de asociar una interfaz con su implementación de manera transparente a la instanciación. Los patrones de creación aseguran que el sistema se escribe en términos de interfaces, no implementaciones.

1.1.7. Herencia y composición Las dos maneras de reutilizar la funcionalidad en los sistemas Orientados a Objetos son la herencia de clases (caja blanca) y la composición de objetos (caja negra). Cada una tiene sus ventajas e inconvenientes. —

Ventajas: La herencia de clases se define estáticamente en tiempo de compilación, y se usa directamente, ya que está proporcionada por el lenguaje de programación. La herencia permite modificar de manera más sencilla la implementación que se está reutilizando. Si se sobrescriben algunos, pero no todos los métodos, podría ocurrir que los no sobrescritos llamen a los sobrescritos.

—

Inconvenientes: No se puede cambiar la implementación heredada de las clases base en tiempo de ejecución, ya que se define en tiempo de compilación. La herencia rompe el encapsulamiento. Las superclases definen parte de la representación física de las subclases. Las dependencias de implementación pueden causar problemas cuando se intenta reutilizar una subclase... se podría solucionar heredando de “interfaces”.

La composición de objetos se define dinámicamente en tiempo de ejecución mediante objetos que toman referencias a otros objetos. La composición requiere que los objetos respeten sus “interfaces”, lo que requiere “interfaces” diseñados cuidadosamente. A cambio, no se rompe el encapsulamiento, y cualquier objeto puede ser reemplazado por otro en tiempo de ejecución siempre que tenga el mismo tipo. Existen menos dependencias de implementación. La composición de objetos tiene otro efecto sobre el diseño de sistemas. Cada clase se mantiene encapsulada y enfocada en una tarea. Las clases y jerarquías de clases permanecerán pequeñas en lugar de crecer hasta convertirse en 5-10


monstruos inmanejables. Por otra parte un diseño basado en la composición de objetos tendrá más objetos (y menos clases). Idealmente, se debería poder conseguir toda la funcionalidad que se necesite ensamblando componentes existentes mediante composición de objetos. Pero este caso no se suele dar, porque el conjunto de componentes nunca es suficientemente rico. La reutilización mediante la herencia hace más fácil componer nuevos componentes con los antiguos. De esta manera la herencia y la composición trabajan juntos.

1.1.8. Delegación Sirve para simular la herencia mediante la composición. La principal ventaja de la delegación es que hace fácil componer comportamientos en tiempo de ejecución y cambiar la manera en la que están compuestos. La desventaja es que es más difícil de entender, e ineficiencias de tiempo de ejecución. Varios patrones usan delegación: state, strategy y visitor. La delegación es un ejemplo extremo de composición de objetos. Nos muestra que siempre se puede reemplazar herencia por composición de objetos como mecanismo de reutilización de código.

1.1.9. Diseño La llave para maximizar la reutilización está en anticiparse a los nuevos requisitos y cambios a los requisitos existentes, y diseñar el sistema para que pueda evolucionar como corresponde. Los cambios pueden provocar redefinición de las clases, reimplementación, modificación del cliente, y nuevos tests. El rediseño afecta a muchas partes del sistema software. Los patrones de diseño nos ayudan a evitarlo asegurando que el sistema puede cambiar en ciertos aspectos determinados. Cada patrón de diseño permite que algún aspecto de la estructura del sistema varíe independientemente de otros aspectos, por lo tanto hace el sistema más robusto para un tipo determinado de cambio. Se listan a continuación las causas de rediseño más comunes junto con los patrones de diseño que las abordan: 1.

Crear un objeto especificando una clase explícitamente. Especificar el nombre de una clase cuando se crea un objeto, nos compromete a una implementación particular en lugar de a una interfaz. Este compromiso puede complicar cambios futuros. Para evitarlo, los objetos se deben crear indirectamente. Patrones de diseño: Factoría abstracta, factory method, prototipo.

2.

Dependencias de operaciones específicas. Cuando se especifica una operación particular, nos comprometemos a una manera de satisfacer una petición. Evitando peticiones especificadas en tiempo de compilación, se hace más fácil de cambiar la manera en la que se satisface una petición. Patrones de diseño: Cadena de responsabilidad, comando. 5-11


3.

Dependencia de la plataforma hardware y software. Las APIs de los sistemas operativos son diferentes para las distintas plataformas. El “software” que depende de una plataforma particular será más difícil de portar a otras plataformas. Podría incluso ser difícil de mantener actualizada en su plataforma nativa. Por lo tanto, es importante diseñar el “software” para limitar las dependencias de la plataforma. Patrones de diseño: factoría abstracta, puente.

4.

Dependencia de las representaciones o implementaciones de objetos. Los usuarios que saben como se representa, almacena o implementa podrían necesitar ser cambiados cuando cambien los objetos. Ocultar esta información de los usuarios evita cambios en cascada. Patrones de diseño: factoría abstracta, puente, memento, proxy.

5.

Dependencias algorítmicas. Los algoritmos se extienden, optimizan y se reemplazan habitualmente durante el desarrollo y la reutilización. Los objetos que dependen de un algoritmo tendrán que cambiar cuando el algoritmo cambie. Por lo tanto los algoritmos que tengan pinta de cambiar deben ser aislados. Patrones de diseño: buider, iterator, estrategia, template method, visitor.

6.

Acoplamiento fuerte. Las clases que están muy acopladas son difíciles de reutilizar individualmente, ya que dependen unas de otras. El acoplamiento fuerte lleva a sistemas monolíticos, donde no se puede cambiar o eliminar una clase sin entender y cambiar muchas otras clases. El sistema se convierte en una masa densa que es difícil de aprender, portar y mantener. El acoplamiento débil incrementa la probabilidad de que una clase pueda ser reutilizada por sí misma y que el sistema pueda ser aprendido, portado, modificado y extendido más fácilmente. Patrones de diseño: factoría abstracta, puente, cadena de responsabilidad, comando, fachada, mediador, observador.

7.

5-12

Extender la funcionalidad mediante la herencia. Adaptar un objeto mediante la herencia muchas veces no es fácil. Cada nueva clase tiene una implementación fija por encima (inicialización, terminación...). Definir una subclase además requiere un entendimiento en profundidad de la clase base. Por ejemplo, sobrescribir una operación puede requerir sobrescribir otra. Una operación sobrescrita podría ser necesitada para llamar a una operación heredada. Y la herencia puede llevar a una explosión de clases, porque podrían necesitarse muchas subclases nuevas para una simple extensión. La composición de objetos en general y la delegación en particular proporciona una alternativa flexible a la herencia para combinar comportamientos. La nueva funcionalidad puede añadirse a una aplicación componiendo objetos existentes de nuevas maneras en lugar de definir nuevas subclases de clases existentes. Por otra parte, demasiado uso de la composición puede hacer los diseños más difíciles de entender. Muchos patrones de diseño producen diseños en los que se pueden introducir nuevas funcionalidades simplemente definiendo una subclase y componiendo las instancias con otras existentes.


Patrones de diseño: puente, cadena de responsabilidad, composite, decorador, observador, estrategia. 8.

Incapacidad para alterar las clases convenientemente. A veces hay que modificar una clase que no puede ser modificada convenientemente. Quizás se necesita el código fuente y no se tiene. O puede que cualquier cambio necesite modificar un montón de clases existentes. Los patrones nos ayudan a modificar las clases en estas circunstancias. Patrones de diseño: adaptador, decorador, visitor.

2. 2.1.

Elementos y componentes software: objetos, clases, herencia, métodos, sobrecarga Evolución de los objetos

Las ideas básicas sobre los objetos, nacen a principios de los años setenta en la universidad de Noruega donde un equipo dirigido por el Dr. Nygaard, se dedicaba a desarrollar sistemas informáticos para realizar simulaciones de sistemas físicos. Debido a que eran programas muy complejos y el mantenimiento era muy necesario (para que el software se adaptara a nuevas necesidades), se dieron cuenta de las limitaciones de la ingeniería de software tradicional, para solucionar este problema idearon una forma de diseñar el programa paralelamente al objeto físico, donde cada componente del objeto físico se correspondía con un componente de “software”, con lo que se simplificaba el programa y, por tanto, el mantenimiento exigía menor esfuerzo. Lo anterior trajo consigo otro beneficio como es la reutilización del código, hecho que por sí mismo repercute en una baja en el costo del “software” y en el tiempo requerido para el desarrollo de sistemas. El primer lenguaje que implementó estas ideas fue el lenguaje SIMULA-67. Luego, en la década de los 70, XEROX en sus laboratorios de Palo Alto desarrolla SMALL-TALK. En los años 80 tomando ideas de Simula y de Small-Talk, en los laboratorios Bell de ATT, Stroustrup crea el lenguaje C++ como sucesor del Lenguaje C, y a éste se debe la gran extensión de los conceptos de objetos. En el área de la inteligencia artificial, se desarrolla Clos, una variante de Lisp orientada a objetos. En sistemas operativos, el Next-Step de Sun es un Sistema Operativo Orientado a objetos. Microsoft trabaja en Cairo, IBM y Apple trabajan en Pink, como sistemas operativos que incluyen conceptos de objetos. En las bases de datos, tenemos al SNAP (Strategic Networed Applications Plataform), conocido en español como Sistemas distribuidos en línea orientados a objetos. Poco más tarde (1993-4) Sun crea JAVA, el cual arrasa hasta la actualidad en aplicaciones cliente y en programas ejecutables para Internet (applets).

5-13


Los conceptos de objetos entran en profundidad poco a poco en todos los ámbitos de la computación, y de la misma manera que ha sido inevitable aprender programación estructurada o bases de datos relacionales, ahora se hace necesario aprender programación orientada a objetos. Los conceptos de análisis, diseño y programación con objetos son fáciles de dominar una vez que se tiene una base de programación en un lenguaje. Para poder construirnos nuestras propias librerías de clases o para llegar a ser un programador de objetos de alto rendimiento, se requiere un poco mas de práctica. En el mercado existen bibliotecas de clases, y también varios lenguajes traen bibliotecas de clases que le permiten al programador realizar ciertas tareas sin tener que programarlas. No obstante, no debemos confundir Programación Orientada a Objetos donde el programador puede usar clases precreadas o crearlas el mismo con Programación Basada en Objetos donde las clases ya están precreadas y el programador solo puede usarlas o modificarlas. Ejemplos de lenguajes de Programación Basada en Objetos son: Clipper que tiene objetos ya creados como el Tbrowse que permite el manejo de tablas y Visual Basic al igual que Delphi tienen objetos como botones o cuadros de diálogo con los que permite desarrollar interfaces de usuario con un mínimo de programación.

Nota. Hemos de destacar que Visual Basic .NET es también un lenguaje de última generación Orientado a Objetos.

2.2.

La programación orientada a objetos (POO-OOP)

La idea principal de POO es construir programas que utilizan objetos de software. Un objeto puede considerarse como una entidad independiente de cómputo con sus propios datos y programación. En computadoras modernas, las ventanas, los menús y las carpetas de archivos, por ejemplo, suelen representarse con objetos de “software”. Pero los objetos pueden aplicarse a muchos tipos de programas Se incluirían datos que describen los atributos físicos, y programación (métodos), que gobierna la manera en que funciona internamente y en que interactúa con otras partes relacionadas. En contraste, la programación tradicional trabajaba con “bytes”, variables, matrices, índices y otros utensilios de programación que resultaba difícil relacionar con el problema actual. Además, la programación tradicional se concentra en los procedimientos paso a paso, llamados algoritmos, para realizar las tareas deseadas. Por esta razón, a la programación tradicional también se le conoce como programación orientada a procedimientos. Todos los lenguajes de programación están formados por dos elementos: código y datos. Cuando los programas empezaron a hacerse complicados y su código es enorme y casi inmanejable, se pensó crear una nueva forma de pensar de la cual surgió la programación orientada a objetos. En ella un programa se organiza entorno a sus datos (objetos) y a un conjunto de interfaces bien definidas para esos datos. La POO es un modelo de programación que utiliza objetos ligados mediante mensajes para la resolución de problemas. La idea inicial siempre ha sido organizar los programas a imagen y semejanza de la organización de los objetos en el mundo real. 5-14


Las técnicas orientadas a objetos se basan en organizar el software como una colección de objetos discretos que incorporan tanto estructuras de datos como comportamiento. Esto contrasta con la programación convencional, en la que las estructuras de datos y el comportamiento estaban escasamente relacionadas. Las características principales del enfoque orientado a objetos serán estudiadas con detenimiento en este tema y son: —

Abstracción.

—

Encapsulación.

—

Herencia.

—

Polimorfismo.

—

Clase.

—

Objeto.

—

Método.

—

Mensajes.

—

Identidad.

—

Reutilización.

—

Jerarquía.

—

Concurrencia.

—

Modularidad.

A partir de estos elementos fundamentales, trataremos de dar un enfoque tanto estructurado como también un enfoque orientado a objetos. Un objeto en el mundo real tiene una apariencia, peso, volumen y se puede definir por la función que realiza. Tiene por tanto un conjunto de características (atributos) que describen su naturaleza y funcionalidad. Un objeto es cualquier cosa, real o abstracta, en la cual almacenamos datos y los métodos que controlan dichos datos, pongamos la vista enfrente y estaremos rodeados de objetos. La teoría de los objetos puede ser aplicada a cualquier sistema, por que la organización de éstos (objetos) es lo que define al sistema, ya que éste posee atributos y características individuales que lo hacen organizacional, desde su denominación en sí, su clase, su poliformismo, el proceso de encapsulación, la herencia que sucede a otro objeto, los mensajes que de algún modo llevan a cabo que se realice una operación, el método como se hace, su identidad, que lo difiere de los demás, su reutilización, el orden jerarquizado, su abstracción, modularidad y, por ultimo, su concurrencia. 5-15


La solución para tratar con la complejidad típica de los programas es “Divide y vencerás”: —

Descomposición Algorítmica (top-down o estructural): Rompe el sistema en partes, cada una representando un pequeño paso del proceso. Métodos de diseño estructurados conducen a descomposiciones algorítmicas, donde la atención se centra en el flujo del sistema.

—

Descomposición orientada a objetos: Trata de identificar semánticamente el dominio del problema. El entorno del problema se estudia como un conjunto de agentes autónomos (objetos) que colaboran para realizar un comportamiento complejo. Algorítmica.

Orientada a objetos.

Diagramas tipo árbol.

Varias posibilidades.

Desmenuza el problema.

Identifica semánticamente el problema.

Se programa en detalle.

Se programa a lo grande.

Lenguajes imperativos.

Lenguajes declarativos.

En cuanto a las características de las descomposiciones algorítmica y orientada a objetos hemos de diferenciar tres términos usados en la orientación a objetos: —

Análisis Orientado a Objetos: es un método de análisis que examina los requerimientos desde la perspectiva de clases y objetos encontrada en el vocabulario original del problema.

—

Diseño Orientado a Objetos: es un método de diseño que abarca el proceso de descomposición orientado a objetos y una notación para describir modelos lógicos y físicos, dinámicos y estáticos, del sistema bajo diseño.

—

Programación Orientada a Objetos: es el método de implementación en el cual los programas se organizan como colecciones cooperantes de objetos, cada uno de los cuales representa un ejemplo de alguna clase, y cuyas clases son todas miembros de una jerarquía de clases unidas por relaciones.

El concepto renovador de la tecnología de POO es la anexión de procedimientos de programas a elementos de datos. Esta idea cambia la separación tradicional entre datos y programas. A esta nueva unión se le llama encapsulamiento y el resultado es un objeto de software. En JAVA, por ejemplo, todos los procedimientos están encapsulados y se les llama métodos. Por ejemplo, un objeto de ventana en un sistema de interfaz gráfica del usuario contiene las dimensiones físicas de la ventana, la ubicación en la pantalla, los colores de primer plano y de fondo, los estilos de borde y otros datos relevantes. Encapsulados junto con estos datos, se encuentran los métodos

5-16


para mover y modificar el tamaño de la propia ventana, para cambiar sus colores, para desplegar texto, para reducirlo a un icono, etc. Otras partes del programa de interfaz del usuario sólo llaman a un objeto de ventana para realizar estas tareas enviándole mensajes bien definidos. El trabajo de un objeto de ventana consiste en realizar las acciones apropiadas y mantener actualizados sus datos internos. Para programas fuera del objeto no importa mucho la manera exacta en que se realizan estas tareas ni las estructuras de los datos internos. La interfaz pública formada por los diferentes tipos de mensajes que envía un objeto, definen por completo la manera de usarlo. Ésta es la interfaz de programación de aplicaciones (API, Application Programming Interface) del objeto. El ocultamiento de detalles internos hace que un objeto sea abstracto. La separación entre la interfaz pública y el funcionamiento interno no es difícil de comprender. Por ejemplo, cuando montamos en un coche, pensamos en un medio de transporte que nos lleve de un lugar a otro. No pensamos en un masijo de hierros, plástico, etc. Además, si montamos en el coche del vecino sabremos conducirlo igualmente pues su forma de utilización es la misa. Su funcionamiento interno lo dejamos para cuando falla y tenemos que pagarle al taller. Cuando se ejecuta un programa, los objetos se crean, los mensajes se envían y los objetos se destruyen. Éstas son las únicas operaciones permisibles sobre ellos. Los datos o los métodos internos (privados) de un objeto están fuera de los límites del público. El desacoplamiento de los mecanismos privados de los objetos de las rutinas externas a ellos, reducen en gran medida la complejidad de un programa. En POO se define una clase para cada tipo diferente de objeto. Se utilizan una definición de clase y valores iniciales apropiados para crear una instancia (objeto) de la clase. A esta operación se le conoce como instanciación de objetos. La tecnología de POO necesita formas fáciles para construir objetos sobre otros, para eso existen dos métodos principales, composición y herencia. El primero permite que objetos existentes se utilicen como componentes para construir otros. Por ejemplo, un objeto de calculadora puede estar compuesto por otro de unidad aritmética y uno más de interfaz de usuario. La herencia es una función importante de POO que le permite ampliar y modificar clases existentes sin cambiar su código. Una subclase hereda código de su superclase y, también, agrega sus propios datos y métodos. La herencia permite la extracción de elementos comunes entre objetos similares o relacionados. También permite que se utilicen clases de bibliotecas de software para muchos propósitos diferentes o no previsibles. Heredar de una clase se conoce como herencia simple y heredar de varias clases se conoce como herencia múltiple. Además, POO permite el polimorfismo, que es la capacidad de un programa para trabajar con diferentes objetos. Se permite la creación de objetos compatibles que son transferibles. La modificación y el mejoramiento de un programa polimórfico puede ser tan sólo cuestión de enlazar objetos actualizados. Una clase es como el plano de los objetos. Describe las estructuras de datos del objeto y sus operaciones asociadas. Una vez que se ha definido una clase, es posible declarar los objetos que le pertenecen y utilizarlos en un pro5-17


grama. Por lo general una clase contiene miembros que pueden ser campos y métodos. Los primeros son variables que almacenan datos y objetos. Los segundos son funciones que codifican operaciones. Es así que ellos reciben argumentos, realizan cálculos predefinidos y devuelven resultados. Un mensaje enviado a un objeto invoca un método de ese objeto, le pasa argumentos y obtiene el valor que devuelve. Los objetos interactúan al enviar y recibir mensajes. Una clase proporciona el nombre bajo el que se reúnen los miembros para formar una unidad de cálculo que puede operar con independencia de otras partes del programa. Con objetos, puede construirse un programa grande con muchas unidades pequeñas, independientes y que interactúan entre sí. La orientación a objetos puede reducir significativamente la complejidad del programa, aumentar su flexibilidad y mejorar las posibilidades de volver a usarlo. Un programa puede definir sus propias clases, utilizar las precreadas (generalmente guardadas en bibliotecas de clases) y emplear las que han sido creadas por otros programadores. Las clases pueden estar organizadas en paquetes con un nombre. Cada paquete puede contener uno o más archivos de código fuente. Veamos a continuación cada uno de los concepto clave de la programación orientada a objetos en profundidad.

2.3.

La abstracción

La abstracción es una de las bases de la POO. Desde siempre el programador ha intentado abstraerse y no ver el programa como un conjunto complejo de código. Se pretender ignorar los detalles y obtener una visión en su conjunto. Una forma de obtener una buena abstracción es utilizando clasificaciones jerárquicas. En las clasificaciones jerárquicas primero vemos el sistema desde su exterior. Luego, en un segundo nivel, nos vamos adentrando en él y viendo los subsistemas, en un tercer nivel nos adentramos en cada uno de los subsistemas, etc.

Ejemplo. Un camión: Si nos abstraemos lo vemos exteriormente como un objeto de grandes dimensiones y con gran capacidad de carga que puede transportar de un lugar a otro. El camión lo podemos dividir en cabina, remolque, usos, coste, etc. (subsistemas). Dentro de la cabina vemos que es un habitáculo donde el conductor se acomoda y controla el camión. A su vez dentro del subsistema cabina tenemos: los asientos, la radio, controles, etc. Cada uno de ellos con una función delimitada. Dentro de cada uno de ellos, … Esta abstracción jerárquica de sistemas en subsistemas se puede aplicar a los programas que el programador crea y de los datos tradicionales obtenemos su abstracción en objetos. Cada uno de estos objetos tiene un comportamiento y funcionalidad propio, que se pueden tratar como entidades inde5-18


pendientes y que responden a mensajes (secuencia de pasos de un proceso) que les dicen lo que tienen que hacer y en qué orden. Una abstracción denota las características esenciales de un objeto que lo distinguen de todos los demás tipos de objetos, y proporciona así fronteras conceptuales definidas con nitidez, desde la perspectiva del observador. Todo objeto es único. Sin embargo, la abstracción elimina algunas distinciones para que podamos ver los aspectos comunes entre los objetos. La abstracción es una de las vías fundamentales por la que los humanos podamos combatir la complejidad. Una abstracción se centra en la visión externa de un objeto y, por lo tanto, sirve para separar el comportamiento esencial de un objeto de su implantación. Sin la abstracción sólo sabríamos que cada objeto es diferente de los demás, con ella se omiten de manera selectiva varias características distintivas de uno o más objetos, lo que permite concentrarnos en las características que comparten. Para hacerlo más entendible, diremos que la abstracción: es el acto o resultado de eliminar diferencias entre los objetos, de modo que podamos ver los aspectos más comunes. La abstracción denota las características esenciales que distinguen a un objeto de otros tipos de objetos, definiendo precisas fronteras conceptuales, relativas al observador. Las características de la abstracción son:

2.4.

—

Surge del reconocimiento de similitudes entre ciertos objetos, situaciones o procesos en el mundo real.

—

Decide concentrarse en estas similitudes e ignorar las diferencias.

—

Enfatiza detalles con significado para el usuario, suprimiendo aquellos detalles que, por el momento, son irrelevantes o distraen de lo esencial.

—

Deben seguir el “principio de mínimo compromiso”, que significa que la interface de un objeto provee su comportamiento esencial, y nada más que eso. Pero también el “principio de mínimo asombro”: capturar el comportamiento sin ofrecer sorpresas o efectos laterales.

El encapsulado

Se trata de un mecanismo que permite juntar el código y los datos y que mantiene a ambos alejados de posibles usos indebidos. Para ello el acceso al código y a los datos se realiza de forma controlada a través de una interfaz bien definida. El encapsulado permite que se realice la migración de las implementaciones tras el paso del tiempo, sin necesidad de reescribir de nuevo todo el código (reutilización o reusibilidad).

Ejemplo. Estás en tu coche. Si pisas el freno lo que debe de hacer el coche es frenar y no debe de activarse el parabrisas, ni acelerar, ni aumentar el volumen de la radio, etc. Eso sucede gracias a que el sistema de frenado está perfectamente definido y funciona como un sistema independiente y con una 5-19


función muy definida. Puede comunicarse con otros sistemas como las luces para que se activen las luces de frenado, pero esta comunicación está perfectamente definida y aunque no funcionen las luces el coche ha de frenar igualmente. Igualmente, si el coche no frena el fallo es del sistema de frenado y no de otro sistema. Con el encapsulado lo único que debemos conocer del sistema es como acceder a él, sin preocuparnos de los detalles internos (abstracción) y estamos seguros de que no se van a producir efectos secundarios imprevistos. Por tanto, el encapsulado consiste en ocultar los detalles de instrumentación de un objeto, a la vez que se provee de una interfaz pública por medio de sus operaciones permitidas. En los modelos orientados a objetos, lo que realmente nos importa es el comportamiento de los objetos y no cómo está instrumentado ese comportamiento. Así, si la instrumentación de un objeto cambia pero su interfaz se mantiene igual, los objetos que interactúan con él no se verán afectados por esos cambios. Además, el encapsulamiento oculta la complejidad de la instrumentación. El encapsulamiento es el proceso de compartimentar los elementos de una abstracción que constituyen su estructura y su compartimiento. Dicho de otro modo, cada objeto es una estructura compleja en cuyo interior hay datos y código, todos ellos relacionados entre sí, como si estuvieran encerrados conjuntamente en una cápsula. Es, a esta propiedad, a lo que se denomina encapsulamiento. Se puede definir como el proceso de almacenar en un mismo compartimiento los elementos de una abstracción que constituyen su estructura y su comportamiento; sirve para separar la interfaz contractual de una abstracción y su implantación. El hecho de cada objeto sea una cápsula facilita enormemente que un objeto determinado pueda ser transportado a otro punto de la organización, o incluso a otra organización totalmente diferente que precise de él. Si el objeto ha sido bien construido, sus métodos seguirán funcionando en el nuevo entorno sin problemas. Esta cualidad hace que la POO sea muy apta para la reutilización de programas. El encapsulamiento es importante porque separa el comportamiento del objeto de su implantación. Esto permite la modificación de la implantación del objeto sin que se tengan que modificar las aplicaciones que lo utilizan. La encapsulación sirve para separar la interface de una abstracción y su implementación. —

Es un concepto complementario al de abstracción.

—

La encapsulación esconde la implementación del objeto que no contribuye a sus características esenciales.

—

La encapsulación da lugar a que las clases se dividan en dos partes:

—

5-20

1.

Interface: captura la visión externa de una clase, abarcando la abstracción del comportamiento común a los ejemplos de esa clase.

2.

Implementación: comprende la representación de la abstracción, así como los mecanismos que conducen al comportamiento deseado.

Se conoce también como ocultamiento o privacidad de la información.


Como hemos visto, cada objeto es una estructura compleja en cuyo interior hay datos y programas, todos ellos relacionados entre sí, como si estuvieran encerrados conjuntamente en una cápsula. Esta propiedad (encapsulamiento), es una de las características fundamentales en la OOP. No obstante, los objetos son inaccesibles, e impiden que otros objetos, los usuarios, o incluso los programadores conozcan cómo está distribuida la información o qué información hay disponible. Esta propiedad de los objetos se denomina ocultación de la información. Esto no quiere decir, sin embargo, que sea imposible conocer lo necesario respecto a un objeto y a lo que contiene. Si así fuera no se podría hacer gran cosa con él. Lo que sucede es que las peticiones de información a un objeto deben realizarse a través de mensajes dirigidos a él, con la orden de realizar la operación pertinente. La respuesta a estas órdenes será la información requerida, siempre que el objeto considere que quien envía el mensaje está autorizado para obtenerla. El hecho de que cada objeto sea una cápsula facilita enormemente que un objeto determinado pueda ser transportado a otro punto de la organización, o incluso a otra organización totalmente diferente que precise de él. Si el objeto ha sido bien construido, sus métodos seguirán funcionando en el nuevo entorno sin problemas. Esta cualidad hace que la POO sea muy apta para la reutilización de programas. Otra forma de ver su definición: Una de las características centrales de POO es la partición del programa completo en pequeñas entidades autónomas, llamadas objetos, con interacciones bien definidas. Esta característica reduce significativamente la complejidad global y ayuda a la calidad del programa de diferentes maneras. Un objeto organiza datos y operaciones relacionadas en una caja negra, que oculta las estructuras de datos, las representaciones y el código interno de la vista exterior. Una estructura de datos es concreta cuando se conocen sus elementos exactos. Los métodos de programación tradicional dependen mucho de datos concretos. Una estructura de datos es abstracta, si sólo conocemos su comportamiento y no sus detalles de implantación. Por tanto, la abstracción de datos pone el énfasis en el ocultamiento de los detalles internos de los datos y sólo presenta su comportamiento externo. Por ejemplo, sin conocer los detalles de la construcción de un automóvil, podemos manejarlo con sólo conocer comportamientos como: “al girar el volante en el sentido de las manecillas del reloj se gira a la derecha”. Esto deja la implantación de la conducción a la caja negra, que puede utilizar una de las varias alternativas de dirección: normal, hidráulica, de engranes, etc. Además, un objeto también contiene mecanismos o códigos que son necesarios para operar las estructuras de datos que están adjuntos a los códigos para formar una unidad inseparable. A esta técnica se le llama encapsulación. En POO el comportamiento externo de un objeto es un contrato de interfaz entre el objeto y sus clientes (los programas que utilizan el objeto). Este convenio contiene datos/operaciones que quedan disponibles para los clientes externos a partir de un objeto y que documenta su significado preciso.

5-21


2.5.

La herencia

La herencia es el proceso mediante el cual un objeto adquiere las propiedades de otro. Gracias a la herencia se consigue llevar a cabo la idea vista anteriormente de clasificación jerárquica. Si una clase dada encapsula algunos atributos entonces cualquier clase “hija” de la anterior (subclase) heredará los atributos de la anterior más los que se le quieran definir. La herencia nos da reusabilidad de código. El concepto de herencia se refiere a la comparición de atributos y operaciones basadas en una relación jerárquica entre varias clases. Una clase pude definirse de forma general y luego redefinirse en sucesivas subclases. Cada clase hereda todas las propiedades de sus superclases y añade sus propiedades particulares.

Ejemplo 1. Los seres vivos tienen una serie de propiedades. Los animales al ser seres vivos heredan esas propiedades a las cuales añaden otros. Los mamíferos al ser animales, heredan todos los atributos de los animales (algunas de las cuales heredaban de los seres vivos) a los cuales añaden otros. Los humanos, como animales, etc. Ejemplo 2. Imagínate que tienes un molde para hacer bicicletas sin marchas. Has hecho miles de bicicletas y todo va bien. De repente deseas hacer bicicletas con marchas. ¿Qué te parece mas apropiado: crear un nuevo molde (es decir, crear de nuevo con todo lo que ello conlleva), o coger el molde anterior y acoplarle las marchas? Ésta es la idea de la herencia, a partir de un sistema creado se crea uno nuevo acoplándole nuevos atributos. La herencia es el medio por el cual los objetos de una clase pueden acceder a variables y funciones miembro contenidas en una clase previamente definida, sin tener que volver a realizar esas definiciones. Existen dos tipos de herencia: A) Herencia simple La herencia simple es aquella en la que una clase puede heredar la estructura de datos y operaciones de una superclase. Es una relación entre clases en la que una clase comparte la estructura o el comportamiento definido en una. B) Herencia múltiple La herencia múltiple se da cuando una clase puede heredar la estructura de datos y operaciones de más de una superclase. Es la relación entre clases en la que una clase comparte la estructura demás de una clase base. La herencia múltiple presenta una gran dificultad y es el hecho que puede heredar dos operaciones con el mismo nombre. Esto hace que las colisiones pueden introducir ambigüedad en el comportamiento de la subclase que hereda en forma múltiple.

Nota. El lenguaje C++ permite la herencia múltiple, pero JAVA no lo permite.

5-22


Es una de las propiedades más destacadas de la POO, se puede definir como un mecanismo que define nuevos objetos con base en los existentes. Lenguajes de programación como C++ y JAVA la soportan con extensión de clase, definiendo una nueva clase con base en otra ya existente sin modificarla. A la primera se le llama subclase o clase extendida, recibe a los miembros de una superclase y agrega otros de su propiedad. Aunque también es posible que la herede dado el surgimiento de jerarquías. JAVA soporta herencia sencilla a través de extensión de clase. En este tipo de herencia una clase se extiende a partir de una sola superclase. Por ejemplo, una subclase puede extenderse de la superclase. Algunos lenguajes POO, como C++, soportan herencia múltiple porque una subclase puede tener varias superclases. Al anular la herencia múltiple, JAVA evita las dificultades y complicaciones relacionadas con este tipo de herencia. Si una clase se designa final no puede extenderse. El uso experto de la herencia a través de subclases contribuye en gran medida a un programa bien diseñado. Varias son las ventajas de la herencia, entre las cuales citamos:

2.6.

—

Fácil modificación de código: evita la modificación del código existente y utiliza la herencia para agregar nuevas características o cambiar características existentes.

—

Reutilización de código existente: usando la herencia como base de código que funciona y está probado podemos crear nuevas clases fácilmente.

—

Adaptación de programas para trabajar en situaciones similares pero diferentes: evita que se vuelvan a escribir programas muy similares porque la aplicación, el sistema de computadora, el formato de datos o el modo de operación es un poco diferente.

—

Extracción de elementos comunes de clases diferentes: evita que se dupliquen códigos; y estructuras idénticas o similares de clases diferentes. Se extraen las partes comunes para formar otra clase y permita que las demás las hereden.

—

Organización de objetos en jerarquías: forma grupos de objetos que tienen una relación. Las agrupaciones le dan una mejor organización a un programa y permite que los objetos de la misma jerarquía se utilicen como tipos compatibles, en oposición a los que carecen totalmente de relación.

El poliformismo

El polimorfismo que en griego significa “muchas formas” es una característica que le permite a una interfaz ser utilizada por una clase general de acciones. La frase “una interfaz, muchas formas” resume la idea de polimorfismo. El polimorfismo permite que se cree un código limpio, sensible, legible y resistente.

Ejemplo. Para abrir un archivo en Windows se pincha dos veces en su icono. Para ver el contenido de una carpeta también se pincha dos veces sobre su icono. Es decir, en ambos casos hemos pinchado dos veces para ejecutar la acción correspondiente. La interfaz ha sido la misma aunque con dos formas diferentes. 5-23


Este concepto reduce la complejidad permitiendo que la misma interfaz se utilice para especificar una clase general de acción. Es el compilador o el intérprete el que debe seleccionar la acción específica a ejecutar. El polimorfismo se define como la posibilidad de asumir varias formas. Permite que una misma operación pueda llevarse a cabo de varias formas, en clases diferentes. Desde este punto de vista, representa un concepto de teoría de tipos en el que un solo nombre puede denotar objetos de muchas clases diferentes que se relacionan por alguna superclase común. Cualquier objeto denotado por este nombre es, por lo tanto, capaz de responder a algún conjunto común de operaciones. Una operación es una acción o transformación que realiza o padece un objeto. La implementación específica de una operación determinada a una clase determinada se denomina método. Aunque los métodos sean distintos, llevan a cabo el mismo propósito operativo, y así estaríamos hablando también, de polimorfismo. Según lo dicho, una operación es una abstracción de un comportamiento similar (pero no idéntico) en diferentes clases de objetos. La semántica de la operación debe ser la misma para todas las clases. Sin embargo, cada método concreto seguirá unos pasos específicos. Existe el polimorfismo cuando interactúan las características de la herencia y el enlace dinámico. Ésta es quizás la característica más importante de los lenguajes orientados a objetos después de su capacidad para soportar la abstracción y es lo que distingue la programación orientada a objetos de otra programación más tradicional con tipos abstractos de datos. El polimorfismo es también un concepto central en el diseño orientado a objetos. Una de las ventajas del polimorfismo es que se puede hacer una solicitud de una operación sin conocer el método que debe ser llamado. No es otra cosa que la posibilidad de construir varios métodos con el mismo nombre, pero con relación a la clase a la que pertenece cada uno, con comportamientos diferentes. Esto conlleva la habilidad de enviar un mismo mensaje a objetos de clases diferentes. Estos objetos recibirían el mismo mensaje global pero responderían a él de formas diferentes. El polimorfismo, encapsulado y herencia son quizás los tres principios clave de la programación orientada a objetos. Cuando se aplican conjunta y adecuadamente producen un entorno de programación que admite el desarrollo de programas robustos y más fáciles de ampliar que los modelos tradicionales de diseño orientado al proceso. Permiten la reutilización de código y un menor coste de programación.

2.7.

Clase

La clase es en núcleo de la POO. Se trata de una construcción lógica sobre la que se construye la orientación a objetos. En la clase se define la forma y la naturaleza de un objeto. Una clase define un nuevo tipo de dato que se utiliza para crear objetos de ese tipo. Dicho de otra forma: una clase es el molde a partir del cual se fabrican objetos.

5-24


Una clase está formada por miembros de datos que a su vez son variables de instancia (datos) y métodos. Una clase es, por tanto, una agrupación de datos (variables o campos) y de funciones (métodos) que operan sobre esos datos. A estos datos y funciones pertenecientes a una clase se les denomina variables y métodos o funciones miembro. La programación orientada a objetos se basa en la programación de clases. Un programa se construye a partir de un conjunto de clases. Una vez definida e implementada una clase, es posible declarar elementos de esta clase. Los elementos declarados de una clase se denominan objetos de la clase. De una clase se pueden declarar o crear numerosos objetos. La clase es lo genérico: es el patrón o modelo para crear objetos. El cuerpo de la clase, encerrado entre { }, es la lista de atributos (variables) y métodos (funciones) que constituyen la clase. No es obligatorio, pero en general se listan primero los atributos y luego los métodos. La definición de una clase se realiza en la siguiente forma:

[ ] class nombredelaclase [datos] { [lista_de_atributos] [lista_de_métodos] } El esqueleto de cualquier aplicación JAVA se basa en la definición de una clase. Todos los datos básicos, como los enteros, se deben declarar en las clases antes de hacer uso de ellos. En la práctica son pocas las sentencias que se pueden colocar fuera del bloque de una clase. La palabra clave import (equivalente al #include) puede colocarse al principio de un fichero, fuera del bloque de la clase. Sin embargo, el compilador reemplazará esa sentencia con el contenido del fichero que se indique, que consistirá, como es de suponer, en más clases. Los tipos de clases que podemos definir son: —

Abstract. Una clase abstract tiene al menos un método abstracto. Una clase abstracta no se instancia (no se puede crear ningún objeto de ella), sino que se utiliza como clase base para la herencia.

—

Final. Una clase final se declara como la clase que termina una cadena de herencia. No se puede heredar de una clase final. Por ejemplo, la clase Math es una clase final.

—

Public. Las clases public son accesibles desde otras clases, bien sea directamente o por herencia. Son accesibles dentro del mismo

5-25


paquete en el que se han declarado. Para acceder desde otros paquetes, primero tienen que ser importadas. —

Synchronizable. Este modificador especifica que todos los métodos definidos en la clase son sincronizados, es decir, que no se puede acceder al mismo tiempo a ellos desde distintos threads; el sistema se encarga de colocar los flags necesarios para evitarlo. Este mecanismo hace que desde threads diferentes se puedan modificar las mismas variables sin que haya problemas de que se sobrescriban.

Citaremos ahora algunas de las normas de las clases en JAVA: 1.

Todas las variables y funciones de JAVA deben pertenecer a una clase. No hay variables y funciones globales.

2.

Si una clase deriva de otra (extends), hereda todas sus variables y métodos.

3.

JAVA tiene una jerarquía de clases estándar de la que pueden derivar las clases que crean los usuarios.

4.

Una clase sólo puede heredar de una única clase (en JAVA no hay herencia múltiple). Si al definir una clase no se especifica de qué clase deriva, por defecto la clase deriva de Object. La clase Object es la base de toda la jerarquía de clases de JAVA. En C++ sí se permite la herencia múltiple.

5.

En un fichero se pueden definir varias clases, pero en un fichero no puede haber más que una clase public. Este fichero se debe llamar como la clase public que contiene con extensión *.java. Con algunas excepciones, lo habitual es escribir una sola clase por fichero.

6.

Si una clase contenida en un fichero no es public, no es necesario que el fichero se llame como la clase.

7.

Los métodos de una clase pueden referirse de modo global al objeto de esa clase al que se aplican por medio de la referencia this.

8.

Las clases se pueden agrupar en “packages”, introduciendo una línea al comienzo del fichero (package packageName;).Esta agrupación en packages está relacionada con la jerarquía de directorios y ficheros en las que se guardan las clases.

El término clase se refiere a la implantación en software de un tipo de objeto. Especifica una estructura de datos y los métodos operativos permisibles que se aplican a cada uno de los objetos. Una clase puede tener sus propios métodos y estructura de datos, así como también heredarlos de su superclase. La superclase es la clase de la cual hereda otra clase, llamada esta última subclase inmediata. Una clase es una abstracción de un conjunto posiblemente infinito de objetos individuales. Cada uno de estos objetos se dice que es una instancia o ejemplar de dicha clase. Cada instancia de una clase posee sus propios valores para sus atributos, pero comparte el nombre de estos atributos y las opera5-26


ciones con el resto de instancias de su clase. La elección de clases es arbitraria, y depende del dominio del problema.

Nota. La industria utiliza el término clase para hacer referencia a las implantaciones de los tipos de objetos. Se construyen clases a partir de otras clases, las cuales a su vez se integran mediante clases. Así, como los bienes manufacturados se fabrican a partir de una serie de materiales de partes y subpartes ya existentes, también el software se crea mediante una serie de materiales de clases ya existentes y probadas. Una clase es un conjunto de objetos que comparten una estructura y comportamiento comunes. —

Clase representa una abstracción, la esencia que comparten los objetos.

—

Un objeto es un ejemplo de una clase.

—

Un objeto no es una clase, y una clase no es un objeto (aunque puede serlo, p.e. en Smalltalk).

—

Las clases actúan como intermediarias entre una abstracción y los clientes que pretenden utilizar la abstracción. De esta forma, la clase muestra: 1.

Visión externa de comportamiento (interface), que enfatiza la abstracción escondiendo su estructura y secretos de comportamiento.

2.

Visión interna (implementación), que abarca el código que se ofrece en la interface de la clase.

2.7.1. Relaciones entre clases Representan tipos de compartición entre clases, o relaciones semánticas. 1.

Asociación. Indica relaciones de mandato bidireccionales (punteros ocultos en C++). Conlleva dependencia semántica y no establece una dirección de dependencia. Tienen cardinalidad.

2.

Herencia. Por esta relación una clase (subclase) comparte la estructura o comportamiento definidos en una (herencia simple) o más (herencia múltiple) clases, llamadas superclases: —

Representa una relación del tipo “es un” entre clases.

—

Una subclase aumenta o restringe el comportamiento o estructura de la superclase (o ambas cosas).

—

Una clase de la que no existen ejemplos se denomina {\it abstracta}.

5-27


—

C++ declara como virtuales todas aquellas funciones que quiere modificar en sus subclases.

3.

Agregación. Representa una relación del tipo “tener un” entre clases. Cuando la clase contenida no existe independientemente de la clase que la contiene se denomina agregación por valor y además implica contenido físico, mientras que si existe independientemente y se accede a ella indirectamente, es agregación por referencia.

4.

Uso. Es un refinamiento de la asociación donde se especifica cuál es el cliente y cuál el servidor de ciertos servicios, permitiendo a los clientes acceder sólo a las interfaces públicas de los servidores, ofreciendo mayor encapsulación de la información.

5.

Ejemplificación. Se usa en lenguajes que soportan genericidad (declaración de clases parametrizadas y argumentos tipo “template”). Representa las relaciones entre las clases parametrizadas, que admiten parámetros formales, y las clases obtenidas cuando se concretan estos parámetros formales, ejemplificados o inicializados con un ejemplo.

6.

Metaclases. Son clases cuyos ejemplos son a su vez clases. No se admiten en C++.

2.7.2. Relaciones entre clases y objetos

0 0 más objetos.

—

Todo objeto es el ejemplo de una clase, y toda clase tiene

—

Mientras las clases son estáticas, con semántica, relaciones y existencia fijas previamente a la ejecución de un programa, los objetos se crean y destruyen rápidamente durante la actividad de una aplicación.

El diseño de clases y objetos es un proceso incremental e iterativo. Debe asegurar la optimización en los parámetros:

5-28

1.

Acoplamiento: Grado de acoplamiento entre módulos.

2.

Cohesión: Mide el grado de conectividad entre elementos de un módulo, y entre objetos de una clase.

3.

Suficiencia: Indica que las clases capturan suficientes características de la abstracción para conseguir un comportamiento e interacción eficiente y con sentido.

4.

Completitud: Indica que la interface de la clase captura todo el significado característico de una abstracción, escrito en el mínimo espacio.

5.

Primitividad: Las operaciones deben implementarse si dan acceso a una representación fundamental de la abstracción. Cuáles son operaciones primitivas y cuáles no (se pueden realizar a partir de otras) es un asunto subjetivo y afecta a la eficiencia en la implementación.


2.8.

Objeto

La construcción clase (class) de JAVA soporta abstracción y encapsulación de datos. Una clase describe la construcción de un objeto y sirve como plano para construirlo; especifica su funcionamiento interno y su interfaz pública. Cada clase tiene un nombre y especifica a los miembros que pertenecen a ella; éstos pueden ser campos (datos) y métodos (funciones). Una vez que se define una clase, su nombre se vuelve un nuevo tipo de dato y se usa para declarar variables de ese tipo y crear objetos de ese tipo. Una vez que se ha declarado una clase pueden crearse sus objetos. La definición de una clase es el plano de construcción de los objetos, y éstos se conocen como instancias de la clase. El nombre de ésta se vuelve un nombre de tipo y puede utilizarse para declarar variables. Una variable de tipo de clase es una variable de referencia que puede contener la dirección de memoria (o referencia) de un objeto de la clase o null para una referencia no válida. La inicialización del objeto creado de una clase se hace por medio del constructor (un método especial de una clase). El operador new de JAVA asigna espacio dinámicamente (al momento de la ejecución) y se utiliza para crear objetos. En lenguajes como JAVA, todos los objetos se crean al momento de la ejecución con el operador new. Veamos un ejemplo: Tenemos una clase llamada cochazo y queremos crear un objeto llamado mi coche de esa clase: cochazo mi_coche = new cochazo();

o cochazo mi_coche; mi_coche = new cochazo();

El objeto es un concepto, una abstracción o una cosa con unos límites definidos y que es relevante para el tema en cuestión, podemos decir además que estos poseen identidad y son distinguibles, aunque dos objetos tengan los mismos valores para todos, sus atributos son diferentes. En la vida real se llama objeto a cualquier cosa real o abstracta, en la cual podemos almacenar datos y los métodos para controlar dichos datos. —

Un objeto es una cosa tangible, algo a que se puede aprehender intelectualmente o algo hacia lo que se puede dirigir una acción o pensamiento.

—

Un objeto representa un ítem individual e identificable, o una entidad real o abstracta, con un papel definido en el dominio del problema. 5-29


—

Un objeto tiene: •

Estado.

•

Comportamiento.

•

Identidad.

La estructura y el comportamiento de objetos similares se definen en sus clases comunes. El término objeto e instancia de una clase son idénticas. Estado de un objeto. El estado de un objeto abarca todas las propiedades del objeto, y los valores actuales de cada una de esas propiedades. Las propiedades de los objetos suelen ser estáticas, mientras los valores que toman estas propiedades cambian con el tiempo. —

El hecho de que los objetos tengan estado implica que ocupan un espacio, ya en el mundo físico, ya en la memoria del ordenador.

—

El estado de un objeto está influido por la historia del objeto.

—

No deben confundirse los objetos, que existen en el tiempo, son mutables, tienen estado, pueden ser creados, destruidos y compartidos..., con los valores (los asignados a una variable, por ejemplo) que son cantidades con las propiedades de ser atemporales, inmutables.

—

El estado de un objeto representa el efecto acumulado de su comportamiento.

Identidad de un objeto. Identidad es la propiedad de un objeto que lo lleva a distinguirse de otros. Comportamiento de un objeto. Comportamiento es como un objeto actúa y reacciona, en términos de sus cambios de estado y de los mensajes que intercambia. El comportamiento de un objeto representa su actividad externamente visible y testable. Son las operaciones que una clase realiza (llamadas también mensajes) las que dan cuenta de cómo se comporta la clase. Por operación se denota el servicio que una clase ofrece a sus clientes. Un objeto puede realizar cinco tipos de operaciones sobre otro, con el propósito de provocar una reacción: 1.

Modificador: altera el estado de un objeto.

2.

Selector: accede al estado de un objeto, sin alterarlo.

3.

Iterador: permite a todas las partes de un objeto ser accedidas en un orden.

4.

Constructor: crea un objeto o inicializa su estado.

5.

Destructor: libera el estado de un objeto o destruye el objeto.

C++ soporta, además de las operaciones, subprogramas libres. En la terminología de C++ las operaciones que un cliente puede realizar sobre un objeto se declaran como funciones miembro. 5-30


2.8.1. Relaciones entre objetos Las relaciones entre objetos abarcan las operaciones, resultados y suposiciones que unos hacen sobre los otros. 1.

Links: son conexiones físicas o conceptuales entre objetos. Denota la asociación específica por la que un objeto (cliente) usa o solicita el servicio de otro objeto (servidor). El paso de mensajes entre objetos los sincroniza.

2.

Agregaciones: denota relaciones todo/parte, con capacidad para gobernar desde el todo las partes. Es equivalente a la relación “tener un”. El todo puede contener a la parte.

Agregación es conveniente en las ocasiones en que el encapsulamiento de las partes es prioritario. Si se requiere que las relaciones entre objetos estén vagamente acopladas, se utilizan “links”.

2.9.

Propiedades y métodos

El método es la especificación de un proceso de una operación, es un proceso disciplinado para generar un conjunto de modelo que describen varios aspectos de un sistema de “software” en desarrollo, utilizando alguna notación bien definida. Los métodos especifican la forma en que se controlan los datos de un objeto. Los métodos en un tipo de objeto sólo hacen referencia a las estructuras de datos de ese tipo de objeto. No deben tener acceso directo a las estructuras de datos de otros de objeto. Para utilizar la estructura de datos de otro objeto, debe enviar un mensaje a este. El tipo de objeto empaca junto los tipos de datos y los métodos.

2.9.1. Propiedades Todo objeto puede tener cierto número de propiedades, cada una de las cuales tendrá, a su vez, uno o varios valores. En POO, las propiedades corresponden a las clásicas “variables” de la programación estructurada. Son, por lo tanto, datos encapsulados dentro del objeto, junto con los métodos (programas) y las relaciones (punteros a otros objetos). Las propiedades de un objeto pueden tener un valor único o pueden contener un conjunto de valores más o menos estructurados (matrices, vectores, listas, etc.). Además, los valores pueden ser de cualquier tipo (numérico, alfabético, etc.) si el sistema de programación lo permite. Pero existe una diferencia con las “variables”, y es que las propiedades se pueden heredar de unos objetos a otros. En consecuencia, un objeto puede tener una propiedad de maneras diferentes: —

Propiedades propias. Están formadas dentro de la cápsula del objeto.

5-31


—

Propiedades heredadas. Están definidas en un objeto antepasado del actual. A veces estas propiedades se llaman propiedades miembro porque el objeto las posee por el mero hecho de ser miembro de una clase.

2.9.2. Métodos Podemos definir al método como un programa procedimental o procedural escrito en cualquier lenguaje, que está asociado a un objeto determinado y cuya ejecución sólo puede desencadenarse a través de un mensaje recibido por éste o por sus descendientes. Son sinónimos de “método” todos aquellos términos que se han aplicado tradicionalmente a los programas, como procedimiento, función, rutina, etc. Sin embargo, es conveniente utilizar el término “método” para que se distingan claramente las propiedades especiales que adquiere un programa en el entorno POO, que afectan fundamentalmente a la forma de invocarlo (únicamente a través de un mensaje) y a su campo de acción, limitado a un objeto y a sus descendientes (no tiene por qué a todos). Dado que los métodos son partes de los programas pueden tener argumentos o parámetros. Puesto que los métodos pueden heredarse de unos objetos a otros, un objeto puede disponer de un método de dos maneras diferentes (al igual que sucedía con las propiedades): —

Métodos propios. Están incluidos dentro de la cápsula del objeto.

—

Métodos heredados. Están definidos en un objeto en un objeto antepasado del actual. A veces estos métodos se llaman “métodos miembro” porque el objeto los posee por el mero hecho de ser miembro de una clase.

—

La sobrecarga de métodos consiste en poner varios métodos con el mismo nombre en la misma clase, pero siempre que su lista de argumentos sea distinta. El compilador sabría a cuál de todas las sobrecargas nos referimos por los argumentos que se le pasen en la llamada. Lo que diferencia las listas de argumentos de las diferentes sobrecargas no es el nombre de las variables, sino el tipo de cada una de ellas. Los métodos sobrecargados dan a los programadores la flexibilidad de llamar a un método similar para diferentes tipos de datos.

Un método es un procedimiento de cálculo definido en una clase. Cada método contiene instrucciones que especifican una secuencia de acciones de cálculo que habrán de realizarse, y variables que se utilizan para almacenar y producir los valores necesarios. Algunas de las variables pueden ser objetos y el proceso de cálculo incluye interacciones entre los mismos, generalmente. Un método toma argumentos como entrada, realiza una secuencia de pasos programados y devuelve un resultado del tipo declarado (existen métodos que no devuelven obligatoriamente un valor, pueden sencillamente cambiar el valor de una propiedad o inicializar una de esas propiedades). También puede llamar a otros métodos en el curso de sus cálculos. 5-32


Una definición de método contiene un encabezado y un cuerpo. El encabezado define el nombre del método y el tipo del valor de regreso. El encabezado también especifica variables, conocidas como parámetros formales, que reciben los argumentos de entrada y se utilizan en el cuerpo del método para realizar cálculos. Mientras que el cuerpo incluye una secuencia de declaraciones e instrucciones encerradas entre llaves, { }, una declaración proporciona información al compilador y una instrucción especifica las acciones que habrán de ejecutarse. En general, a las propiedades y a los métodos de una clase se les suele llamar miembros de datos pues realmente son los únicos elementos que aparecen físicamente dentro de la clase. Antes de pretender crear un molde para hacer objetos (clase) nos debemos plantear muy a conciencia qué propiedades y qué métodos queremos que tenga esa clase. Hoy en día casi todos los lenguajes de programación se basan en propiedades y métodos, pudiendo el usuario del programa cambiar los valores de estas propiedades a su gusto (ejemplo: escritorio, propiedad: papel tapiz, podemos nosotros configurarlo a nuestro antojo).

2.10. Mensajes Para que el objeto haga algo, enviamos una solicitud. Ésta hace que se produzca una operación. La operación ejecuta el método apropiado y, de manera opcional, produce una respuesta. El mensaje que constituye la solicitud contiene el nombre del objeto, el nombre de una operación, a veces, un grupo de parámetros. Un mensaje es una solicitud para que se lleve a cabo la operación indicada y se produzca el resultado. Por tanto, los mensajes son solicitudes que invocan operaciones específicas, con uno o más objetos como parámetros. La respuesta a estas órdenes será la información requerida, siempre que el objeto considere que quien envía el mensaje está autorizado para obtenerla.

2.11. Identidad La identidad es aquella propiedad de un objeto que los distingue de todos los demás objetos. La identidad única (pero no necesariamente el nombre) de cada objeto se preserva durante el tiempo de vida del mismo, incluso cuando su estado cambia. La identidad es la naturaleza de un objeto que lo distingue de todos los demás.

2.12. Reutilización o reusabilidad Es volver a generar una clase, teniendo en cuenta que puede ser útil para varios sistemas, sin tener que volver a generarlos, ahorrando con esto tiempo para programación, etc. Las clases están definidas para que se reutilicen en muchos sistemas. Para que ésta sea efectiva, las clases se deben construir a partir de un modo que puedan ser adaptables y reutilizables indefinidamente. 5-33


Un objetivo de las técnicas orientadas a objetos es lograr la reutilización masiva al construir un “software”. Los sistemas suelen ser construidos a través de objetos ya existentes, que se lleva a un alto grado de reutilización, esto conlleva a un ahorro de dinero, un menor tiempo de desarrollo y una mayor confiabilidad de sistemas. Por lo tanto, si ya hemos puesto a prueba una clase en un sistema, tendremos la garantía y la confiabilidad que podrá volver a ser reutilizada.

2.13. Jerarquía La jerarquía es una clasificación u ordenación de abstracciones. Las dos jerarquías más importantes en un sistema complejo son su estructura de clases y su estructura de objetos, jerarquía de clase y jerarquía de partes correspondientemente. Como ya habíamos mencionado anteriormente la herencia es el ejemplo más claro de una jerarquía de clases. Ésta define una relación entre clases, en la que una clase comparte la estructura de comportamiento definida en una o más clases (herencia simple o herencia múltiple, respectivamente).

2.14. Concurrencia, persistencia y tipificado 2.14.1.

Concurrencia

Es la propiedad que distingue un objeto activo de uno no activo. Concurrencia permite que diferentes objetos actúen al mismo tiempo, usando distintos threads (hilos) de control. Para cierto tipos de problemas, un sistema automatizado puede tener que manejar muchos eventos diferentes simultáneamente, en otro problema pueden implicar tantos cálculos que excedan la capacidad de cualquier procesador individual. En ambos casos es natural considerar el uso de un conjunto distribuido de computadores para la implantación que se persigue o utilizar procesadores capaces de realizar multitareas, a través de un hilo de control, mediante la cual se producen acciones dinámicas independientes dentro del sistema. La concurrencia permite a diferentes objetos actuar al mismo tiempo.

2.14.2. Persistencia Es la propiedad por la cual la existencia de un objeto trasciende en el tiempo (esto es, el objeto sigue existiendo después de que su creador deja de existir) o en el espacio (esto es, la localización del objeto cambia respecto a la dirección en la que fue creado).

2.14.3. Tipificado Tipificar es la imposición de una clase a un objeto, de tal modo que objetos de diferentes tipos no se puedan intercambiar, o se puedan intercambiar sólo de forma restringida. 5-34


—

Tipo es una caracterización precisa de las propiedades estructurales y de comportamiento que comparten una colección de entidades.

—

Una clase define un nuevo tipo de objetos, por tanto, clase y tipo muchos programadores los consideran sinónimos.

—

Existen lenguajes fuertemente tipificados (Ada) y débilmente tipificados. Estos últimos soportan polimorfismo, mientras que los fuertemente tipificados no.

2.15. Modularidad La modularidad es la propiedad que posee un sistema que ha sido descompuesto en un conjunto de módulos cohesivos y débilmente acoplados. La modularización consiste en dividir un programa en módulos que pueden compilarse separadamente, pero que tiene conexiones con otros módulos. Así, los principios de abstracción, encapsulamiento y modularidad son sinérgicos (puede haber muchas más abstracciones diferentes de las que se pueden comprender simultáneamente, el encapsulamiento ayuda a manejar esta complejidad ocultando la visión interna de las abstracciones. La modularidad ayuda ofreciendo una vía para agrupar abstracciones relacionadas lógicamente).

2.16. Relaciones entre los conceptos asociados al modelo de objetos —

Los conceptos de abstracción y encapsulación son conceptos complementarios: abstracción hace referencia al comportamiento observable de un objeto, mientras encapsulación hace referencia a la implementación que la hace alcanzar este comportamiento.

—

Existe una tensión entre los conceptos de encapsulación de la información y el concepto de jerarquía de herencia, que requiere una apertura en el acceso a la información.

—

C++ ofrece mucha flexibilidad, pudiendo disponer de tres compartimentos en cada clase: 1.

Privado: declaraciones accesibles sólo a la clase (completamente encapsulado).

2.

Protegido: declaraciones accesibles a la clase y a sus subclases.

3.

Público: declaraciones accesibles a todos los clientes.

Además de estos tres tipos, C++ soporta la definición de clases cooperativas a las que se les permite acceder a la parte privada de la implementación. Estas clases se denominan friends.

5-35


Vamos a realizar un esquema de cada uno de los términos vistos: OBJETO

Fin, intento, propósito. Materia y sujeto de una ciencia.

CLASE

Orden de cosas de una misma especie. Conjunto de órdenes.

POLIMORFISMO

Propiedad de los cuerpos que cambian de forma sin cambiar su naturaleza. Presencia de distintas formas individuales en una sola especie.

ENCAPSULACIÓN

Proceso de constitución de una cápsula.

HERENCIA

Derecho de suceder a otro la posesión de bienes o acciones.

MENSAJE

Información que se le envía a alguien.

MÉTODO

Modo de hacer en orden una cosa, modo habitual de procede.

IDENTIDAD

Cualidad de ser lo mismo que otra cosa con que se compara.

REUSABILIDAD

Acción de volver a utilizar. Que puede volver a ser utilizado.

JERARQUÍA

Orden o grados de una especie.

ABSTRACCIÓN

Separación, apartamiento, aislamiento, prescindir.

CONCURRENCIA

Asistencia, reunión simultánea de personas o cosas.

MODULARIDAD

Acción de pasar de un término a otro.

3. 3.1.

Ventajas e inconvenientes Ventajas de POO

Un programa grande de computadora se encuentra entre las construcciones más complejas. El costo del diseño, la implantación, la verificación, el mantenimiento y la revisión de sistemas grandes de “software” es muy alto. Por tanto, es importante encontrar maneras de facilitar estas tareas. En este sentido, POO tiene un potencial enorme. Los sistemas orientados a objetos son también más resistentes al cambio y, por lo tanto, están mejor preparados para evolucionar en el tiempo, porque su diseño esta basado en formas intermedias estables. El modelo de objetos ha influido incluso en las fases iniciales del ciclo de vida del desarrollo del software. El análisis orientado a objetos (AOO) enfatiza la construcción de modelos del mundo real utilizando una visión del mundo orientado a objetos. El análisis orientado a objetos es un método de análisis que examina los requisitos desde la perspectiva de las clases y objetos que se encuentran en el vocabulario del dominio del problema. Básicamente los productos del análisis orientado a objetos sirven como modelos de los que se puede partir para un diseño orientado a objetos; los productos del diseño orientado a objetos pueden utilizarse entonces como anteproyectos para la implementación completa de unos sistemas utilizando métodos de programación orientado a objetos, de esta forma se relacionan AOO, DOO y POO.

5-36


La Programación Orientada a Objetos ofrece las siguientes ventajas principales: —

Simplicidad: como los objetos de “software” son modelos de objetos reales en el dominio de la aplicación, la complejidad del programa se reduce y su estructura se vuelve clara y simple.

—

Modularidad: cada objeto forma una entidad separada cuyo funcionamiento interno está desacoplado de otras partes del sistema.

—

Facilidad para hacer modificaciones: es sencillo hacer cambios menores en la representación de los datos o los procedimientos utilizados en un programa Orientado a Objetos (O.O.). Las modificaciones hechas en el interior de un objeto no afectan ninguna otra parte del programa, siempre y cuando se preserve su comportamiento externo.

—

Posibilidad de extenderlo: la adición de nuevas funciones o la respuesta a ambientes operativos cambiantes puede lograrse con sólo introducir algunos objetos nuevos y variar algunos existentes.

—

Flexibilidad: un programa Orientado a Objetos (O.O.) puede ser muy manejable al adaptarse a diferentes situaciones, porque es posible cambiar los patrones de interacción entre los objetos sin alterarlos.

—

Facilidad para darle mantenimiento: los objetos pueden mantenerse por separado, lo que facilita la localización y el arreglo de problemas, así como la adición de otros elementos.

—

Reusabilidad: los objetos pueden emplearse en diferentes programas. Por ejemplo, si se tiene uno que construye tablas puede utilizarse en cualquier programa que requiera cierto tipo de tabla. Por tanto, es posible construir programas a partir de componentes prefabricados y preprobados en una fracción del tiempo requerido para elaborar nuevos programas desde el principio.

—

Dominio del problema: el paradigma O.O. es más que una forma de programar. Es una forma de pensar acerca de un problema desde el punto de vista del mundo real en vez de desde el punto de vista del ordenador. El AOO permite analizar mejor el dominio del problema, sin pensar en términos de implementar el sistema de un ordenador, permite, además, pasar directamente el dominio del problema al modelo del sistema.

—

Comunicación: el concepto O.O. es más simple y está menos relacionado con la informática que el concepto de flujo de datos. Esto permite una mejor comunicación entre el analista y el experto en el dominio del problema.

—

Consistencia: los objetos encapsulan tanto atributos como operaciones. Debido a esto, el AOO reduce la distancia entre el punto de vista de los datos y el punto de vista del proceso, dejando menos lugar a inconsistencias disparidades entre ambos modelos.

5-37


—

Expresión de características comunes: el paradigma lo utiliza la herencia para expresar explícitamente las características comunes de una serie de objetos estas característica comunes quedan escondidas en otros enfoques y llevan a duplicar entidades en el análisis y código en los programas. Sin embargo, el paradigma O.O. pone especial énfasis en la reutilización y proporciona mecanismos efectivos que permiten reutilizar aquello que es común sin impedir por ello describir las diferencias.

—

Resistencia al cambio: los cambios en los requisitos afectan notablemente a la funcionalidad de un sistema por lo que afectan mucho al software desarrollando con métodos estructurados. Sin embargo, los cambios afectan en mucha menos medida a los objetos que componen o maneja el sistema, que son mucho más estables. Las modificaciones necesarias para adaptar una aplicación basada en objetos a un cambio de requisitos suelen estar mucho más localizadas.

—

Reutilización: aparte de la reutilización interna, basada en la expresión explícita de características comunes, el paradigma O.O. desarrolla modelos mucho más próximos al mundo real, con lo que aumentan las posibilidades de reutilización. Es probable que en futuras aplicaciones nos encontremos con objetos iguales o similares a los de la actual.

Todos los problemas aún no han sido solucionados en forma completa. Pero como los objetos son portables mientras que la herencia permite la reusabilidad del código orientado a objetos, es más sencillo modificar código existente porque los objetos no interaccionan excepto a través de mensajes; en consecuencia un cambio en la codificación de un objeto no afectará la operación con otro objeto siempre que los métodos respectivos permanezcan intactos. La introducción de tecnología de objetos como una herramienta conceptual para analizar, diseñar e implementar aplicaciones permite obtener aplicaciones más modificables, fácilmente extensibles y a partir de componentes reusables. Esta reusabilidad del código disminuye el tiempo que se utiliza en el desarrollo y hace que el desarrollo del software sea más intuitivo porque la gente piensa naturalmente en términos de objetos más que en términos de algoritmos de “software”.

3.2.

Inconvenientes de la POO

En un sistema orientado a objetos los problemas (si los hubiese) suelen surgir en la implementación de tal sistema. Muchas compañías oyen acerca de los beneficios de un sistema orientado a objetos e invierten gran cantidad de recursos luego comienzan a darse cuenta que han impuesto una nueva cultura que es ajena a los programadores actuales. A pesar de ser muy pocos los inconvenientes de la POO, citaremos los siguientes:

5-38

—

Curvas de aprendizaje largas. Al hacer la transición a un sistema orientado a objetos la mayoría de los programadores deben capacitarse nuevamente antes de poder usarlo.

—

Dependencia del lenguaje. La elección de un lenguaje orientado a objetos u otro tiene ramificaciones de diseño muy importantes.


4.

—

Determinación de las clases. Una clase es un molde que se utiliza para crear nuevos objetos. Si bien hay muchas jerarquías de clase predefinidas usualmente se deben crear clases específicas para la aplicación que se esté desarrollando. En consecuencia, es importante crear el conjunto de clases adecuado para un proyecto.

—

Descomposición funcional. El análisis estructurado se basa en la descomposición funcional del sistema que queremos construir. El problema es que no existe un mecanismo para comprobar si la especificación del sistema expresa con exactitud los requisitos del sistema.

—

Flujos de datos. El análisis estructurado muestra cómo fluye la información a través del sistema. Aunque este enfoque se adapta bien al uso de sistemas informáticos para implementar al sistema, no es la forma habitual de pensar.

—

Modelo de datos. El análisis estructurado moderno incorpora modelos de datos, además de modelos de procesos y de comportamiento. Sin embargo, la relación entre los modelos es muy débil, y hay muy poca influencia de un modelo en otro.

Patrones de diseño y lenguaje de modelado unificado (UML)

4.1.

UML

UML, Lenguaje Unificado de Modelado (Unified Modeling Language) es el lenguaje de modelado de sistemas de software. Es un lenguaje gráfico para visualizar, especificar, construir y documentar un sistema de software. UML ofrece un estándar para describir un “plano” del sistema (modelo), incluyendo aspectos conceptuales tales como procesos de negocios y funciones del sistema, y aspectos concretos como expresiones de lenguajes de programación, esquemas de bases de datos y componentes de software reutilizables. Es importante remarcar que UML es un “lenguaje” para especificar y no un método o un proceso, se utiliza para definir un sistema de software, para detallar los artefactos en el sistema y para documentar y construir –es el lenguaje en el que está descrito el modelo–. Se puede aplicar en una gran variedad de formas para soportar una metodología de desarrollo de software pero no especifica en sí mismo qué metodología o proceso usar. UML es un lenguaje. Un lenguaje proporciona un vocabulario y unas reglas para permitir una comunicación. Este lenguaje nos indica cómo crear y leer los modelos, pero no dice cómo crearlos. Esto último es el objetivo de las metodologías de desarrollo. Los objetivos de UML son: —

Visualizar, expresa de forma gráfica.

—

Especificar, las características de un sistema.

—

Construir, a partir de los modelos especificados.

—

Documentar, los propios elementos gráficos sirven de documentación. 5-39


4.1.1. Bloques de construcción de un modelo UML Un modelo UML está compuesto por tres clases de bloques de construcción: A) Elementos Los elementos son abstracciones de cosas reales o ficticias (objetos, acciones, etc.). —

Pueden ser estructurales, de comportamiento de agrupación o de anotación.

—

Elementos estructurales: actores, casos de uso, clases, objetos.

—

Elementos de comportamiento: mensajes.

—

Elementos de agrupación: paquetes.

CLASE ATRIBUTOS MÉTODOS ACTOR

CASOS DE USO

PAQUETE

MENSAJES

B) Relaciones Relacionan los elementos entre sí. Las relaciones pueden ser del tipo: • Dependencia Es una relación semántica entre dos elementos, en la cual un cambio en un elemento puede afectar a la semántica de otro elemento. Existen varios tipos de dependencia predefinidas que se indican mediante extend o include para casos de uso. • Asociación Es una relación estructural entre dos elementos, que describen las conexiones entre ellos (suele ser bidireccional). Puede presentarse como agregación o composición. • Generalización Es una relación entre un elemento más general (el padre) y un elemento más específico (el hijo). 5-40


• Implementación Es una relación en la que un elemento (hijo) realiza las acciones indicadas por el padre.

4.2.

Diagramas

Son colecciones de elementos con sus relaciones. UML cuenta con varios tipos de diagramas, los cuales muestran diferentes aspectos de las entidades representadas. Los veremos en esta sección: DIAGRAMAS

Estructura

Comportamiento

Clases

Actividades

Componentes

Iteración

Secuencia

Objetos

Casos de Uso

Comunicación

Paquetes

Estados

Tiempos

Despliegue

Revisión Interacciones

4.2.1. Diagramas de estructura Enfatizan en los elementos que deben existir en el sistema modelado. Los diagramas estructurales representan elementos y así componen un sistema o una función. Estos diagramas pueden reflejar las relaciones estáticas de una estructura, como lo hacen los diagramas de clases o de paquetes, o arquitecturas en tiempo de ejecución, tales como diagramas de Objetos o de Estructura de Composición. • Diagrama de clases Los diagramas de clases son utilizados durante el proceso de análisis y diseño de los sistemas informáticos, donde se crea el diseño conceptual de la información que se manejara en el sistema, y los componentes que se encar5-41


garan del funcionamiento y la relación entre uno y otro. Muestra una colección de elementos de modelado declarativo (estáticos), tales como clases, tipos y sus contenidos y relaciones. Se basan en: —

Propiedades: también llamados atributos o características, son valores que corresponden a un objeto, como color, material, cantidad, ubicación. Generalmente se conoce como la información detallada del objeto. Suponiendo que el objeto es una puerta, sus propiedades serían: la marca, tamaño, color y peso.

—

Operaciones: son aquellas actividades o verbos que se pueden realizar con/para este objeto, como por ejemplo abrir, cerrar, buscar, cancelar, acreditar, cargar. De la misma manera que el nombre de un atributo, el nombre de una operación se escribe con minúsculas si consta de una sola palabra. Si el nombre contiene más de una palabra, cada palabra será unida a la anterior y comenzará con una letra mayúscula, a excepción de la primera palabra que comenzará en minúscula. Por ejemplo: abrirPuerta, cerrarPuerta, buscarPuerta, etc.

—

Interfaz: es un conjunto de operaciones o propiedades que permiten a un objeto comportarse de cierta manera, por lo que define los requerimientos mínimos del objeto.

—

Herencia: se define como la reutilización de un objeto padre ya definido para poder extender la funcionalidad en un objeto hijo. Los objetos hijos heredan todas las operaciones o propiedades de un objeto padre. Por ejemplo: una persona puede subdividirse en Proveedores, Acreedores, Clientes, Accionistas, Empleados; todos comparten datos basicos como una persona, pero además tendrá información adicional que depende del tipo de persona, como saldo del cliente, total de inversión del accionista, salario del empleado, etc.

• Diagrama de componentes Un diagrama de componentes representa la separación de un sistema de “sofware” en componentes físicos (por ejemplo archivos, cabeceras, módulos, paquetes, etc.) y muestra las dependecias entre estos componentes. Representa los componentes que componen una aplicación, sistema o empresa. Los componentes, sus relaciones, interacciones y sus interfaces públicas. Los diagramas de componentes describen los elementos físicos del sistema y sus relaciones. Muestran las opciones de realización incluyendo código fuente, binario y ejecutable. Los componentes representan todos los tipos de elementos software que entran en la fabricación de aplicaciones informáticas. Pueden ser simples archivos, paquetes de Ada, bibliotecas cargadas dinámicamente, etc. Las relaciones de dependencia se utilizan en los diagramas de componentes para indicar que un componente utiliza los servicios ofrecidos por otro componente. Un diagrama de componentes representa las dependencias entre componentes “software”, incluyendo componentes de código fuente, componentes del código binario, y componentes ejecutables. Un módulo de “software” se 5-42


puede representar como componente. Algunos componentes existen en tiempo de compilación, algunos en tiempo de enlace y algunos en tiempo de ejecución, otros en varias de éstas. Un componente de sólo compilación es aquel que es significativo únicamente en tiempo de compilación. Un componente ejecutable es un programa ejecutable. Un diagrama de componentes tiene sólo una versión con descriptores, no tiene versión con instancias. Para mostrar las instancias de los componentes se debe usar un diagrama de despliegue. Un diagrama de componentes muestra clasificadores de componentes, las clases definidas en ellos, y las relaciones entre ellas. Los clasificadores de componentes también se pueden anidar dentro de otros clasificadores de componentes para mostrar relaciones de definición. Un diagrama que contiene clasificadores de componentes y de nodo se puede utilizar para mostrar las dependencias del compilador, que se representa como flechas con líneas discontinuas (dependencias) de un componente cliente a un componente proveedor del que depende. Los tipos de dependencias son específicos del lenguaje y se pueden representar como estereotipos de las dependencias. El diagrama también puede usarse para mostrar interfaces y las dependencias de llamada entre componentes, usando flechas con líneas discontinuas desde los componentes a las interfaces de otros componentes. El diagrama de componente hace parte de la vista física de un sistema, la cual modela la estructura de implementación de la aplicación por sí misma, su organización en componentes y su despliegue en nodos de ejecución. Esta vista proporciona la oportunidad de establecer correspondecias entre las clases y los componentes de implementación y nodos. La vista de implementación se representa con los diagramas de componentes. • Diagrama de objetos Los diagramas de objetos son utilizados durante el proceso de Análisis y Diseño de los sistemas informáticos en la metodología UML. Se puede considerar un caso especial de un diagrama de clases en el que se muestran instancias específicas de clases (objetos) en un momento particular del sistema. Los diagramas de objetos utilizan un subconjunto de los elementos de un diagrama de clase. Los diagramas de objetos no muestran la multiplicidad ni los roles, aunque su notación es similar a los diagramas de clase. Una diferencia con los diagramas de clase es que el compartimiento de arriba va en la forma, Nombre de objeto: Nombre de clase. Por ejemplo, Miguel: Persona. Un diagrama que presenta los objetos y sus relaciones en un punto del tiempo. Un diagrama de objetos se puede considerar como un caso especial de un diagrama de clases o un diagrama de comunicaciones. 5-43


• Diagrama de despliegue El Diagrama de Despliegue es un tipo de diagrama del Lenguaje Unificado de Modelado que se utiliza para modelar el hardware utilizado en la implementaciones de sistemas y las relaciones entre sus componentes. Los elementos usados por este tipo de diagrama son nodos (representados como un prisma), componentes (representados como una caja rectangular con dos protuberancias del lado izquierdo) y asociaciones. En el UML 2.0 los componentes ya no están dentro de nodos. En cambio, puede haber artefactos u otros nodos dentro de un nodo. Un artefacto puede ser algo como un archivo, un programa, una biblioteca, o una base de datos construida o modificada en un proyecto. Estos artefactos implementan colecciones de componentes. Los nodos internos indican ambientes, un concepto más amplio que el hardware propiamente dicho, ya que un ambiente puede incluir al lenguaje de programación, a un sistema operativo, un ordenador o un cluster de terminales. Un diagrama de despliegue físico muestra cómo y dónde se desplegará el sistema. Las máquinas físicas y los procesadores se representan como nodos y la construcción interna puede ser representada por nodos o artefactos embebidos. Como los artefactos se ubican en los nodos para modelar el despliegue del sistema, la ubicación es guiada por el uso de las especificaciones de despliegue. • Diagrama de paquetes En el Lenguaje Unificado de Modelado, un diagrama de paquetes muestra cómo un sistema está dividido en agrupaciones lógicas mostrando las dependencias entre esas agrupaciones. Dado que normalmente un paquete está pensado como un directorio, los diagramas de paquetes suministran una descomposición de la jerarquía lógica de un sistema. Los paquetes están normalmente organizados para maximizar la coherencia interna dentro de cada paquete y minimizar el acoplamiento externo entre los paquetes. Con estas líneas maestras sobre la mesa, los paquetes son buenos elementos de gestión. Cada paquete puede asignarse a un individuo o a un equipo, y las dependencias entre ellos pueden indicar el orden de desarrollo requerido. Un diagrama que presenta cómo se organizan los elementos de modelado en paquetes y las dependencias entre ellos, incluyendo importaciones y extensiones de paquetes. • Diagrama de Estructura de Composición Representa la estructura interna de un clasificador (tal como una clase, un componente o un caso de uso), incluyendo los puntos de interacción de clasificador con otras partes del sistema.

5-44


Los diagramas de composición de estructuras fueron específicamente diseñados para la representación de patrones de diseño, y son una de las modificaciones de mayor impacto dentro de UML 2.0. Los diagramas de composición de estructuras permiten, potencialmente, documentar arquitecturas de software de manera un poco más clara que en versiones anteriores del UML 2.0.

4.2.2. Diagramas de comportamiento Enfatizan en lo que debe suceder en el sistema modelado. Los diagramas de comportamiento representan las características de comportamiento de un sistema o proceso de negocios y, a su vez, incluyen a los diagramas de: actividades, casos de uso, máquinas de estados, tiempos, secuencias, repaso de interacciones y comunicaciones. • Diagrama de actividades En el Lenguaje de Modelado Unificado, un diagrama de actividades representa los flujos de trabajo paso a paso de negocio y operacionales de los componentes en un sistema. Un Diagrama de Actividades muestra el flujo de control general. En SysML el diagrama de Actividades ha sido extendido para indicar flujos entre pasos que mueven elementos físicos (e.g., gasolina) o energía (e.g., presión). Los cambios adicionales permiten al diagrama soportar mejor flujos de comportamiento y datos continuos. Muchos cambios fueron realizados en los diagramas de actividad en la versión 2 de UML. Los cambios realizados son tendentes a: —

Dar soporte en la definición de procesos de negocio.

—

Brindar una semántica similar al de las redes de Petri.

—

Permitir una mayor y más flexible representación de paralelismo.

Representa los procesos de negocios de alto nivel, incluidos el flujo de datos. También puede utilizarse para modelar lógica compleja o paralela dentro de un sistema. • Diagrama de casos de uso En el Lenguaje de Modelado Unificado, un diagrama de casos de uso es una especie de diagrama de comportamiento. El Lenguaje de Modelado Unificado define una notación gráfica para representar casos de uso llamada modelo de casos de uso. UML no define estándares para que el formato escrito describa los casos de uso, y así mucha gente no entiende que esta notación gráfica define la naturaleza de un caso de uso; sin embargo una notación gráfica puede solo dar una vista general simple de un caso de uso o un conjunto de casos de uso. Los diagramas de casos de uso son a menudo confundidos con los casos de uso. Mientras los dos conceptos están relacionados, los casos de uso son mucho más detallados que los diagramas de casos de uso.

5-45


El estándar de Lenguaje de Modelado Unificado de OMG define una notación gráfica para realizar diagramas de casos de uso, pero no el formato para describir casos de uso. Mucha gente sufre la equivocación pensando que un caso de uso es una notación gráfica (o es su descripción). Mientras la notación gráfica y las descripciones son importantes, ellas son documentación de un caso de uso: un propósito para el que el actor puede usar el sistema. los diagramas de casos de uso son diagramas que muestran las relaciones entre actores y el sistema. Un diagrama que muestra las relaciones entre los actores y el sujeto (sistema), y los casos de uso. El valor verdadero de un caso de uso reposa en dos áreas: —

La descripción escrita del comportamiento del sistema al afrontar una tarea de negocio o un requisito de negocio. Esta descripción se enfoca en el valor suministrado por el sistema a entidades externas tales como usuarios humanos u otros sistemas.

—

La posición o contexto del caso de uso entre otros casos de uso. Dado que es un mecanismo de organización, un conjunto de casos de uso coherentes, consistentes promueve una imágen fácil del comportamiento del sistema, un entendimiento común entre el cliente/propietario/usuario y el equipo de desarrollo.

Es práctica común crear especificaciones suplementarias para capturar detalles de requisitos que caen fuera del ámbito de las descripciones de los casos de uso. Ejemplos de esos temas incluyen rendimiento, temas de escalabilidad/gestión, o cumplimiento de estándares. Relaciones de Casos de Uso. Las tres relaciones principales entre los casos de uso son soportadas por el estándar UML, el cual describe notación gráfica para esas relaciones. Include. En una forma de interacción, un caso de uso dado puede “incluir” otro. El primer caso de uso a menudo depende del resultado del caso de uso incluido. Esto es útil para extraer comportamientos verdaderamente comunes desde múltiples casos de uso a una descripción individual. La notación es una flecha rayada desde el caso de uso que lo incluye hasta el caso de uso incluido, con la etiqueta “include”. Este uso se asemeja a una expansión de una macro donde el comportamiento del caso incluido es colocado dentro del comportamiento del caso de uso base. No hay parámetros o valores de retorno. Extend. En otra forma de interacción, un caso de uso dado (la extensión), puede extender a otro. Esta relación indica que el comportamiento del caso de uso extensión puede ser insertado en el caso de uso extendido bajo ciertas condiciones. La notación es una flecha rayada desde el caso de uso extensión al caso de uso extendido, con la etiqueta “extend”. Esto puede ser útil para lidiar con casos especiales, o para acomodar nuevos requisitos durante el mantenimiento del sistema y su extensión. Generalization. En la tercera forma de relación entre casos de uso, existe una relación generalización/especialización. Un caso de uso dado puede estar

5-46


en una forma especializada de un caso de uso existente. La notación es una línea solida terminada en un triángulo dibujado desde el caso de uso especializado al caso de uso general. Esto se asemeja al concepto orientado a objetos de sub-clases, en la práctica puede ser útil factorizar comportamientos comunes, restricciones al caso de uso general, descríbelos una vez, y enfréntate a los detalles excepcionales en los casos de uso especializados. • Diagrama de estados El diagrama de estados de UML es un diagrama de estados con notación estandarizada que puede describir los elementos, desde un programa de computador a procesos de negocio. Un diagrama de Máquina de Estados ilustra cómo un elemento, muchas veces una clase, se puede mover entre estados que clasifican su comportamiento, de acuerdo con disparadores de transiciones, guardias de restricciones y otros aspectos de los diagramas de Máquinas de Estados, que representan y explican el movimiento y el comportamiento. Lo siguiente son los elementos básicos de notación que pueden usarse para componer un diagrama: —

Círculo lleno, apuntando a un estado inicial

—

Círculo hueco que contiene un círculo lleno más pequeño en el interior, indicando el estado final (si existiera)

—

Rectángulo redondeado, denotando un estado. En la parte superior del rectángulo está el nombre del estado. Puede contener una línea horizontal en la mitad, debajo de la cual se indican las actividades que se hacen en el estado

—

Flecha, denotando transición. El nombre del evento (si existiera) que causa esta transición etiqueta el cuerpo de la flecha. Se puede añadir una expresión de Guarda, encerrada en corchetes ([]) denotando que esta expresión debe ser cierta para que la transición tenga lugar. Si se realiza una acción durante la transición, se añade a la etiqueta después de “/”. NombreDeEvento[ExpresiónGuarda]/acción

—

Línea horizontal gruesa con x>1 líneas entrando y 1 línea saliendo o 1 línea entrando y x>1 líneas saliendo. Éstas denotan Unión/Separación, respectivamente.

Un diagrama de Máquina de Estados ilustra cómo un elemento, muchas veces una clase, se puede mover entre estados que clasifican su comportamiento, de acuerdo con disparadores de transiciones, guardias de restricciones y otros aspectos de los diagramas de Máquinas de Estados, que representan y explican el movimiento y el comportamiento. Al igual que los diagramas de secuencia, las Máquinas de Estados permiten un mejor rehúso, a través del agregado de Puntos de Entrada y Puntos de Salida (Entry/Exit Points). Las máquinas de estados son ahora generalizables y soportan una vista centrada en la transición. Las capacidades de generalización incluyen: agregar estados y transiciones, extender estados, reemplazar transiciones, reemplazar maquinas compuestas, etc. Lo que permite que, por ejemplo, dada una clase que hereda de otra, especificar ambas clases mediante máquinas de estados que heredan funcionalidad. 5-47


4.2.3. Diagramas de interacción Son un subtipo de diagramas de comportamiento, que enfatiza sobre el flujo de control y de datos entre los elementos del sistema modelado. El UML 2.0 se encuentra diseñado de manera Orientada a Objetos, dentro de la nueva organización interna, y cuenta con los llamados “Diagramas de Interacciones”, que son una subcategoría de los diagramas de comportamiento. Estos diagramas muestran la interacción entre distintos clasificadores de un modelo desde distintos puntos de vista, es decir, haciendo foco en distintos aspectos de la interacción. Esto hace que todos los diagramas de interacción tengan ciertas características compartidas, como por ejemplo la capacidad de crear Diagramas de descripción de interacción y la utilización de fragmentos combinados. Dichos conceptos serán descriptos a continuación utilizando los diagramas de secuencias. • Diagrama de secuencia El diagrama de secuencia es uno de los diagramas más efectivos para modelar interacción entre objetos en un sistema. Un diagrama de secuencia muestra la interacción de un conjunto de objetos en una aplicación a través del tiempo y se modela para cada caso de uso. Mientras que el diagrama de casos de uso permite el modelado de una vista “business” del escenario, el diagrama de secuencia contiene detalles de implementación del escenario, incluyendo los objetos y clases que se usan para implementar el escenario, y mensajes pasados entre los objetos. Típicamente uno examina la descripción de un caso de uso para determinar qué objetos son necesarios para la implementación del escenario. Si tienes modelada la descripción de cada caso de uso como una secuencia de varios pasos, entonces puedes “caminar sobre” esos pasos para descubrir qué objetos son necesarios para que se puedan seguir los pasos. Un diagrama de secuencia muestra los objetos que intervienen en el escenario con líneas discontinuas verticales, y los mensajes pasados entre los objetos como vectores horizontales. Los mensajes se dibujan cronológicamente desde la parte superior del diagrama a la parte inferior; la distribución horizontal de los objetos es arbitraria. Durante el análisis inicial, el modelador típicamente coloca el nombre “business” de un mensaje en la línea del mensaje. Más tarde, durante el diseño, el nombre “business” es reemplazado con el nombre del método que está siendo llamado por un objeto en el otro. El método llamado, o invocado, pertenece a la definición de la case instanciada por el objeto en la recepción final del mensaje. Las modificaciones de los diagramas de secuencias tienden básicamente a permitir la reutilización de los diagramas, agregando los elementos de tipos Fragmento Combinado. Un diagrama que representa una interacción, poniendo el foco en la secuencia de los mensajes que se intercambian, junto con sus correspondientes ocurrencias de eventos en las Líneas de Vida. • Diagrama de comunicación (Antiguos diagramas de colaboración) Anteriormente tenían el nombre de “Diagramas de Colaboración”. Por ser las colaboraciones un diagrama de interacción, al igual que los diagramas 5-48


de secuencias, heredan la misma capacidad de soportar fragmentos combinados. En UML 2.0, un diagrama de comunicación es una versión simplificada del diagrama de colaboración de la versión de UML 1.x. Un diagrama de Comunicación modela las interacciones entre objetos o partes en términos de mensajes en secuencia. Los diagramas de Comunicación representan una combinación de información tomada desde el diagrama de Clases, Secuencia, y Diagrama de casos de uso describiendo tanto la estructura estática como el comportamiento dinámico de un sistema. Los diagramas de comunicación y de secuencia describen información similar, y con ciertas transformaciones, pueden ser transformados unos en otros sin dificultad. Para mantener el orden de los mensajes en un diagrama de comunicación, los mensajes son etiquetados con un número cronológico y colocados cerca del enlace por el cual se desplaza el mensaje. Leer un diagrama de comunicación conlleva comenzar en el mensaje 1.0, y seguir los mensajes desde un objeto hasta el siguiente, sucesivamente. Es un diagrama que enfoca la interacción entre líneas de vida, donde es central la arquitectura de la estructura interna y cómo ella se corresponde con el pasaje de mensajes. La secuencia de los mensajes se da a través de un esquema de numerado de la secuencia. • Diagrama de tiempos Un diagrama de tiempos o cronograma es una gráfica de formas de onda digitales que muestra la relación temporal entre varias señales, y cómo varía cada señal en relación a las demás. Un cronograma puede contener cualquier número de señales relacionadas entre sí. Examinando un diagrama de tiempos, se puede determinar los estados, nivel alto o nivel bajo, de cada una de las señales en cualquier instante de tiempo especificado, y el instante exacto en que cualquiera de las señales cambia de estado con respecto a las restantes. El propósito primario de los diagramas de tiempos (o temporizados) es mostrar los cambios en el estado, o la condición, de una línea de vida de una instancia (de un Clasificador o un Rol de un clasificador), a lo largo del tiempo y de manera lineal. El uso más común es mostrar el cambio de estado de un objeto a lo largo del tiempo, en respuesta a los eventos o estímulos aceptados. El propósito primario del diagrama de tiempos es mostrar los cambios en el estado o la condición de una línea de vida (representando una Instancia de un Clasificador o un Rol de un clasificador) a lo largo del tiempo lineal. El uso más común es mostrar el cambio de estado de un objeto a lo largo del tiempo, en respuesta a los eventos o estímulos aceptados. Los eventos que se reciben se anotan, a medida que muestran cuándo se desea mostrar el evento que causa el cambio en la condición o en el estado.

5-49


• Diagramas de Revisión de interacciones Es un diagrama que muestra cómo interactúan varios diagramas de interacciones. Este tipo de diagramas es muy útil para mostrar de qué manera distintos escenarios se combinan. Los Diagramas de Revisión de la Interacción enfocan la revisión del flujo de control, donde los nodos son Interacciones u Ocurrencias de Interacciones. Las Líneas de Vida los Mensajes no aparecen en este nivel de revisión.

4.2.4. Diagramas UML 2.0 La superestructura del UML es la definición formal de los elementos que componen el UML 2.0. Éste se encuentra organizado en paquetes, que definen los elementos internos del UML y de qué manera se relacionan. El diseño interno del UML 2.0 se encuentra orientado a objetos.

5-50

Tema 6 Lenguajes de programación. Características, elementos y funciones en entornos Java, C, C++ y .Net.


Guión-resumen

1. Introducción 2. Conceptos básicos 3. Introducción a los lenguajes de programación 4. Generaciones en los lenguajes de programación 5. Tipos de programación 6. Procesos en la programación 7. Tipos de lenguajes de programación 8. Estilos de programación 9. Otros conceptos base en programación

10. Aplicaciones de los lenguajes de programación 11. Historia de los lenguajes de programación 12. Algunos lenguajes de programación 13. Otros lenguajes de programación 14. Características, elementos y funciones de JAVA, C y C++ 15. Entornos de programación visual 16. .NET Framework 17. Clasificación de los lenguajes de programación Anexos

6-2


1.

Introducción

Desde que surgieron las primeras computadoras ha sido necesario definir lenguajes que le permitan al hombre comunicarse con la computadora. Esta máquina (el ordenador) fue diseñada para realizar procesos internos en virtud de entradas y salidas de datos. En la actualidad hay equipos computacionales que son automáticos pero, aun así, necesitan comunicarse internamente de alguna forma. El diseño de soluciones a la medida de nuestros problemas requiere una metodología que nos enseñe de manera gradual la forma de llegar a las soluciones. A las soluciones creadas por computadora se les conoce como programas y no son más que una serie de operaciones que realiza la computadora para llegar a un resultado, con un grupo de datos específicos. Es decir, un programa nos sirve para solucionar un problema específico. Para poder realizar programas, además de conocer la metodología mencionada, también debemos de conocer, de manera específica, las funciones que pueden realizar las computadoras y las formas en que se pueden manejar los elementos que hay en la misma. Como ya sabemos, un ordenador es un conjunto de circuitos, cables, etc. por los cuales circula corriente eléctrica en forma de 0 y 1. Entonces, ¿cómo vamos a poder hacer que un conjunto de circuitos desempeñen una determinada tarea y nos entreguen los resultados que nosotros esperamos?, es decir, ¿de qué manera se puede lograr la comunicación entre el hombre y el ordenador? Es este el papel que juegan los lenguajes de programación.

2.

Conceptos básicos

Un programa es una serie o secuencia de instrucciones que el ordenador debe ejecutar para realizar la tarea prevista por el programador. La CPU sólo ejecuta las instrucciones que componen el programa: operaciones aritméticas, operaciones lógicas, comparaciones y movimientos de datos. Cuando nos planteamos un problema complejo y queremos resolverlo con la utilización del ordenador, necesitamos descomponerlo en una serie de tareas simples que se irán repitiendo a lo largo de un proceso hasta la resolución del problema; el ordenador ha realizado una tarea compleja, a partir de instrucciones simples. Dicho conjunto de tareas simples sería el programa, y su elaboración es lo que entendemos por programación. La determinación de la calidad de los programas estará en función de las ventajas de su utilización; para ello existen unas características entre la cuales citamos: —

Legible. Todo programa debe ser de fácil comprensión no sólo por los futuros usuarios, sino por cualquier programador.

—

Flexible. Capaz de adaptarse con facilidad a los cambios que puedan producirse en el planteamiento inicial.

—

Portable. Facilidad para compilarse o interpretarse en distintas máquinas y sistemas operativos, también un factor a tener en cuenta sería su facilidad para ser traducido a otros lenguajes de programación. 6-3


—

Fiable. El programa debe ser capaz de recuperar el control cuando su utilización no sea la adecuada.

—

Eficaz. El programa ha de utilizar eficazmente los recursos de que disponga, tanto del sistema operativo como del equipo en que trabaje.

Cuando nos disponemos a programar, la primera decisión que hemos de tomar es la elección del lenguaje a emplear, es decir, la forma en la que el programador tiene que escribir las operaciones a realizar por el ordenador. Cada computadora tiene un solo lenguaje que puede ejecutarse: el lenguaje de máquina. Hablamos de programar en lenguajes de alto nivel, pero estos lenguajes deben ser traducidos al lenguaje de máquina de la computadora con que estamos trabajando. Estos lenguajes de alto nivel son un medio de facilitar la labor del programador. Los programas en lenguaje máquina (primera generación) están escritos en el nivel más básico de operación de la computadora. Las instrucciones están dirigidas a ese nivel, el lenguaje máquina y los lenguajes programadores de segunda generación, que utilizan símbolos para las instrucciones reciben la designación de lenguaje de bajo nivel. Programar en estos lenguajes resulta ser arduo y tedioso. Casi toda la programación se hace en lenguajes de alto nivel (de la tercera generación y subsiguientes). Un lenguaje de programación es un conjunto de reglas, notaciones, símbolos y/o caracteres que permiten al programador poder expresar el pensamiento de datos y sus estructuras en la computadora, usando también una sintaxis y una gramática determinada. Análogamente, diremos que un programa es un conjunto de órdenes o instrucciones que resuelven un problema específico basado en un Lenguaje de Programación. Los Lenguajes de Programación se clasifican según su base de desarrollo y su uso en: —

Lenguajes basados en Cálculo Numérico: Fortran, Maple, Mathlab y Algol.

—

Lenguajes para Negocios: Cobol.

—

Lenguajes para la Inteligencia Artificial: Prolog, Adal, Lisp y Logo.

—

Lenguajes para sistemas: C y ensamblador.

También se pueden clasificar según la forma de ejecutar los programas:

6-4

—

Lenguajes imperativos. Son aquellos que son controlados por instrucciones imperativas. Pascal, Fortran y otros manejan este modelo.

—

Lenguajes aplicativos o funcionales. Son aquellos que manejan una preaplicación y dan una prerespuesta antes de aplicarlo realmente.

—

Lenguajes con base en reglas. Son los que ejecutan instrucciones en base al cumplimiento de ciertas condiciones.

—

Lenguajes orientados a objetos. Son los que manejan muchas instrucciones por medio de un objeto y que son controladas por pocas funciones.


Generalizando, definiremos los siguientes términos:

3.

—

Lenguaje. Un conjunto de símbolos, caracteres y reglas que permiten a los programadores comunicarse con las computadoras para que realicen algo.

—

Lenguaje de alto nivel. Lenguaje que se basa en instrucciones más globales y más poderosas, tal como los Visuales, C++ y otros más. El archivo resultado de un lenguaje de alto nivel es más grande que los de lenguaje de máquina.

—

Lenguaje de máquina. Lenguaje que usa instrucciones más directas hacia el procesador de la computadora, las cuales son más simples y más sencillas. Programa Fuente

Traductor

Programa Objeto

(Escrito por el Programador)

(compilador o intérprete)

(Lenguaje máquina)

Introducción a los lenguajes de programación

El lenguaje de programación es la forma en la que el programador escribe las operaciones que el ordenador debe realizar. La CPU esta preparada para manejar unas instrucciones escritas en un tipo de lenguaje muy simple llamado lenguaje máquina. Cada modelo de CPU posee su propio lenguaje máquina, y puede ejecutar un programa sólo si está escrito en ese lenguaje (para poder ejecutar programas escritos en otros lenguajes, es necesario primero trasladarlos a lenguaje máquina). El ordenador ejecuta mecánicamente los programas en lenguaje máquina esto es, sin entenderlos, o pensar sobre ellos simplemente porque es la única forma física de hacerlo. Las instrucciones del lenguaje máquina están expresadas con números binarios. Un número binario está compuesto únicamente por dos dígitos, cero y uno. Por tanto, las instrucciones del lenguaje máquina son una secuencia de ceros y unos. Cada secuencia concreta indica una instrucción determinada. Un interruptor ON, representa un uno, mientras que si está OFF, representa cero. Las instrucciones máquina están almacenadas en la memoria como conjuntos de interruptores en ON y en OFF. El ordenador realiza los cálculos por medio de estos interruptores que se van poniendo ON y OFF, siguiendo un patrón determinado al ejecutar cada una de las instrucciones del programa. En función de su parecido con el lenguaje natural, podemos hablar de lenguajes de bajo nivel y lenguajes de alto nivel. En los primeros la sintaxis está más próxima al lenguaje máquina que al lenguaje humano y en los de alto nivel es todo lo contrario. Cuando un programa es ejecutado directamente por el ordenador, es decir está en código máquina, decimos que es un lenguaje de bajo nivel. Casi todos los programas son escritos en lenguajes de alto nivel como Java, Pascal, o C++.

6-5


4.

Generaciones en los lenguajes de programación

La clasificación de los lenguajes de programación viene estipulada por su aproximación al lenguaje utilizado por el ordenador, teniendo en cuenta que todo lenguaje tiene que acabar siendo traducido al propio lenguaje del ordenador. Según este criterio, los niveles de clasificación se pueden establecer por generaciones:

4.1.

Lenguajes de Primera Generación

En este primer bloque nos vamos a encontrar con un único lenguaje denominado lenguaje máquina difícil de diseñar, ya que está en relación directa con el hardware. Es el denominado lenguaje del ordenador, formado por tan sólo dos valores, el 1 y el 0, que representan los niveles alto y bajo de tensión. Así, cualquier expresión (instrucción) que se le quiera comunicar al procesador a través del programa deberá realizarse únicamente como expresión de 1 y 0, siguiendo una tabla de codificación interna de la que debe disponer el propio procesador. Con este lenguaje la tarea de programar se hace larga y tediosa, y la longitud de los programas resultantes es muy grande, por lo que su manejo pasa a ser complicado, así como las correcciones del mismo. Por el contrario, dispone de la ventaja de ser el lenguaje que más rápidamente se interpreta, al ser precisamente el propio lenguaje del procesador.

4.2.

Lenguajes de Segunda Generación

Con el paso del tiempo los programadores, cansados de escribir códigos máquina, llegaron a la conclusión de que todas aquellas expresiones que utilizaban en los programas, tarde o temprano volvían a repetirse, con lo que debían volver a rescribir el mismo código. Esto les llevó a idear una serie de abreviaturas denominadas nemotécnicos, consistentes en la representación de códigos binarios. Gracias a este invento cada programador tenía la facilidad de resumir todos sus códigos en muchas menos líneas, ya que las expresiones que necesitaban ser repetidas se hacían de forma abreviada gracias a estos nemotécnicos. Este lenguaje resultante recibió el nombre de Ensamblador. Y podemos destacar de él:

6-6

—

Su menor tamaño de programa con respecto al lenguaje máquina.

—

Su menor velocidad de ejecución, porque por supuesto todos los nemotécnicos deben ser traducidos por el procesador, invirtiendo un tiempo en ello que los hace más lentos que los lenguajes máquina.

—

Su dependencia todavía del hardware.

—

Su menor complejidad a la hora de ser diseñado, ya que cada programador conocía perfectamente sus propios nemotécnicos.


A los lenguajes de primera y segunda generación se les conoce con el nombre de Lenguajes de Bajo Nivel, ya que son próximos al lenguaje del ordenador.

4.3.

Lenguajes de Tercera Generación

Para reducir las deficiencias de los lenguajes de primera y segunda generación, surgieron nuevos lenguajes denominados de tercera generación, que se acercaban al lenguaje humano, y por tanto se alejaban del lenguaje máquina. Entre sus propiedades cabe destacar: —

Las instrucciones se obtienen mediante expresiones que tienen algún significado para el lenguaje humano: While, if, End, Then, etc. (Mientras, Si, Fin, Entonces, etc.).

—

Los programas sufren una reducción a la mínima expresión.

—

La construcción por parte del programador es realmente fácil.

—

Son independientes del hardware, aunque todavía se tiene problemas con respecto al sistema operativo en el que se trabaja.

—

La corrección de códigos es sencilla.

—

Su velocidad de ejecución disminuye con respecto a los lenguajes anteriores, pero con los avances tecnológicos, este dato parece carecer de importancia.

A los lenguajes de tercera generación se les dio el nombre de Lenguajes de Alto Nivel precisamente por su lejanía del lenguaje máquina. Estos lenguajes los podemos clasificar a su vez según un criterio de utilización:

4.4.

—

Lenguajes de Propósito general: son aquellos que son utilizados para la resolución de todo tipo de problemas, como por ejemplo C1, Cobol, Basic.

—

Lenguajes de Propósito específico: son aquellos que son utilizados para resolver problemas determinados según un área específica, como, por ejemplo, FORTRAN para resolver cálculos numéricos, COBOL para resolver problemas relacionados con la gestión de empresas, como contabilidad, nóminas, etc.

Lenguajes de Cuarta Generación

Con la aparición de estos lenguajes, el programador prácticamente se desentiende de “programar”, ya que sus expresiones son prácticamente similares al lenguaje humano.

1 “C” surgió inicialmente como lenguaje de propósito específico para la construcción de sistemas operativos, pero dada su versatilidad, se fue ampliando a otros campos y en la actualidad es considerado de propósito general.

6-7


Los podemos clasificar en:

5.

•

Generadores de código. Genera de forma automática o semiautomática programas en lenguaje de alto nivel, empleando un número mucho menor de instrucciones que las que se necesitarían con los propios lenguajes de alto nivel.

•

Petición. Son la mayoría de ellos, y se basan en el manejo de bases de datos.

Tipos de programación

Para la obtención de programas que reúna los máximos requisitos de calidad, la programación ha ido evolucionando al mismo tiempo que los métodos y técnicas. Se han ido estableciendo diferentes criterios de programación: programación secuencial, programación modular, programación estructurada, programación orientada a objetos; son complementarias entre sí y por ello no excluyentes para la obtención de los programas requeridos.

5.1.

Programación secuencial

En los primeros pasos de los lenguajes de programación, éstos es escribían de arriba a bajo, todo ello en un solo archivo sin el uso de funciones ni modularidad. Si un trozo de código tenía un error había que revisarlo todo y volver a compilar el programa entero.

5.2.

Programación modular

En la programación modular, descomponemos el problema en una serie de operaciones simples cuya realización nos lleva a la resolución del problema complejo planteado; ahora bien, está descomposición en operaciones simples la agruparemos en módulos que funcionen independientes entre sí y que sean independientes del programa en el que actúen. En la programación modular encontraremos un programa que será el programa principal o módulo raíz. Dicho módulo estará compuesto principalmente de llamadas a otros módulos secundarios. La programación modular es una programación lineal, sencilla, donde aparece un punto de entrada o de comienzo y se va desarrollando de arriba abajo (top-down) con un punto final o de salida.

5.3.

Programación estructurada

La programación estructurada nos permite resolver problemas a partir de un solo punto de entrada (inicio) y otro de salida (final); su estructura con una composición lineal permite la utilización de estructuras más complejas: —

6-8

Estructura secuencial: operaciones consecutivas.


—

Estructura condicional: selección entre dos o más módulos si se cumple x.

—

Estructura repetitiva: se repiten una o varias veces dependiendo de una condición expresa.

5.4.

Programación orientada a objetos

Ante la dificultad para la optimización de los programas y la creciente complejidad de las aplicaciones, partiendo de la programación estructurada, a la que engloba, y dotando al programador de nuevos elementos para el análisis y desarrollo de software comienza la programación orientada a objetos, facilitando la producción de sistemas cada vez más complejos, que permiten modelar problemas no estructurados, incrementan la productividad gracias a la reutilización de objetos y facilitan su mantenimiento. En la programación orientada a objetos (POO) se utilizan conceptos y herramientas que modelan y representa el mundo real tan fielmente como sea posible. La POO proporciona ventajas sobre otros lenguajes de programación: —

Uniformidad. La representación de los objetos lleva implícita tanto el análisis como el diseño y codificación de los mismos.

—

Compresión. Los datos que componen los objetos y los procedimientos que los manipulan, están agrupados en clases, que se corresponden con las estructuras de información que el programa trata.

—

Flexibilidad. Al relacionar procedimientos y datos, cualquier cambio que se realice sobre ellos quedará reflejado automáticamente en cualquier lugar donde estos datos aparezcan.

—

Reutilización. La noción de objeto permite que programas que traten las mismas estructuras de datos reutilicen las definiciones de objetos empleadas en otros programas e incluso los procedimientos que los manipulan. De esta forma, el desarrollo de un programa puede llegar a ser una simple combinación de objetos ya definidos donde éstos están relacionados de una manera particular.

La POO no sustituye a ninguna metodología ni lenguaje de programación anterior. Todos los programas que se realizan según POO se pueden realizar igualmente mediante programación estructurada. Su uso en la actualidad se justifica porque el desarrollo de todas las nuevas herramientas basadas en una interface de usuario gráfico como Windows, X- Windows, etc. es mucho más sencillo. La POO fue estudiada en detalle en el Tema 5.

6-9


6.

Primera generación

FORTRAN

Segunda generación

ALGOL-60

Tercera generación

Pascal

Cuarta generación

Ada

Programación Orientada a Objetos

Smalltalk y C++

Programación Funcional

LISP, Scheme y ML

Programación Orientada a la Lógica

PROLOG

Procesos en la programación Fases a seguir en todo proceso de programación: 1.

Análisis detallado del problema a resolver Plantearemos el problema que deseamos resolver, analizándolo detalladamente; para ello tendremos en cuenta una serie de factores como son: —

El equipo con el que contamos (hardware y software). Los datos iniciales o datos de entrada.

—

Tratamiento u operaciones que realizaremos con esos datos de entrada.

—

Los resultados o datos de salida que queramos obtener.

En este análisis estudiaremos las posibilidades de descomposición del problema en módulos más simples que faciliten la tarea de programación y de ejecución. 2.

Diseño del algoritmo Este diseño del algoritmo sería la descomposición de la ejecución del problema en tareas elementales. El algoritmo describirá la realización del problema complejo en operaciones básicas, sencillas y elementales a realizar por el ordenador. Estas operaciones son las instrucciones u órdenes que podemos dar al ordenador y se corresponden con las diferentes estructuras de control utilizadas en la programación estructurada; en función de dichas estructuras, se pueden agrupar en las siguientes instrucciones: —

6-10

Secuencias. Son instrucciones que se irán realizando ininterrumpidamente y en el orden exacto en el que estén transcritas.


3.

—

Iteraciones (bucles). Son conjuntos de instrucciones que se ejecutarán repetidamente mientras se cumpla unas condiciones determinadas.

—

Decisiones. El ordenador tomará ciertas decisiones, en función de los resultados que se produzcan en el transcurso del programa, escogiendo diferentes itinerarios u opciones diferentes.

—

Saltos. El ordenador desviará la secuencia lineal de instrucciones, saltando de unas a otras instrucciones en función de ciertas condiciones.

Programación Es la codificación del algoritmo o programación propiamente dicha en el lenguaje de programación elegido. El programador, en función de dicho lenguaje, utilizando la sintaxis y el vocabulario requerido, irá traduciendo el algoritmo al lenguaje de programación, utilizando las funciones que se corresponderán con las diferentes tareas a ejecutar, estructuras, etc.

4.

Obtención del programa Una vez codificado el algoritmo, necesitamos obtener el programa ejecutable, es decir el software que resolverá el problema de partida. Esta tarea se resolverá en tres fases: edición, compilación y montaje o linkado. La edición del programa es la escritura del mismo en el lenguaje de programación y dentro del sistema operativo utilizado; obtendremos el programa en un fichero de texto o código fuente. La compilación es la traducción del fichero de textos en lenguaje máquina, obteniéndose los ficheros código objeto o código máquina. Dicho proceso lo realizarán los programas compiladores o intérpretes. El montaje o linkado es el proceso de unión entre las distintas partes del lenguaje máquina para la obtención del fichero o programa ejecutable.

5.

Depuración del programa La depuración del programa es la comprobación de la bondad del mismo; estudiaremos el funcionamiento del programa en todas las situaciones posibles comprobando su correcto funcionamiento, para ello iremos introduciendo los diferentes valores posibles y comprobando el resultado; tendremos que volver al fichero de texto o código fuente cuantas veces sea necesario hasta que el definitivo programa ejecutable cumpla todas las condiciones requeridas, en ese momento el resultado es el óptimo y el programa está terminado.

6.

Documentación del programa Es la elaboración de la documentación técnica del programa. Se realizará en función del programa y de su futura utilización o comercialización. Dicha documentación se realizará a dos niveles: 6-11


•

Documentación interna. Se elaborará una documentación a nivel de programación, especificándose cuantas aclaraciones y comentarios sean necesarios. Podrán ir dentro del propio programa y su función es simplificar la actualización del programa.

•

Documentación externa. La documentación será a nivel de usuario, en la que se especificará con toda claridad la instalación del programa, las condiciones técnicas o el sistema requerido para su funcionamiento, así como la descripción del funcionamiento del programa, datos de entrada, salida, etc.

1. Análisis del problema

Equipo: hardware y software. Datos iniciales, tratamiento, resultados. Descomposición del problema en módulo.

2. Diseño del algoritmo– descomposición solución en tareas elementales

Secuencias. Iteraciones. Decisiones. Saltos.

3. Codificación–programación del algoritmo

Traducción al lenguaje elegido de programación.

4. Obtención programa ejecutable

Edición: Código fuente. Compilación: Código objeto. Linkado: Programa ejecutable.

5. Prueba, verificación y depuración del programa

Estudio en todas las situaciones.

6. Documentación del programa–elaboración de manuales

Documentación interna. Documentación externa.

Los principales errores en la ejecución de un programa son:

7.

—

Datos de entrada incorrectos que producen una parada del sistema (por ejemplo, introducir un dividendo con valor cero en una operación de división).

—

Bucles mal definidos que producen un funcionamiento continuo del programa (por ejemplo, un bucle sin fin o bucle infinito).

—

Datos de salida incorrectos, producidos por un mal desarrollo del programa o ambigüedad en las especificaciones del usuario.

Tipos de lenguajes de programación

Dentro de los lenguajes de alto nivel podemos distinguir entre lenguajes compilados y lenguajes interpretados; dicha distinción se realiza en función de la forma en que generamos el programa ejecutable. Un lenguaje de alto nivel 6-12


no puede ser ejecutado directamente por ningún ordenador; es necesario trasladarlo a lenguaje máquina.

7.1.

Lenguajes compilados

Los lenguajes compilados son aquellos que, una vez escrito el código fuente, permite obtener un programa ejecutable y autónomo, susceptible de ser ejecutados en cualquier máquina bajo el sistema operativo para el que fue diseñado. En estos lenguajes de programación es imprescindible la existencia de un compilador. El compilador es un programa complejo que traduce todo el programa de golpe en código máquina. Es decir, el programa compilador traduce las instrucciones de un lenguaje de alto nivel en instrucciones de lenguaje máquina que la computadora puede interpretar y ejecutar. Un compilador traduce en instrucciones de lenguaje de máquina las instrucciones de lenguaje de alto nivel, llamadas programa fuente. El resultado de la compilación es el programa objeto. El código objeto también se suele denominar código binario o código máquina. Una vez que el programa está compilado, las líneas de código fuente dejan de tener sentido durante la ejecución del programa.

7.2.

Lenguajes interpretados

Los lenguajes interpretados son aquellos en los que el programa fuente necesita de un programa intérprete para ser ejecutado. El intérprete traduce instrucción por instrucción a medida que va siendo necesario. Un intérprete es un programa que trabaja de una forma muy semejante a la CPU, con una especie de ciclo de leer y ejecutar. Para poder ejecutar un programa, el intérprete ejecuta un bucle en el que va leyendo las instrucciones una a una, decide si se han de ejecutar y, si es así, las convierte en el código máquina apropiado. El intérprete puede permitir el uso de un programa en código máquina de un ordenador, en otro tipo de ordenador completamente diferente. Un intérprete cumple las mismas funciones que un compilador, aunque en diferente forma. En vez de traducir íntegramente el programa fuente en una sola pasada, traduce y ejecuta cada instrucción de él antes de traducir y ejecutar la siguiente. La ventaja de los intérpretes sobre los compiladores radica en que, si hay error en la sintaxis de instrucciones, éste se indica al programador de inmediato, con lo cual se le permite hacer las correcciones durante el desarrollo del programa. Las desventajas del intérprete consiste en que no utiliza los recursos de la compilación con la misma eficiencia con que un programa que ha sido compilado. Como el intérprete no produce programa objeto, debe hacer el proceso de traducción cada vez que un programa se corre, línea por línea. Con la compilación separada, el programa, por la extensión del código fuente, no puede ser compilado en un solo bloque, con lo que se compilará por partes, obteniéndose diferentes códigos objetos; una vez completado todo el programa, todos los códigos objetos que conforman un programa se agruparán obteniéndose el código o fichero ejecutable. Los lenguajes ensambladores y máquina son dependientes de la máquina. Cada tipo de máquina tiene su propio lenguaje máquina distinto y su lenguaje ensamblador asociado. El lenguaje ensamblador es simplemente una representación simbólica del lenguaje máquina asociado, lo cual permite una programación menos tediosa que con el anterior. 6-13


La programación en un lenguaje de alto nivel o en un lenguaje ensamblador requiere algún tipo de interfaz con el lenguaje máquina para que el programa pueda ejecutarse. Las tres interfaces más comunes son: un ensamblador, un compilador y un intérprete. El ensamblador y el compilador traduce el programa a otro equivalente en el lenguaje de la máquina residente como un paso separado antes de la ejecución. Por otra parte, el intérprete ejecuta directamente las instrucciones en un lenguaje de alto nivel, sin un paso de procesamiento previo. La compilación es un proceso mas eficiente que la interpretación para la mayoría de los tipos de máquinas. Esto se debe principalmente a que las sentencias dentro de un bucle deben ser interpretadas cada vez que se ejecutan por un intérprete. Con un compilador, cada sentencia es interpretada y luego traducida a lenguaje máquina solo una vez. Algunos lenguajes son lenguajes principalmente interpretados, como APL, PROLOG y LISP, JAVA, etc. Ejemplos de lenguajes compilados son: PASCAL, FORTRAN, COBOL, PL/I, SNOBOL, C, ADA, etc. En algunos casos, un compilador estará utilizable alternativamente para un lenguaje interpretado y viceversa.

8.

Estilos de programación

De acuerdo con el estilo de programación, podemos clasificar los lenguajes en las siguientes categorías: •

Imperativos: son aquellos lenguajes que basan su funcionamiento en un conjunto de instrucciones secuenciales, las cuales, al ejecutarse, van alterando las regiones de memoria donde residen todos los valores de las variables involucradas en el problema que se plantea resolver. Es decir, se cambia progresivamente el estado del sistema, hasta alcanzar la solución del problema. Está basada en el modelo Von Neumann, en donde un conjunto de operaciones primitivas realizan una ejecución secuencial. Realiza una abstracción en el manejo de variables, expresiones e instrucciones y para programar es necesario declarar las variables necesarias y diseñar una secuencia adecuada de instrucciones (asignaciones). Algunos de los lenguajes de este tipo son Pascal, Ada y C.

•

Declarativos: en este paradigma, más que el cómo desarrollar paso a paso un proceso, nos interesa el qué deseamos obtener a través del programa. El ejemplo típico de lenguaje declarativo es SQL, el cual es utilizado para interactuar con la información de bases de datos, concentrándose sólo en los resultados que van a ser obtenidos, dejándole al traductor la tarea de cómo llegar a ellos y presentárnoslos. Dentro de este paradigma, se encuentran dos estilos distintos de programación, cada uno de los cuales posee su propia lógica: —

6-14

Funcionales: son lenguajes basados en funciones, las cuales se representan mediante expresiones que nos permiten obtener ciertos resultados a partir de una serie de argumentos. De


hecho, las expresiones están formadas por un conjunto de términos, que a su vez pueden encapsular otras expresiones, para con la evaluación de todas ellas, llegar a la solución deseada. El programa es una función (o un grupo de funciones). La relación entre las funciones son muy simples: una función puede llamar a otra función, o el resultado de una función puede ser usado como el argumento de otra función. Las variables, comandos y efectos laterales son exclusivos. Los programas son escritos enteramente dentro del lenguaje de expresiones, funciones y declaraciones. Dos de estos lenguajes son Scheme y ML. —

•

Lógicos: este tipo de lenguajes se basan en el cálculo de predicados, la cual es una teoría matemática que permite entre otras cosas, lograr que un ordenador basándose en un conjunto de hechos y de reglas lógicas, pueda derivar en soluciones inteligentes. La Programación Lógica está basada en la noción de relación, debido a que en la relación es un concepto más general de una aplicación. La Programación Lógica es potencialmente de alto nivel. Los lenguajes de Programación Lógica pueden explotar la Inteligencia Artificial. Un lenguaje de este tipo es Prolog.

Programación Orientada a Objetos: los programas de este tipo, se concentran en los objetos que van a manipular, y no en la lógica requerida para manipularlos. La programación orientada al objeto está basada en los objetos, clase, método, envío y recepción de mensajes, herencia y polimorfismo. Algunos de los lenguajes de este tipo son C++, JAVAy Smalltalk. La Orientación a Objetos está constituyendo una metodología de diseño y desarrollo de “software” de gran trascendencia para la producción de software eficiente y barato. Esta metodología de análisis, diseño y programación, que configura las fases fundamentales del ciclo de vida de un sistema informático, se está asentando como la estructura metodológica de los años 90, y se presenta educacionalmente como paradigmática en el desarrollo de aplicaciones. La Orientación a Objetos se puede definir como una disciplina de ingeniería de desarrollo y modelado de software que permite construir más fácilmente sistemas complejos a partir de componentes individuales. La Orientación a Objetos permite una representación más directa del modelo del mundo real, reduciendo fuertemente la transformación radical normal desde los requerimientos del sistema, definidos en términos del usuario, a las especificaciones del sistema, definidas en términos del computador. Actualmente la tendencia de la Ingeniería Informática es la producir componentes reutilizables para ensamblarlos unos a otros y obtener así el producto completo. Estos elementos reutilizables son denominados “Componentes Integrados de Software” (CIS) por su teórica similitud con los “componentes integrados de hardware” (chips), innovación que revolucionó la industria del computador en los años 70. El Paradigma Orientado a Objetos es, pues, una filosofía de desarrollo y empaquetamiento de 6-15


“software” que permite crear unidades funcionales extensibles y genéricas, de forma que el usuario las pueda aplicar según sus necesidades y de acuerdo con las especificaciones del sistema a desarrollar. La Orientación a Objetos proporciona mejores herramientas para: —

Modelar el mundo real de un modo más cercano a la perspectiva del usuario.

—

Interactuar fácilmente con un entorno computacional, usando metáforas familiares.

—

Construir componentes reutilizables de software y bibliotecas específicas de estos componentes fácilmente extensibles.

—

Modificar y ampliar con facilidad la implementación de estos componentes sin afectar al resto de la estructura.

En cuanto a los elementos fundamentales que configuran el Paradigma Orientado a Objetos, se suelen significar siete: —

Estructura modular basada en objetos, dado que los sistemas en esta metodología son modularizados sobre la base de sus estructuras de datos.

—

Abstracción de datos, porque los objetos son descritos como implementaciones de tipos abstractos de datos.

—

Gestión automática de memoria, de forma que los objetos no utilizados sean desasignados por el propio sistema sin intervención del programador.

—

Clases, en las que cada tipo no simple sea un módulo, y cada módulo de alto nivel sea un tipo.

—

Herencia, que permita que una clase sea definida como una extensión o restricción de otra.

—

Polimorfismo y enlace dinámico, de forma que las entidades del programa puedan referenciar en tiempo de ejecución a objetos de diferentes clases.

—

Herencia múltiple y repetida para que se pueda declarar una clase como heredera de varias, e incluso de ella misma.

El Paradigma Orientado a Objetos se describe a menudo usando el concepto de Objeto/Mensaje, en el que cada objeto (elemento autónomo de información creado en tiempo de ejecución) es solicitado para realizar un determinado servicio mediante el envío a ese objeto del mensaje apropiado. El solicitante no precisa conocer cómo el objeto proporciona el servicio pedido; la implementación es interna al objeto y la gestiona el suministrador del objeto. El énfasis se produce en qué se puede obtener más que en cómo se obtiene.

6-16


Un programa orientado a objetos viene definido por la ecuación: OBJETOS + MENSAJES = PROGRAMA Aquí el objeto es una instancia de una clase, la cual implementa un tipo abstracto de dato (TAD). Y el mensaje es la información específica que se envía al objeto para que ejecute una determinada tarea. Un TAD define conjuntos encapsulados de objetos similares, con una colección asociada de operaciones; y especifica la estructura y el comportamiento de los objetos. Las especificaciones estructuradas del TAD describen las características de los objetos pertenecientes a ese TAD, y las especificaciones de comportamiento describen qué mensajes son aplicables a cada objeto. •

8.1.

Programación orientada al evento: Esta programación es el resultado de la programación orientada al objeto. En este tipo de programación permite trabajar con objetos y clases estándar previamente definidas por la aplicación, las cuales manejan los conceptos de encapsulasión. Las herramientas que trabajan de esta forma por lo general se trabajan con código original de lenguajes imperativos. Algunas herramientas de este tipo son Visual Basic (Basic), Delphi (Pascal) y Power Builder (C).

Programación estructurada

Existen en la actualidad dos formas o metodologías básicas de construcción de software: la programación estructurada u orientada al flujo de datos, y la programación orientada a objetos. Es evidente que un programa tiene como finalidad la resolución de un determinado problema, o la realización de determinada tarea, pero para ello no hay una forma única. Se pueden hacer diferentes programas, o algoritmos de resolución, que cumplan todos ellos un objetivo propuesto. Por esto debemos conocer las reglas o principios que nos permitan la elección del más adecuado, pues todos ellos incidirán directamente en el coste de su diseño y posterior mantenimiento, no olvidando nunca una premisa fundamental: se desarrolla para mantener. Con independencia de la metodología empleada en su construcción, los programas deben cumplir unas características generales como: ser legibles (fáciles de leer y comprender, por lo que hay que comentarlos ampliamente en sus partes complejas), portables (fáciles de codificar en otros lenguajes o en otros sistemas y configuraciones físicas), fácilmente modificables (para facilitar su mantenimiento), eficientes (para aprovechar bien los recursos), modularizables (descomponer el problema general de arriba abajo, top-down, en bloques o módulos a diferentes niveles), y estructurados (siguiendo un método y unas normas básicas). Todas estas características van dirigidas tanto a facilitar su implementación como su verificación y depuración, así como su posterior y seguro mantenimiento. Todo ello tiene como resultado final el que los costes y el esfuerzo personal de todo el proceso sean menores.

6-17


Si consideramos cualquier centro de desarrollo de programas con proyectos en curso, veremos que, frecuentemente, los programadores que comenzaron el proyecto no siguen en el mismo centro o que han pasado a trabajar en otros proyectos. Por ello es de vital importancia que un programa desarrollado inicialmente por una persona sea fácilmente ampliado y modificado por otra distinta. Ésta es una de las ventajas de la programación estructurada. Los programas escritos sin un determinado método suelen tener problemas como los siguientes: —

Suelen ser demasiado rígidos, con problemas al adaptarlos a distintos entornos y configuraciones.

—

Los programadores pasan la mayoría del tiempo corrigiendo sus errores.

—

Los programadores rehúsan el uso de programas y módulos ya escritos y en funcionamiento, pues prefieren escribir los suyos. La comunicación entre ellos es difícil.

—

Un proyecto de varios programadores suele tener varios conjuntos diferentes de objetivos.

—

Cada programador tiene sus propios programas, y esta relación se hace inseparable.

—

Las modificaciones en aplicaciones y programas son muy difíciles de hacer, implican mucho tiempo y un elevado coste de mantenimiento. Ello conduce, bien a colocar “parches” que complican cada vez más el diseño inicial, o bien a que el programa caiga en desuso y que frente al elevado coste de actualización se opte por crear una nueva aplicación que sustituya a la existente.

—

Deficiencias en la documentación: incompleta o no actualizada.

Se hace preciso pues realizar programas siguiendo técnicas o métodos estandarizados que consiguen las características anteriormente descritas, rápida y eficazmente. Las técnicas de programación que permiten seguir una metodología de la programación más empleadas son la programación modular y la programación estructurada. Estas dos técnicas suelen ser complementarias, ya que en el análisis de un problema pueden utilizarse criterios de programación modular para dividirlo en partes independientes y utilizar métodos estructurados en la programación de cada módulo. Por ello no debe causarnos extrañeza que en la actualidad se difundan con gran fuerza las técnicas de programación estructurada, cuyo objetivo principal consiste en: —

Facilitar la comprensión del programa.

—

Permitir rápidamente el mantenimiento del mismo, a lo largo de su vida útil.

Una forma de simplificar el diseño de algoritmos es utilizar la técnica de diseño descendente de programas, Top-down (de arriba abajo), que consiste en descomponer un problema en una serie de niveles o pasos sucesivos de refinamiento (stepwise). La metodología descendente consiste en efectuar una relación entre las sucesivas etapas de estructuración de modo que se relacio6-18


nen unas con otras mediante entradas y salidas de información. Es decir, se descompone el problema en etapas o estructuras jerárquicas, de modo que se puede considerar cada estructura desde dos puntos de vista: lo que hace, y cómo lo hace. La programación estructurada sigue completamente las directrices top-down. En la programación tradicional se utilizan de un modo excesivo, indiscriminado, y a veces caprichoso, las instrucciones de bifurcación condicional e incondicional, lo que hace difícil el seguimiento de la lógica del programa y consecuentemente sus necesarias modificaciones futuras. La programación estructurada tiene como uno de sus fines la eliminación de los problemas descritos; por ello las instrucciones de bifurcación o saltos han sido eliminadas, o por lo menos seriamente restringidas en su utilización. Es por ello que un programa estructurado, en una secuencia normal de lectura, puede ser fácilmente leído en su totalidad, sin saltos ni búsquedas incontroladas. En cierto sentido, la programación estructurada ha sido precursora del diseño orientado a objetos, dado que los programadores en programación estructurada, dentro de la fase de diseño deben realizar sus diferentes tareas en forma de módulos, subrutinas, o bloques, los cuales son susceptibles de estandarizarse, por lo que se pueden incluir como elementos dentro de bibliotecas de programas para su futura utilización en otros programas e incluso para diversas aplicaciones. Así tenemos la reutilización del código. El concepto de objeto, si bien es más amplio, puede tener como origen estos elementos de biblioteca. Vemos pues que con la programación estructurada se consigue hoy en día producir buen código, dado que se utilizan estructuras estándar de control para mejorar la calidad y el mantenimiento de los programas. Las estructuras de control fomentan el desarrollo de programas de alto nivel por expansión ordenada de bloques de programa; dado además que las estructuras de control son limitadas, se minimiza la complejidad de los problemas y por consiguiente se reducen los errores. Los diseñadores especifican funciones de alto nivel con un bloque de programa, y este bloque es entonces expandido en más componentes detallados, basándose en que la programación estructurada se auxilia en los denominados Recursos Abstractos, en lugar de los recursos concretos de que se dispone en un determinado lenguaje de programación. Así, descomponer un programa en términos de recursos abstractos consiste en descomponer una determinada acción compleja en términos de un número de acciones más simples, que uno es capaz de ejecutarlas o que constituyen instrucciones disponibles de un computador. Con todo ello, la documentación que se produce es mucho más legible. Cada bloque debe desarrollar una función bien definida, siendo una buena práctica de programación el intercalar comentarios interactivos que mejoren aún más su legibilidad. Se debe pues definir cada bloque de la estructura de control y describir sus propósitos. Los enlaces con las descripciones de salida del código también deben ser incluidos en la documentación. Es relativamente fácil utilizar las especificaciones para crear código bien estructurado. Las especificaciones de proceso usan palabras clave muy similares a las construcciones utilizadas en programación estructurada. Las sentencias aritméticas o de transformación de las especificaciones del proceso se reemplazan por la gramática utilizada en el lenguaje de programación.

6-19


Tenemos, en consecuencia, que un programa estructurado es: fácil de comprender en su lectura; fácil de codificar en diversos lenguajes; fácil de implantar en diferentes sistemas; fácil de documentar; fácil de mantener; eficiente; modularizable, pues es un valor añadido por la propia técnica de diseño. Como resumen podemos concluir que la programación estructurada es el conjunto de técnicas que incorporan: diseño descendente (top-down), recursos abstractos, y estructuras básicas. En 1966 Böhm y Jacopini demostraron que todo programa propio, sea cual sea el trabajo que tenga que realizar, se puede hacer utilizando tres únicas estructuras de control, que son la secuencial, la selectiva y la repetitiva. Un programa se define como propio si cumple las tres siguientes características: —

Posee sólo un punto de entrada y uno de salida o fin para control de programa.

—

Existen caminos desde la entrada hasta la salida que se pueden seguir y que pasan por todas las partes del programa.

—

Todas las instrucciones son ejecutables y no existen lazos o bucles infinitos.

Así pues podemos definir la programación estructurada como aquella que utiliza siempre una estructura con un único punto de entrada y un único punto de salida, y que utiliza solo tres estructuras de control: la secuencial, la selectiva o alternativa (simple, doble, múltiple), y la repetitiva: —

Estructura secuencial: se trata de una estructura con solo un punto de entrada y uno de salida, compuesta por una serie de tareas que también tienen un solo punto de entrada y de salida, y donde cada tarea sigue a otra en secuencia. Las tareas se suceden de modo que la salida de una es la entrada de la siguiente, y así sucesivamente hasta el final del proceso.

—

Estructura selectiva o alternativa: se utiliza para tomar decisiones lógicas. En ella se evalúa una condición, y en función del resultado de la misma se realiza una opción u otra. Las estructuras selectivas pueden ser simples, dobles o múltiples. La alternativa simple es la típica “si-entonces” (IF-THEN), donde se evalúa la condición, y si esta es verdadera se ejecuta una determinada acción, y si es falsa entonces no se hace nada. La alternativa doble ejecuta una acción diferente en cada caso posible de evaluación de la condición (verdadero o falso). Es el “si-entonces-sino” (IF-THEN-ELSE). La alternativa múltiple se podría realizar con las dos anteriores estructuras anidadas o en cascada, pero la legibilidad del programa podría verse comprometida. Por ello esta estructura múltiple se incluye también. Es la típica instrucción “según-sea, caso de” (CASE OF).

—

6-20

Estructura repetitiva: es el algoritmo necesario para repetir una o varias acciones un número determinado de veces. Estas estructuras


se denominan bucles. Para limitar el número de veces que debe repetirse el bucle hay que contar con una condición, para lo que se suele utilizar una variable que se incrementa con cada ejecución. Es la típica construcción “mientras” (WHILE).

9.

Otros conceptos base en programación Existen algunos términos añadidos que debemos de tener claros como son: —

Código fuente. Es el texto de un programa que un usuario puede leer, normalmente considerado como el programa en sí. El código fuente es la entrada al compilador o intérprete.

—

Código objeto. Es la traducción a través del compilador del código fuente a código máquina, que es el que el ordenador puede leer y ejecutar. El código objeto es la entrada al enlazador.

—

Enlazador. Es un programa que enlaza módulos compilados por separado para producir un solo programa. La salida del enlazador es un programa ejecutable.

—

Tiempo de compilación. Es el tiempo que tarda el compilador en traducir el código fuente a código objeto.

10. Aplicaciones de los lenguajes de programación Las aplicaciones de los lenguajes de programación vienen dadas por el programa que se crea con él. Los programas se pueden clasificar por diversos tipos: aquí realizaremos una pequeña clasificación funcional, como la siguiente: APLICACIÓN

LENGUAJE

NEGOCIOS

COBOL, C, 4GL, PL/I

CIENTÍFICA

FORTRAN, C, C++, BASIC, PASCAL, APL, ALGOL

SISTEMAS

JOVIAL C, C++, PASCAL, ADA, BASCI, MODULA

IA

LISP, PROLOG, SNOBOL

EDICIÓN

TEX, POSTSCRIPT

PROCESO

SHELL DE UNIX, TCL; PERL, MARVEL

NUEVOS PARADIGMAS

ML, SMALLTALK, EIFFEL

INTERNET (USUARIO)

HTML, DHTML, XML, SCRIPT

INTERNET (SERVIDOR)

PHP, ASP, JSP

6-21


11. Historia de los lenguajes de programación La historia de los lenguajes de programación se remonta a la época anterior a la II Guerra Mundial; no obstante es a partir de los años setenta cuando tiene su mayor auge. A partir de los años sesenta, empiezan a surgir diferentes lenguajes de programación, atendiendo a diversos enfoques, características y propósitos. Actualmente existen alrededor de 2000 lenguajes de programación y continuamente están apareciendo otros más nuevos, que prometen hacer mejor uso de los recursos computacionales y facilitar el trabajo de los programadores. A continuación detallamos algunas referencias interesantes. AÑO

LENGUAJE

INVENTOR

USO

1946

Plankalkul

Konrad Zuse

Jugar al ajedrez.

1949

Short Code

1950

ASM (ensamblador)

1951

A-0

Grace Hopper

1952

AUTOCODE

Alick E. Glennie

Compilador rudimentario.

1956

FORTRAN

IBM

Traducción de fórmulas matemáticas.

1956

COBOL

1958

ALGOL 58

1960

LISP

1961

FORTRAN IV

1961

COBOL 61 Extendido

1960

ALGOL 60 Revisado

1964 1964 1965

SNOBOL

Lenguaje traducido a mano. Lenguaje ensamblador. Primer compilador.

Compilador.

Interprete orientado a la Inteligencia Artificial. IBM

Traducción de fórmulas matemáticas.

PASCAL

Niklaus Wirth

Programación estructurada.

BASIC

Universidad de Dartmouth

1965

APL

1965

COBOL 65

1966

PL/I

1966

FORTRAN 66

1967

SIMULA 67

1968

ALGOL 68

1968

SNOBOL4

+1970

GW-BASIC

1970

APL/360

1972

SMALLTALK

Xerox

Pequeño y rápido.

1972

C

Laboratorios Bell

Lenguaje con tipos.

1974

COBOL 74

1975

PL /I

1977

FORTRAN 77

6-22

IBM

Antiguo BASIC.

Lenguaje sencillo. IBM


AÑO

LENGUAJE

INVENTOR

USO

+1980

SMALLTALK/V

Digitalk

Pequeño y rápido.

1981

PROLOG

Ministerio Japonés

Lenguaje para la Inteligencia Artificial.

1982

ADA

Ministerio Defensa EE.UU

Lenguaje muy seguro.

1984

C++

AT&T Bell Laboratories

PROG. ORIENTADA A OBJETOS.

1985

CLIPPER

1985

QuickBASIC 1.0

Microsoft®

Compilador para bases de datos. Vompilador de BASIC.

1986

QuickBASIC 2.0

Microsoft®

Soporte de tarjeta gráfica EGA.

1987

QuickBASIC 3.0

Microsoft®

43 líneas con la tarjeta EGA.

1987

QuickBASIC 4.0

Microsoft®

1987

CLIPPER '87

1988

QuickBASIC 4.5

Microsoft®

1989

QuickBASIC 7.1

Microsoft®

Tarjetas Hércules, VGA. Compilador para bases de datos. Tarjeta SVGA.

1989

ASIC V5.0

+1990

VISUAL C++

Interprete tipo QBASIC shareware. Entorno visual de C++.

+1990

JavaScript

Lenguaje de Script (GUIONES).

+1990

VBScript

1993 1993

Microsoft®

Lenguaje de Script (GUIONES).

HTML

Tim Berners-Lee

Surge para su uso en Internet.

XML

C. M. Sperberg-McQueen


+1990

SGML

Charles F. Goldfarb


+1990

WML

+1990

ASP

Microsoft®

Uso en Internet (SERVIDOR).

+1990

PHP

1995

JAVA

1995

DELPHI

Surge para su uso en Internet. Uso en Internet (SERVIDOR). Sun Microsystems

1995

CLIPPER 5.01

1995

GNAT ADA95

Ministerio Defensa EE.UU

1995

FORTRAN 95

IBM

1991

VISUAL BASIC 1.0

Microsoft®

1992

VISUAL BASIC 2.0

Microsoft®

1993

VISUAL BASIC 3.0

Microsoft®

1994

VISUAL BASIC 4.0

Microsoft®

1995

VISUAL BASIC 5.0

Microsoft®

1998

VISUAL BASIC 6.0

Microsoft®

1998

JAVA(JDK 1.2)

1998

JSP

Applets y aplicaciones. Compilador para bases de datos.

Sun Microsystems

+-1999

C#

1999

Delphi 5

2000

JAVA(JDK 1.3)

2001

.NET

Microsoft®

2002

JAVA(JDK 1.4)

Sun Microsystems

Lenguaje muy seguro. Entorno visual de BASIC.

Uso en Internet (SERVIDOR). PROG. ORIENTADA A OBJETOS.

Sun Microsystems PROG. ORIENTADA A OBJETOS.

6-23


12. Algunos lenguajes de programación 12.1. ADA Nombrado en honor de la primera persona programador de computadoras del mundo, AUGUSTA ADA BYRON KING, Condesa de Lovelace, e hija del poeta inglés Lord Byron. Ada es un idioma de la programación de alto nivel pensado para las aplicaciones en vías de desarrollo donde la exactitud, seguridad, fiabilidad y manutención son primeras metas. Ada es un lenguaje del tipo orientado a Objeto. Se piensa que trabaja bien en un ambiente del multi-lenguaje y ha estandarizado los rasgos para apoyar la unión a otros idiomas. La Razón de Ada proporciona una descripción de los rasgos principales del idioma y sus bibliotecas y explicaciones hacen lo propio con las opciones hechas por los diseñadores del idioma.

12.2. COBOL El deseo de desarrollar un lenguaje de programación que fuera aceptado por cualquier marca de computadora reunió en Estados Unidos, en mayo de 1959, una comisión (denominada CODASYL: Conference On Data Systems Languages) integrada por fabricantes de computadoras, empresas privadas y representantes del Gobierno, dando lugar a la creación del lenguaje COBOL (COmmon Business Oriented Language) orientado a los negocios, llamándose ésta primera versión COBOL-60, por ser éste el año que vio la luz. COBOL estaba en constante evolución gracias a las sugerencias de los usuarios y expertos, dando lugar a las revisiones de 1961, 1963 y 1965. La primera versión standard nació en 1968, siendo revisada en 1974, llamadas COBOL ANSI o COBOL-74, muy extendidas todavía. En la actualidad es COBOL-85 la última versión revisada del lenguaje COBOL, estando pendiente la de 1997. ¿Por qué se hablaba de fabricantes de computadoras y no de Sistemas Operativos, como en la actualidad? Sí que es significativo, pero por aquellos años no existían Sistemas Operativos abiertos, sino que cada fabricante tenía su propio Sistema Operativo y por lo tanto cada Cobol debería valer para cada computadora. Ciertamente no había mucha diferencia entre ellos. Cobol es un lenguaje compilado, es decir, existe el código fuente escrito con cualquier editor de textos y el código objeto (compilado) dispuesto para su ejecución con su correspondiente runtime. Cuando se ve un programa escrito en Cobol saltan a la vista varios aspectos:

6-24

—

Existen unos márgenes establecidos que facilitan su comprensión.

—

Está estructurado en varias partes, cada una de ellas con un objetivo dentro del programa.


—

Nos recuerda mucho al idioma inglés, puesto que su gramática y su vocabulario están tomados de dicho idioma.

—

En contraste con otros lenguajes de programación, COBOL no se concibió para cálculos complejos matemáticos o científicos; de hecho sólo dispone de comandos para realizar los cálculos mas elementales: suma, resta, multiplicación y división; sino que su empleo es apropiado para el proceso de datos en aplicaciones comerciales, utilización de grandes cantidades de datos y obtención de resultados, ya sea por pantalla o impresos.

Con Cobol se pretendía un lenguaje universal, a pesar de lo cual los numerosos fabricantes existentes en la actualidad han ido incorporando retoques y mejoras, aunque las diferencias esenciales entre ellos es mínima. Con la llegada del Sistema Operativo Windows, son muchos los que intentan proveer al Cobol de esa interface gráfica: Objective Cobol, Visual Object Cobol de Microfocus, Fujitsu PowerCobol, Acucobol-GT, Vangui y Cobol-WOW de Liant (RM), etc… que están consiguiendo que este lenguaje siga estando presente en moda visual de ofrecer los programas. Sin embargo, son muchas las empresas que siguen dependiendo del Cobol-85 tradicional para sus proyectos debido principalmente a la estructura de su sistema informático.

12.3. FORTRAN FORTRAN que originalmente significa Sistema de Traducción de Fórmulas Matemáticas pero se ha abreviado a la FORmula TRANslation, es el más viejo de los establecidos lenguajes de “alto-nivel”, fue diseñado por un grupo en IBM durante los años 50. El idioma se hizo tan popular en los 60 que otros vendedores empezaron a producir sus propias versiones y esto llevó a una divergencia creciente de dialectos (a través de 1963 había 40 recopiladores diferentes). Así las cosas, fue reconocido que tal divergencia no estaba en los intereses de los usuarios de la computadora o los vendedores de la computadora, por lo que FORTRAN 66 fue el primer idioma en ser regularizado oficialmente en 1972. La publicación de la norma significó que ese FORTRAN se llevó a cabo más ampliamente que cualquier otro idioma. A mediados de los años setenta se proporcionó virtualmente a cada computadora, mini o mainframe, con un sistema FORTRAN 66 normal. Era, por tanto, posible escribir programas en FORTRAN en cualquier sistema y estar bastante seguro que éstos pudieran moverse para trabajar en cualquier otro sistema de forma bastante fácil. Esto hacía que pudieran procesarse programas de FORTRAN muy eficazmente. La definición normal de FORTRAN se puso al día en 1970 y una nueva norma, ANSI X3.9-1978, fue publicada por el Instituto de las Normas Nacional americana. Esta norma fue adoptada en 1980 por la Organización de Normas Internacionales (ISO) como una Norma Internacional (ES 1539: 1980). El idioma es normalmente conocido como FORTRAN 77 (desde que el proyecto final realmente se completó en 1977) y es ahora la versión del idioma en su uso extendido.

6-25


El FORTRAN fue un lenguaje verdaderamente revolucionario, pues antes de él todos los programas de computadores eran lentos, tendenciosos y originaban muchos errores. En los primeros tiempos, un programador podía escribir el algoritmo deseado como una serie de ecuaciones algebraicas y el compilador FORTRAN podía convertir las declaraciones en lenguaje de máquina que el computador podía reconocer y ejecutar. El lenguaje FORTRAN original era muy pequeño en comparación con las versiones modernas. Contenía apenas un número limitado de declaraciones tipo, y sólo se podía trabajar con el tipo “integer” (entero) y “real” (real), y tampoco había subrutinas. Cuando se comenzó a usar este programa, se verificó la existencia de diversos errores, por lo que la IBM lanzó el FORTRAN II en 1958. El desarrollo continuó en 1962, con el lanzamiento del FORTRAN IV. Éste tenía muchas mejoras y por eso se convirtió en la versión más utilizada en los quince años siguientes. En 1977 el lenguaje recibe otra actualización muy importante, incluyendo muchas nuevas características que permitían escribir y guardar más fácilmente programas estructurados. El FORTRAN 77 introducía nuevas estructuras, como el bloque IF, y fue la primera versión del lenguaje en que las variables “character” (caracteres) eran realmente fáciles de manipular. Este lenguaje se volvió un poco limitado en términos de estructuras de información y también por sólo permitir la codificación de algunas figuras de programación estructurada. La siguiente mejora fue más importante y dio origen al FORTRAN 90. Éste incluía todo el FORTRAN 77 como base pero con cambios significativos, fundamentalmente en las operaciones sobre tablas (array) pero también sobre: una configuración en parámetros de las funciones intrínsecas, permitiendo así utilizar una secuencia de caracteres muy grande, como también usar más de dos tipos de precisión para variables del tipo Real y Complex; se perfeccionó la computación numérica con la inclusión de un conjunto de funciones numéricas, y mediante el desenvolvimiento de un conjunto de funciones y subrutinas que permiten acceder con mayor facilidad a bibliotecas de programas, función auxiliar en la definición de datos globales; se mejoró la capacidad de escribir procedimientos internos y recursivos, como también llamar los procedimientos a través de argumentos, siendo éstos opcionales u obligatorios; y se añadió una implementación del concepto de apuntadores. En conjunto, los nuevos aspectos contenidos en FORTRAN 90 hacen que éste sea considerado como el lenguaje más eficiente de la nueva generación de supercomputadores, y aseguran que el FORTRAN continuará siendo usado con éxito por mucho tiempo. FORTRAN 90 fue seguido de una pequeña mejora llamada FORTRAN 95, en 1997. Éste ofrece nuevas características del lenguaje, y clarifica algunas de las ambigüedades de la antigua versión. Así pues, el FORTRAN de hoy revela unas superioridades en relación con sus competidores que marcan la diferencia, fundamentalmente en las aplicaciones de ingeniería y científicas.

12.4. PASCAL El lenguaje de programación Pascal fue desarrollado originalmente por Niklaus Wirth, un miembro de la International Federation of Information Processing (IFIP). El Profesor Niklaus Wirth desarrolló Pascal para proporcionar rasgos que estaban faltando en otros idiomas en aquel entonces. 6-26


Los principales objetivos para Pascal eran ser eficiente para llevarse a cabo y poder ejecutarse los programas, permitir el desarrollo de estructuras y también organizar programas, y para servir como un vehículo para la enseñanza de los conceptos importantes de programación de la computadora. Pascal, que se nombró así gracias al matemático Blaise Pascal, es un descendiente directo de ALGOL 60, qué ayudó a su desarrollo. Pascal también tomó componentes de ALGOL 68 y ALGOL-W. El original idioma de Pascal aparecido en 1971 tuvo su última revisión publicada en 1973. Fue diseñado para enseñar las técnicas de programación y otros temas a los estudiantes de la universidad y era el idioma de opción de los años 60 a los 80.

12.5. BASIC BASIC es la abreviación de Beginners All Purpose Symbolic Instruction Code, sistema desarrollado en la Universidad de Dartmouth en 1964 bajo la dirección de J. Kemeny y T. Kurtz. Se llevó a cabo para los G.E.225. Esto significa ser un idioma muy simple para aprender y también que sería fácil de traducir. Además, los diseñadores desearon que fuera una piedra en la cual caminar para que los estudiantes aprendieran más adelante los idiomas más poderosos como FORTRAN o ALGOL. Bill Gates y Paul Allen tenían algo diferente en mente. En los 70 cuando la computadora personal Altair de M.I.T.S fue concebida, Allen convenció a Gates a ayudarle a desarrollar un Idioma Básico para él. El futuro de BASIC y la PC empezó. Gates estaba asistiendo a Harvard en ese momento y Allen era un empleado de Honeywell. Allen y Gates adoptaron su BASIC a M.I.T.S. para su Altair. Esta versión tomó un total de 4K de memoria incluido el código y los datos que se usaron para el código fuente. Gates y Allen pusieron a funcionar BASIC en otras plataformas y se mudaron a su lugar de origen en Seattle en donde ellos habían asistido a la escuela primaria juntos. En este momento la Corporación de Microsoft empezó su reinado en el mundo del PC. Más tarde en los 70, BASIC se había puesto ya en las plataformas como la Apple, Comodor y Atari y ahora era tiempo para el DOS de Bill Gates, que vino con un intérprete de BASIC. La versión distribuida con MS-DOS era GW-BASIC y se ajustaba en cualquier máquina que podía ejecutar DOS. No había ninguna diferencia entre BASIC-A y GW-BASIC, el A proporcionado por las computadoras de IBM.

12.6. C El lenguaje C reúne características de programación intermedia entre los lenguajes ensambladores y los lenguajes de alto nivel; con gran poderío basa6-27


do en sus operaciones a nivel de bits (propias de ensambladores) y la mayoría de los elementos de la programación estructurada de los lenguajes de alto nivel, por lo que resulta ser el lenguaje preferido para el desarrollo de software de sistemas y aplicaciones profesionales de la programación de computadoras. En 1970, Ken Thompson de los laboratorios Bell se había propuesto desarrollar un compilador para el lenguaje Fortran que corría en la primera versión del sistema operativo UNIX tomando como referencia el lenguaje BCPL; el resultado fue el lenguaje B (orientado a palabras) que resultó adecuado para la programación de software de sistemas. Este lenguaje tuvo la desventaja de producir programas relativamente lentos. En 1971 Dennis Ritchie, con base en el lenguaje B, desarrolló NB que luego cambio su nombre por C; en un principio sirvió para mejorar el sistema UNIX por lo que se le considera su lenguaje nativo. Su diseño incluyo una sintaxis simplificada, la aritmética de direcciones de memoria (permite al programador manipular “bits”, “bytes” y direcciones de memoria) y el concepto de apuntador; además, al ser diseñado para mejorar el “software” de sistemas, se buscó que generase códigos eficientes y una portabilidad total, es decir el que pudiese ejecutarse en cualquier máquina. Logrados los objetivos anteriores, C se convirtió en el lenguaje preferido de los programadores profesionales. En 1980 Bjarne Stroustrup de los laboratorios Bell de Murray Hill, New Jersey, inspirado en el lenguaje Simula67 adiciona las características de la programación orientada a objetos (incluyendo la ventaja de una biblioteca de funciones orientada a objetos) y lo denomina C con clases. Para 1983 dicha denominación cambió a la de C++. Con este nuevo enfoque surge la nueva metodología que aumenta las posibilidades de la programación bajo nuevos conceptos.

13. Otros lenguajes de programación Cualquier notación para describir algoritmos y estructuras de datos se puede calificar como un lenguaje de programación, pero principalmente este término se refiere a los implementados para computadoras. Se han diseñado he implementado cientos de lenguajes de programación distintos, y actualmente todos ellos además cuentan con entornos gráficos. Existen otros conceptos tomados en cuenta para agrupar los lenguajes, que dan origen a diversas clasificaciones, entre los que destacan las siguientes: —

6-28

Lenguajes de cuarta generación 4GL: estos lenguajes se distinguen por formar parte de un entorno de desarrollo, que comprende el manejador de una base de datos, y todo lo que de esto se deriva, como la administración de un diccionario de datos, el control de accesos, el manejo de la consistencia de la información y otras características enfocadas a facilitar los programas de acceso y explotación de la información. Como ejemplos podemos citar a los 4 grandes: PROGRESS, SYSBASE, INFORMIX, y ORACLE.


—

Lenguajes Visuales: se les llama de esta manera a los lenguajes que forman parte de una aplicación dotada de una Interfase gráfica, la cual por medio de iconos y otras herramientas visuales y simbólicas, pretenden facilitar las tareas rutinarias de los programadores, como son el diseño y desarrollo de formularios e informes. Los ejemplos más comerciales de estos lenguajes son: VISUAL BASIC, VISUAL CAFE, VISUAL FOX, etc.

—

Metalenguajes: son lenguajes como XML, SGML y HTML que sirven para definir otros lenguajes, cuyo objetivo es llevar a cabo la estructuración de textos mediante un conjunto de etiquetas, de manera tal, que puedan ser entendidos por los humanos y también procesado por los ordenadores. Estos lenguajes están teniendo un gran auge sobre la plataforma de Internet, en la cual son usados para la creación de documentos, y el intercambio o transferencia de información.

—

Lenguajes de propósito específico: son aquellos lenguajes desarrollados con la finalidad de resolver problemas de una naturaleza muy determinada, tal como SPSS para problemas estadísticos, MATLAB para cálculos científicos y de ingeniería, CAD/CAM para el diseño de piezas y programación de máquinas de control numérico, como tornos y fresadoras, GPSS para simulación de sistemas, CORBA para el manejo de interfaces en ambientes cliente-servidor, etc.

—

Lenguajes Script: son lenguajes como JAVASCRIPT, VBSCRIPT, PERLSCRIPT, que se utilizan en ambientes clientes servidor, mediante la incrustación de código en las páginas HTML, y así permitir la programación del lado del cliente, buscando fundamentalmente, hacer más atractivos las interfaces gráficos de las páginas.

—

Lenguajes vinculados a Internet.

14. Características, elementos y funciones de JAVA, C y C++ A pesar de la evolución de los lenguajes de programación y su éxito de cada uno ellos, hay mucho que avanzar todavía. Pero para comprender mejor esto último, analicemos las características más esenciales de un buen lenguaje de programación: 1.

Una forma clara, sencilla y exacta de la sintaxis para que el programador pueda expresar sus ideas de sus algoritmos (integridad conceptual), haciendo mas fácil su comprensión del mismo para posibles mejorías o modificaciones.

2.

Tener menos restricciones en la forma de codificación de los valores y en la colocación de los mismos (ortogonalidad).

3.

Tener la facilidad de que al codificar nuestro algoritmo, podamos ver la parte esencial del mismo en nuestro programa, es decir, al tener codificado nuestro programa, podamos ver en el nuestro algoritmo en una forma sencilla para poder hacer modificaciones futuras (Naturalidad de la aplicación), pero también viendo como va quedando la estructura de nuestros datos. 6-29


4.

Apoyo para la abstracción, es decir, permitir al usuario una fácil creación de sus estructuras de sus datos en forma breve y sencilla, sin caer en redundancias.

5.

Un gran problema para los lenguajes de programación es la facilidad de verificar los programas, pero sobre todo la confiabilidad de que cuando se hace un programa, el lenguaje verifique todos los posibles errores de semántica y a su vez que sus datos de salida o en casos de entrada sean reales y confiables.

6.

Otro punto es el entorno de programación. Sin una interfaz, una ayuda o herramientas para la programación, el lenguaje sería inútil, aburrido y desesperante para el programador.

7.

Un factor importante en la creación de los programas es la portabilidad de los mismos hacia otros sistemas. Para ello el lenguaje de programación debe permitirlo por medio de no basarse en una sola arquitectura de computadora en la ejecución de los programas, tal es el caso de C, FORTRAN, Ada y Pascal que manejan la implementación de los programas hacía otros sistemas.

8.

El costo según su uso. El costo de tiempo en la ejecución, de traducción, de creación, prueba y uso y coste de mantenimiento de los programas.

Otras características de los lenguajes de programación son los entornos de diseño. Éstos pueden ser: —

Entorno de procesamiento por lotes. Las instrucciones se ejecutan por secciones o estructuras o lotes.

—

Entorno interactivo. Posibilidad de uso de los periféricos.

—

Entornos incrustados. Son aquellos lenguajes grandes que tienen la posibilidad de llamar a otros más pequeños.

—

Entornos de programación.

—

Entornos de marcos de ambiente. Posibilidad de interactuar con la red.

Un punto importante en todas estas características es que se debe tener un estándar para evitar caer en incompatibilidades de equipo, ya que como sabemos existen cientos de marcas diferentes en equipos de cómputo y sus distintos accesorios.

14.1. Introducción histórica: C, C++ y JAVA En la década de los setenta Ken Thompson creó un lenguaje de programación denominado B que no tubo repercusiones espectaculares pero que sirvió de base para que Dennos Ritchie en esta misma década crease el lenguaje C que a finales de los setenta y durante los ochenta el fue el lenguaje de programación más utilizado por los programadores. Su invención de desarrollo usando UNIX 6-30


como sistema operativo. En 1983 se estableció un comité para crear el estándar ANSI que definiera el lenguaje C. Al cabo de seis años, 1989, este estándar fue adoptado comenzando su implementación en 1990. En este mismo año este estándar también fue adoptado por la ISO. En 1995 se adoptó la Enmienda 1 del estándar C. En 1989 se creó un nuevo estándar que, junto con la Enmienda 1, se convirtió en el documento base del estándar C++. A partir de este momento C quedó como relegado a un segundo plano, pero en un segundo plano totalmente operativo. De hecho, en 1999, se creó un nuevo estándar y en la actualidad sigue siendo un lenguaje de programación en pleno vigor (a este estándar se le suele denominar C99). Es, por tanto, la creciente complejidad de los sistemas lo que ha conducido a la necesidad de cambiar de C a C++. C++ fue inventado por Bjarne Stroustrup en 1979 en los Laboratorios Bell. La nueva forma de pensar (programación orientada a objetos) hizo que fuese una auténtica revolución en el mundo de los lenguajes de programación. C++ es una extensión de C en la que se añaden las características orientadas a objetos. C++ fue estandarizado en 1997 cumpliendo los estándares ANSI/ISO. C++ fue el lenguaje dominante a finales de los ochenta y principios de los noventa. No obstante, y aunque C++ combinaba de forma perfecta la programación orientada a objetos con un lenguaje ten completo como C, llegó un Internet y se hizo necesario adaptar este lenguaje a los nuevos mundos. Así fue como en 1995 vio la luz JAVA, aunque ya en 1991 fue desarrollado y comenzó a ser utilizado. Fue desarrollado durante año y medio por cinco programadores expertos que crearon este lenguaje de programación cuya sintaxis básica esta basada en C y que implementa la orientación a objetos de C++. El dominio de JAVA como lenguaje de programación orientado a objetos se ha extendido hasta nuestra época. Su utilidad tanto para aplicaciones independientes de la plataforma como para subprogramas ejecutables dentro de una pagina Web (applets) y muchas características más que veremos a continuación le han hecho digno de todo elogio.

14.2. El lenguaje C EL lenguaje C es el resultado de un proceso de desarrollo que inició con un lenguaje denominado BCPL. Éste influenció a otro llamado B (inventado por Ken Thompson). En los años 70, este lenguaje llevó a la aparición del C. Con la popularidad de las microcomputadoras muchas compañías comenzaron a implementar su propio C por lo cual surgieron discrepancias entre sí. Por esta razón ANSI estableció un comité en 1983 para crear una definición no ambigüa del lenguaje C e independiente de la máquina que pudiera utilizarse en todos los tipos de C. Algunos de las C existentes son: —

Quick C

—

C++

—

Turbo C 6-31


—

Turbo C ++

—

Borland C

—

Borland C++

—

Microsoft C

Cuando se habla del lenguaje C se ha de tener en cuanta las dos grandes estandarizaciones existentes en su larga historia: por un lado tenemos C89 y C99. Para hacernos una idea de las diferencias, C89 contiene 32 palabras clave, C99 incluye cinco más. Hoy en día la mayoría de los compiladores se basan en esta segunda estandarización. El lenguaje C se engloba dentro de los lenguajes de nivel medio. Como lenguaje de nivel medio, C permite la manipulación de “bits”, “bytes” y direcciones que son los elementos básicos con los cuales funciona la computadora. El lenguaje C es muy portable, en el sentido de que funciona en distintos sistemas o diferentes tipos de computadoras; para que nos hagamos una idea: Windows en todas sus versiones, DOS, Linux, etc. C no lleva a cabo una comprobación de errores en tiempo de ejecución. Es el programador el único responsable de llevar a cabo estas comprobaciones. Dado que con C podemos manipular “bits”, “bytes” y direcciones, se hace ideal para la programación de sistemas. De hecho el sistema Linux nació con el intento logrado de reescribir el código de UNIX en C. C es un lenguaje estructurado pero no estructurado en bloques ya que no permite por ejemplo la creación de funciones dentro de funciones. Al ser por tanto un lenguaje estructurado su sintaxis es la que sirve de base para C++ y JAVA y será la que veamos en un apartado posterior en este mismo tema. El componente principal de C es la función que se define como una subrutina independiente. Cada una de estas funciones está formada por bloques en los que se desarrolla toda la actividad del programa. Cada bloque queda delimitado por “{“ y “}”. A estos bloques se les conoce como bloques de código que son un grupo de instrucciones de un programa conectados de forma lógica y que es tratado como una unidad. En un primer momento C fue usado sólo para la programación de sistemas. Definimos un programa de sistemas como una parte del sistema operativo del ordenador o de sus utilidades de soporte, tales como editores, los compiladores, los enlazadores y similares. No obstante y debido al gran éxito que tuvo desde un primer momento empezó a ser utilizado por los programadores para crear sus propios programas. El lenguaje C tiene una lista de palabras clave que el programador usa constantemente y que tienen un objetivo definido se enumeran en la tabla adjunta. Cada una de estas palabras clave no pueden ser utilizadas para otro fin diferente al que tienen asignado. En C, a pesar de no ser un lenguaje fuertemente tipado como ocurre con C++ y JAVA, sí que se diferencia entre mayúsculas y minúsculas.

6-32


Como hemos visto, en C un programa consiste en una o más funciones; no obstante siempre ha de haber una que sea invocada cuando se ejecuta el programa, es decir que sea la primera que se ejecute y que llame a las demás (una función principal), a esta función se le ha de denominar main(). Main no es una palabra reservada pero no puede usarse para otras cosas (trataremos main como si fuese una palabra reservada aunque no lo sea). La mayoría de los programas C incluyen llamadas a varias funciones contenidas en la biblioteca estándar de C. Todos los compiladores actuales de C incorporan esta biblioteca estándar en la cual se incluyen funciones que realizan las tareas más habituales (raíces, impresiones, lectura de ficheros, etc.). Independientemente de esta biblioteca estándar existen muchas otras las cuales podemos utilizar o incluso crear nuestra propia biblioteca de funciones. Para poder fusionar el código del programa con el código de las funciones existentes en las bibliotecas los compiladores incluyen enlazadores, a cuyo proceso se le denomina “enlace”. En C un programa se puede escribir en varios archivos y compilar cada uno de ellos por separado. De este modo la recompilacion se puede efectuar en aquel archivo que da el problema o en el cual queramos realizar alguna modificación sin tener que recompilar todo el programa. El código objeto completo lo forman todos los archivos del programa compilados y las rutinas de las bibliotecas utilizadas. Por tanto los pasos a seguir en la creación de un programa C son: —

Creación del programa.

—

Compilación del programa.

—

Enlace del programa con todas las funciones que se necesiten de la biblioteca.

14.2.1. Elementos generales de un programa en C Aunque cada uno de los programas son distintos, todos tienen características comunes. Los elementos de un programa en C son los siguientes: Comentarios

Inclusión de archivos main() { variables locales flujo de sentencias } Definición de funciones creadas por el programador utilizadas en main()

6-33


Veamos en qué consiste cada uno: —

Comentarios: se identifican porque van entre diagonales y asterisco. Nos sirve para escribir información que nos referencie al programa pero que no forme parte de él. Por ejemplo, especificar qué hace el programa, quién lo elaboró, en qué fecha, qué versión es, etc.

—

Inclusión de archivos: consiste en mandar llamar a la o las bibliotecas donde se encuentran definidas las funciones de C (instrucciones) que estamos utilizando en el programa. En realidad, la inclusión de archivos no forma parte de la estructura propia de un programa sino que pertenece al desarrollo integrado de C. Se incluye aquí para que el alumno no olvide que debe mandar llamar a los archivos donde se encuentran definidas las funciones estándar que va a utilizar.

—

main(): en C todo está constituido a base de funciones. El programa principal no es la excepción. main() indica el comienzo de la función principal del programa, la cual se delimita con llaves.

—

Variables locales: antes de realizar alguna operación en el programa, se deben declarar la(s) variable(s) que se utilizarán en el programa.

—

Flujo de sentencias: es la declaración de todas las instrucciones que conforman el programa.

—

Definición de funciones creadas por el programador utilizadas en main(): finalmente, se procede a definir el contenido de las funciones utilizadas dentro de main(). Éstas contienen los mismos elementos que la función principal.

Un programa en C consta de tres secciones. La primera sección es donde van todos los “headers”. Estos “headers” son comúnmente los “#define” y los “#include”. Como segunda sección se tienen las “funciones”. Al igual que Pascal, en C todas las funciones que se van a ocupar en el programa deben ir antes que la función principal (main()). Declarando las funciones a ocupar al principio del programa, se logra que la función principal esté antes que el resto de las funciones. Ahora, solo se habla de funciones ya que en C no existen los procedimientos. Y como última sección se tiene a la función principal, llamada main. Cuando se ejecuta el programa, lo primero que se ejecuta es esta función, y de ahí sigue el resto del programa. Los símbolos { y } indican “begin” y “end” respectivamente. Si en una función o en un ciclo while, por ejemplo, su contenido es de solamente una línea, no es necesario usar “llaves” ({ }), en caso contrario es obligación usarlos. Ejemplo de un programa en C

/*Programa que imprime un saludo en pantalla*/ #include tomates () {

6-34


printf("Dedicado a Ismael”); } void main() { tomates(); } /* Fin programa */ Los primeros lenguajes ensambladores ofrecen una forma de trabajar directamente con un conjunto de instrucciones incorporadas en la computadora. Cada una de estas especificaciones se ha de especificar en términos de máquina (bits de los registros). Dado que esto se hacía muy pesado para el programador, surgieron los primeros lenguajes de alto nivel, como Fortran, que en un principio se desarrollaron como alternativa a los lenguajes ensambladores. En un principio estos lenguajes fueron usados para resolver problemas de matemáticas, ingeniería o científicos (lenguajes orientados al problema). Algunos desarrolladores de software quisieron desarrollar lenguajes para su área y crearon los lenguajes orientados a la máquina (B y C). El lenguaje C está ligado a la computadora y nos ofrece un importante control sobre los detalles de la implementación de una aplicación; ésta es la razón por la cual se le considera a la vez un lenguaje de bajo y de alto nivel (lenguaje de nivel medio). Entre las muchas ventajas que posee el lenguaje C citaremos: —

Tamaño óptimo de código. Dado que tiene pocas reglas de sintaxis.

—

Conjunto de palabras clave. Palabras reservadas que usa el lenguaje.

—

Ejecutables rápidos. Muchos programas C se ejecutan con una velocidad equivalente al lenguaje ensamblador.

—

Comprobación de tipos limitada. Se permite visualizar datos de distintas maneras.

—

Implementación de diseño descendente. El denominado diseño Top-Down gracias a la implementación de sentencias de control.

—

Estructura modular. Compilación y enlazado por separado.

—

Interfaz transparente para el lenguaje ensamblador. Se puede llamar a las rutinas del lenguaje ensamblador desde un compilador C.

—

Manipulación de bits. C permite manipular bits y bytes

—

Tipos de datos puntero. C permite manipular direcciones.

—

Estructuras extensibles. Los arrays son unidimensionales.

—

Memoria eficiente. Los programas C tienden a ser muy eficientes en memoria. 6-35


—

Portabilidad entre plataformas. Un programa C se puede ejecutar en una computadora u otra con un sistema operativo u otro.

—

Rutinas de biblioteca. Hay una gran cantidad de bibliotecas con funciones precreadas.

(Para más información sobre el Lenguaje C, consulte el Anexo II de este mismo tema).

14.3. El lenguaje C++ C++ es un subconjunto de C que mantiene todas las características de C y su flexibilidad para el trabajo en el tratamiento de la interfaz hardware/software, su programación del sistema a bajo nivel, sus expresiones, etc., pero todo ello dentro de la programación orientada a objetos. Este lenguaje combina las construcciones del lenguaje procedimental estándar y el modelo orientado a objetos. Se trata pues de una nueva forma de pensar. C++ se desarrolló originariamente para resolver simulaciones conducidas por sucesos. Fue utilizado en 1983 y aún en 1987 se encontraba en fase de evolución. En su evolución siempre se ha procurado preservar la integridad de los programas escritos en otros lenguajes al intentar exportarlos a C++. Diferencias entre C y C++:

6-36

—

Trabajo con clases. Frente al trabajo con estructuras definido en C.

—

Constructores de clases y encapsulación de datos.

—

La clase struct. Esta clase puede contener tanto dado como funciones.

—

Constructores y destructores. Se usan para garantizar la inicialización y destrucción de los datos.

—

Mensajes. Los objetos se manipulan enviándoles mensajes.

—

Funciones afines. Se permite acceder a los métodos y datos de una clase privada.

—

Sobrecarga de operadores. Se puede hacer sobrecarga de operadores por número de argumentos o por su tipo.

—

Clases derivadas. Una subclase de una clase específica.

—

Polimorfismo. El objeto determina qué clase o subclase recibe un mensaje.


—

Biblioteca de flujos. Permitiendo que las operaciones de entrada y salida de datos desde un terminal o un archivo sean más accesibles.

Existen otras diferencias menos notorias como: —

Su sintaxis en algunos aspectos puntuales como son los comentarios y variables enumeradas

—

Conversiones de tipo explícitas.

—

Sobrecarga de funciones.

—

Argumentos por referencia.

—

Punteros de tipo void.

—

Funciones inline.

—

Etc.

Ejemplo de programa en C++:

/* Comentario creado para los estudiantes del TAImucha suerte a todos */ # include int main() { printf(“ C++ es guay”); return (0); } Este código fuente ha de ser guardado con extensión “*.c”, luego será compilado para poder ejecutarlo. Existen entornos gráficos para el desarrollo de programas en C y en C++ que incluyen los compiladores correspondientes y facilitan visualmente la labor del programador. En la imagen vemos el Visual C++ de Microsoft que permite escribir programas C o C++.

6-37


(Para más información sobre el Lenguaje C++, consulte el Anexo III de este mismo tema).

14.4. El lenguaje JAVA JAVA es un lenguaje de programación desarrollado por un grupo de ingenieros de Sun Microsystems (1991); en principio está destinado a electrodomésticos, está basado en C++ y se diseñó para ser un lenguaje sencillo con códigos de tamaño muy reducido. Posteriormente (1995) se comienza a utilizar como lenguaje para computadores; Netscape Navigator incorpora un intérprete JAVA en su versión 2.0 siendo la base para JAVAScript. El rápido crecimiento de Internet y el uso de JAVA para dar dinamismo a las páginas de HTML, lo convierten en un medio popular de crear aplicaciones para Internet. Si bien su uso se destaca en el Web, y sirve para crear todo tipo de aplicaciones (locales, Intranet o Internet). En la actualidad es un lenguaje muy completo (la versión JAVA 1.0 tenía 12 paquetes (packages), JAVA 1.1 tenía 23 y JAVA 1.2 o JAVA 2 tiene 59). El haber sido diseñado en una época muy reciente y por un único equipo le confieren unas características que facilitan su aprendizaje y utilización a los usuarios; JAVA incorpora muchos aspectos que en cualquier otro lenguaje son extensiones propiedad de empresas de software o fabricantes de ordenadores (threads, ejecución remota, componentes, seguridad, acceso a bases de datos, etc.). La importancia de JAVA es su utilización como nexo de unión de los usuarios con la información, ya sea en el ordenador local, en un servidor de Web, en una base de datos o en cualquier otro lugar. JAVA es un lenguaje potente que resuelve los problemas que se plantean al acceder a una base de datos, en la programación de redes, la distribuida, etc.; tiene muchas posibilidades de utilización como aplicación independiente (Standalone Application), programación a través de los applets. Ejecución como servlet, etc. Un applet es un programa que corre bajo un navegador o browser (por ejemplo Netscape Navigator o Internet Explorer) y es descargado como parte de una 6-38


página HTML desde un servidor Web. El Applet se descarga desde el servidor y no requiere instalación en el ordenador donde se encuentra el “browser”. Un servlet es una aplicación sin interface gráfica que se ejecuta en un servidor de Internet. Es un lenguaje orientado a objetos, ha sido concebido como un lenguaje de programación orientado a objetos, a diferencia de otros lenguajes como C++ que son lenguajes modificados para poder trabajar con objetos.

14.4.1. ¿Qué entendemos por objeto? Podemos decir que todo puede verse como un objeto. Un objeto es una pieza de software que cumple con ciertas características: —

Encapsulamiento: el objeto es autocontenido, es la integración sus datos (atributos) y los procedimientos (métodos) que actúan sobre él. Al utilizar la programaci6n orientada a objetos, se definen clases (objetos genéricos) y la forma en que interactúan entre ellos, a través de mensajes. Dado que los programas no modifican al objeto, éste se mantiene independiente del resto de la aplicación; si necesitamos modificar un objeto lo hacemos sin tocar el resto de la aplicación.

—

Herencia: se pueden crear nuevas clases que comparten características (atributos) y comportamientos (métodos) de otras ya preexistentes, relacionadas por una relación jerárquica, simplificando la programación.

JAVA es independiente de la plataforma, puede hacerse funcionar con cualquier ordenador. Al compilar un programa JAVA, lo que se genera es un seudo-código definido por Sun, para una máquina genérica; el “software” de ejecución lava interpreta las instrucciones, emulando a dicha máquina. Por supuesto esto no es muy eficiente, por lo que tanto Netscape como Hot JAVA o Explorer, al ejecutar el código por primera vez, lo van compilando (mediante un JIT: Just In Time compiler), de modo que al crear por ejemplo la segunda instancia de un objeto el código ya está compilado específicamente para la máquina huésped.

14.4.2. Compilador de Java, JAVA Virtual Machine Existen distintos programas comerciales que permiten desarrollar código JAVA. Sun distribuye gratuitamente el JDK (JAVADevelopment Kit); el JDK es un conjunto de programas y librerías que permiten desarrollar, compilar y ejecutar programas en JAVA. El Compilador de JAVA realiza un análisis de sintaxis del código escrito en los ficheros fuente de JAVA (con extensión *.java). Si no encuentra errores en el código genera los ficheros compilados (con extensión *.class). En otro caso muestra la línea o líneas erróneas. Incorpora además la posibilidad de ejecutar parcialmente el programa, deteniendo la ejecución en el punto deseado y estudiando en cada momento el valor de cada una de las variables. Los IDEs (Integrated Development Environment-Entornos de Desarrollo Integrados), tal y como su nombre indica, son entornos de desarrollo inte6-39


grados. En un mismo programa es posible escribir el código JAVA, compilarlo y ejecutarlo sin tener que cambiar de aplicación. Estos entornos integrados permiten desarrollar las aplicaciones de forma mucho más rápida, incorporando en muchos casos librerías con componentes ya desarrollados, los cuales se incorporan al proyecto o programa. Como inconvenientes se pueden señalar algunos fallos de compatibilidad entre plataformas, y ficheros resultantes de mayor tamaño que los basados en clases estándar. La existencia de distintos tipos de procesadores y ordenadores resalta la importancia de contar con un software que no dependa del tipo de procesador utilizado. Esto llevo al los ingenieros de Sun a desarrollar un código capaz de ejecutarse en cualquier tipo de máquina. Al ser compilado el código fuente no necesita ninguna modificación al cambiar de procesador o al ejecutarlo en otra máquina; esto se debe a que se ha desarrollado un código “neutro” el cual estuviera preparado para ser ejecutado sobre una “máquina hipotética o virtual”, denominada JAVA Virtual Machine). La JVM interpreta el código neutro y lo convierte en el código particular de la CPU utilizada, evitando tener que realizar un programa diferente para cada CPU o plataforma. Nota. JDK, por tanto, es necesario si queremos crear applets o aplicaciones en lenguaje JAVA y JVM es necesario si queremos visualizarlos. JDK, no obstante, es un Kit de desarrollo que lleva integrado JVM.

14.4.3. Estructura de un programa JAVA La estructura de un programa realizado en cualquier lenguaje orientado a objetos (Object Oriented Programming) (OOP-POO), y en particular en el lenguaje JAVA es una clase. En JAVA todo forma parte de una clase, es una clase o describe cómo funciona una clase. El conocimiento de las clases es fundamental para poder entender los programas Java. Todas las acciones de los programas JAVA se colocan dentro del bloque de una clase o un objeto. Todos los métodos se definen dentro del bloque de la clase, JAVA no soporta funciones o variables globales. En todo programa nos encontramos con una clase que contiene el programa principal y algunas clases de usuario (las específicas de la aplicación que se está desarrollando) que son utilizadas por el programa principal. Los ficheros fuente tienen la extensión *.java, mientras que los ficheros compilados tienen la extensión *.class. Un fichero fuente (*.java) puede contener más de una clase, pero sólo una puede ser publico El nombre del fichero fuente debe coincidir con el de la clase public (con la extensión *.java). Si, por ejemplo, en un fichero aparece la declaración (public class MiClase {...}) entonces el nombre del fichero deberá ser MiClase.java. Es importante que coincidan mayúsculas y minúsculas ya que MiClase.JAVAy miclase.JAVAserían clases diferentes para lava. Si la clase no es public, no es necesario que su nombre coincida con el del fichero. Una clase puede ser public o package (default), pero no private o protected.

6-40


De ordinario una aplicación está constituida por varios ficheros *.class. Cada clase realiza unas funciones particulares, permitiendo construir las aplicaciones con gran modularidad e independencia entre clases. Las clases de lava se agrupan en packages, que son librerías de clases. Si las clases no se definen como pertenecientes a un package, se utiliza un package por defecto (default) que es el directorio activo. Es necesario entender y dominar la sintaxis utilizada en la programación; observemos nuestro primer programa en lava y un breve comentario de las partes que lo componen, para posteriormente pasar a estudiar la nomenclatura empleada y los elementos que empleamos para desarrollar nuestro lenguaje:

/* lolo.JAVA Escribe en pantalla "¡Dedicado a Maria Luz!" */ class lolo { public static void main(String args [ ]) { System.out.println(" ¡Dedicado a Maria Luz!") ; } } Con JAVA se pueden crear dos tipos de programas: aplicaciones y applets. Una aplicación es un programa que se ejecuta en una computadora utilizando el sistema operativo de esa computadora. Se trata pues de un programa normal como podría haber sido en C o C++ pero en el lenguaje JAVA. En este aspecto la funcionalidad de JAVA no es diferente a la de cualquier otro lenguaje orientado a objetos. Una Applet es una aplicación diseñada para ser transmitida por Internet y ejecutada en un navegador Web compatible con JAVA. Un applet es realmente un pequeño programa que se transfiere dinámicamente a través de la red, como si fuese una imagen, un archivo de sonido o de vídeo. La diferencia principal es que una Applet es un programa que puede reaccionar ante las acciones del usuario y cambiar dinámicamente. Vamos a detallar algunos de los aspectos (cualidades) que han hecho de JAVA uno de los lenguajes más populares: • Simple JAVA es un lenguaje relativamente fácil de aprender una vez que se comprenden los conceptos básicos de la programación orientada a objetos que veremos en el tema correspondiente. Además, para la realización de una determinada acción existen siempre varios caminos por los cuales podamos programar.

6-41


• Seguro Esta cualidad hace que los applets sean ideales para la transmisión por Internet sin violar la vulnerabilidad de los sistemas. • Portable El código ejecutable generado por JAVA es adaptable a cualquier tipo de plataforma con cualquier tipo de Sistema Operativo. • Orientado a objetos JAVA junto con C++ es el máximo exponente de la programación Orientada a Objetos. Esta cualidad le brinda de todas las ventajas de esta programación. • Robusto Ya que JAVA se ejecuta en multitud de plataformas, esta cualidad le permite satisfacer con éxito su deber en todas ellas. • Multihilo JAVA permite que se ejecuten varios hilos al mismo tiempo (cada hilo representa una tarea a desarrollar). Esta cualidad es la que le ha hecho ideal para trabajo en redes. Además permite la sincronización de cada una de esas tareas y su comunicación. • Arquitectura neutral Esta cualidad le permite que un programa JAVA se pueda ejecutar en un Sistema Operativo actual y en las actualizaciones que puedan surgir de ese sistema operativo. Lo único que necesitamos es la JVM (Máquina Virtual de JAVA). • Interpretado Una vez compilado un programa éste se convierte en código binario que es interpretado por un intérprete de Java. Este intérprete debe ser optimizado para que la conversión al código máquina sea de buen rendimiento. • Distribuido A través del protocolo TCP/IP podemos distribuir programas JAVA en Internet. JAVA dispone además de RMI (Invocación de Método Remoto) que permite ejecutar procedimientos de forma remota. Otra característica es la programación cliente/servidor.

6-42


Existen entornos gráficos para el desarrollo de programas en JAVA que incluyen los compiladores correspondientes y facilitan visualmente la labor del programador. (Para más información sobre el Lenguaje JAVA, consulte el Anexo I de este mismo tema).

15. Entornos de programación visual El desarrollo de interfaz de tipo gráfico en los sistemas operativos impulsó el desarrollo de aplicaciones que utilizaran dicho entorno. A partir de 1990, con la proliferación de Windows, esto se hizo especialmente importante. Visual Basic surgió a principios de los años 90. Basado en el popular lenguaje Basic supuso una auténtica revolución en el mundo de la programación, entre otras cosas por su facilidad de uso y su entorno eminentemente gráfico. Las primeras versiones del lenguaje no eran excesivamente potentes, pero las últimas (5.0 y 6.0) incorporan todo tipo de herramientas y controles que permiten la construcción de aplicaciones de desarrollo en cualquier entorno. Todas estas herramientas ofrecen una gran facilidad en la construcción de aplicaciones. Están orientadas tanto a eventos como a objetos, y proporcionan la posibilidad de desarrollar aplicaciones para Windows sin necesidad de utilizar primitivos lenguajes para programar directamente la interfaz gráfica. Por el contrario, el código generado no está completamente optimizado y suele tener un tamaño superior al de otros programas, por lo que su velocidad de ejecución es más lenta que en entornos no gráficos.

15.1. Visual Basic Cuando se inicia Visual Basic aparece una ventana denominada IDE (Entorno Integrado de Desarrollo) a través de la cual desarrollaremos la aplicación. La ventana del IDE contiene las restantes ventanas del entorno de desarrollo. Dicha ventana usa un entorno MDI, es decir, permite mantener múltiples ventanas abiertas contenidas en una ventana principal. En un proyecto visual Basic tenemos tres formas principales de trabajar, diseño, ejecución e interrupción: —

En la fase de diseño se incorporan todos los controles, seleccionados a través del cuadro de herramientas, que van a formar parte de la aplicación. El objeto que va a contener todos los controles se denomina formulario. Una vez que se han incorporado los controles se pueden establecer sus propiedades de dos formas: mediante la ventana de propiedades del control o mediante código.

—

En la fase de ejecución se escriben las sentencias de código necesarias, utilizando la sintaxis del lenguaje, para realizar acciones, modificar propiedades de un objeto o invocar a sus métodos. 6-43


—

En la fase de interrupción se depuran los posibles errores que contenga el código.

En un proyecto puede haber más de un formulario. La combinación de formularios módulos de código, clases y otros recursos son parte integrante de un proyecto de visual basic. Normalmente los proyectos Visual Basic tienen extensión EXE. Clarifiquemos toda la exposición anterior observando el IDE de Visual Basic:

Visual Basic es un lenguaje estructurado aunque permite utilizar estructuras de tipo goto en ciertas rutinas, como las de tratamiento de errores. Otras características importantes del lenguaje VISUAL BASIC son: —

6-44

Contiene una biblioteca de clases que da soporte a los objetos Windows tales como: •

Ventanas.

•

Cuadros de texto.

•

Botones de pulsación.

•

Casillas de verificación.

•

Listas desplegables.

•

Listas combinadas.

•

Marcos.

•

Etiquetas.


—

—

Tiene un entorno de desarrollo integrado que incluye, entre otras: •

Editor de texto.

•

Interpret.

•

Depurador.

•

Examinador de objetos.

•

Explorador de proyectos.

•

Compilador.

Dispone de asistentes para: •

Aplicaciones.

•

Barras de herramientas.

•

Formularios de datos.

•

Empaquetado y distribución.

•

Crear la interfaz pública de controles ACTIVEX.

•

Objetos de datos.

•

Generador de clases.

•

Diseñador de complementos.

—

Galería de objetos vinculados e incrustados.

—

Creación de bibliotecas dinámicas.

—

Soporte para:

—

•

Aplicaciones de Internet.

•

Estandar com.

Acceso a base de datos utilizando: •

Controladores ODBC.

•

Motor de Access.

•

OLEDB.

•

Controles ADO y DATA. 6-45


—

Biblioteca para SQL que permite la manipulación de base de datos relacionales.

—

Un administrador visual de datos para manipular base de datos.

—

Utilidad para crear ficheros de ayuda estilo Windows.

Mediante la implementación de todas estas características mencionadas es posible realizar cualquier tipo de desarrollo utilizando Visual Basic. Con herramientas como el Dataenvironment todo el proceso de acceso a base de datos es de muy sencilla utilización, ya que, al crear una nueva conexión, aparece automáticamente un asistente para poder seleccionar el proveedor de acceso a los datos, su localización y otros parámetros dependientes del tipo de controlador. También, como se ha mencionado, es posible utilizar herramientas que generan código SQL. Como contrapunto a todas estas funciones, Visual Basic no ofrece demasiadas herramientas relacionadas con Internet. Dispone solamente de dos controles: WINSOCK e INET. Con el primero se pueden desarrollar servicios de comunicaciones tanto servidor como cliente, tomando como base los servicios. El segundo control facilita la comunicación entre servidores de tipo FTP y http, lo que es adecuado para crear clientes que necesiten transferencia de archivos y descargas de documentos en la WEB.

15.2. Otros entornos visuales Existen otros entornos de programación visual aparte de los ya mencionados. Otras herramientas RAD (herramientas de desarrollo rápido) son: —

Borland C++ Builder.

—

Power++.

—

Sybase Powerbuilder.

Borland C++ Builder usa prácticamente el mismo entorno que Delphi. Al igual que Delphi, está abierta a otras tecnologías. La mayor ventaja que ofrece es que el lenguaje utilizado para programar es C++, lenguaje muy potente y versátil. El entorno POWER++, de Sybase, dispone de un compilador muy optimizado y de un entorno de trabajo muy eficiente. También tiene capacidades para crear aplicaciones cliente/servidor y aplicaciones WEB, aunque su uso no está demasiado extendido en nuestro país. POWERBUILDER, también de Sybse, está relacionado estrechamente con el mundo de las bases de datos. Es un lenguaje de cuarta generación que, al igual que los demás, se apoya en el uso de objetos. Su gran ventaja es su capacidad MULTIPLATAFORMA.

6-46


Pero sin duda, las herramientas que más desarrollo han tenido dentro del mundo RAD han sido todas aquellas relacionadas con JAVA. Casi la totalidad de los entornos de desarrollo de JAVA son RAD y disponen de avanzados conjuntos de componentes y generadores de código. Mencionaremos algunas como: JBUILDER, IBM VISUALAGE FOR JAVA, SUN JAVAESTUDIO y MICROSOFT VISUAL J++.

16. .NET Framework 16.1. Introducción Tal como entendíamos los entornos de desarrollo hasta “ayer”, éstos permitían desarrollar aplicaciones para DOS, para Linux, para Windows, etc. Si queríamos desarrollar una aplicación con C++, debíamos ejecutar Visual C++; si queríamos desarrollar una aplicación ASP, podíamos ejecutar Microsoft InterDev; si queríamos desarrollar una aplicación en Visual Basic, debíamos desarrollar en el entorno de desarrollo de Visual Basic, etc. Sin embargo, .NET Framework ha modificado esta idea por completo, y otras empresas de creación de software de desarrollo tienden hacia esta idea.

16.2. ¿Un mismo entorno para todos los lenguajes? En realidad el cambio conceptual no es tan complicado de comprender. .NET Framework comparte la misma estructura general para todos los lenguajes de desarrollo. Imaginemos una mano. Tiene cinco dedos. Cada dedo se llama de manera diferente y tiene unas características particulares, uno es más largo, el otro más gordo, otro el más pequeño... sin embargo, todos comparten el mismo corazón, el mismo cerebro y el mismo brazo. Es un ejemplo un poco simple, pero tiene todo el sentido como se verá en las siguientes explicaciones. Así por ejemplo, y hablando de .NET Framework en concreto, dentro de un entorno de desarrollo o trabajando dentro del Marco de Trabajo.NET, podemos trabajar con diferentes lenguajes de desarrollo, es decir, podemos trabajar con JScript .NET, Visual Basic .NET, Visual C#, ASP .NET, etc. Cada lenguaje posee sus propias características que permiten al desarrollador trabajar con el que más conozca, el que más le guste o con el que se sienta más identificado o cómodo. Utilizando un mismo entorno de desarrollo como Visual Studio .NET, podemos emplear en nuestros desarrollos el lenguaje o lenguajes que consideremos oportuno. En realidad, conviene antes de seguir, comprender la diferencia entre Visual Studio .NET y .NET Framework, ya que muchos desarrolladores confunden las diferencias existentes entre estos dos. .NET Framework es el marco de trabajo con el cual desarrollaremos nuestras aplicaciones. En él se incluyen las diferentes partes del lenguaje (clases, objetos, tipos, etc.) que nos permiten desarrollar nuestras soluciones informáticas. Visual Studio .NET es el entorno RAD (Rapid Application Development o Desarrollo Rápido de Aplicaciones), que nos permite utilizar .NET Frame6-47


work para desarrollar nuestras aplicaciones de una forma rápida y visual, incluyendo características de desarrollo como el IntelliSense. Visual Studio .NET utiliza por tanto, .NET Framework.

Figura 1. Aspecto de Visual Studio .NET

Para desarrollar aplicaciones .NET, deberemos por tanto, utilizar necesariamente .NET Framework, ya sea utilizando Visual Studio .NET o no. Hablando del entorno .NET Framework, diremos que Microsoft ha añadido en él las capacidades y características necesarias para hacer de este modelo, un modelo POO o modelo de programación orientada a objetos. Todos los desarrollos que realicemos con .NET serán desarrollos orientados a objetos. Este cambio de «chip» es un cambio especialmente problemático para los desarrolladores que estaban acostumbrados a trabajar con Visual Basic sin tener conocimientos sobre la orientación a objetos, pero ¿quién ha dicho que es difícil o imposible? La problemática llega porque será necesario cambiar el esquema de trabajo que llevábamos a cabo cuando trabajábamos con Visual Basic. Ahora es necesario tener claro lo que se va a hacer, cómo se va a hacer y cuándo se va a hacer.

16.3. ¿Todos los lenguajes para un entorno? Dentro del .NET Framework conviven, como hemos comentado, diferentes lenguajes de desarrollo; sin embargo, todos comparten una serie de características que son idénticas para cada uno de ellos. La más importante es que comparten el mismo entorno de trabajo, el comentado .NET Framework, el cual contiene todo lo necesario para programar, compilar y ejecutar nuestras aplicaciones. 6-48


Algunas de las características de este entorno único es la posibilidad de compartir el mismo CLR. El CLR (Common Language Runtime, es decir, el Motor Común de Ejecución) es el centro neurálgico del .NET Framework encargado de gestionar la ejecución de nuestras aplicaciones, aplicar parámetros de seguridad y ejecutar el denominado recolector de basura entre otras cosas. La particularidad del CLR es que tendremos un CLR distinto por cada plataforma, ya sea una plataforma Windows, Linux, etc. Esto significa que una aplicación desarrollada bajo Microsoft Windows 2000 Advanced Server, por ejemplo, debería poder ejecutarse en un entorno que dispusiese de un CLR para Linux y un CLR para Windows. El CLR está formado, como hemos ya indicado, por diferentes partes que son igualmente importantes. De esta manera, nos encontramos con diferentes «cajas» que veremos a continuación. Cuando desarrollamos una solución en .NET Framework, la compilamos y la ejecutamos posteriormente, pero debemos tener en cuenta diferentes aspectos que suceden de manera transparente para el desarrollador. Todas las aplicaciones .NET son compiladas a un lenguaje neutral denominado IL (Intermediate Language, es decir, Lenguaje Intermedio). El CLR es capaz de compilar ese lenguaje intermedio a lenguaje máquina, específico para cada sistema en el cual se ejecuta. Ése es el «truco» que utiliza .NET Framework para poder ejecutar una misma aplicación en Windows o Linux por ejemplo.

Figura 2. Estructura general de Microsoft .NET Framework

Entre otras características, el CLR contiene un mismo CTS (Common Type Specification, es decir, Especificación de Tipos de Datos Común). El CTS para hablar de forma clara, constituye los diferentes tipos y definiciones de cada tipo de datos utilizable en una aplicación .NET. Un tipo de dato no encontrado en el CTS es devuelto como error por el CLR. Cada tipo de dato hereda su tipo del objeto o clase System.Object. Relacionado con el CTS, nos encontramos con la CLS (Common Language Specification, es decir, la Especificación Común de Lenguajes), la cual no es otra cosa que la especificación o reglas a seguir a la hora de trabajar con los tipos de datos. Pero no sólo los tipos son parte fundamental de .NET Framework; también el BCL (Base Class Library, es decir, la Biblioteca de Clases Base) es importante dentro de la estructura de desarrollo .NET. Dentro del BCL encon-

6-49


traremos una extensa biblioteca formada por clases que nos proporcionarán la posibilidad de acceder a una gran cantidad de servicios. En el .NET Framework, referenciamos a las BCL mediante lo que se ha denominado Namespace (Espacios de Nombres) y que se engloban dentro del Namespace System. Además de todos los aspectos que acabamos de ver, debemos tener en cuenta otros no menos importantes, algunos de ellos ya comentados pero no explicados. Uno de ellos es el denominado Recolector de Basura o Garbage Collector que se incluye dentro del CLR. El Recolector de Basura hace las tareas «sucias» de .NET Framework. Es el gestor de limpieza de .NET. Su objetivo es el de eliminar de la memoria los objetos que no sean útiles para el programador. Si bien el Recolector de Basura se ejecuta sólo cada vez que detecta que no hay espacio suficiente para ejecutar un objeto, podemos personalizar la ejecución del Recolector de Memoria y lanzarla cuando consideremos oportuno. El programador no debe preocuparse por los objetos, su existencia, eliminación,... en otras palabras, no debe preocuparse por la gestión posterior de los objetos. Para más información, acceda a la video/entrevista en inglés con Jim Miller y Jim Hogg, quienes han trabajo durante mucho tiempo en el CLR (http://msdn.microsoft.com/theshow/ Episode020/default.asp) y a la introducción de Microsoft .NET Framework en inglés (http:// msdn.microsoft.com/netframework/prodinfo/overview.asp).

16.4. .NET Framework, un entorno de desarrollo de nuestro tiempo Si algo es el .NET Framework, es un entorno de desarrollo de nuestro tiempo, un entorno de desarrollo moderno. En él podemos conjugar los aspectos modernos y actuales para cubrir las necesidades de los desarrolladores. Es un entorno capaz de resolver las necesidades de los desarrolladores de hoy, capaz incluso de trabajar con los errores que se sucedan en los programas a modo de excepciones. Es decir, podemos trabajar con los errores de una aplicación que se producen en tiempo de ejecución en cualquier momento. El trabajo con excepciones nos ofrece capacidades de gestión de errores mucho mayores a las que estábamos acostumbrados con los antiguos entornos de desarrollo de Microsoft. Y hablando de errores, ¿quién no ha tenido alguna vez problemas con las DLL en una aplicación Windows? Bueno, es hora de irse olvidando de las «famosas» DLL que se utilizaban en los anticuados entornos de desarrollo de Microsoft. En un entorno .NET podemos utilizar una DLL sin problemas, pero el entorno .NET está diseñado fuera del planteamiento y uso de las DLL. Por fin ha llegado el final de la era de las DLL que tantos quebraderos de cabeza han dado a los desarrolladores y administradores de sistemas. Tal ha sido el número de quebraderos de cabeza de las DLL, que se las ha llegado a denominar «el infierno de las DLL». .NET Framework es un entorno orientado a objetos, por lo que a la hora de desarrollar aplicaciones, trabajaremos con objetos y clases en lugar de trabajar con DLLs, aunque si lo deseamos, podremos seguir utilizando las DLL en nuestros desarrollos. .NET Framework es, además, un entorno abierto. Cuando decimos abierto, queremos decir que es un entorno adaptable o receptivo a nuevos len6-50


guajes de programación y tecnologías. Dentro de .NET Framework, podemos hacer uso de un conjunto de lenguajes de desarrollo determinado, pero una empresa externa, puede desarrollar su propio lenguaje de desarrollo o compilador para la plataforma .NET, tan sólo se ha de seguir unas normas para adaptarse al entorno .NET. Algunas de estas normas constituidas dentro del CLR son las que se han expuesto con anterioridad. De hecho, existen ya lenguajes de desarrollo para la plataforma .NET como Fortran .NET, Cobol .NET, Phyton .NET, etc., pertenecientes a otras empresas externas. Otra de las características de .NET Framework como entorno abierto, es que ha sido desarrollado con la pretensión de cumplir con todos los estándares actuales, siguiendo patrones de estandarización ya aprobados como el ECMA (http://www.ecma.ch/). Todo en el .NET Framework, cumple con los patrones de la normalización y se apoya en estándares abiertos. Este cambio de rumbo de Microsoft es claramente una apuesta por el desarrollador, dándole libertad absoluta en sus decisiones y desarrollos. Pero si algo es especialmente interesante dentro de .NET Framework es todo lo relacionado con la seguridad. La seguridad dentro del entorno .NET, proporciona la posibilidad de ser sensible a tipos o roles de ejecución, es decir, se puede restringir la ejecución de una aplicación según diferentes parámetros. En relación con la seguridad, dentro de .NET Framework, podemos trabajar con el cifrado de información según los algoritmos SHA-1 y MD5. Para más información, las páginas centrales de Microsoft .NET Framework en inglés (http://msdn.microsoft.com/netframework/default.asp).

16.5. .NET es a XML lo que XML es a .NET Pero si algo ha revolucionado a los desarrolladores en los últimos años y especialmente en los últimos meses, es la aparición en escena de un nuevo lenguaje, XML (http://www.w3.org/XML/). XML (eXtensible Markup Language, es decir, Lenguaje de Marcadores Extensible) es un lenguaje de marcas cuya particularidad reside en que está aceptado por el W3C, es decir, es un lenguaje estándar lo cual significa que un sistema Windows puede entenderse con cualquier otro sistema mediante XML y al revés. Ésta es una noticia especialmente esperanzadora para los desarrolladores, ya que no importa la plataforma en la cual se desarrollen sus aplicaciones ni tampoco dónde se ejecuten. Lo más importante es que el lenguaje XML es un lenguaje universal, capaz de ser manipulado siguiendo un conjunto de reglas necesarias para que el lenguaje XML sea correctamente interpretable. Algunas personas definen XML como una tecnología, otros como un lenguaje y otros ni siquiera lo definen como lenguaje ni como tecnología. XML, sin embargo, forma una parte muy importante a tener en cuenta dentro de

6-51


.NET, por lo que es conveniente tener algunos conocimientos básicos sobre XML para poder utilizarlos en .NET sin problemas, conociendo lo que se realiza en cada instante. Uno de los usos más importantes de XML, es el que tiene que ver con los Servicios Web, más conocidos como XML Web Services (Servicios Web XML). Otro de los usos de XML es el que se da con el trabajo de fuentes de datos junto a ADO .NET. Sin embargo, XML se utiliza dentro de muchos ficheros de configuración y aplicaciones dentro del propio entorno .NET. XML es una tecnología o lenguaje que se utiliza ya en otras plataformas de desarrollo no sólo en .NET. Obtendremos más información sobre XML y sobre los Servicios Web XML, en la dirección Web de Microsoft (http://msdn.microsoft.com/library/ default.asp?url=/nhp/Default.asp?contentid=28000438).

16.6. Conclusiones En este epígrafe hemos visto algunas de las características más destacables de la plataforma .NET Framework. El desarrollo de aplicaciones .NET puede ser muy versátil, por lo que conviene entender con claridad las partes fundamentales de .NET Framework. Como ejemplos de versatilidad en el desarrollo, destacaremos la posibilidad que nos ofrece .NET Framework, de poder desarrollar una aplicación que contenga una parte escrita en Visual Basic .NET y otra parte escrita en C# por ejemplo. Por otro lado, en este artículo hemos diferenciado el .NET Framework de Visual Studio .NET, el cual en algunas ocasiones, es confundido por el desarrollador que se sienta delante de .NET por primera vez. Esperemos que con estas explicaciones, quede claro lo que es la plataforma .NET Framework, qué partes lo componen, y cuáles son sus características más destacables. Visual Basic .NET usa una jerarquía de clases que están incluidas en el .NET Framework, por tanto conocer el .NET Framework nos ayudará a conocer al propio Visual Basic .NET, aunque también necesitarás conocer la forma de usar y de hacer del VB ya que, aunque en el fondo sea lo mismo, el aspecto sintáctico es diferente para cada uno de los lenguajes basados en .NET Framework; si no fuese así sólo, existiría un solo lenguaje.

«.NET Framework es un entorno para construir, instalar y ejecutar servicios Web y otras aplicaciones. Se compone de tres partes principales: el Common Language Runtime, las clases Framework y ASP.NET» Lo que dice la MSDN Library:

6-52

—

«El .NET Framework es un entorno multi-lenguaje para la construcción, distribución y ejecución de Servicios Webs y aplicaciones.»

—

«El .NET Framework es una nueva plataforma diseñada para simplificar el desarrollo de aplicaciones en el entorno distribuido de Internet.»

—

«El .NET Framework consta de dos componentes principales: el Common Language Runtime y la librería de clases .NET Framework.»


El Common Lenguage Runtime (CLR) es una serie de librerías dinámicas (DLLs), también llamadas assemblies, que hacen las veces de las DLLs del API de Windows así como las librerías runtime de Visual Basic o C++. Como sabrás, cualquier ejecutable depende de una forma u otra de una serie de librerías, ya sea en tiempo de ejecución como a la hora de la compilación. Pues el CLR es eso, una serie de librerías usadas en tiempo de ejecución para que nuestros ejecutables o cualquiera basado en .NET puedan funcionar. Por otro lado, la librería de clases de .NET Framework proporciona una jerarquía de clases orientadas a objeto disponibles para cualquiera de los lenguajes basados en .NET, incluido el Visual Basic. Tendrá a su disposición todas las clases disponibles para el resto de los lenguajes basados en .NET. VB.NET ahora es totalmente un lenguaje orientado a objetos.

17. Clasificación de los lenguajes de programación Los lenguajes de programación constan de: —

Léxico. Conjunto finito de símbolos, a partir del cual se define el vocabulario del lenguaje, la ortografía del lenguaje.

—

Sintaxis. Conjunto finito de reglas para la construcción de las sentencias correctas del lenguaje, la gramática del lenguaje.

—

Semántica. Asociar un significado a cada posible construcción del lenguaje.

Podemos decir que un lenguaje de programación consta de un conjunto de símbolos y un conjunto de reglas válidas para componerlos, de forma que formen un mensaje con significado para el ordenador. Distintos tipos de lenguajes de programación:

17.1. Lenguaje máquina Los ordenadores sólo entienden el código máquina. Este lenguaje utiliza un código binario (0 - 1). Las instrucciones en este lenguaje tienen dos partes diferenciadas: código de operación y código de operando/s: —

En el código de operación se codifica la operación que realiza la instrucción. Este código de operación siempre es único para cada instrucción.

—

En el código de operando se indica la dirección binaria absoluta de memoria en la que se encuentra el operando, con un máximo de tres, sobre el que se aplicará la operación.

6-53


Como cada tipo de ordenador tiene su código máquina específico, para programar en este lenguaje el programador debe conocer la arquitectura física del ordenador. Ventajas: —

Los programas son directamente interpretables por el procesador central.

—

Los programas no se necesitan transformaciones previas para ser ejecutado.

—

Los programas se ejecutan muy eficientemente, ya que se crean específicamente para los circuitos que lo han de interpretar y ejecutar.

—

Los programas pueden utilizar la totalidad de los recursos de la máquina.

Inconvenientes: —

Las instrucciones son cadenas de ceros y unos (estas cadenas se pueden introducir en el ordenador mediante un código intermedio: octal o hexadecimal).

—

Los datos se utilizan por medio de las direcciones de memoria donde se encuentran (binarias absolutas).

—

El repertorio de instrucciones es muy reducido y las instrucciones realizan operaciones muy simples.

—

Existe poca elasticidad, flexibilidad y versatilidad para la redacción de instrucciones. Estas tienen un formato rígido en cuanto a posición de los distintos campos que configuran la instrucción (código de operación, dirección o direcciones de memoria, códigos de puertos, etc.).

—

El código de operación debe seleccionarse estrictamente entre los que figuran en una tabla o repertorio fijo.

—

Un programa máquina no permite el uso de sentencias declarativas, existiendo sólo las instrucciones.

—

No pueden incluirse comentarios.

—

Es muy difícil de reconocer o interpretar por el usuario.

—

La dependencia del lenguaje máquina de la configuración de la CPU hace que los programas redactados en este lenguaje de programación sean poco transferibles o transportables de un ordenador a otro (no portabilidad).

El lenguaje máquina depende íntimamente a la CPU del computador. Si dos ordenadores tienen CPU diferentes, tendrán distintos lenguajes máquina. Dos ordenadores con el mismo microprocesador e iguales circuitos de control, tienen igual lenguaje máquina. 6-54


17.2. Traductores Los lenguajes simbólicos permiten utilizar una simbología y terminología próximas a las tradicionalmente utilizadas en la descripción de problemas. Dado que un ordenador solo puede interpretar y ejecutar código máquina, existen programas traductores, que traducen el lenguaje simbólico al lenguaje máquina. El código inicial se denomina programa fuente y el programa obtenido tras el proceso de traducción programa objeto. Existen dos tipos de lenguajes que necesitan de un traductor:

17.2.1. Ensambladores Los lenguajes ensambladores permiten al programador: —

Escribir las instrucciones utilizando, en vez de códigos binarios o intermedios, con una notación simbólica o mnemotécnica para representar los códigos de operación.

—

Los códigos mnemotécnicos están constituidos por tres o cuatro letras que, en forma abreviada, indican la operación a realizar: SUB (sustracción), MOV (movimiento), CALL (llamada a un procedimiento), etc.

—

Utilizan direcciones simbólicas de memoria en lugar de direcciones binarias absolutas.

—

Existen sentencias declarativas (también denominadas seudo instrucciones o directivas) para indicar al traductor la correspondencia entre direcciones simbólicas y direcciones de memoria. Con estas seudo instrucciones, el traductor crea una tabla con cuya ayuda, al generar las instrucciones máquina, sustituye las direcciones simbólicas por las direcciones binarias correspondientes.

—

Las instrucciones escritas en este lenguaje, guardan una estrecha relación con las instrucciones del lenguaje máquina en que posteriormente serán traducidas.

—

Hace corresponder a cada instrucción en ensamblador una instrucción en código máquina (tener en cuenta los macroensambladores explicados mas a continuación).

—

Incluyen líneas de comentarios entre las líneas de instrucciones.

Un programa en ensamblador no puede ejecutarse directamente por el ordenador, siendo necesario ser traducido (ensamblado). El traductor de lenguaje ensamblador a lenguaje máquina se denomina ensamblador. El ensamblador mejora o resuelve algunos de los problemas de los lenguajes máquina pero siguen persistiendo otras limitaciones (repertorio de instrucciones reducido, poca elasticidad para la redacción de instrucciones, o que está íntimamente ligado a la CPU del ordenador).

6-55


Hay unos lenguajes evolucionados de los ensambladores, que se denominan macroensambladores. Con ellos se solventa en cierta medida la limitación de tener un repertorio de instrucciones muy reducido. Los lenguajes macro ensambladores disponen de macroinstrucciones, como por ejemplo transferir un bloque de datos de memoria principal a disco, multiplicar, dividir, etc. La macroinstrucción es una llamada a un módulo o rutina, llamada macro, que el traductor inserta, antes de realizar el proceso de generación del código máquina definitivo, en el lugar de la llamada correspondiente. A cada macroinstrucción le corresponden varias instrucciones máquina y no sólo una.

17.2.2. Lenguajes de alto nivel Los lenguajes de alto nivel no obligan al usuario a conocer los detalles del ordenador que utiliza. Con estos lenguajes las operaciones se expresan con sentencias o frases muy parecidas al lenguaje matemático o al lenguaje natural, utilizados habitualmente por los humanos. Las características de los lenguajes de alto nivel son: —

Las instrucciones se expresan por caracteres alfabéticos, numéricos y caracteres especiales.

—

Se pueden definir las variables que desee.

—

La asignación de memoria para variables y constantes las hace directamente el compilador.

—

El repertorio de instrucciones es muy amplio, conteniendo operadores y funciones de una gran diversidad: aritméticas, lógicas, de tratamiento de caracteres,…

—

El programador puede definir sus instrucciones con una gran versatilidad, siendo las reglas gramáticas de los lenguajes muy abiertas.

—

Los lenguajes de alto nivel apenas dependen de la máquina.

—

Pueden incluirse comentarios en las líneas de instrucciones, o puede haber líneas específicas de comentarios. Esto facilita la legibilidad de los programas, tanto para el propio programador, como para otras personas.

—

Un programa escrito en un lenguaje de alto nivel no puede ser directamente interpretado por el ordenador, siendo necesario realizar previamente su traducción a lenguaje máquina.

Usualmente la traducción se hace en dos etapas: primero a ensamblador, y posteriormente a código máquina. Por lo general, una sentencia en un lenguaje de alto nivel da lugar, al ser traducida, a varias instrucciones en ensamblador o lenguaje máquina.

6-56


Entre sus actividades, el American National Standard Institute (ANSI) se encarga de realizar normalizaciones de lenguajes para garantizar la translabilidad de los programas. Existen dos tipos de traductores para los lenguajes de alto nivel: A) Compiladores Los compiladores traducen el código fuente a código objeto, para todo el programa a la vez. A su vez llevan a cabo optimizaciones del programa que permiten que el programa ocupe menos espacio o sea más rápido. Un compilador traduce un programa fuente, escrito en un lenguaje de alto nivel, a un programa objeto, escrito en lenguaje ensamblador o máquina. El programa fuente suele estar contenido en fichero y el programa objeto pasa a ocupar otros ficheros. El fichero objeto puede almacenarse en memoria masiva para ser procesado posteriormente. La traducción por un compilador consta de dos etapas fundamentales, que a veces no están claramente diferenciadas a lo largo del proceso: —

La etapa de análisis del programa fuente.

—

La etapa de síntesis del programa objeto.

A su vez, cada una de estas etapas conlleva la realización de varias fases, y en cada una de las cuales se recorre o analiza completamente el programa fuente. 1.

Análisis lexicográfico. Consiste en descomponer el programa fuente en sus elementos constituyentes, es decir, sus símbolos, que son caracteres o secuencias de caracteres con significado especial. El analizador léxico (también denominado escáner) aísla los símbolos, identifica su tipo y almacena en las tablas de símbolos la información del símbolo que pueda ser necesaria durante el proceso de traducción. La representación obtenida en esta fase contiene la misma información que el programa fuente, pero de forma más compacta.

2.

Análisis sintáctico. La sintaxis de los lenguajes de programación se especifica mediante un conjunto de reglas (la gramática del lenguaje). Esta fase deberá comprobar si un programa es sintácticamente correcto, es decir, si sus estructuras (expresiones, sentencias o asignaciones) están construidas de acuerdo con las reglas del lenguaje.

3.

Análisis semántico. La semántica de un lenguaje de programación define el significado dado a las distintas construcciones sintácticas. En los lenguajes de programación, el significado está ligado a la estructura sin6-57


táctica de las sentencias. En el proceso de traducción, el significado de las sentencias se obtiene de la identificación sintáctica de las construcciones sintácticas y de la información almacenada en la tabla de símbolos. 4.

Generación de Código Intermedio. Si no se han producido errores en algunas de las etapas anteriores, este módulo realiza la traducción a un código interno propio del compilador, denominado Código Intermedio, a fin de permitir la transportabilidad del lenguaje a otros ordenadores.

5.

Optimizaciones. En la fase de optimización se mejora el código intermedio generado anteriormente, analizando el programa de forma global.

6.

Generación de Código Objeto. En esta etapa se genera el código objeto final. En algunos casos, este código es directamente ejecutable, y en otros necesita algunos pasos previos a la ejecución (ensamblado, encuadernación y carga). La compilación es un proceso complejo y que consume a veces un tiempo muy superior a la propia ejecución del programa. En cualquiera de las fases de análisis el compilador puede dar mensajes sobre los errores que detecta en el programa fuente, cancelando en ocasiones la compilación para que el usuario realice en el fichero las correcciones oportunas. Existen compiladores que permiten al usuario omitir o reducir las fases de optimización, disminuyéndose así el tiempo global de la compilación.

B) Intérpretes Los intérpretes traducen el código fuente línea por línea, sin generar programa objeto, y traduciendo las instrucciones en comandos para el hardware. Son más lentos que los compiladores, puesto que tienen que interpretar una línea cada vez que pasan por ella. Un intérprete hace que un programa fuente escrito en un lenguaje vaya, sentencia a sentencia, traduciéndose a código objeto y sea ejecutado directamente por el ordenador. El intérprete capta una sentencia fuente y la traduce, expandiéndola en una o varias instrucciones máquina, que ejecuta inmediatamente, no creándose, por tanto, un fichero o programa objeto almacenable en memoria masiva para posteriores ejecuciones. Características de los lenguajes interpretados: —

6-58

Las optimizaciones sólo se realizan dentro del contexto de cada sentencia.


—

Si una sentencia forma parte de un bucle, se traduce tantas veces como tenga que ejecutarse el bucle, y no una sola vez como ocurriría en un compilador.

—

Cada vez que utilicemos un programa tenemos que volver a traducirlo, ya que en la traducción no se genera un fichero objeto que poder guardar en memoria masiva y utilizarlo en cada ejecución.

Los intérpretes son preferibles a los compiladores cuando el número de veces que se va a ejecutar el programa es muy bajo. Es más fácil desarrollar programas. Los lenguajes intérpretes resultan más pedagógicos para aprender a programar, ya que el alumno puede detectar y corregir más fácilmente sus errores. Los traductores-intérpretes ocupan, por lo general, menos memoria que los compiladores. En la actualidad, para un lenguaje dado pueden existir tanto compiladores como intérpretes. C) Clasificación de los lenguajes de programación según el estilo de programación Antes de realizar esta clasificación hemos de pensar que un mismo lenguaje podría estar incluido en más de un paradigma. • Lenguajes imperativos o procedimentales o procedurales Se basan en la asignación de valores. Usan la instrucción o sentencia de asignación como construcción básica en la estructuras de los programas, son lenguajes orientados a instrucciones. Se fundamentan en la utilización de variables para almacenar valores y en la realización de operaciones con los datos almacenados. Se caracterizan por: —

Uso intensivo de variables.

—

Estructura de programas basada en instrucciones.

—

Manejo frecuente de las instrucciones de asignación.

—

Resolución de algoritmos por medio de estructuras de control secuenciales, alternativas (condicionales) y repetitivas (iterativas).

—

Incorporan mecanismos para el manejo de bloques.

—

Gestionan la memoria de modo dinámico (en tiempo de ejecución).

Ejemplos de este paradigma son: Fortran, Pascal, C,… a)

Lenguajes de alto nivel, caracterizados por estar enfocados a la resolución de problemas en campos de aplicación específicos y los programas escritos en ellos ser fácilmente trasladables de uno a otro ordenador. 6-59


b)

Lenguajes ensambladores y máquina, totalmente adaptados y predeterminados por la CPU de la máquina.

• Lenguajes declarativos. Son lenguajes de muy alto nivel cuya notación es muy próxima al problema real del algoritmo que pretenten resolver. Están basados en la definición de funciones o relaciones. No utilizan instrucciones de asignación (sus variables no almacenan valores). Son más fáciles de utilizar pues están muy próximos al algoritmo. Se suelen denominar también lenguajes de órdenes, ya que los programas están formados por sentencias que ordenan “qué es lo que se quiere hacer”, no teniendo el programador que indicar al ordenador el proceso detallado (el algoritmo) de cómo hacerlo”. Hay dos tipos: a)

Lenguajes funcionales o aplicativos. Los lenguajes funcionales son un tipo de lenguajes declarativos, en los que los programas están formados por una serie de definiciones de funciones. No hay instrucciones, todo el programa es una función, todas las operaciones se realizan por composición de funciones más simples. Ejemplos de estos lenguajes son el LISP y el SCHEME.

b)

Lenguajes lógicos. Los lenguajes lógicos son el otro tipo de lenguajes declarativos, y en ellos los programas están formados por una serie de definiciones de predicados (relaciones entre objetos-datos). También se les denomina lenguajes de programación lógica, y el mayor exponente es el lenguaje PROLOG.

• Lenguajes concurrentes Permiten la ejecución simultánea de dos o más tareas. Podrían llamarse también lenguajes paralelos o simultáneos. Podría ser una característica del lenguaje o el resultado de ampliar las instrucciones de un lenguaje que en sus orígenes no sea concurrente. • Lenguajes Orientados a Objetos Se dice que un lenguaje es Orientado a Objetos si soporta tipos abstractos de datos (clases). Se basan en objetos (entes físicos de las clases), herencia, polimorfismo, abstracción y encapsulado. Ejemplos serian JAVA y C#.

6-60

Anexo I Lenguaje C.


Guión-resumen

1. Introducción

9. Cadenas de caracteres

2. Definición de las variables

10. Estructuras, uniones, enumeraciones y typedef

2.1. Nombres de identificadores 2.2. Tipos de datos 2.3. Modificadores de tipos de datos 2.4. Modificadores de acceso 2.5. Clase de almacenamiento 3. Comentarios 4. Operadores 4.1. Clasificación de los operadores 4.2. Orden de prioridad de los operadores 5. Caracteres especiales (barra invertida) 6. Instrucciones 6.1. Las instrucciones de control 6.2. Bucles 6.3. Sentencias de salto 7. Arrays 7.1. Declaración de un array 7.2. Arrays multidimensionales 7.3. Cadenas de caracteres 7.4. Acceso a los miembros de un array 7.5. Arrays indeterminados 8. Punteros 8.1. Definición de un puntero 8.2. Arrays y punteros 8.3. Indirección múltiple punteros a punteros 8.4. Arrays de punteros

Anexo I 6-2

10.1. Estructuras 10.2. Uniones 10.3. Enumeraciones 10.4. Typedef 11. Funciones 12. Memoria dinámica 13. Entrada y Salida por consola (estándar) 13.1. Entrada y salida de caracteres 13.2. La función scanf() 13.3. Otras funciones para la entrada/salida estándar 14. Entrada y salida con ficheros 14.1. Apertura y cierre de un fichero 14.2. Lectura y escritura sobre un fichero 14.3. Lectura y escritura de datos binarios 14.4. Operaciones especiales con los ficheros 14.5. Posicionamiento del indicador de posición del fichero 14.6. Otras operaciones con ficheros 15 El preprocesador 15.1. Directivas de preprocesado

Lenguaje C

1.

Introducción

El lenguaje de programación C ha sido utilizado durante muchos años y hoy en día sigue siendo un lenguaje a tener en cuenta. Ha sido utilizado para infinidad de utilidades como compiladores, sistemas operativos, bases de datos, etc. Este detalle de su uso general es quizá una de las diferencias importantes con respecto a otros lenguajes de programación cuyo uso está más relegado a una tarea en concreto. Dicho de otra forma, estamos ante un lenguaje de propósito general. Muchas son sus ventajas: portabilidad, compatibilidad, flexibilidad, etc. El lenguaje C nació en 1972 en los Laboratorios Bell de la mano de Dennis Ritchie. Tuvo dos grandes revisiones en los años 1989 (C89) y 1999 (C99), este último conocido como el estándar ANSI C es objeto de esta oposición. Entre las características más generales de este lenguaje destacaremos a modo de primer paso las siguientes: —

Permite la manipulación de “bits”, “bytes” y direcciones.

—

No lleva a cabo comprobación de errores en tiempo de ejecución. Por supuesto sí lo lleva en tiempo de compilación y de “linkado”.

—

Existe un conjunto de palabras clave que luego cotaremos que en C89 son 32 y en C99 ha sido ampliado en 5 más. No obstante, los diferentes compiladores de este lenguaje pueden añadir más.

—

No se permite la creación de funciones dentro de funciones.

—

Los bloques de código van encerrados entre llaves.

—

Un programa puede estar formado por uno o varios archivos que se compilan cada uno de ellos por separado. Cada uno de esos archivos ha de llevar extensión “*.c”.

—

Existen bibliotecas de subrutinas precreadas que podemos incluir en nuestro programa. Estas bibliotecas se encuentran en archivos con extensión “*.h”.

—

Las instrucciones terminan en “;”.

—

El concepto de verdadero toma el valor 1 y el de falso el 0. Aunque diremos que generalmente cualquier valor diferente de 0 es tomado como verdadero.

El formato general de un programa en C viene dado por el siguiente esquema:

Anexo I 6-3


ARCHIVO1.C

ARCHIVO2.C

declaraciones globales main( ) { variables locales; sentencias; } funcion_1_1( ) { variables locales sentencias } ……. funcion_1_n(){ variables locales; sentencias; }

declaraciones globales { funcion_2_1( ) variables locales; sentencias; }

……. funcion_2_n(){ variables locales; sentencias; }

…..

ARCHIVON.C declaraciones globales

……

…… ……

funcion_n_1( ) { variables locales; sentencias; }

……. funcion_n_n(){ variables locales; sentencias; }

Pudiendo estar todo el código del programa en un solo archivo o en diferentes archivos que luego han de ser compilados y linkados. Los programas en C están formados por una serie de líneas de código que se ejecutan sucesivamente. Todos los programas se dividen en bloques, estos bloques vienen dados por la combinación de “{“ de apertura del bloque y “}” de finalización del bloque. La ejecución del programa siempre comienza en la función main(). Esta función es la encargada de llamar a las demás. Los bloques están formados por instrucciones. En C todas las instrucciones acaban con un “;”. Hay varios tipos de instrucciones que iremos estudiando a lo largo de este tema. • La función main Si el programa es pequeño es probable que la mayor parte del programa se halle dentro de la función main. Cuando el programa comienza a tener un tamaño mayor conviene dejar para la función main solo el cuerpo del programa. Al principio de la función main colocaremos todas las rutinas de inicialización. Se suele procesar en la función main las posibles contraseñas que queramos darle al programa y los mensajes de bienvenida. Si el programa admite parámetros en la línea de órdenes, la función main debe procesarlos, ya que la función main tiene normalmente acceso a la línea de argumentos con que fue ejecutado el programa. Es esta función la primera que se ejecuta y debe ser la que llame a las demás, aunque luego otra función llame sucesivamente a otras funciones. Al terminar la llamada a la función llamante, el control del programa vuelve a “main”. También debe ser la última en ejecutarse.

Anexo I 6-4

Lenguaje C

2.

Definición de las variables

Las variables permiten guardar información. Los principales tipos de datos son los datos numéricos, los caracteres y las cadenas de caracteres. Comencemos creando un programa con una variable numérica entera, “x”:

#include int x = 1; main() { printf(«x vale %d\n», x); } El valor de las variables es, como su propio nombre indica, variable. Podemos alterar su valor en cualquier punto del programa. La forma más sencilla de hacerlo es mediante una sentencia de asignación. Para asignar un nombre a una variable se escribe su identificador seguido de un = y el nuevo valor. Este tipo de sentencia es el segundo más importante. Así:

#include int i = 1; main() { printf(«el antiguo valor de i es %d\n», i); i = 2; printf(«el nuevo es %d\n», i); } • Palabras reservadas El lenguaje C está formado por un conjunto pequeño de palabras clave. En el estándar C89 hay 32 palabras claves: auto

break

float

for

goto

if

int

long

register

case

default do

short

signed

sizeof

static

struct

typedef

char

const

return

enum

extern

union

unsigned

void

volatile

while

double else

continue switch

A este conjunto de palabras se les denomina «palabras reservadas». En el estándar C99 se le han añadido cinco más. • Duración de las variables Las variables pueden ser de dos tipos: estáticas y dinámicas. Las estáticas se crean al principio del programa y duran mientras el programa se ejecute. Anexo I 6-5


Las variables son dinámicas si son creadas dentro de una función. Su existencia está ligada a la existencia de la función. Se crean cuando la función es llamada y se destruyen cuando la función o subrutina devuelve el control a la rutina que la llamó. Las variables estáticas se utilizan para almacenar valores que se van a necesitar a lo largo de todo el programa. Las variables dinámicas se suelen utilizar para guardar resultados intermedios en los cálculos de las funciones. Como regla general, una variable es estática cuando se crea fuera de una función y es dinámica cuando se crea dentro de una función. • Definición de una variable Cuando se define una variable, lo que realmente estamos haciendo es reservando en memoria un espacio para poder almacenar los valores que pueda ir tomando dicha variable a lo largo de la ejecución del programa. La sintaxis que se debe de seguir en C para definir una variable viene dada por:

[Clase_almacenamiento] [modificadores] [tipo_dato] [identificador]; Todas las variables han de ser declaradas antes de ser usadas. Veamos en detalle cada uno de los elementos que forman esta sintaxis:

2.1.

Nombres de identificadores

Son los nombres usados para referirse a las variables, funciones, etiquetas y otros elementos del programa. Son nombres construidos por una secuencia de letras, dígitos y el carácter subrayado. Las reglas que han de seguir los identificadores son: —

Pueden contener letras, dígitos y el carácter subrayado “_”, pero obligatoriamente deben de comenzar por un carácter alfabético o el “_”. Es decir, el primer carácter debe ser una letra o un símbolo de subrayado, los caracteres siguientes pueden ser letras, números o símbolos de subrayado.

—

No está permitido el uso de espacios en blanco.

—

La longitud del identificador vienen dada por el compilador que se utilice (generalmente está en torno a los 32 caracteres).

—

Las letras mayúsculas y minúsculas son interpretadas como diferentes.

—

No puede ser una palabra reservada.

Ejemplos: Correcto: x, xx, xxx33333, cont, x_3, _x3, cuenta23, patatas_jamon. Incorrecto: 1x, hola!, patatas jamon, xxxñ#xxxx

Anexo I 6-6

Lenguaje C

2.2.

Tipos de datos

Existen cinco tipos de datos básicos; todos los demás tipos de datos se basan en alguno de estos tipos. El tamaño de estos tipos de datos pueden variar dependiendo del procesador y del compilador utilizado; por ejemplo, los datos de tipo “int” pueden ocupar 16 ó 32 bits dependiendo del procesador que tengamos: TIPO

BITS

RANGO

char

8

0 a 255

int

16

-32.768 a 32.767

float

32

3,4 E -38 a 3,4 E +38

double

64

1,7 E -308 a 1,7 E +308

void

0

sin valor

Nota: Void se usa para declarar funciones que no devuelven ningún valor o para declarar funciones sin parámetros.

2.3.

Modificadores de tipos de datos —

signed: con signo.

—

unsigned: sin signo.

—

long: usado en “int” hace que estos tengan un tamaño de 32 bits. Usado en “double” hace que éstos tengan un tamaño de 80.

—

short: usado en “int” hace que estos tengan un tamaño de 16 bits.

Los modificadores signed, unsigned, long y short se pueden aplicar a los tipos base entero y carácter. Sin embargo, long también se puede aplicar a double.

Anexo I 6-7


2.4.

TIPO

BITS

RANGO

char

8

-128 a 127

unsigned char

8

0 a 255

signed char

8

-128 a 127

int

16

-32.768 a 32.767

unsigned int

16

0 a 65.535

signed int

16

-32.768 a 32.767

short int

16

-32.768 a 32.767

unsigned short int

16

0 a 65.535

signed short int

16

-32.768 a 32767

long int

32

-2147483648 a 2147483647

signed long int

32

-2147483648 a 2147483647

float

32

3,4 E -38 a 3,4 E +38

double

64

1,7 E -308 a 1,7 E +308

long double

80

1,7 E -308 a 1,7 E +308

Modificadores de acceso

Se utilizan para controlar la forma en que se modifican las variables. Existen dos modificadores de acceso:

2.5.

—

const. Las variables de tipo const no pueden ser cambiadas durante la ejecución del programa. Por ejemplo: const int x;

—

volatile. A través de este modificador se le indica al compilador que el contenido de la variable puede ser modificado por elementos ajenos al programa a lo largo de su ejecución. Por ejemplo: volatile float hora:

Clase de almacenamiento

• Alcance de las variables Otra característica de las variables es su alcance. El alcance se refiere a los lugares de un programa en los que podemos utilizar una determinada variable. Distinguiremos así dos tipos principales de variables: globales y locales. Una variable es global cuando es accesible desde todo el programa, y es local Anexo I 6-8

Lenguaje C

cuando sólo puede acceder a ella la función que la creó. También hay una norma general para el alcance de las variables: una variable es global cuando se define fuera de una función, y es local cuando se define dentro de una función o de un bloque. Dentro de las variables globales hay dos tipos: las que son accesibles por todos los ficheros que componen nuestro programa y las que son accesibles solo por todas las funciones que componen un fichero. Esto es debido a que normalmente los programas en C se fragmentan en módulos más pequeños, que son mas fáciles de manejar y depurar. Por ello, hay veces que interesa que una variable sea accesible desde todos los módulos, y otras solo que sea accesible por las funciones que componen un determinado módulo. Por defecto, todas las variables globales que se creen son accesibles por todos los ficheros que componen nuestro programa. Existen, por tanto, tres sitios donde se pueden declarar variables: dentro de las funciones (variables locales), en la definición de parámetros de funciones (parámetros formales) y fuera de todas las funciones (variables globales). Normalmente en todo programa en C hay una sección de variables globales. En las variables globales almacenaremos datos que deben ser accesibles a todo el programa. Cuando el programa es pequeño, por ejemplo si consta de un solo fichero, por comodidad se suelen definir todas las variables como globales. A través de la clase de almacenamiento se especifica la forma en la que se almacenara la variable. Existen cuatro especificadores de almacenamiento, que son:

3.

—

auto. Es la opción por defecto de tal forma que la variable se considera local siempre y cuando esté definida dentro de una función.

—

extern. Con este especificador indicamos que la variable esta declarada con un enlace externo en algún otro lugar del programa. Su empleo más típico es cuando el archivo consta de dos o más archivos y en alguno de esos archivos deseamos que enlace con la variable global definida en otro de los archivos.

—

static. En una variable local el especificador static hace que la variable mantenga su valor en las sucesivas llamadas a la función. Tienen memoria asignada durante toda la ejecución del programa. Su valor es recordado incluso si la función donde está definida acaba y se vuelve a llamar más tarde. En una variable global el especificador static hace que esa variable solo sea conocida en el archivo donde ha sido declarada.

—

register. El especificador register pide al compilador que mantenga el valor de una variable con ese especificador de forma que se permita el acceso más rápido a la misma. Esto significa colocarla en un registro de la CPU. Solo se puede aplicar a variables locales y a los parámetros formales de una función.

Comentarios

Un comentario es una línea que se incluye en el programa, cuya misión consiste en aclarar la función de una parte concreta del programa a otro lector,

Anexo I 6-9


o incluso al mismo programador. En C hay dos formas de incluir estos comentarios. La primera es incluir el texto que sirve de comentario al principio de la sección, entre dos símbolos especiales: el /* o principio de comentario y el */ o fin de comentario. Todo el texto que se incluya entre ellos el compilador lo ignora, incluyendo los saltos de línea. Por ejemplo:

/* Hola, que tal, estoy dentro de un comentario */ El otro tipo de comentarios se suele usar para señalar una determinada línea del programa. Para ello escribimos el comentario a la derecha de la línea a comenta con “//”. Por ejemplo:

printf(“HOLA, HOLITA”); // imprime HOLA, HOLITA.

4.

Operadores Los operadores en C se pueden clasificar de la siguiente forma:

4.1.

Clasificación de los operadores

A) Aritméticos •

-

resta

•

+

suma

•

*

producto

•

/

división

•

%

módulo (resto de la división entera)

•

—

decrementar

•

++

incrementar

B) Relacionales •

>

mayor que

•

>=

mayor o igual que

•

<

menor que

•

<=

menor o igual que

•

==

igual

•

!=

distinto

Anexo I 6-10

Lenguaje C

C) Lógicos •

&&

y (Conjunción)

•

||

o (Disyunción)

•

!

no (Negación)

D) El operador ? Exp 1 ? Exp 2 : Exp 3 Se evalúa exp1 si es cierto se evalúa exp2 y toma ese valor para la expresión. Si exp1 es falso evalúa exp3 tomando su valor para la expresión. Ejemplo:

x=5; y=x>2 ? 100 : 200; Resultado: 100 E) Operadores a nivel de bits •

&

y

•

|

o

•

^

o exclusivo

•

~

complemento a 1

•

>>

desplazamiento a la derecha

•

<<

desplazamiento a la izquierda

F) Operador de molde Se utiliza para convertir el tipo de dato de un operando. Anteponiendo al operando el tipo entre paréntesis. Ejemplo (int) 3.2; G) Los operadores de punteros & y * •

& devuelve la dirección de memoria del operando. Ejemplo: m=&cont; coloca en m la dirección de memoria de la variable cont

Anexo I 6-11


•

* devuelve el valor de la variable ubicada en la dirección que se especifica. Ejemplo: q=*m; coloca el valor de cont en q.

H) Operador de asignación •

= Asignación

Forma general: nombre_variable = expresion; I) Operador de tamaño •

sizeof devuelve el tamaño de una variable o de un tipo de dato

Es un operador monario que devuelve la longitud, en “bytes”, de la variable o del especificador de tipo al que precede. El nombre del tipo debe ir entre paréntesis.

Ejemplo: float f; printf («%f»,sizeof f); Mostrara 4 printf («%d», sizeof (int)); Mostrara 2 J) Otros operadores Existen otros operadores como son: •

El “.” Que permite acceder a elementos individuales en las estructuras y en las uniones.

•

El “->” que opera igual que el anterior pero trabajando a través de punteros.

•

El operador “,” que permite encadenar varias expresiones.

•

El operador “[]” cuyo uso fundamental es en el trabajo con “arrays”.

•

El operador “( )” para aumentar la precedencia de las operaciones a realizar.

K) Abreviaturas en C •

+= ; x=x+10 ———— x+=10

•

-=;

x=x-10 ————- x-=10

•

*=;

x=x*10 ————- x*=10

•

/=

x=x/10 ————- x/=10

Anexo I 6-12

Lenguaje C

4.2.

Orden de prioridad de los operadores ()

[]

->

. —

!

~

++

*

/

%

+

-

<<

>>

<

<=

==

!=

>

>=

-=

*=

(tipo) * (punteros)

&

sizeof

& ^ | && || ?: =

+=

/=

, Los operadores monarios y “?” tienen prioridad de derecha a izquierda. Los demás de de izquierda a derecha y de arriba abajo.

5.

Caracteres especiales (barra invertida)

6.

\n Nueva línea

\f Salto de página

\t Tabulación horizontal

\\ Barra invertida

\b Espacio atrás

\’ Comilla simple

\r Retorno de carro

\» Comilla doble

Instrucciones

En el lenguaje C, al igual que en la mayoría de los lenguajes de programación, existen los siguientes tipos de instrucciones: •

Selección, condicionales o de control. Anexo I 6-13


•

Repetitivas o bucles.

•

Salto.

En las sentencias de control y repetitivas su ámbito incluye el bloque que se encierre entre “{ }”; no obstante, si éste se omite, su ámbito es única y exclusivamente la siguiente sentencia a ejecutar. Por tanto, cuando necesitamos ejecutar varias sentencias que dependen de una condición o queramos que éstas se repitan, utilizaremos la sentencia de tipo bloque de sentencias “ { }”.

6.1.

Las instrucciones de control

A) La sentencia “if” La primera sentencia de control es la sentencia “if”. Admite dos tipos de sintaxis:

if (expresion1) sentencia1; o: if (expresion1) sentencia1; else sentencia2; o: if (expresion) { ............ ............ } else { ........... ........... } o: if (expresion1) { ............ ............ } else if(expresion2){ ...........

Anexo I 6-14

Lenguaje C

........... } ... .... else if(expresionn){ ........... ........... } else { ........... ........... } o: if (expresion1) { ............ ............ } else if(expresion2){ if (expresion) { ............ ............ } else { ........... ........... } } else { ........... ........... } Sirve para bifurcar en un punto de programa. La sentencia “if” permite tomar decisiones al programa. En su primera forma, la sentencia1 solo se ejecuta si el resultado de evaluar la expresion1 es verdadero (distinto de cero). En la segunda forma tenemos dos posibilidades: si al evaluar la expresion1 el Anexo I 6-15


resultado es verdadero se ejecuta la sentencia1, pero si el resultado es falso se ejecuta la sentencia2. En cualquier caso sólo una de las dos sentencias se ejecuta. Tras evaluarse la expresión “if” y ejecutarse la sentencia adecuada, el programa continua con la línea siguiente a la de la última sentencia del “if”. Para la sentencia “if” vale como expresión cualquier expresión valida en C, incluso las asignaciones y llamadas a funciones. Cuando hay dos if anidados y a continuación hay un else, este else pertenece al último “if”. Así, en el caso anterior, el primer else corresponde al segundo “if”. Si queremos que un else pertenezca al primer “if” de un “if” anidado deberemos encerrar al segundo entre paréntesis. Por ejemplo:

if (num > 0) { if (num == 1) puts(«num es igual a 1»); } else puts(«num es menor que 0»); B) La sentencia “switch”

switch (variable) { case cte1 : ........... ........... break; case cte2 : ........... ........... break; ............. ............. default : ........... ........... } “Switch” solo puede comprobar la igualdad. Esta sentencia sirve para agrupar varias sentencias “if” en una sola, en el caso particular en el que una variable es comparada a diferentes valores, todos ellos constantes. Primero se evalúa la expresión de control. Se compara con la expresión de la primera etiqueta case. Anexo I 6-16

Lenguaje C

Si son iguales se ejecuta la sentencia1. Luego se vuelve a comparar la expresión de control con la etiqueta del segundo case. De nuevo, si son iguales se ejecuta la sentencia2. Se repite el proceso hasta agotar todas las etiquetas case. Si al llegar a la etiqueta default no se ha ejecutado ninguna otra sentencia. Ésta es la acción por defecto. La etiqueta default es opcional.

6.2.

Bucles

Un bucle es un conjunto de sentencias que se ejecutan repetidamente hasta que se alcanza una condición de fin de bucle o condición de salida. A) El bucle “for” La sintaxis del bucle “for” es:

for (inicio; control; incremento o decremento) sentencia; Este bucle se utiliza para realizar una acción un número determinado de veces. Está compuesto de tres expresiones: la de inicio, la de control y la de incremento, y las sentencias que, si son varias, deben de ir dentro de un bloque (“{ }”). Primero se ejecuta la expresión de inicio. Normalmente‚ ésta es una expresión de asignación a una variable, que le da un valor inicial. Luego se comprueba la expresión de control. Si esta expresión es verdadera, se ejecuta la sentencia o el grupo de sentencias. Si la expresión es falsa, el bucle finaliza. Tras ejecutarse la sentencia se evalúa la expresión de incremento. A continuación se vuelve al segundo paso. El bucle finaliza cuando la expresión de control es falsa. B) El bucle “while” Su sintaxis es la siguiente:

while (expresion) sentencia; El bucle “while” comienza por evaluar la expresión. Si es cierta se ejecutan las sentencias que, si son varias, deben ir dentro de un bloque (“{ }”). Entonces se vuelve a evaluar la expresion1. De nuevo si es verdadera se vuelve a ejecutar la sentencia. Este proceso continua hasta que el resultado de evaluar la expresión es falso. C) El bucle “do / while” La sintaxis de este bucle es:

do sentencia; while (expresion); Anexo I 6-17


o: do { ........... ........... } while (condicion); Su funcionamiento es análogo el del bucle “while”, salvo que la expresión de control se evalúa al final del bucle. Esto nos garantiza que el bucle “do-while” se ejecuta al menos una vez. Podemos incluir dentro del bucle un grupo de sentencias como siempre dentro de un bloque (“{ }”); no obstante, éste es el único bucle en el que no serían obligatorias llaves para encerrar el grupo de sentencias. Por ejemplo:

int i = 5; do printf(«numero %d\n», i); —i; while (i >= 0);

6.3.

Sentencias de salto

A) La sentencia “break” Tiene dos usos: •

Para finalizar un case en una sentencia “switch”.

•

Para forzar la terminación inmediata de un bucle.

Ejemplo:

#include int main() { int i; for(i=0;i<=10;i++){ if(i==3){ /*break acaba con el for*/ break; } printf(«Hola %d\n»,i); } return(0); } Anexo I 6-18

Lenguaje C

B) La sentencia “exit” Para salir de un programa anticipadamente. Da lugar a la terminación inmediata del programa, forzando la vuelta al Sistema Operativo Usa el archivo de cabecera stdlib.h. Ejemplo:

#include int main() { int num; printf(«introduce un numero\n»); scanf(«%d»,&num); if (num==2)

{

/*al introducir el 2, exit obliga a terminar el programa sin ejecutar las sentencias posteriores*/ exit(0); } printf(«Hola\n»); return(0); } C) La sentencia “continue” Hace comenzar la iteración siguiente del bucle, saltando así la secuencia de instrucciones comprendida entre el continue y el fin del bucle. Ejemplo:

#include int main(){ int i; for(i=1;i<=100;i++)

{

if((i-7)%10==0 || (i-3)%10==0) continue; printf(«%d\n»,i); } return(0); }

Anexo I 6-19


D) La sentencia “goto” Esta sentencia está totalmente desaconsejada, y su función es la de permitir el salto de un punto del programa a otro a través de un marcador. • Diferencias entre las sentencias “break” y “continue” en un bucle Hay veces en que interesa romper un bucle en una determinada posición, para ejecutar una nueva pasada del bucle o para finalizar su ejecución. Para realizar estos dos tipos de salto disponemos de dos sentencias: la sentencia “break” y la sentencia “continue”. La sentencia “break” rompe la ejecución de un bucle o bloque de instrucciones y continúa en la instrucción que siga al bucle o bloque. Por ejemplo:

int a = 10; while (a—>=1) { if (a ==· 1) break; printf(«%d\n», a); } printf(“fuera del bucle”); La sentencia “continue” rompe la ejecución habitual del bucle y procede a evaluar de nuevo la expresión del bucle. Actúa como si se saltase al final del bloque de un bucle. Por ejemplo:

int a = 1; while (a++ < 10) { if (a==7) continue; printf(«%d\n», a); }

7.

Arrays

Podemos definir los arrays o tablas de C como una colección de datos del mismo tipo que se denominan o referencian por un mismo nombre común y que son almacenados en posiciones de memoria físicamente contiguas, donde la dirección de memoria más baja corresponde al primer elemento y la más alta al último elemento. Los arrays y los punteros que serán estudiados en la siguiente sección están íntimamente relacionados.

Anexo I 6-20

Lenguaje C

Dentro de los arrays tenemos los siguientes tipos: •

Arrays unidimensionales.

•

Arrays bidimensionales.

•

Arrays multidimensionales.

•

Arrays de caracteres.

•

Arrays indeterminados.

Un array tiene una dimensión y un tamaño. La dimensión viene dada por el número de pares de “[ ]” que éste tenga y el tamaño (no capacidad que ocupa) por la multiplicación de los enteros que se introduce dentro de los corchetes, de tal forma que int x[2][3] tendrá por dimensión dos y por tamaño 2*3. Todos los arrays tienen el 0 como índice de su primer elemento y como último uno menos de su tamaño y los demás tienen la numeración consecutiva. Ejemplo. char c [10]; “array” de caracteres de dimensión uno que tiene 10 elementos, desde c[0] hasta c[9].

7.1.

Declaración de un array

Para crear un array se sigue la misma sintaxis que para la creación de variables, algo normal si pensamos en que realmente son colecciones de variables, de tal forma que para declarar un array de n elementos de un cierto tipo se introduce la línea:

modificadores tipo identificador [n]; Donde n es una constante de tamaño fijo. Si el array es estático o global, el compilador crea el espacio para la matriz al principio del programa. Si es de tipo automático, reservar el espacio en la pila de datos. Como todos los tipos de datos, un array se puede inicializar. Si el array es estático, por defecto cada elemento se inicializa a 0. Si es dinámico, los valores de cada elemento no están definidos y antes de usarlos los debemos inicializar. Para inicializar un array en el momento de su creación añadiremos tras el identificador y los corchetes de tamaño un = y la serie de valores (tipo nombre_array [tamaño] = {lista de valores};). Cada valor debe ser una constante válida para el tipo de datos del array, y cada valor ir separado del valor precedente mediante una coma. Para abrir y cerrar la serie de valores usaremos las llaves. Por ejemplo:

int x [4]={0,1,2,3 }; char y[] = { ‘t’, ‘a’, ‘i’, ‘\0’}; Los “arrays” de carácteres que contienen cadenas permiten una inicialización de la forma:

char nombre_array [tamaño]=»cadena»; Se añade automáticamente el terminador nulo al final de la cadena. Anexo I 6-21


No podemos dar un número de valores mayor al tamaño del “array”, pero si podemos dar menos de los necesarios. El compilador siempre rellenar los demás con ceros. El compilador siempre asignar el primer valor al primer elemento del array, y los demás los asignan consecutivamente. Como siempre, acabaremos la línea con un “;”.

7.2.

Arrays multidimensionales

En C se pueden construir arrays de arrays, es decir, tipos de “arrays” cuyos elementos son a su vez “arrays”. Dado que ahora necesitaremos un índice para situarnos dentro del “array” principal y otro más para movernos dentro de cada uno de los nuevos “arrays”, diremos que los “arrays” de “arrays” poseen dos dimensiones. A un “array” de dos dimensiones se le suele llamar matriz, y a un array de una dimensión, vector. Para crear una matriz de enteros, es decir, un “array” de “arrays” de enteros, se hace de modo análogo a cuando se crea un “array”, salvo que ahora se añade el nuevo índice entre corchetes. Por ejemplo:

int matriz[8][9]; Declara una matriz de 8 filas por 9 columnas, o 9 por 8 columnas, según queramos representar. La elección de cuál índice representa las filas y cuál las columnas es arbitrario. Podemos usar la norma habitual en matemáticas: el de la izquierda representa filas y el de la derecha columnas. Es decir, en el caso particular de los Arrays Bidimensionales se declaran utilizando la siguiente forma general:

tipo nombre_array [tamaño 2ª dim] [tamaño 1ª dim]; Ejemplo ——-> int x [10][20]; Los “arrays” multidimensionales siguen la misma sintaxis, pero en vez de ser de dos dimensiones, son de la dimensión que nosotros le indiquemos.

7.3.

Cadenas de caracteres Hay un tipo de “arrays” de especial importancia; las cadenas de caracteres.

Una cadena de caracteres es un array de caracteres que acaba con el carácter nulo. En C siempre las cadenas de caracteres acaban con este carácter. Esto se hace así por dos motivos: el tamaño de la cadena no tiene un límite prefijado: puede ser tan grande como lo permita la memoria. Las operaciones de manipulación de cadenas de caracteres se simplifican bastante. Para inicializar una cadena de caracteres basta crear un array de caracteres, en el que no necesitamos definir el tamaño e inicializarlo con la cadena de caracteres entrecomillada. Observar que el compilador siempre añade un carácter nulo al final, por lo que el tamaño del “array” es una unidad mayor del aparente. Por ejemplo:

char cadena[] = «hola, holita» Anexo I 6-22

Lenguaje C

Los caracteres especiales como el tabulador \t y el retorno de carro \r se almacenan como un único carácter. El carácter nulo está representado por un 0.

7.4.

Acceso a los miembros de un array

Para usar un elemento de un array se utiliza el identificador y el número de orden del elemento. Al primer elemento siempre le corresponde el número 0. Así

printf («%d», vector[0]) imprimiría el contenido del primer elemento del “array” que definimos antes, que lo habíamos inicializado a 0. En el lenguaje C no se hace ningún control acerca de si intentamos leer un número de elemento mayor que el último número del array. Esto es lo que llama sobrepasar el límite, y el compilador deja al programador la tarea de preocuparse por los límites del array. Si los sobrepasamos, pueden ocurrir resultados imprevisibles.

7.5.

Arrays indeterminados

El tamaño de los “arrays” es siempre constante y se especifica al crear el “array”. Hay dos formas de especificar el tipo índice: dándoselo explícitamente al compilador o haciéndolo implícitamente. Para dar un tamaño al “array” simplemente indicamos el número de elementos entre los corchetes. El otro modo consiste en hacer que sea el compilador el que decida el tamaño. Esto se hace cuando en la creación del “array” le damos una lista de valores iniciales. En este caso, si omitimos el tamaño del “array”, el compilador ajusta el tamaño del “array” según el número de elementos que le demos para inicializar el array. Por ejemplo:

int vector[] = { 1, 2, 3, 4, 5, 6 }; Ejemplo de programa:

#include int main(){ int datos[10][10],i,j; //se carga la matriz con la suma de filas y columnas, se visualiza for(i=0;i<10;i++) { for(j=0;j<10;j++) { datos[i][j]=i+j; printf(«%d\t»,datos[i][j]); } printf(«\n»); } return(0); } Anexo I 6-23


8.

Punteros

Un puntero es una variable que contiene como valor una dirección de memoria de otra variable. Un puntero es un nuevo tipo de datos, que no contiene un dato en sí, sino que contiene la dirección donde podemos encontrar el dato. Decimos que un puntero «apunta» a un dato, pudiendo alterar dicho dato a través del puntero.

8.1.

Definición de un puntero

Para poder usar punteros y direcciones de datos vamos a introducir dos nuevos operadores. El primero es el operador puntero(“*”), que nos permite definir las variables como punteros y también acceder a los datos. El otro nuevo operador, el operador dirección (”&”), que nos permite obtener la dirección en la que se haya ubicada una variable en la memoria. El operador dirección es el complementario al operador puntero. Todo puntero tiene asociado un tipo de datos que es conveniente que coincida con el tipo de dato de la variable a la cual va a apuntar. Un puntero se define igual que una variable normal, salvo que delante del identificador colocaremos un asterisco. Ejemplo: char *c; /* puntero a entero */ Normalmente, al definir un puntero, lo solemos inicializar para que apunte a algún dato. Disponemos de tres formas de inicializar un puntero: —

inicializarlo con la dirección de una variable que ya existe en memoria. Ejemplo: char *x = &c;

—

asignarle el contenido de otro puntero que ya esta‚ inicializado: char *x = &c; char *y = x;

—

inicializarlo con cualquier expresión constante que devuelva un valor.

Siempre se debe inicializar el puntero antes de usarlo. Una vez que el puntero apunta a un objeto o dato en la memoria podemos emplear el puntero para acceder al dato. A este proceso se la llama desreferenciar el puntero, debido a que es una operación inversa a obtener la dirección de una variable. Para desreferenciar un puntero se utiliza el operador puntero. Para acceder al dato al que apunta el puntero basta colocar el asterisco * delante del identificador. Como norma de buena escritura no se deja ningún espacio entre el * y el identificador, aunque el compilador lo acepte. Un puntero desreferenciado se comporta como una variable normal. Por ejemplo:

int x = 100; int *punt = &entero; printf(«%d %d \n», *punt, x); Un uso habitual de los punteros es para recorrer los arrays. Para ello, basta con que el puntero apunte al primer elemento del array y luego, usando la aritmética de los punteros, podemos a acceder a todos los elementos del array a través del puntero. Ejemplo:

int x[] ={ 0,1, 2, 3, 4, 5}; int *punt = x;

Anexo I 6-24

Lenguaje C

En este momento el puntero apunta al primer miembro del array (no se usa el & para indicar el array). Ejemplo: printf(«%d\n», *(punt+2)); // imprimiría 2

8.2.

Arrays y punteros Un nombre de “array” sin índice es un puntero al primer elemento del array.

Ejemplo: //Estas sentencias son idénticas: char p[10]; - p - &p[0]; int *p, i[10]; p=i; // ambas sentencias ponen el valor 100 en el sexto elemento de i. i[5]=100; *(p+5)=100; . int a[10][10]; a=&a[0][0]; a[0][4]=*((*a)+4); char cad[80], *p1; p1 = cad cad[4] o *(p1+4) // Para acceder al quinto elemento de cada.

8.3.

Indirección múltiple punteros a punteros

Consiste en que un puntero contiene la dirección de otro puntero que a su vez apunta a una variable. Ejemplo: int x; int *y=&x; int **z=&y; Ejemplo:

main() { int x, *p, **q; x=10; p=&x; q=&p; Anexo I 6-25


printf(«%d»,**q); /* imprime el valor de x */ return 0; } Cuando trabajamos con cadenas de caracteres podemos recurrir a la inialización del puntero a la cadena directamente. Ejemplo: char *cad=”hola, holita”;

8.4.

Arrays de punteros Se pueden crear “arrays” formados por punteros. Ejemplo: “Array” de punteros a enteros: int *x [10];

Para asignar la dirección de una variable entera llamada var al tercer elemento del “array” de punteros, se escribe: x[2]=&var; Para encontrar el valor de var: *x[2]

9.

Cadenas de caracteres

Como habíamos definido, una cadena de caracteres es un array de caracteres cuyo ultimo carácter es el carácter nulo ‘\0’. Para definir una cadena de caracteres basta definir un array de caracteres del tamaño conveniente, dejando espacio para el carácter nulo. Por ejemplo: char cad[] = «Hola»; La mayoría de las funciones de cadenas de la librería estándar comienzan con el prefijo str y se hayan definidas en el fichero de cabecera . Las funciones más importantes de esta librería son: •

strlen(cad). Devuelve el tamaño de una cadena de caracteres, sin incluir el carácter nulo de terminación.

•

strcpy(s1,s2). Copia la cadena s2 en la cadena s1, incluyendo el carácter de terminación y devuelve un puntero a s1. Los dos parámetros que necesita son punteros a caracteres, y devuelve un puntero a caracteres.

•

strcat(s1, s2). Copia la cadena s2 al final de la cadena s1. Para ello busca el carácter de terminación de s1 y a partir de allí va colocando sucesivamente los caracteres de s2, incluyendo el carácter de terminación.

•

strchr(cad, c). Busca el carácter c a lo largo de la cadena cad. Si lo encuentra devuelve un puntero a la primera posición del carácter. Si

Anexo I 6-26

Lenguaje C

falla la búsqueda devuelve un puntero nulo. La función tiene dos par metros, el puntero a la cadena en la que buscar el carácter y el carácter a buscar. •

strcmp(s1, s2). Devuelve 0 si s1 y s2 son iguales, menor que 0 si s1s2.

Aquí tenemos las declaraciones de las funciones anteriores:

char *strcpy (char *s1, const char *s2);. char *strcat (char *s1, consta char *s2); int strlen (const char *s1); int strcmp (const char *s1, const char *s2);

10. Estructuras, uniones, enumeraciones y typedef 10.1. Estructuras Una estructura es un tipo de datos compuesto por un grupo de datos, cada uno de los cuales puede ser de un tipo distinto. A cada componente de la estructura se le llama campo. A) Definición de una estructura Para la definición de estructuras el C dispone de la palabra reservada “struct”. Para crear una estructura primero comenzamos por definir el tipo de estructura. Para ello se procede de manera parecida a la definición de una variable. La forma general de una definición de estructura es:

struct etiqueta { tipo nombre_variable; tipo nombre_variable; ....... ........ } variables _de_estructura; Ejemplo:

struct estru { int x; char cad[10];

Anexo I 6-27


float sueldo ; double real; double imaginario; }; Una vez que hemos definido un tipo de estructura ya podemos definir variables estructuras de dicho tipo. Esto se hace de una forma análoga a la definición de variables normales, esto es, se pone la palabra reservada struct, el identificador del tipo de estructura y el identificador de la nueva estructura. Por ejemplo:

struct estru xxx; También se puede definir una variable estructura a la vez que se define el tipo de estructura. Ejemplo:

struct estru{ double x ; double y; } z1, z2; Podemos definir variables estructuras sin tipo específico. Ejemplo:

struct { int x; char y[14]; int z; } zorro; A los elementos individuales de la estructura se hace referencia utilizando . (punto). Forma general es: nombre_estructura.elemento Ejemplo:

zorro.z = 12345; B) Arrays de estructuras Se define primero la estructura y luego se declara una variable “array” de dicho tipo. Ejemplo:

struct dir info_dir [100]; Para acceder a una determinada estructura se indexa el nombre de la estructura:

info_dir [2].codigo = 12345; Anexo I 6-28

Lenguaje C

C) Punteros a estructuras Declaración: struct dir * pruntero_dir; Existen dos usos principales de los punteros a estructuras: •

Para pasar la dirección de una estructura a una función.

•

Para crear listas enlazadas y otras estructuras de datos dinámicas.

Para encontrar la dirección de una variable de estructura se coloca & antes del nombre de la estructura. Ejemplo:

struct bal { float balance; char nombre[80]; } persona; struct bal *p; p = &persona; //coloca la dirección de la estructura persona en el puntero No podemos usar el operador punto para acceder a un elemento de la estructura a través del puntero a la estructura. Debemos utilizar el operador flecha “->”. Ejemplo: p -> balance.

10.2. Uniones Una unión es un tipo de datos formado por un campo capaz de almacenar un solo dato pero de diferentes tipos. Dependiendo de las necesidades del programa el campo adoptar uno de los tipos admitidos para la unión. Para definir uniones el C utiliza la palabra reservada unión. La definición y el acceso al campo de la unión es análogo al de una estructura. Al definir una variable de tipo unión el compilador reserva espacio para el tipo que mayor espacio ocupe en la memoria. Siempre hay que tener en cuenta que sólo se puede tener almacenado un dato a la vez en la variable. En C es responsabilidad del programador el conocer qué tipo de dato se esta guardando en cada momento en la unión. Para definir una unión seguimos la misma sintaxis que para las estructuras. Ejemplo:

union un { int num1; float num2; } var_union; Define una unión en la que el campo puede ser de tipo entero o de tipo número con coma flotante.

Anexo I 6-29


10.3. Enumeraciones Una enumeración es un conjunto de constantes enteras con nombre. Su sintaxis es: enum identificador {lista de constantes simbólicas} variables_enumeracion;

enum enum { x, y , z=10, t} var_enum;

Ejemplo:

en la enumeración anterior cuando var_enum tome el valor x valdra 0, cuando tome el valor y valdrá 1, cuando tome el valor z valdrá 10 y cuando tome el valor t valdrá 11.

10.4. Typedef Sirve para definir nuevos nombres para los tipos de datos. Ejemplo:

typedef float real; real x; //estaríamos declarando la x como tipo float

11. Funciones Una función es un módulo o parte de una aplicación informática que forma un bloque o unidad de código. Es el lugar en donde se produce la actividad del lenguaje C. Gracias al empleo de funciones se facilita el mantenimiento y el uso futuro de ellas. El lenguaje C contiene muchas funciones ya predefinidas en bibliotecas (librerías) tanto del sistema como también el programador puede insertar las suyas. Por tanto, una función es una rutina o conjunto de sentencias que realiza una determinada labor. Las funciones admiten argumentos, que son datos que le pasan a la función las sentencias que la llaman. • Definición de una función La sintaxis base de toda funcion es:

tipo_devuelto nombre_funcion (lista de parámetros) { ............ /* bloque de código */ ............ } —

tipo_devuelto especifica el tipo de valor que devuelve la sentencia return de la función.

—

identificador es el nombre de la función. Debe ser un identificador válido.

—

lista_de_argumentos es una lista de variables, separadas por comas, que conforman los datos que le pasamos a la función.

Anexo I 6-30

Lenguaje C

La lista de argumentos es opcional. Un ejemplo es la función main(), que en principio no tiene argumentos. Cuando el programa al ejecutarse alcanza la llave de cierre ‘}’ de la función, ésta finaliza y devuelve el control al punto del programa que la llamó. Para obligar a la función a retornar un determinado valor se utiliza la sentencia return, seguida del valor a retornar. Los tipos de datos escalares son los punteros, tipos numéricos y el tipo carácter. En C no se pueden devolver arrays ni estructuras. • Paso de parámetros a una función Utilizando la lista de argumentos podemos pasar parámetros a una función. En la lista de parámetros se suele colocar un conjunto de identificadores, separados por comas, que representan cada uno de ellos a uno de los parámetros de la función. El orden de los parámetros es importante. Para llamar a la función habrá que colocar los parámetros en el orden en que la función los espera. Cada parámetro puede tener un tipo diferente. Para declarar el tipo de los parámetros añadiremos entre el paréntesis ‘)’ y la llave ‘{‘ una lista de declaraciones, similar a una lista de declaraciones de variables. Ejemplo:

Archivo1.c: #include void imp_may(char *cadena) { int i; for(i=0;cadena[i];i++) cadena[i]=toupper(cadena[i]); } Archivo2.c: #include #include void imp_may(char *cadena); int main() { char x[80]; printf(«introduce una cadena de caracteres\n»); gets(x); imp_may(x);//llamada a la f por referencia printf(«\n\nla cadena nueva es\n»); printf(«%s\n\n»,x); return(0); } Anexo I 6-31


• Paso de parámetros por valor y por referencia En los lenguajes de programación estructurada hay dos formas de pasar variables a una función: por referencia o por valor. Cuando la variable se pasa por referencia función puede acceder a la variable original. En C todos los parámetros se pasan por valor. La función recibe una copia de los parámetros y variables, y no puede acceder a las variables originales. Cualquier modificación que efectuemos sobre un parámetro no se refleja en la variable original. En determinadas ocasiones necesitaremos alterar el valor de la variable que le pasamos a una función. Para ello en el C se emplea el mecanismo de los punteros. • Llamada por valor Copia el valor de un argumento en el parámetro formal de la subrutina. Los cambios en los parámetros de la subrutina no afectan a las variables usadas en la llamada. int cuad (int x); main ( ) { int t=10; printf («%d %d»,cuad(t),t); return 0; }

cuad (int x) { x=x*x; return(x); }

Salida es “100 10” • Llamada por referencia Es posible causar una llamada por referencia pasando un puntero al argumento. Se pasa la dirección del argumento a la función, por tanto es posible cambiar el valor del argumento exterior de la función.

int x,y; inter (&x,&y);

inter (int *x,int *y) { int temp; temp=*x; *x=*y; *y=temp; }

• Declaración y comprobación de tipos (Prototipo) Al igual que para las variables, cuando una función se va a usar en un programa antes del lugar donde se define, o cuando una función se define en otro fichero (funciones externas), la función se debe declarar. Anexo I 6-32

Lenguaje C

La declaración de una función consiste en especificar el tipo de datos que va a retornar la función, el identificador de la función y el número de argumentos y su tipo. Una declaración típica de función es: tipo_devuelto identificador( lista_de_argumentos_con_tipo ); Esto avisa al compilador de que la función ya existe, o que la vamos a definir después. Ejemplo:

void hola(int *x);

• Funciones recursivas Una función se dice recursiva cuando se llama a sí misma. Ejemplo:

int fact (int x)

{

int factorial; if(x==1) return 1; factorial=x* fact(x-1); return factorial; }

12. Memoria dinámica •

malloc (n) reserva una porción de memoria libre de n “bytes” y devuelve un puntero sobre el comienzo de dicho espacio.

•

free (p) libera la memoria apuntada con el puntero p.

Ambas funciones utilizan el archivo de cabecera “stdlib.h” Si no hay suficiente memoria libre para satisfacer la petición, “malloc ( )” devuelve un nulo. Ejemplo:

char *p; p=malloc(1000000);

13. Entrada y Salida por consola (estándar) Un programa en C se comunica con el usuario y con el sistema a través de las funciones de entrada y salida. Con estas funciones se pueden solicitar y enviar datos al terminal del usuario y a otros programas. Además, podemos elegir entre enviar datos binarios o enviarlos como cadenas de texto. Las funAnexo I 6-33


ciones de entrada y salida en C más habituales son las que forman parte de la llamada «librería estándar».

13.1. Entrada y salida de caracteres En la librería estándar se definen las dos principales vías de comunicación de un programa en C: la entrada estándar y la salida estándar. Generalmente ambas están asociadas a nuestro terminal de manera que cuando se imprimen datos en la salida estándar los caracteres aparecen en el terminal, y cuando leemos caracteres de la entrada estándar los leemos del teclado del terminal. La entrada y salida estándar trabaja con caracteres (en modo carácter), con datos o números binarios. Es decir, todos los datos que enviemos a la salida estándar deben ser cadenas de caracteres. Por ello, para imprimir cualquier dato en la salida estándar primero deberemos convertirlo en texto, es decir, en cadenas de caracteres. Sin embargo esto lo haremos mediante las funciones de librería, que se encargan de realizar esta tarea eficientemente. Comenzaremos con las dos funciones principales de salida de caracteres: putchar() y getchar(). La función putchar escribe un único carácter en la salida estándar. Su uso es sencillo y generalmente está implementada como una macro en la cabecera de la librería estándar. La función “getchar()” devuelve el carácter que se halle en la entrada estándar. Esta función tiene dos particularidades. La primera es que aunque se utiliza para obtener caracteres no devuelve un carácter, sino un entero. Esto se hace así ya que con un entero podemos representar tanto el conjunto de caracteres que cabe en el tipo carácter (normalmente el conjunto ASCII de caracteres) como el carácter EOF de fin de fichero. En UNIX es habitual representar los caracteres usando el código ASCII, tanto en su versión de 7 bits como en su versión ampliada a 8 bits. Estos caracteres se suelen representar como un entero que va del 0 al 127 o 256. El carácter EOF entonces es representado con un -1. Además, esto también lo aplicaremos cuando leamos los ficheros binarios “byte” a “byte”. Una tercera función de caracteres que no es muy frecuente es la función ungetchar(). Con ella devolvemos al sistema el ultimo carácter que hemos leído con “getchar()”. No se puede llamar dos veces seguidas a “ungetchar”. El porqué‚ queda más claro al explicar el uso de “ungetchar”. Habitualmente, cuando leemos un conjunto de caracteres de la entrada estándar le pediremos que sean de un determinado tipo. Si, por ejemplo, queremos leer un dato numérico bastará con hacer un bucle que lea números (caracteres numéricos). El bucle normalmente terminará cuando el carácter leído no sea un número. La mejor forma de saber si el siguiente carácter es un número es leerlo. Pero al leerlo, si no es un número ya no estará disponible para futuras lecturas. Aquí es donde se usa “ungetchar()”. Una vez que hemos comprobado que no es un número lo devolvemos, y así estará listo para la siguiente lectura. Visto esto podemos seguir con las funciones gets() y puts(). La función “puts()” simplemente se imprime una cadena de caracteres en la salida estándar. Le debemos proporcionar la dirección donde encontrar la cadena de caracteres. Como ejemplo vamos a dar una implementación sencilla de esta función:

Anexo I 6-34

Lenguaje C

void putchar(char *p) { while (*p) putchar(*p++); } realmente la función “puts” es más complicada, pues devuelve un EOF si ha ocurrido algún error. Para imprimir datos de un modo más general el C dispone de la función printf(), que se ocupa de la impresión formateada en la salida estándar. La función “printf()” imprime los datos en la salida estándar según una cadena de control. Está definida en la cabecera estándar stdio.h como: int printf(const char *formato, ...); La función “printf()” tiene varias características peculiares. La primera es que es una función común número variable de argumentos. Normalmente a estas funciones se las llama variadic, y se reconocen porque incluyen en su línea de argumentos el símbolo de elipsis (tres puntos ...). Sólo el primer parámetro es obligatorio, y es del tipo puntero constante a carácter. Esta cadena tiene dos funciones: imprimir un mensaje en la salida estándar y formatear los demás argumentos que se la pasan a la función para ser impresos como texto. • Funcionamiento de la función printf() Si llamamos a la función “printf()” simplemente con una cadena de caracteres la función fprintf la imprime de modo parecido a como lo hace la función “puts()”. El prototipo de “printf ( )” es:

int printf (const char *cad_fmt, ...); Por ejemplo:

printf(«Hola, holita\n»); Imprime la cadena «Hola, holita\n» en la salida estándar. Pero, además, la función printf es capaz de imprimir otros tipos de datos como variables numéricas en la salida estándar. Para ello debemos avisar a la función “printf()” de que le pasamos como argumento una variable, ya que la función no tiene modo alguno de saber si le hemos pasado algún parámetro. El modo de hacerlo es insertando códigos de control en la cadena de formato. Estos códigos normalmente van precedidos del carácter %. Por ejemplo, el código %d representa enteros en formato decimal. Así, la forma de imprimir una variable entera en la salida estándar es:

printf(«esto es un entero: %d\n», 10); Anexo I 6-35


Cuando “printf()” se encuentra el código %d en la cadena de formato lee el siguiente argumento de la función, que debe ser un entero, y lo convierte en su representación decimal como cadena de caracteres. La cadena que representa al número sustituye al código %d de la cadena de formato y se imprime la cadena resultante. Hay una gran variedad de códigos de control para formatear los diferentes tipos de datos. Los más importantes son: La cadena de formato consiste en dos tipos de elementos: caracteres que se mostrarán en pantalla y órdenes de formato que empiezan con un signo de porcentaje y va seguido por el código del formato. •

%c un único carácter.

•

%d decimal.

•

%i decimal.

•

%e notación científica.

•

%f decimal en coma flotante.

•

%o octal.

•

%s cadena de caracteres.

•

%u decimales sin signo.

•

%x hexadecimales.

•

%% imprime un signo %.

•

%p muestra un puntero.

Las órdenes de formato pueden tener modificadores que especifiquen la longitud del campo, número de decimales y el ajuste a la izquierda. Un entero situado entre % y el código de formato actúa como un especificador de longitud mínima de campo. Si se quiere rellenar con ceros, se pone un 0 antes del especificador de longitud de campo. —

%05 rellena con ceros un número con menos de 5 dígitos.

—

%10.4f imprime un número de al menos diez caracteres con cuatro decimales.

Si se aplica a cadenas o enteros el número que sigue al punto especifica la longitud máxima del campo. —

%5.7s imprime una cadena de al menos cinco caracteres y no más de siete.

Entre el código de alineación y el código de control podemos insertar un valor de anchura de campo que controla el ancho de la conversión. Por ejemplo:

printf(«:%3d:», 4); /* imprime : 3: */ Anexo I 6-36

Lenguaje C

También podemos especificar un valor que controle el número de dígitos decimales en un valor real. Este valor se coloca tras la anchura de campo precedido de un punto. Por ejemplo:

printf(«%.3f», 3.99999); /* imprime 3.999 */ Para cadenas de caracteres también podemos insertar un valor que permite escoger cuantos caracteres se imprimen de la cadena. Para ello daremos este valor tras un punto, al igual que hacemos para el valor de precisión. Por ejemplo:

printf(«%.4s\n», «Hola, holita\n»); /* imprime Hola */

13.2. La función scanf() La función “scanf()” hace el trabajo inverso a la función “printf()”, es decir, examina la entrada estándar y carga valores en variables. Se define como: int scanf(const char *formato, ...); Esta función trabaja de un modo parecido a como lo hace “printf()”. Necesita una cadena que indica el formato de los datos que se deben leer. La cadena de formato no se imprime, sino que sólo sirve para que “scanf()” determine el tipo de datos a leer. El resto de los argumentos deben ser punteros a las variables donde se deben almacenar los datos leídos. Por ejemplo: scanf(«%d», &i); Lee un entero en formato decimal y lo almacena en la variable i. Hay que tener cuidado de pasar siempre punteros a “scanf()”, por lo que para guardar datos en variables normales deberemos emplear el operador dirección &. Los códigos de control son análogos a los de printf, es decir, %d., %e, %s, ... La función “scanf()” es bastante sensible a los errores. Si el usuario introduce los datos incorrectamente, la función “scanf()” simplemente falla. Si queremos realizar una función de lectura más robusta podemos realizar lo siguiente: —

Leemos la entrada en un array de caracteres. Para ello, simplemente usaremos la función “gets()”.

—

Exploramos el array de caracteres manualmente paso a paso. Para ello, podemos usar la función “sscanf()”.

La función sscanf se define como: int sscanf(const char *s, const char *formato, ...); Realiza una tarea parecida a “scanf()”, pero explorando la cadena apuntada por s en vez de la entrada estándar. De este modo podemos ir exploranAnexo I 6-37


do la cadena leída previamente con gets() paso a paso e informando al usuario del lugar donde ha cometido un error al introducir los datos.

13.3. Otras funciones para la entrada/salida estándar •

getche ( ): lee un carácter del teclado, espera hasta que se pulse una tecla y entonces devuelve su valor. El eco de la tecla pulsada aparece automáticamente en la pantalla. Requiere el archivo de cabecera “conio.h”

•

putcahr ( ): imprime un carácter en la pantalla.

Los prototipos son: int getche (void); int putchar (int c); Hay dos variaciones de getche( ):

•

—

getchar ( ): función de entrada de caracteres definida por el ANSI C. El problema es que guarda en un “buffer” la entrada hasta que se pulsa la tecla INTRO.

—

getch ( ): trabaja igual que “getche( )” excepto que no muestra en la pantalla un eco del carácter introducido.

gets ( ) y puts ( ): permiten leer y escribir cadenas de caracteres en la consola. gets ( ): lee una cadena de caracteres introducida por el teclado y la sitúa en la dirección apuntada por su argumento de tipo puntero a carácter. Su prototipo es:

char * gets (char *cad); Ejemplo:

main ( ) { char cad[12]; gets (cad); return (0); } puts ( ): escribe su argumento de tipo cadena en la pantalla seguido de un carácter de salto de línea. Su prototipo es:

char * puts (const char *cad);

Anexo I 6-38

Lenguaje C

14. Entrada y salida con ficheros 14.1. Apertura y cierre de un fichero Para abrir un fichero, primero debemos crear una variable de tipo puntero a FILE. Este puntero permitirá realizar las operaciones necesarias sobre el fichero. Este puntero deberá apuntar a una estructura de tipo FILE. Estas estructuras son creadas por el sistema operativo al abrir un fichero. Para poder inicializar nuestro puntero a fichero bastará llamar a la función fopen(). Esta función intenta abrir un fichero. Si tiene éxito creará una estructura de tipo FILE y devuelve un puntero a FILE que apunta a la estructura creada. En caso de no poder abrir el fichero devuelve en puntero nulo. La función “fopen()” se define en la cabecera estándar “stdio.h” como:

FILE *fopen( const char * filename, const char *modo); Necesita dos argumentos del tipo puntero a carácter. Cada uno de ellos debe apuntar a una cadena de caracteres. El primero indica el nombre del fichero a abrir. En UNIX y otros sistemas se puede especificar con el nombre del fichero el directorio donde se abrirá el fichero. El segundo indica el modo en el que se abrirá el fichero. Hay que tener cuidado en pasar un puntero a cadena de caracteres y no un solo carácter. Es fácil cometer la equivocación de pasar como segundo argumento un carácter ‘r’ en vez de la cadena «r». Los modos mas frecuentes de abrir un fichero son: •

«r» Abre un fichero de texto que existía previamente para lectura.

•

«w» Crea un fichero de texto para escritura si no existe el fichero con el nombre especificado, o trunca (elimina el anterior y crea uno nuevo) un fichero anterior.

•

«a» Crea un fichero de texto si no existe previamente o abre un fichero de texto que ya existía para añadir datos al final del fichero. Al abrir el fichero el puntero del fichero queda posicionado al final del fichero.

•

«rb» Funciona igual que «r» pero abre o crea el fichero en modo binario.

•

«wb» Análogo a «w» pero escribe en un fichero binario.

•

«ab» Análogo a «a» pero añade datos a un fichero binario.

•

«r+» Abre un fichero de texto ya existente para lectura y escritura.

•

«w+» Abre un fichero de texto ya existente o crea uno nuevo para lectura y escritura.

•

«a+» Abre un fichero de texto ya existente o crea un fichero nuevo para lectura y escritura. El indicador de posición del fichero queda posicionado al final del fichero.

•

«r+b» ¢ «rb+» Funciona igual que «r+» pero lee y escribe en un fichero binario.

Anexo I 6-39


•

«w+b» ¢ «wb+» Análogo a «w+» pero en modo binario.

•

«a+b» ¢ «ab+» Análogo a «a+» pero en modo binario.

Una llamada típica a la función fopen() es la siguiente:

FILE *fp; if (( fp = fopen( «datos», « r»)) = = NULL) perror( «No se puede abrir el fichero\n»); Para cerrar un fichero basta llamar a la función fclose que se define en stdio.h como:

int fclose(FILE *fichero); Su argumento es un puntero a una estructura FILE asociada a algún fichero abierto. Esta función devuelve 0 en caso de éxito y EOF en caso de error.

14.2. Lectura y escritura sobre un fichero Para leer y escribir en un fichero en modo texto se usan funciones análogas a las de lectura y escritura de la entrada y salida estándar. La diferencia estriba en que siempre se deberá dar un puntero a FILE para indicar sobre qué fichero efectuaremos la operación, ya que se pueden tener simultáneamente abiertos varios ficheros. Las funciones que trabajan con ficheros tienen nombres parecidos a las funciones de entrada y salida estándar, pero comienzan con la letra f. Las más habituales son: • int fprintf (FILE *fichero, const char *formato, ... );

/* trabaja igual que printf() sobre el fichero */

• int fscanf (FILE *fichero, const char *formato, ... );

/* trabaja igual que scanf() sobre el fichero */

• int fputs (const char *s, FILE *fichero );

/* escribe la cadena s en el fichero */

• int fputc (int c, FILE *fichero);

/* escribe el carácter c en el fichero */

• int fgetc (FILE *fichero);

/* lee un carácter del fichero */

• char *fgets( char *s, int n, FILE * fichero);

/* lee una línea del fichero */

Hay una equivalencia entre las funciones de lectura y escritura estándar y las funciones de lectura y escritura de ficheros. Normalmente las funciones de lectura y escritura estándar se definen en la cabecera estándar como macros. Así la línea:

printf(«hola\n»); es equivalente a la escritura en el fichero stdout:

fprintf(stdout, «hola\n»); A los ficheros “stdin” y “stdout” normalmente se accede con las funciones de lectura y escritura estándar. Estos ficheros son automáticamente abiertos y cerrados por el sistema. Para escribir en la salida de error estándar se deben usar las funciones de ficheros con el fichero “stderr”. Normalmente en UNIX se rediAnexo I 6-40

Lenguaje C

rige la salida de error estándar a la impresora. Esta salida de error es muy útil en los procesos por lotes y cuando se usan filtros. Un filtro es simplemente un programa que lee datos de la entrada estándar, los procesa y los envía a la salida estándar. Por ello, es conveniente que no se mezclen los mensajes de error con el resultado del proceso. Un ejemplo de filtro sería un programa que expande los caracteres de tabulación en espacios en blanco. Si el programa se llama convierte y se quiere procesar el fichero mifichero, se deberá escribir la línea:

cat mifichero | convierte > nuevofichero Se han usado los mecanismos del UNIX de redirección (> envía la salida estándar de un programa a un fichero), de tubería (| conecta la salida estándar de un programa con la entrada estándar de otro) y la utilidad cat, que envía un fichero a la salida estándar.

14.3. Lectura y escritura de datos binarios Para leer y escribir grupos de datos binarios, como por ejemplo “arrays” y estructuras, la librería estándar provee dos funciones: fread() y fwrite(). Se declaran en stdio.h como:

size_t fread(void *p, size_t longitud, size_t numelem, FILE *fichero); size_t fwrite(void *p, size_t longitud, size_t numelem, FILE *fichero); La función “fread()” lee del fichero pasado como último argumento un conjunto de datos y lo almacena en el array apuntado por p. Se debe especificar en longitud la longitud del tipo de datos a leer y en numelem el número de datos a leer. La función fwrite() se comporta igual que “fread()” pero escribe los datos desde la posición apuntada por p en el fichero dado. Como siempre, para usar estas funciones, se debe abrir el fichero y cerrarlo después de usarlas. Por ejemplo, para leer un array de 100 enteros:

int array[100]; FILE *fp; fp = fopen(«mifichero», «rb»); fread(array, sizeof(int), 100, fp); fclose(fp); Estas funciones devuelven el número de elementos leídos. Para comprobar si ha ocurrido un error en la lectura o escritura se usará la función ferror (FILE *fichero), que simplemente devuelve un valor distinto de 0 si ha ocurrido un error al leer o escribir el fichero pasado como argumento. Al escribir datos binarios en un fichero se deben tener en cuenta consideraciones de portabilidad. Esto es debido a que el orden en que se almacenan los bytes que componen cada tipo de datos en la memoria puede variar de unos sistemas a otros, y las funciones “fread()” y “fwrite()” los leen y escriben según estén en la memoria. Anexo I 6-41


14.4. Operaciones especiales con los ficheros Para comprobar si se ha alcanzado el fin de fichero, por ejemplo cuando se lee un fichero binario con “fread()”, se puede emplear la función feof(), que se define en stdio.h como:

int feof (FILE *fichero); Esta función devuelve un 0 si no se ha alcanzado el fin de fichero y un valor distinto de 0 si se alcanzó el fin de fichero. Para comprobar si ha ocurrido un error en la lectura o escritura de datos en un fichero disponemos de la función ferror, que se declara en stdio.h como:

int ferror (FILE *fichero); Esta función devuelve un valor distinto de 0 si ha ocurrido algún error en las operaciones con el fichero y un 0 en caso contrario. Estas dos funciones trabajan leyendo los indicadores de fin de fichero y error de la estructura FILE asociada a cada fichero. Podemos limpiar ambos indicadores utilizando la función clearerr(), que se define en stdio.h como:

void clearerr (FILE *fichero);

14.5. Posicionamiento del indicador de posición del fichero Cuando se manejan ficheros de acceso aleatorio se necesita poder colocar el indicador de posición del fichero en algún punto determinado del fichero. Para mover el puntero del fichero la librería estándar proporciona la función “fseek()”, que se define en stdio.h como:

int fseek (FILE *fichero, long desplazamiento, int modo); La función devuelve un 0 si ha tenido éxito y un valor diferente en caso de error. El argumento desplazamiento señala el número de caracteres que hay que desplazar el indicador de posición. Puede ser positivo o negativo, o incluso 0, ya que hay tres modos diferentes de desplazar el indicador de posición. Estos modos se indican con el argumento modo. En stdio.h se definen tres macros que dan los posibles modos. La macro SEEK_SET desplaza al indicador de posición desde el comienzo del fichero. La macro SEK_CUR desplaza el indicador de posición desde la posición actual y, la macro SEEK_END desplaza al indicador de posición desde el final del fichero. Para este último modo se debe usar un valor de desplazamiento igual o menor que 0. Para ver en qué posición se halla el puntero del fichero se puede usar la función “ftell()”, que se define en stdio.h como:

long ftell (FILE *fichero);

Anexo I 6-42

Lenguaje C

Para un fichero binario “ftell()” devuelve el número de bytes que está desplazado el indicador de posición del fichero desde el comienzo del fichero. Además, para llevar el indicador de posición al comienzo del fichero, tenemos la función rewind(), que se define en stdio.h como:

void rewind( FILE * fichero); Esta función simplemente llama a “fseek” (fichero, 0L, SEEK_SET) y luego limpia el indicador de error.

14.6. Otras operaciones con ficheros La librería estándar proporciona algunas funciones adicionales para manejar ficheros. Por ejemplo, la función remove(), que se define en stdio.h como:

int remove(const char *nombrefichero); Esta función elimina el fichero de nombre nombrefichero. Conviene cerrar el fichero antes de eliminarlo. También disponemos de una función para renombrar el fichero, la función rename(), definida en stdio.h como:

int rename(const char *antiguo, const char *nuevo); intenta renombrar al fichero de nombre antiguo. Si tiene éxito devuelve un 0. Hay que asegurarse antes de que no existía un fichero de nombre nuevo. Otra función para abrir ficheros es freopen(), que se define en stdio.h como:

FILE *freopen( const char *nombre, const char *modo, FILE *fichero); Esta función cierra el fichero pasado como tercer argumento y lo abre con el nuevo nombre y modo especificado. Devuelve un puntero a FILE que apunta al nuevo fichero abierto, o un puntero nulo en caso de error, tal y como lo hace “fopen()”.

15. El preprocesador El preprocesador en el lenguaje C es una herramienta que convierte el programa fuente desarrollado con extensión *.c en un fichero compilable con extensión *.l siendo éste el primer paso que se efectúa en la fase de compilación de un programa C con el fin de obtener el programa objeto con extensión *.obj. El preprocesador utiliza sentencias llamadas directivas de compilación que son órdenes dirigidas al compilador. Estas sentencias utilizan el símbolo “#” como carácter específico antes de la sentencia. Es una parte de la compilación en la que se hacen algunas tareas sencillas. Las fundamentales son: •

Supresión de comentarios.

•

Expansión de macros. Anexo I 6-43


•

Inclusión del código de las cabeceras.

•

Conversión de las secuencias de escape en caracteres dentro de cadenas de caracteres y de constantes de tipo carácter.

15.1. Directivas de preprocesado Para realizar las diferentes acciones que admite el preprocesado se dispone de una serie de directivas de preprocesado, que son como comandos que instruyen al Preprocesador para realizar las expansiones. Todas las directivas del Preprocesador comienzan con el carácter # seguida del nombre de comando. El signo # debe estar al comienzo de una línea, para que el Preprocesador lo pueda reconocer. • Directiva “include” (inclusión de ficheros) Una de esas directivas es #include. Esta directiva debe ir seguida de un nombre de fichero. El nombre debe ir entrecomillado o encerrado entre signos de mayor y menor. Lo que hace el preprocesador es sustituir la línea donde se halla la directiva por el fichero indicado. Por ejemplo:

#include #include «stdio.h» La diferencia entre encerrar el nombre del fichero entre comillas o entre signos de mayor y menor es que al buscar el fichero con las comillas la búsqueda se hace desde el directorio actual, mientras que entre signos de mayor y menor la búsqueda se hace en un directorio especial. Este directorio varía con la implementación, pero suele estar situado en el directorio del compilador. El Preprocesador y el compilador ya conocen dónde se ubica el directorio. Todas las cabeceras estándar se hallan en ese directorio. Se puede incluir cualquier tipo de fichero fuente, pero lo habitual es incluir solo ficheros de cabecera. Hay que tener en cuenta que el fichero incluido es preprocesado. Esto permite expandir algunos tipos de macros y ajustar la cabecera al sistema mediante las directivas de preprocesado. Para ello se suelen usar macros que actúan como banderas. • Directiva “define” (definición de macros) En C una macro es un identificador que el preprocesador sustituye por un conjunto de caracteres. Para definir una macro se dispone de la directiva #define. Su sintaxis es: #define identificador conjunto de caracteres

Anexo I 6-44

Lenguaje C

Se utiliza habitualmente en los ficheros de cabecera para definir valores y constantes. Por ejemplo: #define x 1 • Directivas condicionales Las directivas de compilación condicional son: #if, #endif, #else, #elif, #ifdef y #ifndef. • Otras directivas Existen otras directivas como son: #undef, #line, #pragma y #error.

Anexo I 6-45

Anexo II Lenguaje C++


Guión-resumen

1. Introducción

9. Funciones

2. La función main ()

10. Programación eficiente

3. Tipos básicos de datos

11. El preprocesador

4. Variables

12. Entrada / Salida de datos

5. Operadores, caracteres especiales, instrucciones, arrays, cadenas de caracteres, punteros, estructuras, uniones, enumeraciones y typedef

13. Programación Orientada a Objetos

6. Tipos compuestos

16. Templates

7. Asignación dinámica de memoria

17. Manejo de excepciones

8. Sentencias de control en C++

Anexo II 6-2

14. Herencia en C++ 15. Sobrecarga en C++

Lenguaje C++

1.

Introducción

El lenguaje de programación C++ se comenzó a desarrollar en 1980 como una ampliación del lenguaje C; de ahí el nombre de C++ que proviene del operador incremento ++. También es conocido como C con clases. Entre las características iniciales que debemos tener en cuenta tenemos: •

Los ficheros fuente terminan con la extensión “*.cpp”

•

Los ficheros de encabezado figuran con la extensión “*.h” y se incluyen en el fichero fuente usando la directriz #include del preprocesador (como sucedía en el lenguaje C), Ejemplo:

#include “iostream.h” ó #include

Nota1. La diferencia entre usar las comillas o usar “<>” estriba en que si el nombre de la biblioteca está entre comillas se busca el archivo de la manera definida en la implementación (generalmente primero en el directorio actual de trabajo y luego como si se hubiese puesto “<>”). Y si se usa “<>” se busca según se haya establecido en la creación del compilador. Esto también es aplicable al lenguaje C. Nota2. Las líneas que empieza por # son una directiva. En este caso indica que se incluya el fichero «iostream.h», que contiene las definiciones para entrada/salida de datos en C++. •

Los identificadores válidos del C++ son los formados a partir de los caracteres del alfabeto (del inglés, no podemos usar ni la ñ ni palabras acentuadas), los dígitos “0 – 9” y el guión bajo “_”; la única restricción es que no podemos comenzar un identificador con un dígito. Hay que señalar que el C++ distingue entre mayúsculas y minúsculas, por lo que Lolo y lolo representan dos cosas diferentes. Hay que evitar el uso de identificadores que solo difieran en letras mayúsculas y minúsculas, porque inducen a error.

•

Las variables se pueden declarar en cualquier lugar del programa, siempre y cuando tengamos cuidado de usarlas una vez que hayan sido declaradas.

•

Los comentarios se pueden hacer de dos formas: —

Una sola línea (no afecta a la sentencia situada a la izquierda de las “//”):

Ejemplo: x=2+3; // este es un comentario de una línea —

Un bloque:

Ejemplo: x=2+3; /* comentario de un bloque*/

Anexo II 6-3


Los comentarios entre /* y */ pueden tener la longitud que queramos, pero no se anidan, es decir, si escribimos /* hola /* amigos */ de TAI. Los comentarios que comienzan por // sólo son válidos hasta el final de la línea en la que aparecen. •

Los agrupadores de bloque o de funciones, igual que sucedía en C, son las llaves “{ }”.

•

Cada sentencia debe terminar en un punto y coma “;”. Es por eso que en una misma línea se pueden poner varias sentencias, separadas por el “;” o incluso podríamos poner todo el programa en una sola línea.

Ejemplo: int x=2; float y=8; float z; z=x+y; •

2.

El soporte a la programación modular en C++ se consigue mediante el empleo de algunas palabras clave y de las directivas de compilación. Lo más habitual es definir cada módulo mediante una cabecera (un archivo con la terminación .h) y un cuerpo del módulo (un archivo con la terminación .c, .cpp, o algo similar; depende del compilador). En el archivo cabecera (header) ponemos las declaraciones de funciones, tipos y variables que queremos que sean accesibles desde el exterior y en el cuerpo o código definimos las funciones publicas o visibles desde el exterior, además de declarar y definir variables, tipos o funciones internas a nuestro módulo.

La función main ()

La función main() es la función principal del programa, por donde empieza la ejecución del mismo. En caso de no recibir argumentos se declara de la siguiente forma:

void main(void) { …… …… } Puede recibir argumentos desde la consola en el momento de la ejecución del programa:

void main (int argc, char *argv[]) { …… …… } •

“argc” indica el número de argumentos que son pasados a la función “main”.

Anexo II 6-4

Lenguaje C++

•

“argv” es un “array” de caracteres a través de punteros que contiene el valor de los argumentos.

Todos los programas deben tener una función “main()” que es la que se ejecuta al comenzar el programa. Un programa será una secuencia de líneas que contendrán sentencias, directivas de compilación y comentarios. Las sentencias simples se separan por punto y coma, y las compuestas se agrupan en bloques mediante llaves. Las directivas serán instrucciones que le daremos al compilador para indicarle que realice alguna operación antes de compilar nuestro programa, las directivas comienzan con el símbolo # y no llevan punto y coma.

Nota. El mínimo programa de C++ es: main() { }

3.

Tipos básicos de datos (Ver tipos de datos en Lenguaje C.)

Los tipos elementales definidos en C++ son: char, short, int, long, que representan enteros de distintos tamaños (los caracteres son enteros de 8 bits) float, double y long double, que representan números reales (en coma flotante). Para declarar variables de un tipo determinado escribimos el nombre del tipo seguido del de la variable. Por ejemplo:

int i; double d; char c; Podemos declarar varias variables de un mismo tipo poniendo el nombre del tipo y las variables a declarar separadas por comas: int i, j,k. Además podemos inicializar una variable a un valor en el momento de su declaración: int i=100; Cada tipo definido en el lenguaje (o definido por el usuario) tiene un nombre sobre el que se pueden emplear dos operadores: sizeof, que nos indica la memoria necesaria para almacenar un objeto del tipo, y new, que reserva espacio para almacenar un valor del tipo en memoria. C++ solo define un nuevo tipo de dato al lenguaje C que es el tipo de dato “bool” que puede tomar solo dos valores: true o false. Para especificar si los valores a los que se refieren tienen o no signo, empleamos las palabras signed y unsigned delante del nombre del tipo (por ejemplo unsigned int para enteros sin signo). El tipo void es sintácticamente igual a los tipos elementales pero solo se emplea junto a los derivados y no hay objetos del tipo void. Se emplea para especificar que una función no devuelve nada o como base para punteros a objetos de tipo desconocido. Por ejemplo: void lolo (void); indica que la función lolo no tiene parámetros y no retorna nada.

Anexo II 6-5


3.1.

Conversiones de tipos

• Conversiones implícitas Cuando trabajamos con tipos elementales podemos mezclarlos en operaciones sin realizar conversiones de tipos, ya que el compilador se encarga de aproximar al valor de mayor precisión. • Conversiones explícitas (casting)

Para indicar la conversión explícita de un tipo en otro usamos el nombre del tipo; por ejemplo, si tenemos “i” de tipo “int” y “j” de tipo “long”, podemos hacer i=(long)j (sintaxis del C, válida en C++) o i=long(j) (sintaxis del C++).

4.

Variables (Ver variables en Lenguaje C.)

4.1.

Visibilidad y duración de las variables

La visibilidad o ámbito de vida de una variable es la parte del programa en la que esa variable está definida y puede ser utilizada. Podemos clasificar las variables en locales y globales: •

Variables locales son aquellas que son declaradas dentro de un bloque y son visibles en ese bloque y en los bloques anidados dentro de él. Ocultan a las variables globales con el mismo nombre.

•

Variables globales son aquellas que son declaradas fuera de cualquier función. Son visibles durante toda la ejecución del programa y se pueden utilizar en todas las funciones del fichero que forma el programa.

La duración o tiempo de vida de una variable hace referencia al tiempo que transcurre entre la creación de una variable y el instante en que es destruida. Si son variables auto (locales), la variable se crea y se destruye cada vez que pasa por el bloque (esta es la opción por defecto). Si es una variable static, la duración de dicha variable es hasta que finalice el programa. Las variables existen sólo dentro del bloque en el que se definen, es decir, se crean cuando se entra en el bloque al que pertenecen y se destruyen al salir de él. Para acceder a variables que se definen en otros módulos la declaramos en nuestro módulo precedida de la palabra extern. Si queremos que una variable sea local a nuestro módulo la definimos static, de manera que es inaccesible desde el exterior de nuestro módulo y además permanece durante todo el tiempo que se ejecute el programa guardando su valor entre accesos al bloque. Anexo II 6-6

Lenguaje C++

Si queremos que una variable no pueda ser modificada la declaramos const; tenemos que inicializarla en su declaración y mantendrá su valor durante todo el programa. Estas variables se emplean para constantes que necesitan tener una dirección (para pasarlas por referencia). Si queremos que una variable sea comprobada cada vez que la utilicemos la declararemos precedida de la palabra volatile; esto es útil cuando definimos variables que almacenan valores que no sólo modifica nuestro programa. Podemos intentar hacer más eficientes nuestros programas indicándole al compilador qué variables usamos más a menudo para que las coloque en los registros. Esto se hace declarando la variable precedida de la palabra register. Podemos tener definida una variable local con el mismo nombre que una global; en este caso la local prevalece sobre la global. No obstante si queremos acceder a una variable global en un bloque donde exista una local del mismo nombre, utilizamos el operador “::”. Ejemplo:

int x=10; //variable global void main( ) { int x = 20; //variable local int y = ::x; // asigna a y el valor 10 int t = x; // asigna a t el valor 20 }

5.

Operadores, caracteres especiales, instrucciones, arrays, cadenas de caracteres, punteros, estructuras, uniones, enumeraciones y typedef (Ver Lenguaje C)

5.1.

Tipos derivados

De los tipos fundamentales podemos derivar otros mediante el uso de los siguientes operadores de declaración: * Puntero

& Referencia

[] Vector (Array)

() Función

Ejemplos:

int *punt; // puntero a un entero int v[20]; // vector de 20 enteros int *punt[20]; // vector de 20 punteros a entero void f(int j); // función con un parámetro entero Anexo II 6-7


int i; // declaración de un entero i i = *n; // almacenamos en i el valor al que apunta n i = v[2] // almacenamos en i el valor de el tercer elemento de v i = *v[2] // almacenamos en i el valor al que apunta el tercer puntero de v f(i) // llamamos a la función f y le enviamos el parámetro i Para declarar un puntero a un vector necesitamos paréntesis:

int *v[20]; // vector de 20 punteros a entero int (*punt)[20] // puntero a vector de 20 enteros Al declarar variables de tipos derivados, el operador se asocia a la variable, no al nombre del tipo:

int x,y,z; // declaración de tres variables enteras int *i, j; // declaramos un puntero a entero (i) y un entero (j) int v[10], *p; // declaramos un vector de 10 enteros y un puntero a entero • Punteros Para cualquier tipo X, el puntero a ese tipo es X*. Una variable de tipo X* contendrá la dirección de un valor de tipo X. Los punteros a vectores y funciones necesitan el uso de paréntesis:

int *punt_i // Puntero a entero char **punt_c // Puntero a puntero a carácter int (*punt_v)[10] // Puntero a vector de 10 enteros int (*punt_f)(float) // Puntero a función que recibe un real y retorna un entero La operación fundamental sobre punteros es la de indirección (retornar el valor apuntado por él):

char c1 = ‘a’; // c1 contiene el carácter ‘a’ char *p = &c1; // asignamos a p la dirección de c1 (& es el operador referencia) char c2 = *p; // ahora c2 vale lo apuntado por p (‘a’) • Vectores Para un tipo X, X[n] indica un tipo vector con n elementos. Los índices del vector empiezan en 0 y llegan hasta n-1. Podemos definir vectores multidimensionales como vectores de vectores:

int v1[10]; // vector de 10 enteros int v2[20][10]; // vector de 20 vectores de 10 enteros (matriz de 20*10) Anexo II 6-8

Lenguaje C++

Accedemos a los elementos del vector a través de su índice (entre []):

v1[3] = 15; // el elemento con índice 3 vale 15 v2[8][3] = v1[3]; // el elemento 3 del vector 8 de v2 vale lo mismo que v[3] El compilador no comprueba los límites del vector, es responsabilidad del programador. Para inicializar un vector podemos enumerar sus elementos entre llaves. Los vectores de caracteres se consideran cadenas, por lo que el compilador permite inicializarlos con una constante cadena (pero les añade el carácter nulo). Si no ponemos el tamaño del vector al inicializarlo el compilador le dará el tamaño que necesite para los valores que hemos definido. Ejemplos:

int v1[5] = {0, 1, 2, 3, 4}; char v2[2][3] = {{‘t’, ‘a’, ‘i’}, {‘T’, ‘A’, ‘I’} }; // vect. multidimensional int v3[2] = {1, 2, 3, 4}; // error: sólo tenemos espacio para 2 enteros char c1[5] = {‘h’,’o’,’l’,’a’,’\0’}; // cadena «hola» char c2[5] = «holita»; // cadena holita char c3[] = «hola»; // el compilador le da tamaño 5 al vector char vs[3][] = {«hola», «aprobados», «tai»} // vector de 3 cadenas (3 punteros a carácter) • Referencias Una referencia es un nombre alternativo a un objeto; se emplea para el paso de argumentos y el retorno de funciones por referencia. X& significa referencia a tipo X. Las referencias tienen restricciones: 1.

Se deben inicializar cuando se declaran (excepto cuando son parámetros por referencia o referencias externas).

2.

Cuando se han inicializado no se pueden modificar.

3.

No se pueden crear referencias a referencias ni punteros a referencias.

Ejemplos:

int a; // variable entera int &r1 = a; // ref es sinónimo de a int &r2; // error, no está inicializada extern int &r3; // válido, la referencia es externa (estará inicializada en otro // módulo) int &&r4=r1; // error: referencia a referencia

Anexo II 6-9


6.

Tipos compuestos Existen cuatro tipos compuestos en C++: Estructuras

Uniones

Campos de bits

Clases

• Estructuras Las estructuras son el tipo equivalente a los registros de otros lenguajes. Se definen poniendo la palabra struct delante del nombre del tipo y colocando entre llaves los tipos y nombres de sus campos. Si después de cerrar la llave ponemos una lista de variables, las declaramos a la vez que definimos la estructura. Si no, luego podemos declarar variables poniendo struct nombre_tipo (ANSI C, C++) o nombre_tipo (C++). Ejemplo:

struct persona { int edad; char nombre[50]; } empleado; struct persona alumno; // declaramos la variable alumno de tipo persona (ANSI C) persona profesor; // declaramos la variable profesor de tipo persona persona *p; // declaramos un puntero a una variable persona Podemos inicializar una estructura de la misma forma que un array:

persona lolo= {21, «Lolo Lolete»}; Para acceder a los campos de una estructura ponemos el nombre de la variable, un punto y el nombre del campo. Si trabajamos con punteros podemos poner -> en lugar de de referenciar el puntero y poner un punto (esto lo veremos en el punto de variables dinámicas):

alumno.edad = 20; // el campo edad de alumno vale 20 p->nombre = «Lolo»; // el nombre de la estructura apuntada por p vale «Lolo» (*p).nombre = «Lolo»; // igual que antes Empleando el operador sizeof a la estructura podemos saber cuántos bytes ocupa. • Uniones Las uniones son idénticas a las estructuras en su declaración (poniendo union en lugar de struct), con la particularidad de que todos sus campos comparten la misma memoria (el tamaño de la unión será el del campo con un tipo mayor). Es responsabilidad del programador saber qué está haciendo con Anexo II 6-10

Lenguaje C++

las uniones, es decir, podemos emplear el campo que queramos, pero si usamos dos campos a la vez uno machacará al otro. Ejemplo:

union codigo { int i; float f; } cod; cod.i = 10; // i vale 10 cod.f = 25e3f; // f vale 25 * 1000, i indefinida (ya no vale 10) Podemos declarar uniones o estructuras sin tipo siempre y cuando declaremos alguna variable en la definición. Si no declaramos variables la estructura sin nombre no tiene sentido, pero la unión permite que dos variables compartan memoria. Ejemplo:

struct { int i; char n[20] } reg; union { int i; float f; }; // i y f son variables, pero se almacenan en la misma memoria • Campos de bits Un campo de bits es una estructura en la que cada campo ocupa un numero determinado de bits, de forma que podemos tratar distintos bits como campos independientes, aunque estén juntos en una misma palabra de la máquina. Ejemplo:

struct fichero { :3 // nos saltamos 3 bits unsigned int lectura : 1; // reservamos un bit para lectura unsigned int escritura : 1; unsigned int ejecución : 1; :0 // pasamos a la siguiente palabra unsigned int directorio: 8; } flags; flags.lectura = 1; // ponemos a 1 el bit de lectura Los campos siempre son de tipo discreto (enteros), y no se puede tomar su dirección. Anexo II 6-11


• Clases Las clases son estructuras con una serie de características especiales; las estudiaremos en profundidad más adelante.

7.

Asignación dinámica de memoria

Hay dos formas principales por medio de las cuales un programa puede almacenar información en la memoria del ordenador: •

Por medio del uso de variables, en cuyo caso la cantidad de memoria necesaria queda fijada en tiempo de compilación y no puede ser cambiada durante la ejecución del programa. Esto es, si se ha reservado memoria para un array de 10 elementos de tipo “int”, este array no puede cambiar durante la ejecución.

•

La segunda forma de almacenamiento de información es por medio del sistema de asignación dinámica de memoria de C++. Por medio de este método se va asignando memoria en tiempo de ejecución según se vaya necesitando.

C++ tiene 2 operadores para la asignación dinámica de memoria: new y delete. Sus formas generales son:

var_puntero = new tipo_variable; delete var_puntero; Usando new para un vector, el tamaño del vector se sitúa entre corchetes. Con delete el contenido al que apunta el puntero es borrado. Para asignar memoria dinámicamente a un vector de “n” elementos, se utiliza el siguiente formato: var_puntero = new tipo_variable[n]; delete [] var_puntero; int n=100;

o int *obj = new int[n]; //asigna delete [] obj; //libera

Ejemplo: int *obj = new int; *obj=7.2; delete obj;

Anexo II 6-12

Lenguaje C++

Hemos mencionado que en C se usaban las funciones “malloc()” y “free()” para el manejo de memoria dinámica, pero dijimos que en C++ se suelen emplear los operadores new y delete. El operador new se encarga de reservar memoria y delete de liberarla. Estos operadores se emplean con todos los tipos del C++, sobre todo con los tipos definidos por nosotros (las clases). La ventaja sobre las funciones de C de estos operadores está en que utilizan los tipos como operandos, por lo que reservan el número de bytes necesarios para cada tipo y cuando reservamos más de una posición no lo hacemos en virtud de un número de bytes, sino en función del número de elementos del tipo que deseemos. El resultado de un new es un puntero al tipo indicado como operando y el operando de un delete debe ser un puntero obtenido con new. Veamos con ejemplos cómo se usan estos operadores:

int * i = new int; // reservamos espacio para un entero, i apunta a él delete i; // liberamos el espacio reservado para i int * v = new int[10]; // reservamos espacio contiguo para 10 enteros, v apunta // al primero delete []v; // Liberamos el espacio reservado para v Hay que tener cuidado con el “delete”. Si ponemos: “delete v”; sólo liberamos la memoria ocupada por el primer elemento del vector, no la de los 10 elementos. Con el operador new también podemos inicializar la variable a la vez que reservamos la memoria:

int *i = new int (5); // reserva espacio para un entero y le asigna el valor Para asignar memoria dinámicamente a una estructura, hay que definir una variable puntero a dicha estructura y luego utilizar el operador new para la asignación. Para acceder a los elementos de dicha estructura se utiliza el operador “->” Para la asignación dinámica de memoria de arrays de estructuras, se utiliza la forma general de los arrays, es decir, hay que declarar un puntero a la estructura y luego asignar con el operador new el tipo y número de elementos. Para acceder a cada elemento del array se utiliza el índice y para acceder a cada miembro de la estructura se utiliza el operador “.”:

nombre[indice]. miembro; Ejemplo: struct empleado{ char nombre[20]; int hijos; float sueldo }; int n=10; empleado *obj2 = new empleado[n]; obj1[0].nombre=”Olga”;

Anexo II 6-13


obj1[0].hijos=1; obj1[0].sueldo=1200; delete [] obj1; empleado *obj2 = new empleado[n]; obj2->nombre=”Yolanda”; obj2->hijos=1; obj1->sueldo=1200; delete obj2; a la hora de usar el operador -> lo único que hay que tener en cuenta es la precedencia de operadores. Ejemplo:

++p->i1; // preincremento del campo i1, es como poner ++ (p->i1) (++p)->i1; // preincremento de p, luego acceso a i1 del nuevo p. Por último diremos que la posibilidad de definir campos de una estructura como punteros a elementos de esa misma estructura es la que nos permite definir los tipos recursivos como los nodos de colas, listas, árboles, etc. • Punteros a punteros (indirección múltiple) Además de definir punteros a tipos de datos elementales o compuestos también podemos definir punteros a punteros. La forma de hacerlo es poner el tipo y luego tantos asteriscos como niveles de indirección:

int *p1;

// puntero a entero

int **p2;

// puntero a puntero a entero

char *c[];

// vector de punteros a carácter

Para usar las variables puntero a puntero hacemos lo mismo que en la declaración, es decir, poner tantos asteriscos como niveles queramos acceder:

int ***p3;

// puntero a puntero a puntero a entero

p3 = &p2;

// trabajamos a nivel de puntero a puntero a puntero a entero // no hay indirecciones, a p3 se le asigna un valor de su mismo tipo

*p3 = &p1;

// el contenido de p2 (puntero a puntero a entero) toma la dirección de // p1 (puntero a entero). Hay una indirección, accedemos a lo apuntado por p3

p1 = **p3;

Anexo II 6-14

// p1 pasa a valer lo apuntado por lo apuntado por p3 (es decir, lo apuntado por p2). En //nuestro caso, no cambia su valor, ya que p2 apuntaba a p1 desde la operación anterior

Lenguaje C++

***p3 = 5

8.

// El entero apuntado por p1 toma el valor 5 (ya que p3 apunta a p2 que apunta a p1)

Sentencias de control en C++ (Ver sentencias de control en Lenguaje C) A modo de resumen: Como estructuras de control el C++ incluye las siguientes construcciones: —

—

9.

condicionales: •

if → instrucción de selección simple.

•

switch → instrucción de selección múltiple.

bucles: •

do-while → instrucción de iteración con condición final.

•

while → instrucción de iteración con condición inicial.

•

for → instrucción de iteración especial (similar a las de repetición con contador).

—

de salto:

•

break → instrucción de ruptura de secuencia (sale del bloque de un bucle o instrucción condicional).

•

continue → instrucción de salto a la siguiente iteración (se emplea en bucles para saltar a la posición donde se comprueban las condiciones).

•

goto → instrucción de salto incondicional (salta a una etiqueta).

•

return → instrucción de retorno de un valor (se emplea en las funciones).

Funciones

Una función es una porción de código, un conjunto de sentencias, agrupadas por separado, generalmente enfocadas a realizar una tarea específica. También se suelen denominar subrutinas o subprogramas.

9.1.

Definición

La definición de una función consta de la cabecera de la función y del cuerpo. Su forma general es:

Anexo II 6-15


tipo_valor_retorno nombre_funcion(tipo arg1, tipo arg2, ... ,tipo argn) { …… // CUERPO DE LA FUNCION …… } La lista de argumentos, también llamados argumentos formales, es una lista de declaraciones de variables, precedidas de su tipo correspondiente y separadas por comas (,). Los argumentos formales son la forma más natural y directa para que una función reciba valores desde el programa que le llama. El “tipo_valor_retorno” indica el tipo del valor devuelto al programa que le ha llamado. Si no se desea que devuelva nada, el tipo de retorno debe ser void. La sentencia return permite devolver el valor.

9.2.

Declaración

Toda función debe ser declarada antes de ser utilizada en el programa que realiza la llamada. Ésta se hace mediante el prototipo de la función. La forma general del prototipo coincide con la primera línea de la definición –el encabezamiento–, con tres pequeñas diferencias: •

En vez de la lista de argumentos formales o parámetros, basta incluir sólo los tipos de dichos argumentos.

•

El prototipo termina con un carácter “;”.

•

Los valores pueden ser inicializados si se desea.

Ejemplo: int func (int, char, float); La llamada a una función se hace incluyendo su nombre en una expresión o sentencia del programa principal o de otra función. Este nombre debe ir seguido de una lista de argumentos separados por comas y encerrados entre paréntesis. A los argumentos incluidos en la llamada se les llama argumentos actuales.

9.3.

Paso de argumentos por valor y por referencia

Por defecto los parámetros se pasan por valor, para pasarlos por referencia usaremos punteros y referencias. Sigue el mismo mecanismo visto en el lenguaje C.

9.4.

Funciones recursivas

Son funciones que pueden llamarse a sí mismas. Cuando una función es llamada por sí misma, se crea un nuevo juego de parámetros y variables locales, pero el código ejecutable es el mismo.

Anexo II 6-16

Lenguaje C++

9.5.

Funciones Inline

Las funciones inline son funciones que no son llamadas sino que son expandidas en línea, en el punto de cada llamada. Las ventajas de estas funciones es que no representan un retardo vinculado con la llamada a la función ni con los mecanismos de vuelta de ésta. Esto significa que las funciones inline son ejecutadas de forma mucho más rápida que las normales. Las desventajas de estas funciones es que si son demasiado grandes y son llamadas con demasiada frecuencia, el programa se hace más grande. Para declarar una función inline basta con anteponer el especificador inline a la definición de la función. Estas deben ser declaradas antes de ser usadas. Una función inline es igual que una función normal que no genera código de llamada a función, sino que sustituye las llamadas a la misma por el código de su definición. La principal ventaja frente a las macros es que estas funciones sí que comprueban el tipo de los parámetros. No se pueden definir funciones inline recursivas.

10. Programación eficiente Veremos en este módulo una serie de mecanismos del C++ útiles para hacer que nuestros programas sean más eficientes.

10.1. Estructura de los programas El código de los programas se almacena en ficheros, pero el papel de los ficheros no se limita al de mero almacén, también tienen un papel en el lenguaje: son un ámbito para determinadas funciones (estáticas y en línea) y variables (estáticas y constantes) siempre que se declaren en el fichero fuera de una función. Además de definir un ámbito, los ficheros nos permiten la compilación independiente de los archivos del programa, aunque para ello es necesario proporcionar declaraciones con la información necesaria para analizar el archivo de forma aislada. Una vez compilados los distintos ficheros fuente (que son los que terminan en .c, .cpp, etc.), es el “linker” el que se encarga de enlazarlos para generar un único fichero fuente ejecutable. En general, los nombres que no son locales a funciones o a clases se deben referir al mismo tipo, valor, función u objeto en cada parte de un programa. Si en un fichero queremos declarar una variable que está definida en otro fichero, podemos hacerlo declarándola en nuestro fichero precedida de la palabra extern.

Anexo II 6-17


Si queremos que una variable o función sólo pertenezca a nuestro fichero la declaramos “static”. Si declaramos funciones o variables con los mismos nombres en distintos ficheros producimos un error (para las funciones el error sólo se produce cuando la declaración es igual, incluyendo los tipos de los parámetros). Las funciones y variables cuyo ámbito es el fichero tienen enlazado interno (es decir, el “linker” no las tiene en cuenta).

10.2. Los ficheros cabecera Una forma fácil y cómoda de que todas las declaraciones de un objeto sean consistentes es emplear los denominados ficheros cabecera, que contienen código ejecutable y/o definiciones de datos. Estas definiciones o código se corresponderán con la parte que queremos utilizar en distintos archivos. Para incluir la información de estos ficheros en nuestro fichero .C empleamos la directiva include, que le servirá al preprocesador para leer el fichero cabecera cuando compile nuestro código. Un fichero cabecera debe contener: •

Definición de tipos struct punto { int x, y; };

•

Templates template class V { … }

•

Declaración de funciones extern int strlen (const char *);

•

Definición de funciones inline inline char get { return *p++ ;}

•

Declaración de variables extern int a;

•

Definiciones constantes const float pi = 3.141593;

•

Enumeraciones enum bool { false, true };

•

Declaración de nombres class Matriz;

•

Directivas include #include

•

Definición de macros #define Case break;case

•

Comentarios /* cabecera de mi_prog.c */

Y no debe contener: •

Definición de funciones ordinarias char get () { return *p++}

•

Definición de variables int a;

•

Definición de agregados constantes const tabla[] = { … }

Anexo II 6-18

Lenguaje C++

Si nuestro programa es corto, lo más usual es crear un solo fichero cabecera que contenga los tipos que necesitan los diferentes ficheros para comunicarse y poner en estos ficheros sólo las funciones y definiciones de datos que necesiten e incluir la cabecera global. Si el programa es largo o usamos ficheros que pueden ser reutilizados, lo más lógico es crear varios ficheros cabecera e incluirlos cuando sean necesarios. Por último, indicaremos que las funciones de biblioteca suelen estar declaradas en ficheros cabecera que incluimos en nuestro programa para que luego el linker las enlace con nuestro programa. Las bibliotecas estándar son: Bibliotecas de C: assert.h

Define la macro assert()

ctype.h

Manejo de caracteres

errno.h

Tratamiento de errores

float.h

Define valores en coma flotante dependientes de la implementación

limits.h

Define los límites de los tipos dependientes de la implementación

locale.h

Define la función setlocale()

math.h

Definiciones y funciones matemáticas

setjmp.h

Permite saltos no locales

signal.h

Manejo de señales

stdarg.h

Manejo de listas de argumentos de longitud variable

stddef.h

Algunas constantes de uso común

stdio.h

Soporte de E/S

sdlib.h

Algunas declaraciones estándar

string.h

Funciones de manipulación de cadenas

time.h

Funciones de tiempo del sistema

Anexo II 6-19


Bibliotecas de C++: fstream.h

Streams fichero

iostream.h

Soporte de E/S orientada a objetos (streams)

new.h

Definición de _new_handler

strstream.h

Definición de streams cadena

11. El preprocesador El preprocesador es un programa que se aplica a los ficheros fuente del C++ antes de compilarlos. Realiza diversas tareas, algunas de las cuales se pueden controlar mediante el uso de directivas de preprocesado. Como veremos, estas directivas permiten definir macros como las de los lenguajes ensambladores (en realidad no se trata más que de una sustitución). A continuación veremos las fases de preprocesado y las directivas, así como una serie de macros predefinidas. Por último explicaremos lo que son las secuencias trigrafo.

11.1. Fases de preprocesado 1.

Traduce los caracteres de fin de línea del fichero fuente a un formato que reconozca el compilador.

2.

Concatena cada línea terminada con la barra invertida (\) con la siguiente.

3.

Elimina los comentarios. Divide cada línea lógica en símbolos de preprocesado y espacios en blanco.

4.

Ejecuta las directivas de preprocesado y expande los macros.

5.

Reemplaza las secuencias de escape dentro de constantes de caracteres y cadenas de literales por sus caracteres individuales equivalentes.

6.

Concatena cadenas de literales adyacentes.

7.

Convierte los símbolos de preprocesado en símbolos de C++ para formar una unidad de compilación.

Estas fases se ejecutan exactamente en este orden. Directivas del preprocesador: #define ID VAL

Define la macro ID con valor VAL.

#include «fichero»

Incluye un fichero del directorio actual.

#include

Incluye un fichero del directorio por defecto.

Anexo II 6-20

Lenguaje C++

#defined id

Devuelve 1 si id está definido.

#defined (id)

Lo mismo que el anterior.

#if expr

Si la expresión se cumple se compila todo lo que sigue. Si no, se pasa hasta un #else o un #endif.

#ifdef id

Si el macro id ha sido definido con un #define, la condición se cumple y ocurre lo del caso anterior. Es equivalente a if defined id.

#ifndef id

Si el macro id no ha sido definido con un #define, la condición se cumple. es equivalente a if !defined id.

#else

Si el #if, #ifdef o #ifndef más reciente se ha cumplido todo lo que haya después del #else hasta #endif no se compila. Si no se ha cumplido si se compila.

#elif exp.

Contracción de #else if expr.

#endif

Termina una condición.

#line CONST ID

Cambia el número de línea según la constante CONST y el nombre del fichero de salida de error a ID. Modifica el valor de los macros predefinidos __LINE__ y __FILE__

#pragma OPCION

Especifica al compilador opciones específicas de la implementación.

#error CADENA

Causa la generación de un mensaje de error con la cadena dada.

Ejemplo de macros:

#define MIN(a,b) (((a) < (b)) ? (a) : (b) ) main () { int i, j=6, k=8; i = MIN(j*3, k-1); } Después del preprocesado tendremos: main () { int i, j=6, k=8; i = (((j*3) < (k-1)) ? (j*3) : (k-1)); } Si no hubiéramos puesto paréntesis en la definición de la macro, al sustituir a y b podíamos haber introducido operadores con mayor precedencia que ?: y haber obtenido un resultado erróneo al ejecutar la macro. Notar que la macro no hace ninguna comprobación en los parámetros simplemente sustituye, por lo que a veces puede producir resultados erróneos.

Anexo II 6-21


12. Entrada / Salida de datos 12.1. Entrada / Salida a través de Consola en C++ C++ incorpora su propio archivo de cabecera, denominado “iostream.h” que implementa su propio conjunto de funciones de entrada/salida. La E/S es un flujo de C++ se describe como un conjunto de clases en “iostream.h”. Estas clases sobrecargan los operadores “put to” y “get from”, “<<” y “>>”. En C++, la clase proporciona soluciones modulares a las necesidades de manipulación de datos. La biblioteca estándar de C++ ofrece tres clases de E/S como alternativa a las funciones de E/S de propósito general de C. Estas clases contienen definiciones para el mismo par de operadores (“>>” y “<<”) que se optimizan para todos los tipos de datos. cin,cout y cerr. El equivalente para los flujos en C++ de stdin, stdout y stderr, descritos en STDIO.H, son cin, cout y cerr, que se describen en IOSTREAM.H. Estos tres flujos se abren automáticamente cuando comienza la ejecución del programa y pasan a ser la interfaz entre el programa y el usuario. El flujo “cin” se asocia con el teclado del terminal. Los flujos cout y cerr se asocian con la pantalla de visualización. Los operadores “>>” para extracción y “<<” para inserción. Las entradas y salidas en C++ han mejorado de forma significativa y se han simplificado debido a los operadores de la biblioteca de flujo “>>” (get from o extracción) y “<<” (put to o inserción). Una de las principales mejoras que presenta C++ respecto a C es la sobrecarga de operadores. La sobrecarga de operadores permite al compilador determinar qué función u operador va a ser ejecutado basándose en los tipos de datos de las variables asociadas.

Ejemplo: int ivalor=10; float fvalor=7.2; count << “Valor entero: “ << ivalor << “, Valor en coma flotante: “ << fvalor; cin >> ivalor >> fvalor >> c; Ya no es necesario preceder a las variables de entrada con el operador de dirección &. Cuando se quiere introducir información, se extrae “>>” del flujo de entrada, cin, y se coloca la información en una variable, por ejemplo ivalor. Para extraer información, se coge una copia de la información de la variable fvalor y se inserta “<<” en el flujo de salida, cout. El operador de extracción “>>” lee hasta el carácter nueva línea pero no lo ignora. Cuando se compara el código fuente en C++ con la salida del programa, una de las cosas que se observa inmediatamente es que el operador de inserción “<<” no genera automáticamente una nueva línea. Puede controlar cuándo ocurre esto incluyendo el símbolo de nueva línea “\n” o “endl” cuando sea necesario. Ende es muy útil para la salida de datos en un programa interactivo porque no sólo inserta una nueva línea en un flujo, sino que además vuelca el “buffer” de salida. También puede utilizar flush; sin embargo, éste no inserta una nueva línea. Anexo II 6-22

Lenguaje C++

La función cin.get() leerá todo, incluyendo el espacio en blanco, hasta el número máximo de caracteres especificado que se hayan leído o hasta el siguiente carácter de nueva línea. El tercer parámetro opcional, que no se ha mostrado, identifica un símbolo de terminación. Por ejemplo, la siguiente línea leería N caracteres en nombre o todos los caracteres escritos antes de un símbolo “*” o un carácter de nueva línea:

cin.get (nombre, N, *); La clase istream mantiene las operaciones de entrada básicas, mientras que la salida básica la mantiene la clase ostream. La E/S bidireccional es mantenida por la clase iostream, que se deriva de istream y ostream. Hay cuatro objetos de flujo predefinidos para el usuario: •

cin → Objeto de la clase istream asociado a la entrada estándar.

•

cout → Objeto de la clase ostream asociado a la salida estándar.

•

cerr → Objeto de la clase ostream sin buffer de salida asociado al error estándar.

•

clog → Objeto de la clase ostream con buffer de salida asociado al error estándar.

12.2. Entrada / Salida de datos a través de ficheros en C++ Los ficheros se utilizan para la lectura y/o escritura de datos en unidades de almacenamiento permanente como los disquetes, discos duros, etc. En los ficheros de acceso secuencial se lee o escribe desde el inicio del fichero o se escribe a partir del final. Para trabajar con este tipo de ficheros las clases necesarias son ifstream, ofstream y fstream, que derivan de istream y ostream, que a su vez derivan de la clase ios. Para utilizarlas se debe incluir el archivo de cabecera “fstream.h”. Antes de abrir un fichero hay que crear un flujo o stream, es decir un objeto de las clases ifstream, ofstream o fstream e indicar el modo de apertura (lectura, escritura, etc.) • Clase ofstream Es una clase derivada de ostream, especializada en manipular ficheros en el disco abiertos para escribir. Al construir un objeto de esta clase, el constructor lo conecta automáticamente con un objeto filebuf (un buffer). La funcionalidad de esta clase está soportada por las siguientes funciones miembro: ofstream (const char *nombre_fichero, int modo=ios::out, int proteccion=filebuf:: openprot); void open (const char *nombre_fichero, int modo=ios::out, int proteccion= filebuf::openprot); void close(); //esta función cierra el fichero int is_open(); //verifica si el fichero está abierto(=1). Si no lo está devuelve un 0. Anexo II 6-23


Para escribir en el fichero se utiliza el operador de inserción “<<” sobrecargado. Para leer del fichero se usa el operador de extracción “>>”. Esta forma de escritura es sólo en formato texto. • Clase ifstream Es una clase derivada de istream, especializada en manipular ficheros en el disco abiertos para leer. Al construir un objeto de esta clase, el constructor lo conecta automáticamente con un objeto filebuf (un buffer). La funcionalidad de esta clase está soportada por las siguientes funciones miembro: ifstream (const char *nombre_fichero, int modo=ios::in, int proteccion=filebuf:: openprot); void open (const char *nombre_fichero, int modo=ios::in, int proteccion=filebuf:: openprot); void close(); //esta función cierra el fichero int is_open(); //verifica si el fichero está abierto(=1). Si no lo está devuelve un 0. • Clase fstream Es una clase derivada de iostream, especializada en manipular ficheros en el disco abiertos para leer y/o escribir. Al construir un objeto de esta clase, el constructor lo conecta automáticamente con un objeto filebuf (un buffer). La funcionalidad de esta clase está soportada por las siguientes funciones miembro: fstream (const char *nombre_fichero, int modo, int proteccion=filebuf::openprot); void open (const char *nombre_fichero, int modo, int proteccion=filebuf::openprot); void close(); //esta función cierra el fichero int is_open(); //verifica si el fichero está abierto(=1). Si no lo está devuelve un 0. Si el fichero se abre con el modo: ios::app entonces, todo lo que se escriba se agregará a partir del final del fichero. Otras posibilidades de leer y escribir en un fichero son:

—

getline(): lee de fichero un número de caracteres especificado en la variable nCount o hasta que encuentre el carácter fin de línea “\n”. Devuelve un NULL cuando encuentra el final del fichero. Su prototipo es: istream& getline(unsigned char* puch, int nCount, char dlm = ‘\n’);

—

read() y write(): leen y escriben, respectivamente, bloques de bytes o datos binarios. Sus prototipos son: istream& read( unsigned char* bif, int num); ostream& write( unsigned char* bif, int num);

Anexo II 6-24

Lenguaje C++

En el acceso aleatorio de ficheros permite leer o escribir a partir de una determinada posición del fichero. Esto tiene una gran ventaja, ya que se pueden modificar algunos de los valores contenidos en el fichero. C++ nos da unas funciones para el acceso aleatorio: —

—

Para la clase istream: •

istream &seekg(streamoff desp, ios::seek_dir pos);

•

streampos tellg();

Para la clase ostream: •

ostream &seekp(streamoff desp, ios::seek_dir pos);

•

streampos tellp();

Donde:

streampos es un typedef de long. desp es la nueva posición, desplazada. desp bytes, desde la posición dada por pos, el cual puede ser: ios::beg Principio del fichero. ios::cur Posición actual del puntero del stream. ios::end Final del stream. seekg se usa para desplazarse en un fichero para lectura. seekp se usa para desplazarse en un fichero para escritura. tellg, tellp dan la posición actual del puntero de lectura y escritura, respectivamente. Para escribir en un fichero de acceso aleatorio, éste debe ser abierto de modo lectura/escritura, usando para ello: ios::in | ios::out Leer y escribir objetos. Para leer y escribir objetos en formato binario, se deben sobrecargar los operadores de extracción “>>” e inserción “<<”, en los cuales pondremos el código necesario para usar las funciones read y write de las clases ofstream, ifstream o fstream.

13. Programación Orientada a Objetos 13.1. Concepto de “clase” en C++ Una clase es un tipo de datos definido por el usuario. Es una agrupación de datos (variables) y de funciones (métodos) que operan sobre esos datos. La definición de una clase consta de dos partes:

Anexo II 6-25


•

La primera está formada por el nombre de la clase precedido por la palabra reservada class.

•

La segunda parte es el cuerpo de la clase, encerrado entre llaves y seguido por “;”:

class nombre { //cuerpo }; El cuerpo de la clase consta de: •

Especificadores de acceso: public, protected y private.

•

Atributos: datos miembro de la clase (variables).

•

Métodos: definiciones de funciones miembro de la clase.

Tanto las variables como los métodos pueden ser declarados public, protected y private, controlando de esta forma el acceso y evitando un uso inadecuado. La idea de clase junto con la sobrecarga de operadores, que estudiaremos más adelante, permite al usuario diseñar tipos de datos que se comporten de manera similar a los tipos estándar del lenguaje. Esto significa que debemos poder declararlos y usarlos en diversas operaciones como si fueran tipos elementales, siempre y cuando esto sea necesario. La idea central es que los tipos del usuario sólo se diferencian de los elementales en la forma de crearlos, no en la de usarlos. Pero las clases no sólo nos permiten crear tipos de datos, sino que nos dan la posibilidad de definir tipos de datos abstractos y definir sobre estos nuevas operaciones sin relación con los operadores estándar del lenguaje. Introducimos un nuevo nivel de abstracción y comenzamos a ver los tipos como representaciones de ideas o conceptos que no necesariamente tienen que tener una contrapartida a nivel matemático, como sucedía hasta ahora, sino que pueden ser conceptos relacionados con el mundo de nuestro programa. Así, podremos definir un tipo coche y un tipo motor en un programa de mecánica o un tipo unidad funcional en un programa de diseño de arquitectura de computadores, etcétera. Sobre estos tipos definiremos una serie de operaciones que definirán la interacción de las variables (objetos) de estos tipos con el resto de entidades de nuestro programa. Otra idea fundamental a la hora de trabajar con clases es la distinción clara entre la definición o interface de nuestros tipos de datos y su implementación, esto es, la distinción entre qué hace y cómo lo hace. Una buena definición debe permitir el cambio de la estructura interna de nuestras clases sin que esto afecte al resto de nuestro programa. Deberemos definir los tipos de manera que el acceso a la información y operaciones que manejan sea sencillo, pero el acceso a las estructuras y algoritmos utilizados en la implementación sea restringido, de manera que una modificación en estos últimos solo sea percibido en la parte de nuestro programa que implementa la clase. Por último, es interesante tener presentes las ideas ya mencionadas en el bloque anterior de objeto y paso de mensajes entre objetos. Estas ideas pue-

Anexo II 6-26

Lenguaje C++

den resultar de gran ayuda a la hora del diseño e implementación de programas, ya que podemos basarnos en el comportamiento de los objetos de interés en nuestro programa para abstraer clases y métodos (mensajes).

Nota. Por omisión, los datos miembro de la clase son private.

13.2. Miembros de una clase Los miembros de una clase pueden ser variables de cualquier tipo y funciones. En C++ a las variables se las denomina datos miembro, y a las funciones, funciones miembro de la clase. A) Datos miembro de una clase Para declarar un dato miembro se procede de la misma forma que para declarar cualquier variable. Por ejemplo:

class Lolo { public: float real; }; •

Los datos miembro no pueden ser inicializados durante la declaración.

•

Si no se pone un especificador de acceso (como es nuestro ejemplo public), por defecto los datos miembro serán private.

•

En una clase cada dato miembro debe tener un nombre único.

•

También podemos declarar como datos miembro de una clase, objetos de otra clase, siendo necesario que ésta haya sido previamente definida.

class datos { Lolo obj_lolo; //Declaración de un objeto de la clase dolo }; •

Para acceder a un dato miembro (siempre y cuando sea declarado como público) de una clase desde un objeto, se utilizará el operador Punto “.”. Por ejemplo: obj_lolo.real = 5.4;

13.3. Funciones miembro de una clase Las funciones miembro de una clase definen las operaciones que se pueden realizar con sus datos miembro. Las funciones miembro también pueden ser públicas o privadas, lo cual se hace con los respectivos especificadores. Al Anexo II 6-27


igual que los datos miembro, si no se especifica serán privadas (private) por defecto. Para declarar una función miembro de una clase se procede de la misma forma que para declarar una función cualquiera. Por ejemplo en el fichero lolo.h:

class Lolo { private: float real,imaginario; public: //funcione miembro públicas void Asignar (float x, float y); }; El cuerpo de una clase solo contiene los prototipos de las funciones miembro (las declaraciones). La definición de la función se hace en los ficheros fuente (*.cpp). Para definir la función miembro en el fichero fuente se utiliza el nombre de la clase seguido por el operador de resolución de ámbito “::”. Por ejemplo, en el fichero lolo.cpp:

void Lolo::Asignar(int x, float y) { real = x; imaginario = y; //acceso a los datos miembro …… …… } Las funciones miembro que tengan poco código, o las que se desee, también pueden ser definidas en el cuerpo de la clase. Dentro del cuerpo de la clase no hay necesidad de anteponer el nombre de la clase con el operador “::”, como se hace generalmente en el fichero fuente, puesto que el nombre de la clase es conocido. Para acceder a una función miembro (siempre y cuando sea declarada como pública) de una clase desde un objeto, se utilizará el operador Punto “.”. Por ejemplo: obj_lolo.Asignar (10, 7.2); A) Control de acceso a los miembros de la clase El concepto de clase incluye la idea de ocultación de datos, que, básicamente, consiste en que no se puedan acceder a los datos miembro directamente, sino que hay que hacerlo a través de las funciones miembro públicas de la clase. Para controlar el acceso a los miembros (datos y funciones) de una clase, C++ provee de tres especificadores: •

Public. Un miembro declarado público es accesible en cualquier parte del programa donde el objeto de la clase en cuestión es accesible.

•

Private. Un miembro declarado privado puede ser accedido solamente por las funciones miembro de su propia clase o por funciones amigas (friend) de su clase. En cambio, no puede ser accedido por funciones globales o por las funciones propias de una clase derivada (herencia).

Anexo II 6-28

Lenguaje C++

•

Protected. Un miembro declarado protegido se comporta exactamente igual que uno privado para las funciones globales, pero actúa como un miembro público para las funciones miembro de una clase derivada.

Una clase es un tipo de datos que se define mediante una serie de miembros que representan atributos y operaciones sobre los objetos de ese tipo. Hasta ahora conocemos la forma de definir un tipo de datos por los atributos que posee, lo hacemos mediante el uso de las estructuras. Pensemos, por ejemplo, en cómo definimos un tipo de datos empleado en un programa de gestión de personal:

struct empleado { char * nombre; long DNI; float sueldo; ... }; Con esta definición conseguimos que todas las características que nos interesan del empleado se puedan almacenar conjuntamente, pero nos vemos obligados a definir funciones que tomen como parámetro variables de tipo empleado para trabajar con estos datos:

void modificar_sueldo (empleado *e, float nuevo_sueldo); ... Pero el C++ nos da una nueva posibilidad, incluir esas funciones como miembros del tipo empleado:

struct empleado { char * nombre; long DNI; float sueldo; ... void modificar_sueldo (float nuevo_sueldo); ... }; A estas funciones se les denomina miembros función o métodos, y tienen la peculiaridad de que sólo se pueden utilizar junto con variables del tipo definido. Es interesante señalar, aunque sea anticipar acontecimientos, que la función miembro no necesita que se le pase la estructura como parámetro, ya que al estar definida dentro de ella tiene acceso a los datos que contiene.

Anexo II 6-29


Como distintas clases pueden emplear el mismo nombre para los miembros, a la hora de definir las funciones miembro debemos especificar el nombre de la estructura a la que pertenecen:

void empleado::modificar_sueldo (float nuevo_sueldo) { sueldo = nuevo_sueldo; }; Si definimos la función dentro de la estructura esto último no es necesario, ya que no hay lugar para la confusión. B) Acceso a miembros: la palabra class Hasta ahora hemos empleado la palabra struct para definir las clases; este uso es correcto, pero tiene una connotación específica: todos los miembros del tipo son accesibles desde el exterior del tipo, es decir, podemos modificar los datos o invocar a las funciones del mismo desde el exterior de la definición:

empleado lolo; // declaramos un objeto de tipo empleado lolo.sueldo = 500; // asignamos el valor 500 al campo sueldo lolo.modificar_sueldo(600) // le decimos a lolo que cambie su sueldo a 600 En el caso del ejemplo puede parecer poco importante que se pueda acceder a los datos del tipo, pero hemos dicho que lo que nos interesa es que la forma de representar los datos o de implementar los algoritmos sólo debe ser vista en la definición de la clase. Para que lo que contiene la clase solo sea accesible desde la definición empleamos la palabra class en lugar de struct para definir el tipo:

class empleado { ... } C) Acceso a miembros: etiquetas de control de acceso Con public delante de los miembros de la clase éstos sí deben ser vistos desde fuera:

class empleado { char * nombre; long DNI; float sueldo; ... public: void modificar_sueldo (float nuevo_sueldo); ... Anexo II 6-30

Lenguaje C++

} lolo; lolo.sueldo = 500; // ERROR, sueldo es un miembro privado lolo.modificar_sueldo (600); // CORRECTO, modificar_sueldo() es un método público Además de public también podemos emplear las etiquetas protected y private dentro de la declaración de la clase. Todo lo que aparezca después de una etiqueta será accesible (o inaccesible) hasta que encontremos otra etiqueta que cambie la accesibilidad o inaccesibilidad. La etiqueta protected tiene una utilidad especial que veremos cuando hablemos de herencia; de momento la usaremos de la misma forma que private, es decir, los miembros declarados después de la etiqueta serán inaccesibles desde fuera de la clase. Utilizando las etiquetas podemos emplear indistintamente la palabra struct o class para definir clases, la única diferencia es que si no ponemos nada con struct se asume acceso público y con class se asume acceso privado (con el sentido de la etiqueta private, no protected). Es mejor usar siempre la palabra class y especificar siempre las etiquetas de permiso de acceso, aunque podamos tener en cuenta el hecho de que por defecto el acceso es privado es más claro especificarlo. Hemos de indicar que también se puede definir una clase como union, que implica acceso público pero solo permite el acceso a un miembro cada vez (es lo mismo que sucedía con las uniones como tipo de datos compuesto). D) Operadores de acceso a miembros El acceso a los miembros de una clase tiene la misma sintaxis que para estructuras (el operador . y el operador ->), aunque también se emplea muy a menudo el operador de campo (::) para acceder a los miembros de la clase. Por ejemplo se emplea el operador de campo para distinguir entre variables de un método y miembros de la clase:

class empleado { ... float sueldo; ... public: void modificar_sueldo (float sueldo) { empleado::sueldo = sueldo; } ... }; E) El puntero this En uno de los puntos anteriores comentábamos que un método perteneciente a una clase tenía acceso a los miembros de su propia clase sin necesidad de pasar como parámetro el objeto con el que se estaba trabajando. Esto no es tan sencillo, puesto que es lógico pensar que los atributos (datos) conAnexo II 6-31


tenidos en la clase son diferentes para cada objeto de la clase, es decir, se reserva memoria para los miembros de datos, pero no es lógico que cada objeto ocupe memoria con una copia de los métodos, ya que replicaríamos mucho código. Los objetos de una clase tienen un atributo específico asociado: su dirección. La dirección del objeto nos permitirá saber qué variables debemos modificar cuando accedemos a un miembro de datos. Esta dirección se pasa como parámetro (implícito) a todas las funciones miembro de la clase y se llama this. Si en alguna función miembro queremos utilizar nuestra propia dirección podemos utilizar el puntero como si lo hubiéramos recibido como parámetro. Por ejemplo, para retornar el valor de un atributo escribimos:

float empleado::cuanto_cobra (void) { return sueldo; } Pero también podríamos haber hecho lo siguiente:

float empleado::cuanto_cobra (void) { return this->sueldo; } Utilizar el puntero dentro de una clase suele ser redundante, aunque a veces es útil cuando trabajamos con punteros directamente. F) Funciones miembro constantes Un método de una clase se puede declarar de forma que nos impida modificar el contenido del objeto (es decir, como si para la función el parámetro this fuera constante). Para hacer esto basta escribir la palabra después de la declaración de la función:

class empleado { ... float cuanto_cobra (void) const; ... }; float empleado::cuanto_cobra (void) const { return sueldo; } Las funciones miembro constantes se pueden utilizar con objetos constantes, mientras que las que no lo son no pueden ser utilizadas (ya que podrían modificar el objeto). De cualquier forma, existen maneras de modificar un objeto desde un método constante: el empleo de cast sobre el parámetro this o el uso de miembros puntero a datos no constantes. Veamos un ejemplo para el primer caso:

Anexo II 6-32

Lenguaje C++

class empleado { private: ... long num_accesos_a_empleado; ... public: ... float cuanto_cobra (void) const ... }; float empleado::cuanto_cobra (void) const { ((empleado *)this)->num_accesos_a_empleado += 1; // hemos accedido una vez más a // la clase empleado return sueldo; } Otro ejemplo: struct contabilidad { long num_accesos_a_clase; }; class empleado { private: ... contabilidad *conta; ... public: ... float cuanto_cobra (void) const ... }; float empleado::cuanto_cobra (void) const { conta->num_accesos_a_clase += 1; // hemos accedido una vez más a // la clase empleado return sueldo; } Anexo II 6-33


Esta posibilidad de modificar objetos desde métodos constantes se permite en el lenguaje por una cuestión conceptual: un método constante no debe modificar los objetos desde el punto de vista del usuario, y declarándolo como tal el usuario lo sabe, pero, por otro lado, puede ser interesante que algo que, para el que llama a una función miembro, no modifica al objeto si lo haga realmente con variables internas (no visibles para el usuario) para llevar contabilidades o modificar estados. Esto es especialmente útil cuando declaramos objetos constantes de una clase, ya que podemos modificar variables mediante funciones constantes. G) Funciones miembro inline Al igual que se podían declarar funciones de tipo “inline” generales, también se pueden definir funciones miembro “inline”. La idea es la misma; que no se genere llamada a función. Para hacer esto en C++ existen dos posibilidades: definir la función en la declaración de la clase (por defecto implica que la función miembro es inline), o definir la función fuera de la clase precedida de la palabra “inline”:

inline float empleado::cuanto_cobra { return sueldo; } Lo único que hay que indicar es que no podemos definir la misma función inline dos veces (en dos ficheros diferentes). H) Atributos estáticos Cuando en la declaración de una clase ponemos atributos (datos) estáticos, queremos indicar que ese atributo es compartido por todos los objetos de la clase. Para declararlo estático solo hay que escribir la palabra static antes de su declaración:

class empleado { ... static long num_total_empleados; ... }; Con esto conseguimos que el atributo tenga características de variable global para los miembros de la clase, pero que permanezca en el ámbito de la misma. Hay que tener presente que los atributos estáticos ocupan memoria aunque no declaremos ningún objeto. Si un atributo se declara público para acceder a él desde el exterior de la clase debemos identificarlo con el operador de campo: empleado::num_total_empleados = 1000;

Anexo II 6-34

Lenguaje C++

El acceso desde los miembros de la clase es igual que siempre. Los atributos estáticos se deben definir fuera del ámbito de la clase, aunque al hacerlo no se debe poner la palabra static (podrían producirse conflictos con el empleo de static para variables y funciones globales). Si no se inicializan en su definición toman valor 0:

long empleado::num_total_empleados; // definición, toma valor 0 El uso de atributos estáticos es más recomendable que el de las variables globales. I) Tipos anidados Dentro de las clases podemos definir nuevos tipos (enumerados, estructuras, clases…), pero para utilizarlos tendremos las mismas restricciones que para usar los miembros, es decir, serán accesibles según el tipo de acceso en el que se encuentren y para declarar variables de esos tipos tendremos que emplear la clase y el operador de campo:

class lista { private: struct nodo { int val; nodo *sig; }; nodo *primero; public: enum tipo_lista { FIFO, LIFO }; void inserta (int); int siguiente (); ... }; nodo n1;

// ERROR, nodo no es un tipo definido, está en otro ámbito

tipo_lista tl1;

// ERROR, tipo_lista no definido

lista::nodo n2;

// ERROR, tipo nodo privado

lista::tipo_lista tl2;

// CORRECTO

J) Punteros a miembros Cuando dimos la lista de operadores de indirección mencionamos dos de ellos que aún no se han visto: el operador de puntero selector de puntero a miembro (->*) y el operador selector de puntero a miembro (.*). Estos operadores están directamente relacionados con los punteros a miembros de una clase (como sus nombres indican). Suele ser especialmente interesante tomar la dirección de Anexo II 6-35


los métodos por la misma razón que era interesante tomar la dirección de funciones, aunque en clases se utiliza más a menudo (de hecho las llamadas a métodos de una clase hacen uso de punteros a funciones, aunque sea implícitamente). Para tomar la dirección de un miembro de la clase X escribimos &X::miembro. Una variable del tipo puntero a miembro de la clase X se obtiene declarándolo de la forma X::*. Por ejemplo si tenemos la clase:

class empleado { ... void imprime_sueldo (void); ... }; podemos definir una variable que apunte a un método de la clase que retorna “void” y no tiene parámetros:

void (empleado::*ptr_a_metodo) (void); o usando typedef:

typedef void (empleado::*PMVV) (void); PMVV ptr_a_metodo; Para usar la variable podemos hacer varias cosas:

empleado e; empleado *pe; PMVV ptr_a_metodo = &empleado::imprime_sueldo; e.imprime_sueldo();

// llamada normal

(e.*ptr_a_metodo)();

// acceso a miembro apuntado por puntero a través de un objeto

(pe->*ptr_a_metodo)();

// acceso a miembro apuntado por puntero a través de un puntero a objeto

En el ejemplo se usan paréntesis porque .* y ->* tienen menos precedencia que el operador de función. En realidad el uso de estos punteros es poco usual, ya que se puede evitar usando funciones virtuales. K) Objetos de una clase Un objeto es un ejemplar concreto de una clase. Las clases son como tipos de variables, mientras que los objetos son como variables concretas de un tipo determinado. Los objetos constan de una estructura interna (los datos) y de una interfaz que permite manipular tal estructura (las funciones). Un objeto se crea de la misma forma que como se crea una variable. Anexo II 6-36

Lenguaje C++

Ejemplo.- Lolo milolo; Un objeto no se inicializa como las variables:

Ejemplo: Lolo milolo=5;

//Error

13.4. Constructores y destructores Hasta ahora hemos hablado de la declaración y definición de clases, pero hemos utilizado los objetos sin saber cómo se crean o se destruyen. En este punto veremos cómo las clases se crean y destruyen de distintas maneras y qué cosas se hacen al crear o destruir un objeto. • Creación de objetos Podemos clasificar los objetos en cuatro tipos diferentes según la forma en que se crean: 1.

Objetos automáticos: son los que se crean al encontrar la declaración del objeto y se destruyen al salir del ámbito en que se declaran.

2.

Objetos estáticos: se crean al empezar la ejecución del programa y se destruyen al terminar la ejecución.

3.

Objetos dinámicos: son los que se crean empleando el operador new y se destruyen con el operador delete.

4.

Objetos miembro: se crean como miembros de otra clase o como un elemento de un array.

Los objetos también se pueden crear con el uso explícito del constructor (lo vemos en seguida) o como objetos temporales. En ambos casos son objetos automáticos. Hay que notar que estos modelos de creación de objetos también es aplicable a las variables de los tipos estándar del C++, aunque no tenemos tanto control sobre ellos. • Inicialización y limpieza de objetos Con lo que sabemos hasta ahora sería lógico pensar que si deseamos inicializar un objeto de una clase debemos definir una función que tome como parámetros los valores que nos interesan para la inicialización y llamar a esa función nada más declarar la función. De igual forma, nos interesará tener una función de limpieza de memoria si nuestro objeto utiliza memoria dinámica, que deberíamos llamar antes de la destrucción del objeto. Bien, esto se puede hacer así, explícitamente, con funciones definidas por nosotros, pero las llamadas a esos métodos de inicialización y limpieza pueden resultar pesadas y hasta difíciles de localizar en el caso de la limpieza de memoria.

Anexo II 6-37


Para evitar el tener que llamar a nuestras funciones, el C++ define dos funciones especiales para todas las clases: los métodos constructor y destructor. La función constructor se invoca automáticamente cuando creamos un objeto y la destructor cuando lo destruimos. Nosotros podemos implementar o no estas funciones, pero es importante saber que si no lo hacemos el C++ utiliza un constructor y destructor por defecto. Estos métodos tienen una serie de características comunes muy importantes: •

No retornan ningún valor, ni siquiera de tipo “void”. Por lo tanto, cuando las declaramos, no debemos poner ningún tipo de retorno.

•

Como ya hemos dicho, si no se definen se utilizan los métodos por defecto.

•

No pueden ser declarados constantes, volátiles ni estáticos.

•

No se puede tomar su dirección.

•

Un objeto con constructores o destructores no puede ser miembro de una unión.

•

El orden de ejecución de constructores y destructores es inverso, es decir, los objetos que se construyen primero se destruyen los últimos. Ya veremos que esto es especialmente importante al trabajar con la herencia.

A) Constructor En C++, una forma de asegurar que los objetos siempre contengan valores válidos y que puedan ser inicializados al momento de la declaración es escribiendo un constructor. Un constructor es una función miembro especial de una clase que es llamada de forma automática siempre que se declara un objeto de esa clase. Su función es crear e inicializar un objeto de su clase. Dado que un constructor es una función miembro, admite argumentos al igual que éstas. El constructor se puede distinguir claramente, con respecto a las demás funciones miembro de la clase, porque tiene el mismo nombre que el de la clase. Un constructor no retorna ningún valor ni se hereda. Si el usuario no ha creado uno, el compilador crea uno por omisión, sin argumentos. Pueden existir varios constructores, siempre y cuando difieran en los argumentos. Se puede crear un objeto de cualquiera de las formas siguientes: •

Declarando un objeto local o temporal: Lolo obj_lolo;

•

Invocando al operador new: Lolo *obj_lolo = new Lolo;

Ejemplo: Lolo *obj_lolo = new Lolo(3,4); De esta forma, se debe llamar al operador delete al finalizar; •

Llamando explícitamente al constructor: Lolo obj_lolo(4 , 5.0);

•

Cuando se utiliza el operador new para crear el objeto, el acceso a las variables y funciones miembro de la clase se hace a través del operador (->), siempre y cuando sean públicas. Por ejemplo:

Anexo II 6-38

Lenguaje C++

obj_lolo->real = 4.5; //llamada a una variable perteneciente a la clase obj_lolo->funcion(); //llamada a una funcion perteneciente a la clase Los constructores se pueden considerar como funciones de inicialización y, como tales, pueden tomar cualquier tipo de parámetros, incluso por defecto. Los constructores se pueden sobrecargar, por lo que podemos tener muchos constructores para una misma clase (como ya sabemos, cada constructor debe tomar parámetros distintos). Existe un constructor especial (que podemos definir) o no definir que tiene una función muy específica: copiar atributos entre objetos de una misma clase. Si no lo definimos se usa uno por defecto que copia todos los atributos de los objetos, pero si lo definimos se usa el nuestro. Este constructor se usa cuando inicializamos un objeto por asignación de otro objeto. Para declarar un constructor lo único que hay que hacer es declarar una función miembro sin tipo de retorno y con el mismo nombre que la clase, como ya hemos dicho los parámetros pueden ser los que queramos:

class Complejo { private: float re; float im; public: Complejo (float = 0, float = 0);

// constructor con dos parámetros por defecto // Lo podremos usar con 0, 1, o 2 parámetros.

Complejo (&Complejo);

// constructor copia

... }; // Definición de los constructores // Inicialización Complejo::Complejo (float pr, float pi) { re = pr; im = pi; } // Constructor copia Complejo::Complejo (Complejo& c) { re= c.re; im= c.im; } Los constructores se suelen declarar públicos, pero si todos los constructores de una clase son privados solo podremos crear objetos de esa clase utilizando funciones amigas. A las clases que solo tienen constructores privados se las suele denominar privadas. Los constructores se pueden declarar virtuales. B) Destructor De la misma forma que existe una función para construir cada unos de los objetos que declaramos, también existe una función para destruir cada objeto construido, liberando así la memoria que ocupa. Esta función recibe el Anexo II 6-39


nombre de destructor. Un objeto es destruido automáticamente al salir del ámbito en el que ha sido definido. Sin embargo, si se ha creado con el operador new, se debe utilizar el operador delete para destruirlo. El destructor es una función miembro especial de una clase que se utiliza para eliminar un objeto de esa clase. El destructor se distingue fácilmente del resto de funciones porque tiene el mismo nombre que la clase precedido del operador tilde “~”. El destructor no es heredado, no tiene argumentos ni puede retornar ningún valor. No hace falta llamar al destructor, ya que éste es invocado de forma automática cuando se destruye el objeto por los medios mencionados anteriormente. Si hiciera falta, el destructor también puede ser invocado de forma explícita:

Objeto.nombre_clase::~nombre_clase;

//llamada al destructor

Objeto->nombre_clase::~nombre_clase; //cuando el objeto ha sido creado con new class Lolo{

//lolo.h

public: float real,imaginario; public: Lolo(); ~Lolo();

//constructor //destructor

}; Lolo::Lolo(){

//lolo.cpp //codigo necesario para inicial.

real = imaginario = 0; } Lolo::~Lolo(){ //codigo necesario para liberar memoria. cout << «Se ha llamado al destructor\n»; } Para cada clase sólo se puede definir un destructor, ya que el destructor no puede recibir parámetros y por tanto no se puede sobrecargar. Ya hemos dicho que los destructores no pueden ser constantes, volátiles ni estáticos, pero si pueden ser declarados virtuales (ya veremos más adelante que quiere decir esto). Para declarar un destructor escribimos dentro de la declaración de la clase el símbolo ~ seguido del nombre de la clase. Se emplea el símbolo ~ para indicar que el destructor es el complemento del constructor. Veamos un ejemplo:

class X { private: int *ptr; public: Anexo II 6-40

Lenguaje C++

X(int =1);

// constructor

~X();

// destructor

}; // declaración del constructor X::X(int i){ ptr = new int [i]; } // declaración del destructor X::~X() { delete []ptr; }

13.5. Miembros static de una clase Cada objeto tiene una copia de los datos miembro de la clase. Un dato miembro de una clase declarado como static implica que solo existirá una copia de ese dato miembro para todos los objetos y existe aunque no existan objetos de esa clase, con lo cual se concluye que es un dato asociado con la clase y no con el objeto. Un dato miembro static: •

Puede ser declarado “static”, private o public.

•

Tiene que ser inicializado a nivel global (ámbito de fichero, no de clase).

•

Cuando sea accedido a través de una función miembro, dicha función también tiene que ser declarada “static”.

•

Existe aunque no haya ningún objeto de la clase declarado.

Al igual que los atributos estáticos mencionados en un punto anterior, las funciones miembro estáticas son globales para los miembros de la clase y deben ser definidas fuera del ámbito de la declaración de la clase. Estos métodos son siempre públicos, se declaren donde se declaren. Al no tener parámetro this no pueden acceder a los miembros no estáticos de la clase (al menos directamente, ya que se le podría pasar un puntero al objeto para que modificara lo que fuera).

13.6. Funciones amigas (friend) Son funciones que tienen acceso a los miembros privados de una clase sin ser miembros de la misma. Se emplean para evitar la ineficiencia que supone el tener que acceder a los miembros privados de una clase a través de métodos. Como son funciones independientes de la clase no tienen parámetro this, por lo que el acceso a objetos de una clase se consigue pasándoles como parámetro una Anexo II 6-41


referencia al objeto (una referencia como tipo implica pasar el objeto sin copiar, aunque se trata como si fuera el objeto y no un puntero), un puntero o el mismo objeto. Por la misma razón, no tienen limitación de acceso, ya que se definen fuera de la clase. Para hacer amiga de una clase a una función debemos declararla dentro de la declaración de la clase precedida de la palabra friend:

class X { private: int i; ... friend int f(X&, int);

// función amiga que toma como parámetros una referencia // a un objeto del tipo X y un entero y retorna un entero

} En la definición de la función (que se hace fuera de la clase como las funciones normales) podremos usar y modificar los miembros privados de la clase amiga sin ningún problema: int f(X& objeto, int i) { int j = objeto.i; objeto.i = i; return j; } Es importante ver que aunque las funciones amigas no pertenecen a la clase se declaran explícitamente en la misma, por lo que forman parte de la interface de la clase. Una función miembro de una clase puede ser amiga de otra: class X { ... void f(); ... }; class Y { ... friend void X::f(); }; Si queremos que todas las funciones de una clase sean amigas de una clase podemos poner: class X { friend class Y; ... }; Anexo II 6-42

Lenguaje C++

En el ejemplo todas las funciones de la clase Y son amigas de la clase X, es decir, todos los métodos de Y tienen acceso a los miembros privados de X. Resumiendo, los miembros de una clase declarados como privados solamente pueden ser accedidos mediante las funciones miembro de la clase, garantizando así la integridad de los datos. Una función declarada friend (amiga) de una clase puede acceder a los miembros privados y protegidos de la clase C++. Para declarar una función amiga, basta con escribir la palabra clave friend delante del nombre de la función.

13.7. Variables locales El constructor de una variable local se ejecuta cada vez que encontramos la declaración de la variable local y su destructor se ejecuta cuando salimos del ámbito de la variable. Para ejecutar un constructor distinto del constructor por defecto al declarar una variable hacemos:

Complejo c (1, -1); // Crea el complejo c llamando al constructor // Complejo (float, float) y para emplear el constructor copia para inicializar un objeto hacemos:

Complejo d = c; // crea el objeto d usando el constructor copia // Complejo(Complejo&) Si definimos c y luego d, al salir del bloque de la variable primero llamaremos al destructor de d, y luego al de c.

13.8. Almacenamiento estático Cuando declaramos objetos de tipo estático su constructor se invoca al arrancar el programa y su destructor al terminar. Un ejemplo de esto está en los objetos “cin”, “cout” y “cerr”. Estos objetos se crean al arrancar el programa y se destruyen al acabar. Como siempre, constructores y destructores se ejecutan en orden inverso. El único problema con los objetos estáticos está en el uso de la función “exit()”. Cuando llamamos “a exit()” se ejecutan los destructores de los objetos estáticos, luego usar “exit()” en uno de ellos provocaría una recursión infinita. Si terminamos un programa con la función “abort()” los destructores no se llaman.

13.9. Almacenamiento dinámico Cuando creamos objetos dinámicos con “new” ejecutamos el constructor utilizado para el objeto. Para liberar la memoria ocupada debemos emplear el operador “delete”, que se encargará de llamar al destructor. Si no usamos “delete” no tenemos ninguna garantía de que se llame al destructor del objeto.

Anexo II 6-43


Para crear un objeto con new ponemos: Complejo *c= new Complejo (1); y para destruirlo: delete c; El usuario puede redefinir los operadores “new” y “delete” y puede modificar la forma de interacción de los constructores y destructores con estos operadores. Veremos todo esto al hablar de sobrecarga de operadores. La creación de arrays de objetos se discute más adelante.

13.10. Objetos como miembros Cuando definimos una clase podemos emplear objetos como miembros, pero lo que no sabemos es como se construyen estos objetos miembro. Si no hacemos nada los objetos se construyen llamando a su constructor por defecto (aquel que no toma parámetros). Esto no es ningún problema, pero puede ser interesante construir los objetos miembro con parámetros del constructor del objeto de la clase que los define. Para hacer esto lo único que tenemos que hacer es poner en la definición del constructor los constructores de objetos miembro que queramos invocar. La sintaxis es poner dos puntos después del prototipo de la función constructora (en la definición, es decir, cuando implementamos la función) seguidos de una lista de constructores (invocados con el nombre del objeto, no el de la clase) separados por comas. El cuerpo de la definición de la función se pone después. Estos constructores se llamaran en el orden en el que los pongamos y antes de ejecutar el constructor de la clase que los invoca. Veamos un ejemplo:

class cjto_de_tablas { private: tabla elementos;

// objeto de clase tabla

tabla componentes;

// objeto de clase tabla

int tam_tablas; ... public: cjto_de_tablas (int tam);

// constructor

~cjto_de_tablas ();

// destructor

... }; cjto_de_tablas::cjto_de_tablas (int tam) :elementos (tam), componentes(tam), tam_tablas(tam) { ... // Cuerpo del constructor } Anexo II 6-44

Lenguaje C++

Como se ve en el ejemplo podemos invocar incluso a los constructores de los objetos de tipos estándar. Si en el ejemplo no inicializáramos componentes el objeto se crearía invocando al constructor por defecto (el que no tiene parámetros, que puede ser un constructor nuestro con parámetros por defecto). Este método es mejor que emplear punteros a objetos y construirlos con “new” en el constructor y liberarlos con “delete” en el destructor, ya que el uso de objetos dinámicos consume más memoria que los objetos estáticos (ya que usan un puntero y precisan llamadas al sistema para reservar y liberar memoria). Si dentro de una clase necesitamos miembros objeto pero no necesitamos que sean dinámicos emplearemos objetos miembro con la inicialización en el constructor de la clase. • Arrays de objetos Al igual que con los tipos estándar, también es posible crear array’s de objetos: •

Forma estática, utilizando los corchetes:

Nombre_clase Nombre_array[num_objetos]; •

Forma dinámica, usando new:

Nombre_clase *Nom_Puntero = new Nombre_clase[num]; Notas. •

Para crear un puntero a objeto se utiliza new.

•

Para acceder a los miembros se usa el operador (->).

•

Hemos de acordarnos de llamar a “delete” cuando ya no necesitemos el “array”.

Para declarar un array de objetos de una clase determinada es imprescindible que la clase tenga un constructor por defecto (que como ya hemos dicho es uno que no recibe parámetros pero puede tener parámetros por defecto). Al declarar el “array” se crearán tantos objetos como indiquen los índices llamando al constructor por defecto. La destrucción de los elementos para “arrays” estáticos se realiza por defecto al salir del bloque de la declaración (igual que con cualquier tipo de objetos estáticos), pero cuando creamos un “array” dinámicamente se siguen las mismas reglas explicadas al hablar de “new” y “delete”, es decir, debemos llamar a delete indicándole que queremos liberar un array. Veamos varios ejemplos:

tabla at[20];

// array de 20 tablas, se llama a los constructores por defecto

void f(int tam) { tabla *t1 = new tabla;

// puntero a un elemento de tipo tabla

tabla *t2 = new tabla [tam];

// puntero a un array de ‘tam’ tablas

... delete t1;

// destrucción de un objeto

detele []t2;

// destrucción de un array

} Anexo II 6-45


14. Herencia en C++ Una clase clase derivada puede definirse a partir de otra clase ya existente (clase base), de la que hereda sus variables y funciones miembro. La clase derivada puede añadir y/o redefinir nuevas variables y/o funciones miembro. La clase base suele ser más general que la clase derivada. Ésta añade nuevas determinaciones o especificaciones (nuevas variables y/o funciones miembro). A su vez, la clase derivada puede ser clase base de una nueva clase derivada, que hereda sus variables y funciones miembro. Se puede constituir una jerarquía de clases. Además de public y private, C++ permite también definir miembros protected. Los miembros protected, al igual que los private, no son accesibles desde fuera de la clase. En una clase base, los miembros protected se diferencian de los private en que sí pueden ser accesibles para las clases derivadas de dicha clase base. Para la clase derivada, la clase base se puede heredar como pública o como privada: •

La clase derivada no tiene acceso a los miembros private de la clase base. Sí tiene acceso a los miembros public y protected.

•

Si la clase base se hereda como public, la clase derivada hereda los miembros public y protected de la clase base como miembros public y protected, respectivamente.

•

Si la clase base se hereda como private, la clase derivada hereda todos los miembros de la clase base como private.

14.1. Constructores de clases derivadas Un objeto de una clase derivada contiene todos los miembros de la clase base. El constructor de la clase derivada debe llamar al de la clase base. Cuando se define un constructor para una clase derivada, se debe especificar un inicializador base (llamada al constructor de la clase base). El inicializador base se especifica poniendo, a continuación de los argumentos del constructor, el carácter “:” y un constructor de la clase base seguido de una lista de argumentos entre paréntesis. Al declarar un objeto de la clase derivada, se ejecuta primero el constructor de la clase base y luego el de la clase derivada. El inicializador base puede ser omitido si la clase base tiene un constructor por defecto. El constructor de una clase derivada debe disponer de valores para sus propias variables y para el constructor de la clase base.

popo::popo(const char *nombre) : lolo (nombre) { …… …… }; Definimos las clases como antes, pero intentamos dar unas clases base o clases padre para representar las características comunes de las clases y luego

Anexo II 6-46

Lenguaje C++

definimos unas clases derivadas o subclases que definen tan solo las características diferenciadoras de los objetos de esa clase. Por ejemplo, si queremos representar empleados y clientes podemos definir una clase base persona que contenga las características comunes de ambas clases (nombre, DNI, etc.) y después declararemos las clases empleado y cliente como derivadas de persona, y solo definiremos los miembros que son nuevos respecto a las personas o los que tienen características diferentes en la clase derivada, por ejemplo un empleado puede ser despedido, tiene un sueldo, puede firmar un contrato, etc., mientras que un cliente puede tener una cuenta, una lista de pedidos, puede firmar un contrato, etc. Como se ha mencionado ambos tipos pueden firmar contratos, pero los métodos serán diferentes, ya que la acción es la misma pero tiene significados distintos. En definitiva, introducimos los mecanismos de la herencia y polimorfismo para implementar las relaciones entre las clases. La herencia consiste en la definición de clases a partir de otras clases, de tal forma que la clase derivada hereda las características de la clase base, mientras que el polimorfismo nos permite que métodos declarados de la misma manera en una clase base y una derivada se comporten de forma distinta en función de la clase del objeto que la invoque, el método es polimórfico, tiene varias formas.

14.2. Clases derivadas o subclases Una clase derivada es una clase que se define en función de otra clase. La sintaxis es muy simple: declaramos la clase como siempre, pero después de nombrar la clase escribimos dos puntos y el nombre de su clase base. Esto le indica al compilador que todos los miembros de la clase base se heredan en la nueva clase. Por ejemplo, si tenemos la clase empleado (derivada de persona) y queremos definir la clase directivo podemos declarar esta última como derivada de la primera. Así, un directivo tendrá las características de persona y de empleado, pero definirá además unos nuevos atributos y métodos propios de su clase:

class directivo : empleado { private: long num_empleados; long num_acciones; ... public: ... void despide_a (empleado *e); void reunion_con (directivo *d); ... }; Como un objeto de tipo directivo es un empleado, se podrá usar en los lugares en los que se trate a los empleados, pero no al revés (un empleado no puede usarse cuando necesitamos un directivo). Esto es cierto cuando trabajamos con punteros a objetos, no con objetos: Anexo II 6-47


directivo d1, d2; empleado e1; lista_empleados *le; le= &d1; // inserta un directivo en la lista de empleados d1.next = &e1; // el siguiente empleado es e1 e1.next = &d2; // el siguiente empleado es el directivo 2 d1.despide_a (&e1); // el directivo puede despedir a un empleado d1.despide_a (&d2); // o a otro directivo, ya que también es un empleado e1.despide_a (&d1); // ERROR, un empleado no tiene definido el método despide a d1.reunion_con (&d2); // Un directivo se reúne con otro d1.reunion_con (&e); // ERROR, un empleado no se reúne con un directivo empleado *e2 = &d2; // CORRECTO, un directivo es un empleado directivo *d3 = &e; // ERROR, no todos los empleados son directivos d3->num_empleados =3; // Puede provocar un error, ya que e1 no tiene espacio // reservado para num_empleados d3 = (directivo *)e2. // CORRECTO, e2 apunta a un directivo d3->num_empleados =3; // CORRECTO, d3 apunta a un directivo En definitiva, un objeto de una clase derivada se puede usar como objeto de la clase base si se maneja con punteros, pero hay que tener cuidado ya que el C++ no realiza chequeo de tipo dinámico (no tiene forma de saber que un puntero a un tipo base realmente apunta a un objeto de la clase derivada). A) Funciones miembro en clases derivadas En el ejemplo del punto anterior hemos definido nuevos miembros (podemos definir nuevos atributos y métodos, e incluso atributos de la clase derivada con los mismos nombres que atributos de la clase base de igual o distinto tipo) para la clase derivada, pero, ¿cómo accedemos a los miembros de la clase base desde la derivada? Si no se redefinen, podemos acceder a los atributos de la forma habitual y llamar a los métodos como si estuvieran definidos en la clase derivada, pero si se redefinen para acceder al miembro de la clase base debemos emplear el operador de campo aplicado al nombre de la clase base (en caso contrario accedemos al miembro de la clase derivada):

class empleado { ... void imprime_sueldo(); void imprime_ficha (); ...

Anexo II 6-48

Lenguaje C++

} class directivo : empleado { ... void imprime_ficha () { imprime_sueldo(); empleado::imprime_ficha(); ... } ... }; directivo d; d.imprime_sueldo (); // se llama al método implementado para empleado, ya // que la clase directivo no define el método d.imprime_ficha (); // se llama al método definido en directivo d.empleado::imprime_ficha (); // llamamos al método de la clase base empleado

14.3. Constructores y destructores Algunas clases derivadas necesitan constructores, y si la clase base de una clase derivada tiene un constructor este debe ser llamado proporcionándole los parámetros que necesite. En realidad, la gestión de las llamadas a los constructores de una clase base se gestionan igual que cuando definimos objetos miembro, es decir, se llaman en el constructor de la clase derivada de forma implícita si no ponemos nada (cuando la clase base tiene un constructor por defecto) o de forma explícita siempre que queramos llamar a un constructor con parámetros (o cuando esto es necesario). La única diferencia con la llamada al constructor respecto al caso de los objetos miembro es que en este caso llamamos al constructor con el nombre de la clase y no del objeto, ya que aquí no existe. Veamos un ejemplo:

class X { ... X();

// constructor sin param

X (int); // constructor que recibe un entero ~X();

// destructor

}; class Y : X { ... Y();

// constructor sin param

Anexo II 6-49


Y(int); // constructor con un parámetro entero Y (int, int)

; // constructor con dos parámetros enteros

... }; // constructor sin param, invoca al constructor por defecto de X Y::Y() { ... } // constructor con un parámetro entero, invoca al constructor que recibe un entero de la clase X Y::Y(int i) : X(i) { ... } // constructor con dos parámetros enteros, invoca al constructor por defecto de X Y::Y (int i , int j) { ... }

14.4. Las jerarquías de clases Como ya hemos visto las clases derivadas pueden a su vez ser clases base de otras clases, por lo que es lógico pensar que las aplicaciones en las que definamos varias clases acabemos teniendo una estructura en árbol de clases y subclases. En realidad esto es lo habitual, construir una jerarquía de clases en las que la clase base es el tipo objeto y a partir de él cuelgan todas las clases. Esta estructura tiene la ventaja de que podemos aplicar determinadas operaciones sobre todos los objetos de la clase, como por ejemplo, mantener una estructura de punteros a objeto de todos los objetos dinámicos de nuestro programa o declarar una serie de variables globales en la clase raíz de nuestra jerarquía que sean accesibles para todas las clases pero no para funciones definidas fuera de las clases. Aparte del diseño en árbol se utiliza también la estructura de bosque: definimos una serie de clases sin descendencia común, pero que crean sus propios árboles de clases. Generalmente, se utiliza un árbol principal y luego una serie de clases contenedor que no están en la jerarquía principal y, por tanto, pueden almacenar objetos de cualquier tipo sin pertenecer realmente a la jerarquía (si están junto con el árbol principal podemos llegar a hacer programas muy complejos de forma innecesaria, ya que una pila podría almacenarse a sí misma, causando problemas a la hora de destruir objetos). No siempre la estructura es un árbol, ya que la idea de herencia múltiple provoca la posibilidad de interdependencia entre nodos de ramas distintas, por lo que sería más correcto hablar de grafos en vez de árboles. Anexo II 6-50

Lenguaje C++

14.5. Los métodos virtuales El C++ permite el empleo de funciones polimórficas, que son aquellas que se declaran de la misma manera en distintas clases y se definen de forma diferente. En función del objeto que invoque a una función polimórfica se utilizará una función u otra. En definitiva, una función polimórfica será aquella que tendrá formas distintas según el objeto que la emplee. Los métodos virtuales son un mecanismo proporcionado por el C++ que nos permiten declarar funciones polimórficas. Cuando definimos un objeto de una clase e invocamos a una función virtual, el compilador llamará a la función correspondiente a la de la clase del objeto. Para declarar una función como virtual basta poner la palabra virtual antes de la declaración de la función en la declaración de la clase. Una función declarada como virtual debe ser definida en la clase base que la declara (excepto si la función es virtual pura), y podrá ser empleada aunque no haya ninguna clase derivada. Las funciones virtuales solo se redefinen cuando una clase derivada necesita modificar la de su clase base. Una vez se declara un método como virtual esa función sigue siéndolo en todas las clases derivadas que lo definen, aunque no lo indiquemos. Es recomendable poner siempre que la función es virtual, ya que si tenemos una jerarquía grande se nos puede olvidar que la función fue declarada como virtual. Para gestionar las funciones virtuales el compilador crea una tabla de punteros a función para las funciones virtuales de la clase, y luego cada objeto de esa clase contendrá un puntero a dicha tabla. De esta manera tenemos dos niveles de indirección, pero el acceso es rápido y el incremento de memoria escaso. Al emplear el puntero a la tabla el compilador utiliza la función asociada al objeto, no la función de la clase que tenga el objeto en el momento de invocarla. Empleando funciones virtuales nos aseguramos que los objetos de una clase usarán sus propias funciones virtuales aunque se estén accediendo a través de punteros a objetos de un tipo base. Ejemplo:

class empleado { ... virtual void imprime_sueldo() const; virtual void imprime_ficha () const; ... } class directivo : empleado { ... virtual void imprime_ficha () const;

// no es necesario poner virtual

... }; directivo d; Anexo II 6-51


empleado e; d.imprime_ficha ();

// llamamos a la función de directivo

e.imprime_ficha ();

// llamamos a la función de empleado

d.imprime_sueldo();

// llamamos a la función de empleado, ya que aunque es // virtual, la clase directivo no la redefine

empleado *pe = &d; pe->imprime_sueldo();

// pe apunta a un directivo, llamamos a la función de la // clase directivo, que es la asociada al objeto d

La tabla se crea al construir el objeto por lo que los constructores no podrán ser virtuales, ya que no disponemos del puntero a la tabla hasta terminar con el constructor. Por esa misma razón hay que tener cuidado al llamar a funciones virtuales desde un constructor: llamaremos a la función de la clase base, no a la que redefina nuestra clase. Los destructores sí pueden ser declarados virtuales. Las funciones virtuales necesitan el parámetro this para saber qué objeto las utiliza y, por tanto, no pueden ser declaradas “static” ni friend. Una función friend no es un método de la clase que la declara como amiga, por lo que tampoco tendría sentido definirla como virtual. De cualquier forma, dijimos que una clase puede tener como amigos métodos de otras clases. Pues bien, estos métodos amigos pueden ser virtuales; si nos fijamos un poco, la clase que declara una función como amiga no tiene por qué saber si ésta es virtual o no.

14.6. Clases abstractas Ya hemos mencionado lo que son las jerarquías de clases, pero hemos dicho que se pueden declarar objetos de cualquiera de las clases de la jerarquía. Esto tienen un problema importante: al definir una jerarquía es habitual definir clases que no queremos que se puedan instanciar, es decir, clases que solo sirven para definir el tipo de atributos y mensajes comunes para sus clases derivadas: son las denominadas clases abstractas. En estas clases es típico definir métodos virtuales sin implementar, es decir, métodos que dicen cómo debe ser el mensaje pero no qué se debe hacer cuando se emplean con objetos del tipo base. Este mecanismo nos obliga a implementar estos métodos en todas las clases derivadas, haciendo más fácil la consistencia de las clases. Pues bien, el C++ define un mecanismo para hacer esto (ya que si no lo hiciera deberíamos definir esos métodos virtuales con un código vacío, lo que no impediría que declaráramos subclases que no definieran el método y además permitiría que definiéramos objetos del tipo base abstracto). La idea es que podemos definir uno o varios métodos como virtuales puros o abstractos (sin implementación), y esto nos obliga a redeclararlos en todas las clases derivadas (siempre que queramos definir objetos de estas subclases). Además, una clase con métodos abstractos se considera una clase abstracta y por tanto no podemos definir objetos de esa clase. Anexo II 6-52

Lenguaje C++

Para declarar un método como abstracto solo tenemos que igualarlo a cero en la declaración de la clase (escribimos un igual a cero después del prototipo del método, justo antes del punto y coma, como cuando inicializamos variables):

class X { private: ... public: X(); ~X(); virtual void f(int) = 0;

// método abstracto, no debemos definir la función para esta clase

... } class Y : public X { ... virtual void f(int);

// volvemos a declarar f, deberemos definir el método para la clase Y

... } Lo único que resta por mencionar de las funciones virtuales puras es que no tenemos por qué definirlas en una subclase de una clase abstracta si no queremos instanciar objetos de esa subclase. Esto se puede producir cuando de una clase abstracta derivan subclases para las que nos interesa definir objetos y también subclases que van a servir de clases base abstractas para nuevas clases derivadas. Una subclase de una clase abstracta será abstracta siempre que no redefinamos todas las funciones virtuales puras de la clase padre. Si redefinimos algunas de ellas, las clases que deriven de la subclase abstracta sólo necesitarán implementar las funciones virtuales puras que su clase padre (la derivada de la abstracta original) no haya definido.

14.7. Herencia múltiple La idea de la herencia múltiple es bastante simple, aunque tiene algunos problemas a nivel de uso. Igual que decíamos que una clase podía heredar características de otra, se nos puede ocurrir que una clase podría heredar características de más de una clase. El ejemplo típico es la definición de la clase de vehículos anfibios; como sabemos los anfibios son vehículos que pueden circular por tierra o por mar. Por tanto, podríamos definir los anfibios como elementos que heredan características de los vehículos terrestres y los vehículos marinos. La sintaxis para expresar que una clase deriva de más de una clase base es simple, ponemos el nombre de la nueva clase, dos puntos y la lista de clases padre: Anexo II 6-53


class anfibio : terrestre, marino { ... }; Los objetos de la clase derivada podrán usar métodos de sus clases padre y se podrán asignar a punteros a objetos de esas clases. Las funciones virtuales se tratan igual, etc. Todo lo que hemos comentado hasta ahora es que la herencia múltiple es como la simple, excepto por el hecho de que tomamos (heredamos) características de dos clases. Pero no todo es tan sencillo, existen una serie de problemas que comentaremos en los puntos siguientes.

14.8. Ocurrencias múltiples de una base Con la posibilidad de que una clase derive de varias clases es fácil que se presente el caso de que una clase tenga una clase como clase más de una vez. Por ejemplo, en el caso del anfibio tenemos como base las clases terrestre y marino, pero ambas clases podrían derivar de una misma clase base vehículo. Esto no tiene por qué crear problemas, ya que podemos considerar que los objetos de la clase anfibio contienen objetos de las clases terrestre y marino, que a su vez contienen objetos diferentes de la clase vehículo. De todas formas, si intentamos acceder a miembros de la clase vehículo, aparecerán ambigüedades. A continuación veremos cómo podemos resolverlas.

14.9. Resolución de ambigüedades Evidentemente, dos clases pueden tener miembros con el mismo nombre, pero cuando trabajamos con herencia múltiple esto puede crear ambigüedades que deben ser resueltas. El método para acceder a miembros con el mismo nombre en dos clases base desde una clase derivada es emplear el operador de campo, indicando cuál es la clase del miembro al que accedemos:

class terrestre : vehiculo { ... char *Tipo_Motor; ... virtual void imprime_tipo_motor() { cout << Tipo_Motor; } ... }; class marino : vehiculo { ... char *Tipo_Motor; ...

Anexo II 6-54

Lenguaje C++

virtual void imprime_tipo_motor(); { cout << Tipo_Motor; } ... }; class anfibio : terrestre, marino { ... virtual void imprime_tipo_motor(); ... }; void anfibio::imprime_tipo_motor () { cout << «Motor terrestre : «; terrestre::imprime_tipo_motor (); cout << «Motor acuático : «; marino::imprime_tipo_motor (); } Lo habitual es que la ambigüedad se produzca al usar métodos (ya que los atributos suelen ser privados y, por tanto, no accesibles para la clase derivada), y la mejor solución es hacer lo que se ve en el ejemplo: redefinir la función conflictiva para que utilice las de las clases base. De esta forma los problemas de ambigüedad se resuelven en la clase y no tenemos que emplear el operador de campo desde fuera de ésta (al llamar al método desde un objeto de la clase derivada). Si intentamos acceder a miembros ambiguos el compilador no generará código hasta que resolvamos la ambigüedad.

14.10. Clases base virtuales Las clases base que hemos empleado hasta ahora con herencia múltiple tienen la suficiente entidad como para que se declararen objetos de esas clases, es decir, heredábamos de dos o más clases porque en realidad los objetos de la nueva clase se componían o formaban a partir de otros objetos. Esto está muy bien, y suele ser lo habitual, pero existe otra forma de emplear la herencia múltiple: el hermanado de clases. El mecanismo de hermanado se basa en lo siguiente: para definir clases que toman varias características de clases derivadas de una misma clase. Es decir, definimos una clase base y derivamos clases que le añaden características y luego queremos usar objetos que tengan varias de las características que nos han originado clases derivadas. En lugar de derivar una clase de la base que reúna las características, podemos derivar una clase de las subclases que las incorporen. Por ejemplo, si definimos una clase ventana y derivamos las clases ventana_con_borde y ventana_con_menu, en lugar de derivar de la clase ventana una clase ventana_con_menu_y_borde, la derivamos de las dos subclases. En realidad lo que queremos es emplear un mismo objeto de la clase base ventana, por lo que nos interesa que las dos subclases generen sus objetos a partir de un mismo objeto ventana. Esto se consigue declarando la herencia de la clase Anexo II 6-55


base como virtual en todas las subclases que quieran compartir su padre con otras subclases al ser empleadas como clase base, y también en las subclases que la hereden desde varias clases distintas:

class ventana { }; class ventana_con_borde : public virtual ventana { }; class ventana_con_menu : public virtual ventana { }; class ventana_con_menu_y_borde : public virtual ventana, public ventana_con_borde, public ventana_con_menu { }; El problema que surge en estas clases es que los métodos de la clase base común pueden ser invocados por dos métodos de las clases derivadas y que, al agruparse en la nueva clase, generen dos llamadas al mismo método de la clase base inicial. Por ejemplo, en el caso de la clase ventana, supongamos que definimos un método dibujar, que es invocado por los métodos dibujar de las clases ventana_con_borde y ventana_con_menu. Para definir el método dibujar de la nueva clase ventana_con_menu_y_ borde lo lógico sería llamar a los métodos de sus funciones padre, pero esto provocaría que llamáramos dos veces al método dibujar de la clase ventana, provocando no sólo ineficiencia, sino incluso errores (ya que el redibujado de la ventana puede borrar algo que no debe borrar, por ejemplo el menú). La solución pasaría por definir dos funciones de dibujo, una virtual y otra no virtual: usaremos la virtual para dibujar objetos de la clase (por ejemplo, ventanas con marco) y la no virtual para dibujar sólo lo característico de nuestra clase. Al definir la clase que agrupa características llamaremos a las funciones no virtuales de las clases padre, evitando que se repitan llamadas. Otro problema con estas clases es que si dos funciones hermanas redefinen un método de la clase padre (como el método dibujar anterior), la clase que herede de ambas deberá redefinirla para evitar ambigüedades (¿a qué función se llama si la subclase no redefine el método?).

14.11. Control de acceso Como ya comentamos en puntos anteriores, los miembros de una clase pueden ser privados, protegidos o públicos (private, protected, public). El acceso a los miembros privados está limitado a funciones miembro y amigas de la clase; el acceso protegido es igual que el privado, pero también permite que accedan a ellos las clases derivadas; y los miembros públicos son accesibles desde cualquier sitio en el que la clase sea accesible. El único modelo de acceso que no hemos estudiado es el protegido. Cuando implementamos una clase base podemos querer definir funciones que puedan utilizar las clases derivadas pero que no se puedan usar desde fuera de la clase. Si definimos miembros como privados tenemos el problema de que la clase derivada tampoco puede acceder a ellos. La solución es definir esos métodos como “protected”. Anexo II 6-56

Lenguaje C++

Estos niveles de acceso reflejan los tipos de funciones que acceden a las clases: las funciones que la implementan, las que implementan clases derivadas y el resto. Ya se ha mencionado que dentro de la clase podemos definir prácticamente cualquier cosa (tipos, variables, funciones, constantes, etc.). El nivel de acceso se aplica a los nombres, por lo que lo que podemos definir como privados, públicos o protegidos no sólo los atributos, sino todo lo que puede formar parte de la clase. Aunque los miembros de una clase tienen definido un nivel de acceso, también podemos especificar un nivel de acceso a las clases base desde clases derivadas. El nivel de acceso a clases base se emplea para saber quién puede convertir punteros a la clase derivada en punteros a la clase base (de forma implícita, ya que con casts siempre se puede) y acceder a miembros de la clase base heredados en la derivada. Es decir, una clase con acceso private a su clase base puede acceder a su clase base, pero ni sus clases derivadas ni otras funciones tienen acceso a la misma, es como si definiéramos todos los miembros de la clase base como “private” en la clase derivada. Si el acceso a la clase base es “protected”, solo los miembros de la clase derivada y los de las clases derivadas de esta última tienen acceso a la clase base. Y si el acceso es público, el acceso a los miembros de la clase base es el especificado en ella. Para especificar el nivel de acceso a la clase base ponemos la etiqueta de nivel de acceso antes de escribir su nombre en la definición de una clase derivada. Si la clase tiene herencia múltiple, debemos especificar el acceso de todas las clases base. Si no ponemos nada, el acceso a las clases base se asume public. Ejemplo:

class anfibio : public terrestre, protected marino { ... }; • Gestión de memoria Cuando creamos objetos de una clase derivada se llama a los constructores de sus clases base antes de ejecutar el de la clase, y luego se ejecuta el suyo. El orden de llamada a los destructores es el inverso, primero el de la clase derivada y luego el de sus padres. Comentamos al hablar de métodos virtuales que los destructores podían ser declarados como tales; la utilidad de esto es clara: si queremos destruir un objeto de una clase derivada usando un puntero a una clase base y el destructor no es virtual la destrucción será errónea, con los problemas que esto puede traer. De hecho, casi todos los compiladores definen un “flag” para que los destructores sean virtuales por defecto. Lo más típico es declarar los destructores como virtuales siempre que en una clase se defina un método virtual, ya que es muy posible que se manejen punteros a objetos de esa clase. Además de comentar la forma de llamar a constructores y destructores, en este punto se podría hablar de las posibilidades de sobrecarga de los operadores “new” y “delete” para clases, ya que esta sobrecarga nos permite modificar el modo en que se gestiona la memoria al crear objetos. Como el siguiente punto es la sobrecarga de operadores estudiaremos esta posibilidad en ella. Sólo decir que la sobrecarga de la gestión de memoria es especialmente interesante en las clases base, ya que si ahorramos memoria al trabajar con objetos de la clase base es evidente que la ahorraremos siempre que creemos objetos de clases derivadas. Anexo II 6-57


15. Sobrecarga en C++ • Sobrecarga de funciones La sobrecarga de funciones consiste en definir varias funciones con el mismo nombre diferenciándolas por los argumentos que son de distinto tipo y será el detalle que permite al compilador llamar a una u otra función.

#include void funcion(int x); void funcion(double x); void main(void) { int y=10;

double x=7.2;

funcion(x);

funcion(y);

} void funcion(int a) { cout << «Valor entero: « << a << endl; } void funcion(double a) { cout << «Valor real: « << a << endl; } • Sobrecarga de operadores Los operadores, al igual que las funciones, pueden ser sobrecargados: •

La mayor parte de los operadores de C++ pueden ser redefinidos para actuar sobre objetos de una clase.

•

Se puede cambiar la definición de un operador, pero no su gramática: número de operandos, precedencia y asociatividad.

•

El tipo de los operandos determina qué definición del operador se va a utilizar.

•

Al menos uno de los operandos debe ser un objeto de la clase.

La sintaxis para declarar un operador sobrecargado es la siguiente:

Tipo_operator operador([argumentos]); Donde:

tipo indica el tipo del valor retornado por la función operador es unos de los siguientes: +,-,*,/,%,&,!,>,<,=,[],new, delete, ...

Anexo II 6-58

Lenguaje C++

Sobrecarga del operador de indexación “[ ]“: •

El operador de indexación, operator[], permite manipular los objetos de clases igual que si fuesen arrays.

•

La llamada a la función operator[] de una clase se hace escribiendo el nombre de un objeto de la clase para el cual se quiere invocar dicha función, seguido de un valor encerrado entre corchetes.

•

La forma de sobrecargar el operador es:

int& operator[]( int i); Esta capacidad se traduce en poder definir un significado para los operadores cuando los aplicamos a objetos de una clase específica. Además de los operadores aritméticos, lógicos y relacionales, también la llamada (), el subíndice [] y la de referencia -> se pueden definir, e incluso la asignación y la inicialización pueden redefinirse. También es posible definir la conversión implícita y explícita de tipos entre clases de usuario y tipos del lenguaje.

15.1. Funciones operador Se pueden declarar funciones para definir significados para los siguientes operadores: +-*/%^&|~! = < > += -= *= /= %= ^= &= |= << >> <<= >>= == != <= >= && || ++ — ->* , -> [] () new delete No podemos modificar ni las precedencias ni la sintaxis de las expresiones para los operadores, ya que podríamos provocar ambigüedades. Tampoco podemos definir nuevos operadores. El nombre de una función operador es la palabra clave operator seguida del operador, por ejemplo operator+. Al emplear un operador podemos llamar a su función o poner el operador, el uso del operador sólo es para simplificar la escritura. Por ejemplo:

int c = a + b; es lo mismo que:

int c = operator+ (a, b);

15.2. Asignación e inicialización La asignación entre objetos de un mismo tipo definido por el usuario puede crear problemas; por ejemplo, si tenemos la clase cadena:

Anexo II 6-59


class cadena { private: char *p; // puntero a cadena int tam; // tamaño de la cadena apuntada por p public: cadena (int t) { p = new char [tam =t] } ~cadena () { delete []p; } } la operación: cadena c1(10); cadena c2(20); c2 = c1; asignará a c2 el puntero de c1, por lo que al destruir los objetos dejaremos la cadena c2 original sin tocar y llamaremos dos veces al destructor de c1. Esto se puede resolver redefiniendo el operador de asignación:

class cadena { ... cadena& operator= (const cadena&); // operador de asignación } cadena& cadena::operator= (const cadena& a) { if (this != &a) { // si no igualamos una cadena a si misma delete []p; p = new char[tam = a.tam]; strncpy (p, a.p); } return *this; // nos retornamos a nosotros mismos } Con esta definición resolvemos el problema anterior, pero aparece un nuevo problema: hemos dado por supuesto que la asignación se hace para objetos inicializados pero, ¿qué pasa si en lugar de una asignación estamos haciendo una inicialización? Por ejemplo:

cadena c1(10); cadena c2 = c1; En esta situación solo construimos un objeto, pero destruimos dos. El operador de asignación definido por el usuario no se aplica a un objeto sin iniAnexo II 6-60

Lenguaje C++

cializar; en realidad debemos definir un constructor copia para objetos de un mismo tipo. Este constructor es el que se llama en la inicialización:

class cadena { ... cadena (const cadena&); // constructor copia } cadena::cadena (const cadena& a) { p = new char[tam = a.tam]; strncpy (p, a.p); }

15.3. Sobrecarga de new y delete Al igual que el resto de operadores, los operadores “operator new” y “operator delete” se pueden sobrecargar. Esto se emplea para crear y destruir objetos de formas distintas a las habituales: reservando el espacio de forma diferente o en posiciones de memoria que no están libres en el “heap”, inicializando la memoria a un valor concreto, etc. El “operador new” tiene un parámetro obligatorio de tipo size_t y luego podemos poner todo tipo y número de parámetros. Su retorno debe ser un puntero “void”. El parámetro size_t es el tamaño en “bytes” de la memoria a reservar, si la llamada a “new” es para crear un vector size_t debe ser el número de elementos por el tamaño de la clase de los objetos del “array”. Es muy importante tener claro lo que hacemos cuando redefinimos la gestión de memoria, y siempre que sobrecarguemos el “new” o el “delete” tener presente que ambos operadores están relacionados y ambos deben ser sobrecargados a la vez para reservar y liberar memoria de formas extrañas.

16. Templates C++ es un lenguaje muy potente tal y como lo hemos definido hasta ahora, pero al ir incorporándole características se ha tendido a que no se perdiera eficiencia (dentro de unos márgenes) a cambio de una mayor comodidad y potencia a la hora de programar. El C introdujo en su momento un mecanismo sencillo para facilitar la escritura de código: las macros. Una macro es una forma de representar expresiones; se trata en realidad de evitar la repetición de la escritura de código mediante el empleo de abreviaturas, sustituyendo una expresión por un nombre o un nombre con aspecto de función que luego se expande y sustituye las abreviaturas por código. El mecanismo de las macros no estaba mal, pero tenía un grave defecto: el uso y la definición de macros se hace a ciegas en lo que al compilador se refiere. El mecanismo de sustitución que nos permite definir pseudo-funcioAnexo II 6-61


nes no realiza ningún tipo de chequeos y es por tanto poco seguro. Además, la potencia de las macros es muy limitada. Para evitar que cada vez que definamos una función o una clase tengamos que replicar código en función de los tipos que manejemos (como parámetros en funciones o como miembros y retornos y parámetros de funciones miembro en clases), el C++ introduce el concepto de funciones y clases genéricas. Una función genérica es realmente como una plantilla de una función: lo que representa es lo que tenemos que hacer con unos datos sin especificar el tipo de algunos de ellos. Por ejemplo una función máximo se puede implementar igual para enteros, para reales o para complejos, siempre y cuando esté definido el operador de relación <. Pues bien, la idea de las funciones genéricas es definir la operación de forma general, sin indicar los tipos de las variables que intervienen en la operación. Una vez dada una definición general, para usar la función con diferentes tipos de datos, la llamaremos indicando el tipo (o los tipos de datos) que intervienen en ella. En realidad es como si le pasáramos a la función los tipos junto con los datos. Al igual que sucede con las funciones, las clases contenedor son estructuras que almacenan información de un tipo determinado, lo que implica que cada clase contenedor debe ser reescrita para contener objetos de un tipo concreto. Si definimos la clase de forma general, sin considerar el tipo que tiene lo que vamos a almacenar y luego le pasamos a la clase el tipo o los tipos que le faltan para definir la estructura, ahorraremos tiempo y código al escribir nuestros programas.

16.1. Funciones genéricas Para definir una función genérica solo tenemos que poner delante de la función la palabra template seguida de una lista de nombres de tipos (precedidos de la palabra “class”) y separados por comas, entre los signos de menor y mayor. Los nombres de los tipos no se deben referir a tipos existentes, sino que deben ser como los nombres de las variables, identificadores. Los tipos definidos entre mayor y menor se utilizan dentro de la clase como si de tipos de datos normales se tratara. Al llamar a la función el compilador sustituirá los tipos parametrizados en función de los parámetros actuales (por eso, todos los tipos parametrizados deben aparecer al menos una vez en la lista de parámetros de la función). Ejemplo:

template // sólo un tipo parámetro T max (T a, T b) { return (a>b) ? a : b } // función genérica máximo Los tipos parámetro no solo se pueden usar para especificar tipos de variables o de retornos, también podemos usarlos dentro de la función para lo que queramos (definir variables, punteros, asignar memoria dinámica, etc.). En definitiva, los podemos usar para lo mismo que los tipos normales. Todos lo modificadores de una función (inline, static, etc.) van después de template < ... >.

Anexo II 6-62

Lenguaje C++

Las funciones genéricas se pueden sobrecargar y también especializar. Para sobrecargar una función genérica lo único que debemos hacer es redefinirla con distinto tipo de parámetros (haremos que emplee más tipos o que tome distinto número o en distinto orden los parámetros), y para especializar una función debemos implementarla con los tipos parámetro especificados (algunos de ellos al menos):

template T max (T a, T b) { ... }

// función máximo para dos parámetros de tipo T, sobrecarga de la función

template T max (int *p, T a) { ... }

// función máximo para punteros a entero y valores de tipo T // sobrecarga de la función

template T max (T a[]) { ... }

// función genérica máximo para vectores de tipo T, especialización // función máximo para cadenas como punteros a carácter

const char* max(const char *c1, const char *c2) { return (strncmp(c1, c2) >=1) ? c1 : c2; } // ejemplos de uso int i1 = 9, i2 = 12; cout << max (i1, i2);

// se llama a máximo con dos enteros, T=int

int *p = &i2; cout << max (p, i1); (T=entero)

//llamamos a la función que recibe puntero y tipo T

cout << max («HOLA», «ADIOS»);

// se llama a la función especializada para trabajar con cadenas.

Con las funciones especializadas lo que sucede es muy simple: si llamamos a la función y existe una versión que especifica los tipos, usamos esa. Si no encuentra la función, busca una función template de la que se pueda instanciar una función con los tipos de la llamada. Si las funciones están sobrecargadas resuelve como siempre, si no encuentra ninguna función aceptable, da un error.

Anexo II 6-63


16.2. Clases genéricas También podemos definir clases genéricas de una forma muy similar a las funciones. Esto es especialmente útil para definir las clases contenedor, ya que los tipos que contienen sólo nos interesan para almacenarlos y podemos definir las estructuras de una forma más o menos genérica sin ningún problema. Hay que indicar que si las clases necesitan comparar u operar de alguna forma con los objetos de la clase parámetro, las clases que usemos como parámetros actuales de la clase deberán tener sobrecargados los operadores que necesitemos. Para declarar una clase paramétrica hacemos lo mismo de antes:

template

// podríamos poner más de un tipo

class vector { T* v;

// puntero a tipo T

int tam; public: vector (int); T& operator[] (int);

// el operador devuelve objetos de tipo T

... } Pero para declarar objetos de la clase debemos especificar los tipos (no hay otra forma de saber por que debemos sustituirlos hasta no usar el objeto):

vector v(100); // vector de 100 elementos de tipo T = int Una vez declarados los objetos se usan como los de una clase normal. Para definir los métodos de la clase solo debemos poner la palabra “template” con la lista de tipos y al poner el nombre de la clase adjuntarle su lista de identificadores de tipo (igual que lo que ponemos en template pero sin poner “class”):

template vector::vector (int i) { ... } template T& vector::operator[] (int i) { ... } ...

Anexo II 6-64

Lenguaje C++

Al igual que las funciones genéricas, las clases genéricas se pueden especializar, es decir, podemos definir una clase especifica para unos tipos determinados e incluso especializar solo métodos de una clase. Lo único a tener en cuenta es que debemos poner la lista de tipos parámetro especificando los tipos al especificar una clase o un método:

// especializamos la clase para char *, podemos modificar totalmente la def. de la clase class vector { char *feo; public: vector (); void hola (); } // Si sólo queremos especializar un método vector::vector (int i) { ... // constructor especial para float } Además de lo visto el C++ permite que las clases genéricas admitan constantes en la lista de tipos parámetro:

template class pila { T bloque[SZ]; // vector de SZ elementos de tipo T ... }; La única limitación para estas constantes es que deben ser conocidas en tiempo de compilación. Otra facilidad es la de poder emplear la herencia con clases parametrizadas, tanto para definir nuevas clases genéricas como para definir clases no genéricas. En ambos casos debemos indicar los tipos de la clase base, aunque para clases genéricas derivadas de clases genéricas podemos emplear tipos de nuestra lista de parámetros. Ejemplo: template

class pila { ... } // clase template derivada template class pilita : public pila { // la clase base usa el tipo T y SZ vale 20 Anexo II 6-65


... }; // clase no template derivada class pilita_chars : public pila { // heredamos de la clase pila con T=char y SZ=50 ... };

17. Manejo de excepciones Existen varios tipos de errores a la hora de programar: los errores sintácticos y los errores de uso de funciones o clase y los errores del usuario del programa. Los primeros los debe detectar el compilador, pero el resto se deben detectar en tiempo de ejecución, es decir, debemos tener código para detectarlos y tomar las acciones oportunas. Ejemplos típicos de errores son el salirse del rango de un vector, divisiones por cero, desbordamiento de la pila, etc. Para facilitarnos el manejo de estos errores el C++ incorpora un mecanismo de tratamiento de errores más potente que el simple uso de códigos de error y funciones para tratarlos.

17.1. Tratamiento de excepciones en C++ (throw - catch - try) La idea es la siguiente: en una cadena de llamadas a funciones los errores no se suelen tratar donde se producen, por lo que la idea es lanzar un mensaje de error desde el sitio donde se produce uno y ir pasándolo hasta que alguien se encargue de él. Si una función llama a otra y la función llamada detecta un error lo lanza y termina. La función llamante recibirá el error, si no lo trata, lo pasará a la función que la ha llamado a ella. Si la función recoge la excepción ejecuta una función de tratamiento del error. Además de poder lanzar y recibir errores, debemos definir un bloque como aceptor de errores. La idea es que probamos a ejecutar un bloque y si se producen errores los recogemos. En el resto de bloques del programa no se podrán recoger errores.

17.2. Lanzamiento de excepciones: throw Si dentro de una función detectamos un error lanzamos una excepción poniendo la palabra “throw” y un parámetro de un tipo determinado, es como si ejecutáramos un return de un objeto (una cadena, un entero o una clase definida por nosotros). Por ejemplo:

f() { ... int *i; if ((i= new int) == NULL) Anexo II 6-66

Lenguaje C++

throw «Error al reservar la memoria para i»; // no hacen falta paréntesis, // es como en return ... } Si la función f() fue invocada desde g() y ésta, a su vez, desde h(), el error se irá pasando entre ellas hasta que se recoja.

17.3. Recogida: catch Para recoger un error empleamos la pseudofunción “catch”; esta instrucción se pone como si fuera una función, con “catch” y un parámetro de un tipo determinado entre paréntesis, después abrimos llave, escribimos el código de gestión del error y cerramos la llave. Por ejemplo si la función h() trataba el error anterior:

h() { ... catch (char *ce) { cout << «He recibido un error que dice : « << ce; } ... } Podemos poner varios bloques “catch” seguidos, cada uno recogerá un error de un tipo distinto. El orden de los bloques es el orden en el que se recogen las excepciones:

h() { ... catch (char *ce) { ... // tratamos errores que lanzan cadenas } catch (int ee) { ... // tratamos errores que lanzan enteros } ... } Si queremos que un catch trate más de un tipo de errores, podemos poner tres puntos (parámetros indefinidos):

h() { Anexo II 6-67


... catch (char *ce) { ... // tratamos errores que lanzan cadenas } catch (...) { ... // tratamos el resto de errores } ... }

17.4. El bloque de prueba: try El tratamiento de errores visto hasta ahora es muy limitado, ya que no tenemos forma de especificar dónde se pueden producir errores (en qué bloques del programa). La forma de especificar dónde se pueden producir errores que queremos recoger es emplear bloques “try”, que son bloques delimitados poniendo la palabra try y luego poniendo entre llaves el código que queremos probar. Después del bloque “try” se ponen los bloques “catch” para tratar los errores que se hayan podido producir:

h() { ... g();

// si produce un error, se le pasa al que llamo a h()

try { g();

// si produce un error lo tratamos nosotros

} catch (int i){ ... } catch (...){ ... } z(); } Solo podemos recoger errores después de un bloque “try”, por lo que los “catch” siempre van asociados a los “try”. Si una función que no está dentro de un bloque de prueba recibe un error la pasa a su nivel superior hasta que llegue a una llamada producida dentro de un bloque de prueba que trate el error o salga del programa principal. Si en un bloque “try” se produce un error que Anexo II 6-68

Lenguaje C++

no es tratado por sus “catch”, también pasamos el error hacia arriba. Cuando se recoge un error con un “catch” no se retorna al sitio que lo originó, sino que se sigue con el código que hay después del último “catch” asociado al “try” donde se aceptó el error. En el ejemplo se ejecutaría la función z().

17.5. La lista throw Podemos especificar los tipos de excepciones que puede lanzar una función, poniendo después del prototipo de la función la lista “throw”, que no es más que la palabra “throw” seguida de una lista de tipos separada por comas y entre paréntesis:

void f () throw (char*, int); // f sólo lanza cadenas y enteros Si una función lanza una excepción que no esté en su lista de tipos se produce un error de ejecución. Si ponemos una lista vacía la función no puede lanzar excepciones.

Anexo II 6-69

Anexo III Lenguaje JAVA.


Guión-resumen

1. Introducción a JAVA

13. La clase Object

2. Comentarios

14. Interface

3. Identificadores

15. Paquetes

4. Variables

16. Excepciones

5. Operadores

17. HILOs - Threads

6. Separadores

18. Interfaz gráfico AWT (Abstract Window Toolkit)

7. Sentencias o expresiones 8. Arrays y Cadenas 9. Clases en JAVA 10. Entrada / Salida 11. Herencia 12. Clases abstractas

Anexo III 6-2

19. Paseando por la Red 20. Los Sockets 21. El JAVA Development Kit

Lenguaje JAVA

1.

Introducción a JAVA

JAVA es un lenguaje de programación desarrollado por un grupo de ingenieros de Sun Microsystems (1991-1995). Es un lenguaje orientado a objetos, a diferencia de otros lenguajes que son lenguajes modificados para poder trabajar con objetos. En un principio fue denominado “Oak”, se le puso el nombre de JAVA en 1995. La estructura de un programa realizado en cualquier lenguaje orientado a objetos (Object Oriented Programming) (OOP), y en particular en el lenguaje JAVA es una clase. En JAVA todo forma parte de una clase, es una clase o describe cómo funciona una clase. El conocimiento de las clases es fundamental para poder entender los programas JAVA. Todas las acciones de los programas JAVA se colocan dentro del bloque de una clase. Todos los métodos se definen dentro del bloque de la clase, JAVA no soporta funciones o variables globales. En todo programa nos encontramos con una clase que contiene el programa principal y algunas clases de usuario (las específicas de la aplicación que se está desarrollando) que son utilizadas por el programa principal. Los ficheros fuente tienen la extensión *.java, mientras que los ficheros compilados tienen la extensión *.class. Un fichero fuente (*.java) puede contener más de una clase, pero sólo una puede ser public. El nombre del fichero fuente debe coincidir con el de la clase public (con la extensión *.java), es decir, si por ejemplo en un fichero aparece la declaración (public class MiClase {...}) entonces el nombre del fichero deberá ser MiClase.java. Es importante que coincidan mayúsculas y minúsculas ya que MiClase.java y miclase.java serían clases diferentes para JAVA. Si la clase no es public, no es necesario que su nombre coincida con el del fichero. Una clase puede ser public o package (default), pero no “private” o “protected”. De ordinario una aplicación está constituida por varios ficheros *.class. Cada clase realiza unas funciones particulares, permitiendo construir las aplicaciones con gran modularidad e independencia entre clases. Las clases de JAVA se agrupan en packages, que son librerías de clases. Si las clases no se definen como pertenecientes a un package, se utiliza un package por defecto (default) que es el directorio activo. Es necesario entender y dominar la sintaxis utilizada en la programación; observemos nuestro primer programa en JAVA y un breve comentario de las partes que lo componen, para posteriormente pasar a estudiar la nomenclatura empleada y los elementos que empleamos para desarrollar nuestro lenguaje:

/*

lolo.java Autor NombreyApellido 2005 Escribe en pantalla «¡Hola, mundo!»

*/ class lolo { public static void main(String args[]) { System.out.println(«¡Hola, mundo!»); } } Anexo III 6-3


Analicemos el programa anterior: Comentario:

/* Lolo.java Autor NombreyApellido 2005 Escribe en pantalla «¡Hola, mundo!» */

Definición de clase Lolo: class Lolo Define método main: public static void main(String args[]) Accesible para todos: public Método de clase: static Tipo devuelto. (No devuelve nada): void Punto de entrada de los programas JAVA: main Argumentos en línea de comandos: (String args[]) Clase: System Objeto estático de System (salida estándar): out (flujo) Método de “out” (escribe en línea): println JAVA es un lenguaje que ha sido diseñado para producir “software”: —

Confiable: Minimiza los errores que se escapan a la fase de prueba.

—

Multiplataforma: Los mismos binarios funcionan correctamente en Windows, Unix y Power/Mac.

—

Seguro: Applets recuperados por medio de la red no pueden causar daño a los usuarios.

—

Orientado a objetos: Beneficioso tanto para el proveedor de bibliotecas de clases como para el programador de aplicaciones.

—

Robusto: Los errores se detectan en el momento de producirse, lo que facilita la depuración.

Entre las características que nombramos nos referimos a la robustez. JAVA no permite el manejo directo del “hardware” ni de la memoria. El intérprete siempre tiene el control. El compilador es suficientemente inteligente como para no permitir un montón de cosas que podrían traer problemas, como usar variables sin inicializarlas, modificar valores de punteros directamente, acceder a métodos o variables en forma incorrecta, utilizar herencia múltiple, etc. Además, JAVA Anexo III 6-4

Lenguaje JAVA

implementa mecanismos de seguridad que limitan el acceso a recursos de las máquinas donde se ejecuta, especialmente en el caso de los Applets (que son aplicaciones que se cargan desde un servidor y se ejecutan en el cliente). También está diseñado específicamente para trabajar sobre una red, de modo que incorpora objetos que permiten acceder a archivos en forma remota (via URL por ejemplo). Además, con el JDK (JAVA Development Kit) vienen incorporadas muchas herramientas, entre ellas un generador automático de documentación que, al poner los comentarios adecuados en las clases, crea inclusive toda la documentación de las mismas en formato HTML.

2.

Comentarios

Los comentarios son aquellas aclaraciones que el programador introduce en el lenguaje dirigido al propio programador como recordatorio o a futuros programadores que deseen variar el programa, con el fin de facilitar la comprensión del mismo; el ordenador ignorará dichos comentarios. // Comentarios para una sola línea /* Comentarios de una o más líneas */ /** Comentario que va a ir en ejecutable (Comentario de documentación) */

3.

Identificadores

Los identificadores se utilizan para nombrar variables, funciones, clases y objetos, o cualquier elemento que se necesite identificar o utilizar. Los identificadores utilizados en JAVA comienzan con una letra, un subrayado (_) o un símbolo de dólar ($), nunca por un dígito u otro carácter gráfico (@, #, …). El resto de los caracteres que componen los identificadores son o bien letras o bien dígitos o una combinación de ambos y no existe una longitud máxima. Serían identificadores válidos: nombre nombre_y_apellidos Nombre_Usuarios _variable_interna $moneda JAVA tiene una serie de palabras clave. Estas palabras no se pueden utilizar como identificadores. La siguiente lista de palabras incluye todas aquellas que son consideradas palabras clave por JAVA: Anexo III 6-5


abstract

continue

for

new

switch

boolean

default

goto

null

synchronized

break

do

private

package

threadsafe

byte

double

This

if

implements

byvalue

else

import

protected

throw

case

extends

instanceof

public

transient

catch

false

int

return

true

char

final

“interface”

short

try

class

finally

long

static

void

const

float

native

super

while

Poco a poco las irá conociendo todas. Además de estas palabras clave, JAVA se ha reservado otras ocho palabras que no pueden ser utilizadas como identificadores; se presentan a continuación y por el momento no tienen ningún cometido específico.

4.

cast

future

generic

inner

operator

outer

rest

var

Variables

Son variables aquellos identificadores que a lo largo del programa pueden variar su valor, bien por el usuario, bien por el propio programa. JAVA utiliza cinco tipos de Variables: enteros, reales en coma flotante, booleanos, caracteres y cadenas. Las variables se pueden definir y utilizar en cualquier parte del código. Cada variable define un tipo de elementos con un rango perfectamente definido, siempre dentro de la clase.

4.1.

Declaración de variables locales Las variables locales se declaran igual que los atributos de la clase: Tipo NombreVariable [= Valor]; Ej:

int suma; float precio; Contador obj; Sólo que aquí no se declaran private, public, etc., sino que las variables definidas dentro del método sólo son accesibles por él. Las variables pueden inicializarse al crearse: Anexo III 6-6

Lenguaje JAVA

Ej: int suma = 0; float precio = 12.3; Contador obj = new Contador ( );

4.2.

Asignaciones a variables Se asigna un valor a una variable mediante el signo =: Variable = Constante | Expresión;

Ej: suma = suma + 1; precio = 1.05 * precio; obj.cnt = 0; Todas las variables en el lenguaje JAVA deben tener un tipo de dato. El tipo de la variable determina los valores que la variable puede contener y las operaciones que se pueden realizar con ella. Existen dos categorías de datos principales en el lenguaje JAVA: los tipos primitivos y los tipos referenciados. Los tipos primitivos contienen un solo valor e incluyen los tipos como los enteros, coma flotante, los caracteres, etc... La tabla siguiente muestra todos los tipos primitivos soportados por el lenguaje JAVA, su formato, su tamaño y una breve descripción de cada uno: TIPO

TAMAÑO/FORMATO

DESCRIPCIÓN

byte

8-bit complemento a 2

Entero de un Byte

short


Entero corto

int


Entero

long


Entero largo

float

32-bit IEEE 754

Coma flotante de precisión simple

double

64-bit IEEE 754

Coma flotante de precisión doble

char

16-bit Carácter

Un solo carácter

boolean

true o false

Un valor booleano (verdadero o falso)

Los tipos referenciados se llaman así porque el valor de una variable de referencia es una referencia (un puntero) hacia el valor real. En JAVA tenemos los arrays, las clases y los “interfaces” como tipos de datos referenciados.

Anexo III 6-7


Por convención, como ya hemos comentado, en JAVA los nombres de las variables empiezan con una letra minúscula (los nombres de las clases empiezan con una letra mayúscula).

5.

Operadores

Los operadores utilizados por JAVA son parecidos a los utilizados en operaciones algebraicas y lógicas. A continuación se muestran los operadores que maneja JAVA por orden de precedencia: .

[]

()

++

—

!

~

instanceof

*

/

%

+

-

<<

>>

>>>

<

>

<=

&

^

|

&&

||

?

:

=

op=

(*=

>=

==

!=

/=

%=

+=

-=

Los operadores con una precedencia más alta se evalúan primero. Por ejemplo, el operador división tiene una precedencia mayor que el operador suma, por eso, en la expresión anterior x + y / 100, el compilador evaluará primero y / 100. El operador = hace copias de objetos, marcando los antiguos para borrarlos, y el garbage collector se encargará de devolver al sistema la memoria ocupada por el objeto eliminado. Los operadores realizan algunas funciones en uno o dos operandos. Los operadores que requieren un operador se llaman operadores unarios. Por ejemplo, ++ es un operador unario que incrementa el valor operando en uno. Los operadores que requieren dos operandos se llaman operadores binarios. El operador = es un operador binario que asigna un valor del operando derecho al operando izquierdo. Los operadores unarios en JAVA pueden utilizar la notación de prefijo o de sufijo. La notación de prefijo significa que el operador aparece antes de su operando: operador operando. La notación de sufijo significa que el operador aparece después de su operando: operando operador . Los operadores binarios de JAVA tienen la misma notación, es decir, aparecen entre los dos operandos: op1 operator op2. Además de realizar una operación también devuelve un valor. El valor y su tipo dependen del tipo del operador y del tipo de sus operandos. Por ejemplo, Anexo III 6-8

Lenguaje JAVA

los operadores aritméticos (realizan las operaciones de aritmética básica como la suma o la resta) devuelven números, el resultado típico de las operaciones aritméticas. El tipo de datos devuelto por los operadores aritméticos depende del tipo de sus operandos: si sumas dos enteros, obtendrás un entero. Se dice que una operación evalúa su resultado. Los operadores JAVA se dividen en las siguientes categorías: aritméticos, relacionales y condicionales, lógicos y de desplazamiento y de asignación. A) Operadores aritméticos OPERADOR

USO

DESCRIPCIÓN

+

op1 + op2

Suma op1 y op2

-

op1 - op2

Resta op2 de op1

*

op1 * op2

Multiplica op1 y op2

/

op1 / op2

Divide op1 por op2

%

op1 % op2

Obtiene el resto de dividir op1 por op2

Nota: El lenguaje JAVA extiende la definición del operador + para incluir la concatenación de cadenas. Los operadores + y - tienen versiones unarias que seleccionan el signo del operando: OPERADOR

USO

DESCRIPCIÓN

+

+ op

Indica un valor positivo

-

- op

Niega el operando

Además, existen dos operadores de atajos aritméticos: ++ que incrementa en uno su operando, y — que decrementa en uno el valor de su operando. OPERADOR

USO

DESCRIPCIÓN

++

op ++

Incrementa op en 1; evalúa el valor antes de incrementar

++

++ op

Incrementa op en 1; evalúa el valor después de incrementar

—

op —

Decrementa op en 1; evalúa el valor antes de decrementar

—

— op

Decrementa op en 1; evalúa el valor después de decrementar

B) Operadores relacionales y condicionales Los valores relacionales comparan dos valores y determinan la relación entre ellos. Por ejemplo, != devuelve true si los dos operandos son distintos.

Anexo III 6-9


OPERADOR

USO

DEVUELVE

TRUE SI

>

op1 > op2

op1 es mayor que op2

>=

op1 >= op2

op1 es mayor o igual que op2

<

op1 < op2

op1 es menor que op2

<=

op1 <= op2

op1 es menor o igual que op2

==

op1 == op2

op1 y op2 son iguales

!=

op1 != op2

op1 y op2 son distintos

Aquí tiene tres operadores condicionales: OPERADOR

USO

DEVUELVE

TRUE SI

&&

op1 && op2

op1 y op2 son verdaderos

||

op1 || op2

uno de los dos es verdadero

!

! op

op es falso

El operador & se puede utilizar como un sinónimo de && si ambos operadores son booleanos. Similarmente, | es un sinónimo de || si ambos operandos son booleanos. C) Operadores de desplazamiento OPERADOR

USO

DESCRIPCIÓN

>>

op1 >> op2

Desplaza a la derecha op2 bits de op1

<<

op1 << op2

Desplaza a la izquierda op2 bits de op1

>>>

op1 >>> op2

Desplaza a la derecha op2 bits de op1(sin signo)

&

op1 & op2

Bitwise and

|

op1 | op2

Bitwise or

^

op1 ^ op2

Bitwise xor

~

~ op

Bitwise complemento

D) Operadores de asignación Puede utilizar el operador de asignación =, para asignar un valor a otro. Además del operador de asignación básico, JAVA proporciona varios operadores de asignación que permiten realizar operaciones aritméticas, lógicas o de bits y una operación de asignación al mismo tiempo.

Anexo III 6-10

Lenguaje JAVA

6.

Separadores

En la gramática de JAVA también hay definidos una serie de separadores simples, que definen la forma y función del código. Estos separadores son:

()paréntesis

Se utilizan para identificar listas de parámetros utilizados en la definición y llamada a métodos. También se utilizan para definir el orden de precedencia en expresiones, para delimitar expresiones en situaciones de control de flujo y rodear las conversiones de tipo.

{}llaves

Contienen los valores de las matrices inicializadas automáticamente. También se utiliza para definir un bloque de código, para clases, métodos y ámbitos locales.

[] corchetes

Para declarar tipos matriz. También se utiliza cuando se referencian valores de matriz.

;punto y coma Separa sentencias. ,coma

Separa identificadores consecutivos en una declaración de variables. También se utiliza para encadenar sentencias dentro de una sentencia “for”.

.punto

Para separar nombres de paquete de subpaquetes y clases. También se utiliza para separar una variable o método de una variable de referencia.

7.

Sentencias o expresiones

Las expresiones realizan el trabajo de un programa JAVA. Entre otras cosas, las expresiones se utilizan para calcular y asignar valores a las variables y para controlar el flujo de un programa JAVA. El trabajo de una expresión se divide en dos partes: realizar los cálculos indicados por los elementos de la expresión y devolver algún valor. Una expresión es, por tanto, una serie de variables, operadores y llamadas a métodos (construida de acuerdo a la sintaxis del lenguaje) que evalúa a un valor sencillo. Si no se le indica explícitamente al compilador el orden en el que se quiere que se realicen las operaciones, él decide basándose en la precedencia asignada a los operadores y otros elementos que se utilizan dentro de una expresión. Una expresión es un conjunto variables unidos por operadores. Son órdenes que se le dan al equipo para que realice una tarea determinada. Se permite incluir varias sentencias en una línea, aunque lo habitual es utilizar una línea para cada sentencia. Por ejemplo: i = 0; j = 5; x = i + j; // Tres sentencias.

7.1.

Bifurcaciones

Las bifurcaciones permiten ejecutar una de entre varias acciones en función del valor de una expresión lógica o relacional. Se trata de estructuras muy importantes ya que son las encargadas de controlar el flujo de ejecución de un programa. Existen dos bifurcaciones diferentes: “if” y “switch”. Anexo III 6-11


A) Bifurcación if Esta estructura permite ejecutar un conjunto de sentencias en función del valor que tenga la expresión de comparación (se ejecuta si la expresión de comparación tiene valor true). Tiene la forma siguiente: if (expresión_booleana) { SENTENCIAS; } Las llaves {} sirven para agrupar en un bloque las sentencias que se han de ejecutar, y no son necesarias si solo hay una sentencia dentro del “if”. B) Bifurcación if else Análoga a la anterior, de la cual es una ampliación. Las sentencias incluidas en el “else” se ejecutan en el caso de no cumplirse la expresión de comparación (false). if (expresión_booleana) { SENTENCIAS 1; } else { SENTENCIAS 2; } C) Bifurcación if elseif else Permite introducir más de una expresión de comparación. Si la primera condición no se cumple, se compara la segunda y así sucesivamente. En el caso de que no se cumpla ninguna de las comparaciones se ejecutan las sentencias correspondientes al else.

, if (expresión_booleana) instrucción_si_true; [else instrucción_si_false;] if (expresión_booleana) { instrucciones_si_true; } else { instrucciones_si_false; }

Anexo III 6-12

if (expresión_booleana1) { SENTENCIAS 1; } else if (expresión_booleana2) { SENTENCIAS 2; } else if (expresión_booleana3) { SENTENCIAS 3; } else { SENTENCIAS 4; }

Lenguaje JAVA

D) Sentencia switch Se trata de una alternativa a la bifurcación “if else” cuando se compara la misma expresión con distintos valores. Permite ejecutar una serie de operaciones para el caso de que una variable tenga un valor entero dado. La ejecución saltea todos los case hasta que encuentra uno con el valor de la variable, y ejecuta desde allí hasta el final del case o hasta que encuentre un break, en cuyo caso salta al final del case. El default permite poner una serie de instrucciones que se ejecutan en caso de que la igualdad no se dé para ninguno de los case. switch (expresión) { case (valor1): instrucciones_1; [break;] case (valor2): instrucciones_2; [break;] ….. case (valorN): instrucciones_N; [break;] default: instrucciones_por_defecto; }

switch (expression) { case value1: SENTENCIAS; case value2: SENTENCIAS; case value3: SENTENCIAS; case value4: SENTENCIAS; case value5: SENTENCIAS; case value6: SENTENCIAS; [default: statements7;] }

break; break; break; break; break; break;

Las características más relevantes de “switch” son las siguientes:

7.2.

1.

Cada sentencia case se corresponde con un único valor de expresión. No se pueden establecer rangos o condiciones, sino que se debe comparar con valores concretos.

2.

Los valores no comprendidos en ninguna sentencia case se pueden gestionar en default, que es opcional.

3.

En ausencia de “break”, cuando se ejecuta una sentencia case se ejecutan también todas las case que van a continuación, hasta que se llega a un “break” o hasta que se termina el “switch”.

Bucles

Un bucle se utiliza para realizar un proceso repetidas veces. Se denomina también lazo o “loop”. El código incluido entre las llaves {} (opcionales si el proceso repetitivo consta de una sola línea), se ejecutará mientras se cumpla unas determinadas condiciones. Hay que prestar especial atención a los bucles infinitos, hecho que ocurre cuando la condición de finalizar el bucle (Boolean expression) no se llega a cumplir nunca. Se trata de un fallo muy típico, habitual sobre todo entre programadores poco experimentados.

Anexo III 6-13


A) Bucle while Permite ejecutar un grupo de instrucciones mientras se cumpla una condición dada: while (expresión_booleana) { instrucciones… } Por ejemplo: while ( linea != null) { linea = archivo.LeerLinea(); System.out.println(linea); } B) Bucle for La forma general del bucle for es la siguiente: for (initialization; booleanExpression; increment) { SENTENCIAS; } que es equivalente a utilizar “while” en la siguiente forma, initialization; while (booleanExpression) { SENTENCIAS; incremento; } La sentencia o sentencias “initialization” se ejecuta al comienzo del “for”, e incrementa después de “statements”. La Boolean expression se evalúa al comienzo de cada iteración; el bucle termina cuando la expresión de comparación toma el valor “false”. Cualquiera de las tres partes puede estar vacía. La initialization y el increment pueden tener varias expresiones separadas por comas. C) Bucle do while Es similar al bucle “while” pero con la particularidad de que el control está al final del bucle (lo que hace que el bucle se ejecute al menos una vez, independientemente de que la condición se cumpla o no). Una vez ejecutados las sentencias, se evalúa la condición: si resulta true se vuelven a ejecutar las

Anexo III 6-14

Lenguaje JAVA

sentencias incluidas en el bucle, mientras que si la condición se evalúa a “false” finaliza el bucle. Este tipo de bucles se utiliza con frecuencia para controlar la satisfacción de una determinada condición de error o de convergencia. do { instrucciones… } while (expresión_booleana); Por ejemplo: do { linea = archivo.LeerLinea(); if (linea != null) System.out.println(linea); } while (linea != null);

7.3.

Sentencias break, continue y return

La sentencia “break” es válida tanto para las bifurcaciones como para los bucles. Hace que se salga inmediatamente del bucle o bloque que se está ejecutando, sin realizar la ejecución del resto de las sentencias. La sentencia “continue” se utiliza en los bucles (no en bifurcaciones). Finaliza la iteración “i” que en ese momento se está ejecutando (no ejecuta el resto de sentencias que hubiera hasta el final del bucle). Vuelve al comienzo del bucle y comienza la siguiente iteración (i+1). A) Sentencias break y continue con etiquetas Las etiquetas permiten indicar un lugar donde continuar la ejecución de un programa después de un “break” o “continue”. El único lugar donde se pueden incluir etiquetas es justo delante de un bloque de código entre llaves {} (if, switch, do...while, while, for) y sólo se deben utilizar cuando se tiene uno o más bucles (o bloques) dentro de otro bucle y se desea salir (break) o continuar con la siguiente iteración (continue) de un bucle que no es el actual. lolo: for ( int i = 0, j = 0; i < 100; i++){ while ( true ) { if( (++j) > 5) { break lolo; } else { break; } } } Anexo III 6-15


B) Sentencia return Otra forma de salir de un bucle (y de un método) es utilizar la sentencia “return”. A diferencia de “continue” o “break”, la sentencia “return” sale también del método o función. En el caso de que la función devuelva alguna variable, este valor se deberá poner a continuación del “return” (return value;). C) Sentencias de manejo de excepciones Cuando ocurre un error dentro de un método JAVA, el método puede lanzar una excepción para indicar a su llamador que ha ocurrido un error y que el error está utilizando la sentencia throw. El método llamador puede utilizar las sentencias try, catch, y finally para capturar y manejar la excepción. Puedes ver Manejar Errores Utilizando Excepciones para obtener más información sobre el lanzamiento y manejo de excepciones.

8.

Arrays y Cadenas

Al igual que otros lenguajes de programación, JAVA permite juntar y manejar múltiples valores a través de un objeto “array” (matriz). También se pueden manejar datos compuestos de múltiples caracteres utilizando el objeto String (cadena).

8.1.

Arrays

Como otras variables, antes de poder utilizar un array primero se debe declarar. De nuevo, al igual que otras variables, la declaración de un array tiene dos componentes primarios: el tipo del “array” y su nombre. Un tipo de array incluye el tipo de dato de los elementos que va contener el “array”. Por ejemplo, el tipo de dato para un “array” que sólo va a contener elementos enteros es un “array” de enteros. No puede existir un “array” de tipo de datos genérico en el que el tipo de sus elementos esté indefinido cuando se declara el “array”. Aquí tienes la declaración de un “array” de enteros: int[] arrayDeEnteros; La parte int[] de la declaración indica que arrayDeEnteros es un “array” de enteros. La declaración no asigna ninguna memoria para contener los elementos del “array”. Si se intenta asignar un valor o acceder a cualquier elemento de arrayDeEnteros antes de haber asignado la memoria para él, el compilador dará un error. Para asignar memoria a los elementos de un “array”, primero se debe ejemplarizar el “array”. Se puede hacer esto utilizando el operador new de JAVA (realmente, los pasos que se deben seguir para crear un array son similares a los se deben seguir para crear un objeto de una clase: declaración, ejemplarización e inicialización). La siguiente sentencia asigna la suficiente memoria para que arrayDeEnteros pueda contener diez enteros.

int[] arraydeenteros = new int[10]

Anexo III 6-16

Lenguaje JAVA

En general, cuando se crea un “array”, se utiliza el operador new, más el tipo de dato de los elementos del array, más el número de elementos deseados encerrado entre corchetes cuadrados (‘[‘ y ‘]’).

TipodeElemento[] NombredeArray = new TipodeElementos[tamanoArray] Los arrays pueden contener cualquier tipo de dato legal en JAVA incluyendo los tipos de referencia como son los objetos u otros “array”. Por ejemplo, el siguiente ejemplo declara un array que puede contener diez objetos String. String[] arrayDeStrings = new String[10]; Los elementos en este “array” son del tipo referencia, esto es, cada elemento contiene una referencia a un objeto String. En este punto, se ha asignado suficiente memoria para contener las referencias a los Strings, pero no se ha asignado memoria para los propios Strings. Si se intenta acceder a uno de los elementos de arraydeStrings obtendrá una excepción ‘NullPointerException’ porque el array está vacío y no contiene ni cadenas ni objetos String.

8.2.

Strings

Una secuencia de datos del tipo carácter se llama un string (cadena) y en el entorno JAVA está implementada por la clase String (un miembro del paquete java.lang).

String[] args; Este código declara explícitamente un “array”, llamado args, que contiene objetos del tipo String. Los corchetes vacíos indican que la longitud del “array” no se conoce en el momento de la compilación, porque el array se pasa en el momento de la ejecución. El segundo uso de String es el uso de cadenas literales (una cadena de caracteres entre comillas “y”):

«Hola mundo!» El compilador asigna implicitamente espacio para un objeto String cuando encuentra una cadena literal. Los objetos String son inmutables —es decir, no se pueden modificar una vez que han sido creados—. El paquete java.lang proporciona una clase diferente, StringBuffer, que se podrá utilizar para crear y manipular caracteres. JAVA concatena cadenas fácilmente utilizando el operador +.

9.

Clases en JAVA

Una clase es una agrupación de datos (variables o campos) y de funciones (métodos) que operan sobre esos datos. A estos datos y funciones pertenecientes a una clase se les denomina variables y métodos o funciones miembro. La programación orientada a objetos se basa en la programación de clases. Un programa se construye a partir de un conjunto de clases. Anexo III 6-17


Una vez definida e implementada una clase, es posible declarar elementos de esta clase. Los elementos declarados de una clase se denominan objetos de la clase. De una clase se pueden declarar o crear numerosos objetos. La clase es lo genérico: es el patrón o modelo para crear objetos.

9.1.

El cuerpo de la clase

El cuerpo de la clase, encerrado entre { }, es la lista de atributos (variables) y métodos (funciones) que constituyen la clase. No es obligatorio, pero en general se listan primero los atributos y luego los métodos. La definición en plan muy general de una clase se realiza en la siguiente forma: [elementos] class nombre_clase [elementos] { [lista_de_atributos] [lista_de_métodos] } El esqueleto de cualquier aplicación JAVA se basa en la definición de una clase. Todos los datos básicos, como los enteros, se deben declarar en las clases antes de hacer uso de ellos. En la práctica son pocas las sentencias que se pueden colocar fuera del bloque de una clase. La palabra clave import (equivalente al #include) puede colocarse al principio de un fichero, fuera del bloque de la clase. Sin embargo, el compilador reemplazará esa sentencia con el contenido del fichero que se indique, que consistirá, como es de suponer, en más clases.

9.2.

Tipos de Clases Los tipos de clases que podemos definir son: •

abstract. Una clase abstract tiene al menos un método abstracto. Una clase abstracta no se instancia, sino que se utiliza como clase base para la herencia.

•

final. Una clase final se declara como la clase que termina una cadena de herencia. No se puede heredar de una clase final. Por ejemplo, la clase Math es una clase final.

•

public. Las clases public son accesibles desde otras clases, bien sea directamente o por herencia. Son accesibles dentro del mismo paquete en el que se han declarado. Para acceder desde otros paquetes, primero tienen que ser importadas.

•

synchronizable. Este modificador especifica que todos los métodos definidos en la clase son sincronizados, es decir, que no se puede acceder al mismo tiempo a ellos desde distintos ““threads””; el sistema se encarga de colocar los “flags” necesarios para evitarlo. Este mecanismo hace que desde ““threads”” diferentes se puedan modificar las mismas variables sin que haya problemas de que se sobreescriban.

Anexo III 6-18

Lenguaje JAVA

9.3.

Características de las clases 1.

Todas las variables y funciones de JAVA deben pertenecer a una clase. No hay variables y funciones globales.

2.

Si una clase deriva de otra (extends) hereda todas sus variables y métodos.

3.

JAVA tiene una jerarquía de clases estándar de la que pueden derivar las clases que crean los usuarios.

4.

Una clase sólo puede heredar de una única clase (en JAVA no hay herencia múltiple). Si al definir una clase no se especifica de qué clase deriva, por defecto la clase deriva de Object. La clase Object es la base de toda la jerarquía de clases de JAVA.

5.

En un fichero se pueden definir varias clases, pero en un fichero no puede haber más que una clase public. Este fichero se debe llamar como la clase public que contiene con extensión *.java.

6.

Si una clase contenida en un fichero no es public, no es necesario que el fichero se llame como la clase.

7.

Los métodos de una clase pueden referirse de modo global al objeto de esa clase al que se aplican por medio de la referencia “this”.

8.

Las clases se pueden agrupar en packages, introduciendo una línea al comienzo del fichero (package packageName;). Esta agrupación en packages está relacionada con la jerarquía de directorios y ficheros en la que se guardan las clases.

9.4.

Declaración de la clase

La clase se declara mediante la línea public class Contador. En el caso más general, la declaración de una clase puede contener los siguientes elementos: [public] [ final | abstract] class Clase [extends ClaseMadre] [implements Interfase1 [, Interfase2 ]…] O bien, para “interfaces”: [public] “interface” Interfase [extends InterfaseMadre1 [,InterfaseMadre2 ]…] Como se ve, lo único obligatorio es class y el nombre de la clase. Las interfases son un caso de clase particular que veremos más adelante. —

Extends. La instrucción extends indica de qué clase desciende la nuestra. Si se omite, JAVA asume que desciende de la superclase Object. Cuando una clase desciende de otra, esto significa que hereda sus atributos y sus métodos (es decir que, a menos que los redefinamos, sus métodos son los mismos que los de la clase madre y pueden utiliAnexo III 6-19


zarse en forma transparente, a menos que sean privados en la clase madre o, para subclases de otros paquetes, protegidos o propios del paquete). —

Implements. Una interfase (“interface”) es una clase que declara sus métodos pero no los implementa; cuando una clase implementa (implements) una o más interfases, debe contener la implementación de todos los métodos (con las mismas listas de parámetros) de dichas interfases. Esto sirve para dar un ascendiente común a varias clases, obligándolas a implementar los mismos métodos y, por lo tanto, a comportarse de forma similar en cuanto a su interfase con otras clases y subclases.

—

Interface. Una interfase (“interface”), como se dijo, es una clase que no implementa sus métodos sino que deja a cargo la implementación a otras clases. Las interfases pueden, asimismo, descender de otras interfases pero no de otras clases. Todos sus métodos son por definición abstractos y sus atributos son finales (aunque esto no se indica en el cuerpo de la interfase). Son útiles para generar relaciones entre clases que de otro modo no están relacionadas (haciendo que implementen los mismos métodos), o para distribuir paquetes de clases indicando la estructura de la interfase pero no las clases individuales (objetos anónimos). Si bien diferentes clases pueden implementar las mismas interfases, y a la vez descender de otras clases, esto no es en realidad herencia múltiple ya que una clase no puede heredar atributos ni métodos de una “interface”; y las clases que implementan una interfase pueden no estar ni siquiera relacionadas entre sí.

En JAVA hay un montón de clases ya definidas y utilizables. Éstas vienen en las bibliotecas estándar: •

java.lang; clases esenciales, números, “strings”, objetos, compilador, “runtime”, seguridad y “threads” (es el único paquete que se incluye automáticamente en todo programa JAVA).

•

java.io; clases que manejan entradas y salidas.

•

java.util; clases útiles, como estructuras genéricas, manejo de fecha, hora y strings, números aleatorios, etc.

•

java.net; clases para soportar redes: URL, TCP, UDP, IP, etc.

•

java.awt; clases para manejo de “interface” gráfica, ventanas, etc.

•

java.awt.image; clases para manejo de imágenes.

•

java.awt.peer; clases que conectan la “interface” gráfica a implementaciones dependientes de la plataforma (motif, windows).

•

java.applet; clases para la creación de Applets y recursos para reproducción de audio.

Anexo III 6-20

Lenguaje JAVA

9.5.

Variables Miembro

Las variables declaradas en el cuerpo de la clase se dice que son miembros de la clase y son accesibles por todos los métodos de la clase; las Variables Miembro en la programación JAVA, son los datos o atributos que definen los objetos; cada objeto, es decir, cada ejemplar concreto de la clase, tiene su propia copia de las variables miembro. Un aspecto muy importante del correcto funcionamiento de los programas es que no haya datos sin inicializar. Por eso las variables miembro de tipos primitivos se inicializan siempre de modo automático, incluso antes de llamar al constructor (“false” para Boolean, el carácter nulo para char y cero para los tipos numéricos). De todas formas, lo más adecuado es inicializarlas también en el constructor. Las variables miembro pueden también inicializarse explícitamente en la declaración, como las variables locales, por medio de constantes o llamadas a métodos. Por Ejemplo: long nDatos = 100; Las variables miembro se inicializan en el mismo orden en que aparecen en el código de la clase. Esto es importante porque unas variables pueden apoyarse en otras previamente definidas. Cada objeto que se crea de una clase tiene su propia copia de las variables miembro. Por ejemplo, cada objeto de la clase Figura tiene sus propias coordenadas del centro “x” e “y”, y su propio valor del radio “r”. Los métodos de objeto se aplican a un objeto concreto poniendo el nombre del objeto y luego el nombre del método, separados por un punto. A este objeto se le llama argumento implícito. Por ejemplo, para calcular el área de un objeto de la clase Figura llamado obj1 se escribirá: obj1.area();. Las variables miembro del argumento implícito se acceden directamente o precedidas por la palabra this y el operador punto. Las variables miembro pueden ir precedidas en su declaración por uno de los modificadores de acceso: “public”, “private”, “protected” y “package (que es el valor por defecto y puede omitirse). Junto con los modificadores de acceso de la clase (“public” y “package”), determinan qué clases y métodos van a tener permiso para utilizar la clase y sus métodos y variables miembro. Existen otros dos modificadores (no de acceso) para las variables miembro: •

Transient: indica que esta variable miembro no forma parte de la persistencia (capacidad de los objetos de mantener su valor cuando termina la ejecución de un programa) de un objeto y por tanto no debe ser serializada (convertida en flujo de caracteres para poder ser almacenada en disco o en una base de datos) con el resto del objeto.

•

Volatile: indica que esta variable puede ser utilizada por distintas “threads” sincronizadas y que el compilador no debe realizar optimizaciones con esta variable. Anexo III 6-21


9.6.

Variables miembro de clase (static)

Una clase puede tener variables propias de la clase y no de cada objeto. A estas variables se les llama variables de clase o variables static. Las variables static se suelen utilizar para definir constantes comunes para todos los objetos de la clase o variables que sólo tienen sentido para toda la clase. Las variables de clase son lo más parecido que JAVA tiene a las variables globales de C/C++. Las variables de clase se crean anteponiendo la palabra “static” a su declaración. Para llamarlas se suele utilizar el nombre de la clase (no es imprescindible, pues se puede utilizar también el nombre de cualquier objeto), porque de esta forma su sentido queda más claro. Si no se les da valor en la declaración, las variables miembro “static” se inicializan con los valores por defecto para los tipos primitivos (false para Boolean, el carácter nulo para “char” y cero para los tipos numéricos), y con “null” si es una referencia. Las variables miembro “static” se crean en el momento en que pueden ser necesarias: cuando se va a crear el primer objeto de la clase, en cuanto se llama a un método static o en cuanto se utiliza una variable “static” de dicha clase. Lo importante es que las variables miembro “static” se inicializan siempre antes que cualquier objeto de la clase.

9.7.

Variables Finales

Una variable de un tipo primitivo declarada como final no puede cambiar su valor a lo largo de la ejecución del programa. Puede ser considerada como una constante, y equivale a la palabra “const” de C/C++. JAVA permite separar la definición de la inicialización de una variable final. La inicialización puede hacerse más tarde, en tiempo de ejecución, llamando a métodos o en función de otros datos. La variable final así definida es constante (no puede cambiar), pero no tiene por qué tener el mismo valor en todas las ejecuciones del programa, pues depende de cómo haya sido inicializada. Además de las variables miembro, también las variables locales y los propios argumentos de un método pueden ser declarados final. Declarar como final un objeto miembro de una clase hace constante la referencia, pero no el propio objeto, que puede ser modificado a través de otra referencia. En JAVA no es posible hacer que un objeto sea constante.

9.8.

Métodos o funciones miembros

Los métodos son funciones definidas dentro de una clase. Salvo los métodos “static” o de clase, se aplican siempre a un objeto de la clase por medio del operador punto (.). Dicho objeto es su argumento implícito. Los métodos pueden además tener otros argumentos explícitos que van entre paréntesis, a continuación del nombre del método.

Anexo III 6-22

Lenguaje JAVA

La primera línea de la definición de un método se llama declaración o header; el código comprendido entre las llaves {…} es el cuerpo o “body” del método. Considérese el siguiente método tomado de la clase Figura: public Figura elMayor(Figura c) { if (this.r>=c.r) return this; else return c; } Los métodos tienen visibilidad directa de las variables miembro del objeto que es su argumento implícito, es decir, pueden acceder a ellas sin cualificarlas con un nombre de objeto y el operador punto (.). De todas formas, también se puede acceder a ellas mediante la referencia “this”, de modo discrecional (como en el ejemplo anterior con “this.r”) o si alguna variable local o argumento las oculta. El valor de retorno puede ser un valor de un tipo primitivo o una referencia. En cualquier caso no puede haber más que un único valor de retorno (que puede ser un objeto o un “array”). Se puede devolver también una referencia a un objeto por medio de un nombre de ““interface””. El objeto devuelto debe pertenecer a una clase que implemente esa “interface”. Los métodos pueden definir variables locales. Su visibilidad llega desde la definición al final del bloque en el que han sido definidas. No hace falta inicializar las variables locales en el punto en que se definen, pero el compilador no permite utilizarlas sin haberles dado un valor. A diferencia de las variables miembro, las variables locales no se inicializan por defecto.

9.9.

Paso de argumentos a métodos

En JAVA los argumentos de los tipos primitivos se pasan siempre por valor. El método recibe una copia del argumento actual; si se modifica esta copia, el argumento original que se incluyó en la llamada no queda modificado. La forma de modificar dentro de un método una variable de un tipo primitivo es incluirla como variable miembro en una clase y pasar como argumento una referencia a un objeto de dicha clase. Las referencias se pasan también por valor, pero a través de ellas se pueden modificar los objetos referenciados. En JAVA no se pueden pasar métodos como argumentos a otros métodos (en C/C++ se pueden pasar punteros a función como argumentos). Lo que se puede hacer en JAVA es pasar una referencia a un objeto y dentro de la función utilizar los métodos de ese objeto. Dentro de un método se pueden crear variables locales de los tipos primitivos o referencias. Estas variables locales dejan de existir al terminar la ejecución del método. Los argumentos formales de un método (las variables que aparecen en el header del método para recibir el valor de los argumentos actuales) tienen categoría de variables locales del método. Anexo III 6-23


Si un método devuelve “this” (es decir, un objeto de la clase) o una referencia a otro objeto, ese objeto puede encadenarse con otra llamada a otro método de la misma o de diferente clase y así sucesivamente. En este caso aparecerán varios métodos en la misma sentencia unidos por el operador punto (.), por ejemplo:

String numeroComoString =”8.978”; float p = Float.valueOf(numeroComoString).floatValue(); Donde el método valueOf(String) de la clase java.lang.Float devuelve un objeto de la clase Flota sobre el que se aplica el método floatValue(), que finalmente devuelve una variable primitiva de tipo “float”. El ejemplo anterior se podía desdoblar en las siguientes sentencias:

String numeroComoString = ”8.978”; Float f = Float.valueOf(numeroComoString); float p = f.floatValue(); Obsérvese que se pueden encadenar varias llamadas a métodos por medio del operador punto (.) que, como todos los operadores de JAVA excepto los de asignación, se ejecuta de izquierda a derecha.

9.10. Métodos de clase (static) Análogamente, puede también haber métodos que no actúen sobre objetos concretos a través del operador punto. A estos métodos se les llama métodos de clase o “static”. Los métodos de clase pueden recibir objetos de su clase como argumentos explícitos, pero no tienen argumento implícito ni pueden utilizar la referencia this. Un ejemplo típico de métodos static son los métodos matemáticos de la clase java.lang.Math (sin(), cos(), exp(), pow(), etc.). De ordinario el argumento de estos métodos será de un tipo primitivo y se le pasará como argumento explícito. Estos métodos no tienen sentido como métodos de objeto. Los métodos y variables de clase se crean anteponiendo la palabra “static”. Para llamarlos se suele utilizar el nombre de la clase, en vez del nombre de un objeto de la clase (por ejemplo, Math.sin(ang), para calcular el seno de un ángulo). Los métodos y las variables de clase son lo más parecido que JAVA tiene a las funciones y variables globales de C/C++ o Visual Basic.

9.11. Llamadas a métodos public final class MiClase extends Number { // atributos: private float x; private float y; Anexo III 6-24

Lenguaje JAVA

// constructor: public MiClase(float rx, float iy) {x = rx;y = iy;} // métodos: public float Norma() {return (float)Math.sqrt(x*x+y*y);} public double doubleValue() {return (double)Norma( );} public float floatValue() {return Norma();} public int intValue() {return (int)Norma();} public long longValue() {return (long)Norma();} public String toString() {return «(«+x+»)+i(«+y+»)»;} }

Nombre_del_Objeto< .>Nombre_del_Método(parámetros) import java.io.*; public class Lolo { public static void main(String args[]) { MiClase obj = new MiClase(4,-3); System.out.println(obj.toString()); System.out.println(obj.Norma()); } } En la clase MiClase tenemos también un ejemplo de un llamado a un método de clase, o sea “static”:

return (float)Math.sqrt(x*x+y*y); Como el método es de clase, no hace falta llamarlo para un objeto en particular. En ese caso, en lugar del nombre de un objeto existente se puede utilizar directamente el nombre de la clase:

Nombre_de_la_ClaseNombre_del_Método(parámetros)

9.12. Constructores en JAVA Un punto clave de la Programación Orientada Objetos es el evitar información incorrecta por no haber sido correctamente inicializadas las variables. JAVA no permite que haya variables miembro que no estén inicializadas. JAVA inicializa siempre con valores por defecto las variables miembro de clases y objetos. El segundo paso en la inicialización correcta de objetos es el uso de constructores. Un constructor es un método que se llama automáticamente cada vez que se crea un objeto de una clase. La principal misión del constructor es reservar memoria e inicializar las variables miembro de la clase. Anexo III 6-25


Los constructores no tienen valor de retorno (ni siquiera “void”) y su nombre es el mismo que el de la clase. Su argumento implícito es el objeto que se está creando. De ordinario una clase tiene varios constructores, que se diferencian por el tipo y número de sus argumentos. Se llama constructor por defecto al constructor que no tiene argumentos. El programador debe proporcionar en el código valores iniciales adecuados para todas las variables miembro. Un constructor de una clase puede llamar a otro constructor previamente definido en la misma clase por medio de la palabra “this”. En este contexto, la palabra “this” sólo puede aparecer en la primera sentencia de un constructor. El constructor de una sub-clase puede llamar al constructor de su súper-clase por medio de la palabra súper, seguida de los argumentos apropiados entre paréntesis. De esta forma, un constructor sólo tiene que inicializar por sí mismo las variables no heredadas. El constructor es tan importante que, si el programador no prepara ningún constructor para una clase, el compilador crea un constructor por defecto, inicializando las variables de los tipos primitivos a su valor por defecto, y los Strings y las demás referencias a objetos a “null”. Si hace falta, se llama al constructor de la súper-clase para que inicialice las variables heredadas. Al igual que los demás métodos de una clase, los constructores pueden tener también los modificadores de acceso “public”, “private”, “protected” y “package”. Si un constructor es private, ninguna otra clase puede crear un objeto de esa clase. En este caso, puede haber métodos “public” y “static” (factory methods) que llamen al constructor y devuelvan un objeto de esa clase. Dentro de una clase, los constructores sólo pueden ser llamados por otros constructores o por métodos “static”. No pueden ser llamados por los métodos de objeto de la clase.

9.13. Destrucción de Objetos En JAVA no hay destructores como en C++. El sistema se ocupa automáticamente de liberar la memoria de los objetos que ya han perdido la referencia, esto es, objetos que ya no tienen ningún nombre que permita acceder a ellos, por ejemplo por haber llegado al final del bloque en el que habían sido definidos, porque a la referencia se le ha asignado el valor “null” o porque a la referencia se le ha asignado la dirección de otro objeto. A esta característica de JAVA se le llama garbage collection (recogida de basura). En JAVA es normal que varias variables de tipo referencia apunten al mismo objeto. JAVA lleva internamente un contador de cuantas referencias hay sobre cada objeto. El objeto podrá ser borrado cuando el número de referencias sea cero. Como ya se ha dicho, una forma de hacer que un objeto quede sin referencia es cambiar ésta a “null”, haciendo por ejemplo: ObjetoRef = null; En JAVA no se sabe exactamente cuándo se va a activar el “garbage collector”. Si no falta memoria es posible que no se llegue a activar en ningún momento. No es pues conveniente confiar en él para la realización de otras tareas más críticas. Se puede llamar explícitamente al garbage collector con el método System.gc(), aunque esto es considerado por el sistema sólo como una “sugerencia” a la JVM.

Anexo III 6-26

Lenguaje JAVA

public class Contador { // Se define la clase Contador // Atributos int cnt; // Constructor (un metodo igual que otro cualquiera) public Contador() { cnt = 0; } // Métodos public int incCuenta() { cnt++; return cnt; } public int getCuenta() { return cnt; } } Cuando, desde una aplicación u otro objeto, se crea una instancia de la clase Contador mediante la instrucción new Contador() el compilador busca un método con el mismo nombre de la clase y que se corresponda con la llamada en cuanto al tipo y número de parámetros. Dicho método se llama Constructor, y una clase puede tener más de un constructor (no así un objeto o instancia, ya que una vez que fue creado no puede recrearse sobre sí mismo). En tiempo de ejecución, al encontrar dicha instrucción, el intérprete reserva espacio para el objeto/instancia, crea su estructura y llama al constructor. O sea que el efecto de “new Contador()” es, precisamente, reservar espacio para el contador e inicializarlo en cero. En cuanto a los otros métodos, se pueden llamar desde otros objetos (lo que incluye a las aplicaciones) del mismo modo que se llama una función desde C. Por ejemplo, usemos nuestro contador en un programa bien sencillo que nos muestre cómo evoluciona:

Anexo III 6-27


import java.io.*; public class Lolo1 { static int n; static Contador obj; public static void main ( String args[] ) { System.out.println («Cuenta… «); obj = new Contador(); System.out.println (obj.getCuenta()); n = obj.incCuenta(); System.out.println (n); obj.incCuenta(); System.out.println (obj.getCuenta()); System.out.println (obj.incCuenta()); } }

import java.applet.*; import java.awt.*; public class Lolo2 extends Applet { static int n; static Contador obj; public Lolo2 () { obj = new Contador(); } public void paint (Graphics g) { g.drawString («Cuenta...», 20, 20); g.drawString (String.valueOf(obj.getCuenta()), 20, 35 ); n = obj.incCuenta(); g.drawString (String.valueOf(n), 20, 50 ); obj.incCuenta(); g.drawString (String.valueOf(obj.getCuenta()), 20, 65 ); g.drawString (String.valueOf(obj.incCuenta()), 20, 80 ); } }

Ahora es necesario crear una página HTML para poder visualizarlo. Para esto, crear y luego cargar el archivo Lolo2.htm con un “browser” que soporte JAVA (o bien ejecutar en la ventana DOS: «appletviewerLolo2.htm»): Lolo 2 - Applet Contador Observemos las diferencias entre la aplicación “standalone” y el Applet: —

La aplicación usa un método “main”, desde donde arranca.

—

El Applet, en cambio, se arranca desde un constructor (método con el mismo nombre que la clase).

—

En la aplicación utilizamos System.out.println para imprimir en la salida estándar.

—

En el applet necesitamos «dibujar» el texto sobre un fondo gráfico, por lo que usamos el método g.drawString dentro del método

Anexo III 6-28

Lenguaje JAVA

“paint” (que es llamado cada vez que es necesario redibujar el Applet). Con poco trabajo se pueden combinar ambos casos en un solo objeto, de modo que la misma clase sirva para utilizarla de las dos maneras: import java.applet.*; import java.awt.*; import java.io.*; public class Lolo3 extends Applet { static int n; static Contador obj; public Lolo3 () { obj = new Contador(); } public static void main(String args[]) { obj = new Contador(); paint(); } public static void paint () { System.out.println («Cuenta...»); System.out.println (obj.getCuenta()); n = obj.incCuenta(); System.out.println (n); obj.incCuenta(); System.out.println (obj.getCuenta()); System.out.println (obj.incCuenta()); } public void paint (Graphics g) { g.drawString («Cuenta...», 20, 20); g.drawString (String.valueOf(obj.getCuenta()), 20, 35 ); n = obj.incCuenta(); g.drawString (String.valueOf(n), 20, 50 ); obj.incCuenta(); g.drawString (String.valueOf(obj.getCuenta()), 20, 65 ); g.drawString (String.valueOf(obj.incCuenta()), 20, 80 ); } } Anexo III 6-29


Esta clase puede ejecutarse tanto con «java Lolo3» en una ventana de MS-DOS, como cargarse desde una página HTML con:

Notar que conviene probar el Applet con el “appletviewer” («appletviewer Lolo3.htm»), ya que éste indica en la ventana DOS si hay algún error durante la ejecución. Los “browsers” dejan pasar muchos errores, simplemente suprimiendo la salida a pantalla del código erróneo. Fíjate que en todo este desarrollo de las clases Lolo1, Lolo2 y Lolo3, en ningún momento volvimos a tocar la clase Contador. Los métodos, como las clases, tienen una declaración y un cuerpo. La declaración es del tipo:

[private |protected|public] [static] [abstract] [final] [native ] [synchronized] TipoDevuelto NombreMétodo ([tipo1 nombre1[, tipo2 nombre2]…]) [throws excepción1 [,excepción2]…] Básicamente, los métodos son como las funciones de C: implementan, a través de funciones, operaciones y estructuras de control, el cálculo de algún parámetro que es el que devuelven al objeto que los llama. Sólo pueden devolver un valor (del tipo TipoDevuelto), aunque pueden no devolver ninguno (en ese caso TipoDevuelto es void). Como ya veremos, el valor de retorno se especifica con la instrucción return, dentro del método. Los métodos pueden utilizar valores que les pasa el objeto que los llama (parámetros), indicados con tipo1 nombre1, tipo2 nombre2… en el esquema de la declaración. Estos parámetros pueden ser de cualquiera de los tipos ya vistos. Si son tipos básicos, el método recibe el valor del parámetro; si son arrays, clases o interfases, recibe un puntero a los datos (referencia). Veamos un pequeño ejemplo: public int AumentarCuenta(int cantidad) { cnt = cnt + cantidad; return cnt; } Este método, si lo agregamos a la clase Contador, le suma cantidad al acumulador cnt. En detalle: —

el método recibe un valor entero (cantidad),

—

lo suma a la variable de instancia cnt,

—

devuelve la suma (return cnt).

Supongamos que queremos hacer un método dentro de una clase que devuelva la posición del mouse. Anexo III 6-30

Lenguaje JAVA

Lo siguiente no sirve: void GetMousePos(int x, int y) { x = ….; // esto no sirve! y = ….; // esto tampoco! } Porque el método no puede modificar los parámetros x e y (que han sido pasados por valor, o sea que el método recibe el valor numérico pero no sabe adónde están las variables en memoria). La solución es utilizar, en lugar de tipos básicos, una clase:

class MousePos { public int x, y; } Luego utilizar esa clase en nuestro método:

void GetMousePos( MousePos m ) { m.x = ……; m.y = ……; }

9.14. La clase MiClase public final class MiClase extends Number { private float x; private float y; public MiClase() {x = 0;y = 0;} public MiClase(float rx, float iy) {x = rx;y = iy;} public final float Norma() {return (float)Math.sqrt(x*x+y*y);} public final float Norma(MiClase c) {return (float)Math.sqrt(c.x*c.x+c.y*c.y);} public final MiClase Conjugado() {MiClase r = new MiClase(x,-y);return r;} public final MiClase Conjugado(MiClase c) {MiClase r = new MiClase(c.x,c.y);return r;} public final double doubleValue() {return (double)Norma();} public final float floatValue() {return Norma();} public final int intValue() {return (int)Norma();} public final long longValue() {return (long)Norma();} public final String toString() {

Anexo III 6-31


f (y<0) return x+»-i»+(-y); else return x+»+i»+y; } public static final MiClase Suma(MiClase obj1, MiClase c2) { return new MiClase(obj1.x+c2.x,obj1.y+c2.y); } public static final MiClase Resta(MiClase obj1, MiClase c2) { return new MiClase(obj1.x-c2.x,obj1.y-c2.y); } public static final MiClase Producto(MiClase obj1, MiClase c2) { return new MiClase(obj1.x*c2.x-obj1.y*c2.y,obj1.x*c2.y+obj1.y*c2.x);} public static final MiClase DivEscalar(MiClase c, float f) {return new MiClase(c.x/ f,c.y/f);} public static final MiClase Cociente(MiClase obj1, MiClase c2) { float x = obj1.x*c2.x+obj1.y*c2.y; float y = -obj1.x*c2.y+obj1.y*c2.x; float n = c2.x*c2.x+c2.y*c2.y; MiClase r = new MiClase(x,y); return DivEscalar(r,n);} } Podemos hacer algunos comentarios: 1.

No hay “include” aquí, ya que la única biblioteca que usamos es java.lang y se incluye automáticamente.

2.

La clase es “public final”, lo que implica que cualquier clase en éste u otros paquetes puede utilizarla, pero ninguna clase puede heredarla (o sea que es una clase estéril...).

Hagamos un resumen de los atributos y métodos de la clase: // atributos: private float x; private float y; Siendo privados, no podemos acceder a ellos desde el exterior. Como además la clase es final, no hay forma de acceder “a” “x” e “y”. Además, al no ser “static”, cada instancia de la clase tendrá su propio “x” e “y”. // constructores: public MiClase() public MiClase(float rx, float iy) La clase tiene dos constructores, que se diferencian por su «firma» (signature), o sea por la cantidad y tipo de parámetros. El primero nos sirve para crear un objeto de tipo MiClase y valor indefinido (aunque en realidad el método lo inicializa en cero); con el segundo, podemos definir el valor al crearlo.

Anexo III 6-32

Lenguaje JAVA

// métodos: public final float Norma() public final float Norma(MiClase c) public final MiClase Conjugado() public final MiClase Conjugado(MiClase c) Estos métodos también son duales; cuando los usamos sin parámetros devuelven la norma o el conjugado del objeto individual (instancia): v = miMiClase.Norma(); // por ejemplo otroMiClase = miMiClase.Conjugado(); Con parámetros, en cambio, devuelven la norma o el conjugado del parámetro: v = unMiClase.Norma(miMiClase); otroMiClase = unMiClase.Conjugado(miMiClase); Notar que lo siguiente es inválido: otroMiClase = MiClase.Norma(miMiClase); // NO SE PUEDE! Porque el método no es static, por lo tanto debe llamarse para una instancia en particular (en este caso, unMiClase). // obligatorios (pues son abstractos en Number): public final double doubleValue() public final float floatValue() public final int intValue() public final long longValue() Estos métodos es obligatorio definirlos, ya que en la clase madre Number son métodos abstractos, o sea que debemos implementarlos aquí. Como todos los métodos de esta clase son final, o sea que no puede ser redefinido. No es importante en realidad puesto que la clase no puede tener descendientes... public final String toString() Este método nos sirve para representar el MiClase como una cadena de caracteres, de la forma x+iy. // Operaciones matemáticas public static final MiClase Suma(MiClase obj1, MiClase c2) public static final MiClase Resta(MiClase obj1, MiClase c2) public static final MiClase Producto(MiClase obj1, MiClase c2) public static final MiClase DivEscalar(MiClase c, float f) public static final MiClase Cociente(MiClase obj1, MiClase c2) Anexo III 6-33


Aquí definimos varias operaciones matemáticas. Notar que se han definido como static, o sea que los métodos son únicos independientemente de las instancias. Esto permite que los podamos ejecutar sobre una instancia o directamente sobre la clase: miMiClase = unMiClase.Suma(comp1,comp2); // vale miMiClase = MiClase.Suma(comp1,comp2); // tambien seria correcto Por ejemplo, la siguiente aplicación nos muestra cómo podemos usar algunos de estos métodos: import java.io.*; public class Lolo5 { public static void main(String args[]) { MiClase obj1 = new MiClase(4,-3); System.out.println(obj1+»\tNorma=»+obj1.Norma()); MiClase c2 = new MiClase(-2,5); System.out.println(c2+»\tNorma=»+c2.Norma()+»\n»); System.out.println(«(«+obj1+»)/4 :»+MiClase.DivEscalar(obj1,4)); System.out.println(«Suma : «+MiClase.Suma(obj1,c2)); System.out.println(«Resta : «+MiClase.Resta(obj1,c2).toString()); System.out.println(«Multip: «+MiClase.Producto(obj1,c2).toString()); System.out.println(«Divis : «+MiClase.Cociente(obj1,c2).toString()); } } MiClase obj1 = new MiClase(4,-3); obj1 es un objetos (instancias) de la clase MiClase. El operador “new” ejemplariza una clase mediante la asignación de memoria para el objeto nuevo de ese “tipo. new” necesita un sólo argumento: una llamada al método constructor. Los métodos constructores son métodos especiales proporcionados por cada clase JAVA que son reponsables de la inicialización de los nuevos objetos de ese tipo. El operador new crea el objeto, el constructor lo inicializa.

new Rectangle(0, 0, 100, 200); En el ejemplo, Rectangle(0, 0, 100, 200) es una llamada al constructor de la clase Rectangle. El operador “new” devuelve una referencia al objeto recién creado. Esta referencia puede ser asignada a una variable del tipo apropiado. Anexo III 6-34

Lenguaje JAVA

Rectangle rect = new Rectangle(0, 0, 100, 200); (Recuerde que una clase escencialmente define un tipo de dato de referencia. Por eso, Rectangle puede utilizarse como un tipo de dato en los programas JAVA. El valor de cualquier variable cuyo tipo sea un tipo de referencia, es una referencia —un puntero— al valor real o conjunto de valores representado por la variable.) Como se dijo anteriormente, las clases porporcionan métodos constructores para incializar los nuevos objetos de ese tipo. Una clase podría proporcionar múltiples constructores para realizar diferentes tipos de inicialización en los nuevos objetos. Cuando vea la implementación de una clase, reconocerá los constructores porque tienen el mismo nombre que la clase y no tienen tipo de retorno. Recuerde la creacción del objeto Date en el sección inicial. El constructor utilizado no tenía ningún argumento: Date(). Un constructor que no tiene ningún argumento, como el mostrado arriba, es conocido como constructor por defecto. Al igual que Date, la mayoría de las clases tienen al menos un constructor, el constructor por defecto. Si una clase tiene varios constructores, todos ellos tienen el mismo nombre pero se deben diferenciar en el número o el tipo de sus argmentos. Cada constructor inicializa el nuevo objeto de una forma diferente. Junto al constructor por defecto, la clase Date proporciona otro constructor que inicializa el nuevo objeto con un nuevo año, mes y día: Date cumpleaños = new Date(1963, 8, 30); El compilador puede diferenciar los constructores a través del tipo y del número de sus argumentos. Para acceder a las variables de un objeto, sólo se tiene que añadir el nombre de la variable al del objeto referenciado introduciendo un punto en el medio (‘.’).

objetoReferenciado.variable Recuerde que el operador new devuelve una referencia a un objeto. Por eso, se puede utilizar el valor devuelto por new para acceder a las variables del nuevo objeto:

height = new Rectangle().height; Llamar a un método de un objeto es similar a obtener una variable del objeto. Para llamar a un método del objeto, simplemente se añade al nombre del objeto referenciado el nombre del método, separados por un punto (‘.’), y se proporcionan los argumentos del método entre paréntesis. Si el método no necesita argumentos, se utilizan los paréntesis vacios.

objetoReferenciado.nombreMétodo(listaArgumentos); o objetoReferenciado.nombreMétodo(); Recuerde que una llamada a un método es un mensaje al objeto nombrado. El objeto Referenciado en la llamada al método objetoReferenciado. Anexo III 6-35


método() debe ser una referencia a un objeto. Como se puede utilizar un nombre de variable aquí, también se puede utilizar en cualquier expresión que devuelva una referencia a un objeto. Recuerda que el operador “new” devuelve una referencia a un objeto. Por eso, se puede utilizar el valor devuelto por “new” para acceder a las variables del nuevo objeto:

new Rectangle(0, 0, 100, 50).equals(anotherRect) La expresión new Rectangle(0, 0, 100, 50) evalúa a una referencia a un objeto que se refiere a un objeto Rectangle. Entonces, como verás, se puede utilizar la notación, de punto (‘.’) para llamar al método equals() del nuevo objeto Rectangle para determinar si el rectangúlo nuevo es igual al especificado en la lista de argumentos de equals().

9.15. Eliminar objetos no utilizados Muchos otros lenguajes orientados a objetos necesitan que se siga la pista de los objetos que se han creado y luego se destruyan cuando no se necesiten. Escribir código para manejar la memoria de esta es forma es aburrido y propenso a errores. JAVA permite ahorrarse esto, permitiendo crear tantos objetos como se quiera (solo limitados por los que el sistema pueda manejar) pero nunca tienen que ser destruidos. El entorno de ejecución JAVA borra los objetos cuando determina que no se van autilizar más. Este proceso es conocido como recolección de basura. Un objeto es elegible para la recolección de basura cuando no existen más referencias a ese objeto. Las referencias que se mantienen en una variable desaparecen de forma natural cuando la variable sale de su ámbito. O cuando se borra explícitamente un objeto referencia mediante la selección de un valor cuyo tipo de dato es una referencia a “null”.

9.16. Recolector de Basura El entorno de ejecución de JAVA tiene un recolector de basura que periódicamente libera la memoria ocupada por los objetos que no se van a necesitar más. El recolector de basura de JAVA es un barredor de marcas que escanea dinámicamente la memoria de JAVA buscando objetos, marcando aquellos que han sido referenciados. Después de investigar todos los posibles paths de los objetos, los que no están marcados (esto es, no han sido referenciados) se les conoce como basura y son eliminados. El colector de basura funciona en un “thread” (hilo) de baja prioridad y funciona tanto síncrona como asíncronamente dependiendo de la situación y del sistema en el que se esté ejecutando el entorno JAVA. El recolector de basura se ejecuta síncronamente cuando el sistema funciona fuera de memoria o en respuesta a una petición de un programa JAVA. Un programa JAVA le puede pedir al recolector de basura que se ejecute en cualquier momento mediante una llamada a System.gc().

Nota: que se ejecute el recolector de basura no garantiza que los objetos sean recolectados.

Anexo III 6-36

Lenguaje JAVA

En sistemas que permiten que el entorno de ejecución JAVA note cuando un “thread” a empezado a interrumpir a otro “thread” (como Windows 95/NT), el recolector de basura de JAVA funciona asíncromamente cuando el sistema está ocupado. Tan pronto como otro “thread” se vuelva activo, se pedirá al recolector de basura que obtenga un estado consistente y termine.

9.17. Finalización Antes de que un objeto sea recolectado, el recolector de basura le da una oportunidad para limpiarse él mismo mediante la llamada al método finalize() del propio objeto. Este proceso es conocido como finalización. Durante la finalización un objeto se podrían liberar los recursos del sistema como son los ficheros, etc., y liberar referencias en otros objetos para hacerse elegible por la recolección de basura. El método “finalize()” es un miembro de la clase java.lang.Object. Una clase debe sobreescribir el método “finalize()” para realizar cualquier finalización necesaria para los objetos de ese tipo.

9.18. This Normalmente, dentro del cuerpo de un método de un objeto se puede referir directamente a las variables miembros del objeto. Sin embargo, algunas veces no se querrá tener ambigüedad sobre el nombre de la variable miembro y uno de los argumentos del método que tengan el mismo nombre. Por ejemplo, el siguiente constructor de la clase HSBColor inicializa alguna variable miembro de un objeto de acuerdo a los argumentos pasados al constructor. Cada argumento del constructor tiene el mismo nombre que la variable del objeto cuyo valor contiene el argumento. class HSBColor { int luminosidad, saturacion, brillo; HSBColor (int luminosidad, int saturacion, int brillo) { this.luminosidad = luminosidad; this.saturacion = saturacion; this.brillo = brillo; } Se debe utilizar this en este constructor para evitar la ambigüedad entre el argumento luminosidad y la variable miembro luminosidad (y así con el resto de los argumentos). Escribir luminosidad = luminosidad no tendría sentido. Los nombres de argumentos tienen mayor precedencia y ocultan a los nombres de las variables miembro con el mismo nombre. Para referirise a la variable miembro se debe hacer explicitamente a través del objeto actual—this. También se puede utilizar this para llamar a uno de los métodos del objeto actual. Esto sólo es necesario si existe alguna ambigüedad con el nombre del método y se utiliza para intentar hacer el código más claro.

Anexo III 6-37


9.19. SUPER Si el método oculta una de las variables miembro de la superclase, se puede referir a la variable oculta utilizando super. De igual forma, si el método sobreescribe uno de los métodos de la superclase, se puede llamar al método sobreescrito a través de super. Consideremos esta clase:

class MiClase { boolean unaVariable; void unMetodo() { unaVariable = true; } } y una subclase que oculta unaVariable y sobreescribe unMetodo():

class OtraClase extends MiClase { boolean unaVariable; void unMetodo() { unaVariable = false; super.unMetodo(); System.out.println(unaVariable); System.out.println(super.unaVariable); } } Primero unMetodo() selecciona unaVariable (una declarada en OtraClase que oculta a la declarada en MiClase) a false. Luego unMetodo() llama a su método sobreescrito con esta sentencia:

super.unMetodo(); Esto selecciona la versión oculta de unaVariable (la declarada en MiClase) a true. Luego unMetodo muestra las dos versiones de unaVariable con diferentes valores: false/true.

9.20. Miembros de la Clase y del Ejemplar Las variables de ejemplar están en contraste con las variables de clase (que se declaran utilizando el modificador static). El sistema asigna espacio para las variables de clase una vez por clase, sin importar el número de ejemplares creados de la clase. Todos los objetos creados de esta clase comparten la misma copia de las variables de clase de la clase, se puede acceder a las variables de clase a Anexo III 6-38

Lenguaje JAVA

través de un ejemplar o través de la propia clase. Los métodos son similares: una clase puede tener métodos de ejemplar y métodos de clase. Los métodos de ejemplar operan sobre las variables de ejemplar del objeto actual pero también pueden acceder a las variables de clase. Por otro lado, los métodos de clase no pueden acceder a las variables del ejemplar declarados dentro de la clase (a menos que se cree un objeto nuevo y acceda a ellos através del objeto). Los métodos de clase también pueden ser invocados desde la clase, no se necesita un ejemplar para llamar a los métodos de la clase. Para especificar que una variable miembro es una variable de clase, se utiliza la palabra clave static. Por ejemplo, cambiemos la clase UnEnteroLlamadoX para que su variable x sea ahora una variable de clase:

class UnEnteroLlamadoX { static int x; public int x() {

return x

}

public void setX(int newX) { x = newX;

}

} Ahora veamos el mismo código mostrado anteriormente que crea dos ejemplares de UnEnteroLlamadoX, selecciona sus valores de x, y muestra esta salida diferente: miX.x = 2 otroX.x = 2 La salida es diferente porque x ahora es una variable de clase por lo que solo hay una copia de la variable y es compartida por todos los ejemplares de UnEnteroLlamadoX incluyendo miX y otroX. Cuando se llama a setX() en cualquier ejemplar, cambia el valor de x para todos los ejemplares de UnEnteroLlamadoX. Las variables de clase se utilizan para aquellos puntos en lo que se necesite una sola copia que debe estar accesible para todos los objetos heredados por la clase en la que la variable fue declarada. Por ejemplo, las variables de clase se utilizan frecuentemente con final para definir constantes (esto es más eficiente en el consumo de memoria, ya que las constantes no pueden cambiar y sólo se necesita una copia). Similarmente, cuando se declare un método, se puede especificar que el método es un método de clase en vez de un método de ejemplar. Los métodos de clase sólo pueden operar con variables de clase y no pueden acceder a las variables de ejemplar definidas en la clase. Para especificar que un método es un método de clase, se utiliza la palabra clave static en la declaración de método. Cambiemos la clase UnEnteroLlamadoX para que su variable miembro x sea de nuevo una variable de ejemplar, y sus dos métodos sean ahora métodos de clase:

class UnEnteroLlamadoX { private int x; static public int x() { Anexo III 6-39


return x; } static public void setX(int newX) { x = newX; } } Cuando se intente compilar esta versión de UnEnteroLlamadoX, se obtendrán errores de compilación:

UnEnteroLlamadoX.java:4: Can’t make a static reference to nonstatic variable x in class UnEnteroLlamadoX. return x; ^ UnEnteroLlamadoX.java:7: Can’t make a static reference to nonstatic variable x in class UnEnteroLlamadoX. x = newX; ^ 2 errors Esto es porque los métodos de la clase no pueden acceder a variables de ejemplar a menos que el método haya creado un ejemplar de UnEnteroLlamadoX primero y luego acceda a la variable a través de él. Construyamos de nuevo UnEnteroLlamadoX para hacer que su variable x sea una variable de clase:

class UnEnteroLlamadoX { static private int x; static public int x() { return x; static public void setX(int newX) {

} x = newX; }

} Ahora la clase se compilará y el código anterior que crea dos ejemplares de UnEnteroLlamadoX, selecciona sus valores x, y muestra en su salida los valores de x: miX.x = 2 otroX.x = 2 De nuevo, cambiar x a través de miX también lo cambia para los otros ejemplares de UnEnteroLlamadoX. Otra diferencia entre miembros del ejemplar y de la clase es que los miembros de la clase son accesibles desde la propia clase. No se necesita ejemplarizar la clase para acceder a los miembros de clase. Reescribamos el código anterior para acceder a x() y setX() directamente desde la clase UnEnteroLlamadoX:

... Anexo III 6-40

Lenguaje JAVA

UnEnteroLlamadoX.setX(1); System.out.println(«UnEnteroLlamadoX.x = « + UnEnteroLlamadoX.x()); ... Observe que ya no se tendrá que crear miX u otroX. Se puede seleccionar x y recuperarlo directamente desde la clase UnEnteroLlamadoX. No se puede hacer esto con miembros del ejemplar. Solo se puede invocar métodos de ejemplar a través de un objeto y solo puede acceder a las variables de ejemplar desde un objeto. Se puede acceder a las variables y métodos de clase desde un ejemplar de la clase o desde la clase misma.

9.21. Permisos de Acceso Cuando se crea una nueva clase en JAVA, se puede especificar el nivel de acceso que se quiere para las variables de instancia y los métodos definidos en la clase. Ciertas informaciones y peticiones contenidas en la clase, las soportadas por los métodos y variables accesibles públicamente en su objeto son correctas para el consumo de cualquier otro objeto del sistema. Otras peticiones contenidas en la clase son sólo para el uso personal de la clase. Estas otras soportadas por la operación de la clase no deberían ser utilizadas por objetos de otros tipos. Se querría proteger esas variables y métodos personales a nivel del lenguaje y prohibir el acceso desde objetos de otros tipos. En JAVA se puede utilizar los especificadores de acceso para proteger tanto las variables como los métodos de la clase cuando se declaran. El lenguaje JAVA soporta cuatro niveles de acceso para las variables y métodos miembros: “private”, “protected”, “public”, y, todavía no especificado, acceso de paquete. —

Public. Cualquier clase desde cualquier lugar puede acceder a las variables y métodos de instacia públicos.

public void CualquieraPuedeAcceder(){} —

Protected. Solo las subclases de la clase y nadie más puede acceder a las variables y métodos de instancia protegidos.

protected void SoloSubClases(){} —

Private. Las variables y métodos de instancia privados sólo pueden ser accedidos desde dentro de la clase. No son accesibles desde las subclases.

private String NumeroDelCarnetDeIdentidad; —

Friendly (sin declaración específica). Por defecto, si no se especifica el control de acceso, las variables y métodos de instancia se declaran friendly (amigas), lo que significa que son accesibles por todos los objetos dentro del mismo paquete, pero no por los externos al paquete. Es lo mismo que “protected”.

void MetodoDeMiPaquete(){} Anexo III 6-41


Los métodos protegidos (protected) pueden ser vistos por las clases derivadas, como en C++, y también en JAVA, por los paquetes (packages). Todas las clases de un paquete pueden ver los métodos protegidos de ese paquete. Para evitarlo, se deben declarar como private protected, lo que hace que ya funcione como en C++ en donde solo se puede acceder a las variables y métodos protegidos de las clases derivadas. La siguiente tabla le muestra los niveles de acceso pemitidos por cada especificador: ESPECIFICADOR

CLASE

SUBCLASE

PAQUETE

private

X

protected

X

X*

X

public

X

X

X

package

X

MUNDO

X

X

La primera columna indica si la propia clase tiene acceso al miembro definido por el especificador de acceso. La segunda columna indica si las subclases de la clase (sin importar dentro de que paquete se encuentren éstas) tienen acceso a los miembros. La tercera columna indica si las clases del mismo paquete que la clase (sin importar su parentesco) tienen acceso a los miembros. La cuarta columna indica si todas las clases tienen acceso a los miembros. Observa que la intersección entre protected y subclase tiene un ‘*’ –este caso de acceso particular tiene una explicación en más detalle más adelante. Echemos un vistazo a cada uno de los niveles de acceso más detalladamente: A) Private El nivel de acceso más restringido es “private”. Un miembro privado es accesible sólo para la clase en la que está definido. Se utiliza este acceso para declarar miembros que sólo deben ser utilizados por la clase. Esto incluye las variables que contienen información que si se accede a ella desde el exterior podría colocar al objeto en un estado de inconsistencia, o los métodos que llamados desde el exterior pueden poner en peligro el estado del objeto o del programa donde se está ejecutando. Los miembros privados son como secretos, nunca deben contársele a nadie. B) Protected El siguiente especificador de nivel de acceso es ‘protected’ que permite a la propia clase, las subclases (con la excepción a la que nos referimos anteriormente), y todas las clases dentro del mismo paquete que accedan a los miembros. Este nivel de acceso se utiliza cuando es apropiado para una subclase da la clase tener acceso a los miembros, pero no las clases no relacionadas. Los miembros protegidos son como secretos familiares –no importa que toda la familia lo sepa, incluso algunos amigos allegados pero no se quiere que los extraños lo sepan. Anexo III 6-42

Lenguaje JAVA

C) Public El especificador de acceso más sencillo es “public”. Todas las clases, en todos los paquetes tienen acceso a los miembros públicos de la clase. Los miembros públicos se declaran sólo si su acceso no produce resultados indeseados si un extraño los utiliza. Aquí no importa que lo sepa todo el mundo. D) Acceso de Paquete Y finalmente, el último nivel de acceso es el que se obtiene si no se especifica ningún otro nivel de acceso a los miembros. Este nivel de acceso permite que las clases del mismo paquete que la clase tengan acceso a los miembros. Este nivel de acceso asume que las clases del mismo paquete son “amigas de confianza”.

10. Entrada / Salida En JAVA hay muchas clases para leer y escribir archivos (u otros dispositivos de E/S). Están reunidos en la biblioteca java.io. Vamos a empezar como siempre con un pequeño ejemplo funcional y en seguida nos meteremos en el necesario camino de las excepciones...

import java.io.*; public class Lolo9 { public static void main(String args[]) throws FileNotFoundException,IOException { FileInputStream fptr; DataInputStream f; String linea = null; fptr = new FileInputStream(«Lolo9.java»); f = new DataInputStream(fptr); do { linea = f.readLine(); f (linea!=null) System.out.println(linea); } while (linea != null); fptr.close(); } } El programa de ejemplo simplemente lee un archivo de texto y lo muestra en pantalla, algo así como el type del DOS o el cat de Unix. Dejemos por ahora el throws FileNotFoundException,IOException y vamos al código. Anexo III 6-43


fptr = new FileInputStream(«Lolo9.java»); La clase FileInputStream (descendiente de InputStream) nos sirve para referirnos a archivos o conexiones (sockets) de una máquina. Podemos accederlos pasando un String como aquí, un objeto de tipo File o uno de tipo FileDescriptor, pero en esencia es lo mismo. Al crear un objeto de este tipo estamos «abriendo» un archivo, clásicamente hablando. Si el archivo no existe (por ejemplo reemplacen «Lolo9.java» por alguna otra cosa, como «noexiste.txt»), al ejecutarlo nos aparece un error:

C:\java\curso>java Lolo9 java.io.FileNotFoundException: noexiste.txt at java.io.FileInputStream.(FileInputStream.java:51) at Lolo9.main(Lolo9.java:9) La clase DataInputStream nos permite leer, en forma independiente del “hardware”, tipos de datos de una «corriente» (stream) que, en este caso, es un archivo. Es descendiente de FilterInputStream e implementa DataInput, una “interface”. Al crear un objeto de tipo DataInputStream lo referimos al archivo, que le pasamos como parámetro (fptr); esta clase tiene toda una serie de métodos para leer datos en distintos formatos. En nuestro programa usamos uno para leer líneas, que devuelve null cuando se llega al final del archivo o un String con el contenido de la línea: do { linea = f.readLine(); System.out.println(linea); } while (linea != null); Enseguida de leer la línea la imprimimos, y repetimos esto mientras no nos devuelva “null”. Al final, cerramos el archivo: fptr.close(); Tanto readLine como close pueden lanzar la excepción IOException, en caso de error de lectura o cierre de archivo. En realidad, podríamos no haber usado un DataInputStream y trabajar en forma más directa: import java.io.*; public class Lolo10 { public static void main(String args[]) throws FileNotFoundException,IOException { Anexo III 6-44

Lenguaje JAVA

FileInputStream fptr; int n; fptr = new FileInputStream(«Lolo9.java»); do { n = fptr.read(); if (n!=-1) System.out.print((char)n); } while (n!=-1); fptr.close(); } } Ya que la clase FileInputStream también dispone de métodos para leer el archivo. Sólo que son unos pocos métodos que nos permiten leer un entero por vez o un arreglo de “bytes”. DataInputStream tiene métodos para leer los datos de muchas formas distintas, y en general resulta más cómodo.

11. Herencia Herencia es el mecanismo por el que se crean nuevos objetos definidos en términos de objetos ya existentes. Por ejemplo, si se tiene la clase Mamífero, se puede crear la subclase Felino, que es una especialización de Mamífero. class Felino extends Mamífero { int numero_de_patas; } La palabra cl Mamífero extends se usa para generar una subclase (especialización) de un objeto. Una Felino es una subclase de Mamífero. Cualquier cosa que contenga la definición de Mamífero será copiada a la clase Felino; además, en Felino se pueden definir sus propios métodos y variables de instancia. Se dice que Felino deriva o hereda de Mamífero. Además, se pueden sustituir los métodos proporcionados por la clase base. Utilizando el ejemplo de MiClase, aquí hay un ejemplo de una clase derivada sustituyendo a la función Suma_a_i(): import MiClase; public class MiNuevaClase extends MiClase { public void Suma_a_i( int j ) { i = i + ( j/2 ); } } Anexo III 6-45


Ahora, cuando se crea una instancia de MiNuevaClase, el valor de “i” también se inicializa a 10, pero la llamada al método Suma_a_i() produce un resultado diferente: MiNuevaClase mnc; mnc = new MiNuevaClase(); mnc.Suma_a_i( 10 ); En JAVA no se puede hacer herencia múltiple. Por ejemplo, de la clase aparato con motor y de la clase animal no se puede derivar nada, sería como obtener el objeto toro mecánico a partir de una máquina motorizada (aparato con motor) y un toro (animal). En realidad, lo que se pretende es copiar los métodos, es decir, pasar la funcionalidad del toro de verdad al toro mecánico, con lo cual no sería necesaria la herencia múltiple sino simplemente la compartición de funcionalidad que se encuentra implementada en JAVA a través de “interfaces”. En JAVA, como en otros lenguajes de programación orientados a objetos, las clases pueden derivar desde otras clases. La clase derivada (la clase que proviene de otra clase) se llama subclase. La clase de la que está derivada se denomina superclase. De hecho, en JAVA, todas las clases deben derivar de alguna clase. Lo que nos lleva a la cuestión ¿dónde empieza todo esto? La clase más alta, la clase de la que todas las demás descienden, es la clase Object, definida en java.lang. Object es la raíz de la herencia de todas las clases. Las subclases heredan el estado y el comportamiento en forma de las variables y los métodos de su superclase. La subclase puede utilizar los ítems heredados de su superclase tal y como son, o puede modificarlos o sobreescribirlos. Por eso, según se va bajando por el árbol de la herencia, las clases se convierten en más y más especializadas: Una subclase es una clase que desciende de otra clase. Una subclase hereda el estado y el comportamiento de todos sus ancestros. El término superclase se refiere a la clase que es el ancestro más directo, así como a todas las clases ascendentes.

11.1. Crear Subclases Se declara que un clase es una subclase de otra clase dentro de la declaración de Clase. Por ejemplo, supongamos que queremos crear una subclase llamada SubClase de otra clase llamada SuperClase. Se escribiría esto: class SubClass extends SuperClass { ... } Esto declara que SubClase es una subclase de SuperClase. Y también declara implícitamene que SuperClase es la superclase de SubClase. Una subclase también hereda variables y miembros de las superclases de su superclase, y así a lo largo del árbol de la herencia. Para hacer esta explicación un poco más sencilla, cuando este tutorial se refiere a la superclase de una clase significa el ancestro más directo de la clase así como a todas sus clases ascendentes.

Anexo III 6-46

Lenguaje JAVA

Una clase JAVA sólo puede tener una superclase directa. JAVA no soporta la herencia múltiple. Crear una subclase puede ser tan sencillo como incluir la clausula extends en la declaración de la clase. Sin embargo, normalmente se deberá realizar alguna cosa más cuando se crea una subclase, como sobreescribir métodos, etc...

11.2. ¿Qué variables miembro hereda una subclase? Una subclase hereda todas las variables miembros de su superclase que puedan ser accesibles desde la subclase (a menos que la variable miembro esté oculta en la subclase). Esto es, las subclases: •

Heredan aquellas variables miembros declaradas como public o protected.

•

Heredan aquellas variables miembros declaradas sin especificador de acceso (normalmente conocidas como «Amigas») siempre que la subclases esté en el mismo paquete que la clase.

•

No heredan las variables miembros de la superclase si la subclase declara una variable miembro que utiliza el mismo nombre. La variable miembro de la subclase se dice que oculta a la variable miembro de la superclase.

•

No heredan las variables miembro private.

11.3. Ocultar Variables Miembro Como se mencionó en la sección anterior, las variables miembros definidas en la subclase ocultan las variables miembro que tienen el mismo nombre en la superclase. Como esta característica del lenguaje JAVA es poderosa y conveniente, puede ser una fuente de errores: ocultar una variable miembro puede hacerse deliberadamente o por accidente. Entonces, cuando se nombren variables miembro se ha de ser cuidadoso y ocultar solo las variables miembro que realmente se desean ocultar. Una característica interesante de las variables miembro en JAVA es que una clase puede acceder a una variable miembro oculta a través de su superclase. Considere este pareja de superclase y subclase:

class Super { Number unNumero; } class Sub extends Super { Float unNumero; } La variable unNumero de Sub oculta a la variable unNumero de Super. Pero se puede acceder a la variable de la superclase utilizando: super.unNumero Anexo III 6-47


Super es una palabra clave del lenguaje JAVA que permite a un método referirse a las variables ocultas y métodos sobreescritos de una superclase (ya la hemos estudiado en un apartado anterior en profundidad).

11.4. ¿Qué métodos hereda una Subclase? La regla que especifica los métodos heredados por una subclase es similar a la de las variables miembro. Una subclase hereda todos los métodos de sus superclase que son accesibles para la subclase (a menos que el método sea sobreescrito por la subclase). Esto es, una Subclase: •

Hereda aquellos métodos declarados como public o protected.

•

Hereda aquellos métodos sin especificador de acceso, siempre que la subclase esté en el mismo paquete que la clase.

•

No hereda un método de la superclase si la subclase declara un método que utiliza el mismo nombre. Se dice que el método de la subclase sobreescribe al método de la superclase.

•

No hereda los métodos private.

11.5. Sobreescribir Métodos La habilidad de una subclase para sobreescribir un método de su superclase permite a una clase heredar de su superclase aquellos comportamientos «más cercanos» y luego suplementar o modificar el comportamiento de la superclase. Una subclase puede sobreescribir completamente la implementación de un método heredado o puede mejorar el método añadiendole funcionalidad.

11.6. Redefinir el Método de una Superclase Algunas veces, una subclase querría reemplazar completamente la implementación de un método de su superclase. De hecho, muchas superclases proporcionan implementaciones de métodos vacías con la esperanza de que la mayoría, si no todas, de sus subclases reemplacen completamente la implementación de ese método. Un ejemplo de esto es el método run() de la clase Thread. La clase Thread proporciona una implementación vacía (el método no hace nada) para el método run(), porque por definición este método depende de la subclase. La clase Thread posiblemente no puede proporcionar una implementación medianamente razonable del método run(). Para reemplazar completamente la implementación de un método de la superclase, simplemente se llama a un método con el mismo nombre Anexo III 6-48

Lenguaje JAVA

que el del método de la superclase y se sobreescribe el método con la misma firma que la del método sobreescrito:

class ThreadSegundoPlano extends Thread { void run() { ... } } La clase ThreadSegundoPlano sobreescribe completamente el método run() de su superclase y reemplaza completamente su implementación.

11.7. Añadir Implementación a un método de la Superclase Otras veces una subclase querrá mantener la implememtación del método de su superclase y posteriormente ampliar algún comportamiento específico de la subclase. Por ejemplo, los métodos constructores de una subclase lo hacen normalmente —la subclase quiere preservar la inicialización realizada por la superclase, pero proporciona inicialización adicional específica de la subclase. Supongamos que queremos crear una subclase de la clase Windows del paquete java.awt. La clase Windows tiene un constructor que requiere un argumento del tipo Frame que es el padre de la ventana:

public Window(Frame parent) Este constructor realiza alguna inicialización en la ventana para que trabaje dentro del sistema de ventanas. Para asegurarnos de que una subclase de Window también trabaja dentro del sistema de ventanas, deberemos proporcionar un constructor que realice la misma inicialización. Mucho mejor que intentar recrear el proceso de inicialización que ocurre dentro del constructor de Windows, se podría utilizar lo que la clase Windows ya hace. Se puede utilizar el código del constructor de Windows llamándolo desde dentro del constructor de la subclase Window:

class Ventana extends Window { public Ventana(Frame parent) { super(parent); ... // Ventana especifica su inicialización aquí ... } }

Anexo III 6-49


El constructor de Ventana llama primero al constructor de su superclase, y no hace nada más. Típicamente, éste es el comportamiento deseado de los constructores —las superclases deben tener la oportunidad de realizar sus tareas de inicialización antes que las de su subclase—. Otros tipos de métodos podrían llamar al constructor de la supeclase al final del método o en el medio.

11.8. Métodos que una subclase no puede sobrescibir Una subclase no puede sobrescribir métodos que hayan sido declarados como final en la superclase (por definición, los métodos finales no pueden ser sobrescritos). Si intentamos sobrescribir un método final, el compilador mostrará un mensaje similar a éste y no compilará el programa:

FinalTest.java:7: Final methods can’t be overriden. Method void iamfinal() is final in class ClassWithFinalMethod. void iamfinal() { ^ 1 error Para una explicación sobre los métodos finales, puede ver: escribir clases y métodos finales (epig. 11.10). Una subclase tampoco pude sobrescribir métodos que se hayan declarado como static en la superclase. En otras palabras, una subclase no puede sobrescribir un método de clase. Puede ver Miembros de la clase y del ejemplar (epig. 9.18) para obtener una explicación sobre los métodos de clase.

11.9. Métodos que una subclase debe sobrescribir Las subclases deben sobreescribir aquellos métodos que hayan sido declarados como abstract en la superclase, o la propia subclase debe ser abstracta. Escribir Clases y Métodos Abstractos explica con más detalle los métodos y clases abstractos.

11.10. Escribir clases y métodos finales A) Clases finales Se puede declarar que una clase sea final; esto es, que la clase no pueda tener subclases. Existen (al menos) dos razones por las que se querría hacer esto: razones de seguridad y de diseño. Un mecanismo que los hackers utilizan para atacar sistemas es crear subclases de una clase y luego sustituirla por el original. Las subclases parecen y sienten como la clase original pero hacen cosas bastante diferentes, probablemente causando daños u obteniendo información privada. Para prevenir esta Anexo III 6-50

Lenguaje JAVA

clase de subversión, se puede declarar que la clase sea final y así prevenir que se cree cualquier subclase. La clase String del paquete java.lang es una clase final sólo por esta razón. La clase String es tan vital para la operación del compilador y del intérprete que el sistema JAVA debe garantizar que siempre que un método o un objeto utilicen un String, obtenga un objeto java.lang.String y no algún otro string. Esto asegura que ningún string tendrá propiedades extrañas, inconsistentes o indeseables. Si se intenta compilar una subclase de una clase final, el compilador mostrará un mensaje de error y no compilará el programa. Además, los “bytescodes” verifican que no está teniendo lugar una subversión al nivel de “byte”, comprobando que una clase no es una subclase de una clase final. Otra razón por la que se podría querer declarar una clase final son razones de diseño orientado a objetos. Se podría pensar que una clase es «perfecta» o que, conceptualmente hablando, la clase no debería tener subclases. Para especificar que una clase es una clase final, se utiliza la palabra clave final antes de la palabra clave class en la declaración de la clase. Por ejemplo, si quisieramos declarar AlgoritmodeAjedrez como una clase final (perfecta), la declaración se parecería a esto:

final class AlgoritmodeAjedrez { ... } Cualquier intento posterior de crear una subclase de AlgoritmodeAjedrez resultará en el siguiente error del compilador:

Chess.java:6: Can’t subclass final classes: class AlgoritmodeAjedrez class MejorAlgoritmodeAjedrez extends AlgoritmodeAjedrez { ^ 1 error B) Métodos Finales Si la creacción de clases finales parece algo dura para nuestras necesidades, y realmente lo que se quiere es proteger algunos métodos de una clase para que no sean sobrescritos, se puede utilizar la palabra clave final en la declaración de método para indicar al compilador que este método no puede ser sobrescrito por las subclases. Se podría desear hacer que un método fuera final si el método tiene una implementación que no debe ser cambiada y que es crítica para el estado consistente del objeto. Por ejemplo, en lugar de hacer AlgoritmodeAjedrez como una clase final, podríamos hacer siguienteMovimiento() como un método final:

Anexo III 6-51


class AlgoritmodeAjedrez { ... final void siguienteMovimiento(Pieza piezaMovida, PosicionenTablero nuevaPosicion) { } ... }

12. Clases abstractas Algunas veces, una clase que se ha definido representa un concepto abstracto y, como tal, no debe ser ejemplarizado. Por ejemplo, la comida en la vida real. ¿Ha visto algún ejemplar de comida? No. Lo que ha visto son ejemplares de manzanas, pan y chocolate. Comida representa un concepto abstracto de cosas que son comestibles. No tiene sentido que exista un ejemplar de comida. Similarmente, en la programación orientada a objetos se podría modelar conceptos abstractos pero no querer que se creen ejemplares de ellos. Por ejemplo, la clase Number del paquete java.lang representa el concepto abstracto de número. Tiene sentido modelar números en un programa, pero no tiene sentido crear un objeto genérico de números. En su lugar, la clase Number solo tiene sentido como superclase de otras clases como Integer y Float que implementan números de tipos específicos. Las clases como Number, que implementan conceptos abstractos y no deben ser ejemplarizadas, son llamadas clases abstractas. Una clase abstracta es una clase que solo puede tener subclases —no puede ser ejemplarizada—. Para declarar que una clase es un clase abstracta, se utiliza la palabra clave abstract en la declaración de la clase.

abstract class Number { ... } Si se intenta ejemplarizar una clase abstracta, el compilador mostrará un error similar a éste y no compilará el programa:

AbstractTest.java:6: class AbstractTest is an abstract class. It can’t be instantiated. new AbstractTest(); ^ 1 error

12.1. Métodos abstractos Una clase abstracta puede contener métodos abstractos, esto es, métodos que no tienen implementación. De esta forma, una clase abstracta puede definir un “interface” de programación completo, incluso porporciona a sus subclases Anexo III 6-52

Lenguaje JAVA

la declaración de todos los métodos necesarios para implementar el “interface” de programación. Sin embargo, las clases abstractas pueden dejar algunos detalles o toda la implementación de aquellos métodos a sus subclases. Veamos un ejemplo de cuándo sería necesario crear una clase abstracta con métodos abstractos: en una aplicación de dibujo orientada a objetos, se pueden dibujar círculos, rectángulos, líneas, etc. Cada uno de esos objetos gráficos comparten ciertos estados (posición, caja de dibujo) y comportamiento (movimiento, redimensionado, dibujo). Podemos aprovecharnos de esas similitudes y declararlos todos a partir de un mismo objeto padreObjetoGrafico. Sin embargo, los objetos gráficos también tienen diferencias sustanciales: dibujar un círculo es bastante diferente a dibujar un rectángulo. Los objetos gráficos no pueden compartir estos tipos de estados o comportamientos. Por otro lado, todos los ObjetosGraficos deben saber cómo dibujarse a sí mismos; se diferencian en cómo se dibujan unos y otros. Ésta es la situación perfecta para una clase abstracta. Primero se debe declarar una clase abstracta, ObjetoGrafico, para proporcionar las variables miembro y los métodos que van a ser compartidos por todas las subclases, como la posición actual y el método moverA(). También se deberían declarar métodos abstractos como dibujar(), que necesita ser implementado por todas las subclases, pero de manera completamente diferente (no tiene sentido crear una implementación por defecto en la superclase). La clase ObjetoGrafico se parecería a esto:

abstract class ObjetoGrafico { int x, y; ... void moverA(int nuevaX, int nuevaY) { ... } abstract void dibujar(); } Todas las subclases no abstractas de ObjetoGrafico como son Circulo o Rectangulo deberán proprocionar una implementación para el método dibujar(). class Circulo extends ObjetoGrafico { void dibujar() { ... } } class Rectangulo extends ObjetoGrafico { void dibujar() { ... } } Anexo III 6-53


Una clase abstracta no necesita contener un método abstracto. Pero todas las clases que contengan un método abstracto o no proporcionen implemenación para cualquier método abstracto declarado en sus superclases debe ser declarada como una clase abstracta.

13. La clase Object La clase Object está situada en la parte más alta del árbol de la herencia en el entorno de desarrollo de JAVA. Todas las clases del sistema JAVA son descendentes (directos o indirectos) de la clase Object. Esta clase define los estados y comportamientos básicos que todos los objetos deben tener, como la posibilidad de compararse unos con otros, de convertirse a cadenas, de esperar una condición variable, de notificar a otros objetos que la condición variable ha cambiado y devolver la clase del objeto.

13.1. El método equals() Equals() se utiliza para comparar si dos objetos son iguales. Este método devuelve true si los objetos son iguales, o false si no lo son. Observe que la igualdad no significa que los objetos sean el mismo objeto. Consideremos este código que compara dos enteros:

Integer uno = new Integer(1), otroUno = new Integer(1); if (uno.equals(otroUno)) System.out.println(«Los objetos son Iguales»); Este código mostrará Los objetos son Iguales aunque uno y otroUno referencian a dos objetos distintos. Se les considera iguales porque su contenido es el mismo valor entero. Las clases deberían sobrescribir este método proporcionando la comprobación de igualdad apropiada. Un método equals() debería comparar el contenido de los objetos para ver si son funcionalmente iguales y devolver true si es así.

13.2. El método getClass() El método getClass() es un método final (no puede sobrescribirse) que devuelve una representación en tiempo de ejecución de la clase del objeto. Este método devuelve un objeto Class al que se le puede pedir varia información sobre la clase, como su nombre, el nombre de su superclase y los nombres de los “interfaces” que implementa. El siguiente método obtiene y muestra el nombre de la clase de un objeto:

void PrintClassName(Object obj) { System.out.println(«La clase del Objeto es « + obj.getClass().getName()); }

Anexo III 6-54

Lenguaje JAVA

Un uso muy manejado del método getClass() es crear un ejemplar de una clase sin conocer la clase en el momento de la compilación. Este método de ejemplo, crea un nuevo ejemplar de la misma clase que obj que puede ser cualquier clase heredada desde Object (lo que significa que podría ser cualquier clase):

Object createNewInstanceOf(Object obj) { return obj.getClass().newInstance(); }

13.3. El método toString() Este método devuelve una cadena de texto que representa al objeto. Se puede utilizar toString para mostrar un objeto. Por ejemplo, se podría mostrar una representación del Thread actual de la siguiente forma:

System.out.println(Thread.currentThread().toString()); System.out.println(new Integer(44).toString()); La representación de un objeto depende enteramente del objeto. El String de un objeto entero es el valor del entero mostrado como texto. El String de un objeto Thread contiene varios atributos sobre el “thread”, como su nombre y prioridad. Por ejemplo, las dos líneas anteriores darían la siguiente salida:

Thread[main,5,main] 4 El método toString() es muy útil para depuración y también puede sobreescribir este método en todas las clases.

14. Interface Un “interface” es una colección de definiciones de métodos (sin implementaciones) y de valores constantes. Los “interfaces” se utilizan para definir un protocolo de comportamiento que puede ser implementado por cualquier clase del árbol de clases. Los “interfaces” son útiles para: •

Capturar similitudes entre clases no relacionadas sin forzar una relación entre ellas.

•

Declarar métodos que una o varias clases necesitan implementar.

•

Revelar el “interface” de programación de un objeto sin recelar sus clases (los objetos de este tipo son llamados objetos anónimos y

Anexo III 6-55


pueden ser útiles cuando compartas un paquete de clases con otros desarrolladores). En JAVA, un “interface” es un tipo de dato de referencia y, por tanto, puede utilizarse en muchos de los sitios donde se pueda utilizar cualquier tipo (como en un argumento de métodos y una declaración de variables). Podrá ver todo esto en Utilizar un Interface como un Tipo.

14.1. Los Interfaces no proporcionan herencia múltiple Algunas veces se tratra a los “interfaces” como una alternativa a la herencia múltiple en las clases. A pesar de que los “interfaces” podrían resolver algunos problemas de la herencia múltiple, son animales bastantes diferentes. En particular: •

No se pueden heredar variables desde un “interface”.

•

No se pueden heredar implementaciones de métodos desde un “interface”.

•

La herencia de un “interface” es independiente de la herencia de la clase —las clases que implementan el mismo “interface” pueden o no estar relacionadas a través del árbol de clases—.

14.2. Definir un Interface Para crear un “Interface”, se debe escribir tanto la declaración como el cuerpo del “interface”:

declaraciondeInterface { cuerpodeInterface } La Declaración de Interface declara varios atributos del “interface”, como su nombre o si se extiende desde otro “interface”. El Cuerpo de Interface contiene las constantes y las declaraciones de métodos del Interface.

14.3. La declaración de “interface” Como mínimo, una declaración de “interface” contiene la palabra clave “interface” y el nombre del “interface” que se va a crear:

“interface” Contable { ... }

Anexo III 6-56

Lenguaje JAVA

Por convención, los nombres de “interfaces” empiezan con una letra mayúscula al igual que las clases. Frecuentemente los nombres de “interfaces” terminan en «able» o «ible». Una declaración de “interface” puede tener otros dos componentes: el especificador de acceso public y una lista de «superinterfaces». Un “interface” puede extender otros “interfaces” como una clase puede extender o subclasificar otra case. Sin embargo, mientras que una clase sólo puede extender una superclase, los “interfaces” pueden extender de cualquier número de ““interfaces””. Así, una declaración completa de “interface” se parecería a esto:

[public] “interface” Nombredenterface [extends listadeSuperInterfaces] { ... } El especificador de acceso public indica que el “interface” puede ser utilizado por todas las clases en cualquier paquete. Si el “interface” no se especifica como público, solo será accesible para las clases definidas en el mismo paquete que el “interface”. La clausula extends es similar a la utilizada en la declaración de una clase; sin embargo, un “interface” puede extender varios “interfaces” (mientras una clase sólo puede extender una), y un “interface” no puede extender clases. Esta lista de superinterfaces es un lista delimitada por comas de todos los “interfaces” extendidos por el nuevo “interface”. Un “interface” hereda todas las constantes y métodos de sus superinterfaces a menos que el “interface” oculte una constante con el mismo nombre o redeclare un método con una nueva declaración.

14.4. El cuerpo del Interface El cuerpo del “interface” contiene las declaraciones de métodos para los métodos definidos en el “interface”. Implementar Métodos muestra cómo escribir una declaración de método. Además de las declaraciones del métodos, un “interface” puede contener declaraciones de constantes. En Declarar Variables Miembros existe más información sobre cómo construir una declaración de una variable miembro. Las declaraciones de miembros en un “interface” no permiten el uso de algunos modificadores y desaconsejan el uso de otros. No se podrán utilizar “transient”, “volatile”, o “synchronized” en una declaración de miembro en un “interface”. Tampoco se podrá utilizar los especificadores “private” y “protected” cuando se declaren miembros de un “interface”. Todos los valores constantes definidos en un “interfaces” son implicitamente públicos, estáticos y finales. El uso de estos modificadores en una declaración de constante en un “interface” está desaconsejado por falta de estilo. Similarmente, todos los métodos declarados en un “interface” son implícitamente públicos y abstractos. Este código define un nuevo “interface” llamado Coleccion que contiene un valor constante y tres declaraciones de métodos:

Anexo III 6-57


“interface” Coleccion { int MAXIMO = 500; void añadir(Object obj); void borrar(Object obj); Object buscar(Object obj); int contadorActual(); } El “interface” anterior puede ser implementado por cualquier clase que represente una colección de objetos como pueden ser pilas, vectores, enlaces, etc... Observa que cada declaración de método está seguida por un punto y coma (;) porque un “interface” no proporciona implementación para los métodos declarados dentro de él.

14.5. Implementar un Interface Para utilizar un “interface” se debe escribir una clase que lo implemente. Una clase declara todos los “interfaces” que implementa en su declaración de clase. Para declarar que una clase implementa uno o más “interfaces”, se utiliza la palabra clave implements seguida por una lista delimitada por comas con los “interfaces” implementados por la clase. Por ejemplo, consideremos el “interface” Coleccion presentado en la página anterior. Ahora, supongamos que queremos escribir una clase que implemente un pila FIFO (primero en entrar, primero en salir). Como una pila FIFO contiene otros objetos tiene sentido que implemente el “interface” Coleccion. La clase PilaFIFO declara que implementa el “interface” Coleccion de esta forma:

class PilaFIFO implements Coleccion { ... void añadir(Object obj) { ... } void borrar(Object obj) { ... } Object buscar(Object obj) { ... }

Anexo III 6-58

Lenguaje JAVA

int contadorActual() { ... } } Así se garantiza que proporciona implementación para los métodos añadir(), borrar(), buscar() y contadorActual(). Por convención, la cláusula implements sigue a la cláusula extends si es que ésta existe. Observe que las firmas de los métodos del “interface” Coleccion implementados en la clase PilaFIFO debe corresponder exactamente con las firmas de los métodos declarados en la “interface” Coleccion.

14.6. Utilizar un Interface como un Tipo Como se mencionó anteriormente, cuando se define un nuevo “interface”, en esencia se está definiendo un tipo de referencia. Se pueden utilizar los nombres de “interface” en cualquier lugar donde se usaría un nombre de dato de tipos primitivos o un nombre de datos del tipo de referencia. Por ejemplo, supongamos que se ha escrito un programa de hoja de cálculo que contiene un conjunto tabular de celdas y cada una contiene un valor. Querríamos poder poner cadenas, fechas, enteros, ecuaciones, en cada una de las celdas de la hoja. Para hacer esto, las cadenas, las fechas, los enteros y las ecuaciones tienen que implementar el mismo conjunto de métodos. Una forma de conseguir esto es encontrar el ancestro común de las clases e implementar ahí los métodos necesarios. Sin embargo, esto no es una solución práctica porque el ancestro común más frecuente es Object. De hecho, los objetos que puede poner en las celdas de su hoja de cálculo no están relacionadas entre sí, solo por la clase Object. Pero no puede modificar Object. Una aproximación podría ser escribir una clase llamada ValordeCelda que representara los valores que pudiera contener una celda de la hoja de cálculo. Entonces se podrían crear distintas subclases de ValordeCelda para las cadenas, los enteros o las ecuaciones. Además de ser mucho trabajo, esta aproximación arbitraria fuerza una relación entre esas clases que de otra forma no sería necesaria, y debería duplicar e implementar de nuevo clases que ya existen. Se podría definir un “interface” llamado CellAble que se parecería a esto:

“interface” CellAble { void draw(); void toString(); void toFloat(); } Anexo III 6-59


Ahora, supongamos que existen objetos Línea y Columna que contienen un conjunto de objetos que implementan el “interface” CellAble. El método setObjectAt() de la clase Línea se podría parecer a esto:

class Línea { private CellAble[] contents; ... void setObjectAt(CellAble ca, int index) { ... } ... } Observe el uso del nombre del “interface” en la declaración de la variable miembro contents y en la declaración del argumento ca del método. Cualquier objeto que implemente el “interface CellAble”, sin importar que exista o no en el árbol de clases, puede estar contenido en el array contents y podría ser pasado al método setObjectAt().

15. Paquetes Los paquetes son grupos relacionados de clases e “interfaces” y proporcionan un mecanismo conveniente para manejar un gran juego de clases e “interfaces” y evitar los conflictos de nombres. Además de los paquetes de JAVA, se pueden crear paquetes propios y poner en ellos definiciones de clases y de “interfaces” utilizando la sentencia package. Supongamos que se está implementando un grupo de clases que representan una colección de objetos gráficos como círculos, rectángulos, líneas y puntos. Además de estas clases se debería escribir un “interface” Draggable para que las clases que lo implementen puedan moverse con el ratón. Si se quiere que estas clases estén disponibles para otros programadores, puedes empaquetarlas en un paquete, digamos, graphics y entregar el paquete a los programadores (junto con alguna documentación de referencia como qué hacen las clases y los “interfaces” y qué “interfaces” de programación son públicos). De esta forma, otros programadores pueden determinar fácilmente para qué es tu grupo de clases, cómo utilizarlos y cómo relacionarlos unos con otros, y con otras clases y paquetes. Los nombres de clases no tienen conflictos con los nombres de las clases de otros paquetes porque las clases y los “interfaces” dentro de un paquete son referenciados en términos de su paquete. Se declara un paquete utilizando la sentencia package:

package graphics; “interface” Draggable { } Anexo III 6-60

...

Lenguaje JAVA

class Circle {

...

} class Rectangle {

...

} La primera línea del código anterior crea un paquete llamado graphics. Todas las clases e “interfaces” definidas en el fichero que contiene esta sentencia son miembros del paquete. Por lo tanto, Draggable, Circle,y Rectangle son miembros del paquete graphics. Los ficheros .class generados por el compilador cuando se compila el fichero que contiene el fuente para Draggable, Circle y Rectangle debe situarse en un directorio llamado graphics en algún lugar se el path CLASSPATH. CLASSPATH es una lista de directorios que indica al sistema donde ha instalado varias clases e “interfaces” compiladas JAVA. Cuando busque una clase, el intérprete JAVA busca un directorio en su CLASSPATH cuyo nombre coincida con el nombre del paquete del que la clase es miembro. Los ficheros .class para todas las clases e “interfaces” definidas en un paquete deben estar en ese directorio de paquete. Los nombres de paquetes pueden contener varios componentes (separados por puntos). De hecho, los nombres de los paquetes de JAVA tienen varios componentes: java.util, java.lang, etc... Cada componente del nombre del paquete representa un directorio en el sistema de ficheros. Así, los ficheros .class de java.util están en un directorio llamado util en otro directorio llamado JAVA en algún lugar del CLASSPATH. Todas las clases e “interfaces” pertenecen a un paquete. Incluso si no especifica uno con la sentencia package. Si no se especifican las clases e “interfaces” se convierten en miembros del paquete por defecto, que no tiene nombre y que siempre es importado.

15.1. Utilizar Clases e Interfaces desde un Paquete Para importar una clase específica o un “interface” al fichero actual (como la clase Circle desde el paquete graphics creado en la sección anterior) se utiliza la sentencia de import:

import graphics.Circle; Esta sentencia debe estar al principio del fichero antes de cualquier definición de clase o de “interface” y hace que la clase o el “interface” esté disponible para su uso por las clases y los “interfaces” definidos en el fichero. Si se quiere importar todas las clases e “interfaces” de un paquete, por ejemplo, el paquete graphics completo, se utiliza la sentencia import con un caracter comodín, un asterisco ‘*’.

import graphics.*; Si intenta utilizar una clase o un “interface” desde un paquete que no ha sido importado, el compilador mostrará este error: Anexo III 6-61


testing.java:4: Class Date not found in type declaration. Date date; ^ Observe que solo las clases e “intefaces” declarados como públicos pueden ser utilizados en clases fuera del paquete en el fueron definidos. El paquete por defecto (un paquete sin nombre) siempre es importado. El sistema de ejecución también importa automáticamente el paquete java.lang. Si, por suerte, el nombre de una clase de un paquete es el mismo que el nombre de una clase en otro paquete, se debe evitar la ambigüedad de nombres precediendo el nombre de la clase con el nombre del paquete. Por ejemplo, previamente se ha definido una clase llamada Rectangle en el paquete graphics. El paquete java.awt también contiene una clase Rectangle. Si estos dos paquetes son importados en la misma clase, el siguiente código sería ambigüo:

Rectangle rect; En esta situación se tiene que ser más específico e indicar exactamente qué clase Rectangle se quiere:

graphics.Rectangle rect; Se puede hacer esto anteponiendo el nombre del paquete al nombre de la clase y separando los dos con un punto.

15.2. Los paquetes de JAVA A) El paquete de lenguaje JAVA El paquete java.lang, contiene las clases principales de JAVA, y se importa automáticamente: —

Object. El “abuelo” de todas las clases —la clase de la que parten todas las demás. Esta clase se cubrió anteriormente en la lección La Clase Object.

—

Tipos de Datos Encubiertos. Una colección de clases utilizadas para encubrir variables de tipos primitivos: Boolean, Character, Double, Float, Integer y Long. Cada una de estas clases es una subclase de la clase abstracta Number.

—

Strings. Dos clases que implementan los datos de caracteres. Las Clases String y StringBuffer es una lección donde conocerá el uso de estos dos tipos de Strings.

—

System y Runtime. Estas dos clases permiten a los programas utilizar los recursos del sistema. System proporciona un “interface” de

Anexo III 6-62

Lenguaje JAVA

programación independiente del sistema para recursos del sistema y Runtime da acceso directo al entorno de ejecución específico de un sistema. Utilizar Recursos del Sistema describe las clases System y Runtime y sus métodos. —

Thread. Las clases Thread, ThreadDeath y ThreadGroup implementan las capacidades multitareas tan importantes en el lenguaje JAVA. El paquete java.lang también define el “interface” Runnable. Este “interface” es conveniente para activar la clase JAVA sin subclasificar la clase Thread. A través de un ejemplo de aproximación Threads de Control enseñará los Threads JAVA.

—

Class. La clase Class proporciona una descripción en tiempo de ejecución de una clase y la clase ClassLoader permite cargar clases en los programas durante la ejecución.

—

Math. Una librería de rutinas y valores matemáticos como pi.

—

Exceptions, Errors y Throwable. Cuando ocurre un error en un programa JAVA, el programa lanza un objeto que indica qué problema era y el estado del intérprete cuando ocurrió el error. Solo los objetos derivados de la clase Throwable puden ser lanzados. Existen dos subclasses principales de Throwable: Exception y Error. Exception es la forma que deben intentar capturar los programas normales. Error se utiliza para los errores catastróficos —los programas normales no capturan Errores—. El paquete java.lang contiene las clases Throwable, Exception y Error, y numerosas subclases de Exception y Error que representan problemas específicos. Manejo de Errores Utilizando Excepciones muestra cómo utilizar las excepciones para manejar errores en sus programas JAVA.

—

Process. Los objetos Process representa el proceso del sistema que se crea cuando se utiliza el sistema en tiempo de ejecución para ejecutar comandos del sistema. El paquete java.lang define e implementa la clase genérica Process.

B) El Paquete I/O de JAVA El paquete I/O de JAVA (java.io) proporciona un juego de canales de entrada y salida utilizados para leer y escribir ficheros de datos y otras fuentes de entrada y salida. Las clases e “interfaces” definidos en java.io se cubren completamente en Canales de Entrada y Salida. C) El paquete de utilidades de JAVA Este paquete, java.util, contiene una colección de clases útiles. Entre ellas se encuentan muchas estructuras de datos genéricas (Dictionary, Stack, Vector, Hashtable), un objeto muy útil para dividir cadenas y otro para la manipualción de calendarios. El paquete java.util también contiene el “interface” Observer y la clase Observable que permiten a los objetos notificarse unos a otros cuando han cambiado.

Anexo III 6-63


D) El paquete de red de JAVA El paquete java.net contiene definiciones de clases e “interfaces” que implementan varias capacidades de red. Las clases de este paquete incluyen una clase que implementa una conexión URL. Se puede utilizar estas clases para implementar aplicaciones cliente-servidor y otras aplicaciones de comunicaciones. Conectividad y Seguridad del Cliente tiene varios ejemplos de utilización de estas clases, incluyendo un ejemplo cliente-servidor que utiliza datagramas. E) El paquete Applet Este paquete contiene la clase Applet —la clase que se debe subclasificar si se quiere escribir un applet—. En este paquete se incluye el “interface” AudioClip que proporciona una abstración de alto nivel para audio.Escribir Applets. F) Paquetes de herramientas para ventanas abstractas Tres paquetes componen las herramientas para Ventanas Abstractas: java.awt, java.awt.image, y java.awt.peer. —

El paquete AWT. El paquete java.awt proporciona elementos GUI utilizados para obtener información y mostrarla en la pantalla como ventanas, botones, barras de desplazamiento, etc.

—

El paquete AWT Image. El paquete java.awt.image contiene clases e “interfaces” para manejar imágenes de datos, como la selección de un modelo de color, el cortado y pegado, el filtrado de colores, la selección del valor de un píxel y la grabación de partes de la pantalla.

—

El paquete AWT Peer. El paquete java.awt.peer contiene clases e “interfaces” que conectan los componentes AWT independientes de la plataforma a su implementación dependiente de la plataforma (como son los controles de Microsoft Windows).

16. Excepciones En el lenguaje JAVA, una Exception es un cierto tipo de error o una condición anormal que se ha producido durante la ejecución de un programa. JAVA implementa excepciones dándole al usuario la oportunidad de corregir el error de forma que se pueden capturar y recuperar. JAVA incorpora en el propio lenguaje la gestión de errores. El mejor momento para detectar los errores es durante la compilación. Sin embargo, prácticamente solo los errores de sintaxis son detectados en esta operación. El resto de problemas surgen durante la ejecución de los programas. Algunas excepciones son fatales y provocan que se deba finalizar la ejecución del programa. En este caso conviene terminar ordenadamente y dar un Anexo III 6-64

Lenguaje JAVA

mensaje explicando el tipo de error que se ha producido. Otras excepciones, como por ejemplo no encontrar un fichero en el que hay que leer o escribir algo, pueden ser recuperables. En este caso el programa debe dar al usuario la oportunidad de corregir el error (definiendo por ejemplo un nuevo path del fichero no encontrado). Los errores se representan mediante clases derivadas de la clase Throwable, pero los que tiene que chequear un programador derivan de Exception (java.lang.Exception que a su vez deriva de Throwable). Existen algunos tipos de excepciones que JAVA obliga a tener en cuenta. Esto se hace mediante el uso de bloques “try”, “catch” y “finally”. • Bloque try {...} catch {...} finally {...} El código dentro del bloque “try” está “vigilado”. Si se produce una situación anormal y se lanza como consecuencia una excepción, el control pasa al bloque “catch”, que se hace cargo de la situación y decide lo que hay que hacer. Se pueden incluir tantos bloques “catch” como se desee, cada uno de los cuales tratará un tipo de excepción. Finalmente, si está presente, se ejecuta el bloque “finally”, que es opcional, pero que en caso de existir se ejecuta siempre, sea cual sea el tipo de error. En el caso en que el código de un método pueda generar una Exception y no se desee incluir en dicho método la gestión del error (es decir los bucles try/catch correspondientes), es necesario que el método pase la Exception al método desde el que ha sido llamado. Esto se consigue mediante la adición de la palabra “throws” seguida del nombre de la Exception concreta, después de la lista de argumentos del método. A su vez el método superior deberá incluir los bloques “try/catch” o volver a pasar la Exception. De esta forma se puede ir pasando la Exception de un método a otro hasta llegar al último método del programa, el método main(). import java.io.*; public class Lolo { public static void main(String args[]) { FileInputStream fptr; DataInputStream f; String linea = null; try { fptr = new FileInputStream(args[0]); f = new DataInputStream(fptr); do { linea = f.readLine(); if (linea!=null) System.out.println(linea); } while (linea != null);

Anexo III 6-65


fptr.close(); } catch (FileNotFoundException e) { System.out.println(«Hey, ese archivo no existe!\n»); } catch (IOException e) { System.out.println(«Error de E/S!\n»); } } } También hicimos un cambio para elegir el archivo a imprimir desde la línea de comandos, en lugar de entrarlo fijo, utilizando para eso el argumento del método main(arg[]), que consiste en una lista de Strings con los parámetros que se pasan en la línea a continuación de java nombre_programa. Por ejemplo, si llamamos a este programa con:

java Lolo archi.txt otro.xxx arg[0] contendrá «archi.txt», arg[1] contendrá «otro.xxx», y así sucesivamente. Por supuesto, si llamamos a Lolo sin parámetros se lanzará otra excepción al intentar accederlo:

C:\java\curso>java Lolo java.lang.ArrayIndexOutOfBoundsException: 0 at Lolo.main(Lolo.java:10) La cláusula try engloba una parte del programa donde se pueden lanzar excepciones. Si una excepción se produce, JAVA busca una instrucción catch (nombre_de_la_excepción variable), y, si la encuentra, ejecuta lo que ésta engloba. Si no encuentra un catch para esa excepción, para el programa y muestra el error que se produjo. Por ejemplo, para evitar este último error bastaría con agregar:

catch (ArrayIndexOutOfBoundsException e) { System.out.println(«Debe ingresar un nombre de archivo!»); System.out.println(«Ej.: java Lolo pepe.txt»); } Hay que notar que cuando se lanza una excepción el programa igual se detiene, porque el código que sigue al lanzamiento de la excepción no se ejecuta. Más adelante se verá cómo se comporta esto en un objeto que fue creAnexo III 6-66

Lenguaje JAVA

ado por otro, y cómo usar la instrucción “finally” para poner una parte de código que se ejecute pase lo que pase.

16.1. Manejo de errores utilizando excepciones Existe una regla de oro en el mundo de la programación: en los programas ocurren errores. Esto es sabido. Pero, ¿qué sucede realmente después de que ha ocurrido el error? ¿Cómo se maneja el error? ¿Quién lo maneja? ¿Puede recuperarlo el programa? El lenguaje JAVA utiliza excepciones para proporcionar capacidades de manejo de errores. En este apartado se explicará qué es una excepción, cómo lanzar y capturar excepciones, qué hacer con una excepción una vez capturada, y cómo hacer un mejor uso de las excepciones heredadas de las clases proporcionadas por el entorno de desarrollo de JAVA. Una excepción es un evento que ocurre durante la ejecución del programa que interrumpe el flujo normal de las sentencias. Muchas clases de errores pueden utilizar excepciones —desde serios problemas de “hardware”, como la avería de un disco duro, a los simples errores de programación, como tratar de acceder a un elemento de un array fuera de sus límites—. Cuando dicho error ocurre dentro de un método JAVA, el método crea un objeto ‘exception’ y lo maneja fuera, en el sistema de ejecución. Este objeto contiene información sobre la excepción, incluyendo su tipo y el estado del programa cuando ocurrió el error. El sistema de ejecución es el responsable de buscar algún código para manejar el error. En terminología JAVA, crear una objeto exception y manejarlo por el sistema de ejecución se llama lanzar una excepción. Después de que un método lance una excepción, el sistema de ejecución entra en acción para buscar el manejador de la excepción. El conjunto de «algunos» métodos posibles para manejar la excepción es el conjunto de métodos de la pila de llamadas del método donde ocurrió el error. El sistema de ejecución busca hacia atrás en la pila de llamadas, empezando por el método en el que ocurrió el error, hasta que encuentra un método que contiene el «manejador de excepción» adecuado. Un manejador de excepción es considerado adecuado si el tipo de la excepción lanzada es el mismo que el de la excepción manejada por el manejador. Así, la excepción sube sobre la pila de llamadas hasta que encuentra el manejador apropiado y una de las llamadas a métodos maneja la excepción, se dice que el manejador de excepción elegido captura la excepción. Si el sistema de ejecución busca exhaustivamente por todos los métodos de la pila de llamadas sin encontrar el manejador de excepción adecuado, el sistema de ejecución finaliza (y, consecuentemente, el programa JAVA también). Mediante el uso de excepciones para manejar errores, los programas JAVA tienen las siguientes ventajas frente a las técnicas de manejo de errores tradicionales: —

Ventaja 1: Separar el Manejo de Errores del Código «Normal».

—

Ventaja 2: Propagar los Errores sobre la Pila de Llamadas. Anexo III 6-67


—

Ventaja 3: Agrupar los Tipos de Errores y la Diferenciación de éstos.

16.2. La sentencia throw Todos los métodos JAVA utilizan la sentencia throw para lanzar una excepción. Esta sentencia requiere un solo argumento: un objeto Throwable. En el sistema JAVA, los objetos lanzables son ejemplares de la clase Throwable definida en el paquete java.lang. Aquí tiene un ejemplo de la sentencia throw:

throw algunObjetoThrowable;

16.3. La cláusula throws Habrá observado que la declaración del método pop() contiene esta cláusula:

throws EmptyStackException La cláusula throws especifica que el método puede lanzar una excepción EmptyStackException. Como ya sabe, el lenguaje JAVA requiere que los métodos capturen o especifiquen todas las excepciones chequeadas que puedan ser lanzadas dentro de su ámbito. Se puede hacer esto con la cláusula throws de la declaración del método.

16.4. La clase Throwable y sus subclases Como se aprendió en la página anterior, sólo se pueden lanzar objetos que estén derivados de la clase Throwable. Esto incluye descendientes directos (esto es, objetos de la clase Throwable) y descendiente indirectos (objetos derivados de hijos o nietos de la clase Throwable). Este diagrama ilustra el árbol de herencia de la clase Throwable y sus subclases más importantes:

Anexo III 6-68

Lenguaje JAVA

Object

Throwable

Exception Error

Runtime Exception

... ...

...

Como se puede ver en el diagrama, la clase Throwable tiene dos descendientes directos: Error y Exception. A) Error Cuando falla un enlace dinámico, y hay algún fallo «hardware» en la máquina virtual, ésta lanza un error. Típicamente los programas JAVA no capturan los errores. Pero siempre lanzarán errores. B) Exception La mayoría de los programas lanzan y capturan objetos derivados de la clase Exception. Una excepción indica que ha ocurrido un problema, pero que el problema no es demasiado serio. La mayoría de los programas que se escribirán lanzarán y capturarán excepciones. La clase Exception tiene muchos descendiente definidos en los paquetes JAVA. Estos descendientes indican varios tipos de excepciones que pueden ocurrir. Por ejemplo, IllegalAccessException señala que no se puede encontrar un método particular, y NegativeArraySizeException indica que un programa intenta crear un array con tamaño negativo. Una subclase de Exception tiene un significado especial en el lenguaje JAVA: RuntimeException. • Excepciones en Tiempo de Ejecución La clase RuntimeException representa las excepciones que ocurren dentro de la máquina virtual JAVA (durante el tiempo de ejecución). Un ejemplo de Anexo III 6-69


estas excepciones es NullPointerException, que ocurre cuando un método intenta acceder a un miembro de un objeto a través de una referencia nula. Esta excepción puede ocurrir en cualquier lugar en que un programa intente desreferenciar una referencia a un objeto. Frecuentemente el coste de chequear estas excepciones sobrepasa los beneficios de capturarlas. Como las excepciones en tiempo de ejecución están omnipresentes e intentar capturar o especificarlas todas en todo momento podrían ser un ejercicio infructuoso (y un código infructuoso, imposible de leer y de mantener), el compilador permite que estas excepciones no se capturen ni se especifiquen. Los paquetes JAVA definen varias clases RuntimeException. Se pueden capturar estas excepciones al igual que las otras. Sin embargo, no se requiere que un método especifique que lanza excepciones en tiempo de ejecución. Además puedes crear sus propias subclases de RuntimeException.

17. HILOs - Threads 17.1. ¿Qué es un Thread? Un “thread”, por sí mismo, no es un programa. No puede ejecutarse por sí mismo, pero sí con un programa. Un “thread” es un flujo secuencial de control dentro de un programa. No hay nada nuevo en el concepto de un solo “thread”. Pero el juego real alrededor de los “threads” no está sobre los “threads” secuenciales solitarios, sino sobre la posibilidad de que un solo programa ejecute varios “threads” a la vez y que realicen diferentes tareas. El navegador HotJAVA es un ejemplo de una aplicación multi-“thread”. Dentro del navegador HotJAVA puede moverse por la página mientras baja un applet o una imagen, se ejecuta una animación o escucha un sonido, imprime la página en segundo plano mientras descarga una nueva página, o ve cómo los tres algoritmos de ordenación alcanzan la meta. Algunos textos utilizan el nombre proceso de poco peso en lugar de “thread”. Un “thread” es similar a un proceso real en el que un “thread” y un programa en ejecución son un solo flujo secuencial de control. Sin embargo, un “thread” se considera un proceso de poco peso porque se ejecuta dentro del contexto de un programa completo y se aprovecha de los recursos asignados por ese programa y del entorno de éste. Como un flujo secuencial de control, un “thread” debe conseguir algunos de sus propios recursos dentro de un programa en ejecución (debe tener su propia pila de ejecución y contador de programa, por ejemplo). El código que se ejecuta dentro de un Thread trabaja solo en este contexto. Así, algunos textos utilizan el término contexto de ejecución como un sinónimo para los “threads”. Este ejemplo define dos clases: SimpleThread y TwoThreadsTest. Empecemos nuestra exploración de la aplicación con la clase SimpleThread — una subclase de la clase Thread, que es proporcionada por el paquete java.lang—: Anexo III 6-70

Lenguaje JAVA

class SimpleThread extends Thread { public SimpleThread(String str) { super(str); } public void run() { for (int i = 0; i < 10; i++) { System.out.println(i + « « + getName()); try { sleep((int)(Math.random() * 1000)); } catch (InterruptedException e) {} } System.out.println(«HECHO! « + getName()); } } El primer método de esta clase es un constructor que toma una cadena como su único argumento. Este constructor está implementado mediante una llamada al constructor de la superclase y es interesante para nosotros solo porque selecciona el nombre del Thread, que se usará más adelante en el programa. El siguiente método es el método run(). Este método es el corazón de cualquier Thread y donde tiene lugar la acción del Thread. El método run() de la clase SimpleThread contiene un bucle for que itera diez veces. En cada iteración el método muestra el número de iteración y el nombre del Thread, luego espera durante un intervalo aleatorio de hasta 1 segundo. Después de haber terminado el bucle, el método run() imprime «HECHO!» con el nombre del Thread. La clase TwoThreads proporciona un método main() que crea dos “threads” SimpleThread: uno llamado «Jamaica» y otro llamado «Fiji» (si no quiere decidir, dónde ir de vacaciones, puede utilizar este programa para ayudarte a elegir –ve a la isla cuyo “threads” imprima «HECHO!» primero–.

class TwoThreadsTest { public static void main (String[] args) { new SimpleThread(«Jamaica»).start(); new SimpleThread(«Fiji»).start(); } } El método main() también arranca cada uno de los “threads” inmediatamente después siguiendo su construcción con una llamada al método start(). Anexo III 6-71


El programa daría una salida parecida a esta: 0 2 4 6 8 9

Jamaica Jamaica Jamaica Fiji Fiji Jamaica

0 Fiji 2 Fiji 4 Fiji 6 Jamaica 9 Fiji HECHO! Jamaica

1 3 5 7 8

Fiji Fiji Jamaica Jamaica Jamaica

1 Jamaica 3 Jamaica 5 Fiji 7 Fiji HECHO! Fiji

Observe cómo la salida de cada uno de los “threads” se mezcla con la salida del otro. Esto es porque los dos “threads” SimpleThread se están ejecutando de forma concurrente. Así, los dos métodos run() se están ejecutando al mismo tiempo y cada “thread” está mostrando su salida al mismo tiempo que el otro. 0 Jamaica

0 Fiji

1 Fiji

1 Jamaica

2 Jamaica

2 Fiji

3 Fiji

3 Jamaica

4 Jamaica

4 Fiji

5 Jamaica

5 Fiji

6 Fiji

6 Jamaica

7 Jamaica

7 Fiji

8 Fiji

9 Fiji

8 Jamaica

HECHO! Fiji

9 Jamaica

HECHO! Jamaica

17.2. Atributos de un Thread Esta página presenta varias características específicas de los “threads” JAVA y proporciona enlaces a las páginas que explican cada característica con más detalle. Los “threads” java están implementados por la clase Thread, que es una parte del paquete java.lang. Esta clase implementa una definición de “threads” independiente del sistema. Pero, bajo la campana, la implementación real de la operación concurrente la proporciona una implementación específica del sistema. Para la mayoría de las aplicaciones, la implementación básica no importa. Se puede ignorar la implementación básica y programar el API de los “threads” descrito en estas lecciones y en otra documentación proporcionada con el sistema JAVA. • Cuerpo del Thread Toda la acción tiene lugar en el cuerpo del “thread” — el método run()— . Se puede proporcionar el cuerpo de un Thread de una de estas dos formas: subclasificando la clase Thread y sobreescribiendo su método run(), o creando un “thread” con un objeto de la clase Runnable y su target. Anexo III 6-72

Lenguaje JAVA

• Estado de un Thread A lo largo de su vida, un “thread” tiene uno o varios estados. El estado de un “thread” indica qué está haciendo el Thread y lo que es capaz de hacer durante su tiempo de vida: ¿se está ejecutando?, ¿está esperando? ¿o está muerto? • La prioridad de un Thread Una prioridad del Thread le dice al temporizador de “threads” de JAVA cuando se debe ejecutar este “thread” en relación con los otros. • Threads Daemon Estos “threads” son aquellos que proporcionan un servicio para otros “threads” del sistema. Cualquier “thread” JAVA puede ser un “thread” daemon. • Grupos de Threads Todos los “threads” pertenecen a un grupo. La clase ThreadGrpup, perteneciente al paquete java.lang define e implementa las capacidades de un grupo de “thread” relacionados. —

La mayoría de los ordenadores solo tienen una CPU, los “threads” deben compartir la CPU con otros “threads”. La ejecución de varios “threads” en un solo CPU, en cualquier orden, se llama programación. El sistema de ejecución JAVA soporta un algoritmo de programación determinístico que es conocido como programación de prioridad fija.

—

A cada “thread” JAVA se le da una prioridad numérica entre MIN_PRIORITY y MAX_PRIORITY (constantes definidas en la clase Thread). En un momento dato, cuando varios “threads” están listos para ejecutarse, el “thread” con prioridad superior será el elegido para su ejecución. Sólo cuando el “thread” para o se suspende por alguna razón, se empezará a ejecutar un “thread” con prioridad inferior.

—

La programación de la CPU es totalmente preventiva. Si un “thread” con prioridad superior que el que se está ejecutando actualmente necesita ejecutarse, toma inmediatamente posesión del control sobre la CPU.

—

El sistema de ejecución de JAVA no hace abandonar a un “thread” el control de la CPU por otro “thread” con la misma prioridad. En otras palabras, el sistema de ejecución de JAVA no comparte el tiempo. Sin embargo, algunos sistemas sí lo soportan, por lo que no se debe escribir código que esté relacionado con el tiempo compartido.

—

Además, un “thread” cualquiera, en cualquier momento, puede ceder el control de la CPU llamando al método yield(). Los “threAnexo III 6-73


ads” sólo pueden ‘prestar’ la CPU a otros “threads” con la misma prioridad que él –intentar cederle la CPU a un “thread” con prioridad inferior no tendrá ningún efecto–. —

Cuando todos los “threads” «ejecutables» del sistema tienen la misma prioridad, el programador elige a uno de ellos en una especie de orden de competición.

17.3. Programas con varios Threads A) Sincronización de Threads Frecuentemente, los “threads” necesitan compartir datos. Por ejemplo, supongamos que existe un “thread” que escribe datos en un fichero mientras, al mismo tiempo, otro “thread” está leyendo el mismo fichero. Cuando los “threads” comparten información necesitan sincronizarse para obtener los resultados deseados. Existen muchas situaciones interesantes donde ejecutar “threads” concurrentes que compartan datos y deban considerar el estado y actividad de otros “threads”. Este conjunto de situaciones de programación son conocidos como escenarios ‘productor/consumidor’, donde el productor genera un canal de datos que es consumido por el consumidor. Por ejemplo, se puede imaginar una aplicación JAVA donde un “thread” (el productor) escribe datos en un fichero mientras que un segundo “thread” (el consumidor) lee los datos del mismo fichero. O si se teclean caracteres en el teclado, el “thread” productor sitúa las pulsaciones en una pila de eventos y el “thread” consumidor lee los eventos de la misma pila. Estos dos ejemplos utilizan “threads” concurrentes que comparten un recurso común: el primero comparte un fichero y el segundo una pila de eventos. Como los “threads” comparten un recurso común, deben sincronizarse de alguna forma. B) Imparcialidad, Hambre y Punto Muerto Si se escribe un programa en el que varios “threads” concurrentes deben competir por los recursos, se deben tomar las precauciones necesarias para asegurarse la justicia. Un sistema es justo cuando cada “thread” obtiene suficiente acceso a los recursos limitados como para tener un progreso razonable. Un sistema justo previene el hambre y el punto muerto. El hambre ocurre cuando uno o más “threads” de un programa están bloqueados por ganar el acceso a un recurso y así no pueden progresar. El punto muerto es la última forma de hambre; ocurre cuando dos o más “threads” están esperando una condición que no puede ser satisfecha. El punto muerto ocurre muy frecuentemente cuando dos (o más) “threads” están esperando a que el otro u otros hagan algo. C) Volatile Los programas pueden modificar variables miembros fuera de la protección de un método o un bloque sincronizados y puede declarar que la variable miembro es volatile. Anexo III 6-74

Lenguaje JAVA

Si una variable miembro es declarada como “volatile”, el sistema de ejecución JAVA utiliza esta información para asegurarse que la variable sea cargada desde la memoria antes de cada uso, y almacenada en la memoria después de utilizarla. Esto asegura que el valor de la variable es consistente y coherente a lo largo del programa. D) Monitores Los objetos, como el CubbyHole que son compartidos entre dos “threads” y cuyo acceso debe ser sincronizado son llamados condiciones variables. El lenguaje JAVA permite sincronizar “threads” alrededor de una condición variable mediante el uso de monitores. Los monitores previenen que dos “threads” accedan simultáneamente a la misma variable. E) Los métodos notify() y wait()

En un nivel superior, el ejemplo Productor/Consumidor utiliza los métodos notify() y wait() del objeto para coordinar la actividad de los dos “threads”. El objeto CubyHole utiliza notify() y wait() para asegurarse de que cada valor situado en él por el Productor es recuperado una vez y sólo una por el Consumidor.

18. Interfaz gráfico AWT (Abstract Window Toolkit) 18.1. Introducción El AWT (Abstract Windows Toolkit) es la parte de JAVA que se ocupa de construir “interfaces” gráficas de usuario. JAVA incluye una librería llamada «Abstract Window Toolkit» (AWT) que define los principales elementos para el desarrollo de una interfaz gráfica (GUI): Button, Canvas, TextField, TextArea, Checkbox, Choice, Label, List, etc… Todos estos elementos gráficos son objetos derivadas de una superclase común: Component. Object

Component

Button

Label

TextField

TextArea

Container

Anexo III 6-75


Un objeto de la clase Container agrupa a los elementos gráficos. Para poder mostrar un elemento gráfico es necesario añadirlo a un objeto Container:

Container

Un objeto Container es a su vez un Component, por lo que puede estar anidado en otro objeto Container:

Existen diferentes objetos de la clase Container, por lo general se utilizan objetos de la clase Panel.

18.2. Creación de una Interface Gráfica de Usuario Para construir una “interface” gráfica de usuario hace falta: —

Un “contenedor” o “container”, que es la ventana o parte de la ventana donde se situarán los componentes (botones, barras de desplazamiento, etc.) y donde se realizarán los dibujos. Se correspondería con un formulario o una “picture box” de Visual Basic.

—

Los componentes: menús, botones de comando, barras de desplazamiento, cajas y áreas de texto, botones de opción y selección, etc. Se corresponderían con los controles de Visual Basic.

—

El modelo de eventos. El usuario controla la aplicación actuando sobre los componentes, de ordinario con el ratón o con el teclado. Cada vez que el usuario realiza una determinada acción, se produce el evento correspondiente, que el sistema operativo transmite al AWT. El AWT crea un objeto de una determinada clase de evento, derivada de AWTEvent. Este evento es transmitido a un determinado método para que lo gestione.

Anexo III 6-76

Lenguaje JAVA

En los siguientes apartados se verán con un cierto detalle estos tres aspectos del AWT. Hay que considerar que el AWT es una parte muy extensa y complicada de JAVA, sobre la que existen libros con muchos cientos de páginas.

18.3. Objetos “event source” y objetos “event listener” El modelo de eventos de JAVA está basado en que los objetos sobre los que se producen los eventos (event sources) “registran” los objetos que habrán de gestionarlos (event listeners), para lo cual los event listeners habrán de disponer de los métodos adecuados. Estos métodos se llamarán automáticamente cuando se produzca el evento. La forma de garantizar que los event listeners disponen de los métodos apropiados para gestionar los eventos es obligarles a implementar una determinada “interface” Listener. Las “interfaces” listener se corresponden con los tipos de eventos que se pueden producir. En los apartados siguientes se verán con más detalle los componentes que pueden recibir eventos, los distintos tipos de eventos y los métodos de las “interfaces” listener que hay que definir para gestionarlos. En este punto es muy importante ser capaz de buscar la información correspondiente en la documentación de JAVA. Las capacidades gráficas del AWT resultan pobres y complicadas en comparación con lo que se puede conseguir con Visual Basic, pero tienen la ventaja de poder ser ejecutadas casi en cualquier ordenador y con cualquier sistema operativo.

18.4. Proceso a seguir para crear una aplicación interactiva (orientada a eventos) Para avanzar un paso más, se resumen a continuación los pasos que se pueden seguir para construir una aplicación sencilla orientada a eventos, con “interface” gráfica de usuario: —

Determinar los componentes que van a constituir la “interface” de usuario (botones, cajas de texto, menús, etc.).

—

Crear una clase para la aplicación que contenga la función “main()”.

—

Crear una clase Ventana, sub-clase de Frame, que responda al evento WindowClosing(). La función “main()” deberá crear un objeto de la clase Ventana (en el que se van a introducir las componentes seleccionadas) y mostrarla por pantalla con el tamaño y posición adecuados.

—

Añadir al objeto Ventana todos los componentes y menús que deba contener. Se puede hacer en el constructor de la ventana o en el propio método “main()”.

—

Definir los objetos listener (objetos que se ocuparán de responder a los eventos, cuyas clases implementan las distintas “interfaces” listener) para cada uno de los eventos que deban estar soportados. En aplicaciones pequeñas, el propio objeto Ventana se puede ocupar de res-

Anexo III 6-77


ponder a los eventos de sus componentes. En programas más grandes se puede crear uno o más objetos de clases especiales para ocuparse de los eventos. —

Finalmente, se deben implementar los métodos de las “interfaces” Listener que se vayan a hacer cargo de la gestión de los eventos.

18.5. Relación entre componentes y eventos En la siguiente tabla se relacionan los componentes del AWT y los eventos específicos de cada uno; hay que tener en cuenta que los eventos propios de una superclase de componentes pueden afectar a los componentes de una subclase. COMPONENT

EVENTOS

SIGNIFICADO

GENERADOS

Button

ActionEvent

Clicar en el botón

Checkbox

ItemEvent

Seleccionar o deseleccionar un ítem

CheckboxMenuItem

ItemEvent


Choice

ItemEvent


ComponentEvent

Mover, cambiar tamaño, mostrar u ocultar un componente

FocusEvent

Obtener o perder el focus

KeyEvent

Pulsar o soltar una tecla

MouseEvent

Pulsar o soltar un botón del ratón; entrar o salir de un componente; mover o arrastrar el ratón (tener en cuenta que este evento tiene dos Listener)

ContainerEvent

Añadir o eliminar un componente de un “container”

ActionEvent

Hacer doble clic sobre un ítem de la lista

ItemEvent

Seleccionar o deseleccionar un ítem de la lista

MunuItem

ActionEvent

Seleccionar un ítem de un menú

Scrollbar

AdjustementEvent

Cambiar el valor de la scrollbar

TextComponent

TextEvent

Cambiar el texto

TextField

ActionEvent

Terminar de editar un texto pulsando Intro

Window

WindowEvent

Acciones sobre una ventana: abrir, cerrar, iconizar, restablecer e iniciar el cierre

Component

Container List

Anexo III 6-78

Lenguaje JAVA

En la siguiente tabla se especifican también los eventos específicos de sus superclases:

Eventos que se pueden generar AWT Components

Ation Adjust. Compn. Contai. Focus Event Event Even Even Even

Key Mouse Mousm. Text Window Even Even Even Even Even

*

*

*

*

*

Canvas

*

*

*

*

*

Checkbox

*

*

*

*

*

*

*

*

Button

*

Item Even

* *

Checkbox-MenuItem Choice

*

*

Component

*

*

*

*

*

Container

*

*

*

*

*

*

Dialog

*

*

*

*

*

*

*

Frame

*

*

*

*

*

*

*

Label

*

*

*

*

*

*

*

*

*

*

*

*

*

*

*

*

*

*

*

*

*

*

*

*

*

*

*

*

*

*

*

*

*

*

*

List

*

MenuItem

* *

Panel *

Scrollbar TextArea TextField

*

Window

*

*

*

*

*

*

18.6. Interfaces listener Una vez vistos los distintos eventos que se pueden producir, conviene ver cómo se deben gestionar estos eventos. A continuación se detalla cómo se gestionan los eventos según el modelo de JAVA:

Anexo III 6-79


Cada objeto que puede recibir un evento (event source), “registra” uno o más objetos para que los gestionen (event listener). Esto se hace con un método que tiene la forma:

eventSourceObject.addEventListener(eventListenerObject); Donde eventSourceObject es el objeto en el que se produce el evento, y eventListenerObject es el objeto que deberá gestionar los eventos. La relación entre ambos se establece a través de una “interface” Listener que la clase del eventListenerObject debe implementar. Esta “interface” proporciona la declaración de los métodos que serán llamados cuando se produzca el evento. La “interface” a implementar depende del tipo de evento. EVENTO

INTERFACE LISTENER

MÉTODOS

DE

LISTENER

ActionEvent

ActionListener

actionPerformed()

AdjustementEvent

AdjustementListener

adjustementValueChanged()

ComponentEvent

ComponentListener

componentHidden(), componentMoved(), componentResized(), componentShown()

ContainerEvent

ContainerListener

componentAdded(), componentRemoved()

FocusEvent

FocusListener

focusGained(), focusLost()

ItemEvent

ItemListener

itemStateChanged()

KeyEvent

KeyListener

keyPressed(), keyReleased(), keyTyped()

MouseListener

mouseClicked(), mouseEntered(), mouseExited(), mousePressed(), mouseReleased()

MouseMotionListener

mouseDragged(), mouseMoved()

TextListener

textValueChanged()

WindowListener

windowActivated(), windowDeactivated(), windowClosed(), windowClosing(), windowIconified(), windowDeiconified(), windowOpened()

MouseEvent

TextEvent

WindowEvent

En la tabla están relacionados los distintos tipos de eventos, con la “interface” que se debe implementar para gestionarlos y los métodos declarados en cada “interface”. Obsérvese que el nombre de la “interface” coincide con el nombre del evento, sustituyendo la palabra Event por Listener. Una vez registrado el objeto que gestionará el evento, perteneciente a una clase que implemente la correspondiente “interface” Listener, se deben

Anexo III 6-80

Lenguaje JAVA

definir los métodos de dicha “interface”. Siempre hay que definir todos los métodos de la “interface”, aunque algunos de dichos métodos puedan estar “vacíos”.

18.7. Clases Adapter JAVA proporciona ayudas para definir los métodos declarados en las “interfaces” Listener. Una de estas ayudas son las clases Adapter, que existen para cada una de las “interfaces” Listener que tienen más de un método. Su nombre se construye a partir del nombre de la “interface”, sustituyendo la palabra “Listener” por “Adapter”. Hay siete clases Adapter: —

ComponentAdapter

—

ContainerAdapter

—

FocusAdapter

—

KeyAdapter

—

MouseAdapter

—

MouseMotionAdapter

—

WindowAdapter

Las clases Adapter derivan de Object, y son clases predefinidas que contienen definiciones vacías para todos los métodos de la “interface”. Para crear un objeto que responda al evento, en vez de crear una clase que implemente la “interface” listener, basta crear una clase que derive de la clase Adapter correspondiente, y redefina sólo los métodos de interés.

19. Paseando por la Red Es muy sencillo acceder a archivos en la red utilizando JAVA. El paquete java.net dispone de varias clases e “interfaces” a tal efecto. En primer lugar, la clase URL nos permite definir un recurso en la red de varias maneras, por ejemplo:

URL url1 = new URL («http://www.rockar.com.ar/index.html»); URL url2 = new URL («http», «www.rockar.com.ar», «sbits.htm»); Por otra parte, podemos establecer una conexión a un URL dado mediante openConnection:

URLConnection conexion = url.openConnection(); Una vez lograda la conexión, podemos leer y escribir datos utilizando streams (corrientes de datos), como en el caso de manejo de archivos comunes (ver capítulo X). Un DataInputStream nos permite leer datos que llegan a través de la red, y un DataOutputStream nos permite enviar datos al host. Anexo III 6-81


Por ejemplo:

DataInputStream datos = new DataInputStream (corrienteEntrada); En nuestro caso, la corriente de entrada de datos proviene de la conexión al URL. El método getInputStream() del objeto URLConnection nos provee tal corriente:

DataInputStream datos = new DataInputStream(conex.getInputStream()) De este modo podemos escribir un pequeño programa para, por ejemplo, leer una página HTML desde una dirección arbitraria de internet. El programa, luego de compilarse mediante javac Lolo25.java, se ejecuta con java Lolo25 ; por ejemplo: java Lolo25 http://www.rockar.com.ar/index.html. import java.io.*;

import java.net.*;

public class Lolo25 { public static void main(String argv[]) { String s; try { URL url = new URL (argv[0]); URLConnection conex = url.openConnection(); System.out.println(«Cargando «+argv[0]); DataInputStream datos = new DataInputStream(conex.getInput am()); do { s = datos.readLine(); if (s != null) System.out.println(s); } while (s != null); } catch (ArrayIndexOutOfBoundsException e) { System.out.println(«Sintaxis: java Lolo25 »); } catch (UnknownHostException e) { System.out.println(«El host no existe o no responde»); } catch (Exception e) {e.printStackTrace();} } }

Anexo III 6-82

Stre-

Lenguaje JAVA

Este programa muestra el HTML como texto en la pantalla, pero podríamos grabarlo a un archivo para guardarlo. Inclusive, podríamos procesarlo a medida que lo recibimos, identificar los tags , guardarlos en un vector, y seguidamente conectarnos y bajar los links que figuran en la página original hasta bajar un site completo. Nótese que esto no sólo sirve para establecer conexiones a páginas HTML. En realidad, un URL puede referirse también a otros protocolos, como gopher, ftp, etcétera; si bien según la implementación de JAVA puede haber problemas para conectarse a algunos tipos de URL.

20. Los Sockets Los sockets (zócalos, referido a los enchufes de conexión de cables) son mecanismos de comunicación entre programas a través de una red TCP/IP. De hecho, al establecer una conexión via Internet estamos utilizando sockets: los sockets realizan la interfase entre la aplicación y el protocolo TCP/IP. Dichos mecanismos pueden tener lugar dentro de la misma máquina o a través de una red. Se usan en forma cliente-servidor: cuando un cliente y un servidor establecen una conexión, lo hacen a través de un “socket”. JAVA proporciona para esto las clases ServerSocket y Socket. Los “sockets” tienen asociado un port (puerto). En general, las conexiones via Internet pueden establecer un puerto particular (por ejemplo, en http://www.rockar.com.ar:80/index. html, el puerto es el 80). Esto casi nunca se especifica porque ya hay definidos puertos por defecto para distintos protocolos: 20 para ftp-data, 21 para ftp, 79 para finger, etc. Algunos servers pueden definir otros puertos, e inclusive pueden utilizarse puertos disponibles para establecer conexiones especiales. Justamente, una de las formas de crear un objeto de la clase URL permite especificar también el puerto:

URL url3 = new URL («http», «www.rockar.com.ar», 80,»sbits.htm»); Para establecer una conexión a través de un socket, tenemos que programar por un lado el servidor y por otro los clientes. En el servidor creamos un objeto de la clase ServerSocket y luego esperamos algún cliente (de clase Socket) mediante el método accept():

ServerSocket conexion = new ServerSocket(5000); // 5000 es el puerto en este caso Socket cliente = conexion.accept(); // espero al cliente Desde el punto de vista del cliente, necesitamos un Socket al que le indiquemos la dirección del servidor y el número de puerto a usar:

Socket conexion = new Socket (direccion, 5000);

Anexo III 6-83


Una vez establecida la conexión, podemos intercambiar datos usando streams como en el ejemplo anterior. Como la clase URLConnection, la clase Socket dispone de métodos getInputStream y getOutputStream que nos dan respectivamente un InputStream y un OutputStream a través de los cuales transferir los datos.

21. El JAVA Development Kit El kit de desarrollo de JAVA consiste en un compilador y herramientas de desarrollo para crear tanto programas independientes como Applets. Desarrollado por Sun Microsystems, los creadores de JAVA. Esencial para todo programador de JAVA. El entorno básico del JDK de JAVA que proporciona Sun está formado por herramientas en modo texto, que son: java, intérprete que ejecuta programas en byte-code. javac, compilador de JAVA que convierte el código fuente en byte-code. javah, crea ficheros de cabecera para implementar métodos para cualquier clase. javap, es un descompilador de byte-code a código fuente JAVA. javadoc, es un generador automático de documentos HTML a partir del código fuente JAVA. javaprof, es un profiler para aplicaciones de un solo “thread”. HotJAVA, es un navegador Web escrito completamente en JAVA. El entorno habitual, pues, consiste en un navegador que pueda ejecutar Applets, un compilador que convierta el código fuente JAVA a byte-code y el intérprete JAVA para ejecutar los programas. Estos son los componenetes básicos para desarrollar algo en JAVA. No obstante se necesita un editor para escribir el código fuente, y no son estrictamente necesarias otras herramientas como el debugger, un entorno visual, la documentación o un visualizador de jerarquía de clases. JDK es el acrónimo de «JAVA Development Kit», es decir Kit de desarrollo de JAVA. Se puede definir como un conjunto de herramientas, utilidades, documentación y ejemplos para desarrollar aplicaciones JAVA.

21.1. Componentes del JDK JDK consta de una serie de aplicaciones y componentes, para realizar cada una de las tareas de las que es capaz de encargarse. —

Intérprete en tiempo de ejecución (JRE).

—

Compilador.

—

Visualizador de applets.

—

Depurador.

—

Desensamblador de archivo de clase.

—

Generador de cabecera y archivo de apéndice.

Anexo III 6-84

Lenguaje JAVA

—

Generador de documentación.

—

Applets de demostración.

—

Código fuente la API.

Anexo III 6-85

Anexo IV Visual Basic.Net


Guión-resumen

1. Introducción a VB.Net

7. Entrada / Salida

2. Comentarios

8. Clases en VB.Net

3. Variables

9. Assembly (ensamblado)

4. Operadores

10. Espacios de nombres (Namespace)

5. Sentencias o expresiones

11. Excepciones

6. Arrays

Anexo IV 6-2

Visual Basic.Net

1.

Introducción a VB.Net

Desde que Microsoft liberó Visual Basic 1.0 en 1991 han tenido lugar muchos cambios. Visual Basic 1.0 revolucionó la forma de desarrollar software para Windows, desmitificó el proceso de desarrollo de aplicaciones con interfaz gráfica del usuario y abrió este tipo de programación a las masas. En sus posteriores versiones, Visual Basic ha continuado proporcionando nuevas y nuevas características que facilitaron la creación de aplicaciones para Windows cada vez más potentes; por ejemplo la versión 3.0 introdujo el control de datos para facilitar el acceso a Bases de datos y la versión 4.0 mejoró y potenció este acceso con los objetos ADO. Con la aparición de Windows 95, Microsoft liberó Visual Basic 4.0 que abrió la puerta al desarrollo de aplicaciones de 32 bits y a la creación de DLL. La Versión 5.0 mejoró la productividad con la incorporación de la ayuda inteligente y a introducción de los controles ActiveX. Finalmente la versión 6.0 nos introdujo en la programación de Internet con las aplicaciones DHTML y el objeto Web-Class. Y ahora disponemos de la versión 7.0, o simplemente Visual Basic.NET que viene a revolucionar el mundo de las comunicaciones permitiendo escribir aplicaciones escalables para Internet. Y por supuesto, totalmente orientado a objetos, como su homónimo JAVA. La palabra «Visual» hace referencia, desde el lado del diseño, al método que le utiliza para crear la interfaz gráfica de usuario si se dispone de la herramienta adecuada (con Microsoft Visual Studio .NET se utiliza el ratón para arrastrar y colocar los objetos prefabricados en el lugar deseado dentro de un formulario). Y desde el lado de la ejecución, al aspecto gráfico que toman los objetos cuando se ejecuta el código que los crea, objetos que formarán la interfaz gráfica que el usuario de la aplicación utiliza para acceder a los servicios que esta ofrece. La palabra «Basic» hace referencia al lenguaje BASIC (Beginners AllPurpose Symbolic Instruction Code), un lenguaje utilizado por más programadores que ningún otro lenguaje en la historia de la informática. Visual Basic ha evolucionado a partir del lenguaje BASIC original y ahora contiene centenares de instrucciones, funciones y palabras clave, muchas de las cuales están directamente relacionadas con la interfaz gráfica de Windows. La palabra «NET» hace referencia al ámbito donde operarán nuestras aplicaciones (Network). Visual Basic.NET proporciona la tecnología necesaria para saltar desde el desarrollo de aplicaciones Empleado-servidor tradicionales a la siguiente generación de aplicaciones escalables para la Web, introduciendo algunos conceptos nuevos, como ensamblados, formularios Web, servicios Web, ADO.NET y .NET Framework. Es importante saber también que la inversión realizada en el aprendizaje de Visual Basic ayudará a abarcar otras áreas, porque este lenguaje de programación es utilizado también por Microsoft Excel, Microsoft Access y muchas otras aplicaciones Windows.

1.1.

Extensión de los ficheros de código

En Visual Basic .NET, a diferencia de lo que ocurría en las versiones anteriores de Visual Basic, solo existe un tipo de fichero de código, el cual tiene la extensión .vb. En este tipo de fichero pueden coexistir distintos tipos de elementos (por ejemplo: un módulo de clase, un formulario, un módulo de Anexo IV 6-3


código, un control, etc.), mientras que en las versiones anteriores de Visual Basic, cada uno de estos elementos tenían su propio tipo de fichero con su respectiva extensión.

1.2.

Tipos de ejecutables

Como sucede con JAVA, en Visual Basic .NET puede crear básicamente estos dos tipos de ejecutables: •

Consola.

•

Gráficos, con una interfaz gráfica (GUI).

Existen otros tipos de aplicaciones que se pueden crear con Visual Basic .NET: aplicaciones ASP.NET, servicios Web, servicios Windows, controles, componentes, DLL’s, etc.

2.

Comentarios

Los comentarios empiezan por una comilla simple (apóstrofe). En los comentarios podemos poner lo que queramos, con la seguridad de que no será tenido en cuenta por el Visual Basic. Los comentarios solo pueden ocupar una línea, salvo que dicha línea al final tenga el signo _ (guión bajo), lo cual indica al Entorno de Desarrollo (IDE) que se quiere continuar en la siguiente línea. Ese símbolo se puede llamar «continuador de línea» y lo podemos usar siempre que queramos, no sólo para los comentarios. Los comentarios también se pueden hacer con la palabra reservada Rem, aunque se encuentra en desuso, viene de versiones anteriores.

3.

Variables

Existen distintos tipos de datos que VB.NET maneja. No es obligatorio declarar las variables según el tipo de datos que va a almacenar. Para declarar una variable se usa la sintaxis:

Especificador_acceso Nombre_variable Tipo Ejemplos: Dim i As Integer

Private x As Double

Public cad As String

Los especificadores de acceso los veremos más adelante; aquí veremos los diferentes tipos que puede tomar una variable. Recuerde que son los tipos básicos, ya que en la programación orientada a objetos, nosotros nos podemos crear nuestros propios tipos compuestos (clases).

Anexo IV 6-4

Visual Basic.Net

TIPO

3.1.

DE

VISUAL BASIC

ESPACIO

DE MEMORIA QUE OCUPA

Boolean

2 bytes

Byte

1 byte

Char

2 bytes

Date

8 bytes

Decimal

16 bytes

Double

8 bytes

Integer

4 bytes

Long (entero largo)

8 bytes

Object

4 bytes

Short (entero corto)

2 bytes

Single

4 bytes

Options

Se pueden declarar variables sin tipo específico: Dim x, que en realidad es como si se hubiese declarado del tipo Object, (As Object), por tanto aceptará cualquier tipo de datos. Los options permiten decirle al compilador una serie de parámetros sobre restricciones. Deben ir en el fichero de código al principio del mismo. Visual Basic no obliga a que se declaren todas las variables que vayamos a usar. La instrucción Option Explicit obliga a que declaremos las variables. Con Option Strict On, obligará a que los tipos de datos que uses sean del tipo adecuado. Por ejemplo, con el Option Strict On no podemos hacer esto:

Dim c As Char = «TAI», ya que «TAI» es del tipo String. La instrucción Option Compare dependerá de si se quiere que las cadenas se comparen diferenciando las mayúsculas de las minúsculas o no. Con el valor Binary se diferencian las mayúsculas de las minúsculas y con el otro valor, Text, no se hace ningún tipo de distinción. Las variables se pueden declarar de dos formas: •

Declarando la variable y dejando que VB asigne el valor por defecto.

•

Declarando la variable y asignándole el valor inicial que queramos que tenga. Anexo IV 6-5


Por defecto, cuando no se asigna un valor a una variable, éstas contendrán los siguientes valores, dependiendo del tipo de datos que sea: •

Las variables numéricas tendrán un valor 0.

•

Las cadenas de caracteres una cadena vacía: «»

•

Las variables Boolean un valor False

•

Las variables de tipo Objeto tendrán un valor Nothing.

Por ejemplo: Dim i As Integer Tendrá un valor inicial de 0 Pero si queremos que inicialmente valga 27, podemos hacerlo de cualquiera de estas dos formas: Dim i As Integer i = 27

Dim i As Integer = 27

Las constantes se declaran: Const x As Integer = 7 Para declarar una constante de tipo String, lo haremos de esta forma: Const cad As String = «TAI». De igual manera, para declarar una variable de tipo String y que contenga un valor, lo haremos de esta forma: Dim Nombre As String = «Holita». Podemos usar cualquier constante o variable en las expresiones, e incluso, podemos usar el resultado de esa expresión para asignar un valor a una variable. Por ejemplo:

Dim x As Integer = 27 Dim i As Integer i=x*2

3.2. Funciones de conversión Existen unas funciones de conversión, que sirven para pasar datos de un tipo a otro. Por tanto, esto: i = Val(«10 * 25») es lo mismo que esto otro: i = Val(«10») En este caso, usamos la función Val para convertir una cadena en un número, pero ese número es del tipo Double y si tenemos Option Strict On, no nos dejará convertirlo en un Integer. Para solucionarlo, usaremos la función CType: i = CType(Val(«10 * 25»), Integer).

Anexo IV 6-6

Visual Basic.Net

Con esto le estamos diciendo al VB que primero convierta la cadena en un número mediante la función Val (que devuelve un número de tipo Double), después le decimos que ese número Double lo convierta en un valor Integer. Funciones de conversión de tipos: NOMBRE

DE LA FUNCIÓN

TIPO

DE DATOS QUE DEVUELVE

CBool(expresion)

Boolean

CByte(expresion)

Byte

CChar(expresion)

Char

CDate(expresion)

Date

CDbl(expresion)

Double

CDec(expresion)

Decimal

CInt(expresion)

Integer

CLng(expresion)

Long

CObj(expresion)

Object

CShort(expresion)

Short

CSng(expresion)

Single

CStr(expresion)

String

CType(expresion, Tipo)

El indicado en el segundo parámetro

Val(expresion)

Double

Fix(expresion)

Depende del tipo de datos de la expresión

Int(expresion)

Depende del tipo de datos de la expresión

Aunque si esos números son negativos, Fix devuelve el siguiente valor igual o mayor que el número indicado, mientras que Int lo hace con el primer número menor o igual. Por ejemplo: Fix(-8.4) devuelve -8, mientras que Int(-8.4) devolverá -9. En caso de que sean positivos, las dos funciones devuelven el mismo valor:

Int(8.4) devuelve 8, lo mismo que Fix(8.4). Podemos declarar varios tipos de variables en una misma línea: Dim i As Integer, s As String.

Anexo IV 6-7


En este caso, tenemos dos variables de dos tipos distintos, cada una con su As tipo correspondiente, pero separadas por una coma: Dim j, k As Integer, cad1, Nombre As String, d1 As Decimal. En esta ocasión, las variables “j” y “k” son del tipo Integer, las variables cad1 y Nombre del tipo String y, por último, la variable d1 es de tipo Decimal. No se permite la inicialización explícita con varios declaradores. Ejemplo: Dim i, j As Integer=10 dara error. Deberíamos hacerlo de esta otra forma: Dim i As Integer, j As Integer = 1. No tienen por qué ser del mismo tipo:

Dim x As Integer = 25, cad1, cad2 As Long, cad3 As String = «TAI», d2, d3 As Decimal Que sería lo mismo que:

Dim x As Integer = 25 Dim cad1, cad2 As Long Dim cad3 As String = «TAI» Dim d2, d3 As Decimal

3.3. Visibilidad de las variables Las variables declaradas dentro de un procedimiento se dicen que son «locales» a ese procedimiento y, por tanto, sólo visibles (o accesibles) dentro del procedimiento en el que se ha declarado. Al mismo tiempo, una variable local puede ocultar a otra variable. Cuando se declara una variable dentro de un procedimiento (Sub, función o propiedad), esa variable oculta a otras variables que, teniendo el mismo nombre, pudieran existir a nivel de módulo o a un nivel «superior».

Anexo IV 6-8

Visual Basic.Net

ÁMBITO

DE LAS VARIABLES LOCALES

Option Strict On Module Module1 ‘ Variable declarada a nivel de módulo Dim n As Integer = 15 Sub Main() ‘ Variable declarada a nivel de procedimiento Dim i As Long = 10 ‘ Esto mostrará que n vale 15 Console.WriteLine(«El valor de n es: {0}», n) Console.WriteLine(«El valor de i es: {0}», i) Console.ReadLine() End Sub Sub func() ‘ Esto mostrará que n vale 15 Console.WriteLine(«El valor de n es: {0}», n) ‘ Error, ya que la variable i no está declarada Console.WriteLine(«El valor de i es: {0}», i) Console.ReadLine() End Sub End Module

VARIABLES

QUE OCULTAN A OTRAS VARIABLES

Option Strict On Module Module1 ‘ Variable declarada a nivel de módulo Dim n As Integer = 27 Sub Main() ‘Mostrará n como 27 Console.WriteLine(«El valor de n Main es: {0}», n) ‘ Console.ReadLine() End Sub Sub func() Dim n As Long = 7 ‘ Mostrará n como 7 Console.WriteLine(«El valor de n func es:{0}», n) Console.ReadLine() End Sub End Module

4. Operadores Los operadores VB.NET se dividen en las siguientes categorías: aritméticos, relacionales y condicionales, lógicos y de desplazamiento y de asignación. A) Operadores Aritméticos OPERADOR

USO

DESCRIPCIÓN

+

obj1 + op2

Suma obj1 y op2

-

obj1 - op2

Resta op2 de obj1

*

obj1 * op2

Multiplica obj1 y op2

/

obj1 / op2

Divide decimal o flotante

Mod

obj1 Mod op2

Módulo

\

obj1 \ op2

División entera

&

cad1&cad2

Concatenación de cadenas

^

obj1 ^ op2

Exponenciación

Anexo IV 6-9


Los operadores + y - tienen versiones unarias que seleccionan el signo del operando: OPERADOR

USO

DESCRIPCIÓN

+

+ op

Indica un valor positivo

-

- op

Niega el operando

Además, existen dos operadores de atajos aritméticos, ++ que incrementa en uno su operando, y — que decrementa en uno el valor de su operando. OPERADOR

USO

++

DESCRIPCIÓN

op ++

Incrementa op en 1; evalúa el valor antes de incrementar

++

++ op

Incrementa op en 1; evalúa el valor después de incrementar

—

op —

Decrementa op en 1; evalúa el valor antes de decrementar

—

— op

Decrementa op en 1; evalúa el valor después de decrementar

B) Operadores relacionales y condicionales Los valores relacionales comparan dos valores y determinan la relación entre ellos. Por ejemplo, <> devuelve true si los dos operandos son distintos. OPERADOR

USO

DEVUELVE

>

obj1 > op2

obj1 es mayor que op2

>=

obj1 >= op2

obj1 es mayor o igual que op2

<

obj1 < op2

obj1 es menor que op2

<=

obj1 <= op2

obj1 es menor o igual que op2

==

obj1 == op2

obj1 y op2 son iguales

<>

obj1 <> op2

obj1 y op2 son distintos

TRUE SI

Aquí tiene tres operadores condicionales: OPERADOR

Anexo IV 6-10

USO

DEVUELVE

TRUE SI

And

obj1 And op2

obj1 y op2 son verdaderos

Or

obj1 Or op2

uno de los dos es verdadero

Not

Not op

op es falso

Visual Basic.Net

C) Operadores de asignación Puede utilizar el operador de asignación =, para asignar un valor a otro. Además del operador de asignación básico, VB proporciona varios operadores de asignación que permiten realizar operaciones aritméticas, lógicas o de bits y una operación de asignación al mismo tiempo.

+=

-=

*=

/=

\=

5. Sentencias o expresiones Las expresiones realizan el trabajo de un programa VB. Entre otras cosas, las expresiones se utilizan para calcular y asignar valores a las variables y para controlar el flujo de un programa VB. El trabajo de una expresión se divide en dos partes: realizar los cálculos indicados por los elementos de la expresión y devolver algún valor. Una expresión es, por tanto, una serie de variables, operadores y llamadas a métodos (construida de acuerdo a la sintaxis del lenguaje) que evalúa a un valor sencillo. Si deseamos que en una misma línea aparezcan dos o más expresiones, podemos hacerlo separándolas por el carácter “:”. Ejemplo: x=7 : y=x+5

5.1.

Bifurcaciones

Las bifurcaciones permiten ejecutar una de entre varias acciones en función del valor de una expresión lógica o relacional. Se tratan de estructuras muy importantes ya que son las encargadas de controlar el flujo de ejecución de un programa. Existen dos bifurcaciones diferentes: “if” y “select case”. A) If • Bifurcación if end if Esta estructura permite ejecutar un conjunto de sentencias en función del valor que tenga la expresión de comparación (se ejecuta si la expresión de comparación tiene valor true). Tiene la forma siguiente: if (expresión_booleana) then SENTENCIAS end if • Bifurcación if else end if Análoga a la anterior, de la cual es una ampliación. Las sentencias incluidas en el else se ejecutan en el caso de no cumplirse la expresión de comparación (false). Anexo IV 6-11


if (expresión_booleana) then SENTENCIAS 1 else SENTENCIAS 2 end if • Bifurcación if elseif else Permite introducir más de una expresión de comparación. Si la primera condición no se cumple, se compara la segunda y así sucesivamente. En el caso de que no se cumpla ninguna de las comparaciones se ejecutan las sentencias correspondientes al “else”.

if (expresión_booleana) then instrucción_si_true if (expresión_booleana) then instrucciones_si_true else instrucciones_si_false end if

if (expresión_booleana1) then SENTENCIAS 1 elseif (expresión_booleana2) then SENTENCIAS 2 elseif (expresión_booleana3) then SENTENCIAS 3 else SENTENCIAS 4 End if

B) Sentencia Select Case

Select case (expresión) case (valor1) instrucciones_1 case (valor2) instrucciones_2 ….. case (valorN) instrucciones_N case else instrucciones_por_defecto End Select

Anexo IV 6-12

Select case (expression) case value1 SENTENCIAS case value2, value 22 SENTENCIAS case Is >22 SENTENCIAS case value4 SENTENCIAS case value5 SENTENCIAS case value6 SENTENCIAS [case else: sentencias] End Select

Visual Basic.Net

5.2.

Bucles

• Bucle while Permite ejecutar un grupo de instrucciones mientras se cumpla una condición dada: while (expresión_booleana) instrucciones… end while Por ejemplo: Dim i As Integer ‘ While i < 10 Console.WriteLine(i) i=i+1 End While

Dim n As Integer = 3 i=1 While i = 10 * n ‘ no se repetirá ninguna vez End While

• Bucle for La forma general del “bucle for” es la siguiente: For variable = valor_inicial To valor_final [Step incremento o decremento] … Next For i = 1 To 10 … Next

For i = 1 To 100 Step 2 … Next

For i = 10 To 1 Step -1 … Next

For i = 100 To 1 Step -10 … Next

For Each, este bucle repetirá o iterará por cada uno de los elementos contenidos en una colección. La forma de usarlo es: For Each variable In colección del tipo de la variable …. Next

Anexo IV 6-13


Ejemplos: Dim cad As String For Each cad In «Somos los aprobados de TAI 2005, el que nos hayan hecho machacar VB no nos va a apartar de nuestro aprobado» Console.WriteLine(cad) Next Console.ReadLine() • Bucle do while y do until Es similar al “bucle while” pero con la particularidad de que el control está al final del “bucle” (lo que hace que el bucle se ejecute al menos una vez, independientemente de que la condición se cumpla o no). Una vez ejecutados las sentencias, se evalúa la condición: si resulta “true” se vuelven a ejecutar las sentencias incluidas en el “bucle”, mientras que si la condición se evalúa a false finaliza el “bucle”. Este tipo de bucles se utiliza con frecuencia para controlar la satisfacción de una determinada condición de error o de convergencia. Do While (expresión_booleana) … Loop

Do Until (expresión_booleana) … Loop

Do … Loop While (expresión_booleana)

Do … Loop Until (expresión_booleana)

Ejemplos: i=0 Do Until i > 9 Console.WriteLine(i) i=i+1 Loop

i=0 Do While Not (i > 9) Console.WriteLine(i) i=i+1 Loop

Este bucle se repetirá para valores de i desde 0 hasta 9 (ambos inclusive).

Para poder abandonar un bucle, hay que usar la instrucción Exit seguida del tipo de “bucle” que queremos abandonar:

Exit For Exit While Exit Do Anexo IV 6-14

Visual Basic.Net

6.

Arrays

Los tipos de datos de las variables usadas como “array”, pueden ser de cualquier tipo, dependiendo de lo que queramos guardar. Se puede crear un “array” de un tipo que nosotros hayamos definido o de cualquier clase que exista en el .NET Framework.

6.1.

Declarar variables como arrays

Para poder indicarle al VB que nuestra intención es crear un “array” podemos hacerlo de dos formas distintas, para este ejemplo crearemos un array de tipo Integer: •

La clásica: Dim x() As Integer

•

La nueva forma introducida en .NET: Dim x As Integer()

De cualquiera de estas dos formas estaríamos creando un “array” de tipo Integer llamada x. Cuando declaramos una variable de esta forma, solo le estamos indicando al VB que nuestra intención es que la variable x sea un “array” de tipo Integer, pero ese “array” no tiene reservado ningún espacio de memoria.

6.2.

Reservar memoria para un array Para poder hacerlo tenemos que usar la instrucción ReDim: ReDim x(5) Al ejecutarse este código, tendremos un array con capacidad para 6 elementos.

En .NET Framework el índice menor de un array siempre es cero y en Visual Basic, el índice superior es el indicado entre paréntesis. Por tanto el “array” a tendrá reservada memoria para 6 valores de tipo Integer, los índices serían desde 0 hasta 5 ambos inclusive. Además de usar ReDim, que realmente sirve para «redimensionar» el contenido de un “array”, es decir, para volver a dimensionarlo o cambiarlo por un nuevo valor. Si sabemos con antelación el tamaño que contendrá el array, podemos hacerlo de esta forma: Dim x(5) As Integer Con este código estaríamos declarando la variable x como un “array” de 6 elementos (de 0 a 5) del tipo Integer. Cuando indicamos la cantidad de elementos que contendrá el “array” no podemos usar la segunda forma de declaración que te mostré anteriormente: Dim x As Integer(5) ya que esto produciría un error sintáctico. Cuando tenemos un “array” declarado y asignado, podemos acceder a los elementos de ese “array” mediante un índice, nos será de utilidad saber cuantos elementos tiene el “array”, para ello podemos usar la propiedad Length, la

Anexo IV 6-15


cual devuelve el número total de elementos, por tanto, esos elementos estarán comprendidos entre 0 y Length - 1.

For i = 0 To x.Length - 1 Console.WriteLine(x(i)) Next

6.3.

Inicializar un array al declararla

Al igual que las variables normales se pueden declarar y al mismo tiempo asignarle un valor inicial, con los “arrays” también podemos hacerlo, pero de una forma diferente, ya que no es lo mismo asignar un valor que varios. Aunque hay que tener presente que si inicializamos un “array” al declararla, no podemos indicar el número de elementos que tendrá, ya que el número de elementos estará supeditado a los valores asignados. Ejemplo: Dim x() As Integer = {1, 42, 15, 90, 2} También podemos hacerlo de esta otra forma: Dim x As Integer() = {1, 42, 15, 90, 2} Usando cualquiera de estas dos formas mostradas, el número de elementos será 5; por tanto los índices irán desde 0 hasta 4. Otros Ejemplos:

Dim cad As String() = {«TAI», «de «, «ADAMS», «los», “mejores”} Dim i As Integer For i = 0 To cad.Length - 1 Console.WriteLine(cad(i)) Next • Usar un bucle For Each para recorrer los elementos de un array El tipo de “bucle For Each” es muy útil para recorrer los elementos de un “array” sin indicar el índice.

Dim x() As Integer = {1, 2, 3, 4, 5} ‘ Console.WriteLine(«Elementos del array x()= {0}», x.Length) ‘ Dim i As Integer For Each i In x Console.WriteLine(i) Next Anexo IV 6-16

Visual Basic.Net

Los “arrays” son tipos por referencia en lugar de tipos por valor. El contenido de los arrays son tipos por referencia.

6.4.

Copiar los elementos de un array en otro array

La única forma de tener copias independientes de dos “arrays” que contengan los mismos elementos es haciendo una copia de un “array” a otro. Esto lo podemos hacer mediante el método CopyTo, al cual habrá que indicarle el array de destino y el índice de inicio a partir del cual se hará la copia. Sólo aclarar que el destino debe tener espacio suficiente para recibir los elementos indicados por tanto deberá estar inicializado con los índices necesarios. Ejemplo:

Dim x() As Integer = {1, 2, 3, 4, 5} Dim y(x.Length - 1) As Integer ‘ x.CopyTo(y, 0) ‘ x(3) = 7 ‘ Dim i As Integer For i = 0 To x.Length - 1 Console.WriteLine(«x(i) = {0}, y(i)= {1}», x(i), y(i)) Next En este ejemplo, inicializamos un “array”, declaramos otro con el mismo número de elementos, utilizamos el método CopyTo del array con los valores, en el parámetro le decimos qué array será el que recibirá una copia de esos datos y la posición (o índice) a partir de la que se copiarán los datos, (indicando cero se copiarán todos los elementos); después cambiamos el contenido de uno de los elementos del “array” original y al mostrar el contenido de ambos “arrays”, comprobamos que cada uno es independiente del otro. Para declarar un array multidimensional, lo podemos hacer (al igual que con las unidimensionales), de varias formas, dependiendo de que simplemente declaremos el array, que le indiquemos (o reservemos) el número de elementos que tendrá o de que le asignemos los valores al mismo tiempo que la declaramos. Veamos ejemplos: Dim x() As Integer

Dim z(,,) As Integer

Dim u(1, 6) As Integer

Dim w() As Integer = {1, 2}

Dim y(,) As Integer

Dim t(2) As Integer

Dim v(3, 1, 5, 2) As Integer

Dim r(,) As Integer={{1,2},{4}}

Anexo IV 6-17


6.5.

Cambiar el tamaño de un array

Si deseamos cambiar el tamaño de un “array” manteniendo los valores que tuviese, debemos usar ReDim seguida de la palabra clave Preserve: Dim x() As Integer = {1, 2, 3, 4, 5} Si queremos que en lugar de 5 elementos (de 0 a 4) tenga, por ejemplo 10 y no perder los otros valores, usaremos la siguiente instrucción: ReDim Preserve x(10) A partir de ese momento, el array tendrá 11 elementos (de 0 a 10), los 5 primeros con los valores que antes tenía y los nuevos elementos tendrán un valor cero, que es el valor por defecto de los valores numéricos. Si solo usamos ReDim a(10), también tendremos once elementos en el “array”, pero todos tendrán un valor cero; es decir, si no se usa Preserve, se pierden los valores contenidos en el “array”. Observaciones:

6.6.

•

Sólo podemos cambiar el número de elementos de la última dimensión del “array”.

•

Podemos usar ReDim para cambiar el número de elementos de cada una de las dimensiones.

•

Podemos usar ReDim Preserve para cambiar el número de elementos de la última dimensión sin perder los valores que previamente hubiera.

•

No podemos cambiar el número de dimensiones de un “array”.

Eliminar un array de la memoria

Si en algún momento del programa queremos eliminar el contenido de un “array”, por ejemplo para que no siga ocupando memoria, ya que es posible que no siga ocupando memoria, podemos usar Erase seguida del “array” que queremos «limpiar», por ejemplo: Erase x. Esto eliminará el contenido del “array x”. Si después de eliminar el contenido de un “array” queremos volver a usarlo, tendremos que ReDimensionarlo con el mismo número de dimensiones que tenía, ya que Erase sólo borra el contenido, no la definición del “array”.

7.

Entrada / Salida

Las clases son la base del lenguaje Visual Basic.NET que viene dada por la biblioteca .NET. En ella, hay un espacio de nombres que destaca por las clases de propósito general que incluye: System. El espacio de nombres System contiene clases que se aplican al lenguaje mismo. Por ejemplo, estructuras que encapsulan los tipos primitivos de datos, la clase Console que proporciona los métodos para

Anexo IV 6-18

Visual Basic.Net

manipular la entrada/salida (E/S) estándar, la clase String para manipular cadenas de caracteres, una clase Math que proporciona los métodos correspondientes a las funciones matemáticas de uso más frecuente, etc. La entrada/salida queda reforzada con la funcionalidad aportada por la clase System.IO que, a su vez, aporta clases para el manejo de ficheros. Frecuentemente un programa necesitará obtener información desde un origen o enviar información a un destino. Por ejemplo, obtener información desde el teclado, o bien enviar información a la pantalla. La comunicación entre el origen de cierta información y el destino, se realiza mediante un flujo de información (en inglés stream). Un flujo es un objeto que hace de intermediario entre el programa y el origen o el destino de la información. Cuando un programa Visual Basic.NET se ejecuta, se abren automáticamente tres flujos identificados por las propiedades de la clase Console indicadas a continuación: •

Un flujo desde la entrada estándar (el teclado): In.

•

Un flujo hacia la salida estándar (la pantalla): Out.

•

Un flujo hacia la salida estándar de error (la pantalla): Error.

La propiedad In hace referencia a un objeto de la clase System.IO. TextReader y las propiedades Out y Error hacen referencia a objetos de la clase System.IO.TextWriter.

7.1.

Flujos de entrada

Cuando un programa define un flujo de entrada, por ejemplo, el definido por la propiedad In de la clase Console, dicho programa es destino de ese flujo de caracteres, y eso es todo lo que se necesita saber. Dos métodos que tienen un especial interés porque permiten a un programa leer datos de la entrada estándar son: —

Public Shared Function Read() As Integer.

—

Public Shared Function ReadLine() As String.

El método Read simplemente lee caracteres individuales del flujo de entrada estándar; concretamente lee el siguiente carácter disponible. Devuelve un entero (Integer) correspondiente al código del carácter leído, o bien un valor negativo cuando en un intento de leer se alcanza el final del flujo.

7.2.

Flujos de salida

La propiedad Out de la clase Console define un flujo de salida. Los dos métodos que permiten a un programa escribir en la salida estándar son: Anexo IV 6-19


—

Overloads Public Shared Sub Write(parametros).

—

Overloads Public Shared Sub WriteLine(parametros).

Por ejemplo, el siguiente código lee un carácter del origen vinculado con el flujo In (entrada estándar) y lo imprime a través del flujo de salida.

Imports System Module Lee Sub Main() Dim c As Char Console.Write(«Introduzca un caracter: «) c=Convert.Tochar(System.Console.Read()) Console.WriteLine(c) End Sub End Module

8.

Clases en VB.Net

Todo .NET Framework está basado en clases (u objetos). A diferencia de las versiones anteriores de Visual Basic, la versión .NET de este lenguaje basa su funcionamiento casi exclusivamente en las clases contenidas en .NET Framework. Un programa orientado a objetos se compone solamente de objetos, cada uno de ellos es una entidad que tiene unas propiedades, los atributos, y unas formas de operar con ellas; los métodos. Los atributos definen el estado de cada uno de los objetos de esa clase y los métodos su comportamiento. No obstante, más adelante recalcaremos estos detalles. Todo lo que tiene el .NET Framework, en realidad son clases. Cuando definimos una clase, realmente estamos definiendo dos cosas diferentes: •

Los datos que dicha clase puede manipular o contener.

•

La forma de acceder a esos datos.

Por ejemplo, si tenemos una clase de tipo Empleado, por un lado tendremos los datos de dicho Empleado y por otro la forma de acceder o modificar esos datos. En el primer caso, los datos del Empleado, como por ejemplo el nombre, domicilio etc., estarán representados por una serie de campos o propiedades, mientras que la forma de modificar o acceder a esa información del Empleado se hará por medio de métodos. Esas propiedades o características y las acciones a realizar son las que definen a una clase. La clase es la «plantilla» a partir de la cual podemos crear un objeto en la memoria. Podemos tener varias instancias en memoria de una clase. Una instancia es un objeto (los datos) creado a partir de una clase (la plantilla o el código). El siguiente podría ser el esquema gráfico de un objeto: Anexo IV 6-20

Visual Basic.Net

8.1.

Los miembros de una clase

Las clases contienen datos, esos datos son variables. A esas variables, cuando pertenecen a una clase, se les llama campos o propiedades. Por ejemplo, el nombre de un Empleado sería una propiedad de la clase Empleado. Ese nombre lo almacenaremos en una variable de tipo String; de dicha variable podemos decir que es el «campo» de la clase que representa al nombre del Empleado. Por otro lado, si queremos mostrar el contenido de los campos que contiene la clase Empleado, usaremos un procedimiento que nos permita mostrarlos; ese procedimiento será un método de la clase Empleado. Por tanto, los miembros de una clase son las propiedades (los datos) y los métodos las acciones a realizar con esos datos. Sabemos que podemos almacenar esa información (en las propiedades de la clase) y que tenemos formas de acceder a ella (mediante los métodos de dicha clase).

ATRIBUTOS

MÉTODOS

8.2.

MENSAJES (EVENTOS)

Crear o definir una clase

Para crear una clase debemos usar la instrucción Class seguida del nombre que tendrá dicha clase y debe de ser cerrada usando End Class:

Class Empleado ‘propiedades de la clase ‘métodos de la clase End Class

8.3.

Definir los miembros de una clase

Para definir los miembros de una clase, escribiremos dentro del «bloque» de definición de la clase, las declaraciones y procedimientos que creamos convenientes. Veamos un ejemplo:

Class Empleado Public Nombre As String Sub Mostrar() Console.WriteLine(«El nombre del Empleado: {0}», Nombre) End Sub End Class Anexo IV 6-21


En este caso, la línea Public Nombre As String, estaría definiendo una propiedad o «campo» público de la clase Empleado. Por otro lado, el procedimiento Mostrar sería un método de dicha clase; en esta caso, nos permitiría mostrar la información contenida en la clase Empleado.

8.4.

Crear un objeto a partir de una clase

Definimos una variable capaz de contener un objeto del tipo de la clase; esto lo haremos como con cualquier variable: Dim obj_empl As Empleado. Para poder crear un objeto basado en una clase, necesitamos algo más de código que nos permita «crear» ese objeto en la memoria, ya que con el código usado en la línea anterior, simplemente estaríamos declarando una variable que es capaz de contener un objeto de ese tipo, pero aún no existe ningún objeto en la memoria; para ello tendremos que usar el siguiente código: obj_empl = New Empleado(). Con esto le estamos diciendo al Visual Basic: crea un nuevo objeto en la memoria del tipo Empleado. Estos dos pasos los podemos simplificar de la siguiente forma: Dim obj_empl As New Empleado(). A partir de este momento existirá en la memoria un objeto del tipo Empleado.

8.5.

Acceder a los miembros de una clase

Para acceder a los miembros de una clase (propiedades o métodos) usaremos la variable que apunta al objeto creado a partir de esa clase, seguida de un punto y el miembro al que queremos acceder, por ejemplo, para asignar el nombre al objeto obj_empl, usaremos este código: obj_empl.Nombre = «Lolo». Es decir, de la misma forma que haríamos con cualquier otra variable, pero indicando el objeto al que pertenece dicha variable. Y para acceder al método Mostrar: obj_empl.Mostrar().

8.6.

Herencia

La herencia, como ya debíamos de saber, es una de las características más importantes de la POO, ya que permite que una clase herede los atributos y métodos de otra clase (los constructores no se heredan). Esta característica garantiza la reutilización del código. Para poder usar la herencia en nuestras clases disponemos de la instrucción Inherits, la cual se usa seguida del nombre de la clase de la que queremos heredar. Veamos un ejemplo.

Anexo IV 6-22

Visual Basic.Net

EMPLEADO

EMPLEADOVAGO

Empezaremos definiendo una clase «base» la cual será la que heredaremos en otra clase. Ya sabemos cómo definir una clase, aunque para este ejemplo, usaremos la clase Empleado, después crearemos otra, llamada EmpleadoVago la cual heredará todas las características de la clase Empleado además de añadirle una propiedad a esa clase derivada de Empleado. Veamos el código de estas dos clases.

Class Empleado Public Nombre As String Sub Mostrar() Console.WriteLine(«El nombre del Empleado: {0}», Nombre) End Sub End Class Class EmpleadoVago Inherits Empleado Public Sueldo As Decimal End Class Como puede comprobar, para que la clase EmpleadoVago herede la clase Empleado, se ha usado Inherits Empleado; con esta línea le estamos indicando que estamos creando una clase hija. Haciendo esto, añadiremos a la clase EmpleadoVago la propiedad Nombre y el método Mostrar, aunque también tendremos la nueva propiedad que hemos añadido: Sueldo. Ahora vamos a ver cómo podemos usar estas clases; para ello vamos a añadir código en el procedimiento Main del módulo del proyecto:

Anexo IV 6-23


Module Module1 Sub Main() Dim obj_empl As New Empleado() Dim obj_emplV As New EmpleadoVago() ‘ obj_empl.Nombre = «Mary» obj_emplV.Nombre = «Luz» obj_emplV.Sueldo = 2000 ‘

Console.WriteLine(«Mostrar clase Empleado») obj_empl.Mostrar() ‘ Console.WriteLine(«Mostrar EmpleadoVago») obj_emplV.Mostrar() ‘ Console.WriteLine(«El Sueldo del Vago es: {0}», obj_emplV.Sueldo) ‘ Console.ReadLine() End Sub End Module

Lo que hemos hecho es crear un objeto basado en la clase Empleado y otro basado en EmpleadoVago. Le asignamos el nombre a ambos objetos y a la variable obj_emplV (la del EmpleadoVago) le asignamos un valor a la propiedad Sueldo. Fíjese que en la clase EmpleadoVago no hemos definido ninguna propiedad llamada Nombre, pero esto es lo que nos permite hacer la herencia: heredar las propiedades y métodos de la clase base. Por tanto podemos usar esa propiedad como si la hubiésemos definido en esa clase. Lo mismo ocurre con los métodos, el método Mostrar no está definido en la clase EmpleadoVago, pero sí que lo está en la clase Empleado y como resulta que EmpleadoVago hereda todos los miembros de la clase Empleado, también hereda ese método. La salida de este programa sería la siguiente: Mostrar clase Empleado El nombre del Empleado: Mary Mostrar EmpleadoVago El nombre del Empleado: Luz El Sueldo del Vago es: 2000 Ahora veamos cómo podríamos hacer uso del polimorfismo en una de las formas que nos permite el .NET Framework. Teniendo ese mismo código que define las dos clases, podríamos hacer lo siguiente:

Anexo IV 6-24

Visual Basic.Net

Sub Main() Dim obj_empl As Empleado Dim obj_emplV As New EmpleadoVago() ‘ obj_emplV.Nombre = «Mary» obj_emplV.Sueldo = 2000 obj_empl = obj_emplV ‘ Console.WriteLine(«Mostrar Empleado») obj_empl.Mostrar()

‘ Console.WriteLine(«Usando Mostrar de la clase EmpleadoVago») obj_emplV.Mostrar() ‘ Console.WriteLine(«El Sueldo del Vago es: {0}», obj_emplV.Sueldo) ‘ Console.ReadLine() End Sub

En este caso, la variable obj_empl simplemente se ha declarado como del tipo Empleado, pero no se ha creado un nuevo objeto, simplemente hemos asignado a esa variable el contenido de la variable obj_emplV. Con esto lo que hacemos es asignar a esa variable el contenido de la clase EmpleadoVago, pero como comprenderá, la clase Empleado «no entiende» nada de las nuevas propiedades implementadas en la clase derivada; por tanto, solo se podrá acceder a la parte que es común a esas dos clases: la parte heredada de la clase Empleado. Realmente, las dos variables apuntan a un mismo objeto; por eso, al usar el método Mostrar se muestra lo mismo. Además de que si hacemos cualquier cambio a la propiedad Nombre, al existir sólo un objeto en la memoria, ese cambio afectará a ambas variables. Para comprobarlo, añada este código antes de la línea Console.ReadLine():

Console.WriteLine() obj_empl.Nombre = «Isma» Console.WriteLine(«Después de asignar un nuevo nombre a obj_empl.Nombre») obj_empl.Mostrar() obj_emplV.Mostrar() La salida de este nuevo código sería la siguiente: Usando Mostrar de la clase Empleado El nombre del Empleado: Mary Usando Mostrar de la clase EmpleadoVago El nombre del Empleado: Mary La Sueldo del Vago es: 2000 Después de asignar un nuevo nombre a obj_empl.Nombre El nombre del Empleado: Isma Anexo IV 6-25


El nombre del Empleado: Isma Como puede comprobar, al cambiar en una de las variables el contenido de la propiedad Nombre, ese cambio afecta a las dos variables; sólo existe un objeto en la memoria y las dos variables acceden al mismo objeto. A este tipo de variables se las llama variables por referencia, ya que hacen referencia o apuntan a un objeto que está en la memoria. A las variables que antes hemos estado viendo se las llama variables por valor, ya que cada una de esas variables tiene asociado un valor que es independiente de los demás. Notas:

8.7.

•

En las clases podemos tener: campos, propiedades, métodos y eventos.

•

Los métodos son procedimientos de tipo Sub o Function que realizan una acción.

•

Los campos son variables usadas a nivel de la clase, es decir, son variables normales y corrientes, pero que son accesibles desde cualquier parte dentro de la clase e incluso fuera de ella.

•

Las propiedades son procedimientos especiales, que al igual que los campos, representan una característica de las clases pero, a diferencia de los campos, nos permiten hacer validaciones o acciones extras que un campo nunca podrá hacer.

•

Los eventos son mensajes que utilizará la clase para informar de un hecho que ha ocurrido.

Los procedimientos: métodos de las clases

Los métodos de una clase pueden ser de dos tipos: Sub o Function. Los procedimientos Sub son como las instrucciones o palabras clave de Visual Basic: realizan una tarea. Los procedimientos Function, además de realizar una tarea, devuelven un valor, el cual suele ser el resultado de la tarea que realizan. Debido a que las funciones devuelven un valor, esos valores se pueden usar para asignarlos a una variable además de poder usarlos en cualquier expresión. Module Module1 Sub Main() MostrarS() Dim cad As String = MostrarF() Console.WriteLine(cad) ‘ Console.ReadLine() End Sub ‘

Anexo IV 6-26

Sub MostrarS() Console.WriteLine(«Este es el procedimiento MostrarS») End Sub ‘ Function MostrarF() As String Return «Esta es la función MostrarF» End Function End Module

Visual Basic.Net

La salida producida por este código será la siguiente: Este es el procedimiento MostrarS Esta es la función MostrarF En este módulo tenemos tres procedimientos, dos de tipo Sub y uno de tipo Function, el Sub Main es un procedimiento de tipo Sub y como ya hemos comprobado ejecuta el código que esté entre la definición del procedimiento, el cual empieza con la declaración del procedimiento, que siempre se hace de la misma forma, es decir: usando Sub seguido del nombre del procedimiento y termina con End Sub. Por otro lado, los procedimientos de tipo Function empiezan con la instrucción Function seguido del nombre de la función y el tipo de dato que devolverá la función, ya que, debido a que las funciones siempre devuelven un valor, lo lógico es que podamos indicar el tipo que devolverá. El final de la función viene indicado por End Function. Pero como se ha comentado, las funciones devuelven un valor, el valor que una función devuelve se indica con la instrucción Return seguido del valor a devolver. En este ejemplo, el valor devuelto por la función MostrarF es el texto que está entrecomillado. En el procedimiento Main utilizamos el procedimiento Sub usando simplemente el nombre del mismo: MostrarS. Ese procedimiento se usa en una línea independiente; cuando la ejecución del código llegue a esa línea, se procesará el contenido del mismo, el cual simplemente muestra un mensaje en la consola. Por otro lado, el resultado devuelto por la función MostrarF se asigna a la variable “cad”. Cuando Visual Basic se encuentra con este tipo de asignación, procesa el código de la función y asigna el valor devuelto; por tanto, la variable “s” contendrá la cadena «Esta es la función MostrarF» y tal como podemos comprobar por la salida producida al ejecutar este proyecto, eso será lo que se muestre en la consola. Cuando los procedimientos de tipo Sub o las funciones (Function) pertenecen a una clase se dicen que son métodos de esa clase. Los métodos siempre ejecutan una acción, y en el caso de las funciones, esa acción suele reportar algún valor, el cual se podrá usar para asignarlo a una variable o para usarlo en una expresión, es decir, el valor devuelto por una función se puede usar en cualquier contexto en el que se podría usar una variable o una constante. Por otro lado, los procedimientos de tipo Sub solo ejecutan la acción y nada más. Cuando los procedimientos se convierten en métodos (porque están declarados en una clase), éstos suelen representar lo que la clase (o módulo o estructura) es capaz de hacer. Es decir, siempre representarán una acción de dicha clase.

8.8.

Parámetros

Cuando queramos que un procedimiento realice una tarea, es posible que necesitemos indicarle alguna información adicional. Esa información se Anexo IV 6-27


suele indicar mediante parámetros o argumentos. Los argumentos pasados a los procedimientos se indican a continuación del nombre del procedimiento y deben estar incluidos dentro de los paréntesis que siempre hay que usar con los procedimientos. Por ejemplo, el método WriteLine de la clase Console permite que se indiquen mediante parámetros (o argumentos) los datos a mostrar en la consola. Para indicar que un procedimiento acepta argumentos, éstos se indicarán de la siguiente forma:

Tipo_procedimiento Nombre_procedimiento (parámetros) Supongamos que tenemos un procedimiento llamado Saludar, al cual hay que pasarle un parámetro de tipo cadena. Dicho procedimiento usará ese parámetro como parte de un mensaje que tendrá que mostrar por la consola. Sería algo como esto:

Sub Saludar(ByVal nombre As String) Console.WriteLine(«TAI « & nombre) End Sub En este ejemplo, nombre sería el parámetro o argumento del método Saludar. Para usar este procedimiento lo podríamos hacer de esta forma: Saludar(«Lolo») Si necesitamos que el procedimiento reciba más de un parámetro, se podrán indicar separándolos unos de otros con una coma. Veamos el método anterior en el que se indica, además del nombre, el tipo de saludo a realizar:

Sub Saludar(ByVal tipoSaludo As String, ByVal nombre As String) Console.WriteLine(tipoSaludo & « « & nombre) End Sub Este procedimiento con dos parámetros lo usaríamos de la siguiente forma: Saludar(«Hola», «Lolo»).

8.9.

Parámetros por valor y parámetros por referencia

Lo que se ha pasado al procedimiento es una copia del contenido de la variable elNombre, con lo cual, cualquier cambio que se realice en la variable nombre solo afectará a la copia, no al original. Porque se ha pasado por valor (ByVal). Pero si queremos que el procedimiento pueda modificar el valor recibido como parámetro, tendremos que indicarle al Visual Basic .NET de que lo pase por referencia; para ello habrá que usar la instrucción ByRef en lugar de ByVal. La explicación es que al pasar la variable por referencia (ByRef), el VB lo que ha hecho es asignar a la variable nombre del procedimiento la misma dirección de memoria que tiene la variable elNombre, de forma que cualquier cambio realizado en nombre afectará a elNombre. Anexo IV 6-28

Visual Basic.Net

En Visual Basic .NET, de forma predeterminada, los parámetros serán ByVal (por valor), a diferencia de lo que ocurría con las versiones anteriores de Visual Basic que eran por referencia (ByRef). Es decir, si se declara un parámetro sin indicar si es ByVal o ByRef, el VB.NET lo interpretará como si fuera ByVal. A modo de resumen, diremos que las variables indicadas con ByVal se pasan por valor, es decir, se hace una copia del contenido de la variable o constante y es esa copia la que se pasa al procedimiento. Por otro lado, los parámetros indicados con ByRef se pasan por referencia, es decir, se pasa al procedimiento una referencia a la posición de memoria en la que está el contenido de la variable en cuestión; por tanto, cualquier cambio efectuado a la variable dentro del procedimiento afectará a la variable indicada al llamar al procedimiento. Todo esto es aplicable tanto a los procedimientos de tipo Sub como a los de tipo Function. En el caso de las funciones, el utilizar parámetros ByRef nos permiten devolver más de un valor: el que devuelve la función más los que se puedan devolver en los parámetros declarados con ByRef. En un procedimiento se pueden usar indistintamente parámetros por valor como por referencia, es decir, podemos tener tanto parámetros declarados con ByVal como con ByRef, y, por supuesto, sólo los indicados con ByRef podrán cambiar el contenido de las variables indicadas al llamar al procedimiento.

8.10. Parámetros opcionales Para poder indicarle al Visual Basic .NET que un parámetro es opcional debemos indicarlo usando la instrucción Optional antes de la declaración del parámetro en cuestión. Además tenemos que indicar el valor que tendrá por defecto, es decir, si no se indica ese parámetro, éste debe tener un valor predeterminado. Solo podemos especificar parámetros opcionales después de todos los parámetros obligatorios. Dicho esto, veamos cómo declarar el procedimiento Func para indicar que el segundo parámetro es opcional y que el valor predeterminado (si no se indica) es cinco:

Sub Func(ByVal uno As Integer, Optional ByVal dos As Integer = 5) Con esta declaración podemos usar este procedimiento de estas dos formas: Func(10, 20) En este caso se indicará un 10 para el parámetro uno y 20 para el parámetro dos. Func(10) Si no indicamos el segundo parámetro, el valor que se usará dentro del procedimiento será el valor indicado en la declaración, es decir: 5.

8.11. Sobrecarga de procedimientos La sobrecarga consiste en crear más de un procedimiento, constructor de instancias o propiedad en una clase con el mismo nombre y distintos tipos de Anexo IV 6-29


argumento. La sobrecarga es especialmente útil cuando un modelo de objeto exige el uso de nombres idénticos para procedimientos que operan en diferentes tipos de datos. Es decir, que si necesitamos un procedimiento que utilice distinto número de parámetros o parámetros de distintos tipos, podemos usar la sobrecarga de procedimientos. Sabiendo esto, podríamos hacer lo mismo que con el procedimiento Func mostrado anteriormente con estas declaraciones:

Func() Func(ByVal i As Integer) Func(ByVal i As Integer, ByVal j As Integer) Cuando se usan procedimientos sobrecargados, es el propio compilador de Visual Basic .NET el que decide cuál es el procedimiento que mejor se adecúa a los parámetros que se han indicado al llamar a ese procedimiento. Otra de las ventajas de la sobrecarga de procedimientos, es que además de poder indicar un número diferente de parámetros, podemos indicar parámetros de distintos tipos. Esto es útil si queremos tener procedimientos que, por ejemplo, reciban parámetros de tipo Integer o que reciba parámetros de tipo Double. Incluso podemos hacer que una función devuelva valores de tipos diferentes, aunque en este caso el número o tipo de los parámetros debe ser diferente, ya que no se pueden sobrecargar procedimientos si solo se diferencian en el tipo de datos devuelto. Tampoco se pueden sobrecargar Propiedades con métodos (Sub o Function), es decir, solo podemos sobrecargar propiedades con otras propiedades, o procedimientos (Sub o Function) con otros procedimientos (Sub o Function).

8.12. Sobrecargar el constructor de las clases Un constructor es un método especial de una clase que es llamado automáticamente siempre que se crea un objeto de esa clase. Su función es iniciar el objeto. El constructor de una clase es un procedimiento de tipo Sub llamado New, dicho procedimiento se ejecuta cada vez que creamos un nuevo objeto basado en una clase. Si al declarar una clase no escribimos el «constructor», será el compilador de Visual Basic .NET el que se encargará de escribir uno genérico. Esto es útil si queremos que al crear un objeto (o instancia) de una clase podamos hacerlo de varias formas, por ejemplo, sin indicar ningún parámetro o bien indicando algo que nuestra clase necesite a la hora de crear una nueva instancia de dicha clase. Por ejemplo, si tenemos una clase llamada Empleado, puede sernos útil crear nuevos objetos indicando el nombre del Empleado que contendrá dicha clase. Veámoslo con un ejemplo:

Anexo IV 6-30

Visual Basic.Net

Class Empleado Public Nombre As String Public email As String ‘ Sub New() ‘ End Sub Sub New(ByVal elNombre As String) Nombre = elNombre End Sub End Class Esta clase nos permite crear nuevos objetos del tipo Empleado de dos formas. Por ejemplo si tenemos una variable llamada obj_empl, declarada de esta forma: Dim obj_empl As Empleado podemos crear nuevas instancias sin indicar ningún parámetro: obj_empl = New Empleado() o indicando un parámetro, el cual se asignará a la propiedad Nombre de la clase:

obj_empl = New Empleado(«Lolo») Igual que existe un constructor, existe también un destructor denominado Finalize que es invocado automáticamente por el recolector de basura siempre que un objeto es eliminado, cosa que ocurre cuando ese objeto queda sin referencia.

8.13. Los campos y las propiedades Los campos son variables usadas a nivel de una clase. Los campos representan los datos de la clase. Los campos y propiedades representan los datos manipulados por la clase, mientras que los métodos manipulan (o permiten manipular) esos datos. Podemos declarar cualquier miembro de una clase de dos formas, según el nivel de visibilidad o ámbito que queramos que tenga. •

Si lo declaramos con el modificador de acceso Private, ese miembro sólo será accesible desde «dentro» de la clase, es decir, en cualquier sitio de la clase podremos usar ese miembro, pero no será accesible desde «fuera» de la clase, por ejemplo, en una nueva instancia creada.

•

Si declaramos un miembro de la clase como Public, ese miembro será accesible tanto desde dentro de la clase como desde fuera de la misma. Un miembro público de una clase siempre será accesible.

Anexo IV 6-31


Cuando declaramos un campo con el modificador Public, estamos haciendo que ese campo (o variable) sea accesible desde cualquier sitio; por otro lado, si lo declaramos como Private, sólo estará accesible en la propia clase.

Ejemplo: En el siguiente código vamos a declarar una clase que tendrá tres miembros públicos y uno privado. De estos tres miembros públicos, dos de ellos serán campos y el tercero será un método que nos permitirá mostrar por la consola el contenido de esos campos. El campo privado simplemente lo usaremos dentro del método, en otro ejemplo le daremos una utilidad más práctica, ya que en este ejemplo no sería necesario el uso de ese campo privado, pero al menos nos servirá para saber que «realmente» es privado y no accesible desde fuera de la clase. Public Class Popo ‘ campo privado Private cad As String ‘ campos públicos Public Nombre As String Public Apel As String ‘ ‘ método público Public Sub Mostrar() cad = Nombre & « « & Apel Console.WriteLine(cad) End Sub End Class Module Module1 Sub Main() ‘ creamos una nueva instancia de la clase

Dim p As New Popo() ‘ ‘ asigmos los valores a los campos públicos p.Nombre = «Lolo» p.Apel = «Lolito» ‘ usamos el método para mostrar la información en la consola p.Mostrar() ‘ ‘ esto dará error ‘Console.WriteLine(p.cad) ‘ Console.WriteLine(«Pulsa Intro») Console.ReadLine() End Sub End Module

En la clase Popo (que está declarada como Public) tenemos declarado Nombre y Apel con el modificador Public; por tanto podemos acceder a estos dos campos desde una nueva instancia de la clase, así como desde cualquier sitio de la clase. Lo mismo es aplicable al método Mostrar, ya que al ser público se puede usar desde la variable declarada en el procedimiento Main. Por otro lado, el campo cad está declarado como Private; por tanto, solo será accesible desde la propia clase y no desde fuera de ella. Es decir, no podremos usar ese campo desde la instancia creada en Main por la sencilla razón de que es «privada» y, por tanto, no visible ni accesible desde fuera de la propia clase.

Anexo IV 6-32

Visual Basic.Net

No obstante, las propiedades (Property) son otra cosa diferente; al menos así deberíamos planteárnoslo y, tanto en Visual Basic .NET como en las versiones anteriores, además de declarar una propiedad usando la declaración de un campo público, también podemos usar la instrucción Property.

8.14. Property La forma de usar Property es muy parecido a como se declara una función, pero con un tratamiento especial, ya que dentro de esa declaración hay que especificar por un lado lo que se debe hacer cuando se quiera recuperar el valor de la propiedad, y por otro lo que hay que hacer cuando se quiere asignar un nuevo valor. Cuando queremos recuperar el valor de una propiedad, por ejemplo para usarlo en la parte derecha de una asignación o para usarlo en una expresión, tal es el caso de que queramos hacer algo como esto:

Dim s As String = p.Nombre o Console.WriteLine(p.Nombre) En estos dos casos, lo que queremos es recuperar el contenido de la propiedad. Pero si lo que queremos es asignar un nuevo valor, esa propiedad normalmente estará a la izquierda de una asignación, como sería el caso de hacer esto: p.Nombre = «Lolo». En este caso estaríamos asignando un nuevo valor a la propiedad Nombre. Si queremos que Nombre sea realmente una propiedad (un procedimiento del tipo Property) para que podamos hacer ciertas comprobaciones tanto al asignar un nuevo valor como al recuperar el que ya tiene asignado, tendremos que crear un procedimiento:

Public Property Nombre() As String ‘ la parte Get es la que devuelve el valor de la propiedad Get Return elNombre End Get ‘ la parte Set es la que se usa al asignar el nuevo valor Set(ByVal Value As String) If Value <> «» Then elNombre = Value End If End Set End Property Es decir, declaramos un procedimiento del tipo Property, el cual tiene dos bloques internos: Anexo IV 6-33


•

El primero es el bloque Get, que será el código que se utilice cuando queramos recuperar el valor de la propiedad, por ejemplo para usarlo en la parte derecha de una asignación o en una expresión.

•

El segundo es el bloque Set, que será el código que se utilice cuando queramos asignar un nuevo valor a la propiedad. Tal sería el caso de que esa propiedad estuviera en la parte izquierda de una asignación.

Como puedes comprobar, el bloque Set recibe un parámetro llamado Value que es del mismo tipo que la propiedad, en este caso de tipo String. Value representa el valor que queremos asignar a la propiedad y representará lo que esté a la derecha del signo igual de la asignación. Por ejemplo, si tenemos esto: p.Nombre = «Lolo», «Lolo» será lo que Value contenga. Fíjese que al declarar la propiedad no se indica ningún parámetro; esto lo veremos en otra ocasión, pero lo que ahora nos interesa saber es que lo que se asigna a la propiedad está indicado por el parámetro Value del bloque Set. Fíjese también que cuando creamos un procedimiento Property siempre será necesario tener un campo (o variable) privado que sea el que contenga el valor de la propiedad. Ese campo privado lo usaremos para devolver en el bloque Get el valor de nuestra propiedad y es el que usaremos en el bloque Set para conservar el nuevo valor asignado. El tipo de datos del campo privado debe ser del mismo tipo que el de la propiedad. La ventaja de usar propiedades declaradas como Property en lugar de usar variables (o campos) públicos es que podemos hacer comprobaciones u otras cosas dentro de cada bloque Get o Set, tal como hemos hecho en el ejemplo de la propiedad Nombre para que no se asigne una cadena vacía al Nombre. Si nuestra intención es que dentro de una propiedad se ejecute un código que pueda consumir mucho tiempo o recursos, deberíamos plantearnos crear un método, ya que las propiedades deberían asignar o devolver los valores de forma rápida. Debido a que en Visual Basic .NET los campos públicos son tratados como propiedades, no habría demasiada diferencia en crear una propiedad declarando una variable pública o usando un procedimiento Property, pero deberíamos acostumbrarnos a crear procedimientos del tipo Property si nuestra intención es crear una propiedad, además de que el uso de procedimientos Property nos da más juego que simplemente declarando una variable pública.

8.15. Propiedades de sólo lectura Una de las ventajas de usar un procedimiento Property es que podemos crear propiedades de solo lectura, es decir, propiedades a las que no se pueden asignar valores nuevos, simplemente podemos acceder al valor que contiene. Para poder conseguir que una propiedad sea de solo lectura, tendremos que indicárselo al Visual Basic .NET de la siguiente forma: Anexo IV 6-34

Visual Basic.Net

Private valorFijo As Integer = 10 ‘ Public ReadOnly Property Valor() As Integer Get Return valorFijo End Get End Property Es decir, usamos la palabra clave (o modificador) ReadOnly al declarar la propiedad y tan sólo especificamos el bloque Get. Si declaramos un procedimiento ReadOnly Property no podemos indicar el bloque Set, eso dará error.

8.16. Propiedades de sólo escritura De la misma forma que podemos definir una propiedad de solo lectura, también podemos crear una propiedad de solo escritura, es decir, una propiedad que solo aceptará que se asignen nuevos valores, pero que no permitan obtener el valor que tienen. Veamos cómo tendríamos que declarar una propiedad de solo escritura:

Private valorEscritura As Boolean ‘ Public WriteOnly Property Escribir() As Boolean Set(ByVal Value As Boolean) valorEscritura = Value End Set End Property Es decir, usamos el modificador WriteOnly al declarar la propiedad y solo debemos especificar el bloque Set. Si declaramos un procedimiento WriteOnly Property no podemos indicar el bloque Get, ya que eso dará error. Cuando declaramos una propiedad de solo lectura no podemos declarar otra propiedad con el mismo nombre que solo sea de escritura. Si nuestra intención es crear una propiedad de lectura/escritura, simplemente con no complicarnos la existencia es suficiente, es decir, declaramos la propiedad sin indicar ni ReadOnly ni WriteOnly.

8.17. Campos de sólo lectura Lo mismo que existen propiedades de solo lectura, podemos crear campos de los que solo podamos leer el valor que contiene y no asignar ninguno nuevo. Los campos de solo lectura, a diferencia de las constantes, se pueden cambiar de valor, pero sólo en la definición, lo cual no se diferenciaría de la forma de declarar una constante, o dentro del constructor de la clase. Esto último es algo que no se

Anexo IV 6-35


puede hacer con una constante, ya que las constantes siempre tienen el mismo valor, el cual se asigna al declararla. En el siguiente código vamos a declarar una constante y también un campo (o variable) de sólo lectura:

Public Const PI As Double = 3.14159 Public ReadOnly Len As Integer = 50 En este código tenemos declarada una constante llamada PI que tiene un valor fijo. Las constantes siempre deben declararse con el valor que contendrán. Por otro lado, tenemos un campo de solo lectura llamado Len, que es del tipo Integer y tiene un valor de 50. Cuando declaramos una constante pública, ésta estará accesible en las nuevas instancias de la clase además de ser accesible «globalmente», es decir, no tendremos que crear una nueva instancia de la clase para poder acceder a la constante. Por tanto podríamos decir que las constantes declaradas en una clase son «variables» compartidas por todas las instancias de la clase. Es como si declarásemos la constante usando Shared o como si estuviese declarada en una clase de tipo Module. La diferencia entre una clase de tipo Module y una de tipo Class es que en la primera, todos los miembros están compartidos (Shared), mientras que en la segunda, salvo que se indique explícitamente, cada miembro pertenecerá a la instancia de la clase, es decir, de cada objeto creado con New. Suponte que cambiamos la declaración de Len de la siguiente forma:

Public Shared ReadOnly Len As Integer = 50 En este caso, no habría diferencia con una constante. Pero, ésta no sería la forma habitual de declarar un campo de solo lectura. Lo habitual es declararlo sin un valor inicial, aunque haciéndolo así nos aseguramos que tenga un valor predeterminado, en caso de que no se asigne ninguno nuevo. La forma de asignar el valor que tendrá un campo de solo lectura, sería asignándolo en el constructor de la clase. Por tanto, podríamos tener un constructor (Sub New) que reciba como parámetro el valor que tendrá ese campo de solo lectura. En el siguiente código vamos a declarar una clase que tendrá un campo de solo lectura, el cual se asigna al crear una nueva instancia de la clase:

Anexo IV 6-36

Visual Basic.Net

Public Class Kiki Public ReadOnly Len As Integer = 50 ‘ Public Sub New() ‘ End Sub Public Sub New(ByVal len_nueva As Integer) Len = len_nueva End Sub ‘ ‘ Este será el punto de entrada del ejecutable Public Shared Sub Main() ‘ ‘ si creamos la clase sin indicar la nueva longitud...

Dim p As New Kiki() ‘ el valor será el predeterminado: 50 Console.WriteLine(«p.Len = {0}», p.Len) ‘ ‘ si creamos la clase sin indicar la nueva longitud... Dim obj1 As New Kiki(25) ‘ el valor será el indicado al crear la instancia Console.WriteLine(«obj1.Len = {0}», obj1.Len) ‘ Console.WriteLine() Console.WriteLine(«Pulsa Intro») Console.ReadLine() End Sub End Class

Esta clase tiene definidos dos constructores: uno sin parámetros y otro que recibe un valor de tipo Integer; ese valor será el que se use para el campo de solo lectura. En el Sub Main, el cual está declarado como Shared para que se pueda usar como punto de entrada del ejecutable, declaramos dos objetos del tipo de la clase: el primero se instancia usando New sin ningún parámetro, mientras que el segundo se crea la nueva instancia indicando un valor en el constructor; ese valor será el que se utilice para darle valor al campo de solo lectura, cosa que se demuestra en la salida del programa:

p.Len = 50 obj1.Len = 25 En los comentarios está aclarado por qué el objeto p toma el valor 50 y porqué usando obj1 el valor es 25. Una vez que hemos asignado el valor al campo de solo lectura, ya no podemos modificar dicho valor, salvo que esa modificación se haga en el constructor. Por tanto, sólo podemos asignar un nuevo valor a un campo de sólo lectura en el constructor de la clase.

8.18. El ámbito de los miembros de una clase Hasta ahora hemos estado usando dos instrucciones (o modificadores) que permiten indicar el ámbito de un miembro de una clase (o módulo): uno de ellos es Public y el otro es Private. Al usar el modificador Public, permitimos que el miembro al que se le ha aplicado ese modificador sea visible desde cualquier sitio y por tanto estará accesible para que podamos usarlo desde la propia clase o desde fuera de ella; por otro lado, cuando usamos Private, estamos indicando que ese miembro es «privado» a la clase en la que se ha declarado y, por tanto, solo podremos usarlo desde la propia clase. Anexo IV 6-37


Ejemplo:

Public Class Dede

Private elNombre As String

Public Apel As String ‘ Public Property Nombre() As String Get Return elNombre End Get Set(ByVal Value As String) If Value <> «» Then elNombre = Value End If End Set End Property Public Sub Mostrar() Console.WriteLine(elNombre & « « & Apel) End Sub End Class En esta clase hemos definido dos campos: elNombre y Apel. El primero está declarado como Private; por tanto, sólo será visible dentro de la clase, es decir, no podemos acceder a ese campo desde fuera de la clase (ahora lo comprobaremos). El segundo está declarado como Public; por tanto será accesible (o visible) tanto desde dentro de la clase como desde fuera de ella. Tendremos que crear una nueva instancia, pero a los miembros a los que podemos acceder, sólo serán los que estén declarados como Public. Además de esos dos campos, también tenemos una propiedad y un método, ambos declarados como Public. El método Mostrar, que es un procedimiento de tipo Sub, puede acceder tanto a la variable declarada como Private como a la que hemos declarado como Public, ya que ambas variables (en este caso también campos de la clase) tienen la «cobertura» suficiente para que sean vistas (o accesibles) desde cualquier sitio «dentro» de la propia clase. La propiedad Nombre, tiene dos bloques de código: uno será la parte Get (la que devuelve el valor de la propiedad) y la otra es el bloque Set (el que asigna el valor a la variable privada). Desde los dos bloques podemos acceder a la variable privada elNombre, ya que el ámbito de dicha variable es: toda la clase.

Anexo IV 6-38

Visual Basic.Net

Module Module1 Sub Main() Dim n As New Dede() ‘ n.Nombre = «Lolo» n.Apel = «Som» n.Mostrar() End Sub End Module En este módulo tenemos un procedimiento en el cual declaramos una variable del tipo Dede. Creamos una nueva instancia en la memoria y usamos los miembros públicos. Las variables en un procedimiento, (Sub, Function o Property), tenemos que declararlas con Dim. Esto significa que las variables son privadas (o locales) al procedimiento; por tanto, solo se podrán usar dentro del procedimiento y desde fuera de él no sabrán de la existencia de esas variables. Pero aún hay más: si hubiese una variable de «nivel superior» que se llamase igual que una variable «local» al procedimiento, esta última ocultaría a la que está declarada en un nivel superior. Por ejemplo, en la clase Dede tenemos la variable elNombre, declarada a nivel de módulo; esta variable podrá usarse dentro del procedimiento Mostrar, pero si el procedimiento Mostrar lo sobreescribimos de esta forma:

Public Sub Mostrar() ‘ func declarando una variable «local» ‘ que se llama igual que otra declarada a nivel de módulo Dim elNombre As String ‘ Console.WriteLine(elNombre & « « & Apel) End Sub La variable declarada dentro del procedimiento «ocultaría» a la declarada a nivel de módulo; por tanto, ahora no se mostraría el nombre que hubiésemos asignado a la clase, sino una cadena vacía, ya que no hemos asignado nada a esa variable. Si el parámetro de un procedimiento recibe una variable que se llama como otra declarada a nivel superior, esa variable también ocultaría a la de nivel superior. Por ejemplo, si tenemos este procedimiento:

Public Sub Mostrar2(ByVal elNombre As String) Console.WriteLine(elNombre & « « & Apel) End Sub Anexo IV 6-39


El nombre de la variable usada como parámetro también se llama igual que la declarada a nivel de módulo; por tanto, esa variable (la del parámetro) ocultará a la otra (la declarada a nivel de módulo). Realmente son dos variables diferentes y cada una tendrá su propia dirección de memoria; por tanto el valor asignado a esas variables locales no afectará en nada a la variable declarada a nivel de módulo. Cuando declaramos variables locales (al procedimiento), éstas durarán (o existirán) mientras dure el procedimiento; es decir, cuando se sale del procedimiento, el valor que tuviera asignado, se perderá. Cuando se vuelva a entrar en el procedimiento se volverán a crear esas variables y el valor que antes tenían ya no será recordado. Habrá ocasiones en que no queramos que esos valores de las variables locales se pierdan, en Visual Basic podemos hacerlo declarando las variables usando la instrucción Static en lugar de Dim. Static le indica al compilador que esa variable debe mantener el valor entre distintas llamadas al procedimiento, para que de esa forma no se pierda el valor que tuviera. Las variables declaradas con Static siguen siendo locales al procedimiento y también «ocultarán» a variables declaradas a nivel de módulo que se llamen de igual forma. Es decir, funcionan como las declaradas con Dim, pero mantienen el valor, además de que Static sólo se puede usar para declarar variables dentro de procedimientos. En los bloques podemos declarar variables «privadas» a esos bloques, pero en esta ocasión solo pueden declararse con Dim. Las variables declaradas en un bloque solo serán visibles «dentro» de ese bloque; por tanto, no podrán ser accedidas desde fuera del bloque. Las limitaciones que tenemos en Visual Basic .NET respecto a las variables «locales» declaradas en un bloque, es que no pueden llamarse de igual forma que una declarada en el mismo «nivel» en el que se usa el bloque, normalmente en un procedimiento, ya que no podemos usar un bloque fuera de un procedimiento. Una variable declarada en un bloque sí se puede llamar como otra declarada a nivel de módulo; en ese caso, la variable «local» ocultará a la declarada a nivel de módulo. Lo que debemos tener presente es que las variables declaradas en un bloque «mantienen» el valor mientras dure la vida del procedimiento en el que se encuentran. Es como si fuesen «estáticas» mientras dure el procedimiento, aunque, cuando termina el procedimiento, ese valor se pierde. También debemos saber que esto solo es aplicable si no hemos asignado un valor a la variable al declararla, ya que si se asigna un valor al declararla, siempre usará ese valor.

Anexo IV 6-40

Visual Basic.Net

Module Modulo3 Sub Main() Dim i As Integer For i = 1 To 2 Console.WriteLine(« i vale {0}», i) Func3() Next End Sub

Sub Func3() Dim i As Integer For i = 1 To 5 If i > 1 Then Dim j As Integer Dim k As Integer = 2 k += 1 j += 1 Console.WriteLine(«j = {0}, k = {1}», j, k) End If Next End Sub End Module

En este ejemplo, dentro del bloque If i > 1 Then... tenemos dos variables locales al bloque. La variable “j” se ha declarado de forma «normal», mientras que la variable “k” se ha declarado usando un valor inicial. Cada vez que llamemos al procedimiento Func3, el bucle se repetirá 5 veces y la condición para entrar en el bloque se ejecutará 4 de esas 5 veces, y como podemos comprobar la variable “j” va tomando valores desde 1 hasta 4, mientras que “k” siempre muestra el valor 3 (dos que le asignamos al declarar y uno del incremento). La salida de esta func sería la siguiente: i vale 1

i vale 2

j = 1, k = 3

j = 1, k = 3

j = 2, k = 3

j = 2, k = 3

j = 3, k = 3

j = 3, k = 3

j = 4, k = 3

j = 4, k = 3

8.19. Las variables declaradas a nivel de módulo En las declaraciones de las variables declaradas a nivel de módulo pueden entrar en juego otros modificadores de visibilidad; estos «modificadores», también serán aplicables a los procedimientos. Cuando declaramos una variable a nivel de módulo, ésta será visible en todo el módulo (clase) en el que se ha declarado; además, dependiendo del modificador de nivel de visibilidad que tenga, podrá ser «vista» (o estará accesible) desde otros sitios. Recuerde que las variables declaradas en los módulos se les llama «campos» y si son accesibles desde fuera de la clase, pueden llegar a confundirse con las propiedades.

Anexo IV 6-41


8.20. Los niveles de visibilidad (accesibilidad o ámbito) Veamos un resumen de los modificadores de visibilidad que podemos usar en los programas de Visual Basic .NET MODIFICADOR (VB)

DESCRIPCIÓN

Dim

Declara una variable en un módulo, procedimiento o bloque. Cuando se usa para declarar una variable a nivel de módulo, se puede sustituir por Private.

Private

El elemento declarado sólo es visible dentro del nivel en el que se ha declarado.

Public

El elemento es visible en cualquier parte.

Friend

El elemento es visible dentro del propio ensamblado (proyecto).

Protected

El elemento es visible sólo en las clases derivadas.

Protected Friend

El elemento es visible en las clases derivadas y en el mismo ensamblado.

Hay que tener en cuenta que el ámbito que tendrán los elementos declarados (por elemento entenderemos que es una variable, un procedimiento, una clase, módulo, estructura o una enumeración), dependerán del nivel en el que se encuentran. Por ejemplo, cuando declaramos un elemento con el modificador Public dentro de un nivel que ha sido declarado como Private, el elemento declarado como público no podrá «sobrepasar» el nivel privado. Por otro lado, si se declara un elemento como Private, será visible desde cualquier otro elemento que esté en el mismo nivel o en un nivel inferior.

Nota: En la documentación de Visual Studio .NET, ámbito es el nivel de visibilidad que puede tener, ya sea a nivel de bloque, procedimiento, módulo o espacio de nombres. Y la accesibilidad es la «visibilidad» de dicho elemento, si es público, privado, etc. Otra cosa a tener en cuenta es que cuando declaramos en Visual Basic .NET una clase, una estructura, una enumeración o un procedimiento sin especificar el ámbito, de forma predeterminada será Public. Los Namespace no pueden tener modificadores de acceso, siempre serán accesibles. Los módulos (o clases) declaradas como Module, tampoco pueden tener modificadores de acceso, y también se consideran como Public, por tanto, siempre accesibles. Además de que cualquier elemento declarado en un Module podrá usarse sin necesidad de indicar el nombre del módulo; dónde puedan usarse dependerá del ámbito que le hayamos dado. Anexo IV 6-42

Visual Basic.Net

8.21. Diferencia entre Class y Module y miembros compartidos Por regla general, se usarán las clases de tipo Class cuando «realmente» queramos crear una clase. Para poder acceder a los miembros de una clase, tendremos que crear una nueva instancia en la memoria. Por otro lado, usaremos las clases de tipo Module cuando queramos tener «miembros» que puedan ser usados en cualquier momento, sin necesidad de crear una nueva instancia de la clase, de hecho no podemos crear una instancia de un tipo declarado como Module. El que podamos acceder a los miembros de un Module sin necesidad de crear una nueva instancia, es por el hecho de que esos miembros son miembros compartidos. Bueno, realmente no solo porque son miembros compartidos, sino porque el compilador de Visual Basic .NET trata de forma especial a los «tipos de datos» declarados como Module. Los cuales se pueden acceder sin necesidad de usar el nombre del módulo en el que están incluidos. Pero los Module no son los únicos «poseedores» de la exclusiva de los miembros compartidos, ya que podemos declarar clases, (del tipo Class), que tengan miembros compartidos. Para que un miembro de una clase esté compartido, hay que usar el modificador Shared. Esta instrucción le indicará al runtime de .NET que ese miembro puede ser accedido sin necesidad de crear una nueva instancia de la clase. Para simplificar, diremos que es como si el CLR hubiese creado una instancia de esa clase y cada vez que queramos acceder a un miembro compartido, usará esa instancia para acceder a ese miembro. En los miembros compartidos no se pueden usar variables u otros miembros que no estén compartidos.

8.22. Cómo declarar miembros compartidos en una clase, y cómo usarlos Veamos un pequeño código en el que tenemos una clase con elementos compartidos y no compartidos.

Class Dede ‘ miembros compartidos Public Shared elNombreShared As String Public Shared Sub MostrarCompartido() Console.WriteLine(«Este procedimiento está declarado como compartido (Shared)») Console.WriteLine(«Sólo podemos acceder a miembros compartidos: {0}», elNombreShared) End Sub Anexo IV 6-43


‘ ‘ miembros de instancia Public elNombreInstancia As String Public Sub MostrarInstancia() Console.WriteLine(«Este procedimiento es de instancia.») Console.WriteLine(«Podemos acceder a miembros de instancia: {0}», elNombreInstancia) Console.WriteLine(«y también a miembros compartidos: {0}», elNombreShared) End Sub ‘ End Class En esta clase, hemos declarado un «campo» y un procedimiento compartido (usando Shared) y otro campo y otro procedimiento no compartido (de instancia). Desde el procedimiento compartido sólo podemos acceder al campo compartido. Pero desde el procedimiento de instancia podemos acceder tanto al miembro compartido como al de instancia. Recuerde que una instancia es un nuevo objeto creado en la memoria. Por tanto, cada instancia (u objeto en la memoria) tendrá su propia copia de los miembros de instancia, mientras que de los miembros compartidos sólo existe una copia en memoria que será común para todos y cada uno de los objetos instanciados. Esto lo podemos comprobar en el siguiente código:

Module Modulo Sub Main() ‘ para acceder a miembros compartidos ‘ usaremos el nombre de la clase: Dede.elNombreShared = «Shared» Dede.MostrarCompartido() ‘ Console.WriteLine() ‘ creamos una instancia de la clase Dim obj As New Dede() ‘ obj.elNombreInstancia = «Instancia» obj.MostrarCompartido() obj.elNombreShared = «Shared cambiado»

Anexo IV 6-44

Visual Basic.Net

obj.MostrarInstancia() ‘ Console.WriteLine() ‘ ‘ creamos otro objeto del mismo tipo (otra instancia) Dim obj2 As New Dede_5() ‘ obj2.elNombreInstancia = «Instancia 2» obj2.MostrarInstancia() ‘obj2.MostrarCompartido() Dede.MostrarCompartido() End Sub End Module La salida de este código será la siguiente: Este procedimiento está declarado como compartido (Shared) Sólo podemos acceder a miembros compartidos: Shared Este procedimiento está declarado como compartido (Shared) Solo podemos acceder a miembros compartidos: Shared Este procedimiento es de instancia. Podemos acceder a miembros de instancia: Instancia y también a miembros compartidos: Shared cambiado Este procedimiento es de instancia. Podemos acceder a miembros de instancia: Instancia 2 y también a miembros compartidos: Shared cambiado Este procedimiento está declarado como compartido (Shared) Solo podemos acceder a miembros compartidos: Shared cambiado Como puede comprobar, para acceder a los miembros compartidos, hemos usado el nombre de la clase. De esta forma solo podemos acceder a los miembros compartidos. Por otro lado, al crear una instancia de esa clase, podemos acceder tanto a los miembros compartidos como a los de instancia, en este ejemplo, se asigna un valor al campo de instancia, se llama al procedimiento compartido y desAnexo IV 6-45


pués cambiamos el contenido del campo compartido y llamamos al procedimiento de instancia. En la segunda clase, al mostrar el contenido del campo compartido, mostrará el valor que el objeto (de instancia) le asignó, ya que ese campo está compartido por todas las instancias. En la última línea de código se ha usado el método compartido usando la clase, pero el resultado sería el mismo si se usara el objeto para llamar al método compartido.

8.23. Sobre el código y los datos de una clase Cada vez que creamos (instanciamos) un objeto en la memoria, estamos reservando espacio para ese objeto. Se reserva espacio tanto para los datos como para el código de los procedimientos. El código siempre es el mismo para todos los objetos creados en la memoria, es decir, sólo existe una copia en la memoria del código, no se «copia» ese código una vez por cada objeto que hemos creado. Por otro lado, los datos si que ocupan espacios de memoria diferentes, uno para cada instancia. Cuando se usa un procedimiento de una clase y en ese procedimiento se usan valores de instancia, (los que existen de forma independiente para cada objeto creado), el runtime realmente hace una llamada al «código» indicándole dónde están los datos que tiene que manipular, es decir, le pasa al código la dirección de memoria en la que se encuentran los datos a manipular, de esta forma, sólo existe una copia del código (igual que ocurre con los datos compartidos) y varias direcciones de memoria para los datos no compartidos, (según el número de instancias que se hayan creado).

9.

Assembly (ensamblado)

«Un ensamblado es el bloque constructivo primario de una aplicación de .NET Framework. Se trata de una recopilación de funcionalidad que se construye, versiona e instala como una única unidad de implementación (como uno o más archivos).» Para que nos entendamos, podríamos decir que un assembly es una librería dinámica (DLL) en la cual pueden existir distintos espacios de nombres. Aunque esto es simplificar mucho por ahora nos vale. Un ensamblado o “assembly” puede estar formado por varios ficheros DLLs y EXEs, pero lo más importante es que todos los ensamblados contienen un manifiest. Cada “assembly” contiene un manifiesto en el cual se indica: •

El nombre y la versión del “assembly”.

•

Si este “assembly” depende de otros ensamblados, con lo cual se indica hasta la versión de dichos ensamblados.

•

Los tipos expuestos por el “assembly” (clases, etc.).

•

Permisos de seguridad para los distintos tipos contenidos en el “assembly”.

Anexo IV 6-46

Visual Basic.Net

También se incluyen en los “assemblies” los datos del copyright, etc. La ventaja de los ensamblados es que «realmente» no necesitan de una instalación y un registro correcto en el registro del sistema de Windows, ya que es el «intérprete» de .NET el que se encarga de hacer las comprobaciones cuando tiene que hacerlas. Por tanto, podríamos distribuir una aplicación sin necesidad de crear un programa de instalación. Pero si la aplicación usa ensamblados compartidos, puede que sea necesario usar una instalación. Los ensamblados compartidos se pueden usar por varias aplicaciones diferentes y deben estar «debidamente» instalados en el directorio asignado por el propio .NET Framework. Ejemplo de ensamblados compartidos son los que definen las clases (tipos) usados por el propio .NET Framework.

10. Espacios de nombres (Namespace) Un Namespace es una forma de agrupar clases, funciones, tipos de datos, etc. que están relacionadas entre sí. Por ejemplo, entre los Namespaces que podemos encontrar en el .NET Framework encontramos uno con funciones relacionadas con Visual Basic: Microsoft.VisualBasic. Microsoft y VisualBasic están separados por un punto, esto significa que Microsoft a su vez es un Namespace que contiene otros «espacios de nombres», tales como el mencionado VisualBasic, CSharp y Win32 con el cual podemos acceder a eventos o manipular el registro del sistema. Por regla general, se deberían agrupar en un Namespace funciones o clases que estén relacionadas entre sí. De esta forma, será más fácil saber que estamos trabajando con funciones relacionadas entre sí. Pero el que distintos espacios de nombres pertenezcan a un mismo Namespace no significa que todos estén dentro de la misma librería o assembly. Un Namespace puede estar repartido en varios assemblies o librerías. Por otro lado, un assembly (o ensamblado) puede contener varios Namespaces.

Nota. En JAVA a los Espacios de Nombres, se les llama paquetes. El uso de los espacios de nombres nos permitirá tener nuestros ensamblados agrupados según la tarea para la que los hemos programado. De esta forma, si escribimos ensamblados que accederán al disco, los podemos agrupar para tenerlos en sitio diferente a los que, pro ejemplo, accedan a una base de datos. Eso mismo es lo que se hace en las clases base de .NET Framework y por esa razón existen los espacios de nombres System.IO y System.Data, por poner sólo dos. Cada vez que creamos un proyecto con Visual Studio .NET de forma automática se crea un espacio de nombres para nuestra aplicación. Por tanto todos los tipos (clases, estructuras, enumeraciones, etc.) que definamos en dicho proyecto estarán incluidos dentro de ese espacio de nombres. Aunque el editor de Visual Studio no nos muestra que todo esto es así, ya que para crear o definir un espacio de nombres debemos usar la instrucción Namespace y marcar el final de dicha definición usando End Namespace, por Anexo IV 6-47


tanto, es como si el IDE añadiera esas instrucciones por nosotros. Todos nuestros proyectos estarán dentro de un espacio de nombres. Dicho Namespace se llamará de la misma forma que nuestro proyecto, salvo si tiene espacios, en ese caso se cambiarán los espacios (o caracteres no válidos en un nombre de .NET) por un guión bajo. El escribir nuestro código dentro de un bloque Namespace tiene por finalidad, tal como se ha comentado al principio, el poder mantener una especie de jerarquía. Para que nos entendamos mejor, podríamos comparar los espacios de nombres con los directorios de un disco. En cada directorio tendremos ficheros que de alguna forma están relacionados, de esta forma no mezclaremos los ficheros de música con los de imágenes ni con los proyectos de Visual Basic, por poner algunos ejemplos. Pues lo mismo ocurre con las jerarquías creadas con los Namespace, de forma que podamos tener de alguna forma separados unos tipos de datos (clases, etc.) de otros. Anidar espacios de nombres: espacios de nombres dentro de otros espacios de nombres. Es habitual que dentro de un directorio podamos tener otros directorios, de forma que tengamos ficheros que estando relacionados con el directorio principal no queremos que se mezclen con el resto de ficheros. Pues con los Namespace ocurre lo mismo, podemos declarar bloques Namespace dentro de otro bloque existente. Esto se consigue definiendo un bloque dentro de otro bloque. Por ejemplo:

Namespace CursoLolo Namespace Espacio Module Module1 Sub Main() ‘… End Sub Sub Func() ‘… End Sub End Module End Namespace End Namespace En este código, tenemos dos espacios de nombres anidados, el espacio de nombres Espacio está dentro del espacio de nombres CursoLolo.

Anexo IV 6-48

Visual Basic.Net

10.1. Tipos declarados dentro de un Namespace De igual forma que para acceder a los ficheros de un directorio debemos indicar el «path» en el que se encuentran, con los espacios de nombres ocurre lo mismo. Por ejemplo, si queremos usar la clase StringBuilder que se encuentra declarada en el espacio de nombres System.Text, tendremos que indicar el espacio de nombres en el que se encuentra: Dim sb As New System.Text.StringBuilder() Es decir, debemos indicar el «path» completo de la clase, para poder acceder a ella. En teoría, si declaramos un método dentro del módulo Module1, (mostrado en el código anterior), deberíamos llamar a dicho método usando el espacio de nombres completo, pero cuando estamos dentro de un espacio de nombres, no hace falta indicar el nombre completo, ocurre lo mismo que cuando estamos dentro de en un directorio, no tenemos que indicar el path completo para acceder a un fichero de ese mismo directorio, pero si queremos también podemos hacerlo, tal como se muestra en el siguiente código:

Namespace CursoLolo Namespace Espacio Module Module1 Sub Main() CursoLolo.Espacio.Module1.Func() End Sub Public Sub Func() Console.WriteLine(«Saludos desde el Sub Func») End Sub End Module End Namespace End Namespace Por tanto, para acceder a los miembros declarados dentro de un espacio de nombres, debemos usar la sintaxis: Espacio.nombre_clase.nombremetodo Si dicha clase está dentro de un espacio de nombres anidado, también debemos indicar dicho espacio de nombres. Es decir, siempre debemos indicar los espacios de nombres en los que se encuentran las clases, salvo que la clase (o tipo) esté definido en el mismo espacio de nombres desde el que se va a usar. Aunque existen ciertas formas de hacer que esto no siempre tenga que ser así, ya que el código se puede convertir en algo más engorroso de leer si siempre tenemos que indicar los espacios de nombres que contienen las clases.

Anexo IV 6-49


10.2. Importaciones Pues además de no tener que especificar los espacios de nombres cuando la clase (o tipo) está definido en el mismo en el que queremos usarla, podemos usar lo que se llama importaciones de espacios de nombres, de esa forma podemos acortar el código que tenemos que escribir. Las importaciones de los espacios de nombres se hacen mediante la instrucción Imports. Dicha instrucción se usará al principio del fichero de código y lo que realmente hace es indicarle al compilador que, si no encuentra una clase en el espacio de nombres actual, la busque en el espacio de nombres que hemos importado. Por ejemplo, la clase Console está definida en el espacio de nombres System, si usamos una importación de System en nuestro código (el Visual Studio lo hace de forma automática) no tendremos que indicar la «ruta» completa de dicha clase: System.Console, sino que podemos usarla indicando simplemente Console. La instrucción Imports se usa de la siguiente forma: Imports System. Si queremos importar un espacio de nombres que está «anidado» en otro, lo haremos así:Imports System.Text. Es como si definiéramos un directorio dentro de la variable de entorno PATH, si queremos acceder a aun ejecutable que esté en cualquiera de esos directorios, no nos veremos obligados a indicarlo. Por tanto el uso de Imports lo que hace es indicarle al compilador dónde buscar la definición de los tipos que estamos usando en nuestro código, para así ahorrarnos la escritura de los espacios de nombres que habitualmente usamos. Para importar, por tanto, un espacio de nombre, usamos Imports, seguido del espacio de nombres, al principio de dicho fichero. Una cosa que no hay que confundir son las importaciones de espacios de nombres y las referencias. Las referencias son las que le indican al compilador dónde encontrar las clases (y espacios de nombres) que queremos usar en nuestro proyecto, mientras que las importaciones simplemente hacen que no tengamos que escribir los espacios de nombres importados. Por supuesto, las importaciones (Imports) las podemos realizar no solo con los espacios de nombres definidos en .NET Framework, sino que podemos hacerlas para importar nuestros propios espacios de nombres. Si hacemos una importación de un espacio de nombres, podemos acceder no sólo a las clases (tipos) definidos en ese espacio de nombres, sino también a otros espacios de nombres anidados. Por ejemplo si queremos acceder a la clase StringBuilder que, como hemos visto, está definida en System.Text, es decir, en el espacio de nombres Text que a su vez está definido dentro de System, en Visual Basic podríamos hacerlo así:

Dim sb As New Text.StringBuilder()

Anexo IV 6-50

Visual Basic.Net

10.3. Crear “alias” a los espacios de nombres Un alias es una forma abreviada de usar algo. En el caso de las importaciones de espacios de nombres, podemos crear un alias para un espacio de nombres, de forma que en lugar de escribir todo el espacio de nombres (y subespacios) simplemente usemos ese alias. Por ejemplo, imagine que quiere acceder a las clases del espacio de nombres System.IO pero no quieres realizar una importación completa, con idea de que al escribir dicho alias te muestre todas las clases y demás tipos relacionadas con ese espacio de nombres. En ese caso, podríamos crear un alias al espacio de nombres System.IO de esta forma:

Imports alias = System.IO A partir de ese momento podemos acceder a los tipos definidos en dicho espacio de nombres usando el alias que hemos creado: alias.

10.4. Ejemplos de cómo usar los namespace En el ejemplo que vamos a usar, vamos a definir dos espacios de nombres y en cada uno de ellos declararemos algunas una clase, con idea de que veamos cómo usarlos desde cada uno de esos espacios de nombres. El código sería el siguiente:

Namespace Espacio Module Module1 Sub Main() ‘ declarar una clase del espacio de nombres ClaseUno Dim c1 As New Lolito.FuncA(«Ismael», «Rodriguez») ‘ ‘ declarar una clase del espacio de nombres ClaseDos Dim c2 As New ClasesDos.FuncB(«Maria», «Luz») ‘ Console.WriteLine(«c1 = {0}», c1) Console.WriteLine(«c2 = {0}», c2) ‘ Console.ReadLine() End Sub End Module End Namespace ‘ Namespace Lolito Public Class ClaseA Private _nombre As String Anexo IV 6-51


Private _Apel As String ‘ Public Sub New() End Sub Public Sub New(ByVal nombre As String, ByVal Apel As String) Me.Nombre = nombre Me.Apel = Apel End Sub ‘ Public Property Nombre() As String Get Return _nombre End Get Set(ByVal value As String) _nombre = value End Set End Property Public Property Apel() As String Get Return _Apel End Get Set(ByVal value As String) _Apel = value End Set End Property ‘ Public Overrides Function ToString() As String Return Apel & «, « & Nombre End Function End Class End Namespace ‘ Namespace ClasesDos Public Class ClaseB Inherits Lolito.ClaseA

Anexo IV 6-52

Visual Basic.Net

‘ Public Sub New() End Sub Public Sub New(ByVal nombre As String, ByVal Apel As String) Me.Nombre = nombre Me.Apel = Apel End Sub End Class End Namespace Para poder acceder a las clases desde Main, tenemos que indicar en qué espacio de nombres está cada una de las clases; esto es así porque el módulo que contiene el método Main está declarado dentro de un espacio de nombres diferente. Lo mismo ocurre con la instrucción Inherits Lolito.ClaseA de la clase ClaseB, ya que cada una de las clases está dentro de un espacio de nombres distinto y si no indicamos expresamente ese espacio de nombres, el compilador no sabrá dónde localizar la clase ClaseA. Por supuesto, si hacemos una importación del espacio de nombres Lolito, podríamos acceder a la clase ClaseA sin necesidad de indicar el espacio de nombres que la contiene. En un proyecto (ensamblado) podemos definir varios espacios de nombres. Un espacio de nombres puede estar definido en varios ensamblados y todas las clases (tipos) definidos se podrán acceder como si estuviesen en el mismo proyecto. Podemos importar espacios de nombres para que el compilador sepa dónde buscar las clases.

11. Excepciones 11.1. Definición de error y excepción Los términos error y excepción se suelen utilizar indistintamente. De hecho, un error, que es un evento que sucede durante la ejecución del código, interrumpe el flujo normal del mismo y crea un objeto de excepción. Al producirse la interrupción, el programa intenta buscar un controlador de excepciones, que es un bloque de código que indica cómo reaccionar ante el problema y que ayudará a reanudar el flujo. Es decir, el error es el evento y la excepción es el objeto que crea dicho evento. Con la expresión «iniciar una excepción» los programadores indican que el método en cuestión encontró un error y reaccionó con la creación de un objeto de excepción que contiene información acerca del error y el momento y lugar donde sucedió. Entre los factores que causan el error y las posteriores excepciones se incluyen errores de usuario, de recursos y de lógicas de programación. Dichos errores se relacionan con el modo en que el código realiza una tarea determinada y no con el propósito de ésta.

Anexo IV 6-53


11.2. Control estructurado frente al no estructurado y cuándo utilizar cada uno de ellos El control de excepciones estructurado consiste simplemente en utilizar una estructura de control que contiene excepciones, bloques de código aislados y filtros para crear un mecanismo de control. Con ello se permite que el código realice una distinción entre diferentes tipos de errores y reaccione según las circunstancias. En el control de excepciones no estructurado una instrucción On Error al principio del código controla todas las excepciones. No se puede combinar el control de excepciones de ambos tipos en la misma función. Si se utiliza una instrucción On Error, no se podrá emplear Try...Catch en la misma función. Independientemente del modo que se elija para controlar las excepciones en el código, se debe considerar la situación con cierta perspectiva y analizar qué suposiciones realiza el código. Por ejemplo, si la aplicación solicita al usuario que introduzca un número de teléfono, se tendrán en cuenta las siguientes suposiciones: •

El usuario introducirá un número en lugar de caracteres.

•

El número presentará un formato determinado.

•

El usuario no introducirá una cadena nula.

•

El usuario dispone de un solo número de teléfono.

En la introducción de datos por parte del usuario se pueden infringir todas las suposiciones o cualquiera de ellas. Para que el código resulte eficaz se requiere un control de excepciones apropiado que permita que la aplicación se recupere de forma adecuada frente a infracciones de este tipo. A menos que se pueda garantizar que un método no iniciará una excepción bajo ninguna circunstancia, se debe considerar disponer de un control de excepciones informativo. Dicho control debe resultar útil. Además de indicar que existe algún problema, los mensajes que procedan del mismo deben informar del motivo y lugar donde se ha producido el error. Con los mensajes que no incluyen información alguna además de «ha ocurrido un error» solo se consigue la frustración del usuario.

11.3. Control de excepciones estructurado Con este tipo de control se comfuncn partes específicas del código y cuando se produce la excepción, el código del control de excepciones se adapta a las circunstancias causantes de dicha excepción. En aplicaciones de gran tamaño este método resulta mucho más rápido que el control de excepciones no estructurado; asimismo, permite una respuesta más flexible a los errores y una mayor fiabilidad de la aplicación. La estructura de control Try...Catch...Finally resulta fundamental en el control de excepciones estructurado. Comfunc, una parte del código, filtra las excepciones creadas mediante la ejecución dicho código y reacciona de forma diferente en función del tipo de excepción iniciada. Anexo IV 6-54

Visual Basic.Net

11.4. Bloque Try...Catch...Finally Las estructuras de control Try...Catch...Finally comprueban una parte de código y dirigen el modo en que la aplicación debe controlar las distintas categorías de error. Cada una de las tres partes que componen la estructura realiza una función específica en este proceso. •

La instrucción Try proporciona el código en el que se están comprobando las excepciones.

•

La cláusula Catch identifica bloques de código que se encuentran asociados con excepciones específicas. Un bloque Catch When hace que el código se ejecute en circunstancias específicas. Una cláusula Catch sin otra When reacciona ante cualquier excepción. Por lo tanto, el código debe disponer de una serie de instrucciones Catch...When determinadas que reaccionen, cada una de ellas, ante un tipo específico de excepción, seguidas de un bloque general Catch que reaccione ante cualquier excepción que no se haya interceptado mediante las cláusulas Catch...When anteriores.

•

La instrucción Finally contiene código que se ejecuta independientemente de si ocurre o no una excepción en el bloque Try. Esta instrucción se ejecutará incluso después de Exit Try o Exit Sub. Este código suele realizar tareas de limpieza como el cierre de archivos o la eliminación de búferes.

11.5. Funciones de la cláusula Catch Esta cláusula puede adoptar tres formas: Catch, Catch...As y Catch...When. Una cláusula Catch sin la instrucción When permite que el bloque de instrucciones asociado controle cualquier excepción. Las cláusulas Catch...As y Catch...When interceptan una excepción específica y permiten que el bloque de instrucciones asociado indique a la aplicación qué medidas adoptar. Asimismo, estas dos cláusulas se pueden combinar en una sola instrucción como, por ejemplo, Catch ex As Exception When intResult <> 0. Si la excepción es el resultado de un error de recursos, se debe identificar el recurso en cuestión y proporcionar sugerencias para la solución de problemas. Si la excepción procede de un error de lógicas de programación, es muy probable que la cláusula permita que la aplicación se cierre de la forma más elegante posible. Sin embargo, si un error de usuario ha sido la causa de la excepción, el código debe permitir al usuario corregirlo y poder continuar. Las cláusulas Catch se comprueban en el orden en el que aparecen en el código. Por lo tanto, este tipo de cláusulas se debe enfocar desde lo específico a lo general a medida que progresan a través de la secuencia de código. Por ejemplo, compruebe un tipo antes de realizar la comprobación de su tipo de base. Un bloque catch que controla a System.Exception sólo debe aparecer como bloque final una vez que se hayan agotado las demás posibilidades.

Anexo IV 6-55


Ejemplo: Catch ex As Exception Public Class Forcad1 MsgBox(«Dentro de Excepción») Inherits System.Windows.Forms.Form Finally ‘ Todo Try debe llevar obligatoria/ un Catch Public Sub h() o un Finally Dim a,b,c as Integer MsgBox(«Dentro de Finally») Try End Try a = InputBox(«Introduce el primer número») MsgBox(«El resultado es: « & c) b = InputBox(«Introduce el segundo númeEnd Sub ro») Private Sub Button1_Click(ByVal sender As If b = 1 Then Throw New MethodAccessExSystem.Object, ByVal e As System.EventArgs) ception Handles Button1.Click c=a/b h() Catch ex As ArithmeticException ‘Tipo aritEnd Sub metico End Class c=0 MsgBox(«Dentro de Aritmética») Catch ex As InvalidCastException ‘Tipo formato c=0 MsgBox(«Dentro de Formato»)

Anexo IV 6-56

Anexo V C#.NET


Guión-resumen

1. Introducción a C#.NET

5. Tipos básicos

2. Escritura y compilación de una aplicación básica

6. Instrucciones condicionales

3. Espacios de nombres 4. Aplicaciones con argumentos

Anexo V 6-2

7. Instrucciones iterativas 8. Ejemplos

C#.NET

1.

Introducción a C#.NET

C# (pronunciado en inglés “C Sharp” y en español “C Almohadilla”) es un lenguaje de programación orientado a objetos desarrollado y estandarizado por Microsoft como parte de su plataforma .NET. Como ya se ha visto, es posible escribir código para la plataforma .NET en muchos otros lenguajes, como Visual Basic.NET o JScript.Net. C# es el único que ha sido diseñado específicamente para ser utilizado en esta plataforma. Microsoft suele referirse a C# como el lenguaje nativo de .NET, gran parte de la librería de clases base de .NET ha sido escrito en este lenguaje. Nació en el año 2001 de la mano de Microsoft y se trata de un lenguaje influido por C++ (el código nos recuerda mucho su uso), JAVA, Delphi y Eiffel. Aunque C# forma parte de la plataforma.NET, ésta es una interfaz de programación de aplicaciones, mientras que C# es un lenguaje de programación independiente diseñado para generar programas sobre dicha plataforma. Es posible implementar compiladores que no generen programas para dicha plataforma, sino para una plataforma diferente como Linux. En la web de Microsoft podemos leer de C#: “es un lenguaje orientado a objetos sencillo, moderno, amigable, intuitivo y fácilmente legible que ha sido diseñado con el objetivo de recoger las mejores características de muchos otros lenguajes, fundamentalmente Visual Basic, JAVA y C++, y combinarlas en uno sólo en el que se unan la alta productividad y facilidad de aprendizaje de Visual Basic con la potencia de C++”.

Como curiosidad: El símbolo # viene de sobreponer "++" sobre "++" y eliminar las separaciones, indicando así su descendencia de C++. Los programas de C# se ejecutan en .NET Framework, que incluye un sistema de ejecución virtual denominado Common Language Runtime (CLR) y un conjunto unificado de bibliotecas de clases. CLR es la implementación comercial de Microsoft de Common Language Infrastructure (CLI), norma internacional que constituye la base para crear entornos de ejecución y desarrollo en los que los lenguajes y las bibliotecas trabajan juntos sin problemas. El código fuente escrito en C# se compila en un lenguaje intermedio (IL) conforme con la especificación CLI. El código de lenguaje intermedio, junto con recursos, tales como mapas de “bits” y cadenas, se almacena en disco en un archivo ejecutable denominado ensamblado, cuya extensión es .exe o .dll generalmente. Un ensamblado contiene un manifiesto que ofrece información sobre los tipos, la versión, la referencia cultural y los requisitos de seguridad del ensamblado. Cuando se ejecuta un programa de C#, el ensamblado se carga en CLR, con lo que se pueden realizar diversas acciones en función de la información del manifiesto. A continuación, si se cumplen los requisitos de seguridad, CLR realiza una compilación Just In Time (JIT) para convertir el código de lenguaje intermedio en instrucciones máquina nativas. CLR también proporciona otros servicios relacionados con la recolección automática de elementos no utilizados, el control de excepciones y la administración de recursos. El código ejecutado por CLR se denomina algunas veces “código administrado”, en contraposición al “código no administrado” que se compi-

Anexo V 6-3


la en lenguaje máquina nativo destinado a un sistema específico. En el diagrama siguiente se muestran las relaciones en tiempo de compilación y tiempo de ejecución de los archivos de código fuente de C#, las bibliotecas de clases base, los ensamblados y CLR. La interoperabilidad del lenguaje es una función clave de .NET Framework. Como el código de lenguaje intermedio generado por el compilador de C# cumple la especificación de tipos común (CTS), este código generado en C# puede interactuar con el código generado en las versiones .NET de Visual Basic, Visual C++, Visual J# o cualesquiera de los más de 20 lenguajes conformes con CTS. Un único ensamblado puede contener varios módulos escritos en diferentes lenguajes .NET, y los tipos admiten referencias entre sí como si estuvieran escritos en el mismo lenguaje. Principales características de C#: —

C# es un lenguaje simple, moderno, de propósito-general de programación orientada a objetos.

—

Dispone de todas las características propias de cualquier lenguaje orientado a objetos: encapsulación, herencia y polimorfismo.

—

Ofrece un dat2 de programación orientada a objetos homogéneo, en el que todo el código se escribe dentro de clases y todos los tipos de datos, incluso los básicos, son clases que heredan de System.Object (por lo que los métodos definidos en ésta son comunes a todos los tipos del lenguaje).

—

Permite definir estructuras, que son clases un tanto especiales: sus objetos se almacenan en pila, por lo que se trabaja con ellos directamente y no referencias al montículo, lo que permite accederlos más rápido. Sin embargo, esta mayor eficiencia en sus accesos tiene también sus inconvenientes, fundamentalmente que el tiempo necesario para pasarlas como parámetros a métodos es mayor (hay que copiar su valor completo y no sólo una referencia) y no admiten herencia (aunque sí implementación de interfaces).

—

Es un lenguaje fuertemente tipado, lo que significa se controla que todas las conversiones entre tipos se realicen de forma compatible, lo que asegura que nunca se acceda fuera del espacio de memoria ocupado por un objeto. Así se evitan frecuentes errores de programación y se consigue que los programas no puedan poner en peligro la integridad de otras aplicaciones.

—

Tiene a su disposición un recolector de basura que libera al programador de la tarea de tener que eliminar las referencias a objetos que dejen de ser útiles, encargándose de ello éste y evitándose así que se agote la memoria porque al programador olvide liberar objetos inútiles o que se produzcan errores porque el programador libere áreas de memoria ya liberadas y reasignadas.

—

Incluye soporte nativo para eventos y delegados. Los delegados son similares a los punteros a funciones de otros lenguajes como C++, aunque más cercanos a la orientación a objetos, y los eventos son mecanismos mediante los cuales los objetos pueden notificar de la

Anexo V 6-4

C#.NET

ocurrencia de sucesos. Los eventos suelen usarse en combinación con los delegados para el diseño de “interfaces” gráficas de usuario, con lo que se proporciona al programador un mecanismo cómodo para escribir códigos de respuesta a los diferentes eventos que puedan surgir a lo largo de la ejecución de la aplicación (pulsación de un botón, modificación de un texto, etc.).

2.

—

Incorpora propiedades, que son un mecanismo que permite el acceso controlado a miembros de una clase tal y como si de campos públicos se tratasen. Gracias a ellas se evita la pérdida de legibilidad que en otros lenguajes causa la utilización de métodos Set() y Get() pero se mantienen todas las ventajas de un acceso controlado por éstos proporcionada.

—

Permite la definición del significado de los operadores básicos del lenguaje (+, -, *, &, ==, etc.) para nuestros propios tipos de datos, lo que facilita enormemente tanto la legibilidad de las aplicaciones como el esfuerzo necesario para escribirlas. Es más, se puede incluso definir el significado del operador [] en cualquier clase, lo que permite acceder a sus objetos tal y como si fuesen tablas. A la definición de este último operador se le denomina indizador, y es especialmente útil a la hora de escribir o trabajar con colecciones de objetos.

—

Admite unos elementos llamados atributos, que no son miembros de las clases sino información sobre éstas que podemos incluir en su declaración. Por ejemplo, indican si un miembro de una clase ha de aparecer en la ventana de propiedades de Visual Studio.NET, cuáles son los valores admitidos para cada miembro en ésta, etc.

—

El lenguaje provee soporte para principios de ingeniería de software tales como revisión estricta de los tipos de datos, revisión de límites de “arrays”, detección de intentos de usar variables no inicializadas, y recolección de basura automática.

—

Es usado para desarrollar componentes de software que se puedan usar en ambientes distribuidos. C# es adecuado para escribir aplicaciones desde las más grandes y sofisticadas como sistemas operativos hasta las más pequeñas funciones.

—

Soporte para internacionalización.

Escritura y compilación de una aplicación básica

Este programa lo único que hace al ejecutarse es mostrar por pantalla el mensaje “Hola Mundo”:

// Lolo1.cs class Lolo1 { Anexo V 6-5


public static void Main() { System.Console.WriteLine(“¡Hola Mundo!”); } } Si almacenamos este código en un fichero de texto plano de nombre Lolo.cs podemos compilarlo abriendo una ventana de consola (MS-DOS) y, tras colocarnos en el directorio donde hayamos almacenado el fichero, ejecutando: csc Lolo1.cs Csc es el nombre del compilador de C#, y la orden anterior simplemente indica que deseamos compilar el fichero de código fuente Lolo.cs, y tras ejecutarla el compilador generará un fichero de nombre Lolo.exe que contendrá el ejecutable de nuestra sencilla aplicación de ejemplo. Para ejecutarlo basta escribir: Lolo1 El resultado que veremos por la pantalla será: ¡Hola Mundo! Una vez que ya sabemos cómo compilar y ejecutar aplicaciones escritas en C#, es el momento de analizar detenidamente el significado del código anterior:

1:

class Lolo1

2:

{

3:

public static void Main()

4:

{

5:

System.Console.WriteLine(“¡Hola Mundo!”);

6: 7:

} }

Nótese que se ha eliminado la línea // Lolo.cs: Ejemplo típico que aparecía en la versión original del código. Esto se debe a que es sólo un comentario que se introduce para facilitar la legibilidad del código a los lectores humanos pero que el compilador ignora completamente, por lo que no la incluiremos en el presente análisis. Cabe señalar que en C# se considera comentario a todo aquel texto comprendido entre los caracteres // y el final de la línea donde aparecen y a todo texto comprendido entre los caracteres /* y */. Como se comentó en la introducción, todo el código escrito en C# se ha de escribir dentro de una clase. Así, lo que en la línea 1: se dice es que lo que Anexo V 6-6

C#.NET

a continuación se incluirá es la definición de una clase (class) a la que le daremos el nombre de Lolo1, estando la definición de la misma comprendida entre la primera llave que aparezca (línea 2:) y su correspondiente llave de cierre (línea 7:). Lo que dentro de la definición de la clase se dice (línea 3:) es que va a tener un método de nombre Main cuyo código es el indicado entre la próxima llave de apertura (línea 4:) y su respectiva llave de cierre (línea 6:) Un método no es más que un conjunto de instrucciones a las que se les asocia un nombre, de modo que si posteriormente se desea ejecutarlas basta referenciarlas por su nombre en vez de tener que reescribirlas. La partícula que antecede al nombre del método indica cuál es el tipo de valor que se devuelve tras la ejecución del método, y en este caso es void que significa que no se devuelve nada. Por su parte, los paréntesis que se han colocado tras el nombre del método indican cuáles son los parámetros que éste toma. Estos parámetros permiten variar el resultado de la ejecución del método en cada llamada al mismo, según los valores que para ellos se especifiquen. Como en este caso los paréntesis están vacíos, nuestro método no toma parámetros de ningún tipo. Las palabras public y static que anteceden a la declaración del tipo de valor devuelto son modificadores opcionales del significado de la declaración de método. Public indica que el método es público; es decir, que puede llamársele desde código escrito dentro de cualquier otra clase. En caso de no incluirse este modificador se habría considerado que el método es private, lo que significa que sólo sería correcto llamarle desde dentro de la misma clase en que se declara. Por su parte, static indica que es un método estático; es decir, asociado a la clase dentro de la que se define y no a los objetos que se creen a partir de la misma, por lo que para acceder a él se usará la sintaxis nombreClase.NombreMétodo(parámetros) –en nuestro caso Lolo1.Main()– y no objeto.NombreMétodo(parámetros) como corresponde a los métodos no estáticos. El nombre, modificadores, tipos de parámetros y tipo de valor devuelto que se han dado al método Main() del ejemplo no son arbitrarios, sino que se corresponden con una de las cuatro posibles formas de definir el punto de entrada de nuestra aplicación. Este punto de entrada es sencillamente el método a partir del cual se comenzará a ejecutar el código de nuestra aplicación, y su declaración ha de ser de una de estas cuatro formas posibles:

public static int Main() public static void Main() public static void Main(String[] args) public static int Main(String[] args) El parámetro que puede tomar el método Main() almacena la lista de argumentos con los que se llamó a la aplicación; y como se ve, en caso de que no vayamos a utilizarla no es necesario especificarla en la declaración de Main(). El tipo de este parámetro es String[], que significa que es una tabla de cadenas de texto Anexo V 6-7


(objetos String); y su nombre, que es el que habrá de usarse dentro del código del método Main() para hacerle referencia, puede ser cualquiera (en el ejemplo es “args”). Por otro lado, la primera y última forma de uso del método Main() muestran que éste no tiene porque no devolver ningún valor, sino que puede devolver uno de tipo “int”. Dicho valor sería interpretado como código de retorno de la aplicación, que suele usarse para indicar si la aplicación a terminado con éxito o no. Finalmente, la única línea que nos queda por estudiar de nuestro sencillo programa de ejemplo es precisamente el código a ejecutar; es decir, el código de su método Main().

5:

System.Console.WriteLine(“¡Hola Mundo!”);

Esta instrucción lo único que hace es ejecutar el método WriteLine() de la clase Console. Esta clase viene predefinida en la librería de clases de .NET, y WriteLine() es un método de clase (static) definido dentro de ella (al igual que nuestro Main() lo está en la clase Lolo1) cuyo código lo que hace es imprimir en el dispositivo de salida estándar de nuestra máquina (por defecto, la ventana de consola) la cadena de texto que le pasemos como parámetro. Una cadena de texto es cualquier secuencia de caracteres encerrada entre comillas dobles (“...”), aunque dichas comillas no forman parte de la cadena como puede observarse viendo que al ejecutar el ejemplo no se muestran en pantalla. Antes de continuar es importante resaltar algunos aspectos: 1)

C# es un lenguaje sensible a las mayúsculas, los que significa que no da igual la capitalización con la que se debe escribir cada identificador. Es decir, no es lo mismo escribir Console que COnsole o que CONSOLE, y en caso de que lo hagamos de una de las dos últimas formas el compilador producirá un error indicando que no conoce ninguna clase con ese nombre. Un error común entre programadores acostumbrados a JAVA es llamar al punto de entrada del programa main() en vez de Main().

2)

Todo el código escrito en un fichero de código fuente en C# es autocontenido. Es decir, no son necesarios ni ficheros de cabecera ni ficheros IDL ni ningún otro tipo de fichero adicional aparte del propio fichero de código fuente.

3)

Por defecto, el compilador sólo busca definiciones de clases predefinidas en el fichero mscorlib.dll, y si vamos a usar clases definidas en otro fichero hemos de indicárselo mediante la opción /r del compilador.

4)

C# admite métodos y tipos genéricos, que proporcionan mayor rendimiento y seguridad de tipos, e iteradores, que permiten a los implementadores de clases de colección definir comportamientos de iteración personalizados que el código de cliente puede utilizar.

5)

Una clase puede heredar directamente de una clase primaria, pero puede implementar cualquier número de interfaces. Los métodos

Anexo V 6-8

C#.NET

que reemplazan a los métodos virtuales en una clase primaria requieren la palabra clave override como medio para evitar redefiniciones accidentales. En C#, una estructura es como una clase sencilla; es un tipo asignado en la pila que puede implementar interfaces pero que no admite la herencia.

csc /t:winexe /r:System.Winforms.dll;System.dll;Microsoft.Win32.Interop.dll Fuente.cs

3.

Espacios de nombres

Un espacio de nombres es una forma de organizar las clases definidas en la librería de .NET en grupos de clases relacionadas entre sí. Por ejemplo, dentro del espacio de nombres System usando en el ejemplo Lolo están incluidas todas las clases más frecuentemente usadas en cualquier aplicación .NET. Dado que puede ser tedioso tener que preceder todas nuestras referencias a clases con el nombre del espacio de nombres en que están definidas, en C# también se da la posibilidad de hacer:

using System; class Lolo2 { public static void Main() { Console.WriteLine(“¡Hola Mundo!”); } } Las sentencias using siempre han de incluirse en el fichero fuente antes de la declaración de cualquier clase y permite indicar cuáles son los espacios de nombres que se usaran implícitamente. En nuestro ejemplo, gracias al uso esta sentencia no es necesario preceder la referencia a la clase Console con el nombre del espacio de nombres en que está definida, sino que el compilador automáticamente intentará encontrarla buscándola en el espacio de nombres System. Los espacios de nombres también son útiles para evitar conflictos en caso de que se quiera usar clases de igual nombre pero procedentes de distintos fabricantes, pues las diferenciaríamos por su espacio de nombres. Para esto, es necesario que no coincidan los nombres de estos espacios, y una buena forma de hacerlo es dándoles el nombre de la empresa que desarrolló la clase, o el nombre del dominio de Internet de ésta, etc. Para indicar que una clase forma parte de un espacio de nombres basta incluir su definición dentro de la definición de un espacio de nombres. Por ejemplo, si queremos definir nuestra clase de ejemplo anterior dentro de un espacio de nombres llamado Pruebas bastaría añadir estas líneas:

Anexo V 6-9


using System; namespace Pruebas { class Lolo3 { public static void Main() { Console.WriteLine(“¡Hola Mundo!”); } } }

4.

Aplicaciones con argumentos

Antes se comentó que es posible declarar el método Main() de modo que tome un parámetro de tipo String[] que contenga los argumentos con los que se llamó a la aplicación. Es decir, de una de estas dos formas:

public static void Main(String[] args) public static int Main(String[] args) String[] indica que el parámetro Main() es una tabla de cadenas. Como en la mayoría de lenguajes de programación, una tabla no es más que una conjunto de valores ordenados y de tamaño fijo. Los corchetes [] en la declaración del parámetro indican que éste es una tabla, y String indica que es una tabla de cadenas. Es importante resaltar el hecho de que aunque una tabla siempre tiene un tamaño fijo, éste tamaño no forma parte de la declaración de la misma. Esto permite que una misma variable de tipo tabla pueda almacenar tablas de diferentes tamaños, aunque el tamaño de la tabla almacenada en cada instante no pueda modificarse. Los elementos de la tabla de cadenas que puede tomar como parámetro el método Main() son cada uno de los argumentos con los que se llamó al programa. En C# las tablas se indexan desde 0, lo que significa que su primer argumento se almacena en la posición 0, el segundo en la posición 1, etc. Esto es importante tenerlo presente a la hora de acceder a cada elemento de una tabla, para lo que se usa la notación tabla[posiciónElemento] como muestra la siguiente variante de la clase Lolo.

using System; class Lolo4 { public static void Main(String[] args) { Console.WriteLine(“¡Hola {0}!”, args[0]); } }

Anexo V 6-10

C#.NET

Es importante notar la forma especial en que se ha realizado la llamada al método WriteLine(). En este caso, la cadena a imprimir contiene una secuencia de caracteres de la forma {número} que indica que se ha de mostrar en su lugar el valor del argumento número+2 de WriteLine(). Así, en nuestro ejemplo {0} indica que se ha de mostrar el valor del segundo argumento; es decir, el de args[0], que es el primer argumento con que se llamó a Lolo4 (en los arrays el indice empieza por 0). Ahora cuando ejecutemos el programa hemos de pasarle un argumento y en función del valor que éste tome se mostrará un mensaje de bienvenida personalizado. Por ejemplo, si ejecutamos el programa así: Lolo4 TAIER@S. Se nos mostrará el siguiente mensaje de saludo: ¡Hola TAIER@S!

5.

Tipos básicos Bi ts Rango

Tipo

Descripción

sbyte

Bytes con signo

8

-128 - 127

SByte

byte

Bytes con signo

8

0 - 255

Byte

short

Enteros cortos con signo

16

-32.768 - 32.767

Int16

ushort

Enteros cortos con signo

16

0 - 65.535

UInt16

int

Enteros normales

32

-2.147.483.648 - 2.147.483.647

Int32

uint

Enteros normales sin signo

32

0 - 4.294.967.295

UInt32

long

Enteros largos

64

-9.223.372.036.854.775.808

Int64

ulong

Enteros largos sin signo

64

0 - 18.446.744.073.709.551.615

Uint64

float

Reales con 7 dígitos de precisión

32

1,5x10-45 - 3,4X1038

Float

double

Reales con 15-16 dígitos de precisión

64

5,0x10-324 - 1,7X10308

Double

decimal

Reales con 28-29 dígitos de precisión

128

1,0x10-28 - 7,9X1028

Decimal

oolean

Valores lógicos

32

true, false

Boolean

char

Caracteres Unicode

16

Unicode 0 – Unicode 65535

Char

string

Cadenas de caracteres

var

Permitido por memoria

String

object

Cualquier objeto

var

Depende del objeto

Object

Alias

En C# los tipos básicos son tipos del mismo nivel que cualquier otro tipo del lenguaje. Es decir, heredan de System.Object y pueden ser tratados como objetos de la misma por cualquier rutina que espere un System.Object, lo que cual es muy útil para el diseño de rutinas genéricas, que admitan parámetros de cualquier tipo. En realidad todos los tipos básicos de C# son simples alias de tipos Anexo V 6-11


del espacio de nombres System, como se recoge en la última columna de la tabla. Por ejemplo, sbyte es alias de System.Sbyte y da igual usar una forma del mismo u otra.

6.

Instrucciones condicionales

C# ofrece una serie de instrucciones que permiten ejecutar bloques de código sólo si se da una determinada condición. Éstas son: A) Intrucción If Como la mayoría de los lenguajes de programación, C# incluye la instrucción condicional if, cuya forma de uso es:

if (condición) intruccionesIf else intruccionesElse El significado de esta instrucción es el siguiente: se evalúa la condición indicada, y en caso de ser cierta se ejecutan las instruccionesIf; mientras que si no lo es se ejecutan las instruccionesElse. La rama else es opcional y, si se omite y la condición es falsa, se seguiría ejecutando a partir de la siguiente instrucción al if. Si las intruccionesIf o las instruccionesElse constan de más de una instrucción, es necesario encerrar el conjunto de instrucciones de las que constan entre llaves ({...}) Un ejemplo de aplicación de esta instrucción es esta variante del Lolo:

using System; class Lolo5 { public static void Main(String[] args) { if (args.Length > 0) Console.WriteLine(“¡Hola {0}!”, args[0]); else Console.WriteLine(“¡Hola mundo!”); } } En este caso, si ejecutamos el programa sin indicar ningún argumento al lanzarlo veremos que el mensaje que se imprime es ¡Hola Mundo!, mientras que si lo ejecutamos indicando algún argumento se mostrará un mensaje de bienvenida personalizado (del mismo tipo que en el Lolo2). Anexo V 6-12

C#.NET

Nótese que para saber si se han pasado argumentos en la llamada al programa y tomar una u otra decisión según el caso, lo que se hace en la condición del if es comprobar si la longitud de la tabla de argumentos es superior a 0. Para conocer esta longitud se utiliza la propiedad Length que toda tabla tiene definida. Recuérdese que el tamaño de una tabla es fijo, por lo que esta propiedad es de sólo lectura y no es válido intentar escribir en ella (como por ejemplo, haciendo args.Length = 2). B) Instrucción Switch Para aquellos casos en los haya que ejecutar unos u otros bloques de instrucciones según el valor de una determinada expresión C# proporciona la instrucción condicional switch, cuya forma de uso es:

switch(condición) { case caso1: instrucciones1: break; case caso2: instrucciones2: break; ... default: instruccionesDefecto; break; } El significado de esta instrucción es el siguiente: se evalúa la condición, y si su valor coincide con el de caso1, se ejecutan las instruciones1; si coincide con el de caso2 se ejecutan las instrucciones2; y así para cada caso mientras no se encuentra alguno que coincida con el valor resultante de la evaluación. La rama default es opcional, y en caso de agotarse todos los casos y no encontrarse coincidencia, entonces se pasaría a ejecutar las instruccionesDefecto en caso de que dicha rama apareciese; y si no apareciese, se pasaría directamente a ejecutar la instrucción siguiente al switch. En realidad, la rama default, si se usa, no tiene por qué aparecer la última, aunque se recomienda que lo haga porque ello facilita la legibilidad del código. Un ejemplo de uso de esta instrucción es el siguiente:

using System; class Lolo6 { public static void Main(String[] args) { if (args.Length > 0) switch(args[0]) { case “Oposiciones”: Console.WriteLine(“Hola, estas en oposiciones.”); Anexo V 6-13


break; case “General”: Console.WriteLine(“Hola, estas en un curso estándar.”); break; default: Console.WriteLine(“Hola {0}”, args[0]); } else Console.WriteLine(“Hola Mundo”); } } Ahora, nuestro programa reconoce a algunas personas y les saluda de forma especial. Nótese que al final de cada grupo de instrucciones se ha de incluir una instrucción break que indique el final de la lista de instrucciones asociadas a esa rama del switch. Esta instrucción puede ser sustituida por una instrucción goto usada de la forma goto casoi (o goto default) que indique qué otras ramas del switch han de ejecutarse tras llegar a ella. Además, en la última rama del switch no tiene por qué aparecer obligatoriamente ninguna de estas dos sentencias. Para los programadores habituados a lenguajes como C++ es importante resaltarles el hecho de que, a diferencia de dicho lenguaje, C# obliga a incluir una sentencia break o una sentencia goto al final de cada rama del switch, con la idea de evitar errores muy comunes en este lenguaje, donde no es forzoso hacerlo.

7.

Instrucciones iterativas

C# ofrece un buen número de instrucciones que permiten la ejecución de bloques de códigos repetidas veces. A continuación se comentan las principales: A) Instrucción While Es la instrucción iterativa más común en los lenguajes de programación, y en C# se usa de la siguiente forma:

while (condición) instrucciones El significado de esta instrucción es el siguiente: se evalúa la condición y, en caso de ser cierta, se ejecutan las instrucciones. Tras ejecutarlas, se repite el proceso de evaluar la condición y ejecutar las instrucciones en caso de seguir siendo cierta. Este proceso se repite continuamente hasta que la condición deje de verificarse. Si las instrucciones constan de más de una instrucción es necesario encerrarlas entre llaves, del mismo modo que se comentó para el caso del if. Anexo V 6-14

C#.NET

Un ejemplo de aplicación de esta sentencia es:

using System; class Lolo7 { public static void Main(String[] args) int actual = 0;

{

if (args.Length > 0) while (actual < args.Length) { Console.WriteLine(“¡Hola {0}!”, args[actual]); actual = actual + 1; } else Console.WriteLine(“¡Hola mundo!”); } } En este caso, si se indica más de un argumento en la llamada a nuestro programa se mostrará por pantalla un mensaje de saludo para cada uno de ellos. Observa que la primera línea del método Main() no contiene ahora una instrucción, sino que contiene una declaración de una variable de tipo int, nombre actual y valor inicial 0 que usaremos en la sentencia iterativa para saber cuál es la posición del argumento a mostrar en cada ejecución de la misma. El valor de esta variable se irá aumentando en una unidad, para así asegurar que siempre mantiene el valor adecuado para ir mostrando cada uno de los argumentos de llamada y para asegurar que la instrucción while termine de ejecutarse alguna vez, lo cual ocurrirá cuando se hallan mostrado todos los argumentos. C# no proporciona ningún valor inicial a las variables locales de los métodos, por lo que es tarea del programador proporcionárselos antes de ser leídos. En cualquier caso, si el compilador detecta que en el código hay alguna posibilidad de que se lea algún parámetro no inicializado informará al programador de ello dando error. La idea detrás de todo esto es conseguir evitar errores comunes y difíciles de detectar que se dan en otros lenguajes cuando se olvida inicializar un parámetro y su valor por defecto no es el esperado. B) Instrucción Do...while Es una variante del while que se usa así:

do instrucciones while (condición); Anexo V 6-15


En este caso, el significado de la instrucción es ahora el siguiente: se ejecutan las instrucciones (que en caso de ser varias habrán de ir encerradas entre llaves), y tras ello se evalúa la condición. Si el resultado de evaluarla es cierto se vuelve a repetir el proceso, mientras que si no lo es se continúa ejecutando a partir de la instrucción siguiente al do ... while. Es importante resaltar que en esta instrucción es obligatorio incluir el punto y coma (;) al final del paréntesis de cierre de la condición, ya es un error frecuente entre novatos olvidar incluirlos. Do ... while especialmente útil para aquellos casos en los que hay que asegurar que las instrucciones en él contenidas se ejecuten al menos una vez, aun cuando la condición sea falsa desde el principio. Un ejemplo de su uso es este código:

using System; class Lolo8 { public static void Main() String leído; do

{

{ Console.WriteLine(“Clave: “); leído = Console.ReadLine();

} while (leído != “Donald”); Console.WriteLine(“Hola Donald”); } } Al ejecutarse la aplicación puede observarse que lo que se hace es preguntar al usuario una clave, de modo que mientras no se introduzca la clave correcta (que es Donald), no se continuará con la ejecución de la aplicación; y una vez que se introduzca correctamente se dará un mensaje de bienvenida al usuario. El método ReadLine() de la clase Console detiene la ejecución de la aplicación y la deja en espera de que el usuario introduzca una cadena de caracteres y pulse la tecla ENTER, cadena que es devuelta por el método ReadLine() y que en la aplicación se guarda en la variable de tipo cadena llamada leído para comprobar posteriormente, en la condición del do ... while, si coincide con la clave esperada (Donald). C) Instrucción For Es otra variante del while que permite compactar el código de este tipo de bloques. Su forma de uso es:

Anexo V 6-16

C#.NET

for (inicialización; condición; incremento) instrucciones El significado de esta instrucción es el siguiente: se realizan las inicializaciones de variables indicadas en inicialización y luego se evalúa la condición; si es cierta, se ejecutan las instrucciones indicadas (entre llaves si son varias). Tras ello se ejecutan las operaciones de incremento (o decremento) indicadas y se reevalúa la condición. Mientras ésta sea cierta se irá repitiendo el proceso de ejecución de instrucciones, incremento de variables y reevaluación de la condición hasta que deje de serlo. En caso de que se desee inicializar o declarar varias variables en el campo de inicialización o de que se realizar varias operaciones incremento/decremento en el campo decremento habría que separarlas mediante comas (,). Como se ve, la instrucción for recoge de una forma muy compacta el uso principal de la instrucción while normal, siendo un ejemplo de su uso:

using System; class Lolo9 { public static void Main(String[] args) { if (args.Length > 0) for (int actual = 0; actual < args.Length; actual++) Console.WriteLine(“¡Hola {0}!”, args[actual]); else Console.WriteLine(“¡Hola mundo!”); } }

El funcionamiento de este ejemplo es exactamente el mismo que el del Lolo5, sólo que en este caso se ha aprovechado la eficacia de la instrucción for para hacer reducir mucho más el tamaño del código. Si acaso, cabría señalar la utilización del operador ++ en el campo de incremento, cuyo significado es sumar 1 a la variable sobre la que se aplica. Simétricamente, también está definido el operador —, cuyo significado es restar 1 a la variable sobre la que es aplicado. D) Instrucción Foreach Esta instrucción es la novedad más importante introducida en el juego de instrucciones de C# respecto a JAVA y C++, sus más directos competidores. Se utiliza así:

foreach (tipoElemento elemento in colección) instrucciones Anexo V 6-17


Esta instrucción se utiliza para recorrer colecciones de elementos (por ejemplo, tablas), y su significado es muy sencillo: se ejecutan las intrucciones indicadas (estarán encerradas entre paréntesis en caso de ser varias) para cada uno de los elementos de la colección que se especifica. El siguiente ejemplo muestra cómo se utiliza esta instrucción:

using System; class Lolo10 { public static void Main(String[] args) { if (args.Length > 0) foreach(String arg in args) Console.WriteLine(“¡Hola {0}!”, arg); else Console.WriteLine(“¡Hola mundo!”); } }

El significado de este ejemplo es el mismo que el del Lolo5.

8.

Ejemplos

• Clases y objetos

class Lolo { public Lolo(string dat1, string dat2, string dat3, string dat4) { this.Dat1=dat1; this.Dat2=dat2; this.Dat3=dat3; this.Dat4=dat4; } public double Metodo1 { Anexo V 6-18

C#.NET

get { return this.metodo1; } } protected double metodo1=0; public string Dat1; public string Dat2; public string Dat3; public string Dat4; public void Metodo2(double argum) { Console.WriteLine(“{0} “, argum); this.metodo1 += argum; } public void Metodo3(double argum) { Console.WriteLine(“{0} “, argum); } public void Metodo4(double argum) { Console.WriteLine(“{0} “, argum); this.metodo1 -= argum; } } class Ejemplo { static void Main() { Lolo MiLolo=new Lolo(“TAI”, “2008”, “ADAMS”,”100%Aprobados”); Console.WriteLine(“Los datos de mi Lolo son:”); Console.WriteLine(“Dat1: {0}”, MiLolo.Dat1); Console.WriteLine(“Dat2: {0}”, MiLolo.Dat2); Anexo V 6-19


Console.WriteLine(“Dat3: {0}”, MiLolo.Dat3); Console.WriteLine(“Número de bastidor: {0}”, MiLolo.Dat4); MiLolo.Metodo2(100); Console.WriteLine(“{0} “,MiLolo.Metodo1); MiLolo.Metodo4(75); Console.WriteLine(“{0} “,MiLolo.Metodo1); MiLolo.Metodo3(45); } } C# no soporta herencia múltiple de clases. Una clase puede derivarse de otra, pero no de varias. Sí se puede derivar de otra clase y varias “interfaces”.

class LoloAvanzado:Lolo { public LoloAvanzado(string dat1, string dat2, string dat3, string dat4): base(dat1, dat2, dat3, dat4) {} public override void Metodo2(double argum) { Console.WriteLine(“{0}”, argum); this.metodo1 += argum; } }

LoloAvanzado MiLolo; ... MiLolo = new LoloAvanzado(“TAI”, “2008”, “ADAMS”, “100%Aprobados “); MiLolo.Metodo2(100); Declarar una variable o un puntero en C# se escribe igual que en C:

int a; int* punt;

Anexo V 6-20

C#.NET

• C# soporta la sobrecarga de métodos

namespace Espace { // Aquí van las clases del espacio de nombres }

using Espace.Tipo.Terrestre; ... CLASE1 objeto = new CLASE1 (argumentos); internal class NombreClase{ // miembros de la clase } Si quieres que una clase sea accesible desde otros ensamblados, necesitarás que sea pública, usando el modificador de acceso public:

public class NombreClase { // Aquí se codifican los miembros de la clase } Los indicadores, al igual que las clases, también tienen modificadores de acceso. Si se pone, ha de colocarse en primer lugar. Si no se pone, el compilador entenderá que es private. Dichos modificadores son: MODIFICADOR public protected

COMPORTAMIENTO Hace que el indicador sea accesible desde otras clases. Hace que el indicador sea accesible desde otras clases derivadas de aquella en la que está declarado, pero no desde el cliente.

private

Hace que el indicador solo sea accesible desde la clase donde está declarado.

internal

Hace que el indicador solo sea accesible por los miembros del ensamblaje actual. Anexo V 6-21


Para declarar una variable de uno de estos tipos en C# hay que colocar primero el tipo del CTS o bien el alias que le corresponde en C#, después el nombre de la variable y después, opcionalmente, asignarle su valor:

System.Int32 num=10; int num=10; La variable num sería de la clase System.Int32 en ambos casos: en el primero hemos usado el nombre de la clase tal y como está en el CTS, y en el segundo hemos usado el alias para C#. En todos los lenguajes que cumplen las especificaciones del CLS se usan los mismos tipos de datos, es decir, los tipos del CTS, aunque cada lenguaje tiene sus alias específicos. • Conversiones

int a = System.Int32.Parse(cadena); • Métodos

using System; namespace HolaMundo { class HolaMundoApp { static void Main(string[] args) { Console.WriteLine(“Hola Mundo”); string a = Console.ReadLine(); } } } acceso tipo NombreMetodo(TipoArg1 arguento1, TipoArg2 arguento2 ...) { // implementación del método } Anexo V 6-22

C#.NET

using System; class Clase2 { protected int dat3=0; protected byte dat4=100; public bool Metodo4(byte argum) { if (argum>this.dat4) return false; return this.dat4; } } } • Sobrecarga de métodos

public bool Metodo(single cant) {...} public int Metodo(double argum, double argumento2) {...} public int Metodo(single argum, double argumento2) {...}

• Métodos static

using System; namespace Estado { class Estado { public static ushort Num_aprob() { return 15; } Anexo V 6-23


// miembros de la clase } class EstadoApp { static void Main() { Console.WriteLine(“{0}”, Estado.Num_aprob()); string a=Console.ReadLine(); } } } • Constructores

using System; namespace Constructores { class Objeto { public Objeto() { Console.WriteLine(“Instanciado el objeto”); } } class ConstructoresApp { static void Main() { Objeto o = new Objeto(); string a=Console.ReadLine(); } } } Anexo V 6-24

C#.NET

namespace ConstructoresStatic { class Mensaje { public static string Texto; static Mensaje() { Texto=”Hola “; } } class ConstructoresStaticApp { static void Main() { Console.WriteLine(Mensaje.Texto); string a=Console.ReadLine(); } } }

Anexo V 6-25

Tema 7 Arquitectura cliente/servidor. Modelo de 2 capas. Modelo de 3 capas. Componentes y operación. Arquitecturas de servicios web (WS).


Guión-resumen

1. Introducción 1.1. Sistemas centralizados 1.2. Sistemas distribuidos 1.3. Clasificación de Flynn 2. Arquitectura cliente/servidor 2.1. Componentes 2.2 Tipos de servidores 2.3. Características 3. Aplicaciones cliente/servidor

4. Aplicaciones web 4.1. Estructura de las aplicaciones web 4.2. Servicios web (web services) 4.3. SOAP (Simple Object Access Protocol) 4.4. WDSL (Web Services Description Language) 4.5. UDDI (Universal Description, Discovery and Integration)

3.1. Modelos de distribución cliente/servidor

5. Comunicación cliente/servidor

3.2. Arquitecturas multicapa

5.2. Protocolos RPC (Remote Procedure Call)

3.3. Modelo de dos capas 3.4. Modelo de tres capas

5.1. Protocolos Petición-Respuesta

6. Comunicación entre procesos en UNIX 6.1. Pipes 6.2. Sockets

7-2

Arquitectura cliente/servidor

1.

Introducción

1.1.

Sistemas centralizados

Los sistemas centralizados son aquellos en los que todos los componentes de una aplicación residen en un mismo equipo. Estos sistemas están limitados en escalabilidad puesto que su rendimiento es dependiente de la potencia de una única máquina. Habitualmente son sistemas monolíticos en los cuales no se puede modificar un elemento sin afectar al resto. Existe, por tanto, una falta de escalabilidad, flexibilidad y una dependencia del equipo principal. Los usuarios deben realizar las peticiones en la misma máquina que las va a procesar o bien en terminales conectados a la máquina central. En este último caso, los terminales no tienen capacidad de procesamiento sino que todos los datos son enviados al sistema central para que los procese. Se limitan a recoger las pulsaciones del teclado o movimientos de ratón y a mostrar información en la pantalla. Debido a la utilización de arquitectura cerradas, los sistemas centralizados tienen serias dificultades para comunicarse con otras máquinas y aplicaciones.

1.2.

Sistemas distribuidos

Los sistemas distribuidos solucionan las limitaciones del modelo centralizado repartiendo los elementos de una aplicación entre distintos equipos comunicados por una red. Se puede definir un sistema distribuido como aquel que ofrece servicios implementados sobre una red de ordenadores como si se tratase de un único sistema. El usuario no percibe que su petición está siendo resuelta utilizando para ello distintos sistemas. Unas máquinas interactúan con otras de forma transparente al usuario. Un sistema distribuido se puede construir utilizando: —

Un sistema operativo distribuido en todas las máquinas que participan. Estos sistemas operativos se encargan de repartir automáticamente las tareas entre las distintas máquinas del conjunto, de forma que su ejecución sea transparente a las ubicaciones físicas. Se requiere que todos los equipos utilicen el mismo sistema operativo distribuido. El desarrollo de estos sistemas es complejo y, por este motivo, son escasos. En los años 80 se crearon algunos sistemas operativos distribuidos experimentales como Chorus, Mach, Amoeba, V Kernel y 2K.

—

Una plataforma de servicios de distribución (middleware). Esta plataforma permite la interoperabilidad entre las distintas aplicaciones a través de una red, consiguiendo que ésta sea transparente en la comunicación de las aplicaciones. Aquí se incluyen tecnologías como CORBA (Common Object Request Broker Architecture) de OMG (Object Management Group), DCOM (Distributed Component Object Model) de Microsoft, DCE (Distributed Computing Environment) de Open Group y JAVA RMI (Remote Method Invocation). 7-3


En este tema se estudia un caso particular de sistema distribuido, la arquitectura cliente/servidor, en el cual unos procesos denominados clientes realizan peticiones a otros procesos denominados servidores. Esta arquitectura es la utilizada en Internet, donde el middleware utilizado se corresponde con la familia de protocolos TCP/IP. Por ejemplo: un cliente web (un navegador como Internet Explorer) solicita una página web a un servidor web (que ejecuta por ejemplo el software Apache).

1.3.

Clasificación de Flynn

Aunque todos los sistemas distribuidos constan de varias CPUs, se han propuesto distintas formas de interconectarlas entre sí. Una de las clasificaciones de arquitecturas de ordenadores más conocidas es la de Flynn (1972), que se basa en el análisis de 2 características de los sistemas: número de flujos de instrucciones y número de flujos de datos.

2.

—

SISD (Single Instruction Single Data). Sistema con un sólo flujo de instrucciones y uno sólo de datos. En este grupo se ubican la mayor parte de máquinas que tienen una CPU, desde ordenadores personales hasta “mainframes”.

—

SIMD (Single Instruction Multiple Data). Sistema con un sólo flujo de instrucciones y varios de datos. Se corresponden con los ordenadores vectoriales, los cuales aplican una misma instrucción a un conjunto de datos (vectores o matrices).

—

MISD (Multiple Instruction Single Data). Sistema con múltiples flujos de instrucciones y un único de datos. No se conocen máquinas de este tipo.

—

MIMD (Multiple Instruction Multiple Data). Sistema con múltiples flujos de instrucciones y de datos. Estos sistemas se dividen a su vez en dos tipos, según tengan memoria compartida o no: multiprocesadores y multicomputadoras. Un sistema multiprocesador es en realidad una máquina con varias CPUs. Por el contrario, una multicomputadora se corresponde con un sistema distribuido, formado por varias máquinas, cada una con su propia CPU y memoria, interconectadas a través de una red.


La arquitectura cliente/servidor consiste en un sistema distribuido basado en la compartición de recursos entre unos procesos que los solicitan (clientes) y otros que responden a las solicitudes (servidores). Los recursos que se comparten pueden ser datos, aplicaciones u otro tipo de servicios. Lo habitual es que clientes y servidores sean máquinas distintas interconectadas a través de una red, sin embargo no hay inconveniente en que una misma máquina funcione simultáneamente como cliente y servidor, incluso del mismo servicio. El modelo cliente/servidor está estrechamente ligado a la idea de transparencia. Suelen ser sistemas abiertos en los cuales no hay dependencia con 7-4


el sistema operativo de los equipos. Además, se pueden programar de forma independiente los módulos cliente y servidor. Los usuarios pueden acceder a los servicios ofrecidos desde cualquier punto de la red (transparencia de localización).

2.1.

Componentes

Los elementos básicos de un sistema con arquitectura cliente/servidor son los servidores, los clientes y la red de comunicación: —

Servidores (sistemas back-end). Procesos que responden las peticiones de los clientes. Los servidores deben presentar una interfaz bien definida y pública. Su misión consiste en permanecer a la espera de peticiones por parte de los clientes e ir respondiéndolas a medida que las reciban.

—

Clientes (sistemas front-end). Procesos que realizan peticiones a los servidores. Un cliente no conoce el funcionamiento interno del servidor, sino únicamente su interfaz mediante la cual se comunica. Los clientes son transparentes a la ubicación física del servidor.

—

Red de comunicación. Interconecta los elementos anteriores. Puede ser una red aislada o una red de redes como es el caso de Internet. Además, se incluyen en este apartado los protocolos, sistemas operativos y aplicaciones de red necesarios para intercambiar información por el medio físico. Es posible comunicar máquinas heterogéneas siempre que se utilicen los mismos protocolos de red. Por ejemplo, se puede utilizar la familia de protocolos TCP/IP para lograr comunicación entre un cliente web que corre en una máquina Apple con sistema operativo Mac OS X y un servidor web bajo el sistema operativo Solaris funcionando en una máquina Sun.

2.2

Tipos de servidores

Un servidor no tiene por qué ser siempre una máquina que desempeñe una labor específica en la red, pero sí suele ser así en la mayoría de los casos. Los tipos de servidor más comunes que solemos manejar son: —

Servidor de impresión. Será un servidor que se encargará de gestionar los trabajos de impresión de nuestra red. Con esto nos referimos no sólo a las impresoras físicas, sino también a los puertos de éstas, las colas de impresión, etc.

—

Servidor de disco. Se encargará principalmente del almacenamiento masivo de los trabajos de los usuarios. Para hacer una buena gestión de los servidores de disco, suelen hacerse particiones o incluso generar cuotas de disco para administrar el tamaño utilizado por los usuarios.

—

Servidor de ficheros o servidor de base de datos. Como su nombre indica, serán los servidores a los que accederán los clientes de la red

7-5


cuando necesiten información acumulada en las bases de datos de estos servidores. —

Servidores de terminales. Son servidores que permiten la conexión de otros equipos de la red a sus servicios, de forma que los procesos se ejecutarán en el servidor central, pero podremos acceder a estos servicios “en local” desde cada una de las máquinas conectadas al servidor central.

—

Servidor de comunicaciones. Este tipo de servidores se comporta como un “router” o encaminador, permitiendo la conexión entre distintas redes.

—

Servidor de ejecución remota. Permiten que un programa particular se ejecute en otro ordenador diferente al que estamos utilizando. Hay ocasiones en las que la mayor parte del proceso se realiza en un ordenador personal pero existen algunas tareas que para ejecutarse necesitan los recursos del sistema.

—

Servidor de nombres. En los grandes sistemas existe una gran cantidad de nombres de usuarios, contraseñas, direcciones de red, etc., que hacen difícil y tediosa su gestión. En estos casos los servidores de nombres resultan de gran ayuda, facilitando el almacenamiento y actualización de estos elementos.

—

Servidor de transacciones. Sirven como soporte para la realización o ejecución de procesos transaccionales.

—

Servidor de ventanas. En algunos casos, los gráficos de alta resolución no pueden visualizarse en ordenadores si no cuentan con una pantalla para tal efecto. El servidor de ventanas permite que un ordenador utilice el visualizador de otro ordenador como una estación de trabajo con posibilidades gráficas.

2.3.

Características

A continuación se explican las características de los sistemas cliente/servidor. Estas características son básicamente las mismas que las de los sistemas distribuidos en los cuales están basados.

7-6

—

Compartición de recursos. Según la definición que hemos dado de la arquitectura cliente/servidor recordemos que los servidores ofrecen recursos y los clientes acceden a dichos recursos. Por recursos entendemos archivos, bases de datos, aplicaciones u otro tipo de servicios. Para cada tipo de recursos tendremos servidores distintos: servidor de correo, de impresión, de base de datos, de páginas web, etc. Y, para cada uno de estos servidores, será necesario un cliente específico capaz de comunicarse con el servidor correspondiente: cliente de correo, cliente web, etc.

—

Concurrencia y paralelismo. Los servidores deben estar preparados para atender de forma concurrente a peticiones de distintos clientes. Los servidores implementan los mecanismos de concurrencia y ejecución paralela necesarios para ofrecer esta capacidad. Por ejemplo:


un servidor web con mucho tráfico puede estar recibiendo simultáneamente decenas de peticiones de páginas web. Los clientes obtendrán respuesta de forma transparente al número de peticiones de otros clientes (siempre que el servidor tenga suficiente potencia y la red suficiente capacidad). —

Arquitectura abierta. La arquitectura cliente/servidor está estrechamente ligada a la idea de sistema abierto. Esto es el caso de los protocolos de Internet, los cuales pueden ser implementados por distintos fabricantes y en distintas plataformas, sin que ello suponga ningún obstáculo para las comunicaciones. Otro ejemplo es DCE, citado anteriormente a propósito del “middleware”, el cual constituye un estándar de facto para las tareas de comunicación en sistemas distribuidos, independientemente de su fabricante. DCE incluye servicios de RPC, seguridad, directorio, gestión de transacciones y archivo distribuido.

—

Escalabilidad. La respuesta a la evolución de las necesidades de un sistema con arquitectura cliente/servidor es lo que se conoce como escalabilidad. La escalabilidad puede ser horizontal, si aumentamos o modificamos el número de equipos cliente, o vertical si migramos hacia servidores diferentes (más potentes generalmente). También hay que considerar la escalabilidad de la red de forma que sea capaz de ajustarse a los requerimientos de tráfico del sistema.

—

Interoperabilidad. El sistema distribuido puede estar repartido en máquinas con distintas plataformas con independencia del hardware y del sistema operativo. El middleware es el encargado de permitir la comunicación a través de la red entre las distintas plataformas. Esto, que sería lo ideal, no siempre es posible debido a que cada fabricante de “middleware” puede tener sus propias restricciones.

—

Transparencia. Los sistemas distribuidos son transparentes al usuario en el sentido de que no percibe que sus peticiones están siendo resueltas por un conjunto de máquinas. Pensemos por un momento en las máquinas y bases de datos que intervienen en el momento que compramos una entrada para un concierto desde un cajero automático y, sin embargo, el usuario es ajeno a toda la complejidad tecnológica. El modelo de interconexión de sistemas abiertos (OSI) distingue 8 tipos de transparencia, siendo las dos primeras las más importantes (las dos conjuntamente se conocen como transparencia de red): •

Transparencia de acceso. Podemos acceder al sistema desde distintos puntos de la red. El comportamiento es análogo para peticiones locales que remotas.

•

Transparencia de ubicación. Los usuarios no precisan conocer la ubicación de los servidores. Existen servicios de directorio de objetos que se encargan de resolverlo.

•

Transparencia de concurrencia. Distintos clientes pueden acceder a los mismos objetos de forma concurrente sin interferencia entre los accesos.

7-7


•

Transparencia de réplica. Se pueden replicar objetos con el fin de aumentar la eficiencia y fiabilidad del sistema, sin que los usuarios precisen tener conocimiento de este hecho.

•

Transparencia ante fallos. Se incluyen mecanismos de tolerancia a fallos para que el sistema siga funcionando en caso de situaciones anómalas.

•

Transparencia de migración. Se puede cambiar la ubicación de elementos del sistema sin afectar a la operatoria de los usuarios o aplicaciones.

•

Transparencia de prestaciones. Hace referencia a la reconfiguración del sistema para adaptarlo a las necesidades de carga en cada momento.

•

Transparencia de escalabilidad. El sistema puede crecer sin necesidad de cambios en su estructura.

Si comparamos los sistemas cliente/servidor frente a los sistemas centralizados, encontramos las siguientes ventajas:

7-8

—

Uno de los aspectos que más ha promovido el uso de sistemas cliente/servidor es la existencia de plataformas de hardware cada vez más baratas. Se pueden utilizar componentes, tanto de hardware como de software, de varios fabricantes, lo cual contribuye considerablemente a la reducción de costos y favorece la flexibilidad en la implantación y actualización de soluciones.

—

El esquema cliente/servidor facilita la integración entre sistemas diferentes y comparte información permitiendo, por ejemplo, que las máquinas ya existentes puedan ser aprovechadas pero con interfaces más amigables al usuario. De esta manera, podemos integrar PC’s con sistemas medianos y grandes, sin necesidad de que todos tengan que utilizar el mismo sistema operacional.

—

El uso de interfaces gráficas para el usuario. El esquema cliente/servidor presenta la ventaja, con respecto a uno centralizado, de que no es siempre necesario transmitir información gráfica por la red pues ésta puede residir en el cliente, lo cual permite aprovechar mejor el ancho de banda de la red.

—

En el esquema cliente/servidor es más rápido el mantenimiento y el desarrollo de aplicaciones, pues se pueden emplear las herramientas existentes (por ejemplo los servidores de SQL o las herramientas de más bajo nivel como los sockets o el RPC).

—

La estructura inherentemente modular facilita además la integración de nuevas tecnologías y el crecimiento de la infraestructura computacional, favoreciendo así la escalabilidad de las soluciones.

—

El esquema cliente/servidor contribuye a proporcionar a los diferentes departamentos de una organización, soluciones locales, pero permitiendo la integración de la información relevante a nivel global.


3.

Aplicaciones cliente/servidor

Las aplicaciones cliente/servidor se encuentran divididas funcionalmente de forma que cada módulo pueda ser ejecutado en máquinas distintas. La comunicación entre sus componentes, a través de la red, es posible gracias al middleware, el cual aporta transparencia tanto a los desarrolladores de las aplicaciones como a los usuarios finales de la distribución de la aplicación. En una aplicación típica se pueden distinguir los siguientes módulos funcionales: —

Lógica de presentación. Contiene el código de la aplicación encargado de interactuar con el usuario. Incluye la presentación de información en pantalla, el sistema de ventanas, la lectura de caracteres del teclado y la gestión del ratón, entre otras tareas. Las aplicaciones pueden utilizar una interfaz en modo texto o bien, una interfaz gráfica (GUI, Graphical User Interface) como es el caso de Microsoft Windows o X-Windows.

—

Lógica de negocio. Es la parte de código central de la aplicación la cual realiza el procesamiento de las funciones del sistema. Está programado mediante un lenguaje de alto nivel como puede ser C, C++, JAVA o VisualBasic.

—

Lógica de datos. Se encarga de la manipulación y gestión de datos dentro de la aplicación. Habitualmente los accesos a las bases de datos se realizan mediante consultas de SQL o de otro lenguaje equivalente.

En los sistemas centralizados, estos tres componentes de la aplicación residen en una misma máquina y están mezclados en un mismo programa ejecutable. No existe ninguna distribución de los componentes de la aplicación por lo que ésta se encuentra limitada a la plataforma en la que se ejecuta. Los sistemas distribuidos, en cambio, permiten repartir los componentes de la aplicación entre distintas plataformas interconectadas mediante una red. Sin embargo, ¿cómo se realiza la distribución de los componentes? Para responder a esta pregunta se han propuesto distintos modelos de distribución, que estudiamos más adelante. Con el fin de facilitar el acceso a módulos funcionales que residen en otras máquinas, éstos deben estar encapsulados. La encapsulación aísla los detalles de implementación a los procesos que los invocan. Todos los accesos se realizarán a través de una interfaz bien definida y conocida posibilitando la reutilización de código. Como vemos, la programación de aplicaciones distribuidas guarda similitud con el paradigma de programación orientada a objetos. Otra característica deseable en los módulos funcionales es la portabilidad. Los códigos que han sido desarrollados teniendo en cuenta su portabilidad podrán ser ejecutados en distintas plataformas sin apenas modificaciones. Las peticiones que realizan los procesos cliente a los servidores durante el funcionamiento de una aplicación pueden funcionar en modo síncrono o asíncrono: 7-9


—

Modo síncrono. El cliente, después de enviar un mensaje, queda bloqueado hasta que recibe la respuesta del servidor. A continuación, el cliente puede enviar un nuevo mensaje o seguir el flujo de su programa.

—

Modo asíncrono. El cliente no se bloquea después de enviar un mensaje, por lo que puede enviar un nuevo mensaje justo a continuación. En este modo, además, el servidor podría funcionar de dos formas: con bloqueo o sin bloqueo. En la primera situación, el servidor permanece bloqueado (a la espera) hasta recibir un nuevo mensaje. En el modo de no bloqueo, los mensajes recibidos se irán acumulando en una memoria intermedia (buffer) hasta que ésta se llene. En este momento se enviará una interrupción al proceso servidor.

3.1.

Modelos de distribución cliente/servidor

Existen distintos modelos de distribución cliente/servidor que indican cómo se distribuyen los módulos funcionales (lógica de presentación, lógica de negocio y lógica de datos) entre los procesos cliente y servidor. MODELO PRESENTACIÓN

LÓGICA

LÓGICA

DE

PRESENTACIÓN

DE

LÓGICA

NEGOCIO

Cliente

DE DATOS

Servidor

DISTRIBUIDA

PRESENTACIÓN

Cliente

Servidor

REMOTA

LÓGICA

DE NEGOCIO

Cliente

Servidor

DISTRIBUIDA

DATOS

REMOTOS

DATOS

DISTRIBUIDOS

COMBINACIÓN

7-10

Cliente

Servidor

Cliente Cliente

Servidor Servidor

Cliente

Servidor

—

Modelo de presentación distribuida. Las tareas de presentación están divididas entre cliente y servidor. Las lógicas de negocio y presentación las realiza el servidor. El cliente únicamente se limita a funcionar de forma similar a un terminal que envía pulsaciones de teclado o movimientos de ratón y muestra en pantalla lo indicado por el servidor.

—

Modelo de presentación remota. Las tareas de presentación son responsabilidad exclusiva del cliente. El servidor se encarga de las funciones de negocio y datos.

—

Modelo de lógica de negocio distribuida. Las funciones de negocio se encuentran repartidas entre cliente y servidor. Esto es, parte del procesamiento la realiza el cliente y parte el servidor. Por ejemplo: una aplicación web que realiza cálculos matemáticos la cual parte de los mismos los realiza el cliente (con una función JavaScript) y parte en el servidor


(mediante un Servlet, por ejemplo). Las funciones de presentación están gestionadas por el cliente y las de datos, por el servidor. —

Modelo de datos remotos. El cliente se encarga de las funciones de presentación y negocio. Y el servidor, de las funciones de datos. Por ejemplo: un cliente que realiza todo el procesamiento y las tareas de presentación pero que tiene que recurrir a un servidor de base de datos para consultar o almacenar datos.

—

Modelo de datos distribuidos. Las funciones de datos se encuentran repartidas entre cliente y servidor. La presentación y las funciones de negocio son responsabilidad del cliente.

—

Combinación del modelo de lógica de negocios distribuida y el modelo de datos distribuidos. El cliente se encarga de la presentación, parte de las funciones de negocio y parte de las funciones de datos. El servidor realiza la otra parte de las funciones de negocio y de datos.

3.2.

Arquitecturas multicapa

Según el número de elementos de red que intervienen en una aplicación cliente/servidor, existirán distintos entornos multicapa. El modelo más sencillo consta de tan solo dos capas: un proceso cliente y un proceso servidor. Sin embargo, puede ser necesario distribuir las tareas entre varios procesos servidores. En este caso hablaremos del modelo de tres capas si el cliente se comunica con un servidor y éste a su vez con otro servidor. Hablaremos de modelos multicapa si hay más niveles de servidores.

3.3.

Modelo de dos capas

El modelo de dos capas es el resultado de aplicar directamente los modelos de distribución explicados anteriormente. Las situaciones más habituales son: —

Modelo de datos remotos. La presentación y la aplicación residen en el cliente pero los datos en el servidor. Es lo que se conoce como “cliente grueso”.

—

Modelo de lógica de negocio distribuida. La lógica de negocio de la aplicación se encuentra repartida entre el cliente y el servidor.

—

Modelo de presentación remota. En este caso, el cliente únicamente se encarga de la presentación y el servidor del resto de las funciones. Se trata de un “cliente delgado”.

Los sistemas de dos capas suelen tener como inconveniente una gran dependencia de la lógica de la aplicación con el gestor de bases de datos lo que puede traducirse en una arquitectura cerrada dependiente del suministrador, poca flexibilidad para distribuir las funciones y falta de escalabilidad. Su utilización típica reside en sistemas de soporte de decisión y en aplicaciones sencillas de carácter departamental.

7-11


3.4.

Modelo de tres capas

En el modelo de tres capas, tenemos un cliente que se comunica con un servidor. Hasta aquí es igual que en el modelo de 2 capas. Sin embargo, el servidor se comunica ahora con un segundo servidor. En este modelo, el cliente procesa la lógica de presentación; el servidor intermedio (servidor de aplicaciones), la lógica de negocios y el último servidor (servidor de bases de datos), la lógica de datos. Los componentes son, por tanto: —

Cliente. Se encarga de las funciones de presentación incluyendo la interfaz gráfica de usuario (GUI) si es aplicable. Únicamente interactúa con el servidor de aplicación. El servidor de datos no es accesible desde los clientes.

—

Servidor de aplicaciones. Se sitúa en la capa intermedia. Recibe las peticiones de los clientes, las procesa e interactúa con los servidores de datos cuando sea necesario. Finalmente devuelve los resultados al cliente que los solicitó.

—

Servidor de datos. Contiene las bases de datos o los archivos de la aplicación. El servidor de datos puede ser común para distintos servidores de aplicaciones.

Este modelo tiene una mayor complejidad y coste inicial de implantación que el modelo de dos capas, sin embargo es apropiado para aplicaciones corporativas de cierta envergadura. Ofrece un mayor grado de escalabilidad, de flexibilidad en la distribución de funciones entre las plataformas y una arquitectura abierta.

4.

Aplicaciones web

Las aplicaciones cliente/servidor que sin duda han tenido un mayor desarrollo en los últimos años son las aplicaciones web, caracterizadas por funcionar desde un navegador web en una red TCP/IP. Este tipo de aplicaciones no sólo se utilizan en Internet sino que también resultan muy interesantes para su uso privado en “intranets”. La utilización de tecnologías estándares, abiertas, muy documentadas y con una gran variedad de herramientas de desarrollo reduce los costes iniciales y facilita el mantenimiento, asegurando la inversión inicial gracias a su flexibilidad y escalabilidad.

4.1.

Estructura de las aplicaciones web

En las aplicaciones web, el servidor web actúa como un repositorio de documentos marcados (en lenguaje HTML). Los clientes solicitan mediante un URL el documento que desean obtener. El servidor devuelve al cliente el documento en formato HTML. Finalmente, el navegador cliente interpreta el código HTML y dibuja la página web en pantalla. Este tipo de aplicaciones web clásicas se basan en el modelo de dos capas ya estudiado. Sin embargo, resulta insuficiente para las potentes aplicaciones web actuales en las cuales es necesaria la coordinación de varios servidores. Un caso habitual consiste en: —

7-12

Cliente. Se corresponde con el navegador web del usuario. Solicita páginas al servidor de aplicación.


—

Servidor de aplicación. Es el servidor web con capacidades de procesamiento de códigos. Estos códigos están escritos utilizando alguna tecnología de servidor como ASP, PHP, JSP o Servlets.

—

Servidor de datos. Es un servidor de bases de datos que responde a las peticiones del servidor de aplicación. Ejemplos: MySQL (para sistemas Linux) y Microsoft SQL Server (para Windows).

En el lado servidor, existen múltiples combinaciones tanto de software comercial como de “software” libre, utilizadas por las empresas para desplegar sus aplicaciones web. Sin embargo, son especialmente conocidas las siguientes (sistema operativo + servidor web + lenguaje de páginas dinámicas + servidor de bases de datos): —

Windows + Internet Information Server (IIS) + ASP + SQL Server a través de ADO (ActiveX Data Objets)

—

Unix/Linux + Apache + PHP + MySQL

—

Unix/Linux + Apache Tomcat + JSP/Servlets + Oracle/MySQL a través de una conexión JDBC (JAVA Database Connectivity)

4.2.

Servicios web (web services)

Las aplicaciones web distribuidas que utilizan tecnologías como CORBA (de OMG) o DCOM (de Microsoft) presentan el inconveniente de no utilizar protocolos de comunicación estándares. Esto ocasiona problemas de interoperabilidad cuando queremos comunicar aplicaciones con tecnologías distintas. Una solución la constituyen los denominados servicios web (web services) caracterizados por: —

La utilización de componentes para la implementación de servicios.

—

La utilización de protocolos estándares de Internet (TCP/IP).

—

La utilización del protocolo UDDI (Universal Description, Discovery and Integration, descripción universal, descubrimiento e integración) para registrar los servicios.

—

La utilización de lenguajes de marcado para: •

Describir las “interfaces” de los servicios mediante WSDL (Web Service Description Language, lenguaje de descripción de servicios web).

•

Representar los mensajes que se intercambian las aplicaciones mediante SOAP (Simple Object Access Protocol, protocolo simple de acceso a objetos). SOAP permite que las aplicaciones puedan comunicarse a través de Internet. Tiene cierta similitud con el método post utilizado en los formularios HTML, aunque SOAP está basado en XML.

7-13


Los servicios web son interesantes para la comunicación entre servidores. Por ejemplo: un servidor web necesita mostrar al usuario el tiempo que hará mañana. Como el servidor web no tiene la previsión, podría enviar una consulta a un servidor de predicciones meteorológicas a través de su servicio web correspondiente. La comunicación entre ambos servidores se establecerá mediante el protocolo SOAP, intercambiando mensajes de texto con estructura XML. Finalmente, el servidor web, con la respuesta recibida, preparará una página HTML con el resultado de la previsión y se la enviará al cliente web. A continuación, se detallan los protocolos utilizados en los servicios web.

4.3.

SOAP (Simple Object Access Protocol)

SOAP es un protocolo elaborado para facilitar la llamada remota de funciones a través de Internet, permitiendo que dos programas se comuniquen de una manera muy similar técnicamente a la invocación de páginas Web. El protocolo SOAP tiene diversas ventajas sobre otras maneras de llamar funciones de manera remota como DCOM, CORBA o directamente en TCP/IP. Entre sus caracteristicas tenemos: —

Es sencillo de implementar, probar y usar.

—

Es un estándar de la industria, creado por W3C .

—

Utiliza prácticamente los mismos estándares de la Web: la comunicación se hace mediante HTTP con paquetes virtualmente idénticos; los protocolos de autenticación y encriptación son los mismos; el mantenimiento de estado se hace de la misma forma; se implementa normalmente por el propio servidor Web.

—

Atraviesa "firewalls" y routers, que "piensan" que es una comunicación HTTP.

—

Tanto los datos como las funciones se describen en XML, lo que permite que el protocolo no sólo sea más fácil de utilizar sino que también sea muy sólido.

—

Es independiente del sistema operativo y procesador.

—

Se puede utilizar tanto de forma anónima como con autenticación (nombre/clave).

Las solicitudes SOAP se pueden hacer en tres estándares: GET, POST y SOAP. Los estándares GET y POST son idénticos a las solicitudes hechas por navegadores de Internet. SOAP es un estándar similar a POST, pero las solicitudes se hacen en XML y permiten recursos más sofisticados, como pasar estructuras y arrays. Independientemente de cómo se haga la solicitud, las respuestas siempre son en XML. XML describe perfectamente los datos en tiempo de ejecución y evita los problemas ocasionados por cambios inadvertidos en las funciones, ya 7-14


que los objetos llamados tienen la posibilidad de validar siempre los argumentos de las funciones, haciendo que el protocolo sea muy sólido. SOAP define un estándar llamado WSDL, que describe perfectamente los objetos y métodos disponibles a través de páginas XML accesibles por la Web. La idea es la siguiente: quien publica un servicio, crea también estas páginas. Quien quiera llamar el servicio, puede utilizar estas páginas como "documentación" de la llamada y también utilizarlas antes de llamar las funciones para verificar si cambió algo. SOAP se puede implementar fácilmente en casi cualquier ambiente de programación. Actualmente, existen diversos paquetes de desarrollo SOAP para diversos sistemas operativos y lenguajes de alto nivel. SOAP Versión 1.2 proporciona la definición de información basada en XML que puede ser utilizada para el intercambio de información estructurada y de tipos concretos entre puntos en un entorno descentralizado, distribuido. SOAP está especificado formalmente por un Conjunto de Información XML, que proporciona una descripción abstracta de sus contenidos. Los Conjuntos de Información pueden tener diferentes representaciones a la hora de ser transmitidos. SOAP es fundamentalmente un paradigma de intercambio de mensajes en un solo sentido, sin estado, pero las aplicaciones pueden crear patrones de interacción más complejos (por ejemplo, petición/respuesta, petición/respuestas múltiples, etc.) combinando tales intercambios de un solo sentido con características proporcionadas por el protocolo utilizado y/o información específica de la aplicación en cuestión. SOAP no interfiere en la semántica de cualesquiera datos específicos de aplicación que comunica, ni tampoco en asuntos tales como en enrutamiento de mensajes SOAP, transferencia de datos fiables, cortafuegos que atraviesa, etc. No obstante, SOAP proporciona el marco de trabajo por el que la información de aplicaciones específicas puede comunicarse de forma extensible. También, SOAP proporciona una descripción completa de las acciones que debe realizar un nodo SOAP al recibir un mensaje SOAP. Un mensaje SOAP es fundamentalmente una transmisión en un solo sentido entre nodos SOAP, de un remitente SOAP a un destinatario SOAP, pero se espera que los mensajes SOAP sean combinados por las aplicaciones para implementar patrones de interacción más complejos desde la petición/respuesta a múltiples intercambios "conversacionales" de ida y vuelta. SOAP Versión 1.2 es una infraestructura de mensajería sencilla para la transferencia de información especificada en la forma de un conjunto de Información XML entre un remitente SOAP inicial y un destinatario SOAP final. Los escenarios más interesantes implican habitualmente el intercambio de múltiples mensajes entre estos dos nodos. El intercambio más simple de esta forma es el de un patrón petición-respuesta. Algunos de los primeros usos de SOAP 1.1 enfatizaban el uso de este patrón como el medio para transportar llamadas a procedimientos remotos (RPC), pero es importante hacer notar que no todos los intercambios petición-respuesta SOAP pueden o necesitan ser modelados como RPC. Este último es utilizado cuando existe la necesidad de modelar cierto comportamiento programático, en el que los mensajes 7-15


intercambiados conformen con una descripción predefinida de la llamada remota y se retorno. Un conjunto de escenarios de uso mucho mayor que el cubierto por el patrón petición-prespuesta puede ser modelado simplemente como contenido basado en XML intercambiado en mensajes SOAP para formar una “conversación” de ida y vuelta, en la que la semántica está al nivel de las aplicaciones que envian y reciben los mensajes. Uno de los objetivos de diseño de SOAP Version 1.2 es la encapsulación de la funcionalidad de las llamadas a procedimientos remotos utilizando la extensibilidad y funcionalidad de XML. Para invocar una SOAP RPC, es necesaria la siguiente información: —

La dirección de un nodo SOAP destino.

—

El nombre del método o procedimiento.

—

Las identidades y valores de cualesquiera argumentos que deban ser pasados al método o procedimiento junto con cualquier parámetro de salida y valores de retorno.

—

Una separación clara de los argumentos utilizados para identificar el recurso Web que es el destino real para la RPC, en contraste a aquellos que transportan datos o información de control utilizada para que el recurso de destino procese la llamada.

—

El patrón del intercambio de mensajes que será empleado para transportar la RPC, junto con la identificación del, así llamado, “Método Web” que será utilizado.

Opcionalmente, los datos que deben ser transportados como parte de bloques de encabezado SOAP. Tal información puede ser expresada de por diferentes medios, incluyendo Lenguajes de Definición de Interfaces formales (IDL). Nótese que SOAP no proporciona ningún IDL, formal o informal. SOAP proporciona un modelo para la gestión de situaciones en las que surgen errores durante el proceso de un mensaje SOAP. SOAP distingue entre las condiciones que resultan en un error, y la habilidad de señalar el error al remitente del mensaje erróneo o a otro nodo. La habilidad de señalar el error depende del mecanismo de transferencia utilizado, y un aspecto de la especificación de enlace de SOAP a un protocolo es especificar cómo se señalan los errores, si es que se señalan. El resto de esta sección asume que existe un mecanismo de transferencia para señalar los errores que se producen al procesar los mensajes recibidos, y se concentra en la estructura del mensaje SOAP de error.

7-16


4.4.

WDSL (Web Services Description Language)

Es un formato XML que se utiliza para describir servicios Web. Se trata hoy en día de una recomendación de la W3C. WSDL describe la interfaz pública a los servicios Web. Está basado en XML y describe la forma de comunicación, es decir, los requisitos del protocolo y los formatos de los mensajes necesarios para interactuar con los servicios listados en su catálogo. Las operaciones y mensajes que soporta se describen en abstracto y se ligan después al protocolo concreto de red y al formato del mensaje. WSDL se usa generalmente con SOAP y XML Schema. Un programa cliente que se conecta a un servicio web puede leer el WSDL para determinar qué funciones están disponibles en el servidor. Los tipos de datos especiales se incluyen en el archivo WSDL en forma de XML Schema. El cliente puede usar SOAP para hacer la llamada a una de las funciones listadas en el WSDL. El WSDL 2.0 (borrador a abril de 2007) define y describe los servicios Web modulares, y se utiliza para documentar sistemas distribuidos y para automatizar la comunicación entre aplicaciones. WSDL es un formato XML que describe los servicios de red como un conjunto de puntos finales que procesan mensajes contenedores de información orientada tanto a documentos como a procedimientos. Las operaciones y los mensajes se describen de forma abstracta y después se enlazan a un protocolo de red y a un formato de mensaje concreto para definir un punto final de red. Los puntos finales concretos relacionados se combinan en puntos finales abstractos (servicios). WSDL es extensible, lo que permite la descripción de puntos finales de red y sus mensajes, independientemente de los formatos de los mensajes o protocolos de red utilizados para comunicarse. Dado que los protocolos de comunicaciones y los formatos de mensajes están estandarizados en la comunidad del Web, cada día aumenta la posibilidad e importancia de describir las comunicaciones de forma estructurada. WSDL afronta esta necesidad definiendo una gramática XML que describe los servicios de red como colecciones de puntos finales de comunicación capaces de intercambiar mensajes. Las definiciones de servicio de WSDL proporcionan documentación para sistemas distribuidos y sirven como fórmula para automatizar los detalles que toman parte en la comunicación entre aplicaciones. Los documentos WSDL definen los servicios como colecciones de puntos finales de red o puertos. En WSDL, la definición abstracta de puntos finales y de mensajes se separa de la instalación concreta de red o de los enlaces del formato de datos. Esto permite la reutilización de definiciones abstractas: mensajes, que son descripciones abstractas de los datos que se están intercambiando y tipos de puertos, que son colecciones abstractas de operaciones. Las especificaciones concretas del protocolo y del formato de datos para un tipo de puerto determinado constituyen un enlace reutilizable. Un puerto se define por la asociación de una dirección de red y un enlace reutilizable; una colección de puertos define un servicio.

7-17


Un documento WSDL utiliza los siguientes elementos en la definición de servicios de red: —

Types: contenedor de definiciones del tipo de datos que utiliza algún sistema de tipos (por ejemplo XSD).

—

Message: definición abstracta y escrita de los datos que se están comunicando.

—

Operation: descripción abstracta de una acción admitida por el servicio.

—

Port Type: conjunto abstracto de operaciones admitidas por uno o más puntos finales.

—

Binding: especificación del protocolo y del formato de datos para un tipo de puerto determinado.

—

Port: punto final único que se define como la combinación de un enlace y una dirección de red.

—

Service: colección de puntos finales relacionados.

WSDL no introduce un nuevo lenguaje de definición de tipos. WSDL reconoce la necesidad de disponer de diferentes sistemas de tipos para describir los formatos de mensaje y admite como sistema de tipos canónico la especificación de los esquemas XML (XSD). Sin embargo, puesto que no es razonable esperar una única gramática del sistema de tipos que se utilice para describir todos los formatos de mensajes presentes y futuros, WSDL permite el uso de otros lenguajes de definición de tipos mediante la extensibilidad. WSDL define los mecanismos de enlace común. Éstos se utilizan para adjuntar un protocolo, un formato de datos o una estructura específica a un mensaje abstracto, una operación o un punto final de red. Permite la reutilización de definiciones abstractas.

4.5.

UDDI (Universal Description, Discovery and Integration)

Catálogo de negocios de Internet en el cual el registro en el catálogo se hace en XML. UDDI es una iniciativa industrial abierta. El registro de un negocio en UDDI tiene tres partes: —

Páginas blancas-dirección, contacto y otros identificadores conocidos.

—

Páginas amarillas-categorización industrial basada en taxonomías.

—

Páginas verdes-información técnica sobre los servicios que aportan las propias empresas.

UDDI es uno de los estándares básicos de los servicios Web cuyo objetivo es ser accedido por los mensajes SOAP y dar paso a documentos WSDL, en los que se describen los requisitos del protocolo y los formatos del mensaje solicitado para interactuar con los servicios Web del catálogo de registros.

7-18


UDDI es un registro público diseñado para almacenar de forma estructurada información sobre empresas y los servicios que éstas ofrecen. A través de UDDI, se puede publicar y descubrir información de una empresa y de sus servicios. Se pueden utilizar sistemas taxonómicos estándar para clasificar estos datos y poder encontrarlos posteriormente en función de la categorización. Lo más importante es que UDDI contiene información sobre las interfaces técnicas de los servicios de una empresa. A través de un conjunto de llamadas a API XML basadas en SOAP, se puede interactuar con UDDI tanto en tiempo de diseño como de ejecución para descubrir datos técnicos de los servicios que permitan invocarlos y utilizarlos. De este modo, UDDI sirve como infraestructura para una colección de “software” basado en servicios Web. A partir de la creación de esta infraestructura para servicios Web, los datos sobre estos servicios se pueden encontrar de forma sistemática y confiable en una capacidad universal totalmente independiente de proveedores. Se pueden llevar a cabo búsquedas categóricas precisas utilizando sistemas de identificación y taxonómicos extensibles. La integración de UDDI en tiempo de ejecución se puede incorporar a las aplicaciones. Como resultado, se fomenta el desarrollo de un entorno de software de servicios Web. No existen requisitos de propietario respecto al modo en que el operador del host implementa su nodo. El nodo público UDDI constituye un claro ejemplo de que el modelo de servicios Web XML funciona en entornos heterogéneos. UDDI es relativamente ligero; se ha diseñado como registro, no como depósito. La diferencia, aunque sutil, resulta esencial. Un registro redirige al usuario a recursos, mientras que un depósito sólo almacena información. UDDI se basa en identificadores únicos globales (GUID) para garantizar la capacidad de búsquedas y determinar la ubicación de recursos. En última instancia, las consultas a UDDI conducen a una interfaz (un archivo .WSDL, .XSD, .DTD, etc.) o a una implementación (como un archivo .ASMX , ASP, …) ubicadas en otro servidor. WSDL se ha convertido en una pieza clave de la pila de protocolos de los servicios Web. Por eso, es importante saber cómo colaboran UDDI y WSDL y por qué la idea de interfaces frente implementaciones forma parte de cada protocolo. WSDL y UDDI se diseñaron para diferenciar claramente los metadatos abstractos y las implementaciones concretas. Para entender cómo funcionan WSDL y UDDI resulta esencial comprender las consecuencias de esta división. WSDL distingue claramente los mensajes de los puertos: los mensajes (la sintaxis y semántica que necesita un servicio Web) son siempre abstractos, mientras que los puertos (las direcciones de red en las que se invoca al servicio Web) son siempre concretos. No es necesario que un archivo WSDL incluya información sobre el puerto. Un archivo WSDL puede contener simplemente información abstracta de interfaz, sin facilitar datos de implementación concretos, y ser válido. De este modo, los archivos WSDL se separan de las implementaciones. Una de las consecuencias más interesantes de esto es que pueden existir varias implementaciones de una única interfaz WSDL. Este diseño permite 7-19


que sistemas dispares escriban implementaciones de la misma interfaz, para garantizar así la comunicación entre ellos. Si tres empresas diferentes implementan el mismo archivo WSDL y una parte del “software” de cliente crea el código auxiliar/proxy a partir de esa interfaz, dicho “software” se podrá comunicar con las tres implementaciones con el mismo código de base, cambiando simplemente el punto de acceso. UDDI establece una distinción similar entre la abstracción y la implementación con el concepto de tModels. La estructura tModel, abreviatura de “Technology Model” (modelo de tecnología), representa huellas digitales técnicas, interfaces y tipos abstractos de metadatos. El resultado de los tModels son las plantillas de enlace, que son la implementación concreta de uno o más tModels. Dentro de una plantilla de enlace se registra el punto de acceso de una implementación particular de un tModel. Del mismo modo que el esquema de WSDL permite separar la interfaz y la implementación, UDDI ofrece un mecanismo que permite publicar por separado los tModels de las plantillas de enlace que hacen referencia a ellos. Por ejemplo, un grupo industrial o de estándares publica la interfaz canónica para un sector particular y, a continuación, varias empresas escriben implementaciones de esta interfaz. Cada una de estas implementaciones haría referencia al mismo tModel. Los archivos WSDL constituyen un ejemplo perfecto de tModel de UDDI.

5.

Comunicación cliente/servidor

5.1.

Protocolos Petición-Respuesta Petición-Respuesta, es el método básico de las comunicaciones Cliente-Servidor.

Este tipo de comunicación suele ser síncrona. Como recordaremos, esto significaba que el proceso cliente se “bloqueaba” mientras esperaba una respuesta del proceso servidor. Esta respuesta no es otra cosa que la confirmación de la entrega de la petición que ha efectuado el proceso cliente. Es posible también, aunque no es lo normal que las comunicaciones cliente-servidor, sean también asíncronas. Esto sólo ocurrirá cuando el cliente sea capaz de recibir más tarde las confirmaciones y continuar con el resto de los procesos. Algunos ejemplos de sistemas operativos distribuidos, que soportan este tipo de comunicaciones solicitud-respuesta, son: —

Chorus.

—

Amoeba.

—

V.

—

Mach.

Estos sistemas, utilizan diferentes variables de comunicación: —

7-20

Ejecutar Operación (DoOperation).


—

Conseguir Petición (GetRequest).

—

Enviar Respuesta (SendReply).

A continuación, las estudiamos con más detenimiento: —

Ejecutar Operación (DoOperation) La utiliza el proceso cliente para realizar operaciones remotas. En esta variable o primitiva, van integrados el identificador del puerto del servidor junto con la solicitud de mensaje, además de un buffer que se encargará de recibir el mensaje de respuesta. La solicitud de mensaje, especifica qué operación del servidor se va a ejecutar. Cuando se ejecuta esta primitiva, el cliente quedará bloqueado hasta que reciba el mensaje de respuesta del servidor.

—

Conseguir Petición (GetRequest) Esta primitiva es utilizada por el servidor para agilizar el proceso de respuesta solicitado por el cliente.

—

Enviar Respuesta (SendReply) Es utilizada por el servidor, una vez que ha efectuado la solicitud del cliente. En este momento envía un mensaje de respuesta (Sendreply) al cliente diciéndole que se ha efectuado la operación requerida. Cuando el cliente recibe este mensaje, se desbloquea y continúa con sus procesos. Un método de detección de errores utilizado en este tipo de procesos, es la existencia de un mecanismo de temporización para la primitiva Ejecutar Operación (DoOperation), de esta forma se evita que ante un fallo el proceso emisor se quede esperando de forma indefinida.

5.2.

Protocolos RPC (Remote Procedure Call) Existen varios tipos de RPC (Ejecución de Procedimientos Remotos). A continuación vamos a estudiar tres de los protocolos que se utilizan en los RPC: —

Protocolo de Petición (R) (request).

—

Protocolo de Petición-Respuesta (RR) (request-reply).

—

Protocolo de Petición-Respuesta-Confirmación (RRA) (request-reply-acknowledge).

El protocolo de Petición sólo conllevará un mensaje que será el de la propia petición; el protocolo de Petición-Respuesta, efectuará dos mensajes: el de 7-21


petición por parte del cliente y el de respuesta por parte del servidor; el protocolo de Petición-Respuesta-Confirmación, como su nombre indica ejecutará tres mensajes, petición (cliente), respuesta (servidor) y confirmación (cliente).

6. 6.1.

•

El protocolo R se utilizará siempre que no se requiera una respuesta del servidor, ni ninguna confirmación de que el proceso ha sido ejecutado. Según esto, el cliente no sufrirá ningún tipo de bloqueo, ya que no estará esperando ninguna respuesta, por lo tanto podrá continuar con sus procesos.

•

El protocolo RR, está basado en el protocolo petición-espuesta (request-reply), y se utilizará en la mayoría de las comunicaciones cliente-servidor. En este caso el mensaje de respuesta del servidor es considerado también como la confirmación de que el proceso ha sido ejecutado.

•

En el protocolo RRA, el mensaje de confirmación contiene un identificador de petición del mensaje que está siendo confirmado.

Comunicación entre procesos en UNIX Pipes

Pipe o tubería fue en principio el único método de comunicación entre procesos en Unix. En los sistemas Unix, tanto el proceso cliente, como el proceso servidor se “ejecuta” en el mismo ordenador. El “pipe” no se utiliza en los entornos de red, puesto que no son adecuados para las comunicaciones petición/respuesta. El sistema operativo UNIX fue el precursor del desarrollo de los sistemas distribuidos. Desarrollado entre 1969 y 1974 por Ritchie y Thompson. Ya en sus primeras versiones proporcionaba facilidades para la comunicación entre procesos concurrentes dentro de un mismo ordenador. Podríamos afirmar que este sistema operativo es un caso particular de sistema distribuido en el que los procesos cliente y los procesos servidor están localizados en el mismo ordenador. Los programas de usuario se ejecutan concurrentemente en la misma máquina ocupando zonas distintas de la memoria. Originalmente, el único método de comunicación entre procesos fue el pipe (tubería) –una secuencia (stream) de bytes unidireccionales sin nombre– y sin soporte para las comunicaciones de red. Realmente, no se utilizan en los entornos de red, pues aunque fuesen extendidos para operar en red, no son adecuados para comunicaciones del tipo petición/respuesta.

6.2.

Sockets

Una forma de especificar el destino de un mensaje es mediante una dirección “socket”, que no es otra cosa que un puerto local y una dirección de Internet. Las comunicaciones de este tipo van ligadas a parejas de “sockets”, cada uno de ellos correspondiente a cada uno de los procesos que se comunican. La comunicación consiste en un intercambio de información al transmitir ésta en un mensaje entre un “socket” en un proceso y un “socket” en el otro pro7-22


ceso. Los mensajes se encolan en el socket emisor hasta que el protocolo de red lo ha transmitido y se ha recibido una confirmación de llegada, en caso de que lo requiera el protocolo (Ej. TCP). Cuando los mensajes han llegado, se encolan en el “socket” receptor hasta que el proceso receptor realiza la apropiada llamada al sistema para que éste lo reciba. Cualquier proceso puede crear un “socket” para establecer una comunicación con otro proceso. Esto se lleva a cabo mediante una llamada al sistema de creación de “socket”, cuyos argumentos especifican el dominio de la comunicación (normalmente Internet), el tipo (datagrama o stream) y algunas veces el protocolo en particular que se usará, TCP/IP para datagramas o UDP/IP para streams. Un socket es al sistema de comunicación entre ordenadores lo que un buzón o un teléfono es al sistema de comunicación entre personas: un punto de comunicación, por el cual se puede emitir o recibir información. La comunicación entre procesos a través de “sockets” se basa en la filosofía cliente-servidor: un proceso en esta comunicación actuará de proceso servidor creando un “socket” cuyo nombre conocerá el proceso cliente, el cual podrá “hablar” con el proceso servidor a través de la conexión con dicho socket nombrado. El proceso crea un “socket” sin nombre cuyo valor de vuelta es un descriptor sobre el que se leerá o escribirá, permitiéndose una comunicación bidireccional, característica propia de los “sockets” y que los diferencia de los Pipes, o canales de comunicación unidireccional entre procesos de una misma máquina. El mecanismo de comunicación vía “sockets” tiene los siguientes pasos: —

El proceso servidor crea un socket con nombre y espera la conexión.

—

El proceso cliente crea un socket sin nombre.

—

El proceso cliente realiza una petición de conexión al socket servidor.

—

El cliente realiza la conexión a través de su socket mientras el proceso servidor mantiene el socket servidor original con nombre.

Es muy común en este tipo de comunicación lanzar un proceso hijo, una vez realizada la conexión, que se ocupe del intercambio de información con el proceso cliente mientras el proceso padre servidor sigue aceptando conexiones. Para eliminar esta característica se cerrará el descriptor del “socket” servidor con nombre en cuanto realice una conexión con un proceso “socket” cliente. Todo socket viene definido por dos características fundamentales: •

El tipo del socket, que indica la naturaleza del mismo, el tipo de comunicación que puede generarse entre los “sockets”.

•

El dominio del socket especifica el conjunto de sockets que pueden establecer una comunicación con el mismo.

Para que la comunicación entre sockets sea posible el socket emisor debe estar enlazado con el “socket” receptor. Las llamadas al sistema que generan 7-23


estos enlaces se llaman “bind”. El “bind” consta de un descriptor de su “socket” y la dirección del este “socket”.

6.2.1. Protocolo Datagrama Para enviar un datagrama, se necesitan un par de “sockets” cada vez que se realiza una comunicación. Como hemos visto antes, esto se conseguía mediante las llamadas al sistema (bind). Una vez enlazados los sockets necesarios, estas llamadas al sistema se ocuparán de pasar el mensaje (datagrama) a los protocolos UDP e IP, de esta forma el mensaje será transmitido. Como recordaremos, UDP era un protocolo poco fiable, por lo tanto no se recibirá confirmación de entrega de ese mensaje.

6.2.2. Protocolo Stream Con este protocolo, el proceso de creación de la comunicación se establece del mismo modo que con el protocolo datagrama, pero, en este caso el argumento de la función que identifica al protocolo será SOCK_STREAM. Otra diferencia que se establece con el otro protocolo es que en este caso el proceso es asimétrico, es decir, que uno de los sockets (servidor) se mantendrá escuchando a la espera de una petición de conexión desde el proceso cliente. Los datos se transfieren sin encuadrarlos en registros ni bloques. El protocolo de comunicaciones con streams es un protocolo orientado a conexión, ya que para establecer una comunicación utilizando el protocolo TCP, hay que establecer en primer lugar una conexión entre un par de sockets. Uno de ellos atiende peticiones de conexión (el servidor), el otro solicita una conexión (el cliente). Una vez que los sockets están conectados, se pueden utilizar para transmitir en ambas direcciones. Comparación socket-pipe como mecanismos de comunicación entre procesos: SOCKETS

7-24

PIPES

Referencia por descriptores

Referenciado por array de descriptores

Admite comunicación entre procesos de distintas máquinas

Sólo admite comunicación entre procesos de la misma máquina

Comunicación bidireccional

Comunicación unidireccional

Filosofía cliente-servidor

Simple intercambio de información

Tema 8 Aplicaciones Web. Tecnologías de programación. JavaScript, applets, servlets, servicios Web. Lenguajes de descripción de datos: HTML y XML. Navegadores y lenguajes de programación web. Lenguajes de script.


Guión-resumen

1. Aplicaciones web 2. Tecnologías de programación 3. JAVA Script 4. Applets 5. Servlets 6. Servicios Web

8-2

7. Lenguajes de descripción de datos: HTML 8. Lenguajes de descripción de datos: XML 9. Navegadores y lenguajes de programación web. Lenguajes de script

Aplicaciones Web

1.

Aplicaciones web

El principal lenguaje utilizado para la creación de páginas web es HTML (HyperText Markup Language, lenguaje de marcas con hipertexto). No se considera un lenguaje de programación sino únicamente se habla de “lenguaje de marcas”. Las marcas o etiquetas son trozos de código que habitualmente delimitan un texto para asociarle un significado o unas características. Por ejemplo, el código:
Página web
indica que el texto “Página web” es un título importante en el documento. Los códigos colocados entre los signos “< “y” >” son las etiquetas. Las páginas web tienen habitualmente las extensiones .htm y .html. HTML es un subconjunto de SGML (Standard Generalized Markup Lenguage, lenguaje de marcas estándar generalizado). Contiene etiquetas con un significado fijo (por ejemplo, siempre indica texto centrado). Se entremezclan información estructural y de presentación. XML (eXtensible Markup Lenguage, lenguaje de marcas extensible) es también un derivado de SGML. Se trata de un metalenguaje utilizado para definir nuevos lenguajes. En XML, el significado de las etiquetas puede variar. Sólo se define la estructura. Ejemplo: Juan 912345678 (no especificamos cómo se debe mostrar esta información). Otras características de XML son anidación de niveles y posibilidad de validación de documentos, para comprobar que su sintaxis es correcta. El metalenguaje XML se ha utilizado para redefinir el lenguaje HTML, generando el lenguaje XHTML (eXtensible HyperText Markup Lenguage). XHTML se considera la evolución de HTML para la creación de páginas web. El organismo encargado del desarrollo técnico de los estándares de la Web es W3C (World Wide Web Consortium, www.w3.org). En su web podemos encontrar las especificaciones o recomendaciones de los lenguajes HTML, XML y XHTML, entre otros. El elemento principal de una página web es el enlace o link a otra página. Esta posibilidad de saltar de unas páginas a otras es lo que se conoce como navegación. En realidad, el nombre de web (telaraña) procede precisamente del entramado de enlaces entre unas páginas y otras. Una página web puede contener texto, elementos multimedia (principalmente imágenes), enlaces y objetos incrustados (como scripts, applets de JAVA u objetos Flash). Los principales formatos de imágenes utilizados en páginas web son: —

GIF (Graphics Interchange Format). Formato propietario de Compuserve. Apropiado para pequeños iconos y dibujos, que utilizan colores sólidos, no degradados. 256 colores como máximo. Permite animaciones (una secuencia de imágenes GIF mostradas de forma circular) y transparencias (un color es marcado como transparente). Utiliza compresión sin pérdida.

—

JPEG o JPG (Joint Photographics Experts Group, grupo de expertos fotográficos unidos). Formato abierto que soporta hasta 16 millones 8-3


de colores. Sus características son opuestas a GIF. Apropiado para fotografías. Se puede elegir el ratio de compresión: a más compresión, menor tamaño pero menor calidad de imagen. —

PNG (Portable Network Graphics, gráficos portables de red). Formato abierto, propuesto recientemente por W3C, para sustituir al formato propietario GIF. Utiliza compresión sin pérdida y admite 16 millones de colores. Permite guardar imágenes en modo entrelazado para que el visitante de la página vaya viendo la imagen progresivamente a medida que el navegador la carga (esto también es posible con GIF y JPEG). Soporta canales alfa, para especificar hasta 256 grados de transparencias. PNG no admite animaciones, en su lugar se está desarrollando el formato MNG (Multiple image Network Graphics, gráficos de red de imagen múltiple).

Para separar la estructura de la presentación de los documentos HTML, se recomienda utilizar hojas de estilo CSS (Cascade style sheets, hojas de estilo en cascada). Una hoja de estilos permite definir cuál será la apariencia de la estructura del documento. Por ejemplo, mediante CSS se puede definir que todas las etiquetas
(título importante) tengan asociada las características de presentación “color rojo” y “centrado”. Se puede utilizar una única hoja de estilos en todo un sitio web para economizar código y facilitar los posibles cambios de presentación futuros. Las páginas utilizadas tradicionalmente en los servidores web son páginas estáticas: el servidor ofrece siempre el mismo contenido cuando el usuario las solicita. Estas páginas suelen tener extensión .htm o .html. Sin embargo, debido a las necesidades crecientes de los sitios web, se han desarrollado lenguajes específicos para páginas dinámicas. Cuando el usuario solicita la página, el servidor interpreta el código fuente de la página, genera un código HTML y lo devuelve al usuario. Las páginas dinámicas se utilizan habitualmente para realizar consultas a bases de datos y ofrecer así, resultados dinámicos al usuario.

2.

Tecnologías de programación Los principales lenguajes de páginas dinámicas son: —

ASP (Active Server Pages, páginas activas de servidor). Lenguaje propietario de Microsoft. Programación basada en Visual Basic.

—

PHP (Hypertext Preprocessor, preprocesador de hipertexto). Lenguaje abierto con sintaxis similar a C.

—

JSP (JavaServer Pages, páginas JAVA de servidor). Sintaxis basada en JAVA.

Otras tecnologías relacionadas con las páginas web que debemos conocer son: —

8-4

DHTML (Dynamic HTML, HTML dinámico). Permite modificar las propiedades de presentación de un documento después de haberse cargado en el navegador del usuario. Esto es lo que se conoce como

Aplicaciones Web

“dotar de movimiento” a una página. Mediante DHTML podríamos hacer que una imagen se desplazara continuamente por la pantalla. Esto es posible mediante un código JavaScript que modifique continuamente las coordenadas de la imagen establecidas inicialmente en la hoja de estilos del documento. —

VRML (Virtual Reality Markup/Modeling Language, lenguaje de marcas/modelado de realidad virtual). Ofrece al usuario la posibilidad de realizar acciones dentro de escenarios tridimensionales de realidad virtual.

—

SMIL (Syncronized Multimedia Integration Language, lenguaje de integración de multimedia sincronizado). Desarrollado por W3C, permite crear presentaciones utilizando un conjunto de objetos multimedia independientes. El programador puede definir la situación de los objetos y su comportamiento temporal. Está basado en XML.

HTML es un lenguaje estático, no tiene estado. Esto significa que las páginas servidas al usuario siempre serán las mismas, no pudiéndose adaptar a las preferencias o decisiones que haya tomado el usuario en páginas visitadas anteriormente. Cada página HTML funciona como un programa independiente, por lo que no existe el concepto de variable como medio para pasar información entre las páginas de un mismo sitio web. En realidad, la única interacción posible que ofrece HTML es a través de los enlaces y los formularios. Pero observemos que los formularios de HTML sólo recogen información del usuario, no la tratan. HTML no es suficiente para procesar la información que el usuario ha escrito en un formulario. Para aumentar las posibilidades de HTML, se han desarrollado diferentes tecnologías de programación web. Estas tecnologías se pueden clasificar en función de dónde se ejecuten. —

En el servidor. El servidor web ejecuta el código de programación y genera HTML. El navegador del cliente recibe únicamente HTML, por lo que no llega a ver la programación del servidor.

—

En el cliente. El servidor envía un código de programación al cliente, sin entender lo que envía. El navegador del cliente ejecutará el código.

Una tecnología que tiene parte de cliente y parte de servidor son las cookies. Se trata de archivos con información del usuario que la almacena el servidor web en el ordenador del usuario. La información que se acostumbra almacenar en las cookies es aquella propia de cada usuario (sus preferencias de navegación por el sitio web, el identificador de la sesión del usuario, los artículos que ha comprado en un comercio virtual, su nombre, etc.). Las cookies tienen una caducidad definida por el sitio web. Esta información la genera y la guarda el servidor web para posteriormente consultarla. Se utiliza habitualmente para pasar información de unas páginas a otras de un mismo sitio web. El navegador del usuario utiliza un directorio para el almacenamiento de las cookies de los distintos sitios web que lo requieren. Un sitio web no debería poder consultar una cookie que no ha introducido.

8-5


2.1.

Tecnologías en el lado servidor Se ejecutan en el servidor las páginas dinámicas (ASP, PHP, JSP), los CGIs y los serv-

lets. La tecnología CGI (Common Gateway Interface, interfaz común de pasarela) permite ejecutar programas externos en el servidor web. Se utilizó frecuentemente para el acceso a bases de datos, tratamiento de formularios, buscadores, etc. El principal lenguaje utilizado para el desarrollo de CGIs es Perl. Los CGIs son programas independientes que habitualmente se invocan desde un formulario HTML (atributo action). Su mayor problema es que son poco eficientes cuando reciben muchas peticiones simultáneas. Esto es debido a que cada vez que un usuario ejecuta un CGI, se abre una instancia nueva del programa en el servidor, con el consiguiente consumo de memoria y CPU. En su lugar, se prefiere en la actualidad la utilización de páginas dinámicas o “servlets”. Las páginas dinámicas incluyen código de programación mezclado entre el código HTML. Estos códigos se conocen con el nombre de scripts. El servidor web comienza leyendo la página desde el principio. Cuando el código es HTML, se lo envía tal cual al cliente. Sin embargo, cuando el código es un script de servidor, lo ejecuta y genera un código HTML que envía al cliente. La página HTML que recibe el cliente ha sido, por tanto, construida dinámicamente (en tiempo de ejecución) según su petición. Las aplicaciones de las páginas dinámicas son las mismas que en los CGIs: acceso a bases de datos, formularios, etc. Los principales lenguajes de programación de páginas dinámicas son: ASP (Active Server Pages, páginas activas de servidor) de Microsoft; PHP (Hypertext Preprocessor, preprocesador de hipertexto), que es un proyecto de Apache Software Foundation y cuya utilización es libre y gratuita; y JSP (JavaServer Pages, páginas de servidor de JAVA), que es un proyecto del mundo JAVA, liderado por Sun Microsystems. ASP es propio del servidor web de Microsoft, Internet Information Server (IIS). PHP se acostumbra a utilizar en servidores Apache (Linux, Unix, etc.). JSP también es frecuente en entornos Unix. Para delimitar códigos ASP y JSP se utilizan los símbolos <% y %>. En cambio, para delimitar porciones de código PHP, se requieren los símbolos . Por último, los servlets son la respuesta de la tecnología JAVA a los CGIs. Al igual que los CGIs, son programas completos, sin embargo, son más eficientes, potentes y portables. El servidor mantiene una máquina virtual en ejecución. Cada vez que un usuario invoca un servlet, se genera un nuevo hilo en la máquina virtual (no se abre una nueva instancia de programa). Para la ejecución tanto de servlets como de JSPs, se requiere un software específico JAVA en el servidor como, por ejemplo, Tomcat, de la Apache Software Foundation.

2.2.

Tecnologías en el lado cliente

Se ejecutan en el navegador del usuario los lenguajes de scripting (JavaScript, VBScript, JScript...) y, en general, el resto de tecnologías no citadas más arriba como, por ejemplo, DHTML, CSS, Applets de JAVA, VRML o SMIL. 8-6

Aplicaciones Web

Entre las tecnologías de scripting de cliente incluimos JavaScript (también conocido como LiveScript) de Netscape, VBScript y JScript de Microsoft, y ECMAScript que es un lenguaje basado en JavaScript con soporte para el estándar ECMA-262. Entre todas ellas, JavaScript es la tecnología más utilizada. Al igual que en las páginas dinámicas, el autor de la página incorpora porciones de código de programación (scripts) intercalados en el código HTML. Sin embargo, la diferencia del scripting del cliente es que éste se ejecuta en el propio navegador, por lo que los códigos fuente los recibe el navegador donde son interpretados línea a línea. Los Applets de JAVA se ejecutan en la máquina virtual del cliente. Se requiere que el navegador tenga instalada una máquina virtual de JAVA. Son programas completos que se traen compilados (archivos .class o bytecodes) desde el servidor web y se interpretan en el cliente.

2.3.

Tecnologías JAVA Resumimos las tecnologías web JAVA: —

En el servidor: JSP y Servlets.

—

En el cliente: Applets, JavaScript y JScript.

—

Scripts: JSP, JavaScript y JScript.

—

Programas completos: Servlets, Servicios Web.

JavaScript en ocasiones se compara con otras tecnologías JAVA. Sin embargo, quizás su único parecido es la sintaxis del lenguaje. JavaScript es interpretado y JAVA, compilado (el código compilado luego se interpreta en la máquina virtual). JAVA es un lenguaje de propósito general y JavaScript únicamente funciona en un navegador web. JAVA, a diferencia de JavaScript, es orientado a objetos (incluye herencia, polimorfismo y encapsulación). JavaScript tiene muchas limitaciones, por lo que en la práctica se utiliza casi exclusivamente para validación de formularios y mejoras en la presentación visual de las páginas web. Por último y para completar el listado de tecnologías JAVA, no nos olvidamos de JavaBeans. Se trata de una tecnología de componentes. Sus ventajas son la portabilidad, independencia de plataforma y reutilización de componentes. Mediante JavaBeans se pueden construir aplicaciones reutilizando componentes previamente escritos.

3.

JAVA Script

Al igual que en VBScript puede ser utilizado dentro de una página Web utilizando el siguiente comando HTML.

8-7


•

El comando <SCRIPT> El código en JavaScript se escribe dentro del par <SCRIPT> como muestra el ejemplo. <SCRIPT LANGUAGE=”JavaScript”> 2; } -->

El atributo LANGUAGE indica al navegador el lenguaje en el que se ha escrito el script. No es necesario especificar el lenguaje porque es el lenguaje de script que los navegadores utilizarán por defecto. Todo indicado anteriormente para VBScript es también aplicable a JavaScript.

3.1.

Tipos de datos en JavaScript

JavaScript es un lenguaje poco tipado porque posee pocos tipos de datos. Al declarar una variable no pertenece a ningún tipo concreto de datos, tiene un valor Unsigned. Al asignarle un valor pasará de un tipo de datos a otro dependiendo del valor que le asignemos. En función del contenido que tiene la variable, JavaScript asume que es numérico, cadena, Booleano, Objeto o Nulo. La siguiente tabla muestra los 5 diferentes tipos de datos de JavaScript. Tipos

Descripción

Null

No contiene un dato válido o no inicializada.

Booleano

Contiene bien “true” (verdadero) o “false” (falso).

Numérico

Admite cualquier tipo de datos numéricos, enteros, coma flotante, positivos, negativos, etc.

String

Contiene una cadena de 2 millones de caracteres.

Object

Contiene un object.

Se pueden usar funciones de conversión o conversiones implícitas para pasar de un tipo a otro y la función typeOf() para conocer el tipo actual de una variable. 8-8

Aplicaciones Web

3.1.1. Funciones de Conversión (conversión explícita de tipos) parseFloat( ..)

Descripción Convierte un String en un número en coma flotante si es posible. Sintaxis parseFloat(string) El string ha de ser una cadena válida o una cadena que posea un número válido, sino devolverá NaN. Notas Ejemplo: var v1= parseFloat( “123.456”); var v2=parseFloat(“123ABC”); var v3=parseFloat(”ABC”); alert(v1); // correcto. Devuelve 123.456 alert(v2); // detecta un error en la primera letra. Devuelve 123. Solamente admite números del 0 al 9, el + y el -, el punto como separador decimal y la letra “e” para el exponencial de 10. alert(v3); // Incorrecto. Devuelve NaN.

parseInt ( ... )

Descripción Convierte un String en un número entero de cualquier base entre 2 y 36. Sintaxis parseInt(string, Base) Si no se especifica la base por defecto es base decimal. Notas Ejemplo: var v1= parseInt( “123”); var v2=parseInt(“ABC”,16); alert(v1); // Devuelve 123 alert(v2); // Devuelve 2748 que es ABC en base Hexadecimal.

toString()

Descripción Retorna una cadena con la información de cualquier tipo de dato. Sintaxis variable.toString() Notas Esta función es llamada automáticamente cuando concatenamos una variable a una cadena.

8-9


3.1.2. La Función typeOf Retorna una cadena que identifica el tipo de una variable. Su sintaxis es typeOf(varname) Algunos ejemplos son: var check,saludo=”Hola”; check = typeOf( saludo); alert( check);

//retorna string

saludo=true; check = typeOf( saludo); alert( check);

3.2.

//retorna boolean

Variables en JavaScript

Una variable es un espacio reservado en la memoria que es utilizado para guardar información durante la ejecución de un “script”. Una variable es referenciada por su nombre. Pueden declararse variables de un modo explícito utilizando la instrucción “var” o implícitamente sólo con escribir su nombre y asignarle un valor: var GradosFahrenheit; // Declaración explícita GradosCentigrados=23; //Declaración implícita Las variables pueden ser declaradas en ámbito global fuera de cualquier función, o en ámbito local, dentro de una función. JavaScript es un lenguaje de programación que hace distinción entre Mayúsculas y Minúsculas. Pueden declarase varias variables separándolas por comas (ejemplo: var Top, Bottom, Left, Right=23; // ) e incluso asignarles valor a la hora de definirlas:

3.2.1. Restricciones en el nombre de las variables

8-10

—

Deben comenzar con una letra.

—

No pueden usar un punto.

—

No pueden exceder 255 caracteres.

—

No puede volver a utilizarse dentro del mismo ámbito.

Aplicaciones Web

3.2.2. Ámbito de las variables El ámbito de una variable determina la parte del código desde el cual podremos acceder a la misma. Pueden declararse variables en dos ámbitos distintos: —

Local.

—

Global.

Una variable global es aquella que se define fuera de cualquier función que compongan el “script”. Son accesibles desde cualquier parte del código. El tiempo de vida de estas variables es también global, se crean al cargar el “script” y se destruyen al descargar la página Web. Una variable local a una rutina es aquella que es definida dentro de una función. Sólo es accesible desde la función en la que han sido definida. El tiempo de vida de estas variables es local, se crean al cargar la función y se destruyen al finalizar el código de la misma.

3.2.3. Asignar valores a las variables Mediante una operación de asignación. La variable siempre está definida en la parte izquierda y el valor asignado está en la parte derecha. B = 200;

3.2.4. Variables Array Las matrices o arrays poseen tres sintaxis diferentes. Se puede declarar un array, indicar su tamaño o sus elementos. Las matrices en JavaScript se crean gracias a un objeto llamado Array para lo cual utilizaremos el operador “new”: var proveedores = new Array(); A continuación asignaremos valores en las posiciones que queramos: proveedores[0]=”Arrakis”; proveedores[1]=”Teleline”; proveedores[2]=”CTV”; Las matrices comienzan a contar los elementos de la misma por 0. El segundo sistema me permite especificar inicialmente el número de elementos de la matriz. var proveedores = new Array(3); El tercer sistema permite incluir los elementos en la matriz a la vez que se declara: 8-11


var proveedores = new Array(“Arrakis”,”Teleline”,”CTV”); En último lugar podemos especificar el número de dimensiones de la matriz: var proveedores = new Array(3)(3);

3.3.

Operadores en JavaScript

JavaScript tiene un gran rango de operadores, incluyendo los aritméticos, de comparación, de asignación, lógicos y de concatenación. • Prioridad de operadores Cuando varios operadores son utilizados en la misma expresión, se utiliza la prioridad para resolverla. Podemos utilizar paréntesis para cambiar la prioridad y que unas partes de la expresión sean evaluadas antes que otras. Utilizando paréntesis las operaciones son ejecutadas resolviéndose de dentro hacia fuera y dentro de los paréntesis con la prioridad estándar. Los operadores son evaluados en el siguiente orden: Operadores . () ++ --

8-12

Precedencia

[] -

1 ¡

typeOf new delete void

2

*/%

3

+-

4

<<

>>

5

<<=

>>=

6

>>

¡=

7

&

8

^

9

|

10

&&

11

||

12

?:

13

Asignación

14

Aplicaciones Web

Aritméticos Descripción

Comparaciones

Símbolo

Descripción

Lógicos

Símbolo

Descripción

Asignación Símbolo

Descripción

Símbolo

Cambio de signo

-

Igualdad

==

Negación

!

Incremento

+=

Incremento

++

Distinto

!=

Y lógica

&&

Decremento

-=

Decremento

--

Menor que

<

||

Multiplicación

*=

Multiplicación y división

*,/

Mayor que

>

División

/=

División entera

\

Menor o igual que

<=

Módulo

%=

Suma y resta

+,-

Mayor o igual que

>=

Resto de división

%

O Lógica

Cuando la multiplicación y la división o la suma y la resta aparecen juntos, son evaluados de izquierda a derecha. La concatenación de cadenas no es un operador aritmético, pero la prioridad hace que se ejecute después de los operadores aritméticos y antes que los de comparación. • Operadores de Comparación Comparan expresiones. Su sintaxis es:

resultado = expression1 comparisonoperador expression2

Operador

Descripción

Es true si

Es false si

<

Menor que

Expression1 < expression2

expression1 >= expression2

<=

Menor o igual que

Expression1 <= expression2

expression1 > expression2

>

Mayor que

Expression1 > expression2

expression1 <= expression2

>=

Mayor o igual que

Expression1 >= expression2

expression1 < expression2

==

Igual que

Expression1 = expression2

expression1 <> expression2

¡=

distinto

Expression1 <> expression2

expression1 = expression2

8-13


• Operadores de Concatenación operador + Suma dos números. Si uno de ellos o los dos son cadenas también concatena. Su sintaxis es: result = expression1 + expression2; • Operadores Lógicos operador && Conjunción lógica entre dos expresiones. Su sintaxis es: resultado = expression1 && expression2; operador ¡ Negación lógica de una expresión. Su sintaxis es: result = ¡ expression; operador || Disyunción lógica de dos expresiones. Su sintaxis es: result = expression1 || expression2; • Operadores de asignación num += 2; // num = num + 2 num -= 2; // num = num - 2 num *= 2; // num = num * 2 num /= 2; // num = num / 2 num %= 2; // num = num % 2

3.4.

Usando condiciones

• Controlando la ejecución del programa Las decisiones nos permiten ejecutar o no un conjunto de instrucciones dependiendo de si la condición es Verdadera (true) o falsa (false). Existen dos instrucciones para poder hacerlo en JavaScript: —

If-else

—

switch-case

• Tomando decisiones usando if...else La instrucción “if...else” es utilizada para evaluar cuando una condición es cierta o falsa y dependiendo del resultado poder especificar un conjunto de 8-14

Aplicaciones Web

instrucciones a ejecutar. Usualmente la condición utiliza una operación de comparación. Las instrucciones de comparación pueden ser anidadas. • Ejecutar comando si la condición es true El siguiente ejemplo muestra una condición que solamente ejecuta instrucciones cuando la condición es cierta. No se escribe la parte del else. function menorde5( aux){ var num=aux; if( num < 5) return “Es menor que 5”; } Si se quieren ejecutar más de una instrucción, han de incluirse dentro de un bloque con llaves function AlertUser(value){ if (value == 0){ accion1; accion2; accion3; } } • Ejecutando ciertas acciones si la condición es True y ciertas otras si es False Se puede usar “if...Else” para definir dos bloques de ejecución para los casos en que la condición sea cierta o falsa. function AlertUser(value){ if (value == 0){ accion1; accion2; accion3; 8-15


} else{ accion4; accion5; accion6; } } • Decidiendo entre varias alternativas Switch-case trabaja con una expresión que es evaluada una sola vez pero que luego es comparada en cada una de las instrucciones case de la estructura: switch ( NotaExamen){ case <5: alert(“Suspenso”); break; case<7: alert( “Aprobado”); break; case 8,9: alert(“Notable”); break; case <=10: alert(“Sobresaliente”); default: alert(“Nota no válida”); } Default permite la ejecución de código en el caso de que ninguno de los case sea cierto. 8-16

Aplicaciones Web

Cada case ha de finalizar en un break para no pasar a ejecutar el código del siguiente case. Los case se ejecutan en el orden indicado, del primero al último. Las condiciones de los case indican igualdad (case 1), igualdad con varios números (case 3,4)

3.5.

Bucles Usando “bucles” para repetir código.

Los “bucles” nos permiten ejecutar un conjunto de instrucciones repetidas veces. Uno de ellos nos permite ejecutar el “bucle” mientras que la condición sea falsa, otro hasta que sea cierta y otro un número determinado de veces. Existen los siguientes “bucles” en JavaScript: —

do-while: Se repite hasta que una condición sea False.

—

while: Se repite mientras que la condición sea cierta True.

—

for: Usa un contador para repetirse un número determinado de veces.

• Usando do-while Puede usar “do-while” para ejecutar un bloque un número indeterminado de veces. Se repite hasta que una condición sea False. • Repitiendo hasta que una condición sea falsa Usando while en el chequeo de la condición de do-while permite ejecutar una acción hasta que la condición sea falsa. El bucle evalúa la condición al final por lo que se ejecutará al menos una vez. var contador=0; do{ alert( contador); contador++; }while(contador<10); • Repetir un bucle mientras que la condición sea cierta While permite repetir mientras que la condición evaluada al principio sea cierta. Al evaluar la condición al principio puede no ejecutarse el bucle ninguna vez. 8-17


var contador=0; while( contador<10){ alert( contador); contador++; } • Usando for Puede usar for para ejecutar un bucle un número determinado de veces. Utiliza una variable llamada contador cuyo valor se incrementa o decrementa en cada repetición del “bucle” y que marca el número exacto de veces que se ejecutará. Su sintaxis es: for( inicialización; condición; incremento){} El siguiente ejemplo repite el proceso 50 veces para los valores de x desde 1 a 50, incrementando x en +1 en cada paso del “bucle”. var x for( x = 1;x<=50;x++){ accion; } El incremento puede ser positivo o negativo. Si es positivo incrementa y si es negativo decrementa. En el siguiente ejemplo “j” comienza valiendo 2 y pasa a valer 4, 6, 8 y 10 en cada paso del “bucle”. for( j = 2;j<=10;j+=2) { ... } El siguiente ejemplo tendrá para x los valores 16, 14, 12, 10, 8, 6, 4 y 2. for( j = 16;j>=2;j-=2) { ... } Puede utilizar “break” para finalizar el “bucle” en cualquier momento. Puede utilizar continue para pasar a la siguiente iteración del “bucle” sin finalizar la actual.

3.6.

Rutinas en JavaScript En JavaScript sólo existe la rutina “function”.

• Function (Función) Una “function” es un conjunto de instrucciones de JavaScript dentro de las instrucciones function{... }. Una “function” puede retornar un valor asignándolo al final a la palabra reservada “return”. Su sintaxis es: 8-18

Aplicaciones Web

Todo el código ejecutable debe ir situado dentro de las llaves. La instrucción “return” permite la finalización de la función. Puede estar situada en cualquier parte de una rutina. La finalización de una función devuelve el control a aquella que la llamó. Las funciones sí pueden ser utilizadas dentro de una expresión. Dentro de una función pueden existir dos tipos de variables, aquellas que son definidas explícitamente en la función y aquellas que no. Las primeras son locales. Se crean al llamar a la función y se destruyen cuando finaliza la misma. No pueden ser utilizadas fuera de ella. Las segundas son las variables globales, que son comunes a todo el “script”. Permiten compartir información entre las funciones. Son accesibles desde cualquier función y son destruidas al final del “script”. • Utilizando funciones en código Una función siempre debe ser utilizada en la parte derecha de una asignación o en una expresión: Temp = Celsius(fDegrees); alert “The Celsius temperature is “ + Celsius(fDegrees) + “ degrees.”;

4.

Applets

4.1.

¿Qué es un Applet?

Un Applet es una mini-aplicación escrita en JAVA que se ejecuta en un browser (Netscape Navigator, Microsoft Internet Explorer…) al cargar una página HTML que incluye información sobre el applet a ejecutar por medio de los tags ... . Los ficheros de JAVA compilados (*.class) se descargan a través de la red desde un servidor de Web o servidor HTTP hasta el “browser” en cuya JAVA Virtual Machine se ejecutan. Pueden incluir también ficheros de imágenes y sonido. Aunque su entorno de ejecución es un “browser”, las applets se pueden probar sin necesidad de “browser” con la aplicación “appletviewer” del JDK de Sun.

4.2.

Características de los Applets —

Las Applets no tienen un método “main()” con el que comience la ejecución. El papel central de su ejecución lo asumen otros métodos que se verán posteriormente.

—

Todas las Applets derivan de la clase java.applet.Applet. Las Applets deben redefinir ciertos métodos heredados de Applet que controlan su ejecución: init(), start(), stop(), destroy().

8-19


4.3.

—

Se heredan otros muchos métodos de las super-clases de Applet que tienen que ver con la generación de interfaces gráficas de usuario (AWT). Así, los métodos gráficos se heredan de Component, mientras que la capacidad de añadir componentes de interface de usuario se hereda de Container y de Panel.

•

Las Applets también suelen redefinir ciertos métodos gráficos: los más importantes son “paint()” y “update()”, heredados de Component y de Container; y “repaint()” heredado de Component.

•

Las Applets disponen de métodos relacionados con la obtención de información, como, por ejemplo: getAppletInfo(), getAppletContext(), getParameterInfo(), getParameter(), getCodeBase(), getDocumentBase(), e isActive().

Métodos de control

• Método init() Se llama automáticamente al método “init()” en cuanto el “browser” o visualizador carga el Applet. Este método se ocupa de todas las tareas de inicialización, realizando las funciones del constructor (al que el browser no llama). • Método start() El método “start()” se llama automáticamente en cuanto el Applet se hace visible, después de haber sido inicializada. Se llama también cada vez que el Applet se hace de nuevo visible después de haber estado oculta (por dejar de estar activa esa página del “browser”, al cambiar el tamaño de la ventana del “browser”, al hacer “reload”, etc.). Es habitual crear “threads” en este método para aquellas tareas que, por el tiempo que requieren, dejarían sin recursos al Applet o incluso al “browser”. Las animaciones y ciertas tareas a través de Internet son ejemplos de este tipo de tareas. • Método stop() El método “stop()” se llama de forma automática al ocultar el applet (por haber dejado de estar activa la página del “browser”, por hacer “reload” o “resize”, etc.). Con objeto de no consumir recursos inútilmente, en este método se suelen parar las threads que estén corriendo en el Applet, por ejemplo para mostrar animaciones. • Método destroy() Se llama a este método cuando el Applet va a ser descargada para liberar los recursos que tenga reservados (excepto la memoria). De ordinario no es necesario redefinir este método, pues el que se hereda cumple bien con esta misión. 8-20

Aplicaciones Web

4.4.

Métodos para dibujar el Applet

Las Applets son aplicaciones gráficas que aparecen en una zona de la ventana del “browser”. Por ello, deben redefinir los métodos gráficos “paint()” y “update()”. El método “paint()” se declara en la forma:

public void paint(Graphics g) El objeto gráfico “g” pertenece a la clase java.awt.Graphics, que siempre debe ser importada por el Applet. Este objeto define un contexto o estado gráfico para dibujar (métodos gráficos, colores, fonts, etc.) y es creado por el “browser”. Todo el trabajo gráfico del Applet (dibujo de líneas, formas gráficas, texto, etc.) se debe incluir en el método “paint()”, porque este método es llamado cuando el Applet se dibuja por primera vez y también de forma automática cada vez que el applet se debe redibujar. En general, el programador crea el método “paint()” pero no lo suele llamar. Para pedir explícitamente al sistema que vuelva a dibujar el Applet (por ejemplo, por haber realizado algún cambio) se utiliza el método “repaint()”, que es más fácil de usar, pues no requiere argumentos. El método repaint() se encarga de llamar a “paint()” a través de “update()”. El método “repaint()” llama a “update()”, que borra todo pintando de nuevo con el color de fondo y luego llama a “paint()”. A veces esto produce parpadeo de pantalla o “flickering”. Existen dos formas de evitar el “flickering”:

4.5.

•

Redefinir “update()” de forma que no borre toda la ventana sino solo lo necesario.

•

Redefinir “paint()” y “update()” para utilizar doble “buffer”.

Inclusión de Applets en páginas HTML

Para llamar a un applet desde una página HTML se utiliza la “tag” doble …, cuya forma general es (los elementos opcionales aparecen entre corchetes[]): [texto alternativo para browsers que reconocen el tag pero no pueden ejecutar el applet] [] [] 8-21


El atributo NAME permite dar un nombre opcional al Applet, con objeto de poder comunicarse con otras applets o con otros elementos que se estén ejecutando en la misma página. El atributo ARCHIVE permite indicar uno o varios ficheros Jar o Zip (separados por comas) donde se deben buscar las clases. A continuación se señalan otros posibles atributos de :

4.6.

•

ARCHIVE=»file1, file2, file3». Se utiliza para especificar ficheros JAR y ZIP.

•

ALIGN, VSPACE, HSPACE. Tienen el mismo significado que el tag IMG de HTML.

Paso de parámetros a un Applet

Los tags PARAM permiten pasar diversos parámetros desde el fichero HTML al programa JAVA del Applet, de una forma análoga a la que se utiliza para pasar argumentos a “main()”. Cada parámetro tiene un nombre y un valor. Ambos se dan en forma de String, aunque el valor sea numérico. El Applet recupera estos parámetros y, si es necesario, convierte los Strings en valores numéricos. El valor de los parámetros se obtiene con el siguiente método de la clase Applet:

String getParameter(String name) La conversión de Strings a los tipos primitivos se puede hacer con los métodos asociados a los “wrappers” que JAVA proporciona para dichos tipo fundamentales (Integer.parseInt(String), Double.valueOf(String), …). En los nombres de los parámetros no se distingue entre mayúsculas y minúsculas, pero sí en los valores, ya que serán interpretados por un programa JAVA, que sí distingue. El programador del Applet debería prever siempre unos valores por defecto para los parámetros del applet, para el caso de que en la página HTML que llama al Applet no se definan. El método getParameterInfo() devuelve una matriz de Strings (String[][]) con información sobre cada uno de los parámetros soportados por el applet: nombre, tipo y descripción, cada uno de ellos en un String. Este método debe ser redefinido por el programador del Applet y utilizado por la persona que prepara la página HTML que llama al applet. En muchas ocasiones serán personas distintas, y ésta es una forma de que el programador del Applet de información al usuario.

4.7.

Parametrizando un applet

Vamos a aprovechar este ejemplo, modificándolo un poco para indicarle desde el HTML qué archivos debe cargar, mediante parámetros. Nuestro HTML modificado será: 8-22

Aplicaciones Web

Lolo 24 - Multimedia Para leer estos parámetros desde el applet, usamos el método getParameter(nombre Parámetro), así que podemos modificar nuestro applet simplemente modificando un par de líneas:

archImagen = getParameter(«imagen»); archAudio = getParameter(«sonido»); Con esto hemos visto una gran parte de lo que es JAVA. No hemos profundizado demasiado en cada punto, pero hemos hecho ejemplos que funcionan para ilustrar cada cosa. Sin embargo, hemos dejado un punto importante y muy fuerte de JAVA, que es el de las comunicaciones entre aplicaciones y, especialmente, el uso de “sockets” y la programación de aplicaciones cliente-servidor. Por cuestiones de seguridad, los applets son más limitados que las aplicaciones JAVA locales. Las políticas de seguridad las manejan los “browsers” (no JAVA), y generalmente los límites que se imponen a los Applets son: —

Un Applet no puede cargar bibliotecas (libraries) ni definir métodos nativos.

—

No puede leer o escribir normalmente archivos en el cliente que lo carga desde otro server.

—

No puede establecer conexiones de red, salvo al servidor del que proviene.

—

No puede arrancar programas en la máquina donde se está ejecutando.

—

No puede leer ciertas propiedades del sistema.

—

En las ventanas de los Applets se indica que se trata de un Applet.

Sin embargo, pueden: —

Reproducir sonidos.

—

Pueden establecer conexiones con el servidor del que provienen. 8-23


—

Pueden llamar fácilmente páginas HTML desde el “browser”.

—

Pueden invocar métodos públicos de otros Applets de la misma página.

—

Si se cargan desde la propia máquina (localmente) no tienen ninguna de las restricciones anteriores.

—

Pueden seguir corriendo aunque se cambie de página en el “browser”.

En realidad, la especificación de JAVA permite que los applets lean archivos en otras máquinas dando la URL completa; sin embargo, los “browsers” no lo permiten. Veremos más adelante cómo intercambiar datos entre máquinas para poder ver un archivo del server, por ejemplo.

4.8.

Sonidos en el Applet

La clase Applet y la interface AudioClips permiten utilizar sonidos en applets. Respecto a la carga de sonidos, por lo general es mejor cargar los sonidos en un “thread” distinto (creado en el método “init()”) que en el propio método init(), que tardaría en devolver el control y permitir al usuario empezar a interaccionar con el Applet. Si el sonido no ha terminado de cargarse (en la “thread” especial para ello) y el usuario interacciona con el Applet para ejecutarlo, el applet puede dar un aviso de que no se ha terminado de cargar.

4.9.

Imágenes en el Applet

Las Applets admiten los formatos JPEG y GIF para representar imágenes a partir de ficheros localizados en el servidor. Estas imágenes se pueden cargar con el método getImage() de la clase Applet, que puede tener las formas siguientes:

public Image getImage(URL url) public Image getImage(URL url, String name) Estos métodos devuelven el control inmediatamente. Las imágenes de cargan cuando se da la orden de dibujar las imágenes en la pantalla. El dibujo se realiza entonces de forma incremental, a medida que el contenido va llegando. Para dibujar imágenes se utiliza el método “drawImage()” de la clase Graphics, que tiene las formas siguientes:

public abstract boolean drawImage(Image img, int x, int y, Color bgcolor, ImageObserver observer) public abstract boolean drawImage(Image img, int x, int y, int width, int height, Color bgcolor, ImageObserver observer) El primero de ellos dibuja la imagen con su tamaño natural, mientras que el segundo realiza un cambio en la escala de la imagen. 8-24

Aplicaciones Web

Los métodos “drawImage()” van dibujando la parte de la imagen que ha llegado, con su tamaño, a partir de las coordenadas (x, y) indicadas, utilizando bgcolor para los píxeles transparentes. Estos métodos devuelven el control inmediatamente, aunque la imagen no esté del todo cargada. En este caso devuelve false. En cuanto se carga una parte adicional de la imagen, el proceso que realiza el dibujo avisa al ImageObserver especificado. ImageObserver es una interface implementada por Applet que permite seguir el proceso de carga de una imagen.

5.

Servlets

5.1.

Introduccion

Los Servlets son clases JAVA que amplian la funcionalidad de un servidor Web mediante la generacion dinamica de paginas Web. El motor de “servlets” administra la carga y descarga del “servlet” dirigiendo las peticiones a los “servlets” y enviando las respuestas a los clientes.

5.2.

Ventajas a la hora de trabajar con los servlets —

Mejor rendimiento que otras tecnologias anteriores. El motor del “servlet” carga un solo ejemplar o instancia de la clase Servlet y le lanza peticiones a través de una serie de hilos (threads).

—

Dados los problemas de compatibilidad de los Applets JAVA debidos a su ejecucion del lado del cliente, los “servlets” e ejecutan en una maquina virtual en entorno servidor controlado y solo necesitan el protocolo http para su comunicación. Por tanto el cliente no necesita de ningun “software” adicional.

—

Con los “servlets” podemos recordar detalles de peticiones previas del mismo cliente. A traves de la clase HttpSesion.

—

El codigo en el cual se escriben los “servlets” es JAVA, con lo cual podemos disfrutar de toda su potencia asi como el acceso a datos dentro del servidor, restricciones, gesion de varios subprocesos, etc.

5.3.

Ciclo de vida de un servlet Cada “servlet” tiene el mismo ciclo de vida: —

Carga un “servlet” cuando lo solicitamos por primera vez. El servidor no puede recargar un “servlet” sin primero haber destruido el “servlet” llamando al método “destroy”.

—

Inicialización del “servlet” (init). Una vez que el servidor carga un servlet, ejecuta el método “init” del “servlet”. La inicialización se

8-25


completa antes de manejar peticiones de clientes y antes de que el servlet sea destruido. Aunque muchos “servlets” se ejecutan en servidores multi-thread, los “servlets” no tienen problemas de concurrencia durante su inicialización. El servidor llama sólo una vez al método “init” al crear la instancia del “servlet”, y no lo llamará de nuevo a menos que vuelva a recargar el servlet.

5.4.

—

Manejo de peticiones de cliente (service). Después de la inicialización, el “servlet” puede manejar peticiones de clientes. Estas respuestas son manejadas por la misma instancia del “servlet” por lo que hay que tener cuidado con acceso a variables compartidas por posibles problemas de sincronización entre requerimientos concurrentes.

—

Eliminación del “servlet” (destroy). Los “servlets” se ejecutan hasta que el servidor los destruye, por cierre el servidor o bien a petición del administrador del sistema. Cuando un servidor destruye un “servlet”, ejecuta el método “destroy” del propio servlet. Este método sólo se ejecuta una vez y puede ser llamado cuando aún queden respuestas en proceso por lo que hay que tener la atención de esperarlas. El servidor no ejecutará de nuevo el “servlet”, hasta haberlo cargado e inicializado de nuevo.

Ejemplo de Servlet public class TAIServlet extends HttpServlet

{

/** * Una sencilla página Web. */ public void doGet (HttpServletRequest request, HttpServletResponse response) throws ServletException, IOException { PrintWriter out; String

title = "Ejemplo de Servlet"; response.setContentType("text/html");

out = response.getWriter(); out.println(""); out.println(title); out.println(""); 8-26

Aplicaciones Web

out.println("
" + title + "
"); out.println("
Ejemplo de Servlet."); out.println("
Para que este año apruebe fijo."); out.println(""); out.close(); } }

5.5.

Clases del servlet

Los “servlets” operan con un ciclo de vida fijo, que proporciona métodos de retrollamada a un motorde “servlets” para que se inicialicen, manejen las peticiones y los destruyan. La API proporciona dos modelos de subproceso: uno predeterminado consistente en subprocesos múltiples ejecutados en un solo ejemplar y el modelo de subproceso único alternativo. Las clases e “interfaces” principales de la API “servlet” son:

5.6.

—

Servlet, interfaz que describe los métodos de retrollamada que se deben implementar.

—

GenericServlet, clase que implementa los métodos de la interfaz Servlet.

—

HttpServlet, clase específica para http de GenericServlet.

—

ServletRequest, clase que encapsula la información sobre la petición del cliente.

—

ServletResponse, clase que proporciona acceso a un flujo de salida para los resultados.

—

ServletContext, interfaz que permite a un grupo de “servlets” interoperar entre si en una aplicación web.

Servlets y JSP

Una página JSP (JavaServer Pages) se ejecta en un componente del servidor llamado contenedor de JSP que las traduce a “servlets” JAVA equivalentes. Es decir, las paginas JSP son traducidas por este contenedor a su sintaxis Servlet correspondiente, teniendo las mismas ventajas. Quizas cabria destacar que las paginas JSP sueles ser mas sencillas de programar por parte de los desarrolladores, pero se obtiene menos potencia. 8-27


6. 6.1.

Servicios Web Introducción

Existen múltiples definiciones sobre lo que son los Servicios Web, lo que muestra su complejidad a la hora de dar una adecuada definición que englobe todo lo que son e implican. Una posible sería hablar de ellos como un conjunto de aplicaciones o de tecnologías con capacidad para interoperar en la Web. Estas aplicaciones o tecnologías intercambian datos entre sí con el objetivo de ofrecer unos servicios. Los proveedores ofrecen sus servicios como procedimientos remotos y los usuarios solicitan un servicio llamando a estos procedimientos a través de la Web. Estos servicios proporcionan mecanismos de comunicación estándares entre diferentes aplicaciones, que interactúan entre sí para presentar información dinámica al usuario. Para proporcionar interoperabilidad y extensibilidad entre estas aplicaciones, y que al mismo tiempo sea posible su combinación para realizar operaciones complejas, es necesaria una arquitectura de referencia estándar.

6.2.

Los servicios Web

Un usuario (cliente dentro de los Servicios Web), a través de una aplicación, solicita información sobre un viaje que desea realizar haciendo una petición a una agencia de viajes que ofrece sus servicios a través de Internet. La agencia de viajes ofrecerá a su cliente (usuario) la información requerida. Para proporcionar al cliente la información que necesita, esta agencia de viajes solicita a su vez información a otros recursos (otros Servicios Web) en relación con el hotel y la línea aérea. La agencia de viajes obtendrá información de estos recursos, lo que la convierte a su vez en cliente de esos otros Servicios Web que le van a proporcionar la información solicitada sobre el hotel y la línea aérea. Por último, el usuario realizará el pago del viaje a través de la 8-28

Aplicaciones Web

agencia de viajes que servirá de intermediario entre el usuario y el servicio Web que gestionará el pago. Toda la información disponible para cualquier persona, en cualquier lugar, a través de cualquier dispositivo. Se busca un lenguaje común de intercambio de información aprovechando los estándares existentes en el mercado. Bajo este contexto nacen los Servicios Web basados en XML. Los Web services son componentes “software” que permiten a los usuarios usar aplicaciones de negocio que comparten datos con otros programas modulares, vía Internet. Son aplicaciones independientes de la plataforma que pueden ser fácilmente publicadas, localizadas e invocadas mediante protocolos Web estándar, como XML, SOAP, UDDI o WSDL. El objetivo final es la creación de un directorio online de Web services, que pueda ser localizado de un modo sencillo y que tenga una alta fiabilidad. La funcionalidad de los protocolos empleados es la siguiente: —

XML (eXtensible Markup Language): Un servicio Web es una aplicación Web creada en XML.

—

WSDL (Web Services Definition Language): Este protocolo se encarga de describir el Web Service cuando es publicado. Es el lenguaje XML que los proveedores emplean para describir sus Web Services.

—

SOAP (Simple Object Access Protocol): Permite que programas que corren en diferentes sistemas operativos se comuniquen. La comunicación entre las diferentes entidades se realiza mediante mensajes que son rutados en un sobre SOAP.

—

UDDI (Universal Description Discovery and Integration): Este protocolo permite la publicación y localización de los servicios. Los directorios UDDI actúan como una guía telefónica de los Web Services.

Aunque la idea de la programación modular no es nueva, el éxito de esta tecnología reside en que se basa en estándares conocidos en los que ya se tiene una gran confianza, como el XML. Además, el uso de los Web services aporta ventajas significativas a las empresas. El principal objetivo que se logra, es la interoperabilidad y la integración. Mediante los Web services, las empresas pueden compartir servicios “software” con sus clientes y sus socios de negocio. Esto ayudará a las compañías a escalar sus negocios, reduciendo el coste en desarrollo y mantenimiento de “software”, y sacando los productos al mercado con mayor rapidez. La integración de aplicaciones hará posible obtener la información demandada en tiempo real, acelerando el proceso de toma de decisiones.

6.3.

Seguridad

Actualmente, los Web Services están siendo ampliamente aceptados por las empresas para el desarrollo de “software” de uso interno. De este modo, los servicios pueden implementar toda su funcionalidad y permanecer segu8-29


ros tras el Cortafuegos de la compañía. Los desarrollos actuales no ayudan a la cooperación entre las empresas ya que no hay ningún estándar establecido sobre las técnicas de seguridad. Debido a la tecnología que es usada por los Web services, y en concreto al uso de SOAP, las técnicas de seguridad convencionales que se han venido usando en Internet, ya no son suficientes. Con SOAP, cada mensaje simple que se intercambia realiza múltiples saltos y es rutado a través de numerosos puntos antes de que alcance su destino final. Es por ello que los Web Services necesitan tecnologías que protejan los mensajes desde el principio hasta el final. Existen un conjunto de técnicas que se pueden usar para garantizar la seguridad a nivel de mensaje. Estas son:

6.4.

—

Encriptación XML: Evita que los datos se vean expuestos a lo largo de su recorrido.

—

Firma Digital XML: Asocia los datos del mensaje al usuario que emite la firma, de modo que este usuario es el único que puede modificar dichos datos.

—

XKMS y los Certificados: XKMS (XML Key Management Specification) define Web Services que se pueden usar para chequear la confianza de un certificado de usuario.

—

SAML y la Autorización: SAML (Security Assertion Mark-up Language) hace posible que los Web Services intercambien información de autentificación y autorización entre ellos, de modo que un Web Service confíe en un usuario autentificado por otro Web Service.

—

Validación de datos: Permite que los Web Services reciban datos dentro de los rangos esperados.

—

Además, también hay técnicas que permiten mantener la seguridad a otros niveles. La seguridad en UDDI permite autentificar todas las entidades que toman parte en la publicación de un Web service: proveedor, agente y consumidor del servicio. De este modo, nadie podrá registrar servicios en el papel de un proveedor o hacer uso de ellos sin contar con los permisos adecuados.

Calidad

Actualmente ya existen en el mercado algunas herramientas específicamente diseñadas para medir la calidad de los Web services, pero sigue siendo necesaria una estandarización sobre este tema. Los resultados sobre la calidad de diferentes Web services, servirán como parámetro de comparación y ayudarán al consumidor a decantarse por un servicio u otro. Para que un Web service se ejecute con corrección y satisfaga las expectativas creadas, a parte del precio, habrá que tener en cuenta una serie de parámetros como por ejemplo, que los resultados obtenidos del mismo sean los esperados o que el entorno de uso sea amigable. Otro elemento a tener en cuenta es la integración. Aunque teóricamente los Web services proporcionan conectividad con cualquier software de un modo transparente, cada proveedor de servicios puede adoptar soluciones diferentes que resultan más o menos adecuadas para el consumidor. Analizando la escalabilidad se comprobará el grado de modularidad y flexibilidad del servicio. Por último, también sería 8-30

Aplicaciones Web

interesante analizar las características que ofrece el proveedor de Web services. Actualmente no hay definidos estándares sobre este tema, pero la mayoría de las empresas ya está demandando algún tipo de acuerdo o contrato con los proveedores, de modo que se pueda garantizar la calidad y la fiabilidad de los servicios por los que se paga.

6.5.

Estandarización

Los Web services están basados en el estándar XML, que ha sido universalmente aceptado. Algunas de las empresas más importantes en el desarrollo de Negocio Electrónico como IBM, Intel, Microsoft u Oracle, han creado el WS-I: organización para la Interoperabilidad de los Web Services. El objetivo de dicha organización es la promoción de la estandarización de los Web Services de modo que se fomente la cooperación e interoperabilidad entre las compañías y mercados.

6.6.

Conceptos e ideas de Web Services

“Los Web Services son componentes software que permiten a los usuarios usar aplicaciones de negocio que comparten datos con otros programas modulares, vía Internet. Son aplicaciones independientes de la plataforma que pueden ser fácilmente publicadas, localizadas e invocadas mediante protocolos Web estándar, como XML, SOAP, UDDI o WSDL. El objetivo final es la creación de un directorio de online de Web Services, que pueda ser localizado de un modo sencillo y que tenga una alta fiabilidad.” “Los Servicios Web son la revolución informática de la nueva generación de aplicaciones que trabajan colaborativamente en las cuales el “software” esta distribuido en diferentes servidores.” “Los Servicios XML Web son los bloques de construcción de la computación distribuida en el Internet. Usted puede crear soluciones al usar los múltiples servicios de XML Web desde varias fuentes que trabajan en conjunto-independientemente de dónde residan o cómo fueron implementadas.” “Un Web Service es un componente de software que se comunica con otras aplicaciones codificando los mensaje en XML y enviando estos mensaje a través de protocolos estándares de Internet tales como el Hypertext Transfer Protocol (HTTP). Intuitivamente un Web Service es similar a un sitio Web que no cuenta con un interfaz de usuario y que da servicio a las aplicaciones en vez de a las personas. Un Web Service, en vez de obtener solicitudes desde el navegador y retornar páginas Web como respuesta, lo que hace es recibir solicitudes a través de un mensaje formateado en XML desde una aplicación, realiza una tarea y devuelve un mensaje de respuesta también formateado en XML.” Microsoft y otras empresas líderes están promocionando SOAP como estándar de los mensajes para los Web Services. Un mensaje SOAP se parece mucho a una carta: es un sobre que contiene una cabecera con la dirección del receptor del mensaje, un conjunto de opciones de entrega (tal como la información de encriptación), y un cuerpo o body con la información o data del mensaje. 8-31


Microsoft y otros proveedores líderes promocionan los Web Services como un modelo de programación para la comunicación entre aplicaciones. Estas compañías piensan que la conexión de aplicaciones a través de la Internet mejorará la capacidad de las empresas para trabajar conjuntamente con sus socios de negocio, proveedores y clientes. Creando una capa de Web Services sobre una aplicación corporativa existente, las organizaciones podrán permitir que sistemas externos puedan invocar las funciones de la aplicación a través de Internet (o una intranet corporativa) sin tener que modificar la aplicación misma. Por ejemplo, varias compañías están hoy en día creando Web Services que actúan como front end para aplicaciones de entrada de órdenes que están residentes internamente en un mainframe. Estas compañías permiten a los sistemas de compras de sus clientes enviar órdenes de compra a través de la Internet. Poner una capa de Web services sobre las aplicaciones existentes es una solución muy interesante para integrar las aplicaciones desarrolladas por los diferentes departamentos y así reducir los costos de integración.

6.7.

8-32

Requisitos de un Web Service —

Interoperabilidad: un servicio remoto debe permitir su utilización por clientes de otras plataformas.

—

Amigabilidad con Internet: la solución debe poder funcionar para soportar clientes que accedan a los servicios remotos desde Internet.

—

Interfaces fuertemente tipadas: no debería haber ambigüedad acerca del tipo de dato enviado y recibido desde un servicio remoto. Más aún, los tipos de datos definidos en el servicio remoto deben poderse corresponder razonablemente bien con los tipos de datos de la mayoría de los lenguaje de programación procedimentales.

—

Posibilidad de aprovechar los estándares de Internet existentes: la implementación del servicio remoto debería aprovechar estándares de Internet existentes tanto como sea posible y evitar reinventar soluciones a problemas que ya se han resuelto. Una solución construida sobre un estándar de Internet ampliamente adoptado puede aprovechar conjuntos de herramientas y productos existentes creados para dicha tecnología.

—

Soporte para cualquier lenguaje: la solución no debería ligarse a un lenguaje de programación particular JAVA RMI, por ejemplo, esta ligada completamente a lenguaje JAVA. Sería muy difícil invocar funcionalidad de un objeto JAVA remoto desde Visual Basic o PERL. Un cliente debería ser capaz de implementar un nuevo servicio Web existente independientemente del lenguaje de programación en el que se halla escrito el cliente.

—

Soporte para cualquier infraestructura de componente distribuida: la solución no debe estar fuertemente ligada a una infraestructura de componentes en particular. De hecho, no se bebería requerir el comprar, instalar o mantener una infraestructura de objetos distribuidos, solo construir un nuevo servicio remoto utilizar un servicio existente. Los protocolos

Aplicaciones Web

subyacentes deberían proporcionar un nivel base de comunicación entre infraestructura de objeto distribuidos existentes tales como DCOM y CORBA.

6.8.

Bloques constructivos de Servicios Web Descubrimiento UDDI, DISCO Descripción WSDL, Esquema XML, Docs Formato de Mensaje SOAP Codificación XML Transporte HTTP, SMTP y otros —

Descubrimiento: la aplicación cliente que necesita acceder a la funcionalidad que expone un Servicio Web necesita una forma de resolver la ubicación de servicio remoto. Se logra mediante un proceso llamado, normalmente descubrimiento (discovery). El descubrimiento se puede proporcionar mediante un directorio centralizado así como por otros métodos ad hoc. En DCOM, el servicio de descubrimiento lo proporciona el Administrador de control de servicios (SCM, Services Control Manager).

—

Descripción: una vez que se ha resuelto el extremo de un servicio Web dado, el cliente necesita suficiente información para interactuar adecuadamente con el mismo. La descripción de un servicio Web implica meta datos estructurados sobre la interfaz que intenta utilizar la aplicación cliente así como documentación escrita sobré el servicio Web incluyendo ejemplo de uso. Un componente DCOM expone meta datos estructurados sobre sus “interfaces” mediante una biblioteca de tipo (typelib). Los meta datos dentro de una “typelib” de componente se guardan en un formato binario propietario a los que se accede mediante una interfaz de programación de aplicación (API) propietaria.

—

Formato del mensaje: para el intercambio de datos, el cliente y el servidor tienen que estar de acuerdo en un mecanismo común de codificación y formato de mensaje. El uso de un mecanismo estándar de codificar los datos asegura que los datos que codifica el cliente los interpretará correctamente el servidor. En DCOM los mensajes que se envían entre un

8-33


cliente y un servidor tienen un formato definido por el protocolo DCOM Object RPC (ORPC). —

Codificación: los datos que se trasmiten entre el cliente y el servidor necesitan codificarse en un cuerpo de mensaje. Dcom utiliza un esquema de codificación binaria para serializar los datos de los parámetros que se intercambian entre el cliente y el servidor.

—

Transporte: una vez se ha dado formato al mensaje y se han serializado los datos en el cuerpo del mensaje se debe transferir entre el cliente y el servidor utilizando algún protocolo de transporte. DCOM dispone de varios protocolos propietarios como TCP, SPX, NetBEUI y NetBIOS sobre IPX.

6.8.1. SOAP (Simple Object Access Protocol) SOAP Version 1.2 Latest version of SOAP Version 1.2 specification: http://www.w3.org/TR/soap12 W3C Recommendation (Second Edition) 27 April 2007 SOAP Version 1.2 Part 1: Messaging Framework (Second Edition) W3C Recommendation 27 April 2007 http://www.w3.org/TR/soap12-part1/ http://www.w3.org/TR/soap12-part2/ http://www.w3.org/TR/soap12-part3/ Son las siglas de Simple Object Access Protocol. Este protocolo deriva del protocolo XML-RPC. SOAP proporciona un mecanismo estándar de empaquetar mensajes. SOAP ha recibido gran atención debido a que facilita una comunicación del estilo RPC entre un cliente y un servidor remoto. Pero existen multitud de protocolos creados para facilitar la comunicación entre aplicaciones, incluyendo RPC de Sum, DCE de Microsoft, RMI de JAVA y ORPC de CORBA. SOAP es un protocolo basado en XML, que permite la interacción entre varios dispositivos y que tiene la capacidad de transmitir información compleja. Los datos pueden ser transmitidos a través de HTTP, SMTP, etc. SOAP especifica el formato de los mensajes. El mensaje SOAP está compuesto por un envelope (sobre), cuya estructura está formada por los siguientes elementos: header (cabecera) y body (cuerpo).

8-34

Aplicaciones Web

• Estructura de los mensajes SOAP es el primer protocolo de su tipo que ha sido aceptado prácticamente por todas las grandes compañías de “software” del mundo. Compañías que en raras ocasiones cooperan entre sí están ofreciendo su apoyo a este protocolo. Algunas de las mayores Compañías que soportan SOAP son Microsoft, IBM, SUN, Microsystems, SAP y Ariba. Algunas de las Ventajas de SOAP son: —

No esta asociado con ningún lenguaje: los desarrolladores involucrados en nuevos proyectos pueden elegir desarrollar con el último y mejor lenguaje de programación que exista pero los desarrolladores responsables de mantener antiguas aflicciones heredadas podrían no poder hacer esta elección sobre el lenguaje de programación que utilizan. SOAP no especifica una API, por lo que la implementación de la API se deja al lenguaje de programación, como en JAVA, y la plataforma como Microsoft .Net.

—

No se encuentra fuertemente asociado a ningún protocolo de transporte: la especificación de SOAP no describe como se deberían asociar los mensajes de SOAP con HTTP. Un mensaje de SOAP no es más que un documento XML, por lo que puede transportarse utilizando cualquier protocolo capaz de transmitir texto.

—

No está atado a ninguna infraestructura de objeto distribuido: la mayoría de los sistemas de objetos distribuidos se pueden extender, y ya lo están alguno de ellos para que admitan SOAP.

—

Aprovecha los estándares existentes en la industria: los principales contribuyentes a la especificación SOAP evitaron, intencionadamente, reinventar las cosas. Optaron por extender los estándares existentes para que coincidieran con sus necesidades. Por ejemplo, SOAP aprovecha XML para la codificación de los mensajes, en lugar de utilizar su propio sistema de tipo que ya están definidas en la especificación esquema de XML. Y como ya se ha mencionado SOAP no define un medio de trasporte de los mensajes; los mensajes de SOAP se pueden asociar a los protocolos de transporte existentes como HTTP y SMTP.

—

Permite la interoperabilidad entre múltiples entornos: SOAP se desarrollo sobre los estándares existentes de la industria, por lo que las aplicaciones que se ejecuten en plataformas con dicho estándares pueden comunicarse mediante mensaje SOAP con aplicaciones que se ejecuten en otras plataformas. Por ejemplo, una aplicación de escritorio que se ejecute en una PC puede comunicarse con una aplicación del back-end ejecutándose en un mainframe capaz de enviar y recibir XML sobre HTTP.

SOAP proporciona un mecanismo estándar de empaquetar un mensaje. Un mensaje SOAP se compone de un sobre que contiene el cuerpo del mensaje y cualquier información de cabecera que se utiliza para describir le mensaje. El elemento raíz del documento es el elemento Envelope. El ejemplo contiene dos subelementos, Body y Header. Un ejemplo de SOAP valido también puede contener otros elementos hijo en el sobre. 8-35


—

El sobre puede contener un elemento Header opcional que contiene información sobre el mensaje.

—

Un mensaje debe estar dentro de sobre de SOAP bien construido. Un sobre se compone de un único elemento “envelope” el sobre puede contener un elemento Header y puede contener un elemento “body”. Si existe, la cabecera debe ser el elemento hijo inmediato del sobre, con el cuerpo siguiendo inmediatamente a la cabecera.

—

El cuerpo contiene la carga de datos del mensaje y la cabecera contiene los datos adicionales que no pertenecen necesariamente al cuerpo del mensaje.

—

Además de definir un sobre de SOAP, la especificación de SOAP define una forma de codificar los datos contenidos en un mensaje. La codificación de SOAP proporciona un mecanismo estándar para serializar tipos de datos no definidos en la parte 1 de la especificación del esquema de XML.

—

La especificación de SOAP también proporciona un patrón de mensaje estándar para facilitar el comportamiento de tipo RPC. Se emparejan dos mensajes de SOAP para facilitar la asociación de un mensaje de petición con un mensaje de respuesta.

—

La llamada a un método y sus parámetros se serializan en el cuerpo del mensaje de petición en forma de una estructura. El elemento raíz tiene el mismo nombre que el método objetivo, con cada uno de los parámetros codificado como un subelemento.

—

El mensaje de respuesta puede contener los resultados de la llamada al método o una estructura de fallo bien definida. Los resultados de la llamada a un método se serializan en el cuerpo de la petición como una estructura.

lolo123 2007-05-18T13:20:00.000-05:00 Pepe Ejemplo 8-36

Aplicaciones Web

Madrid Los Angeles 2007-12-14 última hora de la tarde pasillo Los Angeles Madrid 2007-12-20 media-mañana ninguna

6.8.2. WSDL (Lenguaje de Descripción de Servicios Web) para la documentación de Servicios Web • SEGUNDA VERSION CONVERTIDA A RECOMENDACIÓN: W3C Recommendation 26 June 2007 (http://www.w3.org/TR/wsdl20/) XML no basta para describir un servicio Web, ya que este ha de asentarse también en unos patrones; estos patrones los proporciona el lenguaje de descripción WSDL. WSDL, permite que un servicio y un cliente establezcan un acuerdo en lo que se refiere a los detalles de transporte de mensajes y su contenido, a través de un documento procesable por dispositivos. WSDL representa una especie de contrato entre el proveedor y el que solicita. WSDL especifica la sintaxis y los mecanismos de intercambio de mensajes. Supongamos que se ha creado un servicio Web Calculadora. Este servicio Web expone los métodos sumar y restar. Ambos métodos aceptan dos enteros y devuelven un único entero con el resultado; sumar devuelve la suma de los dos enteros y restar devuelve su diferencia. En un esfuerzo para describir cómo interacciona un cliente con el servicio Web se define un esquema para los mensajes que se intercambiarán entre el cliente y el servidor. El esquema contiene una definición de un tipo de com8-37


plejo para los mensajes de petición y repuesta para los métodos sumar y restar. Recuerde que el objetivo último es que los desarrolladores no tengan que investigar en las definiciones del esquema intentando descifrar cómo interaccionar con el servicio Web. En lugar de ello se quiere describir el servicio de forma que una herramienta pueda descifrarlo y crear un proxy por el cliente. Además de la información que proporciona el esquema, ¿Qué más necesita conocer el cliente para invocar los métodos que expone el Servicio Web Calculadora? Como el cuerpo de un mensaje de SOAP puede contener cualquier cosa que no invalide el XML los mensajes de SOAP se pueden combinar para disponer de una amplia variedad de patrones de intercambio de mensajes. Los patrones de intercambio de mensajes para el Servicio Web Calculadora son bastante inmediatos pero una asociación formal entre los mensajes de petición Sumar y Restar y sus mensajes de respuesta asociados eliminarían cualquier posible ambigüedad. Algunos servicios podrían aceptar una petición pero no enviar la respuesta correspondiente devuelta al cliente. Otros podrían solamente enviar mensajes al cliente. Además, el esquema no contiene información sobre cómo acceder al Servicio Web. Como SOAP es independiente del protocolo, se intercambiarán los mensajes entre el cliente y el servidor de numerosas formas. ¿Cómo se sabe si hay que enviar un mensaje mediante HTTP, SMTP o cualquier otro protocolo de transporte? Más aún, ¿cómo se sabe la dirección la que hay que enviar el mensaje? El lenguaje de descripción de servicios Web (WSDL) es un dialecto basado en XML sobre el esquema que describe un servicio Web. Un documento WSDL proporciona la información necesaria al cliente para interaccionar con el servicio Web. WSDL es extensible y se pude utilizar para describir, prácticamente, cualquier servicio de red, incluyendo SOAP sobre HTTP e incluso protocolos que no se basan en XML como DCOM sobre UDP. Dado que los protocolos de comunicaciones y los formatos de mensajes están estandarizados en la comunidad del Web, cada día aumenta la posibilidad e importancia de describir las comunicaciones de forma estructurada. WSDL afronta esta necesidad definiendo una gramática XML que describe los servicios de red como colecciones de puntos finales de comunicación capaces de intercambiar mensajes. Las definiciones de servicio de WSDL proporcionan documentación para sistemas distribuidos y sirven como fórmula para automatizar los detalles que toman parte en la comunicación entre aplicaciones. Los documentos WSDL definen los servicios como colecciones de puntos finales de red o puertos. En WSDL, la definición abstracta de puntos finales y de mensajes se separa de la instalación concreta de red o de los enlaces del formato de datos. Esto permite la reutilización de definiciones abstractas: mensajes, que son descripciones abstractas de los datos que se están intercambiando y tipos de puertos, que son colecciones abstractas de operaciones. Las especificaciones concretas del protocolo y del formato de datos para un tipo de puerto determinado constituyen un enlace reutilizable. Un puerto se define por la asociación de una dirección de red y un enlace reutilizable; una colección de puertos define un servicio.

8-38

Aplicaciones Web

El esquema para un determinado conjunto de elementos de extensibilidad se debe definir dentro de distintos espacios de nombres que WSDL. La definición de los propios elementos puede contener un atributo wsdl:requiered que indique un valor Boolean si el atributo “requiered” se establece a true en una definición de elementos una asociación que haga referencia a ese conjunto concreto de electos de extensibilidad tiene que incluir dicho elemento. Lo más habitual es que los elementos de extensibilidad se utilicen para especificar especificación de asociación. La especificación WSDL define conjunto de elementos de extensibilidad para la asociación SOAP, HTTP GET, HTTP POS, MIME. Sin embargo, la especificación sólo define las asociaciones para dos de los cuatro tipos de operaciones. Un sentido y petición repuesta. El Grupo de Trabajo Web Services Description ha hecho público el Lenguaje descriptor de servicios (WSDL) Versión 2.0: —

Parte 1: Núcleo del Lenguaje y

—

Parte 2: Patrones de Mensaje.

WSDL es un modelo y formato XML para describir servicios en red. El lenguaje permite separar etapas fundamentales de función abstracta y detalles concretos. (CONVERTIDO A RECOMENDACIÓN: W3C Recommendation 26 June 2007) http://www.w3.org/TR/wsdl20/ WSDL Es un protocolo basado en XML que describe los accesos al Web Service. Podriamos decir que es el manual de operación del Web service, porque nos indica cuales son las interfaces que provee el Servicio Web y los tipos de datos necesarios para la utilización del mismo. Veamos un ejemplo de un documento WSDL: ...

...

...

...

Un documento WSDL utiliza los siguientes elementos en la definición de servicios de red:

8-39


Comienzo del documento, este tag agrupa a todos los demás. Se definen los tipos de datos utilizados en el Web Service.

Contenedor de definiciones del tipo de datos que utiliza algún sistema de tipos (por ejemplo XSD).

Fin de la definición de tipos.

Se definen los métodos y parámetros para realizar la operación. Cada message puede consistir en una o más partes (parámetros). Definición abstracta y escrita de los datos que se están comunicando.

Fin de la definición de los parámetros.

Esta sección es la más importante, ya que se definen las operaciones que pueden ser realizadas, y los mensajes que involucran (por ejemplo el mensaje de petición y el de respuesta). Conjunto abstracto de operaciones admitidas por uno o más puntos finales.

Fin de la definición de las operaciones y mensajes.

Punto final único que se define como la combinación de un enlace y una dirección de red.

Colección de puntos finales relacionados.

Se definen el formato del mensaje y detalles del protocolo para cada portType. Eespecificación del protocolo y del formato de datos para un tipo de puerto determinado.

Fin de la definición del formato del mensaje y detalles del protocolo para cada PortType.

Fin del documento WSDL

Ejemplo Parte 1 (Núcleo del Lenguaje): 8-40

Aplicaciones Web

Ejemplo Parte 2 (Patrones de Mensaje): *

whttp:contentEncoding=”xs:string”? />

6.8.3. UDDI (Universal Description Discovery and Integration). Un registro global de servicios Web • UDDI Version 3.0. UDDI Spec Technical Committee Specification. http://www.uddi.org/pubs/uddi-v3.00-published-20020719.htm Una vez definido el servicio Web, necesitamos darlo a conocer a la comunidad para que sepan de su existencia. UDDI se va a encargar de ello. Definir cómo se dará a conocer el servicio Web para que los clientes interesados puedan descubrirlo fácilmente y utilizarlo en sus aplicaciones. En la actualidad, ya existe un mecanismo de descubrimiento que cumple estos requisitos: UDDI (Universal Description Discovery and Integration), una iniciativa del sector para hacer compatible el descubrimiento de servicios Web con todo tipo de tecnologías y plataformas. UDDI es un registro público diseñado para almacenar de forma estructurada información sobre empresas y los servicios que éstas ofrecen. A través de UDDI, se puede publicar y descubrir información de una empresa y de sus servicios. Se puede utilizar sistemas taxonómicos estándar para clasificar estos datos y poder encontrarlos posteriormente en función de la categorización. Lo más importante es que UDDI contiene información sobre las interfaces técnicas de los servicios de una empresa. A través de un conjunto de llamadas a API XML basadas en SOAP, se puede interactuar con UDDI tanto en tiempo de diseño como de ejecución para descubrir datos técnicos de los servicios que permitan invocarlos y utilizarlos. De este modo, UDDI sirve como infraestructura para una colección de “software” basado en servicios Web. Varias empresas, incluidas Microsoft, IBM, Sun, Oracle, Compaq, Hewlett Packard, Intel, SAP y unas trescientas más (para obtener un listado completo, consulte UDDI: Community [en inglés]), unieron sus esfuerzos para desarrollar una especificación basada en estándares abiertos y tecnologías no propietarias. A partir de la creación de esta infraestructura para servicios Web, los datos sobre estos servicios se pueden encontrar de forma sistemática y confiable en una capacidad universal totalmente independiente de proveedores. Se pueden llevar a cabo búsquedas categóricas precisas utilizando sistemas de identificación y taxonómicos extensibles. La integración de UDDI en tiempo de ejecución se puede incorporar a las aplicaciones. Como resultado, se fomenta el desarrollo de un entorno de “software” de servicios Web.

Nota. En Biología, un taxón (del griego Ù·ÍÈ˜, ordenamiento) es un grupo de organismos emparentados, que en una clasificación dada han sido agrupados, asignándole al grupo un nombre en latín, una descripción, y un “tipo”, que si el taxón es una especie es un espécimen o ejemplar concreto. Cada descrip-

8-42

Aplicaciones Web

ción formal de un taxón es asociada al nombre del autor o autores que la realizan, los cuales se hacen figurar detrás del nombre. La información de UDDI se aloja en nodos de operador, empresas que se han comprometido a ejecutar un nodo público conforme a la especificación que rige el consorcio UDDI.org. Existen nodos públicos que se ajustan a la versión 1 de la especificación UDDI: Microsoft aloja uno e IBM el otro. Hewlett Packard se ha comprometido a alojar un nodo bajo la versión 2 de la especificación. Los operadores del “host” deben replicar datos entre ellos a través de un canal seguro, para conseguir la redundancia de la información en el registro UDDI. Se pueden publicar los datos en un nodo y descubrirlos en otro tras la réplica. Actualmente, la réplica se produce cada 24 horas. En el futuro, este intervalo entre réplicas se reducirá, ya que habrá más aplicaciones que dependan de los datos de UDDI. Resulta importante observar que no existen requisitos de propietario respecto al modo en que el operador del host implementa su nodo. El nodo sólo se debe ajustar a la especificación UDDI. El nodo público UDDI constituye un claro ejemplo de que el modelo de servicios Web XML funciona en entornos heterogéneos. UDDI es relativamente ligero; se ha diseñado como registro, no como depósito. La diferencia, aunque sutil, resulta esencial. Un registro redirige al usuario a recursos, mientras que un depósito sólo almacena información. El registro Microsoft® Windows® puede servir de ejemplo: contiene las configuraciones y parámetros básicos pero, en última instancia, su función es la de dirigir la aplicación a un recurso o binario. Buscar un componente COM basándonos en su Id. de programa nos conducirá a un Id. de clase, que a su vez nos dirigirá a la ubicación del binario. UDDI se comporta de forma similar: como el registro de Windows, se basa en identificadores únicos globales (GUID) para garantizar la capacidad de búsquedas y determinar la ubicación de recursos. En última instancia, las consultas a UDDI conducen a una interfaz (un archivo .WSDL, .XSD, .DTD, etc.) o a una implementación (como un archivo .ASMX o .ASP) ubicadas en otro servidor. OASIS ratifica UDDI-OASIS (Organization for the Advancement of Structured Information Standards) ha aprobado UDDI (Universal Description, Discovery and Integration), uno de los estándares claves en la arquitectura de servicios Web junto a XML), SOAP (Simple Object Access Protocol) y WSDL (Web Services Description Language). UDDI es un modelo de directorios para Web Services. Es una especificación para mantener directorios estandarizados de información acerca de los Web Services, sus capacidades, ubicación, y requerimientos en un formato reconocido universalmente. UDDI utiliza WSDL para describir las interfaces de los Web Services. Es un lugar en el cual podemos buscar cuales son los Servicios Web disponibles, una especie de directorio en el cual podemos encontrar los Web Services publicados y publicar los Web Services que desarrollemos.

6.8.4. WSDL y UDDI WSDL se ha convertido en una pieza clave de la pila de protocolos de los servicios Web. Por eso, es importante saber cómo colaboran UDDI y WSDL y por qué la idea de interfaces frente implementaciones forma parte de cada 8-43


protocolo. WSDL y UDDI se diseñaron para diferenciar claramente los metadatos abstractos y las implementaciones concretas. Para entender cómo funcionan WSDL y UDDI resulta esencial comprender las consecuencias de esta división. Por ejemplo, WSDL distingue claramente los mensajes de los puertos: los mensajes (la sintaxis y semántica que necesita un servicio Web) son siempre abstractos, mientras que los puertos (las direcciones de red en las que se invoca al servicio Web) son siempre concretos. No es necesario que un archivo WSDL incluya información sobre el puerto. Un archivo WSDL puede contener simplemente información abstracta de interfaz, sin facilitar datos de implementación concretos, y ser válido. De este modo, los archivos WSDL se separan de las implementaciones. Una de las consecuencias más interesantes de esto es que pueden existir varias implementaciones de una única interfaz WSDL. Este diseño permite que sistemas dispares escriban implementaciones de la misma interfaz, para garantizar así la comunicación entre ellos. Si tres empresas diferentes implementan el mismo archivo WSDL y una parte del “software” de cliente crea el código auxiliar/proxy a partir de esa interfaz, dicho “software” se podrá comunicar con las tres implementaciones con el mismo código de base, cambiando simplemente el punto de acceso.

6.9.

SOA

La Arquitectura Orientada a Servicios (SOA), define un modelo de arquitectura “software” que está teniendo bastante aceptación para entornos de integración de aplicaciones. El concepto básico de esta arquitectura es el de servicio. Los nodos de un sistema distribuido ofrecen servicios al resto del sistema de una forma estandarizada. Un servicio es una función autocontenida y sin estado que acepta una o varias peticiones y devuelve una o varias respuestas a través de una interfaz bien definida. Los servicios no dependen del estado de otras funciones o procesos. SOA proporciona una metodología y un marco de trabajo para documentar las capacidades de negocio y puede dar soporte a las actividades de integración y consolidación. Los objetivos iniciales de la plataforma SOA son el contar con un contenedor de servicios fiable y de altas prestaciones para el desarrollo de servicios SOA y que sirva como base para el desarrollo de posteriores herramientas y servicios de descubrimiento y orquestación de Web Services. En un ambiente SOA, los nodos de la red hacen disponibles sus recursos a otros participantes en la red como servicios independientes a los que tienen acceso de un modo estandarizado. La mayoría de las definiciones de SOA identifican la utilización de Servicios Web (empleando SOAP y WSDL) en su implementación, no obstante se puede implementar una SOA utilizando cualquier tecnología basada en servicios. Al contrario de las arquitecturas orientado a objetos, las SOAs están formadas por servicios de aplicación débilmente acoplados y altamente interoperables. Para comunicarse entre sí, estos servicios se basan en una definición formal independiente de la plataforma subyacente y del lenguaje de programación (p.ej., WSDL). La definición de la interfaz encapsula (oculta) las particularidades de una implementación, lo que la hace independiente del fabricante, del lenguaje de progra8-44

Aplicaciones Web

mación o de la tecnología de desarrollo (como Plataforma JAVA o Microsoft .NET). Con esta arquitectura, se pretende que los componentes software desarrollados sean muy reusables, ya que la interfaz se define siguiendo un estándar; así, un servicio C Sharp podría ser usado por una aplicación JAVA. Los lenguajes de alto nivel como BPEL o WS-coordinación llevan el concepto de servicio un paso adelante al proporcionar métodos de definición y soporte para flujos de trabajo y procesos de negocio. Término

Definición / Comentario

Servicio

Una función sin estado, auto-contenida, que acepta una(s) llamada(s) y devuelve una(s) respuesta(s) mediante una interfaz bien definida. Los servicios pueden también ejecutar unidades discretas de trabajo como serían editar y procesar una transacción. Los servicios no dependen del estado de otras funciones o procesos. La tecnología concreta utilizada para prestar el servicio no es parte de esta definición.

Orquestación

Secuenciar los servicios y proveer la lógica adicional para procesar datos. No incluye la presentación de los datos. Coordinación.

Sin estado

No mantiene ni depende de condición pre-existente alguna. En una SOA los servicios no son dependientes de la condición de ningún otro servicio. Reciben en la llamada toda la información que necesitan para dar una respuesta. Debido a que los servicios son “sin estado”, pueden ser secuenciados (orquestados) en numerosas secuencias (algunas veces llamadas tuberías o pipelines) para realizar la lógica del negocio.

Proveedor

La función que brinda un servicio en respuesta a una llamada o petición desde un consumidor.

Consumidor

La función que consume el resultado del servicio provisto por un proveedor.

La metodología de modelado y diseño para aplicaciones SOA se conoce como análisis y diseño orientado a servicios. La arquitectura orientada a servicios es tanto un marco de trabajo para el desarrollo de “software” como un marco de trabajo de implantación. Para que un proyecto SOA tenga éxito los desarrolladores de software deben orientarse ellos mismos a esta mentalidad de crear servicios comunes que son orquestados por clientes o “middleware” para implementar los procesos de negocio. El desarrollo de sistemas usando SOA requiere un compromiso con este modelo en términos de planificación, herramientas e infraestructura.

6.10. Detalles sobre los Servicios Web A diferencia de DCOM y CORBA, que son binarios, SOAP usa el código fuente en XML. Esto es una ventaja ya que facilita su lectura por parte de 8-45


humanos, pero también es un inconveniente dado que los mensajes resultantes son más largos. El intercambio de mensajes se realiza mediante tecnología de componentes. SOAP es un marco extensible y descentralizado que permite trabajar sobre múltiples pilas de protocolos de redes informáticas. Los procedimientos de llamadas remotas pueden ser modelados en la forma de varios mensajes SOAP interactuando entre sí. SOAP funciona sobre cualquier protocolo de Internet, generalmente HTTP, que es el único homologado por el W3C. SOAP tiene como base XML, con un diseño que cumple el patrón Cabecera-Desarrollo de diseño de “software”, como otros muchos diseños, verbigracia HTML. La cabecera Header es opcional y contiene metadatos sobre enrutamiento (routing), seguridad o transacciones. El desarrollo Body contiene la información principal, que se conoce como carga útil (payload). La carga útil se acoge a un XML Schema propio.

6.11. Ventajas de los servicios Web —

Aportan interoperabilidad entre aplicaciones de “software” independientemente de sus propiedades o de las plataformas sobre las que se instalen.

—

Los servicios Web fomentan los estándares y protocolos basados en texto, que hacen más fácil acceder a su contenido y entender su funcionamiento.

—

Al apoyarse en HTTP, los servicios Web pueden aprovecharse de los sistemas de seguridad firewall sin necesidad de cambiar las reglas de filtrado.

—

Permiten que servicios y “software” de diferentes compañías ubicadas en diferentes lugares geográficos puedan ser combinados fácilmente para proveer servicios integrados.

—

Permiten la interoperabilidad entre plataformas de distintos fabricantes por medio de protocolos estándar.

6.12. Inconvenientes de los servicios Web

8-46

—

Para realizar transacciones no pueden compararse en su grado de desarrollo con los estándares abiertos de computación distribuida como CORBA (Common Object Request Broker Architecture).

—

Su rendimiento es bajo si se compara con otros modelos de computación distribuida, tales como RMI (Remote Method Invocation), CORBA, o DCOM (Distributed Component Object Model). Es uno de los inconvenientes derivados de adoptar un formato basado en texto. Y es que entre los objetivos de XML no se encuentra la concisión ni la eficacia de procesamiento.

—

Al apoyarse en HTTP, pueden esquivar medidas de seguridad basadas en firewall cuyas reglas tratan de bloquear o auditar la comunicación entre programas a ambos lados de la barrera.

—

Existe poca información de servicios web para algunos lenguajes de programación.

Aplicaciones Web

7. 7.1.

Lenguajes de descripción de datos: HTML Introducción

HTML es el lenguaje utilizado para la creación de páginas web. Las siglas proceden de HyperText Markup Language (lenguaje de marcado de hipertexto). Los documentos escritos en un lenguaje de marcado están formados por datos y marcas (etiquetas). Los datos constituyen el contenido del documento y las marcas proporcionan el significado de los datos o bien, indican algún otro tipo de atributo. El término hipertexto se utiliza para referirse a un documento que incluye texto combinado con enlaces, los cuales redireccionan al usuario a otras partes del mismo o a otros documentos. En realidad, los documentos HTML no sólo contienen texto y enlaces. También pueden contener otros formatos de información multimedia como imágenes, vídeos o sonidos. Los documentos HTML se pueden crear con un simple editor de textos o bien, utilizando un programa de diseño web como Microsoft FrontPage o Macromedia Dreamweaver. Estos últimos programas generan automáticamente el código HTML a partir de la representación visual que va elaborando el diseñador. Una vez creados, los documentos HTML se almacenan en el servidor web. Cuando un cliente solicita una página, el servidor envía el documento HTML correspondiente. Finalmente, el navegador del usuario lee el documento recibido y lo representa en pantalla. Un navegador, visualizador HTML o “browser” no es más que un programa capaz de representar documentos HTML, ya sean locales o estén en un servidor web remotos. Algunos de los navegadores más conocidos son: Microsoft Internet Explorer, Netscape, Mosaic, Mozilla, Opera, Galeon y Lynx. Este último sólo permite navegación en modo texto. HTML es un subconjunto del metalenguaje SGML (Standard Generalized Markup Language, lenguaje de marcas generalizado estandarizado) para la creación de páginas web. Metalenguaje significa lenguaje para la creación de otros lenguajes. XML (Extensible Markup Language, lenguaje de marcas extensible) también es otro metalenguaje, basado en SGML, aunque mucho más sencillo. En XML se han excluido los elementos menos utilizados y más complejos de SGML. La primera versión de HTML data de 1992. Esta versión disponía de un número muy reducido de etiquetas. Desde esta especificación inicial, el lenguaje ha ido evolucionando en distintas versiones hasta llegar a la versión 4.0 en diciembre de 1997, mejorada posteriormente por HTML 4.01 (diciembre de 1999). La siguiente versión a HTML 4.01 se considera XHTML 1.0 (enero de 2000) que es, en realidad, una reformulación de HTML 4 en el lenguaje XML. El organismo responsable del desarrollo de las recomendaciones HTML y del resto de estándares de la web es W3C (Consorcio para la World Wide Web). La mayor parte de ejemplos de este tema se refieren a la versión 4.0 por ser la versión preferida por los exámenes.

8-47


7.2

Elementos. Sintaxis de las etiquetas

Los documentos HTML son archivos en formato de texto que contienen información textual y etiquetas. La información se mostrará en el navegador del usuario según lo indiquen las etiquetas. Por ejemplo, se puede utilizar una etiqueta para destacar un párrafo con un determinado color o tipo de letra. Las etiquetas también se utilizan para incluir otros elementos adicionales en las páginas web como imágenes, sonidos, scripts o Applets de JAVA. Todas las etiquetas se encuentran delimitadas entre los símbolos < (menor que) y > (mayor que). Lo que esté fuera de estos símbolos son textos que, generalmente, se mostrarán en el navegador del usuario. Un elemento de HTML está formado por una etiqueta de apertura, un contenido y una etiqueta de cierre. En ocasiones, se omiten partes del elemento. Al contenido del elemento se le aplicará lo que indique la etiqueta. —

Etiqueta de apertura. Tiene la sintaxis general de . Los atributos indican propiedades adicionales de la etiqueta. Una etiqueta puede tener cero, uno o más atributos. El orden en el que se escriban los atributos no es relevante. Por ejemplo: . Como vemos, se utiliza el delimitador espacio para separar el nombre de la etiqueta del primer atributo y un atributo de otro. Para cada atributo se indica el valor que recibe entre comillas.

—

Etiqueta de cierre. Su sintaxis es . Una etiqueta de cierre siempre comienza con la barra inclinada '/'. No incluye atributos.

Veamos varios ejemplos: —

Este texto aparecerá en negrita

—

Título que aparecerá centrado

—

Aspectos a tener en cuenta:

8-48

—

HTML 4 no distingue entre mayúsculas y minúsculas en las etiquetas y atributos, por lo que <script> y <SCRIPT> serían equivalentes. Por el contrario, XHTML requiere que las etiquetas y atributos aparezcan en minúsculas.

—

La utilización de comillas en los valores de los atributos de HTML 4 es opcional en ciertos casos, aunque se recomienda su utilización. La etiqueta sería correcta sintácticamente. Es obligatoria la utilización de comillas cuando el valor de los atributos contenga un carácter diferente a números (0-9), letras (a-z y A-Z), guión (-), subrayado (_), punto (.) o dos puntos (:). Por ejem-

Aplicaciones Web

plo . En XHTML es obligatorio el uso de comillas en todos los casos. —

En HTML 4, no es obligatorio cerrar algunas etiquetas (elementos vacíos). Por ejemplo, las etiquetas ,
,
,
,
o . En XHTML, por el contrario, es obligatorio cerrar todas las etiquetas. Esto se puede hacer de dos formas: abriendo y cerrando con la misma etiqueta (se coloca una barra al final para indicarlo:
) o bien, colocando la etiqueta de cierre a continuación de la de apertura (ejemplo:

).

—

Existen algunos atributos generales que son válidos para todas las etiquetas (como los atributos class o id). Sin embargo, hay otros que son específicos de cada etiqueta (como el atributo src en la etiqueta ).

Se pueden incluir comentarios dentro del código HTML. Estos comentarios no serán interpretados por el navegador, aunque sí serían vistos por el visitante si éste consultase el código fuente de la página. Los comentarios se utilizan habitualmente para señalizar bloques o partes del documento en códigos HTML largos. Los comentarios se delimitan entre los símbolos (guión, guión, mayor que). Pueden abarcar una o más líneas. Ejemplo: —

7.3.

Estructura general de un documento HTML

Un código HTML está delimitado por las etiquetas y . Contiene dos secciones: —

Cabecera. Se delimita por las etiquetas y . Contiene información adicional del documento, como su título, su autor o la codificación internacional que se ha empleado, así como hojas de estilo, scripts u otros elementos. Cada documento, según las especificaciones de HTML 4, debe tener exactamente un título dentro de la sección de cabecera. El título se indica con el elemento . El contenido de este elemento se mostrará habitualmente en la barra de título de la ventana del navegador.<br /> <br /> —<br /> <br /> Cuerpo del documento. Se incluye entre las etiquetas <body> y </body>. Se corresponde con el contenido del documento, esto es, aquella información que se mostrará en el navegador del usuario. La sección de body es la más extensa del documento HTML.<br /> <br /> A continuación mostramos la estructura general de un documento HTML: <html> <head> <title>Este es el título de la página 8-49


Aquí se incluye el contenido de la página. Atributos que puede aparecer en la etiqueta : •

background=“archivo de imagen de fondo”

•

bgcolor=“color de fondo del documento”

•

text=“color del texto”

•

link=“color de los enlaces no visitados”

•

vlink=“color de los enlaces visitados”

•

alink=“color del enlace que está seleccionando el usuario”

Ejemplo:

7.4.

Elementos de la sección de cabecera Los siguientes elementos aparecen en la sección de cabecera:

A) Elemento: —<br /> <br /> Explicación: título del documento. El título del documento aparece habitualmente en el título de la ventana del navegador. No confundir esta etiqueta con los títulos que aparecen en el cuerpo del documento (<h1>, <h2>, etc...).<br /> <br /> Ejemplo: <title>Programación en Internet B) Elemento: <meta> —

Explicación: información del documento. La información de estas etiquetas no se muestra al usuario en el navegador, sin embargo puede ser leída por programas específicos (motores de búsqueda, por ejemplo) o consultando manualmente el código fuente de la página. Permite almacenar datos como el autor de la página, el programa de diseño web que se ha utilizado, la descripción del documento, palabras clave, etc.

Ejemplos: <meta name=”Description” content=”página de ejemplo de HTML”>

8-50

Aplicaciones Web

<meta name=”Keywords” content=”oposiciones, tai, programación”> <meta http-equiv=”Refresh” content=”10;URL=http://www.adams.es”> (esta última etiqueta genera una redirección automática después de 10 segundos a la URL indicada) C) Elemento: D) Elemento: —

Explicación: enlace en la sección de cabecera (al contrario que que son enlaces en el cuerpo del documento). Uno de los usos más frecuentes de este elemento es para llamar a una hoja de estilo CSS ubicada en un documento externo.

Ejemplo:

href=”hoja-de-estilos.css”

type=”text/css”

E) Elemento: <script> —

Explicación: código de un lenguaje de script, JavaScript normalmente, tanto almacenado en un documento externo como en el propio documento. El elemento <script> también puede aparecer en la sección del cuerpo del documento. La ventaja de incluir los scripts en la cabecera es que los mismos se cargarán antes de que comience a mostrarse el documento en el navegador del usuario. Por este motivo, es frecuente colocar en la cabecera las funciones o trozos de códigos que serán llamados desde otras partes del documento.

Ejemplo: <script src=”codigo-javascript.js” cript” type=”text/javas cript”>

7.5.

language=”JavaS-

Marcos (Frames)

Lo habitual es que cada documento HTML se ubique en el área de trabajo de la ventana del navegador. Sin embargo, los marcos permiten dividir el área del navegador en varias partes y en cada una de ellas, desplegar un documento HTML diferente. Su uso más frecuente es la utilización de un marco para mantener cierta información visible permanentemente (por ejemplo, una botonera con opciones) y otro marco con información variable.

8-51


Para generar marcos se requiere, por un lado, un documento HTML que defina la estructura de los marcos (frameset) y por otro, tantos documentos HTML como marcos se hayan definido. El siguiente ejemplo genera una estructura con dos marcos. Cuando se invoque este código, el navegador dividirá su área de trabajo en dos columnas. La de la derecha ocupa un 10% de la anchura del navegador y la de la izquierda, un 90%. En la primera división aparecerá el documento indice.htm y en la segunda, portada.htm: Ejemplo de frames Se puede realizar una división por filas, cambiando el atributo “cols” de por “rows”. Es posible también anidar un dentro de otro y generar así estructuras de marcos más complejas.

7.6.

Elementos de formato de textos

Los elementos que veremos en los próximos apartados se ubican dentro de la sección del cuerpo del documento (). Comenzamos repasando los elementos relativos al formato de texto. A pesar del siguiente listado, las recomendaciones de diseño actuales instan a utilizar hojas de estilo en lugar de etiquetas de presentación. Esto es: en lugar de emplear etiquetas como para indicar “negrita”, se prefiere la utilización de otras etiquetas más generales, cuyas características de presentación concretas (tipos de letras, tamaños, negritas, colores, alineaciones, separación de párrafos, etc...) queden definidas en una hoja de estilo.

8-52

—

Texto en negrita.

—

Texto en cursiva.

—

Texto subrayado.

—

Tipo de letra. Permite definir el tipo de letra (atributo face), color (atributo color) y tamaño (atributo size).

—

Salto de línea. No es necesaria etiqueta de cierre.

—

Línea horizontal.

Aplicaciones Web

—

Letra de máquina de escribir. —Texto centrado. — Texto preformateado. Se conservarán los espacios en blanco y los saltos de línea tal y como aparecen en el código fuente. — Texto sangrado. — Texto con parpadeo. Este elemento no está contemplado por el W3C, únicamente funciona en el navegador Netscape. Los siguientes elementos añaden información estructural (aportan significado) a los documentos. En lugar de indicar cómo se deben mostrar, indican el tipo de texto que delimitan. Las características de presentación se definirán en una hoja de estilos. Por ejemplo: se puede escribir ejemplo y en la hoja de estilos, indicar que todos los elementos se muestren en color rojo. — Párrafo. Se puede indicar la alineación del párrafo mediante el atributo “align”. No es necesaria etiqueta de cierre. — , , , , y Títulos. es el título (epígrafe) más general, es un subtítulo de y así sucesivamente, hasta llegar a , que es el título de menor importancia. — Texto con énfasis. — Texto destacado (con mayor énfasis). — Dirección. Se utiliza para indicar la forma de contacto con los autores de un texto mostrado en la página. — Cita o referencia a otras fuentes. — Código de ordenador. — Definición. — Teclado. Texto que debe introducir el usuario en un programa. — Ejemplo de salida de un programa. — Variable de un programa. Ejemplo: Ceremonia de los Oscars El Señor de los Anillos: El Retorno del Rey fue la vencedora de la 76 edición de los Oscars, ya que obtuvo nada menos que 11 Oscars 8-53 Desarrollo de Sistemas 7.7. Referencias de caracteres Las referencias de caracteres o referencias de entidad definen una serie de nombres para que los autores puedan referirse a caracteres especiales dentro de un documento. Comienzan por el símbolo “&” y terminan con un punto y coma. Algunos de ellos aparecen frecuentemente en documentos HTML: — < representa el carácter menor que (<). — > representa el carácter mayor que (>). — & representa el carácter &. — " representa las comillas dobles (“). Por ejemplo: el texto 5<2 se codificaría en HTML como 5<2 y de esta forma se evitaría la confusión con el símbolo de apertura de etiqueta. Existen también referencias de caracteres para aquellos específicos de cada idioma como, por ejemplo: á (á), Â (Â), Ç (Ç), ñ (ñ). 7.8. Colores Hemos visto que algunas etiquetas HTML incluyen atributos de color. En este tipo de atributos, así como en ciertas propiedades de las hojas de estilo, es necesario representar el color deseado con una notación apropiada. En este apartado estudiamos las notaciones admitidas: 7.9. — Nombre del color: black, white, red, blue, yellow, green, maroon, gray, cyan, purple, etc. — Notación RGB. Se indican 3 bytes expresados en hexadecimal. El primer byte indica la cantidad de rojo; el segundo, la cantidad de verde y el tercero, la cantidad de azul. Ejemplos: #000000 (negro), #FFFFFF (blanco), #FF0000 (rojo), #D50000 (un rojo más oscuro), #FFFF00 (amarillo), #FFAC30 (una tonalidad naranja). — Notación RGB abreviada. Similar al anterior, aunque sólo se indica el primer carácter de cada “byte”. Por ejemplo: #ABC se corresponde en realidad con el color #AABBCC. La gama de colores obtenida utilizando la notación abreviada es menor que con la notación anterior, aunque suele ser más que suficiente. Imágenes Se pueden incluir imágenes en documentos HTML mediante el elemento . Este elemento sólo tiene etiqueta de apertura, no tiene ni contenido ni etiqueta de cierre. El siguiente ejemplo muestra la imagen del archivo foto.jpg con 200 píxeles de anchura y 300 de altura. Si no se especifican las dimensiones, se toman las de la imagen original. 8-54 Aplicaciones Web 7.10. Enlaces Los enlaces (links, hiperenlaces, vínculos o hipervínculos) son el principal elemento de las páginas web. Sin enlaces no existiría la navegación. Un enlace permite referenciar otra página web u otra zona de la misma para que el usuario, haciendo clic en el mismo, salte al lugar indicado. También se pueden referenciar imágenes o archivos para descargar. Su sintaxis es: Texto que aparecerá en el enlace. Ejemplos: — Ir a la portada — Centro de Estudios Adams — — Descarga del tema Obsérvese que para indicar la localización del recurso, se emplean atributos diferentes en las etiquetas y (href en y src en ). 7.11. Listas HTML dispone de estructuras para crear listas de información. Las listas están compuestas por elementos (items). Podemos ver las listas de HTML como las numeraciones y viñetas de un procesador de textos. Se contemplan tres tipos de listas: — Lista ordenada (etiqueta ). Muestra los elementos numerados (1, 2, 3, ...; A, B, C, ...; i, ii, iii, etc.). — Lista no ordenada (etiqueta ). Muestra los elementos anteponiéndoles un mismo icono (disk, circle o square) a todos ellos. — Lista de definición (etiqueta ). Muestra un listado de definiciones. Cada elemento está formado por el término que se define y su definición. Los elementos de las listas ordenadas y no ordenadas se indican con la etiqueta . No es obligatorio cerrarla. 8-55 Desarrollo de Sistemas En el caso de las listas de definición, el elemento que se define se indica con la etiqueta y su definición, con la etiqueta . Tampoco es obligatorio cerrar estas dos etiquetas. Ejemplo: JAVA C++ Eiffel 7.12. Tablas Las tablas permiten mostrar información organizada en filas y columnas. La intersección de una fila con una columna se denomina celda. El elemento HTML que genera una tabla es . Dentro de una tabla, se definen tantas filas como sean necesarias con el elemento . Y dentro de una fila, se indican las celdas que lo componen (columnas) mediante elementos . El siguiente ejemplo representa una tabla con 2 filas y 3 columnas: . No es obligatorio cerrar las etiquetas y Celda Celda Celda Celda Celda Celda 1.1 1.2 1.3 2.1 2.2 2.3 7.13. Formularios Los formularios HTML permiten recoger información del usuario y enviársela a un programa para que la procese. Los formularios están compuestos por elementos de formulario como, por ejemplo, cuadros de texto o listas desplegables. Todos los elementos de un mismo formulario deben estar contenidos en un elemento . La sintaxis de este elemento es: 8-56 Aplicaciones Web El atributo “method” puede contener dos valores: “get” si los parámetros escritos por el usuario deben enviarse en la URL o “post”, si deben enviarse de forma oculta. El atributo action indica el programa que procesará los datos escritos por el usuario. Este programa suele ser un archivo CGI o una página dinámica (ASP, PHP o JSP). Ejemplo: Elementos del formulario: — Cuadro de texto (single-line text input). Recoge números o un texto breve (de una línea). Ejemplo: . — Botones de radio (radio buttons). Presentan varias opciones, de las cuales sólo se puede escoger una de ellas. Ejemplo: . — Casilla de verificación (checkboxes). Presenta una opción que se puede activar o no independientemente del resto de opciones. Ejemplo: . — Lista desplegable (menus). Ofrece un conjunto de opciones. Se utiliza en lugar de los botones de radio cuando el número de opciones es elevado. Ejemplo: — Área de texto (multi-line text input). Recoge un texto de varias líneas. Ejemplo: Aquí puede ir el texto. — Botones (buttons). Muestra un botón que desencadenará una acción cuando el usuario lo pulse. Ejemplo: . Existen dos botones predefinidos, uno para enviar el formulario completo (submit) y otro para borrar lo que el usuario haya escrito (reset). Ejemplo: . 8-57 Desarrollo de Sistemas 8. Lenguajes de descripción de datos: XML 8.1. Introducción El objetivo XML no es la aplicación de estilos ni de formatos sobre un documento creado con un contenido, sino que estamos ante un lenguaje pensado para estructurar documentos. De lo dicho podemos deducir que cualquier documento consta de tres partes bien diferenciadas: — Contenido. Es el texto escrito en si. Este contenido puede estar escrito con cualquier editor de texto plano. Por supuesto es lo que interesa al usuario, no obstante este contenido, falto de formatos y de una estructura representa por si solo algo difícil de hacer vistoso y por supuesto difícil de catalogar e indexar. — Formato. Se le pone una cara bonita al texto plano anterior, usando formatos de fuentes, párrafos, colores, márgenes, etc. Hoy en dia es mejor recurrir a formatear nuestros documentos usando estilos, como son las hojas de estilo en cascada (CSS). — Estructura. Cualquier documento contiene partes claramente diferenciadas, como son títulos, subtítulos, niveles, numeraciones, etc. La estructura de un documento esta definida por la forma en como se distribuye los elementos que lo componen. Podemos hacer representaciones gráficas de estas estructuras a través de árboles. XML, objetivo del presente anexo esta diseñado para trabajar con la estructura de los documentos (así como los campos, definidos en la vista diseño de una tabla de una base de datos definen la estructura de la tabla). 8.1.1. Lenguajes de marcas Las marcas son códigos que indican a un programa cómo debe tratar su contenido. La forma que ideo IBM en la década de los 60 para pasar información de un sistema a otro sin necesidad de perder el formato indicado se basaba en tratar las marcas como texto accesible desde cualquier sistema, texto plano, código ASCII. Y la norma se denominó GML (General Modeling Language). Más tarde GML pasó a manos de ISO y se convirtió en SGML (ISO 8879), Standart Generalized Markup Language. Esta norma es la que se aplica desde entonces a todos los lenguajes de marcas, cuyos ejemplos más conocidos son el HTML y el RTF. Los lenguajes de marcas no son equivalentes a los lenguajes de programación. Son sistemas complejos de descripción de información, normalmente documentos, que si se ajustan a SGML, se pueden controlar desde cualquier editor ASCII. Las marcas más utilizadas suelen describirse por textos descriptivos encerrados entre signos de “menor” (<) y “mayor” (>), siendo lo más usual que existan una marca de principio y otra de final. La diferencia fundamental entre HTML y XML es que mientras el HTML es un lenguaje, XML es un metalenguaje. De hecho es un subconjunto de SGML, una versión reducida y totalmente compatible diseñada específicamente para la Web. Todos los documentos XML se ajustan a las normas de SGML. 8-58 Aplicaciones Web Según el documento “Extensible Markup Language (XML) 1.0 W3C Recommendation”, los documentos XML deben ser fáciles de crear, legibles por personas (no sólo por computadoras) y razonablemente claros. También debe ser fácil escribir programas de tratamiento de documentos XML y se debe reducir al mínimo el número de elementos opcionales. 8.1.2. Vista general de XML Cuando trabajamos con XML, estamos trabajando con estructuras de documentos. Cuando accedemos a la información (datos) que XML estructura necesitamos de algún visualizador, como puede ser un navegador (browser), pero al mismo tiempo necesitamos también un analizador (parser) que no nos dejara acceder a los contenidos del documento hasta que no este “bien formado”. Se dice que un documento esta “bien formado” cuando cumple las normas básicas de XML. Se dice que un documento XML es “válido” cuando además de cumplir las normas básicas también se cumplen las normas impuestas en un DTD (Definición de Tipo de Documento). XML permite al usuario manejar los elementos como mejor le convenga, cosa que el código HTML no permite. Además con XML el usuario podrá ordenar los datos o actualizarlos en tiempo real. XML también permite realizar un estándar de almacenamiento estructurado. Un error que se suele cometer es considerar a XML un HTML extendido. XML, es el estándar de Extensible Markup Language. XML es un conjunto de reglas para definir etiquetas semánticas que nos organizan un documento en diferentes partes. XML es un metalenguaje que define la sintaxis utilizada para definir otros lenguajes de etiquetas estructurados. En teoría HTML es un subconjunto de XML especializado en presentación de documentos para la Web, mientras que XML es un subconjunto de SGML especializado en la gestión de información para la Web. En la práctica XML contiene a HTML aunque no en su totalidad. La definición de HTML contenido totalmente dentro de XML y por lo tanto que cumple la especificación SGML es XHTML (Extensible Hypertext Markup Language). XML fue creado al amparo del Word Wide Web Consortium (W3C) organismo que vela por el desarrollo de WWW partiendo de las amplias especificaciones de SGML. Su desarrollo se comenzó en 1996 y la primera versión salió a la luz el 10 de febrero de 1998. La primera definición que apareció fue: Sistema para definir validar y compartir formatos de documentos en la Web. Respecto a sus objetivos son: — XML debe ser directamente utilizable sobre Internet. — XML debe soportar una amplia variedad de aplicaciones. — XML debe ser compatible con SGML. — Debe ser fácil la escritura de programas que procesen documentos XML. 8-59 Desarrollo de Sistemas — El número de características opcionales en XML debe ser mínima. — Los documentos XML deben ser legibles por humanos y lo más claros posible. — El diseño de XML debe ser preparado rápidamente. — El diseño de XML debe ser formal y conciso. — Los documentos XML deben ser fácilmente creables. — La concisión en las marcas XML es de mínima importancia. Estamos ante una herramienta para definir estructuras de datos susceptibles de ser procesadas por una gran variedad de aplicaciones para realizar un eficiente intercambio electrónico de datos. XML (eXtensible Markup Language) es un lenguaje orientado a identificar estructuras de datos en un documento. La especificación XML define la manera estándar de cómo hay que realizar el marcado de expresiones en un documento no estructurado, para que con dicho marcado se defina una determinada estructura de datos. Como ya hemos comentado, un documento XML es un documento que puede ser leído y entendido por una persona y a la vez puede ser procesado por un sistema para extraer información. 8.1.3. Tipos de documentos XML Para que un documento sea compatible con XML tiene que cumplir dos condiciones: Ha de ser un documento conforme (well formed) y válido (valid). El hecho de imponer condiciones es importante para que XML se comporte efectivamente como una base universal para estructurar la información. El documento será conforme cuando cumpla una serie de normas que veremos más adelante. Para evitar errores se ha creado el sistema DTD o (Document Type Definition, Definición de Tipos de Documento). En un documento DTD se indica qué códigos contiene el documento XML, en qué orden aparecen, cómo se anidan unos dentro de otros y si pueden estar vacíos o no, entre otras cosas. Los documentos que se ajustan a su DTD son válidos. En el caso de HTML existe un DTD universal en el que se definen con claridad las etiquetas HTML ya conocidas y sus contenidos. Para XML, cada aplicación puede generar sus propios tipos de datos y códigos, con lo que es preciso generar un DTD junto con cada documento o aplicación. Una empresa puede utilizar su propio DTD. Por tanto los documentos XML pueden construirse para ser documentos "válidos" o para ser documentos "bien formados". Si hablamos de un documento válido, es que éste documento está asociado a un conjunto de reglas que definen su estructura lógica. El documento se certifica conforme a estas reglas que en conjunto reciben el nombre de “Definición de tipo de documento” (DTD). Cuando hablamos de un documento bien formado, manifestamos que éste sigue las reglas de sintaxis especificadas para el lenguaje XML, pero no dispone de reglas de certificación aso- 8-60 Aplicaciones Web ciadas. Un documento bien formado puede ser muy simple, todo lo que necesita contener son elementos de datos. 8.1.4. XML familia de tecnologías Aunque una de las principales funciones con las que nace sería suceder al HTML, separando la estructura del contenido y permitiendo el desarrollo de vocabularios modulares, compatibles con cierta unidad y simplicidad del lenguaje (objetivo que se viene desarrollando a través de la especificación XHTML), tiene otras aplicaciones entre las que destaca su uso como estándar para el intercambio de datos entre diversas aplicaciones o software con lenguajes privados como en el caso del SOAP. Al igual que el HTML, se basa en documentos de texto plano en los que se utilizan etiquetas para delimitar los elementos de un documento. Sin embargo, XML define estas etiquetas en función del tipo de datos que está describiendo y no de la apariencia final que tendrán en pantalla o en la copia impresa, además de permitir definir nuevas etiquetas y ampliar las existentes. Son varios los vocabularios desarrollados en XML con el fin de ampliar sus aplicaciones. Podemos considerar fundamentales: XHTML, XSL-FO y XSLT, XLink, XPointer y Schema. Estos serán estudiados en apartados posteriores. Pero, además, existen también versiones para usos específicos, ya que XML facilita incluso la accesibilidad y esta adaptado para cambiar la salida de texto a voz y traducir a Braille. Otras versiones destacables son: — MathML. Fórmulas matemáticas, utilizando etiquetas extensibles que permiten que las representaciones matemáticas sean visualizadas por el navegador que lo admita. — SVG. Gráficos vectoriales. Utilizando elementos que definan formas, rutas y texto, permite que se escriba codigo en lugar de crear grandes mapas de “bits”. — RSS. Sindicación de noticias — XBRL. Partes financieros — SMIL. Lenguaje de Integración Multimedia Sincronizada, puede utilizarse para crear contenido Web interactivo. Permite combinar audio, video y gráficos que pueden enviarse al navegador y pueden representarse rápidamente. — WML. Aplicaciones para móviles para aplicaciones inalámbricas (Wireless) — Por supuesto las organizaciones o empresas pueden crearse su propia versión de este lenguaje extensible y personalizarlo para su negocio. • Si los utiliza un video club para guardar la información de las películas. Este lenguaje se podría llamar PeliculasML. • Si lo utiliza un hospital para almacenar diagnósticos de los pacientes. Este lenguaje se podría llama HospitalML. 8-61 Desarrollo de Sistemas XML es un método para introducir datos estructurados en un fichero de texto. Cuando pensamos en “datos estructurados” pensamos en cosas tales como hojas de cálculo, libretas de direcciones, parámetros de configuración, transacciones financieras, dibujos técnicos, etc. Los programas que producen esta clase de datos a menudo también los guardan en disco, por lo que pueden usar tanto un formato binario como un formato texto. El último formato te permite, si es necesario, ver los datos sin el programa que los ha producido. XML consiste en una serie de reglas, pautas, convenciones para planificar formatos texto para tales datos, de manera que produzcan archivos que sean fácilmente generados y leídos (por un ordenador) que son inequívocos, y que evitan escollos comunes como la falta de extensibilidad, falta de soporte para la internacionalización o localismo, y la dependencia de una determinada plataforma. XML define cuales son las “tags” (etiquetas) y “atributos”, pero alrededor de XML hay una creciente serie de módulos opcionales que ofrecen colecciones de etiquetas y atributos, o pautas para especificar tareas. Existen: 8-62 — Xlink que describe una manera estándar de añadir hiper-enlaces a un archivo XML. — XFragments son sintaxis para apuntar a partes de un documento XML. — XPointer. Lenguaje de Direccionamiento XML, es un lenguaje que permite el acceso a la estructura interna de un documento XML, esto es, a sus elementos, atributos y contenido — CSS, el lenguaje de hojas de estilo, se puede aplicar a XML igual que a HTML. — XSL es el lenguaje avanzado para explicitar hojas de estilo. Está basado en XSLT, un lenguaje de transformación a menudo útil también fuera de XSL, para reordenar, añadir o borrar etiquetas y atributos. XSL-FO.–es un metalenguaje de marcado (denominado también lenguaje de anotaciones o de etiquetas) que nos permite definir lenguajes de marcado adecuados a usos determinados–. — El DOM es una serie de funciones estándar llamadas para manipular archivos XML (y HTML) desde un lenguaje de programación. — XML Namespaces es una especificación que describe como puedes asociar una URL con cada etiqueta y atributo en un documento XML, si bien, para qué se utiliza la URL depende de la aplicación que lea la URL. — XML Schemas 1 y 2 ayuda a los desarrolladores a definir precisamente sus propios formatos basados en XML. — XPath. Lenguaje de Rutas XML, es un lenguaje para acceder a partes de un documento XML. Es un lenguaje (basado en xml) que permite seleccionar subconjuntos de un documento xml. La idea es parecida a las expresiones regulares para seleccionar partes de un texto sin atributos (plain text). Xpath permite buscar y seleccionar teniendo en cuenta la estructura jerárquica del xml. Aplicaciones Web — XQL. Lenguaje de Consulta XML, es un lenguaje que facilita la extracción de datos desde documentos XML. Ofrece la posibilidad de realizar consultas flexibles para extraer datos de documentos XML en la Web. Como vemos, se pueden crear infinitos lenguajes a partir del XML. Para especificar cada uno de los usos de XML, o lo que es lo mismo, para especificar cada uno de los sublenguajes que podemos crear a partir de XML, se utilizan unos lenguajes propios. Son unos lenguajes que sirven para definir otros lenguajes, es decir, son metalenguajes. Los definen especificando qué etiquetas podemos o debemos encontrarnos en los documentos HTML, en qué orden, dentro de qué otras, además de especificar los atributos que pueden o deben tener cada una de las etiquetas. Hay dos metalenguajes con los que definir los lenguajes que podemos obtener a partir de XML, el DTD y el XML Schema. El DTD, Definition Type Document, tiene una sintaxis especial, distinta de la de XML. Para evitar el DTD, que tiene una sintaxis muy especial, se intentó encontrar una manera de escribir en XML la definición de otro lenguaje XML. Se definió entonces el lenguaje XML Schema. Un detalle importante de señalar a la hora de hablar de los DTD o XML Schema es que estos lenguajes también permiten comprobar la integridad de los datos en cualquier momento. Los metalenguajes de XML sirven para tomar un documento XML y comprobar que los datos que él incluye son válidos, comprobando si lo que tenemos en el XML concuerda con lo que tendríamos que tener. Eso lo podemos hacer al leer el documento, si no son validos se saca un mensaje de error y se detiene el proceso del documento. 8.1.5. Principales características de XML — Es una arquitectura más abierta y extensible. No se necesita versiones para que puedan funcionar en futuros navegadores. Los identificadores pueden crearse de manera simple y ser adaptados en el acto en Internet/Intranet por medio de un validador de documentos (parser). — Mayor consistencia, homogeneidad y amplitud de los identificadores descriptivos del documento con XML (los RDF Resource Description FrameWork), en comparación a los atributos de la etiqueta <META> del HTML. — Integración de los datos de las fuentes. Se podrá hacer el intercambio de documentos entre las aplicaciones tanto en el propio PC como en una red local o extensa. — Datos compuestos de múltiples aplicaciones. La extensibilidad y flexibilidad de este lenguaje nos permitirá agrupar una variedad amplia de aplicaciones, desde páginas Web hasta bases de datos. — Gestión y manipulación de los datos desde el propio cliente Web. 8-63 Desarrollo de Sistemas — Los motores de búsqueda devolverán respuestas más adecuadas y precisas, ya que la codificación del contenido Web en XML consigue que la estructura de la información resulte más accesible. — Se desarrollarán de manera extensible las búsquedas personalizables y subjetivas para robots y agentes inteligentes. También conllevará que los clientes Web puedan ser más autónomos para desarrollar tareas que actualmente se ejecutan en el servidor. — Se permitirá un comportamiento más estable y actualizable de las aplicaciones Web, incluyendo enlaces bidireccionales y almacenados de forma externa. — El concepto de “hipertexto” se desarrollará ampliamente (permitirá denominación independiente de la ubicación, enlaces bidireccionales, enlaces que pueden especificarse y gestionarse desde fuera del documento, hiperenlaces múltiples, enlaces agrupados, atributos para los enlaces, etc. Creado a través del Lenguaje de enlaces extensible (XLL). — Exportabilidad a otros formatos de publicación (papel, Web, CD-ROM, etc.). El documento maestro de la edición electrónica podría ser un documento XML que se integraría en el formato deseado de manera directa. — La gramática usada en HTML es fija y no ampliable. En XML es Extensible. — La estructura en HTML es Monolítica y en XML es jerárquica. — El estilo en HTML viene dado por CSS o por las propias etiquetas, en XML por CSS o por XSL, en SGML por DSSSL. — HTML no es exportable, XML si lo es. — HTML no permite validación, XML puede validarse, SGML es obligatorio. 8.1.6. Estructura del XML El metalenguaje XML consta de cuatro especificaciones (el propio XML sienta las bases sintácticas y el alcance de su implementación): DTD (Document Type Definition): definición del tipo de documento. Es, en general, un archivo que encierra una definición formal de un tipo de documento y , a la vez, especifica la estructura lógica de cada documento. Define tanto los elementos de una página como sus atributos. El DTD del XML es opcional. En tareas sencillas no es necesario construir una DTD, entonces se trataría de un documento "bien formado"(well-formed) y si lleva DTD será un documento “validado” (valid). XSL (eXtensible Stylesheet Language): define o implementa el lenguaje de estilo de los documentos escritos para XML. Desde el verano de 1997 varias empresas informáticas como Arbortext, Microsoft e Inso vienen trabajando en 8-64 Aplicaciones Web una propuesta de XSL (antes llamado “xml-style”) que presentaron a W3C. Permite modificar el aspecto de un documento. Se puede lograr múltiple columnas, texto girado, orden de visualización de los datos de una tabla, múltiples tipos de letra con amplia variedad en los tamaños. Este estándar está basado en el lenguaje de semántica y especificación de estilo de documento (DSSSL, Document Style Semantics and Specification Language, ISO/IEC 10179) y, por otro lado, se considera más potente que las hojas de estilo en cascada (CSS), usado en un principio con el lenguaje DHTML. “Se espera que el CSS sea usado para visualizar simples estructuras de documentos XML (actualmente se ha conseguido mayor integración en XML con el protocolo CSS2 (Cascading Style Sheets, nivel 2) ofreciendo nuevas formas de composición y una más rápida visualización) y, por otra parte, XSL pueda ser utilizado donde se requiera más potencia de diseño como documentos XML que encierran datos estructurados (tablas, organigramas, etc.)”. XLL (eXtensible Linking Language): define el modo de enlace entre diferentes enlaces. Se considera que es un subconjunto de HyTime (Hipermedia/Timed-based structuring Language o Lenguaje de estructuración hipermedia/basado en el tiempo, ISO 10744) y sigue algunas especificaciones del TEI (Text Encoding Initiative o Iniciativa de codificación de texto). Desde marzo de 1998 el W3C trabajo en los enlaces y direccionamientos del XML. Provisionalmente se le renombró como Xlink y a partir de junio se le denomina XLL. Este lenguaje de enlaces extensible tiene dos importantes componentes: Xlink y el Xpointer. Va más allá de los enlaces simples que sólo soporta el HTML. Se podrá implementar con enlaces extendidos. Jon Bosak establece los siguientes mecanismos hipertextuales que soportará esta especificación: — Denominación independiente de la ubicación. — Enlaces que pueden ser también bidirecccionales. — Enlaces que pueden especificarse y gestionarse desde fuera del documento a los que se apliquen (esto permitirá crear en un entorno intranet/extranet un banco de datos de enlaces en los que se puede gestionar y actualizar automáticamente. — Hiperenlaces múltiples (anillos, múltiples ventanas, etc.). — Enlaces agrupados (múltiples orígenes). — Transclusión (el documento destino al que apunta el enlace aparece como parte integrante del documento origen del enlace). — Se pueden aplicar atributos a los enlaces (tipos de enlaces). 8.1.7. Documentos XML Como XML es un metalenguaje, es posible crear códigos o etiquetas (tags) a gusto del usuario para aplicaciones concretas. Ya no sólo es posible definir el formato del texto o la posición de los datos y las imágenes, sino que cada parte de la información puede ser identificada con un sistema propio de etiquetas. 8-65 Desarrollo de Sistemas Ejemplo: Mickey Mouse 900 Madrid Donald 950 Pontevedra Mynie 1100 Barcelona Deysi 850 Sevilla La idea que subyace bajo el XML es la de crear un lenguaje muy general que sirva para muchas cosas. El HTML está diseñado para presentar información directamente a los humanos, es un lenguaje complicado de procesar para los programas informáticos. El HTML no es bueno porque no indica lo que está representando, se preocupa principalmente del formato. El XML describe el contenido de lo que etiqueta. Esto permitirá, por ejemplo, realizar motores de búsqueda mucho más eficaces, lo que nos permitirá un acceso más rápido y eficiente a la información. Nos permitirá acceder a páginas Web desde nuestro teléfono móvil, o desde la radio de nuestro coche, en el momento en el que los programas de reconocimiento de voz trabajen con XML. Facilitará el intercambio de información y la cooperación entre las empresas facilitando el comercio electrónico, etc. La potencia de esta forma de trabajar radica en que estamos etiquetando e identificando el contenido, olvidándonos en un principio por la forma de presentarlo. Mediante una XSL podremos transformar un document XML en 8-66 Aplicaciones Web otro XML (por ejemplo en HTML) o convertirlo a un formato de impresión: RTF, PDF, etc. El XML supone una revolución porque va a permitir la comunicación entre las máquinas. 8.1.8. Parsers XML Un parser o procesador de XML es la herramienta principal de cualquier aplicación XML. Mediante este parser no sólo podremos comprobar si nuestros documentos están bien formados o válidos, sino que también podremos incorporarlos a nuestras aplicaciones, de manera que estas puedan manipular y trabajar con documentos XML. Actualmente hay muchos y para todos los lenguajes y plataformas: JAVA, C, Phyton, Visual Basic, Perl, Tcl, Delphi, etc. El XML contribuye con datos independientes de la plataforma (documentos y datos portables). Todas las grandes compañías ya han elaborado sus propios procesadores de XML. Y existen muchos más gratuitos. 8.2. XML XML (eXtensible Markup Language o Lenguaje de Marcado Extensible) viene a ser una versión reducida de SGML, en el cual se basa, y está especialmente diseñado para la definición de estructuras de documentos y el almacenamiento de datos. Podemos decir que XML se puede utilizar para el desarrollo de dos tipos de aplicaciones: — Aplicaciones de datos. — Aplicaciones de documento. Las Recomendaciones XML 1.0 del W3C definen los documentos XML como un tipo de objetos de datos que están formados físicamente por unidades de almacenamiento, denominadas entidades, cuyo contenido puede ser datos analizados y no analizados. Los datos analizados (PCDATA, Parsed Character Data) están compuestos por datos de caracteres (character data) y marcas (markup). Las marcas son símbolos especiales utilizados por el lenguaje XML para indicar que el texto que viene a continuación debe ser procesado, ya que se trata de una etiqueta, marcas < y >, o una referencia, marca &. Las marcas permiten establecer la estructura lógica y de almacenamiento del documento. Los datos no analizados o datos de caracteres (CDATA, Carácter Data) representarían datos de contenido textual que no han de ser analizados por el procesador XML. XML, además, proporciona un mecanismo para imponer restricciones al almacenamiento de los datos y a la estructura lógica del documento. Una unidad de almacenamiento XML se puede considerar como documento XML si está bien formado. Un documento XML bien formado puede además ser válido si cumple una serie de restricciones definidas en una DTD o Schema. XML es, por lo tanto, un lenguaje diseñado para trabajar con datos y estructuras; podríamos definir, teniendo en cuenta lo visto anteriormente, a los documentos XML como “objetos de datos cuya estructura está bien formada”. 8-67 Desarrollo de Sistemas Las aplicaciones destinadas a trabajar con documentos XML han de incorporar un módulo de “software” especial denominado Procesador XML, que permitirá leer el documento XML y acceder a su estructura y contenido (en caso de que dicho documento esté como mínimo bien formado). Por tanto los documentos XML, teniendo en cuenta el grado de restricción utilizado para establecer la estructura y contenido de sus datos, pueden ser de dos tipos: bien formados y válidos o validados. 8.2.1. Documentos XML bien formados Los documentos XML se basan en una estructura en forma de árbol en la cual los elementos se encuentran distribuidos jerárquicamente. En esa estructura siempre existe un elemento raíz (root) que representa el elemento documento (o entidad documento). Las seis normas básicas que debe cumplir todo documento XML para que sea considerado como bien formado y, por lo tanto, su estructura sea correcta son: 1. Un documento XML solamente puede tener un elemento raíz (root). La entidad documento está representada por el denominado elemento documento (Document). Es el nodo raíz a partir del cual se irán añadiendo el resto de entidades o elementos (nodos hijo) que conforman el documento. 2. Todos los elementos con contenido de un documento XML han de tener etiquetas de cierre, es decir, siempre que se utilice la etiqueta de un determinado elemento, hemos de utilizar también su etiqueta de cierre: … . Debemos tener en cuenta que las etiquetas vacías utilizan una sola etiqueta que incluye su propio cierre por medio del carácter “/” situado al final: . 3. Las etiquetas de distintos elementos no se pueden solapar o superponer, es decir, no se puede mezclar el contenido de un elemento con el de otro. 4. Las etiquetas de elementos anidados se deben cerrar en el orden correcto, es decir, no se pueden mezclar las etiquetas de elementos de orden superior (elementos padre) con los de orden inferior (elementos hijo). 5. Los atributos de los elementos XML deben ir siempre entre comillas; se pueden utilizar comillas dobles (“”) o simples (´). 6. No se pueden utilizar los caracteres <,> o & en el texto del contenido de un elemento, ya que representan marcas del lenguaje XML; se ha de recurrir a las entidades XML < > o &. 8.2.2. Documentos XML válidos Además de ser documentos bien formados, utilizan un mecanismo de descripción de documentos, ya sea DTD o Schema, en el cual se definen los 8-68 Aplicaciones Web elementos que se han de usar y el modo de hacerlo (sintaxis), así como la estructura que han de mantener. Un documento XML basado en DTD (Document Type Definition o Definición de Tipo de Documento) utiliza una declaración DOCTYPE en el prólogo del documento indicando cuál es el elemento documento (elemento raíz) y la definición del resto de los elementos que se pueden utilizar en ese tipo de documentos. Por tanto, en función de si lleva asociada una DTD o no, podemos diferenciar dos tipos de documentos XML: — Válidos, aquellos que siguen las reglas de una DTD especifica. — Bien formados (well-formed), que no tienen necesariamente una DTD asociada, pero siguen las reglas del XML al pie de la letra. Evidentemente, los documentos válidos son bien formados. 8.2.3. Estructura básica de un documento XML La estructura lógica de un documento XML esta definida por declaraciones, elementos, comentarios, referencias e instrucciones de procesamiento. Todo documento XML consta de dos partes: el prólogo y el cuerpo del documento. • Prólogo Contiene datos con meta información utilizada por el procesador XML y generalmente, está formado por: — La línea de declaración de XML. — Instrucciones de procesamiento. — Declaración DOCTYPE. — Comentarios. La línea de declaración de documento XML Es una instrucción de procesamiento y la primera línea que debe aparecer en un documento XML. Usar la línea de declaración de documento XML es opcional; no obstante, puede prevenir contra posibles errores producidos al intentar abrir el documento. Si se utiliza, será la primera línea del código en el prólogo del documento y es una instrucción similar a la siguiente: Parámetros — Version: indica la versión XML en la cual se basa del documento. En caso de utilizarse la línea de declaración de documento XML, este parámetro es de uso obligatorio. 8-69 Desarrollo de Sistemas — Encoding, tipo de codificación utilizado por los caracteres del documento. — Standalone, para especificar si se utiliza una DTD externa o no. En caso de utilizarse estos dos últimos parámetros, han de indicarse en ese orden. Posibles valores del atributo standalone: • Yes: la especificación DTD se encuentra dentro del propio documento; no se permite el uso de DTD externa. • No: la especificación DTD se encuentra en un documento externo. En caso de que el parámetro standalone sea “no”, se pueden utilizar conjuntamente DTD interna y externa. • Cuerpo del documento Representado por el elemento raíz (objeto o entidad documento) y el resto de los elementos y contenido: 8.2.4. Tipos de datos XML Como ya hemos visto, el texto de un documento XML está formado por una mezcla de datos de caracteres y marcas. Este texto es analizado por el procesador de XML; para comprobar la estructura y buena formación del documento, no obstante, pueden existir fragmentos que no se desee que pasen dicho análisis. Podemos decir, por lo tanto, que un documento XML puede contener datos que han de ser analizados han de ser marcados de una manera especial, es decir, utilizando unas determinadas marcas del lenguaje XML. Datos no analizados Son datos incluidos dentro del documento XML y que son ajenos a la normativa de XML, es decir, no tienen por qué ser analizados para comprobar su estructura o sintaxis por el procesador de XML y son enviados tal como están escritos, como simples datos de caracteres (CDATA). Pertenecen a este grupo: — Comentarios: — Secciones CDATA: — Instrucciones de procesamiento (PI, Proccessing Instruction) Datos analizados Por defecto, todo el contenido de un documento XML ha de ser analizado por el procesador de XML al abrir el documento para comprobar su buena formación. Todos los datos analizados (PCDATA) son de tipo texto y se dividen, como ya hemos visto, en datos carácter y marcas. 8-70 Aplicaciones Web Datos carácter Son cualquier cadena de caracteres, excepto los utilizados como delimitadores de marcas, caracteres < >, ampersand (&), utilizado por las entidades y los caracteres apóstrofo (´) y comillas (“) utilizados en los valores de atributos. En caso de querer utilizar estos caracteres como texto, se hará como caracteres escapados, mediante referencias entre los símbolos ampersand (&) y punto y coma (;), pudiéndose utilizar dos métodos: — Referencias numéricas por código, con la sintaxis &#valor; (numeración decimal o &#xvalor; (numeración hexadecimal). — Referencia a entidades por nombre como, por ejemplo, < ( < ), & ( & ). Marcas Los símbolos de marcas utilizadas en un documento XML pueden ser: — — — — De etiquetas: • Marca de comienzo de etiqueta(<) y marca de fin de etiqueta(>). • Marcas de etiquetas de elementos vacíos (). De referencias: • Referencias a entidades: &NombreEntidad;. • Referencias a códigos de caracteres: ódigo; o &#Código;. De valores de los atributos: • Apóstrofo (´) o comilla simple: ´valor´. • Comillas dobles (“): “valor”. Delimitadores: utilizados en listas de elementos de contenido, generalmente: • Coma (,). • Barra inclinada (|). Existen además marcas especiales para establecer: — Declaraciones de tipo de documento — Comentarios: — Secciones CDATA: — Instrucciones de procesamiento: 8-71 Desarrollo de Sistemas Atributos especiales XML Las etiquetas de los elementos XML pueden utilizar una serie de atributos especiales definidos para este lenguaje y que todo procesador XML debe implementar. — Xml:space Sirve para establecer si se han de preservar los espacios utilizados por el contenido de un determinado elemento o no. En caso de utilizarse este atributo en un DTD ha de declararse de tipo enumerado y su único valor posible es “default” y “preserve”. La declaración para este atributo en un DTD es, por lo tanto, xml:space(default|preserve). — Xml:lang Sirve para especificar el lenguaje utilizado por los contenidos y los valores de atributos de cualquier elemento en un documento XML. Los valores de este atributo son identificadores de lenguajes definidos en el documento “Etiquetas para la Identificación de Lenguajes” [IETF RFC 1766]. Marcas XML En los documentos XML podemos encontrar las siguientes marcas utilizadas por este lenguaje: — Etiquetas: < > y < /> Las etiquetas representan elementos XML; su nombre se encierra entre la marca de comienzo de etiqueta (<) y la marca de fin de etiqueta (>) para la etiqueta inicial y las marcas para la etiqueta final. En caso de que sean elementos vacíos, las marcas de etiquetas son < (marca inicial) y /> (marca final). Sintaxis: — • Elemento con contenido: … contenido... • Elemento sin contenido:. Referencias: & Como ya hemos visto, pueden existir referencias a caracteres (por código) o a entidades (por nombre). El valor utilizado como referencia va entre las marcas ampersand (&) y punto y coma (;). En caso de ser una referencia a caracteres, se utilizará además el símbolo de almohadilla (#) antes del valor del código si va en notación decimal &#Valor; ejemplo: €.Se pueden utilizar también valores en hexadecimal; en este caso se pondrá una equis (x) tras el símbolo # y delante del valor hexadecimal &#xValor; ejemplo: €. Si es una referencia a una entidad, simplemente se ha de poner el nombre de dicha entidad &NombreEntidad; ejemplo:&. 8-72 Aplicaciones Web Al encontrarse una referencia, el procesador XML lo que hace es insertar el carácter o expandir la entidad referenciada; debemos tener en cuenta que una entidad no tiene por qué ser un carácter simplemente, sino que puede ser incluso un documento completo o archivo externo. — Comentarios: Los comentarios se sitúan entre las marcas (final de comentario) de forma similar a los utilizados por SGML y HTML. Los comentarios incluyen datos que no serán analizados por el procesador de XML. Generalmente son utilizados para documentar el código del documento XML y pueden incluir textualmente todo tipo de caracteres, incluidos los utilizados como marcas. No están permitidas las cadenas de caracteres de dos guiones (--) y la secuencia utilizada para finalización de comentario (- - >) — Secciones CDATA: <[CDATA[“…”]]> El contenido de estas secciones va entre las cadena de inicio “<[CDATA[“ y finalización”]]>”. Al igual que los comentarios, sirven para insertar en el documento XML datos que no han de ser analizados por el procesador XML. Su contenido, como su nombre indica, es texto (CDATA, Character Data o Datos de Caracteres) en el cual se puede utilizar cualquier tipo de carácter, incluso los usados para marcas. No está permitido el uso de la secuencia de caracteres “]]>” usado para indicar la finalización de la sección CDATA. Generalmente se utilizan estas secciones para incluir scripts, estilos, bloques de código HTML, documentación y comentarios en los cuales se incluyen los caracteres de marcas ya que, dentro de la sección, son interpretados como datos carácter y no como marcas de etiquetas. — Declaraciones de tipo de documento: Las declaraciones de tipo de documento (DOCTYPE) se utilizan para declarar documentos XML válidos, es decir, que el documento utilizará una definición de tipo de documento o DTD. Los parámetros utilizados en una declaración DOCTYPE, por lo tanto, sirven para establecer cuál es el elemento raíz del documento y la DTD que se ha de utilizar para efectuar su validación. La línea de declaración DOCTYPE debe aparecer justamente antes del primer elemento utilizado. La sintaxis genérica de una declaración DOCTYPE es la siguiente: Sintaxis: Ejemplo: 8-73 Desarrollo de Sistemas El parámetro elementoRaíz representa al elemento documento; este elemento es único, debe existir obligatoriamente en todo documento XML y es la base (raíz) de toda la estructura del documento; así, por ejemplo, en el documento biblioteca con la siguiente estructura: Popeye El Marino El elemento raíz (entidad documento) está representado por las etiquetas . El parámetro DTD sirve para indicar la Definición de Tipo de Documento en la cual se basa el documento; el valor de este parámetro puede ser: El código de la propia DTD entre corchetes: [contenido del DTD]. La declaración DOCTYPE para el ejemplo anterior sería, por lo tanto: ]> • SYSTEM “archivo.dtd”, si se utiliza una DTD externa almacenada en un archivo independiente en el mismo equipo. Si hemos guardado en el mismo directorio que el documento XML la DTD vista en el ejemplo anterior con el nombre de “empleado.dtd”, la declaración DOCTYPE sería: • PUBLIC “ID” “URI”, si se utiliza una DTD externa almacenada en un archivo independiente en un equipo existente en la red Internet. ID hace referencia a un identificador público utilizado por el DTD y URI es el localizador, la dirección donde se encuentra la DTD. 8.2.5. Instrucciones de procesamiento: Las instrucciones de procesamiento (IP, Processing Instructions) van situadas entre las marcas >? Y ¿> y sirven para pasar información que no ha 8-74 Aplicaciones Web de ser analizada por el procesador de XML. Pueden ir situadas en cualquier lugar del documento, aunque, por lo general, van entre las líneas del prólogo. Se denominan instrucciones de procesamiento porque suelen contener instrucciones para determinadas aplicaciones; por ello, comienzan con el nombre identificador de la aplicación destino (PITarget) a la cual va dirigida dicha instrucción. Las instrucciones de procesamiento generalmente se utilizan para efectuar enlaces con entidades externas o recursos que van a ser utilizados por el documento XML, tales como las hojas de estilos CSS y XSL. Ejemplo de instrucciones de procesamiento utilizadas con hojas de estilo: Sintaxis genérica para instrucciones de procesamiento utilizadas con hoja de estilo es: 8.2.6. Normas para el uso de eiquetas XML 1) Las etiquetas (tags) aparecen marcadas por un carácter de inicio > (menor que) y otro de finalización > (mayor que). Ejemplo:. 2) Las etiquetas XML deben comenzar por una letra o espacio de subrayado (“_”); no pueden comenzar por , y representan elementos distintos. Por convención se recomienda el uso de minúsculas, pero, en caso de utilizar etiquetas HTML en documentos XML, se deberían escribir en mayúsculas. 3) La etiquetas pueden ser nombres compuestos que han de separarse por un guión, punto o carácter de subrayado, pero no se admiten los espacios. Ejemplo: . Se recomienda el uso de mayúsculas iniciales y no utilizar los símbolos antes citados: . 4) Los documentos XML han de utilizar siempre para cada elemento con contenido una etiqueta de apertura y otra de cierre. Ambas utilizan el mismo nombre, pero en la de finalización va precedida por el símbolo/. Ejemplo: contenido>/etiqueta>. 5) Pueden existir elementos “vacíos”, sin etiqueta de cierre; en este caso se ha colocar el carácter / al final de ella. Ejemplo: . Debemos tener en cuenta que, en realidad, una etiqueta “vacía” puede contener datos, los cuales podrían ser considerados 8-75 Desarrollo de Sistemas como elementos individuales dentro del documento, pero éstos son utilizados como atributos en la etiqueta vacía. Así, si tenemos un elemento empleado, a su vez, utilizáramos los elementos nombre y apellidos: empleado (nombre, apellidos), podríamos utilizarlo de la siguiente forma: En la misma etiqueta como atributos: En etiquetas independientes como elementos independientes: Popeye El Marino 6) Las etiquetas de los elementos con contenido también pueden utilizar atributos. Los valores de los atributos siempre han de ir entre comillas, ya sean simples (apóstrofos) o dobles. En caso de utilizar apóstrofos o comillas dobles dentro de la cadena de texto dada como valor para el atributo, se han de combinar ambas; en cado de utilizarse del mismo tipo, se han de usar las referencias a entidades ' o ". • Sintaxis general para etiquetas de elementos con contenido: contenido • Sintaxis general para etiquetas de elementos sin contenido: Ejemplo: < dedicatoria para=”familia” > Ojana significa familia, estaremos unidos siempre 8-76 Aplicaciones Web Un documento XML es un conjunto de cadenas de caracteres, en el que, al igual que en el HTML, podemos diferenciar dos tipos de construcciones: el marcado y los datos de carácter. El texto incluido entre los caracteres menor que "<" y mayor que ">" o entre los signos "&" y ";" es el marcado. Son exactamente las partes del documento que tiene que entender el procesador de XML. El marcado entre los signos "<" y ">" se denominan etiqueta. El resto no son más que datos de carácter, que se corresponde con lo que sería el contenido del documento: es decir, la parte imprimible de éste. En el caso de elementos con contenido, las etiquetas de comienzo se componen del símbolo menor que "<", el nombre del tipo de elemento, los atributos si los tiene y el símbolo mayor que ">". Mientras que las etiquetas de fin se componen del símbolo menor que seguido de contrabarra "". En el caso de ser un elemento vacío, sólo hay una etiqueta de elemento vacío que se forma del símbolo menor que "<", el nombre del tipo de elemento, los atributos si los tiene y se cierra con el símbolo "/>". Es importante destacar este tipo de elementos, ya que hasta ahora en el SGML y, por tanto en el HTML entendido como aplicación SGML, los elementos vacíos sólo se representaban con una etiqueta de inicio. A diferencia del SGML, no es necesario que un documento XML esté asociado a una DTD. 8.3. CSS La técnica más sencilla de publicar documentos XML en Internet que consiste en aplicar en este tipo de documentos las denominadas Hojas de Estilo en Cascada (CSS, Cascading Style Sheets) también veremos otras posibilidades basadas en tecnologías propiamente XML como son la utilización de XSL y XSLT para su publicación. No debemos olvidar que XML no es un lenguaje diseñado para la publicación de documentos y, por lo tanto, ha de recurrir al uso de alguna otra tecnología para poder mostrar los contenidos de los documentos. La técnica XML-CSS permite al diseñador de documentos el utilizar al máximo su capacidad creativa. Con XML controlará la estructura y elementos (etiquetas) que van a ser usados en el documento y con CSS definir de forma totalmente personal qué estilos serán utilizados por cada uno de esos elementos. La definición de las normas o reglas de estilo siguen la misma sintaxis: Selector { propiedad1: valor1 [; propiedad2: valor2:…]} La principal característica de las hojas de estilo CSS utilizadas por los documentos XML es que el nombre del selector del estilo debe coincidir con el nombre del elemento XML sobre el cual se va a aplicar, es decir, los nombres de los selectores siempre serán nombres de elementos utilizados en el documento XML. Título{ Font-family:Comic Sans MS; 8-77 Desarrollo de Sistemas Font-size: 16pt; Color:red; Text-align:center; Font-weight:bold } El enlace con las hojas de estilos se efectúa desde los documentos XML, por medio de una instrucción <¿xml-stylesheet…>. La sintaxis genérica es la siguiente: <¿xml-stylesheet href=”estilos.css” type=”text/css”?> Ya que XML no es un lenguaje diseñado para la publicación de documentos pero podemos utilizar otras tecnologías (hojas de estilo) existentes para ese fin. Los estilos que deseemos aplicar a los elementos de los documentos XML, han de ser definidos por medio de las hojas de estilo en cascada (CSS). Los estilos definidos pueden ser aplicados directamente a los elementos existentes en el documento XML. La aplicación de estilos también se puede efectuar utilizando las tecnologías XSL y XSL-FO. XML permite definir etiquetas personalizadas cuya principal característica sea la de aplicar formato o estilos a determinados elementos del documento. Las hojas de estilo en cascada (Cascading Style Sheets, CSS) son un lenguaje formal usado para definir la presentación de un documento estructurado escrito en HTML o XML (y por extensión en XHTML). El W3C (World Wide Web Consortium) es el encargado de formular la especificación de las hojas de estilo que servirá de estándar para los agentes de usuario o navegadores. CSS (Cascading Style Sheets o hojas de estilo en cascada) no es nada nuevo, ya se podía utilizar con HTML y se creó en un intento de separar la forma del contenido en HTML. En XML también podemos utilizar las CSS, y se utilizan de una manera muy similar a cómo se utilizan en HTML, por lo menos los atributos de estilo que podemos aplicar son los mismos y sus posibles valores también. La idea que se encuentra detrás del desarrollo de CSS es separar la estructura de un documento de su presentación. Por ejemplo, el elemento de HTML indica que un bloque de texto es un encabezamiento y que es más importante que un bloque etiquetado como . Versiones más antiguas de HTML permitían atributos extra dentro de la etiqueta abierta para darle formato (como el color o el tamaño de fuente). No obstante, cada etiqueta debía disponer de esa información si se deseaba un diseño consistente para una página, y además, una persona que lea esa página con un navegador pierde totalmente el control sobre la visualización del texto. Cuando se utiliza CSS, la etiqueta no debería proporcionar información sobre como va a ser visualizado, solamente marca la estructura del documento. La información de estilo separada en una hoja de estilo, especifi8-78 Aplicaciones Web ca como se ha de mostrar : color, fuente, alineación del texto, tamaño, y otras características no visuales. La información de estilo puede ser adjuntada tanto como un documento separado o en el mismo documento HTML. En este último podrían definirse estilos generales en la cabecera del documento o en cada etiqueta particular mediante el atributo “style”. Las ventajas de utilizar CSS (u otro lenguaje de estilo) son: — Control centralizado de la presentación de un sitio Web completo con lo que se agiliza de forma considerable la actualización del mismo. — Los Navegadores permiten a los usuarios especificar su propia hoja de estilo local que será aplicada a un sitio Web remoto, con lo que aumenta considerablemente la accesibilidad. Por ejemplo, personas con deficiencias visuales pueden configurar su propia hoja de estilo para aumentar el tamaño del texto o remarcar más los enlaces. — Una página puede disponer de diferentes hojas de estilo según el dispositivo que la muestre o incluso a elección del usuario. Por ejemplo, para ser impresa, mostrada en un dispositivo móvil, o ser "leída" por un sintetizador de voz. — El documento HTML en sí mismo es más claro de entender y se consigue reducir considerablemente su tamaño. Hay varias versiones: CSS1 y CSS2, con CSS3 en desarrollo por el World Wide Web Consortium (W3C). Los navegadores modernos los implementan bastante bien, aunque existen pequeñas diferencias de implementación según marcas y versiones de los navegadores. 8.4. DTD Siglas de Document Type Definition. Un DTD (Definición de tipo de documento) es una colección de reglas usadas con el propósito de identificar un tipo o clase de documento. El DTD realiza las siguientes tareas: — Define todos los elementos (nombres de etiquetas) que pueden aparecer en el documento. — Define las relaciones establecidas entre los distintos elementos. — Suministra información adicional que puede ser incluida en el documento: Atributos, Entidades y Notaciones. — Aporta comentarios e instrucciones para su procesamiento. El DTD es una definición en un documento SGML ó XML que especifica restricciones en la estructura del mismo. El DTD puede ser incluido dentro 8-79 Desarrollo de Sistemas del archivo del documento, pero normalmente se almacena en un fichero ASCII de texto separado. La sintaxis de los DTD’s para SGML y XML es similar pero no idéntica. La definición de un DTD especifica la sintaxis de una aplicación de SGML o XML, que puede ser un estándar ampliamente utilizado como XHTML o una aplicación local. Los DTD’s son generalmente empleados para determinar la estructura de un documento XML o SGML. Un DTD describirá típicamente cada elemento admisible dentro del documento, los atributos posibles y (opcionalmente) los valores de atributo permitidos para cada elemento. Es más, describirá los anidamientos y ocurrencias de elementos. La mayoría de DTD se componen generalmente de definiciones de ELEMENT y definiciones de ATTLIST. Ejemplo: ]> < dedicatoria para=”familia” > Ojana significa familia, estaremos unidos siempre Esto es un ejemplo de documento XML con DTD incorporada, prestamos especial interés en las siguientes características: 8-80 — Utilizamos nuestras propias etiquetas. Y es que en XML no estamos trabajando con etiquetas predefinidas. Nosotros podemos crearnos nuestro propio lenguaje de etiquetas en función de nuestras necesidades. — La sintaxis es estricta. Ya no vale dejar de entrecomillar los atributos o utilizar las mayúsculas y minúsculas sin ningún control. La especi- Aplicaciones Web ficación XML determina claramente una serie de reglas que especifican cuando un documento está bien formado. — La utilización de una DTD. En HTML, a pesar de ser una aplicación SGML, no era obligatorio utilizarlas y aunque para trabajar con XML tampoco será necesario, sí que será recomendable. Posiblemente no acompañen al documento XML en su distribución, pero resultan muy útiles en la elaboración y validación de los documentos. — Los elementos vacíos. Son los elementos del tipo , , etc. de HTML, en los que no existe etiqueta final al no tener contenido. Ahora, en el XML, la propia etiqueta de inicio llevará una contrabarra al final que los identificará. — Es posible guardar el componente DTD en un archivo de texto llamado ejemplo.dtd y el fichero xml a un fichero de texto denominado de forma diferente. Crear documentos XML válidos, es decir, documentos XML basados en la utilización de una definición de tipo de documento (DTD). Se denominan documentos XML válidos a aquéllos que, además de estar bien formados (estructura del documento correcta), siguen las normas sintácticas establecidas en un determinado DTD (Document Type Definition o Definición de Tipo de Documento) en el cual se indican cuáles son los elementos, atributos, etc., que se deben utilizar y de qué manera. Las DTD se basan en el lenguaje SGML, es decir, utilizan instrucciones definidas en ese lenguaje, pero existen otros lenguajes de modelado para la creación de documentos de validación y que están basados en XML; son los denominados esquemas (Schema), entre los cuales tenemos XML Schema. 8.4.1. Declaraciones usadas en un DTD Las posibles declaraciones son cuatro y permiten declarar todos los objetos que pueden ser utilizados por un documento y como. Se dividen en: — — Estructura física del documento: • Declaración de entidad (ENTITY) • Declaración de notación (NOTATION) Estructura lógica del documento: • Declaración de elemento (ELEMENT) • Declaración de atributos (ATTLIST) Veamos cada uno de ellos en detalle: 8-81 Desarrollo de Sistemas 8.4.2. Declaración de elementos En los DTD declaramos los elementos que se han de utilizar en el documento XML por medio de ; ésta es la forma de establecer los nombres de etiquetas usadas y cuál será su contenido. La sintaxis genérica para la declaración de elementos es: — NombreElemento representa a la etiqueta utilizada por un determinado elemento. — (Contenido) tipo de dato que puede incluir ese elemento; va entre paréntesis. Aquellos elementos que carezcan de contenido se declaran como EMPTY (vacío). Contenido de los elementos — Un texto (datos de caracteres). Datos de Caracteres Analizados. — Otros elementos: — Mixto con texto y otros elementos: los elementos de la lista de contenidos, entre paréntesis, han de ir separados por barra vertical “|”. Además, se ha de poner el indicador de número de apariciones de ese elemento en el documento mediante el símbolo de asterisco “*” colocado fuera de los paréntesis, el cual se utiliza para establecer que esos elementos pueden aparecer cero, 0, o varias veces. Cuando el contenido son otros elementos. 1. Los elementos de la lista han de ir separados por comas “,” si todos ellos pueden ser utilizados y siguiendo un determinado orden. 2. Los elementos de la lista han de ir separados por la barra inclinada “|” (OR) si cualquiera de ellos puede ser utilizado. 8.4.3. Declaración de entidad La entidad que sirve de punto de entrada al procesador XML es la entidad documento (o elemento raíz); desde esta entidad se puede hacer referencia a otras entidades ya sean internas (definidas en el propio documento) o externas. Esas entidades pueden a su vez hacer referencia a otras entidades. El conjunto de todas ellas dan lugar al documento XML completo. Una entidad puede ser desde un simple carácter especial, euro, por ejemplo, hasta archivos externos almacenados en disco de cualquier tipo: documentos de texto, imágenes, sonidos, etc. Se pueden establecer tres tipos de clasificaciones para las entidades: 8-82 Aplicaciones Web — Teniendo en cuenta si la DTD está definida dentro del propio documento XML o en fichero externo, pueden ser entidades internas y entidades externas. — Teniendo en cuenta el nivel de visibilidad o acceso a ella: entidades generales y entidades de parámetro. — Teniendo en cuenta si han de ser analizadas por el procesador de XML o no: entidades analizadas y entidades no analizadas. A) Entidades internas Pueden estar definidas en cualquier lugar del documento XML o en una DTD interna. Para hacer referencia a una entidad interna en el documento XML, tiene que haber sido definida previamente. Las entidades internas son todas entidades analizadas y, por lo tanto, han de ser de tipo texto. La referencia a una entidad interna en el documento XML se efectúa por nombre entre las marcas ampersand (&) y punto y coma (;) Ejemplo:&fecha; B) Entidades externas Están definidas en archivos externos almacenados en el propio ordenador o en otro distinto de una red. Existen dos métodos de acceso a la entidades externas SYSTEM o PUBLIC, tal como se muestra a continuación: — SYSTEM identificador_de_sistema. Tras la palabra SYSTEM, se especifica el identificador de sistema, un URI (Universal Resource Identifier o Identificador de Recursos Universal) o dirección de la entidad que se desea utilizar. — PUBLIC identificador_público identificador_de_sistema. Tras la palabra PUBLIC, se ha de indicar un identificador público, que generalmente hace referencia a una organización o documento estándar, y un identificador de sistema. C) Entidades generales Pueden estar definidas en el propio documento XML, en una DTD interna o en una DTD externa. Si hacen referencia a un objeto existente en el propio documento, un objeto XML, suelen ser utilizadas como macros y son expandidas por el procesador XML; reciben el nombre de entidades generales internas. Las entidades generales que hacen referencia a un objeto o recurso no XML, tales como archivos de imágenes, sonidos, etc., se las denomina entidades generales externas. 8-83 Desarrollo de Sistemas La referencia a una entidad de tipo general en el documento XML se efectúa por nombre, entre las marcas ampersand (&) y punto y coma (;) Ejemplo: &tai;. D) Entidades de párametro Las entidades de parámetro se utilizan solamente en las DTD. Para su declaración se ha de usar el símbolo de tanto por ciento (%) tras E) Entidades analizadas El contenido de estas entidades es analizado por el procesador de XML y debe ser siempre de tipo XML. Las entidades analizadas se suelen utilizar para compartir texto entre varios documentos. Pueden ser internas o externas. F) Entidades no analizadas Son entidades externas de cualquier tipo: sonidos, imágenes, documentos de texto, etc., y el acceso a ellas se efectúa mediante los métodos SYSTEM o PUBLIC. 8.4.4. Declaración de notación Estas declaraciones permiten definir un nombre de notación y un identificador externo por medio del cual los procesadores XML puedan localizar la aplicación auxiliar capaz de procesar los datos existentes en un determinado archivo. Las notaciones también permiten establecer la aplicación que debe ejecutar una determinada instrucción de procesamiento. 8.4.5. Declaración de atributos Estas declaraciones permiten definir el nombre del atributo, tipo de dato que utilizará y valor por defecto, si lo tuviera, para un determinado elemento ya definido en la DTD. 8-84 Aplicaciones Web — Elemento: nombre del elemento para el cual se define la lista de atributos. — Nombre: nombre del atributo o referencia a una entidad de parámetro con la lista de atributos ya definida en la DTD. — Valor: se refiere al valor por defecto asignado al atributo; puede ser un dato literal o una palabra clave, predefinida en XML (véase apartado sobre valores por defecto de los atributos). Tipos de atributos — CDATA — TIPOS ENUMERADOS — NOTATION • Valores por defecto de los atributos La asignación de un valor por defecto a un atributo se efectúa mediante un literal. En las declaraciones de lista de atributos se pueden utilizar también determinadas palabras clave para indicar si es obligatorio (REQUIRED) asignar un valor al atributo, o bien, la asignación de valor es opcional (IMPLIED).También se puede asignar un valor constante (FIXED) al atributo en su declaración. Declaración del tipo de documento Cuando un documento XML, va a utilizar una DTD para ser validado, ha de incluir una línea de prólogo en la cual se declara qué tipo de documento es, o sea, qué DTD se debe utilizar para efectuar la validación, por medio de una instrucción La sintaxis genérica de la línea de instrucción DOCTYPE es: — ElementoRaíz (root): se refiere al nombre del elemento que sirve como raíz de la estructura del árbol del documento. — DTD: mediante este parámetro especificamos la DTD que va ser utilizada por el documento. 8.4.6. Tipos de DTD Las DTD se clasifican en dos tipos: internas y externas. — DTD INTERNA La DTD se encuentra declarada en el propio documento XML. 8-85 Desarrollo de Sistemas . — DTD EXTERNA Las DTD se pueden guardar en archivos independientes con extensión, dtd; Podemos entonces utilizar dos métodos: SYSTEM o PUBLIC: • SYSTEM: utilizaremos este método para acceder a DTD’s que se encuentren en nuestro propio equipo. • PUBLIC: utilizamos este método para acceder a DTD’s que se encuentran en otros ordenadores de una red. El motor XML incluido en Internet Explorer incorpora un parser para validación de documentos XML basados en DTD. 8.5. XML SCHEMA También llamado “Esquema”, se trata de un documento de definición estructural al estilo de los DTD, que además cumple con el estándar XML. Los documentos Schema (usualmente con extensión XSD) se concibieron como un sustituto de los DTD teniendo en cuenta los puntos débiles de estos y la búsqueda de mayores y mejores capacidades a la hora de definir estructuras para los documentos XML, como la declaración de los tipos de datos. Un ejemplo de documento Schema vacío podría ser el siguiente: Ejemplo de XSD: Partamos del siguiente archivo xml que llamaremo futbol.xml: Lolo 91 777 77 77 8-86 Aplicaciones Web [email protected] 66666.33 ? 989898 Un poco mas arriba Madrid Mostoles 28777 25 España H5E24 Popo 91 777 77 77 [email protected] 66666.33 ? 989898 Un poco mas abajo Barcelona Marsella 22777 23 España A5E25 … …. Vamos a crear ahora un esquema que valide el anterior XML. Le llamaremos por supuesto futbol.xsd: 8-87 Desarrollo de Sistemas 8-88 Aplicaciones Web 8-89 Desarrollo de Sistemas 8.6. XSL XSL (eXtensible Style Language o Lenguaje de Estilos Extensible) es un lenguaje basado en XML y especialmente diseñado para la publicación de documentos XML. Las hojas de estilo XSL se almacenan en archivos independientes, con la extensión (*.xsl) y son enlazadas desde el documento XML que las utiliza de forma similar a como se enlazaban las hojas de estilo CSS. XSL no es un lenguaje para definir estilos, como en el caso de las hojas de estilo CSS o XSL-FO, sino un lenguaje que permite aplicar determinados formatos ya definidos a documentos XML. Otra de sus características es la posibilidad de efectuar filtrado de información seleccionando los elementos y contenido que deseamos mostrar en la página generada. Es una familia de lenguajes basados en el estándar XML que permite describir cómo la información contenida en un documento XML cualquiera debe ser transformada o formateada para su presentación en un medio específico. Este lenguaje no se limita a definir qué estilo aplicar a cada elemento del documento XML. Además se pueden realizar pequeñas instrucciones típicas de los lenguajes de programación y la salida no tiene porque ser un documento HTML, sino que además podría ser de otros tipos, cualquiera que podamos necesitar como un documento escrito en WML (para WAP), un documento de texto plano u otro documento XML. XSL resulta mucho más potente que CSS y de hecho es mucho más adecuado utilizarlo. Una de sus principales ventajas la vemos a continuación. Si tenemos un documento XML que queremos que se visualice en múltiples dispositivos distintos será imprescindible utilizar XSL. En este esquema tendríamos un solo documento XML y un documento XSL para cada dispositivo que queramos incluir, por ejemplo para un navegador Netscape, otro para Internet Explorer, otro para un móvil de una marca y otro para un móvil de otra marca. Si mañana aparece un nuevo dispositivo, por muy particular que sea, sólo necesitaremos crear un documento XSL para que nuestros XML se puedan visualizar en él. Esta familia está formada por tres lenguajes: 8-90 — XSLT (siglas de Extensible Stylesheet Language Transformations, lenguaje de hojas extensibles de transformación) (XSL Transform o Transformaciones XSL), que permite convertir documentos XML de una sintaxis a otra (por ejemplo, de un XML a otro o a un documento HTML). Es pues una tecnología utilizada para la aplicación de formatos a los documentos XML. — XSL-FO (lenguaje de hojas extensibles de formateo de objetos) (XSL Formatting Objects u Objetos para Formato de XSL), que permite especificar el formato visual con el cual se quiere presentar un docu- Aplicaciones Web mento XML, es usado principalmente para generar documentos PDF. Es pues una tecnología utilizada para definir estilos de forma similar a las hojas de estilo CSS. — XPath, o XML Path Language, es una sintaxis (no basada en XML) para acceder o referirse a porciones de un documento XML. Para poder visualizar los resultados de aplicar los formatos y estilos a un documento XML, es necesario que el navegador incorpore un motor XSLT (XSL, Transform), el cual se encarga de efectuar las transformaciones de los estilos definidos y generar la presentación adecuada. Con Internet Explorer 5.5 se incorpora MSXML3. Mediante XSL y XSL-FO se puede generar la salida de los contenidos de un archivo XML en cualquier formato de publicación: texto plano, HTML, XHTML, WML, PDF (utilizado por Acrobat Reader), RTF, etc. Las hojas de estilo XSL, se basan en la definición de plantillas (templates). Cada una de las plantillas definidas ha de estar relacionada con algún elemento existente en el documento; sobre dicho elemento se aplicarán las transformaciones y formatos utilizados en la plantilla. La relación plantilla-elemento se establece por medio del parámetro match existente en toda la plantilla y en la cual se asignará la ruta (Xpath) que el elemento XML tiene en la estructura del documento. El elemento (nodo) raíz del documento, el inicio de la ruta de acceso, es referenciado por el símbolo de barra inclinada (“/). Para acceder a todos los nodos del documento se puede utilizar “//”. Para acceder a todos los nodos situados por debajo de uno determinado, se utilizará el carácter comodín “*”. • Tipos de planillas En toda hoja de estilos XSL existirá una plantilla raíz, match=”/”, que estará relacionada con el elemento raíz del documento XML; establece, por lo tanto, cómo ha de efectuarse la transformación genérica que se utilizará en el documento. • Creación de plantillas XSL La declaración de una plantilla se efectúa por medio de la instrucción XSL , en la cual se establece la ruta de acceso al elemento relacionado con la plantilla por medio del parámetro match. • Instrucciones XSL básicas 1. Ejecución de las transformaciones definidas en las plantillas. Para indicar al motor XSL que aplique todas laas transformaciones definidas en el documento o las utilizadas por defecto, se usa la instrucción . 8-91 Desarrollo de Sistemas 2. Acceso a contenidos del documento. Para indicar, dentro de la plantilla, que se utilice el dato (texto) del elemento XML relacionado con la plantilla, utilizaremos la instrucción . • Creación de hojas de estilo XSL 1º Los documentos XSL comienzan con una línea de prólogo. 2º La siguiente línea es la línea de declaración de hoja de estilo; sirve para identificar al documento como una hoja de estilos y representa su inicio. Comienza con una instrucción 3º Los documentos XSL se han de cerrar siempre con la etiqueta . 4º Por convención, los archivos de documentos XSL, se guardan con la extensión .xsl. • Enlace de hojas de estilo XSL El enlace de una hoja de estilos XSL, desde un archivo XML, se efectúa mediante una instrucción de proceso (PI, Processing Intruction). Las instrucciones de proceso están representadas por etiquetas de tipo vacío (sin etiqueta de cierre, solamente utilizan atributos) que comienzan con <¿ y se cierran con ?>. <¿xml-stylesheet href=”url” type=”text/xsl”?> • Plantillas XSL utilizadas para conversión a texto Plantilla básica para mostrar los datos de un documento XML con XSL. Selección de la información que vamos a mostrar . Bucles para selección de información . 8.6.1. XSLT Al igual que XML, XSLT es un lenguaje de programación. Forma parte de la trilogía transformadora de XML, compuesta por las CSS (Cascading Style 8-92 Aplicaciones Web Sheets, hojas de estilo en cascada), que permite dar una apariencia en el navegador determinada a cada una de las etiquetas XML; XSLT (XML Stylesheets Language for Transformation, o lenguaje de transformación basado en hojas de estilo); y XSL:FO, (Formatting Objects, objetos de formateo), o transformaciones para fotocomposición, o, en general, para cualquier cosa que no sea XML, como por ejemplo HTML “del viejo” o PDF (el formato de Adobe). XHTML sí es XML, sigue un DTD (varios, en realidad), y sólo admite documentos “bien formados”. HTML no lo es, aunque pude convertirse fácilmente en XHTML usando utilidades tales como Tidy. XSLT es pues, un lenguaje que se usa para convertir documentos XML en otros documentos XML; puede convertir un documento XML que obedezca a un DTD a otro que obedezca otro diferente, un documento XML bien formado a otro que siga un DTD, o, lo más habitual, convertirlo a “formatos finales”, tales como WML (usado en los móviles WAP) o XHTML. Los programas XSLT están escritos en XML, y generalmente, se necesita un procesador de hojas de estilo, o “stylesheet” processor para procesarlas, aplicándolas a un fichero XML. El estilo de programación con las hojas XSLT es totalmente diferente a los otros lenguajes a los que estamos acostumbrados (tales como C++ o Perl), pareciéndose más a “lenguajes” tales como el AWK, o a otros lenguajes funcionales, tales como ML o Scheme. En la práctica, eso significa dos cosas: — No hay efectos secundarios. Una instrucción debe de hacer lo mismo cualquier que sea el camino de ejecución que llegue hasta ella. — La programación está basada en reglas: cuando ocurre algo en la entrada, se hace algo en la salida. Lo que consiguen las hojas de estilo es separar la información (almacenada en un documento XML) de su presentación, usando en cada caso las transformaciones que sean necesarias para que el contenido aparezca de la forma más adecuada en el cliente. Es más, se pueden usar diferentes hojas de estilo, o incluso la misma, para presentar la información de diferentes maneras dependiendo de los deseos o de las condiciones del usuario. XSLT o XSL Transformaciones es un estándar de la organización W3C que presenta una forma de transformar documentos XML en otros e incluso a formatos que no son XML. Las hojas de estilo XSLT realizan la transformación del documento utilizando una o varias reglas de plantilla: unidas al documento fuente a transformar, esas reglas de plantilla alimentan a un procesador de XSLT, el cual realiza las transformaciones deseadas colocando el resultado en un archivo de salida o, como en el caso de una pagina Web, directamente en un dispositivo de presentación, como el monitor de un usuario. Actualmente, XSLT es muy usado en la edición Web, generando páginas HTML o XHTML. La unión de XML y XSLT permite separar contenido y pre- 8-93 Desarrollo de Sistemas sentación, aumentando así la productividad. XSLT o XSL Transformations es la parte más importante del lenguaje XSL (eXtensible StyleSheet Language). La función de XSLT es la de transformar documentos XML en documentos XHTML u otros documentos XML. El W3C es el encargado de la definición de especificación XSLT. XSLT se basa en XPath para realizar la búsqueda de información a través del documento XML. XPath son cadenas que son expresiones regulares, las cuales hacen referencia a alguna estructura dentro del documento XML. El proceso de transformación se basa en plantillas. Dichas plantillas identifican una estructura a partir de la cual realizar la transformación (con XPath), así como las acciones a realizar con dicha estructura: recorrerla, obtener el dato de la etiqueta, el valor de alguno de sus atributos, contar cuantos elementos tiene la etiqueta anidados,... Además, para poder aplicar las transformaciones, necesitaremos asociar el documento de transformación al documento XML receptor de la misma. A diferencia del lenguaje HTML, donde cada una de sus etiquetas lleva asociada una representación gráfica, el XML identifica datos, los cuales no tienen representación gráfica asociada. Cuando definimos una tabla en HTML (la etiqueta ), sabemos que las herramientas que interpreten el documento HTML, normalmente los navegadores Web, pintarán la tabla. De una forma u otra visualizaremos la tabla en nuestra pantalla. Si bien, si tenemos un documento XML, donde podemos tener definida la etiqueta , está no tendrá ninguna representación gráfica asociada. Es por ello que si visualizamos nuestro documento XML con alguna herramienta, esta, mostrará el contenido de la etiqueta, pero sin ninguna representación. Es en este punto donde entra el lenguaje XSLT. Y es que este lenguaje permite transformar el susodicho documento XML en otro formato, el resultado de la transformación será el que lleve la representación gráfica. 8.6.2. XSL-FO (Objetos de Formateo) Mediante los objetos de formateo (Formatting Objects –FO–) y sus propiedades podemos describir cómo se van a visualizar los componentes de un documento. Con estos objetos definimos: 8-94 — Las características de la página. — Los párrafos. — Las listas. — Las tablas. — Los enlaces. — etc. Aplicaciones Web La especificación XSL indica el vocabulario XML que define estos objetos de formateo. El siguiente código es un pequeño ejemplo de fichero XSL-FO: Mi primer XSL-FO Hola este es mi primer XSL-FO. 8-95 Desarrollo de Sistemas En el que podemos observar: — Que se trata de un vocabulario XML, en el que todos los elementos van precedidos del “namespace” 'fo', y que por tanto al escribir el elemento raiz del documento XML debemos declararlo de la siguiente manera: — Que esta formado por un conjunto de elementos: fo:simple-page-master, fo:flow, fo:block, etc. mediante los cuales y sus propiedades (definidas en los atributos): “font-size”, “font-family”, etc. describimos como se visualizan de forma genérica los componentes de un documento. La especificación define por tanto todos estos elementos y sus propiedades y como deben expresarse mediante un vocabulario XML. • Procesadores XSL-FO Un procesador XSL es la aplicación que procesa un documento XML compuesto de XSL-FOS y lo presenta de manera que una persona lo pueda leer facilmente. BROWSER XSL-FO XML PROCESADOR XSLT XSL-FO PROCESADOR XSL-FO XSLT XSL-FO PDF RTF OTROS En los últimos meses han sido muchos los procesadores de XSL-FO que han aparecido. Estos son algunos de los más significativos: 8-96 — XEP, desarrollado por RenderX. — PassiveTex. Es una librería de macros en Tex que pueden ser usadas para procesar documentos XML formados por XSL-FO. — XSL Formatter, de Antenna House Inc. — Unicorn Formatting Objects (UFO), es un procesador de XSL-FO implementado en C++. — FOP, que es un procesador de XSL-FO desarrollado en JAVA por Apache XML Project. Aplicaciones Web 8.7. XHTML XHTML, acrónimo inglés de eXtensible Hyper Text Markup Language (lenguaje extensible de marcado de hipertexto), es el lenguaje de marcado pensado para sustituir a HTML como estándar para las páginas Web. XHTML es la versión XML de HTML, por lo que tiene, básicamente, las mismas funcionalidades, pero cumple las especificaciones, más estrictas, de XML. Su objetivo es avanzar en el proyecto del World Wide Web Consortium de lograr una Web semántica, donde la información, y la forma de presentarla estén claramente separadas. En este sentido, XHTML serviría únicamente para transmitir la información que contiene un documento, dejando para hojas de estilo (como las hojas de estilo en cascada) y JavaScript su aspecto y diseño en distintos medios (ordenadores, PDA’s, teléfonos móviles, impresoras...). 8.7.1. Ventajas Las principales ventajas del XHTML sobre otros formatos son: — Compatibilidad parcial con navegadores antiguos: la información se visualiza, aunque sin formato. Apuntar que el XHTML 1.0 fue diseñado expresamente para ser mostrado en navegadores que soportan HTML de base. — Un mismo documento puede adoptar diseños radicalmente distintos en diferentes aparatos, pudiendo incluso escogerse entre varios diseños para un mismo medio. — Facilidad de edición directa del código y de mantenimiento. — Formato abierto, compatible con los nuevos estándares que actualmente está desarrollando el W3C como recomendación para futuros agentes de usuario o navegadores. — Los documentos escritos conforme a XHTML 1.0 pueden potencialmente presentar mejor rendimiento en las actuales herramientas Web que aquellos escritos conforme a HTML. 8.7.2. Inconvenientes — Algunos navegadores antiguos no son totalmente compatibles con los estándares, lo que hace que las páginas no siempre se muestren correctamente. Esto cada vez es menos problemático, al ir cayendo en desuso. — Muchas herramientas de diseño Web aún no producen código XHTML correcto. 8.7.3. Diferencias entre HTML y XHTML Se eliminan elementos no semánticos: — Desaparecen las etiquetas de HTML , . 8-97 Desarrollo de Sistemas — Desaparecen varios atributos de formato. — El aspecto del documento se describe únicamente a través de hojas de estilo. Al ser XML, se exige: — Incluir siempre la etiqueta “doctype” apropiada. — Todas las etiquetas deben cerrarse, aunque sea poniendo una barra “/”, como, por ejemplo: pasa a ser . — Sólo pueden incluirse datos en formatos admitidos por XML. Esto da problemas para incluir JavaScript en los documentos directamente. — Todos los atributos deben tener un valor, y meterlo entre comillas. Además, los nombres y atributos de todas las etiquetas deben estar en minúsculas. 8.8. XQUERY “libros.xml” Programación XML LopezL. ADAMS 65.95 Programación para Linux LopezL. ADAMS65.95 Data on the Web LopezSerge RodríguezPeter AlvarezDan Morgan Kauf 39.95 Economics Digital TV 8-98 Aplicaciones Web SuarezDarcy CITI Kluwer Acad 129.95 A continuación se muestra el contenido del DTD correspondiente al archivo “libros.xml”. bib (libro* )> libro (titulo,(autor+ | editor+ ),editorial, precio libro year CDATA #REQUIRED > autor (apellido, nombre )> editor (apellido, nombre, afiliacion )> titulo (#PCDATA )> apellido (#PCDATA )> nombre (#PCDATA )> afiliacion (#PCDATA )> editorial (#PCDATA )> precio (#PCDATA )> La siguiente consulta devuelve los títulos de los libros que tengan más de dos autores ordenados por su título. for $b in doc(“libros.xml”)//libro let $c := $b//autor where count($c) > 2 order by $b/titulo return $b/ titulo El resultado de esta consulta se muestra a continuación. Data on the Web La siguiente consulta devuelve los títulos de los libros del año 2.000. for $b in doc(“libros.xml”)//libro where $b/@año = “2000” return $b/titulo 8-99 Desarrollo de Sistemas doc(“libros.xml”)/bib/libro/titulo[/bib/libro/autor/apellido=’Lopez’] Esta expresión XPath, que también es una consulta XQuery válida, devuelve los títulos de los libros que tengan algún autor de apellido ‘Lopez’. La consulta con una cláusula “for” se muestra a continuación. for $d in doc(“libros.xml”)/bib/libro/titulo return { $d } El resultado de esta consulta se muestra a continuación: Programación XML Programación para Linux Data on the Web Economia mundial A continuación repetimos la misma consulta sustituyendo la cláusula for una cláusula let. let $d := doc(“libros.xml”)/bib/libro/titulo return { $d } El resultado de esta consulta se muestra a continuación. Programación XML Programación para Linux Data on the Web Economia mundial Esta consulta devuelve el título de cada uno de los libros de archivo “libros.xml” junto con el número de autores de cada libro. for $b in doc(“libros.xml”)//libro let $c := $b/autor return { $b/titulo, { count($c) }} En esta se devuelve los titulos de todos los libros contenidos en el archivo “libros.xml” y todos los comentarios de cada libro contenidos en “comentarios.xml”: for $t in doc(“libros.xml”)//titulo, $e in doc(“comentarios.xml”)//entrada where $t = $e/titulo return { $t, $e/comentario } 8-100 Aplicaciones Web La siguiente consulta devuelve los títulos de todos los libros almacenados en el archivo “libros.xml” y sus dos primeros autores. En el caso de que existan más de dos autores para un libro, se añade un tercer autor “et al.”. for $b in doc(“libros.xml”)//libro return { $b/titulo } { for $a at $i in $b/autor where $i <= 2 return {string($a/last), “, “, string($a/first)} } { if (count($b/autor) > 2) then et al. else () } Esta devuelve los titulos de los libros en los que al menos uno de sus autores es L. Lopez: for $b in doc(“libros.xml”)//libro where some $a in $b/autor satisfies ($a/last=”Lopez” and $a/first=”L.”) return $b/titulo La siguiente consulta devuelve todos los títulos de los libros en los que todos los autores de cada libro es L. Lopez. for $b in doc(“libros.xml”)//libro where every $a in $b/autor satisfies ($a/last=”Lopez” and $a/first=”L.”) return $b/titulo La siguiente consulta devuelve los títulos de los libros que mencionen “Unix” y “programacion” en el mismo párrafo. Si el libro tiene más de un párrafo solo es necesario que aparezca en, al menos, uno de ellos. for $b in doc(“bib.xml”)//libro where some $p in $b//parrafo satisfies 8-101 Desarrollo de Sistemas (contains($p,”Unix”) AND contains($p,”programacion”)) return $b/title La siguiente consulta devuelve el título de todos los libros que mencionen “programacion” en cada uno de los párrafos de los libros almacenados en “bib.xml”. for $b in doc(“bib.xml”)//libro where every $p in $b// parrafo satisfies contains($p,”programacion”) return $b/title Esta consulta es distinta de la anterior ya que no es suficiente que “programacion” aparezca en al menos uno de los párrafos, sino que debe aparecer en todos los párrafos que existan. Una consulta que usa el operador unión para obtener una lista ordenada de apellidos de todos los autores y editores: for $l in distinct-values(doc(“libros.xml”) //(autor | editor)/apellido) order by $l return { $l } Consulta que usa el operador sustracción para obtener un nodo libro con todos sus nodos hijos salvo el nodo . for $b in doc(“libros.xml”)//libro where $b/titulo = “Programación XML” return { $b/@* } { $b/* except $b/precio } La siguiente consulta devuelve todos los nodos libro que tengan al menos un nodo autor. for $b in doc(“libros.xml”)//libro where not(empty($b/autor)) return $b 8-102 Aplicaciones Web Como la consulta anterior tiene una cláusula “where” que comprueba una negación sobre “empty()”, podemos rescribirla usando la función “exists()”. El resultado de esta consulta es el mismo que el resultado de la consulta anterior. for $b in doc(“libros.xml”)//libro where exists($b/autor) return $b 9. Navegadores y lenguajes de programación web. Lenguajes de script La representación de información mediante hipertexto es la base principal de la tecnología web, la conexión de páginas a través de enlaces proporciona un mecanismo flexible y adaptable a la creación de hiperespacios de información. Una página web vista en un navegador, o cliente web, está compuesta por diferentes elementos como textos, imágenes, vídeos y diferente información procedente de bases de datos. Inicialmente la web solo empleaba páginas estáticas basadas en HTML, donde la presentación era fija, pero posteriormente la evolución tecnológica aportó páginas dinámicas que se conformaban en función de la interacción con el operador. Distinguimos para estas últimas aquellas páginas dinámicas que construyen la presentación en el cliente y las que construyen la respuesta a entregar en el servidor. En las páginas dinámicas que se procesan en el cliente toda la carga de procesamiento la soporta el navegador mientras que en las páginas dinámicas que se ejecutan en el servidor se posibilita el acceso a muchos recursos externos al ordenador del cliente, principalmente bases de datos alojadas en servidores. Para estas dos modalidades podemos clasificar los lenguajes de diseño web en: — Lenguajes web de cliente. — Lenguajes web de servidor. Hacemos a continuación una revisión de los lenguajes web de cliente: — Javascript: es un lenguaje interpretado sin compilación. Fue creado por Netscape Communications y es similar a JAVA, aunque no es un lenguaje orientado a objetos. Para evitar incompatibilidades entre navegadores el World Wide Web Consortium (W3C) diseñó un estándar denominado DOM (en inglés Document Object Model. Su principal desventaja es que el código es visible por el usuario. — Visual Basic Script: es un lenguaje de programación de scripts del lado del cliente, pero sólo compatible con Internet Explorer. Su utilización está desaconsejada en favor de Javascript. Está basado en 8-103 Desarrollo de Sistemas Visual Basic, sin embargo, no todo lo que se puede hacer en Visual Basic se puede hacer en Visual Basic Script, ya que se trata de una versión reducida del primero. — DHTML: no es en sentido estricto un lenguaje de programación, se trata de un conjunto de capacidades de las que disponen los navegadores modernos, las páginas que responden a las interacciones del usuario se pueden englobar dentro de DHTML, y en ellas se pueden mostrar y ocultar elementos, modificando su posición, dimensiones, color, etc. — CSS: las hojas de estilo en cascada son un recurso para definir los estilos de un sitio web. Esto se consigue creando un archivo donde se definen las declaraciones de estilo y se enlazan todas las páginas del sitio con este archivo. De este modo, todas las páginas comparten una misma declaración de estilo. — Applets de JAVA: se trata de pequeños programas hechos en JAVA, que se transfieren a los clientes web. Los Applets están programados en JAVA y precompilados, son mucho menos dependientes del navegador que Javascript y más potentes. En relación con Javascript los applets son más lentos de procesar y tienen un espacio muy delimitado en la página donde se ejecutan. Los Applets de JAVA no abren ventanas secundarias, ni controlan frames, formularios, capas, etc. A continuación hacemos a continuación una revisión de los lenguajes web de servidor: — CGI, Common Gateway Interface: actualmente se encuentra un poco desfasado por la dificultad con la que se desarrollan los programas y la pesada carga que supone para el servidor que los ejecuta. Los CGI se escriben habitualmente en Perl, sin embargo, otros lenguajes como C, C++ o Visual Basic pueden ser también empleados para construirlos. Cada programa CGI que se pone en marcha lo hace en un espacio de memoria propio. Así, si tres usuarios ponen en marcha un CGI a la vez se multiplicará por tres la cantidad de recursos que ocupe ese CGI. Esto supone una grave ineficiencia. — ASP, Active Server Pages: es una tecnología del lado de servidor desarrollada por Microsoft para sitios web dinámicos y requiere tener instalado Internet Information Server (IIS). ASP no necesita ser compilado para ejecutarse. Existen varios lenguajes que se pueden utilizar para crear páginas ASP. El más utilizado es VBScript, nativo de Microsoft. Los archivos tienen la extensión (asp). Actualmente está disponible la siguiente versión de ASP, ASP.NET, que comprende mejoras en cuanto a las posibilidades del lenguaje y rapidez de funcionamiento. Para el desarrollo de ASP.NET se puede utilizar C#, VB.NET o J#. Los archivos cuentan con la extensión (aspx). Para su funcionamiento se necesita tener instalado IIS con el Framework .Net. — PHP, Hypertext Preprocesor: PHP es un acrónimo recursivo que significa “PHP Hypertext Pre-processor”, (inicialmente se llamó Personal Home Page). Surgió en 1995, desarrollado por PHP Group. PHP 8-104 Aplicaciones Web es un lenguaje de script interpretado en el lado del servidor utilizado para la generación de páginas web dinámicas, embebidas en código HTML y ejecutadas en el servidor. PHP no necesita ser compilado para ejecutarse. Para su funcionamiento necesita tener instalado Apache o IIS con las librerías de PHP. La mayor parte de su sintaxis ha sido tomada de C, JAVA y Perl con algunas características específicas. Los archivos cuentan con la extensión (php). Se caracteriza por ser un lenguaje muy rápido. Soporta en cierta medida la orientación a objetos (Clases y herencia). Es un lenguaje multiplataforma: Linux, Windows, entre otros. Tiene capacidad de conexión con la mayoría de bases de datos: MysSQL, PostgreSQL, Oracle, MS SQL Server, entre otras. Es libre, por lo que se presenta como una alternativa de fácil acceso para todos. Incluye gran cantidad de funciones. No requiere definición de tipos de variables ni manejo detallado del bajo nivel. — JSP, JAVA Server Pages: es un lenguaje para la creación de sitios web dinámicos, acrónimo de JAVA Server Pages. Está orientado a desarrollar páginas web en JAVA. JSP es un lenguaje multiplataforma. Creado para ejecutarse del lado del servidor. JSP fue desarrollado por Sun Microsystems. Posee un motor de páginas basado en los servlets de JAVA. Para su funcionamiento se necesita tener instalado un servidor Tomcat. Los archivos se encuentran con la extensión (jsp). — Lenguaje Perl: Perl es uno de los lenguajes más antiguos siendo muy flexible, los scripts Perl se asemejan bastante a PHP. La principal causa de la “sucia” apariencia de Perl es la afición de sus desarrolladores a escribir numerosas funcionalidades en una sola línea de código. La potencia de Perl a la hora de procesar grandes cantidades de datos lo hace realmente popular a la hora de desarrollar aplicaciones del lado del servidor. — Lenguaje Python: es un lenguaje de programación creado en el año 1990 por Guido van Rossum. Python es comparado habitualmente con Perl. Los usuarios lo consideran un lenguaje más “limpio” para programar. Permite la creación de todo tipo de programas incluyendo sitios web. Su código no necesita ser compilado. — Lenguaje Ruby: es un lenguaje interpretado de alto nivel y orientado a objetos. Desarrollado en el 1993 por el programador japonés Yukihiro Matsumoto. Su sintaxis está inspirada en Phyton y Perl. Es distribuido bajo licencia de software libre (Opensource). Ruby es un lenguaje dinámico para programación orientada a objetos rápida y sencilla. 8-105 Tema 9 Accesibilidad, diseño universal y usabilidad. Acceso y usabilidad de las tecnologías, productos y servicios relacionados con la sociedad de la información. Confidencialidad y disponibilidad de la información en puestos de usuario final. Desarrollo de Sistemas Guión-resumen 1. Accesibilidad, diseño universal y usabilidad 1.1. Introducción 1.2. Accesibilidad 1.3. Diseño universal 1.4. Usabilidad 2. Acceso y usabilidad de las tecnologías, productos y servicios relacionados con la sociedad de la información 2.1. Usabilidad y accesibilidad 9-2 3. Confidencialidad y disponibilidad de la información en puestos de usuario finalI Accesibilidad, diseño universal y usabilidad 1. Accesibilidad, diseño universal y usabilidad 1.1. Introducción Decimos que accesibilidad es poder acceder a la información sin limitación alguna por razón de deficiencia, minusvalía o tecnología utilizada sin que interfieran, por ejemplo: — Problemas de oído, visión, movilidad. — Dificultades de lectura o comprensión cognitiva. — Imposibilidad de utilización del teclado o el ratón. — Lector de sólo texto, pantalla pequeña o conexión lenta. — La accesibilidad mejora el acceso, no es de interés únicamente para personas con discapacidad. El diseño universal es el diseño de productos y entornos de fácil uso para el mayor número de personas posible, sin la necesidad de adaptarlos o rediseñarlos de una forma especial. El propósito del diseño universal es simplificar la realización de las tareas cotidianas mediante la construcción de productos, servicios y entornos más sencillos de usar por todas las personas y sin esfuerzo alguno. El diseño universal, así pues, beneficia a todas las personas de todas las edades y habilidades. La usabilidad se refiere a la capacidad de un software de ser comprendido, aprendido, usado y ser atractivo para el usuario, en condiciones específicas de uso. Usabilidad es la eficiencia y satisfacción con la que un producto permite alcanzar objetivos específicos a usuarios específicos en un contexto de uso específico. 1.2. Accesibilidad La accesibilidad indica la facilidad con la que algo puede ser usado, visitado o accedido en general por todas las personas, especialmente por aquellas que poseen algún tipo de discapacidad. Para promover la accesibilidad se hace uso de ciertas facilidades que ayudan a salvar los obstáculos o barreras de accesibilidad del entorno, consiguiendo que estas personas realicen la misma acción que pudiera llevar a cabo una persona sin ningún tipo de discapacidad. Estas facilidades son llamadas ayudas técnicas. Entre éstas se encuentran el alfabeto braille, la lengua de señas, las sillas de ruedas, las señales auditivas de los semáforos, etc. Si nos centramos en la informática, la accesibilidad incluye ayudas como las tipografías de alto contraste o gran tamaño, magnificadores de pantalla, lectores y revisores de pantalla, programas de reconocimiento de voz, teclados adaptados, y otros dispositivos apuntadores y de entrada de información. 9-3 Desarrollo de Sistemas La accesibilidad aplicada al contenido de Internet se denomina accesibilidad web. En la Web, el W3C ha desarrollado directrices o pautas específicas para permitir y asegurar este tipo de accesiblidad. El grupo de trabajo dentro del W3C encargado de promoverla es el WAI (Web Accessibility Initiative) Nota. Al final de este capítulo introduciremos un capítulo sobre la W3C y WAI. La accesibilidad web indica la capacidad de acceso a la Web y a sus contenidos por todas las personas, independientemente de la discapacidad (física, intelectual o técnica) que presenten o de las que se deriven del contexto de uso (tecnológicas o ambientales). 1.3. Diseño universal El concepto de “Diseño Universal” se centra en el diseño para todas las personas, pero hay que considerar que en el uso del entorno intervienen otros aspectos, como la calidad de ejecución, el mantenimiento, los recursos económicos, las limitaciones propias de las personas, la cultura, el ambiente, etc., que no deben olvidarse. Todo esto significan limitaciones al concepto propuesto de “Diseño Universal”. 1.3.1. Principios del Diseño Universal o Diseño para Todos Los 7 Principios del Diseño Universal o Diseño para Todos se centran en el diseño utilizable universalmente o por todos, pero hay que tener en cuenta que en el diseño intervienen otros aspectos, como el coste, la cultura en la que será usado, el ambiente, etc.; que tampoco pueden olvidarse. Estos principios generales del diseño son aplicables y de hecho se aplican en la arquitectura, la ingeniería y, por supuesto, las páginas y aplicaciones Web, entre otros campos de aplicación. Los principios del Diseño Universal, fueron compilados por: Bettye Rose Connell, Mike Jones, Ron Mace, Jim Mueller, Abir Mullick, Elaine Ostroff, Jon Sanford, Ed Steinfeld, Molly Story, y Gregg Vanderheiden. Los citamos a continuación: 1º. Uso equiparable Igualdad de uso: El diseño debe ser fácil de usar y adecuado para todas las personas independientemente de sus capacidades y habilidades. El diseño es útil y vendible a personas con diversas capacidades. 9-4 • Que proporcione las mismas maneras de uso para todos los usuarios: idénticas cuando es posible, equivalentes cuando no lo es. • Que evite segregar o estigmatizar a cualquier usuario. • Las características de privacidad, garantía y seguridad deben estar igualmente disponibles para todos los usuarios. • Que el diseño sea atractivo para todos los usuarios. Accesibilidad, diseño universal y usabilidad 2º. Uso flexible Flexibilidad: El diseño debe poder adecuarse a un amplio rango de preferencias y habilidades individuales. El diseño se acomoda a un amplio rango de preferencias y habilidades individuales. 3º. • Que ofrezca posibilidades de elección en los métodos de uso. • Que pueda accederse y usarse tanto con la mano derecha como con la izquierda. • Que facilite al usuario la exactitud y precisión. • Que se adapte al paso o ritmo del usuario. Simple e intuitivo El diseño debe ser fácil de entender independientemente de la experiencia, los conocimientos, las habilidades o el nivel de concentración del usuario. El uso del diseño es fácil de entender, atendiendo a la experiencia, conocimientos, habilidades lingüísticas o grado de concentración actual del usuario. 4º. • Que elimine la complejidad innecesaria. • Que sea consistente con las expectativas e intuición del usuario. • Que se acomode a un amplio rango de alfabetización y habilidades lingüísticas. • Que dispense la información de manera consistente con su importancia. • Que proporcione avisos eficaces y métodos de respuesta durante y tras la finalización de la tarea. Información perceptible Información fácil de percibir: El diseño debe ser capaz de inrtercambiar información con el usuario, independientemente de las condiciones ambientales o las capacidades sensoriales del mismo. El diseño comunica de manera eficaz la información necesaria para el usuario, atendiendo a las condiciones ambientales o a las capacidades sensoriales del usuario. • Que use diferentes modos para presentar de manera redundante la información esencial (gráfica, verbal o táctilmente). • Que proporcione contraste suficiente entre la información esencial y sus alrededores. • Que amplíe la legibilidad de la información esencial. • Que diferencie los elementos en formas que puedan ser descritas (por ejemplo, que haga fácil dar instrucciones o direcciones). 9-5 Desarrollo de Sistemas • 5º. Que proporcione compatibilidad con varias técnicas o dispositivos usados por personas con limitaciones sensoriales. Con tolerancia al error El diseño debe minimizar las acciones accidentales o fortuitas que puedan tener consecuencias fatales o no deseadas. El diseño minimiza los riesgos y las consecuencias adversas de acciones involuntarias o accidentales. 6º. • Que disponga los elementos para minimizar los riesgos y errores: elementos más usados, más accesibles; y los elementos peligrosos eliminados, aislados o tapados. • Que proporcione advertencias sobre peligros y errores. • Que proporcione características seguras de interrupción. • Que desaliente acciones inconscientes en tareas que requieren vigilancia. Que exija poco esfuerzo físico Escaso esfuerzo físico: El diseño debe poder ser usado eficazmente y con el mínimo esfuerzo posible. El diseño puede ser usado eficaz y confortablemente y con un mínimo de fatiga. 7º. • Que permita que el usuario mantenga una posición corporal neutra. • Que utilice de manera razonable las fuerzas necesarias para operar. • Que minimice las acciones repetitivas. • Que minimice el esfuerzo físico continuado. Tamaño y espacio para el acceso y uso Dimensiones apropiadas: Los tamaños y espacios deben ser apropiados para el alcance, manipulación y uso por parte del usuario, independientemente de su tamaño, posición y movilidad. Que proporcione un tamaño y espacio apropiados para el acceso, alcance, manipulación y uso, atendiendo al tamaño del cuerpo, la postura o la movilidad del usuario. 9-6 • Que proporcione una línea de visión clara hacia los elementos importantes tanto para un usuario sentado como de pie. • Que el alcance de cualquier componente sea confortable para cualquier usuario sentado o de pie. • Que se acomode a variaciones de tamaño de la mano o del agarre. • Que proporcione el espacio necesario para el uso de ayudas técnicas o de asistencia personal. Accesibilidad, diseño universal y usabilidad 1.4. Usabilidad La usabilidad universal es la característica de un sistema que pretende ser utilizado por: — El tipo o tipos específicos de usuario. — La tarea o tareas que para las cuales el sistema se ha hecho. — El contexto en el que se da la interacción. El “grado de usabilidad” de un sistema es una medida empírica y relativa de la usabilidad del mismo. — Empírica porque no se basa en opiniones o sensaciones sino en pruebas (tests) de usabilidad, realizadas en laboratorio u observadas mediante trabajo de campo. — Relativa porque el resultado no es ni bueno ni malo, sino que depende de las metas planteadas o de una comparación con otros sistemas similares. El concepto de usabilidad puede referirse a “software” o “hardware”. El modelo conceptual de la usabilidad, proveniente del diseño centrado en el usuario, no está completo sin la idea utilidad. En inglés, utilidad con usabilidad es lo que se conoce como “usefulness”. La idea de Diseño Centrado en el Dato se ha discutido ampliamente en el tema 8 de este Temario. En castellano usabilidad significa capacidad de uso, es decir, la característica que distingue a los objetos diseñados para su utilización de los que no. Sin embargo, la acepción inglesa es más amplia y se refiere a la facilidad o nivel de uso, es decir, al grado en el que el diseño de un objeto facilita o dificulta su manejo. La Usabilidad es un aspecto fundamental de las aplicaciones interactivas y estratégico para definir sitios Web. Es por ello que su ponderación resulta de sumo interés dentro de la Interacción Persona Ordenador. Algunas conclusiones y casos recogidos en estudios e investigaciones: — La usabilidad demuestra reducciones del ciclo de desarrollo de los productos de 33-50% (Bosert 1991). — El 63% de todos los proyectos de desarrollo de software sobrepasan su presupuesto, siendo las cuatro causas más importantes relacionadas con usabilidad (Lederer y Prassad 1992). — El porcentaje de código que se dedica al desarrollo de la interfaz con los usuarios ha ido aumentando a lo largo de los años hasta un promedio 47-60% del conjunto de la aplicación (MacIntyre et al. 1990). — La empresa Ricoh descubrió que el 95% de los usuarios encuestados nunca utilizaban las tres características claves diseñadas para hacer más atractivo el producto, bien por desconocer su existencia, no saber cómo utilizarlas o no entenderlas (Nussbaum y Neff 1991). 9-7 Desarrollo de Sistemas — El 80% de las tareas de mantenimiento se deben a requerimientos de usuarios no previstos, quedando el resto debido a fallos y errores (Martin y McClure 1993; Pressman 1992). La Organización Internacional para la Estandarización (ISO) ofrece dos definiciones de usabilidad: — ISO/IEC 9126: “La usabilidad se refiere a la capacidad de un software de ser comprendido, aprendido, usado y ser atractivo para el usuario, en condiciones específicas de uso”. Esta definición hace énfasis en los atributos internos y externos del producto, los cuales contribuyen a su funcionalidad y eficiencia. La usabilidad depende no sólo del producto sino también del usuario. Por ello un producto no es en ningún caso intrínsecamente usable, sólo tendrá la capacidad de ser usado en un contexto particular y por usuarios particulares. La usabilidad no puede ser valorada estudiando un producto de manera aislada (Bevan, 1994). — ISO/IEC 9241: “Usabilidad es la eficiencia y satisfacción con la que un producto permite alcanzar objetivos específicos a usuarios específicos en un contexto de uso específico”. Es una definición centrada en el concepto de calidad en el uso, es decir, se refiere a cómo el usuario realiza tareas específicas en escenarios específicos con efectividad. A partir de la conceptualización llevada a cabo por la ISO, se infieren los principios básicos en los que se basa la usabilidad: — Facilidad de aprendizaje: facilidad con la que nuevos usuarios desarrollan una interacción efectiva con el sistema o producto. Está relacionada con lo predecible, la sintetización, la familiaridad, la generalización de los conocimientos previos y la consistencia. — Flexibilidad: relativa a la variedad de posibilidades con las que el usuario y el sistema pueden intercambiar información. También abarca la posibilidad de diálogo, la multiplicidad de vías para realizar la tarea, similitud con tareas anteriores y la optimización entre el usuario y el sistema. — Robustez: es el nivel de apoyo al usuario que facilita el cumplimiento de sus objetivos. Está relacionada con la capacidad de observación del usuario, de recuperación de información y de ajuste de la tarea al usuario. JAKOB NIELSEN (uno de los grandes expertos mundiales en usabilidad) fue quien definió la usabilidad en 2003 como “un atributo de calidad que mide lo fáciles de usar que son las interfaces web”. La usabilidad está muy relacionada con la accesibilidad. Otra definición es la de REDISH (2000), para quien es preciso diseñar sitios web para que los usuarios sean capaces de “encontrar lo que necesitan, entender lo que encuentran y actuar apropiadamente… dentro del tiempo y esfuerzo que ellos consideran adecuado para esa tarea”. 9-8 Accesibilidad, diseño universal y usabilidad La usabilidad parte de los principios del diseño universal o diseño para todos (vistos en el apartado anterior). La buena usabilidad puede lograrse mediante el diseño centrado en el usuario, aunque se emplean diversas técnicas. El diseñador de usabilidad proporciona un punto de vista independiente de las metas de la programación. La usabilidad incluye consideraciones como: — ¿Quiénes son los usuarios, cuáles sus conocimientos, y qué pueden aprender? — ¿Qué quieren o necesitan hacer los usuarios? — ¿Cuál es la formación general de los usuarios? — ¿Cuál es el contexto en el que el usuario está trabajando? — ¿Qué debe dejarse a la máquina? ¿Qué al usuario? — ¿Pueden los usuarios realizar fácilmente sus tareas previstas? Por ejemplo, ¿pueden los usuarios realizar las tareas previstas a la velocidad esperada? — ¿Cuánta preparación necesitan los usuarios? — ¿Qué documentación u otro material de apoyo están disponible para ayudar al usuario? ¿Puede éste hallar las respuestas que buscan en estos medios? — ¿Cuáles y cuántos errores cometen los usuarios cuando interactúan con el producto? — ¿Puede el usuario recuperarse de los errores? ¿Qué han de hacer los usuarios para recuperarse de los errores? ¿Ayuda el producto a los usuarios a recuperarse de los errores? Por ejemplo, ¿muestra el “sofware” mensajes de error informativos y no amenazantes? — ¿Se han tomado medidas para cubrir las necesidades especiales de los usuarios con discapacidades? (Es decir, ¿se ha tenido en cuenta la accesibilidad?) Ejemplos de técnicas para hallar respuesta a éstas y otras cuestiones son: análisis de requisitos enfocado al usuario, construcción de perfiles de usuarios y pruebas de usabilidad. Las pruebas de usabilidad son una forma de medir que tan bien puede una persona usar un objeto hecho por el hombre, como puede ser una página web, una interfaz de usuario, un documento o un dispositivo. Consisten en seleccionar a un grupo de usuarios de una aplicación y solicitarles que lleven a cabo las tareas para las cuales fue diseñada, en tanto el equipo de diseño, desarrollo y otros involucrados toman nota de la interacción, particularmente de los errores y dificultades con las que se encuentren los usuarios. No es necesario que se trate de una aplicación completamente terminada, pudiendo tratarse de un prototipo. Actualmente la usabilidad está reconocida como un importante atributo de calidad del “software”, habiéndose ganado un puesto entre atributos más 9-9 Desarrollo de Sistemas tradicionales como el rendimiento y la fiabilidad. Incluso diversos programas de estudios se centran en ella. También han surgido diversas empresas de consultoría de usabilidad, y las firmas tradicionales de consultoría y diseño están ofreciendo servicios similares. Entre los principales beneficios encontramos: — Reducción de los costes de aprendizaje. — Disminución de los costes de asistencia y ayuda al usuario. — Optimización de los costes de diseño, rediseño y mantenimiento. — Aumento de la tasa de conversión de visitantes a clientes de un sitio web. — Mejora la imagen y el prestigio. — Mejora la calidad de vida de los usuarios, ya que reduce su estrés, incrementa la satisfacción y la productividad. Todos estos beneficios implican una reducción y optimización general de los costes de producción, así como un aumento en la productividad. La usabilidad permite mayor rapidez en la realización de tareas y reduce las pérdidas de tiempo. 2. Acceso y usabilidad de las tecnologías, productos y servicios relacionados con la sociedad de la información En España, en un acto celebrado el 3 de diciembre de 2005 con motivo del Día Internacional de las Personas con Discapacidad, el Gobierno anunció su intención de reformar el artículo 49 de la Constitución Española para sustituir en el texto de la Carta Magna la palabra “disminuidos” por “discapacitados”. En la actualidad dice: “Los poderes públicos realizarán una política de previsión, tratamiento, rehabilitación e integración de los disminuidos físicos, sensoriales y psíquicos”. La accesibilidad es un elemento clave para las personas, sin importar que sean consideradas discapacitadas. Todos podemos necesitar acceder a la web en unas condiciones diferentes a las que el diseñador de la web cree habituales. O, dicho de otra manera, todos podemos ser, en un momento dado, discapacitados en la web. Las tecnologías de la información y la comunicación proporcionan actualmente nuevas oportunidades de inclusión. Personas con diferentes perfiles y capacidades pueden ahora, gracias a Internet, acceder a contenidos y servicios que antes quedaban fuera de su alcance. Actualmente existen 3,5 millones de personas con discapacidad en España. Sin embargo todas las personas pueden estar discapacitadas de manera temporal, por un accidente o una enfermedad, y también en estos casos el uso de Internet puede ser una necesidad que no debe verse frustrada por una mala política de accesibilidad de la web. 9-10 Accesibilidad, diseño universal y usabilidad El entorno en el que se acceda a Internet también puede limitar la capacidad del usuario para navegar en una web. Seguir las pautas de accesibilidad facilita el acceso deseado en entornos que podríamos llamar “hostiles”. Los estándares, la usabilidad y la accesibilidad quedaban a un lado ante el interés de las empresas y los usuarios por estar en Internet, en la mayoría de los casos, sin importar cómo. A pesar del trabajo de diferentes organizaciones que desde hace varios años insisten en la importancia de la accesibilidad en la web (el W3C tiene una recomendación del 5 de mayo de 1999 titulada “Pautas de Accesibilidad al Contenido en la Web 1.0”) no ha sido hasta este último año cuando parece que se ha despertado el interés de las instituciones y algunas empresas por el acceso universal a Internet. Afortunadamente, el objetivo “estar en Internet sin importar cómo”, está empezando a cambiar. Empresas y administraciones comienzan a darse cuenta la importancia del cómo y de la necesidad de que la web llegue a todo aquel que quiera usarla. Ha llegado el momento de cumplir los estándares y comprobar si los sitios web son usables y accesibles. Sin embargo, tras más de 10 años haciendo webs, generalmente teniendo poco presente la usabilidad y la accesibilidad, y con un estándar de facto marcado por el navegador dominante del momento, conseguir que todo el mundo sea consciente de esa necesidad no es fácil, sobre todo cuando requiere un cambio de mentalidad (no muy grande, pero un cambio al fin y al cabo) por parte de desarrolladores, diseñadores y responsables de proyecto. Actualmente, con la entrada en vigor de la LSSI todas las webs de las Administraciones Públicas españolas están obligadas a adoptar “las medidas necesarias para que la información disponible en sus respectivas páginas de Internet pueda ser accesible a personas con discapacidad y de edad avanzada”. Esta obligación está poniendo de relieve las graves deficiencias de accesibilidad de las webs de organismos e instituciones públicas y, de paso, también en las webs de organismos y empresas privadas. Por otro lado, ha contribuido a provocar un interés creciente por los distintos aspectos relacionados con la accesibilidad en la web. JOHN SLATING, en el Congreso Fundamentos web 2005, presentaba la accesibilidad como “una cualidad de la experiencia del usuario: el contenido es accesible cuando la gente con inhabilidades puede utilizarlo con tanta eficacia como la gente sin inhabilidades”. Según TIM BERNERS-LEE la accesibilidad “es el arte de garantizar que, tan amplia y extensamente como sea posible, los medios (como por ejemplo el acceso a la Web) estén disponibles para las personas, tengan o no deficiencias de un tipo u otro”. La definición de HASSAN y MARTÍN tiene en cuenta que la discapacidad de una persona puede estar relacionada con el entorno: “podemos definir la accesibilidad Web como la posibilidad de que un producto o servicio web pueda ser accedido y usado por el mayor número posible de personas, indiferentemente de las limitaciones propias del individuo o de las derivadas del contexto de uso.” 9-11 Desarrollo de Sistemas El validador de W3C, que permite comprobar si el código de la página sigue los estándares HTML o XHTML. De esta manera se da un paso en la accesibilidad, paso que si bien debe ser completado con el resto de normas, es muy importante y es el primero de cualquier estudio de accesibilidad. En cuanto a las herramientas propiamente de accesibilidad y en español, una de las que más información proporciona es HERA, desarrollada por la Fundación Sidar. HERA muestra los errores encontrados según la prioridad de las pautas de accesibilidad, y además permite también ver los errores integrados en el código de la página, facilitando su corrección a la vez que sugiere puntos a revisar manualmente. Es importante insistir en que las herramientas no son infalibles y, por tanto, el resultado del análisis puede validar una página que en realidad no es accesible, o indicar errores en páginas que siguen los estándares correctamente. Otra herramienta también en español, muy útil para comprobar la accesibilidad de una página, es TAW (Test de Accesibilidad Web). En este caso la presentación de los resultados es muy visual, numerando los errores según el nivel de prioridad y marcando con interrogantes los puntos a revisar a mano. El Colour Contrast Analyser de Juicy Studio es otra herramienta muy útil para desarrolladores. Da información sobre la diferencia que debe haber entre los colores del texto y del fondo de la página para que sean legibles. La extensión Web Developer para Firefox y Mozilla, que permite desactivar con facilidad la presentación de imágenes, el CSS y el JavaScript, permitiendo ver la página tal y como se vería en dispositivos sin esas características. Checky es una extensión para Firefox, Mozilla y Netscape para simular deficiencias visuales, o ver la página como la mostraría un navegador de texto. CheckIE es la versión para Internet Explorer de esta extensión, aunque, para este navegador, la barra de accesibilidad AIS es una buena alternativa, pues es capaz de simular diferentes casos de visión reducida, a la vez que proporciona abundante información sobre la página. Las herramientas de validación automática son herramientas útiles pero no bastan por sí mismas: la validación automática es sólo el primer paso de la evaluación de la accesibilidad puesto que la comprobación que realizan es limitada. Para ver si una web es realmente accesible hay que ponerla a prueba y testearla con diferentes navegadores, diferentes dispositivos y, sobre todo, con usuarios discapacitados. 2.1. Usabilidad y accesibilidad Para evaluar la accesibilidad es cada vez más frecuente valerse de técnicas y métodos usados habitualmente en el campo de la usabilidad y el diseño centrado en el usuario. Por ello cada vez más se habla de la convergencia entre usabilidad y accesibilidad. La usabilidad beneficia a la accesibilidad, pues la aplicación de las técnicas 9-12 Accesibilidad, diseño universal y usabilidad de evaluación que le son propias hace, por ejemplo, que se tengan en consideración los aspectos más relacionados con la intervención humana, como la adecuación de los textos alternativos en las imágenes, que un validador automático no puede evaluar. Pero, sobre todo, nos recuerda la necesidad de probar la web con usuarios con algún tipo de de discapacidad y así descubrir no sólo si los usuarios pueden acceder a la web y navegar por ella, sino si pueden alcanzar sus objetivos, esto es, si pueden consultar un catálogo, comprar un producto o servicio, o acceder a unos contenidos específicos. Por otro lado, la accesibilidad beneficia a la usabilidad: una web accesible es una web un poco más usable aun por el solo hecho de seguir unos estándares y estar mejor indexada por los buscadores. 3. Confidencialidad y disponibilidad de la información en puestos de usuario final La Confidencialidad, Integridad y Disponibilidad constituyen los tres principios básicos de la seguridad en el acceso a la información. La confidencialidad se refiere a la la privacidad de los datos, a la limitación en el acceso a la información a las entidades y usuarios autorizados, la integridad se refiere a la fiabilidad de los recursos de información, es decir, que los datos no hayan sido modificados inapropiadamente, ya sea por accidente o deliberadamente y la disponibilidad se refiere a la inmediatez en el acceso a los recursos de información, un sistema de información que no está disponible cuando se necesita, es casi tan malo como ninguno. El concepto de puesto de trabajo engloba tanto la ubicación física donde el usuario desempeña sus funciones diarias como los soportes de la información empleada en la actividad que se desarrolla en ese puesto de usuario: equipos de trabajo, teléfonos inteligentes, tabletas, dispositivos de almacenamiento extraíbles, impresoras, escáneres, documentación, archivadores, etc. Tanto en el ámbito público como en el privado el usuario debe custodiar la información con la que trabaja, tanto más aquella información sensible que afecta a personas o a bienes patrimoniales de la empresa. En relación con los equipos informáticos el usuario debe respetar los procedimientos previstos en las políticas de su organización. Pongamos en consideración algunas prácticas indebidas a modo de ejemplos ilustrativos de “mala praxis”: — El usuario conecta un portátil no corporativo de uso su particular y doméstico en la red de su empresa con el servidor DHCP activado, lo que provoca un caos de direccionamiento IP y caída de la red. — Debido a la falta de gestión adecuada en los permisos de administración en los equipos de trabajo, un usuario instala en su equipo una aplicación de P2P. Al ponerla en marcha, comparte por error con la red un directorio de su equipo donde almacena información corporativa sensible. — Un usuario detiene el antivirus corporativo porque según indica le impide trabajar. Más tarde, ejecuta un archivo que le llega por correo electrónico, infectando su equipo y toda la red de la empresa. 9-13 Desarrollo de Sistemas — Un usuario tira a la papelera los CV del último proceso de selección, que acaban en un contenedor y son recogidos por una tercera persona. — Un usuario copia en un pendrive documentación confidencial de la oferta para concursar en una obra para un conocido edificio público, con la intención de continuar trabajando en casa. El pendrive se pierde en el autobús, con información de planos, oferta económica, etc. Alguien lo encuentra y los planos terminan publicándose en prensa. — Un usuario instala en su equipo una versión “pirata” de un programa de edición de video. Éste lleva asociado un ejecutable para la generación del número de serie. Aunque el antivirus le alerta del peligro, lo desactiva temporalmente para continuar. Al ejecutarlo, instala en su equipo un control remoto que es utilizado por un atacante para extenderse a otros equipos y realizar ataques de denegación de servicio contra grandes organizaciones. — Un servidor de correo electrónico que está en una empresa no dispone de las medidas de seguridad adecuadas y termina siendo comprometido y utilizado por los atacantes para campañas de SPAM, Phishing, etc. Este hecho, además del daño a terceros que puede causar y de las implicaciones legales que pueda tener por formar parte de la cadena del delito, nos incluirá en muchos casos en la mayoría de listas negras de los sistemas antispam. Esta situación provoca que nuestro correo legítimo sea considerado como SPAM, lo que nos creará un trastorno al impedir comunicarnos con terceros de manera habitual. Las medidas de seguridad que podemos aplicar para mantener las buenas prácticas en la gestión de la información en el puesto de trabajo son diversas y de diferente grado de complejidad aunque la primera y fundamental medida es implantar una política de seguridad dentro de la organización que transmita a los empleados las obligaciones y procedimientos en relación con la seguridad de la información donde se incluirán los siguientes aspectos: 9-14 — La obligación de mantener la confidencialidad en relación con cualquier información a la que el empleado tenga acceso durante su trabajo en la empresa, de manera indefinida. Esto debe aplicarse tanto a información confidencial como a datos de carácter personal, y debe ir acompañado de un compromiso de confidencialidad. — La obligación de notificar de cualquier incidente de seguridad relacionado con el puesto de trabajo, como por ejemplo: • Alertas de virus/malware generadas por el antivirus. • Llamadas sospechosas recibidas pidiendo información sensible. • Correos electrónicos que contengan virus. • Pérdida de dispositivos móviles: portátiles, smartphones o tabletas, USBs, CDs/DVDs, etc. Accesibilidad, diseño universal y usabilidad • Cualquier actividad sospechosa que pueda detectar en su puesto de trabajo. • Borrado accidental de ficheros. • Alteración accidental de datos o registros en las aplicaciones con información crítica. • Comportamientos anómalos de los sistemas de información. • Hallazgo de información en ubicaciones no designadas para ello. • Evidencia o sospecha de acceso físico de personal no autorizado, a áreas de acceso restringido (CPD’s, despachos, almacenes,…). • Evidencia o sospecha de accesos no autorizados a sistemas informáticos o información confidencial por parte de terceros. — La prohibición de publicar o compartir contraseñas. Las claves son elementos confidenciales y deben permanecer en secreto, ya que sólo así se puede garantizar la confidencialidad y trazabilidad de las acciones. Por tanto, no deben compartirse ni apuntarse en documentos ni en cualquier otro tipo de soporte. — La obligación de bloquear la sesión al ausentarse del puesto de trabajo. Dejar un equipo sin protección durante el almuerzo, la comida, o incluso por la noche, es equivalente a no utilizar contraseña de acceso. Debe ser notificado al usuario cómo puede bloquear su equipo de manera sencilla. Asimismo, debemos indicar al empleado que debe apagar su equipo al acabar la jornada laboral. Además, nuestro departamento de TI deberá establecer las políticas de seguridad técnicas adecuadas para que el bloqueo del puesto de trabajo se realice de manera automática tras un tiempo prudencial sin actividad en el equipo. — Realizar un uso adecuado de los medios de almacenamiento extraíble. La utilización de pendrives y discos duros externos es una práctica habitual que conlleva un alto riesgo de pérdida y robo de información. No obstante, en caso de que sea necesaria su utilización, debemos transmitir al empleado la necesidad de aplicar ciertas precauciones como utilizar mecanismos de cifrado que impidan el acceso a la información en caso de pérdida. — Prohibición a la alteración de la configuración del equipo y la instalación de aplicaciones no autorizadas. El usuario final debe ser disuadido de modificar los dispositivos corporativos: equipos de sobremesa, portátiles, móviles o tabletas para instalar nuevas aplicaciones o modificar la configuración del sistema. En caso de ser necesaria la instalación de una aplicación o modificar la configuración original del equipo, ésta debe ser solicitada al personal de informática. — La obligación de destruir la documentación mediante mecanismos seguros. Debemos poner a disposición de los usuarios destructoras de papel que los usuarios deben utilizar para la destrucción de aquella documentación obsoleta o que no sea necesaria. 9-15 Desarrollo de Sistemas — La obligación de no abandonar documentación en las impresoras o escáneres. Es frecuente que un usuario envíe un documento a la impresora y lo recoja más tarde, o que lo imprima a través de la impresora de otro departamento, por cuestiones técnicas, mayor calidad o funcionalidades especiales (impresión en color, tamaño A3, etc.), durante ese tiempo la documentación permanece a disposición de otros usuarios, que pueden recogerla accidental o intencionadamente. — Normativa de utilización de Internet y el correo electrónico corporativo. Debemos trasladar a los usuarios bajo qué condiciones y circunstancias puede utilizarse Internet y el correo corporativo, así como las posibles sanciones y acciones a llevar en caso de detectarse un mal uso. En concreto, los empleados deben ser notificados de que Internet y el correo electrónico deben utilizarse de manera responsable y para la actividad laboral, y que se tomarán acciones en caso de detectarse mala fe. Las medidas planteadas en la política y normativas de seguridad deben trasladarse a los usuarios de la manera adecuada y recordarse mediante comunicaciones de manera periódica, y firmarse al comienzo de la relación laboral. Ni la política ni las normativas deben trasladarse al usuario como un descargo de responsabilidad de la empresa o como un medio con el fin exclusivo de adoptar medidas disciplinarias. Las principales consecuencias de una fuga o pérdida de información por negligencia son siempre para la empresa. Deben llevarse a cabo programas periódicos de concienciación que adopten un enfoque práctico y que trasladen la importancia de las medidas comunicadas. Las medidas organizativas deben complementarse con medidas técnicas. Éstas mejoran la eficacia, dificultan la realización de acciones dañinas e impiden la violación de las medidas organizativas. Citamos algunas de las medidas técnicas a continuación: 9-16 — Implantar una política de contraseñas robusta a nivel del sistema, tanto para el acceso al sistema operativo como a las aplicaciones. Esto evita que algunos usuarios escojan claves demasiado sencillas o repitan la misma clave durante mucho tiempo. — Implantar y configurar un antivirus para todos los equipos de la empresa, incluyendo los dispositivos móviles. — Configurar los sistemas para la actualización automática del sistema operativo y las aplicaciones. — Limitar la utilización de usuarios genéricos. Los usuarios genéricos impiden la posibilidad de llevar la trazabilidad de las acciones realizadas, además de que dificultan saber si puede haber una persona no autorizada utilizando un sistema. — Limitar los permisos de administración. Un usuario que tiene en su equipo local privilegios de administración supone un riesgo potencial por lo que los usuarios habituales no deben tener permisos de Accesibilidad, diseño universal y usabilidad administración. El usuario «Administrador» debe estar en posesión de personal técnico. — Configurar el bloqueo de sesión por inactividad en sistemas y aplicaciones. Aunque el acceso a un equipo se realice con contraseña, si la sesión permanece abierta en aquellos momentos en los que el usuario no está trabajando con el equipo, la medida pierde mucha eficacia. — Restringir los puertos USB a puestos determinados ya que son elementos de poco tamaño que pueden sacarse fácilmente de una organización y su reducido tamaño los hace muy proclives a ser perdidos. Estas restricciones podrían aplicarse también a otro tipo de “interfaces” como CD, DVD, tarjetas de almacenamiento de SD, etc. — Adquirir destructoras de documentación. Debemos adquirir dispositivos que nos permitan destruir la documentación sensible. — Limitar la navegación a páginas de ciertos contenidos. El acceso a determinados sitios web puede conducir a la infección por virus, tener repercusiones legales o afectar a la imagen de la empresa. — Habilitar mecanismos de seguridad en la impresión de documentos. Si el tamaño o la disposición de nuestra organización facilita que los documentos residan en la impresora durante un tiempo hasta que son recogidos, se deben establecer mecanismos de seguridad, tales como el uso de tarjetas o códigos personales antes de la impresión. — Limitar el acceso a la red corporativa a los equipos que no estén debidamente protegidos. La conexión de determinados dispositivos a la red como smartphones personales, equipos de proveedores o portátiles de personal esporádico pueden implicar un serio riesgo de infección por virus, entre otras amenazas. — Es imprescindible que la Wifi esté debidamente configurada para el caso en que la conexión a la red corporativa se realice a través de ella. Por ello debemos cifrar el canal para garantizar la seguridad de la información que se trasmita. 9-17 Tema 10 Herramientas CASE: características. Repostorios: estructura y actualización. Generación de código y documentación. Programas para control de versiones. Desarrollo de Sistemas Guión-resumen 1. Herramientas CASE 1.1. Introducción 2. Repositorio. Estructura y actualización. 1.2. Características 3. Generación de código y documentación 1.3. Componentes de una Herramienta CASE 4. Programas para control de versiones 1.4. Clasificación de las Herramientas CASE Nota: a pesar de que el programa habla de “Repostorios”, entendemos que se refiere a los “Repositorios”, y así utilizamos este término en el desarrollo del epígrafe correspondiente. 10-2 Herramientas CASE 1. Herramientas CASE 1.1. Introducción Una herramienta CASE (Computer Aided Software Engineering, Ingeniería de Software Asistida por Ordenador) es un producto destinado a apoyar una o más actividades de la ingeniería de software. La ingeniería de sistemas asistida por ordenador es la aplicación de tecnología informática a las actividades, las técnicas y las metodologías propias de desarrollo, su objetivo es acelerar el proceso para el que han sido diseñadas, en el caso de CASE para automatizar o apoyar una o más fases del ciclo de vida del desarrollo de sistemas. Las Herramientas CASE son diversas aplicaciones informáticas destinadas a aumentar la productividad en el desarrollo de software reduciendo el coste de las mismas en términos de tiempo y de dinero. Estas herramientas nos pueden ayudar en todos los aspectos del ciclo de vida de desarrollo del software en tareas como el proceso de realizar un diseño del proyecto, cálculo de costes, implementación de parte del código automáticamente con el diseño dado, compilación automática, documentación o detección de errores entre otras. Entre las definiciones de CASE nos podemos encontrar: — “CASE es la automatización del software”. — “CASE es una filosofía que se orienta a la mejor comprensión de los modelos de empresa, sus actividades y el desarrollo de los sistemas de información. Esta filosofía involucra además el uso de programas que permiten: — • Construir los modelos que describen la empresa, • Describir el medio en el que se realizan las actividades, • Llevar a cabo la planificación, • El desarrollo del Sistema Informático, desde la planificación, pasando por el análisis y diseño de sistemas, hasta la generación del código de los programas y la documentación.” “La creación de software utilizando técnicas de diseño y metodologías de desarrollo bien definidas, soportadas por herramientas automatizadas operativas en el ordenador”. La idea del CASE es la de ordenar y facilitar el desarrollo del software en virtud de reglas consistentes, con documentación coherente y actualizada, auxiliada por un diseño más o menos visual, pero integrado, que sea capaz de convertirse en código, disminuyendo o eliminando el código erróneo, basado en la consistencia de los objetos integrados, siguiéndolos hasta su implementación. Las herramientas CASE en sí, son un conjunto de métodos, utilidades y técnicas que facilitan la automatización del ciclo de vida del desarrollo del sis10-3 Desarrollo de Sistemas tema de información, completamente o en algunas fases. Una herramienta CASE suele incluir: — Un diccionario de datos para almacenar información sobre los datos de la aplicación de bases de datos. — Herramientas de diseño para dar apoyo al análisis de datos. — Herramientas que permitan desarrollar el modelo de datos corporativo, así como los esquemas conceptual y lógico. — Herramientas para desarrollar los prototipos de las aplicaciones. Existen otros nombres que se le dan a este tipo de herramientas, y que no es una clasificación excluyente entre sí, ni con la anterior: 10-4 — Integrated CASE (I-CASE), herramientas que engloban todo el proceso de desarrollo software, desde análisis hasta implementación. — MetaCASE, herramientas que permiten la definición de nuestra propia técnica de modelado, los elementos permitidos del metamodelo generado se guardan en un repositorio y pueden ser usados por otros analistas. — CAST (Computer-Aided Software Testing), herramientas de soporte a la prueba de software. — IPSE (Integrated Programming Support Environment), herramientas que soportan todo el ciclo de vida, incluyen componentes para la gestión de proyectos y gestión de la configuración. Herramientas CASE 1.2. Características El objetivo más importante a través del uso de estas herramientas es conseguir la generación automática de programas. La tecnología CASE supone la automatización del desarrollo del software, contribuyendo a mejorar la calidad y la productividad en el desarrollo de sistemas de información. Entre sus características tenemos: — Facilitar el control de cambios. Simplificar el mantenimiento de los programas. — Aumentar la productividad en el desarrollo y mantenimiento del software. — Mejorar la calidad del software. Automatizar el desarrollo del software, documentación, generación de código, chequeo de errores y gestión del proyecto. — Disminuir el tiempo de entrega de código. — Reducir el coste de desarrollo y mantenimiento de los sistemas informáticos. — Mejorar la gestión y dominio sobre el proyecto en cuanto a su planificación, ejecución y control. — Aumentar la biblioteca de conocimiento informático de una empresa ayudando a la búsqueda de soluciones para los requisitos. — Permitir a la reutilización (reusabilidad). — Disminuir de duración de los ciclos de desarrollo. Gestión global en todas las fases de desarrollo de software con una misma herramienta. — Facilitar el uso de las distintas metodologías propias que desarrollan la propia ingeniería del software. — Realizar un análisis de impacto. — Facilitar la utilización de las distintas metodologías. Permitir la aplicación práctica de metodologías estructuradas, las cuales al ser realizadas con una herramienta se consigue agilizar el trabajo. — Proporcionar topologías de aplicación flexibles. La herramienta debe proporcionar facilidades de construcción que permita separar la aplicación (en muchos puntos diferentes) entre el cliente, el servidor y, más importante, entre servidores. — Aumentar la portabilidad de las aplicaciones. Se debe de proporcionar aplicaciones portátiles generando código para todas las plataformas de servidores conocidas. Debe ser capaz de desplegar la versión correcta del código en la máquina apropiada. — Versionamiento. Brindar un Control de versión. La herramienta debe reconocer las versiones de códigos que se ejecutan en los clientes y servidores, y asegurarse que sean consistentes. 10-5 Desarrollo de Sistemas — Crear código compilado en el servidor. La herramienta debe ser capaz de compilar automáticamente código 4GL en el servidor para obtener el máximo performance. — Dar un Soporte multiusuario. La herramienta debe permitir que varios diseñadores trabajen en una aplicación simultáneamente. Debe gestionarse los accesos concurrentes a la base de datos por diferentes usuarios, mediante el arbitrio y bloqueos de accesos a nivel de archivo o de registro. — Utilizar nombres y definiciones únicas y coherentes. — Ofrecer Seguridad. La herramienta debe proporcionar mecanismos para controlar el acceso y las modificaciones a los que contiene. La herramienta debe, al menos, mantener contraseñas y permisos de acceso en distintos niveles para cada usuario. También debe facilitar la realización automática de copias de seguridad y recuperaciones de las mismas, así como el almacenamiento de grupos de información determinados, por ejemplo, por proyecto o aplicaciones. — Facilitar la realización de prototipos y el desarrollo conjunto de aplicaciones. — Mejorar y estandarizar la documentación. — Facilitar la reutilización de componentes software. Trabajar con una variedad de software intermedio. La herramienta debe adaptar sus comunicaciones cliente / servidor al software intermedio existente. — Permitir un desarrollo y un refinamiento visual de las aplicaciones, mediante la utilización de gráficos. — La herramienta debe ser capaz de controlar un gran número de tipos de objetos incluyendo texto, gráficos, mapas de bits, documentos complejos y objetos únicos, tales como definiciones de pantallas y de informes, archivos de objetos y datos de prueba y resultados. — Trabajar con una variedad de administradores de recurso. La herramienta debe adaptarse ella misma a los administradores de recurso que existen en varios servidores de la red; su interacción con los administradores de recurso debería ser negociable a tiempo de ejecución. — Desarrollo en equipo, repositorio de librerías compartidas. Debe permitir que grupos de programadores trabajen en un proyecto común. 1.3. Componentes de una Herramienta CASE De una forma esquemática podemos decir que una herramienta CASE se compone de los siguientes elementos: — 10-6 Repositorio (diccionario) donde se almacenan los elementos definidos o creados por la herramienta, y cuya gestión se realiza median- Herramientas CASE te el apoyo de un Sistema de Gestión de Base de Datos (SGBD) o de un sistema de gestión de ficheros. — Meta modelo (no siempre visible), que constituye el marco para la definición de las técnicas y metodologías soportadas por la herramienta. — Carga o descarga de datos, son facilidades que permiten cargar el repertorio de la herramienta CASE con datos provenientes de otros sistemas, o bien generar a partir de la propia herramienta esquemas de base de datos, programas, etc., que pueden, a su vez, alimentar otros sistemas. Este elemento proporciona así un medio de comunicación con otras herramientas. — Comprobación de errores, facilidades que permiten llevar a cabo un análisis de la exactitud, integridad y consistencia de los esquemas generados por la herramienta. — Interfaz de usuario, que constará de editores de texto y herramientas de diseño gráfico que permitan, mediante la utilización de un sistema de ventanas, iconos y menús, con la ayuda del ratón, definir los diagramas, matrices, etc., que incluyen las distintas metodologías. 1.4. Clasificación de las Herramientas CASE CASE es una combinación de herramientas software (aplicaciones) y de metodologías de desarrollo: — Las herramientas permiten automatizar el proceso de desarrollo del software. — Las metodologías definen los procesos automatizar. Algunas de las herramientas son: Smartdraw G, DFD, Visio, Visible analyst, Case estudio, Easy case, Gerwin, fcs demo, Gannt project, Project. No existe una única clasificación de herramientas CASE y, en ocasiones, es difícil incluirlas en una clase determinada. Podrían clasificarse atendiendo a: — Las plataformas que soportan. — Las fases del ciclo de vida del desarrollo de sistemas que cubren. — La arquitectura de las aplicaciones que producen. — Su funcionalidad. — Su uso. Clasificación del CASE considerando su amplitud: — TOOLKIT: es una colección de herramientas integradas que permiten automatizar un conjunto de tareas de algunas de las fases del 10-7 Desarrollo de Sistemas ciclo de vida del sistema informático: Planificación estratégica, Análisis, Diseño, Generación de programas. — WORKBENCH: Son conjuntos integrados de herramientas que dan soporte a la automatización del proceso completo de desarrollo del sistema informático. Permiten cubrir el ciclo de vida completo. El producto final aportado por ellas es un sistema en código ejecutable y su documentación. Clasificación teniendo en cuenta las fases del ciclo de vida que automatizan: — UPPER CASE: Planificación estratégica, Requerimientos de Desarrollo Funcional de Planes Corporativos. — MIDDLE CASE: Análisis y Diseño. — LOWER CASE : Generación de código, test e implantación Por funcionalidad podríamos diferenciar algunas como: — Herramientas de generación semiautomática de código. — Editores UML. — Herramientas de Refactorización de código. — Herramientas de mantenimiento como los sistemas de control de versiones. Clasificación de las herramientas CASE según su uso: — 10-8 Herramientas de la ingeniería de la información. El objetivo primordial de las herramientas de esta categoría consiste en representar objetos de datos de negocios, sus relaciones, y ayuda a comprender mejor la forma en que fluyen estos objetos de datos entre distintas zonas de negocio en el seno de la compañía. Herramientas CASE — Modelado de procesos y herramientas de administración. Se utilizan para representar los elementos clave del proceso de modo que sea posible entenderlo mejor. — Herramientas de planificación de proyectos. Las herramientas de esta categoría se concentran en dos áreas primordiales: Estimación de esfuerzos de proyecto y de costes de software y Planificación de proyectos. — Herramientas de análisis de riesgos. Las herramientas de análisis de riesgos capacitan al administrador el proyecto para construir una tabla de riesgos proporcionando una guía detallada en la identificación y análisis de riesgos. — Herramientas de administración de proyectos. La planificación del proyecto y el plan del proyecto deben seguirse y de monitorizarse de forma continua. Las herramientas de esta categoría suelen ser extensiones de herramientas de planificación de proyectos. — Herramientas de seguimiento de requisitos. El objetivo de las herramientas de seguimiento de requisitos es proporcionar un enfoque sistemático para el aislamiento de requisitos, comenzando por las especificaciones del cliente. — Herramientas de métricas y gestión. Las herramientas métricas actuales se centran en procesos, proyectos y características del producto. Las herramientas orientadas a la gestión capturan métricas específicas del proyecto que proporcionan una indicación global de productividad o de calidad. — Herramientas de documentación. Las herramientas de producción de documentos y autoedición prestan su apoyo a casi todos los aspectos de la ingeniería del software. — Herramientas de software de sistema. CASE es una tecnología de estaciones de trabajo. Por tanto, el entorno CASE debe adaptase a un software de sistema en redes de alta calidad, al correo electrónico, a los boletines electrónicos y a otras capacidades de comunicaciones. — Herramientas de control de calidad. La mayor parte de las herramientas CASE que afirman que tiene como principal interés el control de calidad son en realidad herramientas métricas que hace una auditoría del código fuente para determinar si es justa o no a ciertos estándares del lenguaje. — Herramientas de gestión como base de datos. El software de gestión de bases de datos sirve como fundamentos para establecer una base de datos CASE. Dado el énfasis acerca de los objetos de configuración, las herramientas de gestión de bases de datos para CASE pueden evolucionar a partir de los sistemas de gestión de bases de datos relacionales (SGBDR) para transformarse en sistemas de gestión de bases de datos orientadas a objetos (SGBDOO). — Herramientas de codificación de cuarta generación. 10-9 Desarrollo de Sistemas — Herramientas de mantenimiento. Estas herramientas están limitadas a lenguajes de programación específicos y requieren cierto grado de interacción con el ingeniero de software. La categoría de herramientas de mantenimiento puede subdividirse de la siguiente forma: • Herramientas de ingeniería inversa a especificaciones, • Herramientas de reestructuración y análisis de código, • Herramientas interactivas de reingeniería de sistema. — Herramientas de gestión de configuración de software. Las herramientas pueden ofrecer su asistencia en las cinco tareas principales de GCS: identificación, control de versiones, control de cambios, auditorias y contabilidad de estados. — Herramientas de análisis y diseño. Las herramientas de análisis y diseño capacitan al ingeniero del software para crear modelos del sistema que haya que construir. — Herramientas pro/sim. Las herramientas PRO/SIM (de prototipos y simulación) proporcionan al ingeniero del software la capacidad de predecir el comportamiento de un sistema en tiempo real antes de llegar a construirlo. — Herramientas de desarrollo y diseño de interfaz. Las herramientas de desarrollo y diseño de interfaz son en realidad un conjunto de primitivas de componente de programas tales como menús, botones, estructuras de ventanas, iconos, mecanismos de desplazamiento, controladores de dispositivos, etc. — Herramientas de generación de prototipos. Se puede utilizar toda una gama de herramientas de generación de prototipos. Los generadores de pantallas permiten al ingeniero de software definir rápidamente la disposición de pantalla para aplicaciones interactivas. — Herramientas de programación. La categoría de herramientas de programación abarca los compiladores, editores y depuradores que están disponibles para prestar su apoyo en la mayoría de los lenguajes de programación convencionales. — Herramientas de integración y comprobación. — Herramientas de análisis estático. Se utilizan tres tipos distintos de herramientas estáticas: herramientas de comprobación basadas en código, lenguajes de comprobación especializados, y herramientas de comprobación basadas en requisitos. — Herramientas de análisis dinámico. Las herramientas de análisis dinámico interactúan con un programa que se esté ejecutando, comprueban la cobertura de rutas, comprueban las afirmaciones acerca del valor de variables especificas y, en general, instrumentan el flujo de ejecución del programa. 10-10 Herramientas CASE 2. — Herramientas de gestión de comprobación. Se utilizan para comprobar y coordinar la comprobación de software para cada uno de los pasos principales de comprobación. — Herramientas de comprobación clientes/servidor. En el entorno C/S exista, unas herramientas de comprobación especializadas que ejercitan la interfaz gráfica de usuario y los requisitos de comunicaciones en red para el cliente y el servidor. — Herramientas de reingeniería. La categoría de herramientas de reingeniería se pueden subdividir en las funciones siguientes: • Herramientas de ingeniería inversa para producir especificaciones. • Herramientas de reestructuración y análisis de código. • Herramientas de reingeniería para sistemas en línea. Repositorio. Estructura y actualización. “Lugar donde se guarda algo”, en latín repositorium, que significaba armario, alacena. Un repositorio, depósito o archivo es un sitio centralizado donde se almacena y mantiene información digital, habitualmente bases de datos, archivos de texto, imágenes, audio, vídeo... Es un almacén centralizado donde se mantiene información, está preparado para distribuirse a través de una red informática como Internet o en un medio físico como un disco compacto. Es un conjunto de servicios para gestionar y difundir los materiales digitales producidos a través del autoarchivo. Es un término utilizado en el dominio de las herramientas CASE. El repositorio podría definirse como la base de datos fundamental para el diseño; no sólo guarda datos, sino también algoritmos de diseño y, en general, elementos software necesarios para el trabajo de programación. Pueden ser de acceso público, o pueden estar protegidos y necesitar de una autentificación previa, con la posibilidad de preservar la propiedad intelectual por medio de licencias abiertas. Los repositorios más conocidos son los de carácter académico y los institucionales. Los repositorios suelen contar con sistemas de backup y mantenimiento preventivo y correctivo, lo que hace que nuestra información se pueda recuperar en el caso de que nuestro ordenador quede inutilizable. Entre los principales beneficios cabe destacar que la publicación en abierto, al facilitar el acceso de forma libre en Internet, reporta un mayor impacto de los trabajos y una mayor visibilidad. Aseguran la preservación a largo plazo de los documentos generados, a pesar de los posibles cambios de formatos que pueda haber en el futuro (migración) y la persistencia de los datos mediante un identificador único. 10-11 Desarrollo de Sistemas Un repositorio puede ser un lugar donde múltiples bases de datos o ficheros están localizados para ser distribuidos sobre una red de ordenadores. La estructura de un repositorio se basa en alguna de las siguientes tipologías: — Repositorios de eprints y temáticos. Contienen documentos de un mismo tema, usualmente artículos científicos. — Repositorios de materiales académicos. No contiene sólo documentos científicos arbitrados, sino que alberga todo tipo de materiales que apoyen la enseñanza y el aprendizaje, que pueden o no corresponder al mismo tema. — Repositorios de objetos de aprendizaje. Basan su contenido en unidades de aprendizaje que tienen como principal objetivo transmitir un conocimiento concreto y, técnicamente, estos contenidos pueden ser fácilmente reutilizables en otras aplicaciones. — Repositorios institucionales. Incluyen material académico diverso, tendiendo a ser organizados por una institución más que por áreas temáticas. Como tipos de nos podemos encontrar: — Repositorios de metadatos. Contienen sólo los metadatos de los objetos — Repositorios de recursos. Contienen tanto los objetos con su contenido como los metadatos 10-12 Herramientas CASE 3. Generación de código y documentación Un generador de código permite agilizar el desarrollo de aplicaciones. La generación de código se ha convertido en una necesidad para la mayoría de los programadores durante el desarrollo de software. Numerosas herramientas conocidas como CASE permiten la generación automática de código a partir de diagramas o modelos. La capacidad de abstracción nos permite trabajar en el mundo de las ideas y conocer en términos de clases y relaciones lo que en el mundo real consideramos y aceptamos como objetos y las relaciones entre ellos. Los programadores han logrado interpretar los modelos para construir herramientas adecuadas, ya que al automatizar este trabajo aumenta de modo apreciable la productividad En la actualidad existen numerosas alternativas para disminuir la carga laboral de los programadores, sobre todo, la generación automática de código, permite este propósito. Una gran cantidad de herramientas soportan UML, muchas de ellas tienen las características que reducen significativamente el trabajo de los programadores, lo que las hace ser consideradas Herramientas CASE. La clasificación actual de los lenguajes de programación cita a los de cuarta generación (4GL) que incorporan planillas electrónicas, administradores de bases de datos, generadores de informes, de gráficos, paquetes con parámetros orientados a alguna área del conocimiento (Estadística, Programación Lineal, manejo de datos ecológicos). Se distinguen aquí de cuarta generación completos, como los generadores de aplicaciones del computador, y los lenguajes para el desarrollo de aplicaciones del computador en la Organización. Un 4GL es un lenguaje no procedural: el usuario define qué se debe hacer, no cómo debe hacerse. Los de quinta generación se encuentran en pleno desarrollo y en ellos están los lenguajes para la creación de los sistemas expertos y, en general, los lenguajes usados para el desarrollo y aplicación de Inteligencia Artificial. Los PC aprenderán de sus errores, se auto-mejorarán, 10-13 Desarrollo de Sistemas reconocerán órdenes incompletas y crearán sus propios procedimientos (subrutinas) para llevar a cabo algunas de sus decisiones. Los lenguajes de cuarta generación abarcan: — Lenguajes de presentación, como lenguajes de consultas y generadores de informes. — Lenguajes especializados, como hojas de cálculo y lenguajes de bases de datos. — Generadores de aplicaciones que definen, insertan, actualizan y obtienen datos de la base de datos. — Lenguajes de muy alto nivel que se utilizan para generar el código de la aplicación. 10-14 • Un generador de formularios (Forms Generators), es una herramienta interactiva que permite crear rápidamente formularios de pantalla para introducir o visualizar datos. Los generadores de formularios permiten que el usuario defina el aspecto de la pantalla, qué información se debe visualizar y en qué lugar de la pantalla debe visualizarse. Algunos generadores de formularios permiten la creación de atributos derivados utilizando operadores aritméticos y también permiten especificar controles para la validación de los datos de entrada. Los generadores de “Forms” en algunos casos manejan iteraciones online con los usuarios de la aplicación o bien crean un programa para que manejen esta iteración. • Un generador de informes (Report Generators) es una herramienta para crear informes a partir de los datos almacenados en la base de datos. Se parece a un lenguaje de consultas en que permite al usuario hacer preguntas sobre la base de datos y obtener infor- Herramientas CASE mación de ella para un informe. Sin embargo, en el generador de informes se tiene un mayor control sobre el aspecto de la salida. Se puede dejar que el generador determine automáticamente el aspecto de la salida o se puede diseñar ésta para que tenga el aspecto que desee el usuario final. Los generadores de reportes toman una descripción del formato y el reporte a generar, y de ahí pueden generar el reporte de forma directa, o bien un programa que genere el reporte. • Un generador de gráficos es una herramienta para obtener datos de la base de datos y visualizarlos en un gráfico mostrando tendencias y relaciones entre datos. Normalmente se pueden diseñar distintos tipos de gráficos: barras, líneas, etc. • Un generador de aplicaciones es una herramienta para crear programas que hagan de interface entre el usuario y la base de datos. El uso de un generador de aplicaciones puede reducir el tiempo que se necesita para diseñar un programa de aplicación. Los generadores de aplicaciones constan de procedimientos que realizan las funciones fundamentales que se utilizan en la mayoría de los programas. Estos procedimientos están escritos en un lenguaje de programación de alto nivel y forman una librería de funciones entre las que escoger. El usuario especifica qué debe hacer el programa y el generador de aplicaciones es quien determina cómo realizar la tarea. • Los Ambientes de Cuarta Generación (Fourth Generation Environments) se encargan de generar todo un sistema a partir de las salidas de herramientas CASE, pantallas, reportes y además posiblemente de la especificaron de algún proceso lógico adicional. • Los Administradores de Datos (Data Management) proveen comandos para la manipulación de datos, selecciones de casos y documentación de datos en la preparación de la información para análisis estadísticos y reportes. Entre ellos se encuentran SAS, SPSS y Stata. Los lenguajes de cuarta generación tienen relación con Herramientas Case (HC): 4. — Los lenguajes de cuarta generación comparten con las Herramientas Case el objetivo de la cercanía al usuario. — Las Herramientas Case cubren el espacio entre el usuario y el lenguaje de cuarta generación. — Generación de código 4GL automáticamente. Programas para control de versiones El control de versiones proporciona un registro los cambios realizados sobre un archivo o conjunto de archivos a lo largo del tiempo, de modo que se puedan recuperar versiones previas. Cualquier tipo de archivo puede poner10-15 Desarrollo de Sistemas se bajo control de versiones aunque nos referiremos en concreto a aplicaciones para gestionar los cambios en el código fuente de programas y poder recuperarlos, este ámbito ha sido superado pasando del concepto control de versiones al de gestión de configuración de software. Entre los sistemas de control de versiones locales (para un solo ordenador) uno de los más populares es RCS (Revision Control System), que basa su funcionamiento en la creación de “parches” (diferencias entre archivos) de una versión a otra para poder recuperar cómo era un archivo en cualquier momento previo. Inicialmente la gestión de versiones estaba orientada a ficheros individuales, de forma que como hace RCS se almacena la última versión y las diferencias con la anterior, lo que permite acceder rápidamente a la versión original. RCS automatiza las tareas de guardar, recuperar, registrar, identificar y mezclar versiones de archivos siendo apropiado para archivos que son modificados frecuentemente. Esta aplicación hace uso de la herramienta diff. RCS opera exclusivamente con archivos individuales, no siendo posible el trabajo multiusuario, aunque en escenarios de monousuario RCS es una buena opción por su simplicidad. Otra solución en la categoría local fue Source Code Control System (SCCS), que formó parte de Unix; está basado en diferencias entrelazadas, que permiten construir versiones como un conjunto de subrevisiones. En los sistemas de control de versiones centralizados existe un repositorio centralizado de todo el código y el objetivo se centra en permitir la colaboración de diferentes desarrolladores entre si que interactúan en red. De entre los sistemas de control de versiones centralizados (Centralized Version Control Systems) soluciones como CVS, Subversion, y Perforce, tienen un único servidor que contiene todos los archivos versionados, y los clientes acceden concurrentementa al dicho servidor central. Los clientes pueden comparar diferentes versiones de archivos, solicitar una historia completa de los cambios, o sacar una "foto" histórica del proyecto tal como se encontraba en una fecha determinada o en un número de revisión determinado. Dentro de esta modalidad de modelo cliente-servidor podemos enumerar productos abiertos (código fuente disponible) y propietarios (comerciales). Código abierto: Concurrent Versions System (CVS): basado originalmente en RCS, licenciado mediante GPL, CVSNT, OpenCVS, Subversion. Propietario: AccuRev, CA SCM, Autodesk Vault, ClearCase, codeBeamer, MKS Integrity, Perforce, Quma Version Control System (QVCS) (solución para Windows de muy bajo coste), SourceAnywhere, Vault, Visual SourceSafe (herramienta de control de versiones de Microsoft, Visual Studio Team Foundation Server (orientada a Plataforma Microsoft .Net). 10-16 Herramientas CASE Existen dos esquemas básicos de funcionamiento para que los usuarios puedan ir aportando sus modificaciones: — De forma exclusiva: en este esquema para poder realizar un cambio es necesario comunicar al repositorio el elemento que se desea modificar y el sistema se encargará de impedir que otro usuario pueda modificar dicho elemento. Una vez hecha la modificación, esta se comparte con el resto de colaboradores. Si se ha terminado de modificar un elemento entonces se libera ese elemento para que otros lo puedan modificar. — De forma colaborativa: en este esquema cada usuario modifica la copia local y cuando el usuario decide compartir los cambios el sistema automáticamente intenta combinar las diversas modificaciones. El principal problema es la posible aparición de conflictos que deban ser solucionados manualmente o las posibles inconsistencias que surjan al modificar el mismo fichero por varias personas no coordinadas. Los Sistemas de control de versiones distribuidos (Distributed Version Control Systems o DVCS) disponen que cada usuario tenga su propio repositorio. Los distintos repositorios pueden intercambiar y mezclar revisiones entre ellos. Es frecuente el uso de un repositorio, que está normalmente disponible, que sirve de punto de sincronización de los distintos repositorios locales. En esta modalidad los clientes no sólo descargan la última instantánea de los archivos: sino que replican completamente el repositorio. Cualquiera de los repositorios de los clientes puede copiarse en el servidor para restaurarlo. Cada vez que se descarga una instantánea, en realidad se hace una copia de seguridad completa de todos los datos Pueden darse varios repositorios con los que trabajar, con lo que es posible colaborar con distintos grupos simultáneamente dentro del mismo proyecto. Esto te permite establecer varios flujos de trabajo que no son posibles en sistemas centralizados, como pueden ser los modelos jerárquicos, es decir en el modelo distribuido, cada desarrollador trabaja directamente con su repositorio local, y los cambios se comparten entre repositorios en un paso posterior. Código abierto: Aegis, ArX, Bazaar, Codeville, Darcs, DCVS (CVS descentralizado), Fossil, Git (diseñado por Linus Torvalds según las necesidades del proyecto del kernel de Linux). Propietario: BitKeeper, Code Co-op (sistema de control de versiones P2P), Plastic SCM. Sistemas centralizados vs distribuidos: En los sistemas distribuidos hay menos control a la hora de trabajar en equipo ya que no se tiene una versión centralizada de todo lo que se está haciendo en el proyecto. En los sistemas centralizados las versiones vienen identificadas por un número de versión. Sin embargo en los sistemas de control de versiones dis- 10-17 Desarrollo de Sistemas tribuidos no hay números de versión, ya que cada repositorio tendría sus propios números de revisión dependiendo de los cambios. En lugar de eso cada versión tiene un identificador al que se le puede asociar una etiqueta (tag). 10-18 IV. Sistemas y Comunicaciones Tema 1 Administración del Sistema operativo y software de base. Funciones y responsabilidades. Control de cambios de los programas de una instalación. Sistemas y comunicaciones Guión-resumen 1. Introducción 2. Administración del Sistema Operativo y “software” de base 3. Funciones y responsabilidades 3.1. Rutinarias 3.2. Incidencias 3.3. Herramientas y protocolos 4. Control de cambios de los programas de una instalación 1-2 Administración del Sistema operativo y software de base 1. Introducción La administración de sistemas puede definirse como el conjunto de actividades orientadas a configurar y gestionar un conjunto de equipos informáticos en su aspecto físico y lógico. La administración de un sistema de información comprende también tareas como la elaboración de documentación o el establecimiento de procedimientos. Por tanto, desde el punto de vista de la organización, se requiere autoridad y responsabilidad y desde el punto de vista del usuario, servicio y cooperación. El SO es el “software” que sirve de interfaz entre el usuario y la máquina. El “software” base es el conjunto de programas que controlan e interactúan con el SO, ofreciendo control sobre el “hardware” y soporte a otros programas. Mucho “software” base está incluido en el SO. Por tanto, suelen usarse casi como sinónimos los términos “software” de base o “software” de sistema, y entenderse por ello, estos programas y el sistema operativo. Ejemplos de “software” base serían los demonios que controlan la temperatura de la CPU o las bibliotecas del sistema gráfico. Lo suyo sería hablar de dos tipos de “software” según el criterio del administrador: “software” de sistema y de aplicación. El primero sería el que se acaba de definir y el segundo, el dirigido al usuario. La generalidad de acciones de la administración del “software” base consiste en la gestión de usuarios, el control del rendimiento del sistema, copias de seguridad, adición de “hardware”, instalación o actualización de “sw”, monitorización del sistema, entre otras. La dificultad reina en la administración del “software” de sistema es la diversidad de plataformas tecnológicas, que suelen agruparse en entornos WS y Unix y la distribución de sistemas. Por tanto, la administración tiende a centralizar su actividad, para ganar en homogeneidad, estandarización y control. Otra actividad destacable es la gestión de incidencias y cambios. Su registro y solución. Y las herramientas y métodos que se disponen para la tarea. Por fin, por su tendencia a la centralización, la administración del “sw” de sistema ya oculta otra idea, la administración remota, que difumina la frontera entre la administración de “sw” de sistema y la gestión de redes y el “sw” de red, para lo que se dispone y muchas veces se integran herramientas de gestión y administración. 2. Administración del Sistema Operativo y “software” de base La administración del “sw” de sistema (SO y “sw” base) la realiza una persona que se da en llamar administrador del sistema, precisamente por administrar el “sw” de sistema. Por tanto, configura y gestiona el sistema, y en muchas ocasiones lo realiza compatibilizando esta tarea con otras. Lo ideal es dedicación exclusiva a tareas de administración. 1-3 Sistemas y comunicaciones De un administrador se exigen amplios conocimientos del sistema administrado, capacidad de toma de decisiones, filosofía de mejora continua, eficacia y responsabilidad. Como se introdujo, las acciones de la administración del “sw” de sistema incluye la gestión de usuarios, el control del rendimiento del sistema, copias de seguridad, adición de “hardware”, instalación o actualización de “sw”, monitorización del sistema, entre otras tareas. Para realizarlas, el administrador debe seguir una estrategia. De forma similar al ciclo de mejora de calidad de Demming, podría identificarse esta estrategia como PDCA, es decir, planificar, hacer, verificar y mejorar. Lo peligroso, quizá es “hacer”. Es recomendable, tener la posibilidad de hacer una tarea o cambio reversible, contando con copias de seguridad o mecanismos similares. Del mismo modo interesa hacer cambios pequeños e incrementales, probándose en caso que se pudiera. Para las pruebas, es conveniente contar con un entorno de preproducción o maqueta. Un entorno de prueba. Una vez verificados los cambios, se aplicarían y se monitorizan, auditan y analizan para seguir buscando mejoras y anticipación a problemas. Se ha definido la acción de la administración de “sw” de sistema. El sujeto, el administrador. Su estrategia. Y queda por tanto presentar su relación con la máquina: su perfil en el sistema. Al perfil de usuario del administrador, se le suele denominar también administrador o superusuario. Más original no podría ser la terminología. Este perfil posee todos los privilegios sobre el sistema. Esto implica control sobre todo archivo y comando de sistema. En entornos Unix también se conoce como ‘root’ y se asocia al grupo ‘root’. En entornos WS se conoce como Administrador o Administrador de Dominio y se asocia al grupo administradores. En los entornos Unix, la herramienta sudo (hacer del superusuario, en inglés) permite a otros usuarios ejecutar comandos con el perfil del administrador. La configuración de esta funcionalidad se hace en el fichero /etc/sudoers y al ejecutar un comando en la forma sudo se pedirá contraseña de administrador. Esto es debido a que no debe usarse una cuenta privilegiada para acciones rutinarias, por lo que sudo, es una opción ágil. La administración del “sw” de sistema puede identificar dentro del conjunto de sus tareas, las que son más rutinarias, o planificadas, que se exponen en el siguiente punto, y tareas aleatorias, que se pueden englobar en lo que se conoce como gestión de incidencias. La gestión de incidencias es el proceso tendente a minimizar el impacto de un hecho que se materializa sobre el sistema y afecta a su funcionalidad. Así, las incidencias son situaciones anormales en el funcionamiento del sistema. Podría decirse también, de forma irónica, que son más normales que anormales, por su frecuencia, pero ese es otro debate. Ejemplos de incidencias son la pérdida de conexión de red de un usuario, su imposibilidad para imprimir o la pérdida u olvido de una contraseña. 1-4 Administración del Sistema operativo y software de base Por su “normalidad”, a veces, la gestión de incidencias, o el “soporte informático” se externaliza por parte de una organización y esto obliga a establecer unos acuerdos contractuales para definir responsabilidades y niveles de atención. A este contrato o acuerdo se le llama SLA acrónimo inglés de Service Layer Agreement o acuerdo de nivel de servicio. Si el SLA se da entre departamentos de una misma organización, como en un grupo de empresas, puede recibir otros nombres similares. El SLA debe recoger los objetivos a los que se compromete la función informática mediante indicadores concretos, como el tanto por ciento de disponibilidad, tiempo y horario de respuesta, tiempo medio entre fallos (MTBF), número de incidencias pendientes, etc. También se incluyen las responsabilidades y penalidades en caso de incumplimiento. 3. Funciones y responsabilidades Las funciones y responsabilidades rutinarias en la administración de “sw” de sistema poseen un carácter local, en cuanto que administración de una máquina concreta y otro global, en lo que se refiere al “sw” de sistema del entorno de red. La tendencia es la integración de esos dos aspectos. Y se suele concretar en utilidades y herramientas con un único interfaz. 3.1. Rutinarias Entre las funciones y responsabilidades rutinarias de la administración del “sw” de sistema pueden identificarse las que se exponen a continuación. 3.1.1. Inventario Una correcta gestión del “sw” de sistema comienza con un inventario de los recursos “hw” y “sw” de la organización. De especial interés será el caso de externalización, cuando habrá que reflejarlo en el SLA correspondiente. El nivel de detalle variará en función de las necesidades, aunque al menos deben incluirse elementos “hw”, “sw” y de red. Los elementos “hw” incluirán equipos y su configuración. Los “sw” incluirán aplicaciones y componentes “sw” usados en cada equipo en su respectiva versión. Los recursos de red incluirán los mapas y grupos de trabajo conectados. La elaboración de los inventarios se puede realizar con herramientas automáticas que exploran los equipos extrayendo la información requerida. La instalación de nuevos componentes es habitual, por tanto, junto a cada actualización, se debe actualizar el inventario. 3.1.2. Distribución de “sw” y control de licencias. Antivirus La distribución de “sw” suele automatizarse con herramientas integradas, en general, con soporte para varios tipos de entornos y redes, registro de operaciones y actualización de inventario. 1-5 Sistemas y comunicaciones En caso “sw” comercial deben controlarse las licencias “sw” para no incurrir en problemas legales. La gestión de licencias en equipos locales, puede ser más sencillo, pero en sistemas distribuidos el control debe verificar que el número de ejecuciones simultáneas no supere el número de licencias autorizadas. Como ayuda para el control de licencias se pueden usar herramientas de inventario que indiquen cuántas instalaciones de cada aplicación existen en los equipos. También son útiles herramientas específicas de control de licencias, que ofrecen la posibilidad de bloquear la ejecución si se sobrepasan las condiciones del contrato. Otras posibilidades son la reubicación de licencias entre servidores, gestión de colas de usuarios para licencia, liberación de licencias no usadas, etc. El uso de estas herramientas reduce los costes de adquisición de licencias y evita los problemas legales. Estos aspectos, por su constante actualización son de especial cuidado en lo referente al “sw” antivirus. La actualización y distribución de antivirus se suele hacer en entornos de Internet. Por ello, la organización establecerá si se usan antivirus en local, en servidor o en ambos. 3.1.3. Contabilidad Se entiende por contabilidad la obtención de datos y estadísticas de uso de los sistemas como puedan ser el tiempo de conexión de usuario, uso de cuotas de almacenamiento, tiempos de acceso, carga de procesador y de red, o datos del estilo, considerados de interés. El análisis de la información permitirá dimensionar los sistemas, ajustándolos a las necesidades reales. 3.1.4. Gestión de sistemas y comunicaciones La gestión de sistemas se basa en su monitorización para el control de la operativa. Su acción clave es establecer las condiciones umbral que marcan la normalidad del funcionamiento. Superados los umbrales se podría identificar alguna anomalía que diera origen a un análisis de la situación. La situación anómala, se podrá tratar como incidencia, que será tratada según los procesos documentados (los procedimientos) de la organización. Las herramientas gráficas de mapas de red ofrecen una visión panorámica de la topología de red que facilitan a los administradores información valiosa para la gestión de la red, en particular para identificar rápidamente anomalías que puedan suponer problemas. La administración de sistemas y comunicaciones genera su integración natural. Y a la vez surge la facilidad de la administración remota. Las herramientas que permiten control remoto de los sistemas permiten la centralización de la gestión, con el incremento de productividad que supone. Se engloban en lo que se conoce como RAT (Remote Administration Tool) y el ejemplo paradigmático es VNC (Virtual Network Computing) de AT&T Laboratories Cambridge, de libre distribución o la propietaria PCAnywhere de Symantec. 1-6 Administración del Sistema operativo y software de base 3.1.5. Otras funciones Otras actividades relacionadas con la administración del “sw” de sistema, que por su extensión, no se desarrollan aquí, son la gestión de colas de impresión e impresoras, del almacenamiento, la planificación de copias de seguridad (backups o respaldos) o la gestión de cuentas de usuarios, por citar las más inmediatas. Algunas de estas tareas se exponen en los temas de administración de redes de área local. 3.2. Incidencias Cuando se dan situaciones anómalas, no necesariamente de gravedad, la administración de “sw” de sistemas, el administrador, realiza funciones y adquiere responsabilidades en relación a la situación planteada. El punto de partida de estas funciones y responsabilidades hay que buscarlo en el SLA, el acuerdo del nivel de servicio, que puede ser interno o, como se ha comentado, responder a un contrato entre organizaciones. Las funciones que se suelen identificar, entre otras son: — Resolución de incidencias y cambios con seguimiento trazado de principio a fin. — Informar a usuarios y entidades que se establezcan de las acciones sobre el sistema. — Informar a la dirección sobre situaciones excepcionales o de especial gravedad. — Analizar el grado de satisfacción del usuario y la calidad del servicio percibida. — Estandarización y centralización de los procedimientos de gestión. Además de las métricas de seguimiento es interesante obtener una valoración del usuario sobre la percepción de la calidad del servicio mediante una “encuesta de satisfacción de usuarios” (CSS, Customer Satisfaction Survey). El análisis del resultado contribuirá a la mejora del servicio. Para el tratamiento de incidencias, se hace necesario centralizar las operaciones y personal, de forma que la categorización de las incidencias asigne el personal indicado al problema concreto. La categorización de incidencias consiste en su clasificación por criterio de gravedad, de forma que la respuesta sea lo más eficiente posible. Una categorización típica, de menor a mayor grado de gravedad puede ser la siguiente. — Categoría 4. Incidencias rutinarias o que en un futuro podrían ocasionar problemas. — Categoría 3. Incidencias de fácil solución. En el peor caso afectarían a pocos usuarios. — Categoría 2. Incidencias de riesgo grave predecible. En caso de producirse llevan asociado un largo proceso de recuperación o podrían detener un sistema o aplicación. 1-7 Sistemas y comunicaciones — Categoría 1. Incidencias urgentes. Problema complejo que paraliza la operación y afecta a muchos usuarios. La situación puede no tener vuelta atrás o proceder de la combinación o evolución de incidencias de categorías inferiores. — Categoría 0. Incidencias de emergencia. Situación grave que paraliza todo el servicio. La gestión de incidencias puede automatizarse con herramientas especializadas. Éstas permitirán la apertura de incidencias, seguimiento y solución, entre otras funcionalidades. Cada incidencia se identifica con un código o, en el argot, tique. Son herramientas comunes en los departamentos de atención al cliente y soporte técnico (help desk). Se pueden clasificar en: — Control de llamadas. Son las más básicas. Permiten abrir, gestionar y cerrar incidencias y la posibilidad de elaborar estadísticas e informes. — Gestión de problemas. Disponen de una BBDD de configuración, incidencias y cambios. Permiten realizar inventarios y responder a una escala de problemas con control de flujo. — Herramientas integradas. Son las más completas y costosas. Integran gestión de configuración e incluyen sistemas basados en el conocimiento. Estos sistemas asesoran en la resolución de incidencias analizando incidencias previas resueltas. Entre las empresas que desarrollan herramientas de incidencias y cambios destacan Remedy (herramienta ARS), Artistry, Astea, Applix y Platinum. 3.3. Herramientas y protocolos Es difícil encontrar un “sw” que integre el soporte a todas las funciones y responsabilidades expuestas. Esto obliga a los administradores a manejar distintas herramientas. Sin embargo, existen plataformas de gestión muy adaptadas, que presentan características comunes, como son el interfaz gráfico de usuario, protocolos estándar de monitorización y gestión remota de dispositivos, soporte para BBDD o interfaces de programación de aplicaciones (API). Es conveniente que la plataforma soporte varios protocolos. La arquitectura de gestión suele ser cliente servidor. El dispositivo monta un servidor (llamado agente), que responde con su información a la parte cliente de la estación gestora. El servidor del dispositivo, el agente puede enviar alarmas en función de la configuración de sus umbrales. Los protocolos típicos de gestión suelen ser SNMP o CMIP. Las plataformas permiten incrementar su funcionalidad con aplicaciones de terceros para gestionar “sw” de base o dispositivos propios. En general son más potentes en entornos Unix. De las propietarias más conocidas destacan HP Openview, Spectrum de Cabletron Systems, Tivoli de IBM, LMS (Landesk Management Suite, de Intel), SMS (Systems Management Server, de Microsoft), SunNet Manager (Sun) o Unicenter de Computer Associates. Entre las plataformas libres citar Scotty/Tkined, OpenNMS y gxsnmp. 1-8 Administración del Sistema operativo y software de base Los protocolos de gestión establecen las normas de comunicación entre agentes y estaciones de gestión. Hay que conocer los siguientes: — SNMP (Simple Network Management Protocol). Es un protocolo simple, constituido como estándar. Sus archivos de BBDD se denominan MIBs (Management Information Base). — CMIP (Common Management Information Protocol). Cuando en 1987 se planteó el desarrollo de protocolos para gestión de red se propuso SNMP como solución a corto plazo y CMIP como solución a largo. CMIP, es más formal y potente que SNMP, aunque menos usado. La implementación de CMIP sobre TCP/IP se llama CMOT y su adaptación sobre LLC, CMOL. — DMI (Desktop Management Interface). Está definido por un consorcio llamado Desktop Management Task Force. El objetivo es definir una arquitectura abierta para gestión de equipos y “sw”. Usa archivos de interfaz de gestión (MIF, Management Information Format) para especificar las características de los productos. Es compatible con Plug and Play para configuración de sus archivos de BBDD y con SNMP. Por su importancia, deben conocerse algunos aspectos de SNMP. El entorno de gestión SNMP está formado por procesos agente (en dispositivos) y procesos gestores (en estaciones de gestión) que se comunican con SNMP. Los agentes recopilan información del dispositivo de red en que se ejecuta, creando una estructura jerárquica de información llamada MIB. Las estaciones de gestión acceden a las MIB con operaciones de lectura y escritura. Los agentes pueden enviar alertas (mensajes trap) a las estaciones de gestión para notificar incidencias. SNMP usa los puertos 161 y 162 UDP para recibir los trap. Una comunidad SNMP (SNMP community) es un grupo formado por dispositivos y las estaciones que los gestionan. Se usa un nombre de comunidad para identificar cada grupo y asociar las operaciones soportadas por los agentes. Los dispositivos pueden pertenecer a una o varias comunidades, pero no responderán a estaciones de otra comunidad a la que no pertenezcan. Las comunidades SNMP son cadenas de texto que suelen usarse a modo de claves de autentificación. Es habitual usar las comunidades predeterminadas “public” (lectura) o “private” (escritura). Existen 3 versiones de SNMP: SNMPv1 fue la primera versión, SNMPv2 es la más usada y SNMPv3 se espera que sea el futuro estándar. Los puestos de trabajo también pueden monitorizarse con SNMP. A continuación se muestra un ejemplo de listado de una MIB: SNMPv2-MIB::sysDescr.0 = STRING: “hardware”: x86 Family 6 Model 9 Stepping 5 AT/AT COMPATIBLE - “software”: Windows 2000 v 5.1 (Build 2600 Uniprocessor Free) 1-9 Sistemas y comunicaciones SNMPv2-MIB::sysObjectID.0 = OID: SNMPv2-SMI::enterprises.311.1.1.3.1.1 DISMAN-EVENT-MIB::sysUpTimeInstance = Timeticks: (444424) 1:14:04.24 SNMPv2-MIB::sysContact.0 = STRING: idefix SNMPv2-MIB::sysName.0 = STRING: IDEFIX […] IF-MIB::ifIndex.2 = INTEGER: 2 IF-MIB::ifDescr.1 = STRING: MS TCP Loopback interface IF-MIB::ifDescr.2 = STRING: Intel(R) PRO/Wireless LAN 2100 3B Mini PCI Adapter IF-MIB::ifDescr.3 = STRING: NIC Fast Ethernet PCI Familia RTL8139 de Realtek […] IF-MIB::ifPhysAddress.2 = STRING: 0:4:23:66:ee:ad IF-MIB::ifPhysAddress.3 = STRING: 0:c:6e:8a:f8:39 4. Control de cambios de los programas de una instalación El control de cambios de un programa instalado es el método de evaluación y aprobación de las modificaciones que se realizan a los elementos de la configuración “sw” durante su ciclo de vida. Para abordar el control de cambios, hay que definir primero el concepto de EC o elemento de configuración. Es aquél elemento de un sistema sin el cual se pierde una funcionalidad identificada. La definición de EC depende de los gestores y podrá tener mayor o menor nivel de detalle. Hay que valorarlo. La gestión de configuración es el control de los elementos de configuración del sistema. Se suelen distinguir 3 tipos de control, el individual, el de gestión y el formal. El primero tiene lugar antes de aprobarse un nuevo elemento, el de gestión aprueba el cambio y el control formal es el realizado en la fase de mantenimiento. 1-10 — Control individual. O informal. Un elemento de configuración bajo control individual, permite que se cambie la documentación sin más. Aunque se mantiene un registro informal de revisiones, no se incluyen, en general, en la documentación. El control individual se aplica en las etapas importantes del desarrollo del documento y se caracteriza por cambios frecuentes. — Control de gestión. Implica un procedimiento de revisión y aprobación de cada cambio en la configuración. Como en el anterior, el control a nivel de proyecto se da en el proceso de desarrollo pero se Administración del Sistema operativo y software de base usa después de haberse aprobado un elemento de configuración “sw”. Este nivel de control de cambios se caracteriza por tener menos cambios que el individual. Cada cambio es registrado formalmente y es visible para la gestión. — Control formal. Se da en la fase de mantenimiento del ciclo de vida “”software”” (el producto está en producción). El impacto de cada tarea de mantenimiento se evalúa por un Comité de Control de Cambios (CCC), que aprueba las modificaciones de la configuración “software”. A menudo se establecen mecanismos de arreglo rápido (quick-fix). El procedimiento “quick-fix” no debe involucrar otros niveles de control de cambios, pero sí proporcionar significados temporales para modificación rápida de la configuración “sw” en situaciones de emergencia. Necesidad del Cambio Petición de cambio El proceso de control de cambios se aplica, cuando un “EC “sw”” se modifica. El flujo del proceso de control de la GCS (gestión de configuración “sw”) se ilustra en la figura. Una necesidad de cambio genera una petición. La petición se trata, teniendo en cuenta el compromiso entre los aspectos técnicos y de gestión y generando un informe de cambios que se evaluará por el Comité de Control de Cambios (CCC). Evaluación Aprobación Decisión Autoridad Control Aambios (ACC) Informar al peticionario Orden de cambio de ingeniería La petición se aprueba o rechaza y se notifica al peticionario del cambio. Para cada Otras tareas cambio aprobado, se genera una Orden de Cambio (OC), que lo describe, teniendo en cuenta las restricciones a respetar y los criterios de revisión y auditorías. El Comité de Control de Cambios (CCC) es el órgano que gestiona los aspectos relacionados con la GCS. En general, está compuesto por representan1-11 Sistemas y comunicaciones tes del usuario/peticionario y del equipo de desarrollo. Para pequeños proyectos, el CCC puede estar formado por un representante del usuario, peticionarios y desarrolladores. En proyectos de envergadura, el CCC puede estar organizado en una jerarquía que analice los problemas del sistema, del “hardware” y del “software” por separado. El CCC puede llegar a formar parte del desarrollo del proyecto “software”. Entre sus funciones se encuentran: — Analizar el impacto de cambios de entidad en el sistema. — Categorizar y dar prioridad a los cambios conforme son pedidos y aprobados. — Intervenir en los conflictos entre entes implicados en los cambios. — Garantizar que las propiedades de mantenimiento de registro y contabilidad se cumplan. Las auditorías de la configuración se centran en comprobar que se ha realizado el cambio conforme a la orden de cambio de ingeniería (OCI) y se han incorporado modificaciones adicionales, además de comprobar que: — Se ha realizado una revisión técnica formal para comprobar la corrección técnica. — Se han seguido los estándares de ingeniería del “software”. — Se han marcado los cambios en el EC, especificando fecha y autor del cambio y que el EC se refleja en su identificación. — Se han seguido los procedimientos para señalar el cambio, registrarlo y divulgarlo. — Se han actualizado todos los EC implicados. Por fin, la generación de IEC (informes de estado de la configuración) responde a las preguntas qué ocurrió, quién realizó el cambio, cuándo ocurrió y a qué elementos ha afectado. El flujo de información del proceso de generación de los IEC se puede apreciar en la figura de la derecha. 1-12 Identificación de la configuración Control de la configuración Auditoría de la configuración BBDD de IEC Generación informes de Estado Informe IEC Tema 2 Administración de bases de datos. Funciones y responsabilidades. Administración de servidores de correo electrónico. Protocolos de Correo electrónico. Sistemas y comunicaciones Guión-resumen 1. Introducción 2. Administración de Bases de Datos 3. Funciones y responsabilidades 3.1. Definición de la estructura de la BBDD 3.2. Modificación de esquemas 3.3. Documentación 3.4. Operación 2-2 4. Administración de servidores de correo electrónico 5. Protocolos de Correo electrónico Administración de Bases de Datos 1. Introducción La administración de sistemas de BBDD recae en la figura del administrador. Su labor consiste en la definición de su responsabilidad, funciones y procedimientos de trabajo. En principio estas tareas son independientes del SGBD concreto que se utilice en la organización. En una empresa, el administrador de bases de datos, es una responsabilidad principal y un puesto clave de la organización, debido a que la información es un activo estratégico. Por tanto, la persona que desempeñe ese rol (DBA) debe conocer bien la información y los procesos de negocio de la organización. El administrador de bases de datos es el responsable de decidir en primer término qué datos deben almacenarse y establecer las políticas de mantenimiento y gestión de datos. Es curioso que este cargo suela ser ocupado por gerentes más que por técnicos. En teoría, un técnico sólo debe poner en práctica las decisiones del administrador de datos, pero con frecuencia realiza sus funciones, desplazando al supuesto DBA a funciones más de gestión de proyectos o similares. La Administración de Datos alcanza a toda la organización, mientras que el alcance de la Administración de Bases de Datos queda restringido a una Base de Datos en particular y a los sistemas que los procesan. La Administración de la BBDD opera dentro del marco proporcionado por la Administración de Datos facilitando el desarrollo y uso de una Base de Datos concreta y sus aplicaciones. Las siglas DBA suelen utilizarse para designar tanto la función del Administrador de Datos como del administrador de Base de Datos. La función DBA existe en todas las bases de datos, pero varía con respecto a la complejidad de la base que se administre. No es lo mismo administrar una base de datos por ejemplo, de personal, que otra de grupos de trabajo u organizacional. En una BBDD menos compleja, normalmente el usuario es su administrador. Las BBDD más complejas o sensibles, requieren de una o varias personas para administrarlas aunque sea a tiempo parcial. En BBDD más complejas y críticas todavía, se precisa de un administrador de bases de datos a tiempo completo. El DBA ha de tener aptitudes técnicas para la gestión del sistema en cuestión. Además, es de valorar nociones de administración (no sólo informática), capacidad de dirección de equipos de trabajo y un alto grado de diplomacia. Es decir, características de perfiles de gestión. La característica más importante a tener o desarrollar, es la posesión de un conocimiento profundo de las políticas y normas de la empresa, así como el criterio de la empresa para aplicarlas en un momento dado. Es la razón por la que el DBA suele formar parte de la alta dirección o por al menos, sea un perfil a tener muy en cuenta. 2-3 Sistemas y comunicaciones 2. Administración de Bases de Datos La responsabilidad de administración de BBDD recae en la figura del administrador de la BBDD. Es la persona o grupo que gestiona el sistema, asegura su correcto funcionamiento y posee la responsabilidad de su seguridad e integridad. Según ANSI, las funciones del administrador se pueden organizar en 3 niveles, distinguiendo tres roles de administración, que coinciden con los niveles que se identifican para una BBDD. — Administrador de la organización. Encargado del diseño lógico y conceptual. — Administrador de la BBDD. Encargado del diseño físico, mantenimiento y seguridad. — Administrador de Aplicaciones. Crea vistas, aplicaciones y programas para gestión. Las funciones del administrador de BBDD pueden agruparse en 3 áreas de responsabilidad. Definición del esquema de la BBDD. Es misión del administrador la definición de los esquemas conceptual, interno y externo. Por tanto, se trata del análisis, la estructura de almacenamiento de la información y el diseño de vistas. Gestión del rendimiento. Establecer la forma de controlar y medir el funcionamiento de la BBDD para obtener un rendimiento óptimo, en función de sus características o requisitos. Gestión de la seguridad. Se refiere a las medidas a implementar para garantizar la seguridad de la BBDD, incluyendo la integridad de la información y el respaldo y recuperación de la misma. Para cumplir con sus funciones y responsabilidades, un administrador de BBDD en general, hace uso de las herramientas típicas de su entorno. Las más directas son las que ofrece el propio SGBD, entre las que se suelen encontrar utilidades de copias de seguridad y restauración, gestión de usuarios, permisos, diccionario de datos, etc. Las herramientas CASE facilitan tareas de ingeniería de “software” como la documentación. Para la gestión del rendimiento, puede hacerse uso de simuladores, cuyos resultados, en general en forma de gráficos y estadísticas, sirven de orientación para la optimización de la BBDD. La seguridad de la BBDD cubre varios aspectos. El primero, el control del acceso a la misma, asegurando, en lo posible, que el usuario que accede, sea quien dice ser. Otro aspecto es la integridad, referido a que las acciones que se intentan realizar sean efectivamente esas y que la información es consistente. Los permisos de cada usuario en la BBDD los otorga el administrador y estarán en consonancia con el perfil de usuario. Las dos herramientas para gestionar este aspecto son la vista y los permisos de usuario. Una vista permite seleccionar la información sobre la que trabajará un usuario, de forma que implícitamente, se oculta la que no se debe mostrar. 2-4 Administración de Bases de Datos Los permisos de usuario limitan el acceso a aquellos que se autoricen. Así, a una vista se pueden aplicar permisos de usuario como si fuera una tabla. Por ejemplo, en una BBDD de pacientes, puede interesar que cierto perfil de usuario acceda a los datos de contacto, pero no al historial clínico, por tanto, una vista, recuperará sólo la información relevante a cada tarea. Por fin, un administrador debe tener en cuenta la integridad de la BBDD, que en general identifica tres aspectos a cubrir, la integridad de dominios, general y sobre tablas base. La integridad de dominios se refiere a la limitación en los valores a tomar por los atributos o su tipo de datos. La integridad general se refiere a las restricciones sobre las columnas de las tablas. La integridad sobre las tablas se refiere a las restricciones de diseño que afectan a claves primarias, foráneas, cláusulas u otros aspectos. 3. Funciones y responsabilidades La tarea del DBA, entendido como el profesional que se encarga del proceso de datos, no como perfil de administrador de datos (a un nivel más de gestión) es crear la BBDD y poner en marcha los controles técnicos necesarios para apoyar las políticas definidas por el nivel superior. El DBA se encarga también de garantizar el buen funcionamiento del sistema. Para ello suele contar con un equipo de programadores de sistemas, analistas y otros técnicos. Aunque existen varios tratados teóricos sobre las funciones y responsabilidades del DBA, a continuación se identifican cuatro grupos que pretenden encajarlos. 3.1. Definición de la estructura de la BBDD El DBA participa en el diseño inicial, su implementación, evaluando alternativas, tomando decisiones sobre SGBD a usar y coordinando equipos para el proyecto. Una vez diseñada la BBDD, se implementa usando las facilidades del SGBD y procediéndose a la creación de los datos o captura inicial. El DBA participa en el desarrollo de procedimientos y controles para asegurar la calidad y la alta integridad de la BD. Según el profesor DATE, son responsabilidad del DBA definir el esquema conceptual e interno de la BBDD. Se pueden englobar en este punto. Entre sus funciones se encontrarían la creación a partir del diseño lógico de la BBDD el esquema conceptual correspondiente, empleando el DDL elegido. El SGBD usará la versión objeto (compilada) de ese esquema para responder a las solicitudes de acceso. Otra función será la definición del esquema interno; cómo se representará la información en la BBDD almacenada, el diseño físico, que incluye la definición de la estructura de almacenamiento correspondiente y la correspondencia entre el esquema interno y conceptual. En la práctica, el DDL conceptual o DDL interno incluirán los medios para definir dicha correspondencia. Ambas funciones deberán poder separarse con nitidez. 2-5 Sistemas y comunicaciones El profesor KORTH también identifica dos funciones similares del Administrador de BBDD, que encajan en este título: la definición del esquema y de la estructura de almacenamiento, que serán implementada por el compilador de DDL en el conjunto de tablas que se usarán. 3.2. Modificación de esquemas Una vez que el sistema entra en operación, las modificaciones son habituales. Pueden ser debidas a nuevos requisitos, mejoras o evoluciones. En cualquier caso, deben tener en cuenta a todos los usuarios, ya que el impacto se hará notar en más de una aplicación. Una administración eficaz de la BD debe incluir procedimientos con los que los usuarios registren sus necesidades de modificaciones, para que el resto de usuarios aporte sus comentarios y la viabilidad del cambio. Esta función, el profesor DATE la identifica como vínculo con el usuario y el profesor KORTH como modificación del esquema y organización física. En esencia se refieren a lo mismo. El proceso de mantenimiento. Que incluiría el mantenimiento evolutivo. En particular, el vínculo con el usuario establece la responsabilidad del DBA de la comunicación con los usuarios, garantizando la disponibilidad de los datos y escribir (o ayudar en la tarea) los esquemas externos necesarios. Esto implica la definición de la correspondencia con el esquema conceptual. El resto de aspectos de la función de enlace con los usuarios se podrían resumir en la idea de soporte técnico. 3.3. Documentación Una responsabilidad fundamental del DBA es la documentación del sistema. Una modificación sobre la BBDD pudiera ocasionar un error oculto, que si se llega a manifestar, la falta de documentación puede suponer un alto coste. La documentación viene a ser el pato feo del operativo “software”. No suele ser grato para los técnicos escribir procedimientos o documentación técnica como instrucciones de trabajo. Para agilizar la tarea los SGBD integran herramientas CASE para ello. Otra razón para cuidar la documentación es la necesidad de mantener organizados datos históricos. Es normal realizar consultas sobre los respaldos para conocer la información en un estado previo. Los casos de caídas del sistema también requieren respaldos que deben verificar su estructura, formato y escala, para integrarlos a la operación del sistema. 3.4. Operación Aunque el DBA protege los datos, no los procesa. El DBA no es usuario del sistema, en consecuencia, no administra valores de datos; administra la actividad. Dado que la BBDD es un recurso compartido, el administrador debe proporcionar estándares, guías de acción, procedimientos de control y la 2-6 Administración de Bases de Datos documentación necesaria para garantizar que los usuarios trabajan de forma cooperativa y complementaria, al procesar datos. Todo el ámbito de la BBDD se rige por estándares, desde la forma de captura de información (tipo, longitud, formato), hasta su proceso y presentación. El nivel de estandarización alcanza los aspectos más internos de la BBDD: cómo se accede a un archivo, cómo se determinan los índices primarios y auxiliares o la foliación de registros, entre otros. Cuando se definen estándares sobre la estructura de la BBDD, deben registrarse en una sección del diccionario de datos a la que los usuarios relacionados con ese tipo de proceso, puedan acceder. Estos estándares se someten a mantenimiento, pruebas y modificaciones. Otro aspecto que el administrador debe atender es coordinar nuevas propuestas de otorgación de privilegios y derechos de acceso a datos. Se obtendrán este tipo de garantías cuando el SGBD sea capaz de implementar las restricciones aplicables al acceso concurrente. Entre las alternativas más usadas por el administrador para resolver este problema se encuentran restringir el acceso a los procedimientos y datos a ciertos usuarios o evitar la coincidencia de horarios de distintos usuarios. Otra función esencial del administrador es definir las técnicas de recuperación. A pesar de que el SGBD lleva a cabo una parte del proceso de recuperación, los usuarios determinan de forma crítica la operatividad de esos sistemas de protección. El personal de operación debe saber cómo iniciar el proceso de recuperación de la BBDD, qué copias de seguridad usar, cómo programar la ejecución del tiempo perdido y de las tareas pendientes. El DBA es el responsable de la publicación y mantenimiento de la documentación en relación con la actividad de los datos, incluyendo los estándares, derechos de recuperación y acceso a la BBDD, procedimientos de recuperación ante caídas y cumplimiento de las políticas establecidas. Estas funciones son identificadas por el profesor DATE como supervisión del desempeño, definición de verificaciones de seguridad e integridad y definición de procedimientos de respaldo. En la supervisión del desempeño, se incluye la respuesta a cambios de requisitos. Se refiere a la responsabilidad del administrador en cuanto a la organización del sistema para obtener la máxima eficiencia y realizar los ajustes apropiados cuando se requiera. La definición de las verificaciones de seguridad e integridad se pueden considerar parte del esquema conceptual, para lo que habrá que hacer uso de las facilidades del DDL. La definición de los procedimientos de respaldo y recuperación hace hincapié en evitar el cautiverio que supone a una organización su dependencia del sistema de información. Ante incidencias debe preverse una respuesta para restaurar y continuar la actividad en el mínimo tiempo posible. Por tanto, el administrador debe definir y poner en practica un plan de recuperación adecuado que incluya, copias de seguridad o respaldo y procedimientos para recargar la BBDD si se materializa la incidencia. 2-7 Sistemas y comunicaciones Por su parte, el profesor KORTH en cuanto a operación, diferencia dos funciones, la concesión de permisos y la definición de las restricciones de integridad. La concesión de autorización para el acceso a los datos permite al administrador regular qué partes de la BBDD podrán ser vistas por qué usuario concreto. Las restricciones de integridad se refieren a la responsabilidad del administrador para fijar los criterios de integridad a implementar en el SGBD para tratar las transacciones que implican una actualización en el sistema. Además de administrar la operativa habitual y la estructura de la BBDD, el administrador debe gestionar el SGBD. Deberá compilar y analizar estadísticas de rendimiento del sistema e identificar potenciales problemas. Dado que son muchos los usuarios, se debe analizar las observaciones sobre el tiempo de respuesta del sistema, precisión de los datos y la facilidad de uso. Si se requieren cambios, el administrador debe planearlos y ponerlos en práctica. Asimismo, se debe monitorizar periódica y continuamente la actividad del usuario. Los SGBD comerciales suelen incluir herramientas estadísticas. Los informes pueden ser indicativos y ofrecer datos como el número de usuarios activos, tasas de error y tipos. El administrador debe analizar esta información para determinar nuevas necesidades o evoluciones del sistema para mejorar su rendimiento o facilitar la operativa. Las estadísticas temporales siempre son indicativas ya que están en relación inversa con el rendimiento del sistema. Otro aspecto, si se quiere, heredado del mantenimiento de sistemas “sw”, es el de las actualizaciones. Si el fabricante del SGBD de la organización anuncia una nueva versión del producto, deberían analizarse las nuevas características y su idoneidad de aplicación. Si se decide adquirir las nuevas versiones, debe notificarse y controlar la migración. El “software” de soporte y otras características de “hardware” pueden implicar también modificaciones de las que el administrador será responsable ocasional. Estas modificaciones pueden conllevar cambios en la configuración o en parámetros de operación del SGBD. El SGBD es parametrizado en su implantación. Pero, dada la poca experiencia de operación con el mismo, el análisis de la operativa rutinaria y su rendimiento proporcionarán el punto de partida a nuevas mejoras. Si el rendimiento es aceptable, el administrador podría considerar la modificación de parámetros u opciones y observar su efecto sobre el sistema, con el objetivo de optimizarlo. 4. Administración de servidores de correo electrónico Un servidor de correo electrónico es un servicio que gestiona mensajes de correo entre remitentes y destinatarios de forma parecida a como lo haría una oficina postal. Cada emisor/receptor de correo tiene una dirección o cuenta de correo y a ella se asocia un buzón. Los mensajes salientes y entrantes quedarán almacenados en el buzón hasta que sean gestionados por su propietario. Para inte2-8 Administración de Bases de Datos ractuar con el servidor de correo caben varios modos, desde el acceso web al empleo de un cliente tipo POP o IMAP. La administración del servidor de correo requiere de una configuración inicial y de tareas de mantenimiento preventivo y correctivo en su funcionamiento. Básicamente en la acción de envío el servidor guardará el mensaje en su disco y lo encaminará hacia su destino final según la ruta que obtenga del servicio DNS en función del dominio de destino. El mensaje se recepcionará finalmente en el servidor que almacena el correo del destinatario. Además del necesario servicio de enrutado DNS las medidas de seguridad serán fundamentales, por ejemplo para prevenir la captura de nuestro servidor para el fraudulento envío masivo de correo denominado “spam”. Por esta razón los proveedores de servicio de correo bloquean sus servidores SMTP para que sólo sus suscriptores puedan usarlos (relay de correo). Podemos establecer como tareas principales de administración de un servidor de correo las siguientes: — Gestión de usuarios que accederán a revisar su correo electrónico. — Gestión de tamaños de correo y máximo de conexiones. — Prevención del relay de correo. — Prevención del SPAM, (entrada masiva de correo no solicitado), también denominado correo basura. — Configurar programas antivirus para la detección de virus en correos entrantes y salientes. — Administrar listas de correo y servidor de noticias. El software de correo consta normalmente de dos partes: un agente de usuario (MUA) o mailer y un programa de transporte (MTA). El agente de usuario es el software que el usuario utiliza para crear mensajes, leerlos, etc. El programa de transporte es quien se ocupa de entregar correo tanto remoto como local, aunque el usuario nunca interactúa con este programa sino que lo hace a través del agente de usuario. Básicamente un MUA es un programa que permite a los usuarios leer y redactar mensajes de correo. Los MUAs recuperan los mensajes a través de los protocolos POP o IMAP, y envían los mensajes salientes a través de un MTA. Citamos a continuación algunos de los servidores de correo más empleados. — Sendmail es un programa que proporciona el servicio de correo electrónico en sistemas Linux y Unix. Entre sus objetivos de diseño destaca una potente configuración, capaz de procesar mensajes de e-mail en prácticamente cualquier tipo de red. Sin embargo, esta cualidad ha resultado ser de una complejidad abrumadora para los no expertos. 2-9 Sistemas y comunicaciones Descendiente del Delivermail de ARPANET, Sendmail es todo un clásico, una de las soluciones más longevas empleada desde los años ochenta. Es el más usado de su categoría y tiene fama de difícil de configurar y de requerir atención constante, especialmente en lo que a actualizaciones de seguridad se refiere. Es el agente de transporte de correo más común de Internet (en los sistemas Linux y Unix). Aunque actúa principalmente como MTA, también puede ser utilizado como MUA. — Postfix es un MTA relativamente fácil de administrar, seguro y que no sobrecarga mucho la máquina ya que solamente se cargan los módulos necesarios en cada momento. Postfix es otro clásico, aunque a diferencia del anterior es conocido por ser, además de potente y versátil, de los más amigables de configurar y de hecho son muchas las distribuciones Linux que lo incluyen por defecto o en sus repositorios oficiales. A diferencia de Sendmail, que es un gestor de correo monolítico, en el diseño de Postfix se han disgregado los diversos tratamientos que se realizan sobre un mensaje a su paso por un MTA, adjudicando cada tratamiento o grupo de tratamientos a un proceso independiente. El conjunto de todos estos procesos es Postfix. — Qmail es un gestor de correos extremadamente robusto que corre en cualquier sistema operativo que emule a UNIX. Esto incluye a Linux y a todos los BSDs. Se trata de un sustituto completo para el sistema sendmail que se suministra con los sistemas operativos UNIX. Creado como una alternativa a Sendmail que mejorase la seguridad de éste con una nueva estructura a base de módulos, qmail es una solución potente y vigente. — Microsoft Exchange, plataforma de mensajería de Microsoft que ofrece correo electrónico, programación y herramientas para aplicaciones personalizadas de servicios de mensajería y colaboración entre usuarios. — Open-Xchange como su nombre indica, nació como alternativa a Microsoft Exchange y ha evolucionado hasta convertirse en una solución muy productiva de interfaz moderna. — Procmail es un sencillo programa que permite procesar correos de forma sencilla pero muy potente. Se pueden separar los correos según determinados filtros, eliminar correos spam, reenviar a otras cuentas, activar antivirus de correos, responder automáticamente, ejecutar programas, etc. En cuanto a los clientes de correo más populares citamos: — 2-10 Outlook es el rey indiscutible de los clientes de correo, gracias a su inclusión en el paquete ofimático por excelencia de Windows: Microsoft Office. Su extendido uso entre los clientes profesionales y su completa colección de plugins, lo convierten prácticamente en una referencia de lo que deben ser capaces de hacer los clientes de correo. Administración de Bases de Datos — Mozilla Thunderbird es la eterna alternativa a Outlook. Este cliente de correo gratuito desarrollado por los creadores de Firefox, ha ido creciendo poco a poco, hasta convertirse en una herramienta muy versátil. — Zimbra es un cliente Open Source con un claro espíritu 2.0, orientado principalmente a un ámbito más profesional. Además incorpora herramientas para trabajo colaborativo en la nube entre distintos miembros del mismo equipo. — EM Client es uno de los pocos clientes de correo que se atreven a desafiar la hegemonía de Outlook y Thunderbird, y en algunos aspectos sin duda lo consigue. Al contrario que otros clientes de correo, que requieren de un proceso de aprendizaje relativamente largo, eMClient es muy sencillo. Un caso particular de la gestión de servidores de mensajes son los servidores de noticias, son un servicio internet que permite el intercambio de mensajes en un foro común sobre un determinado tema de interés para todos sus lectores. En cuanto al formato, son similares a los e-mails, mensajes de texto formados por la cabecera del mensaje seguida del cuerpo, y donde a su vez la cabecera se divide en diferentes campos que indican el remitente, el grupo destinatario o el tema del mensaje. — CNEWS fue diseñado para servidores que llevan noticias sobre enlaces UUCP. Funciona bajo cualquier Unix y hay literalmente miles de sistemas usándolo alrededor del mundo. Su mayor desventaja es que parece haber sido diseñado para conexiones UUCP por módem, y por tanto requiere la adición de un servidor NNTP para manejar transferencia en tiempo real de noticias por Internet. — InterNetNews o INN tiene su mayor ventaja en la velocidad y el hecho de que contiene un servidor NNTP integrado. Su principal desventaja es que no funciona necesariamente en todos los Unix estándar. — NNTP (Network News Transfer Protocol) proporciona una forma de intercambio de noticias totalmente diferente de Cnews, para adaptarse a los protocolos de transporte usados en la Red NNTP (Protocolo de Transferencia de Noticias de Red), y es un estándar de Internet. Está basado en una comunicación orientada a la conexión generalmente sobre TCP entre un cliente y un servidor que almacena las noticias en disco. Otro elemento a destacar en el contexto de los servidores de correo son las denominadas listas de correo que consisten en una dirección de correo, con la característica de que al enviar un mensaje a dicha dirección es recibido por un conjunto de direcciones de correo previamente especificado. Es decir, la lista actúa como un distribuidor. Se envía un mensaje hacia la lista y es distribuido a todas las direcciones de correo que están suscritas. Cada suscriptor tiene derecho a enviar mensajes a una dirección específica de la lista de correo, y desde allí se redirige a todos los miembros de la lista que a su vez, pueden expresar sus opiniones de la misma forma, originándose así un intercambio de ideas colaborativo. Algunas listas disponen de un moderador que se encarga de filtrar los mensajes que se reciben. Mailman o Majordomo son programas que gestionan listas de correo. 2-11 Sistemas y comunicaciones Por otra parte la modalidad WEBMAIL permite leer el correo electrónico del servidor de correos por medio de una pagina web. Webmail simplifica la lectura del correo en cualquier parte ya que prescinde de software cliente de correo y solo se necesita un navegador web. Entre los servicios de este tipo más conocidos podemos enumerar: 5. — Gmail es uno de los servicios de correo web más extendido. Atrae por su capacidad de almacenamiento ilimitado, su bandeja de entrada, sencilla y clara y por su filtro antispam, bastante eficaz. Las etiquetas y los filtros para identificar tus mensajes pueden resultar bastante útiles a la hora de clasificar el correo; además dispones de un chat online para poder hablar con tus contactos a tiempo real. La parte negativa es que si todavía no tienes una cuenta en Gmail o simplemente quieres crearte una nueva, es complicado encontrar nombres que nos gusten o que simplemente estén disponibles. — Hotmail o Outlook.com con el paso del tiempo ha ido ampliando su capacidad hasta hacerse ilimitada. Tienes acceso desde la interfaz principal a messenger, documentos y fotos. — Yahoo! Mail junto con Gmail y Hotmail, constituyen los tres servicios de correo web más extendidos y populares. Yahoo! Mail tiene también una capacidad de almacenamiento ilimitada y protección contra correo no deseado y virus. Protocolos de Correo electrónico Se describen a continuación los tres protocolos básicos del servicio de correo electrónico, SMTP, POP e IMAP. — SMTP (Simple Mail Transfer Protocol, Protocolo simple de transferencia de correo) es el protocolo que se emplea para enviar correo electrónico. Los mensajes salientes utilizan SMTP para pasar de la máquina del cliente al servidor, lugar desde el que se trasladan hasta el destino final. También dos servidores de correo que intentan transferir entre sí un mensaje utilizan SMTP para comunicarse, incluso si utilizan plataformas totalmente distintas. SMTP usa el puerto 25 del servidor para comunicarse. Empieza un intercambio SMTP básico con el sistema conectado mediante la emisión del comando MAIL From: para iniciar el intercambio. El sistema que recibe el comando responde con un mensaje 250 para informar de que se ha recibido el primer comando. A continuación, el sistema conectado comunica las direcciones de correo electrónico para recibir el mensaje del sistema receptor, seguido de un mensaje con el comando DATA. Este mensaje notifica al sistema receptor que la siguiente parte de la comunicación será el cuerpo real del mensaje de correo electrónico. Cuando el sistema conectado finaliza el envío del mensaje de correo electrónico, coloca un punto “.” en una línea. A partir de ese momento, se considera que el mensaje se ha enviado. 2-12 Administración de Bases de Datos El protocolo SMTP también permite gestionar el reenvío de mensajes entre sistemas si el sistema receptor sabe el destino al que tiene que enviar el mensaje. El protocolo puede verificar si determinados usuarios utilizan realmente un servidor de correo concreto (VRFY) o ampliar una lista de distribución de correo (EXPN). También se puede retrasar el envío de correo electrónico entre dos servidores SMTP si en los dos sistemas se permite realizar esta actividad. SMTP no requiere autentificación en su forma más básica. Esto ha provocado mucho correo basura o spam, ya que un usuario externo puede utilizar el sistema de otro para enviar o transmitir el correo a listas completas de destinatarios con los recursos y ancho de banda del sistema. Las aplicaciones SMTP modernas han progresado enormemente al minimizar este comportamiento y restringir las transmisiones de modo que sólo los hosts conocidos envíen correo electrónico. En el documento RFC-821 se describe el comportamiento básico del protocolo SMTP, aunque se han agregado nuevas funciones dando lugar a extensiones de SMTP, a través de la RFC-1869. Al iniciar una conversación con un servidor SMTP mediante un comando EHLO, en lugar de HELO, el servidor conectado puede identificarse a sí mismo como un servidor compatible con las extensiones SMTP. El servidor receptor contesta con una línea 250 que contiene las distintas extensiones SMPT compatibles. A continuación, el servidor conectado puede utilizar las extensiones compatibles como desee para obtener los objetivos de la comunicación. La RFC-2554 describe la incorporación de autentificación SMTP mediante el comando AUTH. Otra extensión SMTP muy utilizada se explica en detalle en el documento RFC-2034, que describe el uso entre aplicaciones SMTP de códigos de error estándar separados por puntos. La lectura de los documentos RFC en los que se describen aspectos del protocolo SMTP proporciona los conocimientos básicos sobre la forma de transferir el correo electrónico en Internet. Es posible también conectarse a un servidor SMTP mediante telnet si se especifica el puerto 25, como por ejemplo telnet localhost 25. — POP (Post Office Protocol, Protocolo de oficina de correo) permite a los clientes de correo electrónico recuperar los mensajes de los servidores remotos y guardarlos en las máquinas locales. La mayoría de los clientes de correo que utilizan el protocolo POP se configuran automáticamente para eliminar el mensaje del servidor de correo después de transferirlo correctamente al sistema del cliente. Para establecer una conexión a un servidor POP el cliente de correo abre una conexión TCP en el puerto 110 del servidor. Cuando la conexión se ha establecido, el servidor POP envía al cliente POP una invitación y después las dos máquinas se envían entre sí otros comandos y respuestas que se especifican en el protocolo. Como parte de esta comunicación, al cliente POP se le pide que se autentifique en lo que se denomina “Estado de autenticación”, donde el nombre de usuario y la contra2-13 Sistemas y comunicaciones seña del usuario se envían al servidor POP. Si la autentificación es correcta, el cliente POP pasa al “Estado de transacción”, fase en la que se pueden utilizar los comandos LIST, RETR y DELE para mostrar, descargar y eliminar mensajes del servidor, respectivamente. Los mensajes definidos para su eliminación no se quitan realmente del servidor hasta que el cliente POP envía el comando QUIT para terminar la sesión. En ese momento, el servidor POP pasa al “Estado de actualización”, fase en la que se eliminan los mensajes marcados y se limpian todos los recursos restantes de la sesión. POP es un protocolo mucho más sencillo que IMAP, porque no se tienen que enviar tantos comandos entre el cliente y el servidor. POP también es en cierta medida más conocido, aunque la mayoría de los clientes de correo electrónico pueden utilizar cualquiera de estos protocolos. En el documento RFC-1939 se ofrece una descripción básica del protocolo POP3, la versión actual del protocolo. — IMAP (Internet Message Access Protocol, Protocolo de acceso a mensajes de Internet) es otro método que utilizan las aplicaciones cliente de correo electrónico para obtener acceso a los mensajes almacenados remotamente. Al utilizar el protocolo IMAP, los mensajes de correo electrónico se conservan en el servidor de correo remoto, donde el usuario puede leerlos o eliminarlos, además de cambiar el nombre o eliminar los buzones de correo para almacenamiento de mensajes. El protocolo IMAP es compatible con los estándares de mensajes de Internet, como MIME, que permiten recibir ficheros adjuntos. Muchos clientes de correo electrónico que utilizan el protocolo IMAP también se pueden configurar para que almacenen temporalmente en caché una copia de los mensajes localmente, de modo que el usuario puede examinar los mensajes que ha leído anteriormente aunque no esté conectado directamente al servidor IMAP. IMAP es utilizado principalmente por usuarios que suelen acceder a su correo desde varias máquinas, también los usuarios que se conectan a Internet o a una red privada a través de una conexión de ancho de banda baja utilizan a menudo el protocolo IMAP, puesto que sólo se obtiene inicialmente la información de cabecera del correo. Esto les permite posponer la descarga de mensajes que tienen ficheros adjuntos de gran tamaño. De la misma manera, el usuario puede eliminar el correo electrónico que no le interesa sin tener que ver antes el cuerpo del mensaje, lo cual evita tener que descargar un mensaje completo para ser leído. El documento RFC-1730 define el modo en el que el protocolo IMAP se implementa en la versión 4, y la RFC-2060 contiene las cuestiones de implantación de IMAP actuales que utilizan muchos servidores IMAP y que se denomina versión IMAP4rev1. 2-14 Tema 3 Administración de redes de área local. Gestión de usuarios. Gestión de dispositivos. Monitorización y control de tráfico. Sistemas y comunicaciones Guión-resumen 1. Introducción 5. Monitorización y Control de Tráfico 2. Administración de redes de área local 5.1. SolarWinds 3. Gestión de usuarios 5.2. Ethereal 3.1. Entornos Windows 5.3. WinDump 3.2. Entornos Unix 5.4. Fing 4. Gestión de dispositivos 4.1. Gestión de discos 4.2. Gestión de impresoras 3-2 Administración de redes de área local 1. Introducción La explotación de un sistema en red corresponde a la fase de funcionamiento estable del sistema, implantado y configurado y con una carga igual a la real, es decir, cumpliendo los requisitos funcionales y las ventanas de servicio para las que se ha diseñado. Debe diferenciarse entre explotación y producción. Suelen tratarse ambos términos como sinónimos, no siendo así, a menos que el sistema sea único. La diferencia está en que el entorno de producción se refiere al sistema en funcionamiento, y por tanto, su operativa es delicada. El entorno de explotación puede asimilarse a una maqueta, o un sistema paralelo, donde puedan realizarse pruebas de mejora, integración, desarrollo, etc. que si generasen problemas no afectarían a la producción. El entorno de explotación puede ser tan similar al de producción que sea prácticamente una copia, pero el servicio real, no se verá afectado por su modificación. Del mismo modo, puede utilizarse el sistema en explotación como respaldo en caso de que el sistema en producción sufra una eventualidad. Clave en la explotación de una red es su gestión, su administración, que incluye todo aquello que garantiza la operación del sistema, recursos y servicios según los objetivos marcados. Se incluirán, por tanto, los procedimientos y recursos involucrados en producción. La gestión puede identificar los siguientes aspectos: Gestión de red. En relación con los servicios de comunicación, recursos, infraestructuras, etc. Gestión de sistemas. Referido a elementos de proceso y finales de usuario soportados sobre la red. Se incluye la gestión de servidores, “software” de base, periféricos, usuarios y demás. Gestión de servicios. Referido a los requisitos de mantenimiento de la operativa, como el almacenamiento de datos, distribución de “software”, control de incidencias o estado del sistema, entre otros. Gestión de aplicaciones. Orientado a las aplicaciones de producción de la organización y a asegurar el cumplimiento de las condiciones marcadas en los objetivos. Gestión de información. Las tareas de diseño y mantenimiento de la información corporativa que marcan las pautas de distribución, disponibilidad y accesibilidad adecuadas. Además como aspectos de gestión destacados se incluyen la gestión de usuarios y dispositivos que se desarrollan en los epígrafes del tema. 2. Administración de redes de área local Los conceptos de seguridad de los sistemas de información, se exponen en temas posteriores. Aplicados a las redes de comunicaciones, se podría definir la 3-3 Sistemas y comunicaciones seguridad de las redes de comunicaciones como la capacidad de una red de resistir, con un nivel de confianza, las acciones que comprometan la confidencialidad, integridad, disponibilidad y autenticidad de la información La administración de un sistema en red consiste en el conjunto de tareas que garantizan su correcto funcionamiento y documentación. Entre estas tareas, puede citarse, por ejemplo, la asignación del direccionamiento, segmentación de la red y definición de VLAN, uso de servidores, administración de usuarios y recursos o el control de los mecanismos de monitorización y gestión de la red. Los objetivos de la administración de red persiguen la continuidad de la operatividad, resolución de incidencias, su uso eficiente, reducción de costes, seguridad, control de cambios y gestión de la configuración entre otros. Administrar una red precisa la información referente a su estado y subsistemas, en forma de registros, eventos, etc. de forma que se presente a los administradores de forma legible y manejable. La información, debe almacenarse y estar disponible para su análisis o tomar las acciones correctivas necesarias. Se recomienda que el sistema de administración sea abierto, capaz de soportar distintos protocolos y arquitecturas de red. La administración de usuarios debe incluir la información de los procedimientos de uso del sistema y documentarlo con guías de uso. La asignación de permisos para el acceso a los recursos y la definición de grupos, dominios o unidades organizativas es responsabilidad del administrador. En general serán necesarios servidores de consulta tipo DNS o WINS para localizar los recursos. La administración se facilita con una definición correcta de grupos, dominios, UO, etc. Los grupos podrán tener un perfil de seguridad, distribución, de dominio u otro. En cuanto a la administración de impresoras, suele ser normal implementar un servidor para esas tareas. Los SO incluyen facilidades como la compartición o la definición de prioridades y permisos. Los servidores de archivos, por su parte, agilizan la administración de ficheros en red, en lo relativo a permisos de acceso y recuperación remota de información. Otro de los pilares de la administración es la monitorización de red, que facilita en tiempo real el mantenimiento del nivel de operatividad del sistema y su correcto rendimiento. La monitorización debe incluir la redacción de informes periódicos sobre los aspectos de gestión de la red, tales como la configuración, respuesta frente a errores o su seguridad. Un esquema primario de las tareas de administración de un sistema en red local, podría estructurarse en los aspectos de direccionamiento, gestión de usuarios, gestión de recursos, administración de servicios y gestión de la red. — Direccionamiento. El administrador de red debe proveer el plan de direccionamiento de la capa de red. Lo funcional es utilizar un servidor DHCP, que lógicamente debe ser configurado y administrado, con especial atención a los aspectos de seguridad. El direccionamiento debe tener en cuenta la segmentación de la red, si se utilizan VLANs y la correcta aplicación del subnetting. Para ello, 3-4 Administración de redes de área local la configuración de routers y switches debe ser cuidadosa. Del mismo modo, si se utiliza, como es habitual, direccionamiento privado en la LAN, deben proveerse las direcciones públicas de acceso a Internet, en general con los servicios NAT. Otros aspectos del direccionamiento son la publicación de las direcciones de puertas de enlace, pasarelas y servidores DNS, como casos típicos, que también suele proveer el servidor DHCP. — Gestión de usuarios. La asignación de usuarios, su agrupación en unidades superiores como grupos o dominios y sobre todo la administración de sus permisos es una de las labores más importantes de la administración de red. Los usuarios, entendidos como personas, no como cuentas, deben ser informados de las normas y cambios en la operativa de trabajo y utilización del sistema, en general confeccionando guías y recomendaciones de utilización de los sistemas y recursos. Los SO ofrecen muchas y variadas herramientas para la administración de usuarios, destacando la gestión de grupos, que agiliza la asignación de permisos, directivas de seguridad, aspectos de distribución, acceso a dominios, visibilidad y características similares. Algunas de estas herramientas son las directivas de seguridad que ofrece WS o las listas de control de acceso características en entornos tipo Unix. Además, estas utilidades suelen presentarse en entorno gráfico para una administración más intuitiva. De especial importancia es la gestión de la cuenta de usuario administrador, superusuario o “root”. Esto es debido a que al poseer todos los permisos sobre el sistema y sus recursos, su utilización debe ser cuidadosa en extremo, recomendándose su utilización únicamente en labores de administración, evitando realizar con ella tareas que pueden realizarse con cuentas de menos privilegios. — Gestión de recursos. En la gestión de recursos en red, destacan la administración de impresoras y archivos. Las herramientas para esta labor suelen ser fáciles de usar, pero un tanto laboriosas. El aspecto más importante es saber qué se está realizando con la herramienta, ya que una mala configuración puede generar situaciones no deseadas. 3-5 Sistemas y comunicaciones Tanto los sistemas WS como los de tipo Unix permiten compartir impresoras que serán accesibles a un grupo de trabajo o determinados usuarios, ofreciendo funcionalidades para gestionar sus propiedades, colas de impresión, direccionamiento y administración remota entre otras. La administración de archivos en red es un trabajo típico y delicado. Los servicios que suelen facilitar esta gestión son los estudiados y típicos como FTP, NFS con el protocolo RPC o SSL. WS utiliza otros protocolos y servicios como WINS y NetBIOS, ya presentados también. Por fin, la compatibilidad entre ambos tipos de sistemas suele implementarse con herramientas como SAMBA. La gestión de archivos debe incluir medidas de recuperación ante incidencias como la redundancia de discos y sistemas RAID. — Gestión de servicios. La administración de los servidores de red es otro de los aspectos críticos de la administración de sistemas en red, debido a las implicaciones de seguridad y rendimiento que comportan para las organizaciones. Destacan además de los servicios mencionados como DHCP, DNS, los de administración de impresión y recursos, los servicios web, cortafuegos, correo electrónico o los de BBDD, como más representativos. Pueden utilizarse los servidores que integran los SO de red o decidir instalar otras soluciones comerciales o libres. La recomendación general es utilizar máquinas dedicadas para cada servicio, decisión que deberá responder a compromisos de eficiencia, carga de trabajo, etc. El aspecto más delicado de la administración de los servidores y los servicios que implementan es su configuración. A parte de la complejidad, las implicaciones de seguridad son graves. Por tanto la configuración y sobre todo la administración y constante monitorización son cruciales. Sin embargo las herramientas para realizar tales labores suelen ser cómodas e intuitivas. — Gestión de red. Por último, la administración de red, entendida como aspecto global se referiría a tareas propias de supervisión y mantenimiento del sistema. Incluiría el conjunto de procedimientos, actividades, informes y herramientas que permiten la monitorización y supervisión constante de los equipos y sistemas. El objetivo de la administración del sistema en red es mantener su disponibilidad, garantizar su correcto funcionando y establecer un principio de proactividad que adelante acciones ante comportamientos anómalos. De esta forma, cuando existe un problema es recomendable haber establecido umbrales para indicadores que muestren que se está en situaciones que pueden derivar en situaciones críticas. Las herramientas que facilitan estas labores utilizan protocolos de gestión de red como el ya presentado SNMP que permite una correcta gestión remota de los sistemas dispersos a lo largo de la red. También se ha comentado que las máquinas dedicadas con aplicaciones de gestión de red suelen conocerse como NMS (Network Management Station). 3-6 Administración de redes de área local Las herramientas de gestión de red suelen ofrecer facilidades de gestión de configuración, guardando un inventario del “hardware” y “software” instalado y operativo en el sistema, recogiendo periódicamente la información del estado de los dispositivos o gestionando su actualización. También facilitan la gestión de incidencias, siendo fundamentales en la proactividad comentada. Mediante configuración de umbrales como operación típica se puede anticipar la detección, diagnóstico y reparación de averías en la red. A partir de la recepción de mensajes de error o la falta de respuesta de un equipo pueden localizarse los puntos de fallo. Otra de las utilidades más importantes de estas herramientas es la evaluación del rendimiento de la red. Mediante el análisis estadístico de los factores que se consideren críticos en el desempeño, como los tiempos de respuesta o el tráfico cursado, puede estimarse el grado de eficiencia del sistema, su capacidad máxima, proponer mejoras, ampliaciones o procedimientos de optimización. La administración de la seguridad de la red es uno de los aspectos más amplios y comprometidos. La protección del sistema y sobre todo de la información puede es vital para la continuidad de la organización ante situaciones de crisis o emergencia. Herramientas para gestión de seguridad existen muchas y algunas ya se han expuesto en el tema anterior. Incidir en la necesidad de configurar correctamente los ficheros de registro o “log”, duplicidad geográfica de servidores o redundancia de discos y copias de seguridad. Dependiendo de la entidad de la información y la organización de que se trate, la legislación obliga a establecer algunas de estas medidas de seguridad que deben incluirse en los sistemas de red. Lógicamente la implantación de la seguridad es algo caro y generará un compromiso entre el tipo de empresa, su facturación y las obligaciones y responsabilidad que pueda asumir. En cualquier caso, si el compromiso se supera, debe ser claro que la no implantación de la seguridad siempre será más caro, en el largo plazo, que la correcta implantación de la misma. 3. Gestión de usuarios Los usuarios se modelan en un sistema con una cuenta de usuario. Ésta, define los datos relativos a su administración como el propietario, contraseña de acceso o grupos a que pertenece. Una cuenta local se define en una máquina. El acceso se realiza contra una BBDD local. La administración es local, permitiendo establecer políticas de seguridad y se realiza con lo que se conoce como Administrador de usuarios o Administrador de usuarios para dominios. Una cuenta de dominio es la perteneciente a uno en cuestión. El login requiere usuario, contraseña y dominio al que se accede y se valida contra una BBDD del servidor de dominio. 3-7 Sistemas y comunicaciones Un grupo es un conjunto de usuarios reunidos con algún criterio. La administración de grupos asigna los mismos permisos a todos sus miembros. Un dominio es un grupo lógico de máquinas que comparten cuentas de usuarios y seguridad de los recursos. Se compone de un servidor de dominio que administra cuentas y recursos; otros servidores; y estaciones de trabajo. Los usuarios de un mismo dominio tendrán un inicio de sesión único en el servidor de dominio para acceder a los recursos de red, una cuenta única para acceder a máquinas del dominio, etc. La gestión de usuarios incluye aspectos lógicos y burocráticos. A parte de la definición de un usuario en el sistema debe existir una política de usuarios; disponer de algún tipo de formulario de registro bien definido, donde se incluya la firma del sujeto, aceptando condiciones, responsabilidades y posibilidad de acreditación que supone ser usuario del sistema. Los procesos de registro (log, accounting) permiten dejar evidencia del uso de los recursos por parte de usuarios y procesos. La forma de configurar el sistema de registro depende del entorno y el SO. Suele realizarse en el núcleo, volcándose a ficheros cada cierto tiempo. La gestión de usuarios y grupos debe prever la copia de seguridad del área de disco de usuario y agrupar directorios de usuarios de forma lógica, especialmente si el número es grande. Los registros (log) de actividad deben monitorizarse y analizarse. Otros aspectos son la política de asignación de cuotas de disco a usuarios y grupos y el establecimiento de rutinas de comprobación de los mismos para el control de la correcta operación. 3.1. Entornos Windows En redes Microsoft se distinguen dos modelos: — Grupo de trabajo. Cada equipo define sus usuarios y directivas de seguridad. — Dominio. Los equipos de red comparten el listado de usuarios y directivas de seguridad, que se almacenan en los controladores de dominio. Los grupos de trabajo funcionan bien en redes pequeñas o domésticas. El modelo de dominio, indica escala; empresas u organizaciones. En entornos Windows se basan en el servicio de directorio activo (AD, Active Directory) y DNS. Para instalar AD en Windows se usa el comando DCPROMO (promover a controlador de dominio). En una red WS (grupo de trabajo o dominio) se pueden crear cuentas locales y de dominio. La herramienta administrativa para gestión se denomina Administrador de usuarios para dominios. Las cuentas que crea WS por defecto son la de Invitado, deshabilitada por defecto, y la de Administrador, que dispone de los máximos privilegios en el sistema (similar a root en Unix). La averiguación de usuarios de WS en la máquina local se puede realizar con los comandos net. Los usuarios se almacenan en WS, en el fichero SAM (Secu3-8 Administración de redes de área local rity Account Manager), junto a sus contraseñas. El archivo SAM se encuentra en %Windir%/system32/config/SAM. En %Windir%/repair/SAM existe una copia. El SAM se guarda encriptado y no se puede listar directamente. Existen herramientas para desencriptarlo, como Ophcraft. Un método para prevenir este ataque es el uso de contraseñas fuertes. Siguiendo con la filosofía de las cuentas de usuario, WS también distingue dos tipos de grupo: local y global. Uno local se forma con cuentas locales de usuarios y grupos globales de otros dominios. Se usan para asignar permisos de acceso a un recurso a usuarios. Un grupo global lo forman sólo cuentas de dominio. Su principal función es agrupar cuentas de dominio. Un grupo puede ser: — Global. Puede contener usuarios de un mismo dominio. — Local. Puede contener usuarios y grupos globales de distintos dominios. — Universal. Puede contener usuarios, grupos globales y grupos de distintos dominios. El sistema de archivos NTFS incorpora seguridad a nivel de archivos y carpetas. Permite definir listas de control de acceso (ACL, Access Control List) para definir de forma independiente los permisos para cada usuario o grupo. WS crea por defecto grupos locales, globales y de sistema con privilegios predefinidos. Los grupos locales por defecto son usuarios (comunes), administradores (con privilegios), invitados (usuarios sin cuentas con privilegios limitados) y operadores de copia de seguridad. En un servidor de dominio, además se definen los grupos locales operadores de cuentas, de servidores y de impresión y los grupos globales administradores, usuarios e invitados de dominio. Los usuarios se convierten en miembros de los grupos de sistema automáticamente al acceder a la red. Los grupos de sistema en cualquier WS son Los permisos de Windows son más completos que los nativos de Unix, aunque Unix también tiene la opción de utilizar ACLs. La administración de servidores Windows se suele realizar con consolas administrativas en la ruta Inicio, Programas, Herramientas administrativas. 3.2. Entornos Unix Como se ha expuesto, un usuario, en entorno informático, es la información que identifica a una persona o entidad que usa un sistema. Un usuario puede tener acceso a recursos desde distintas máquinas. Si existen muchos usuarios se suelen agrupar para su administración en un grupo. Los grupos, permiten asignar características comunes al conjunto para evitar tener que definirlas una a una. Averiguar usuarios y grupos existentes en un sistema es un factor de ataque para un intruso. Una buena gestión de usuarios preserva su seguridad. 3-9 Sistemas y comunicaciones En entornos Unix un usuario representa una conexión lógica al sistema. Más de una persona podría conectarse con el mismo usuario, aunque no es recomendable. Un grupo sigue siendo un conjunto de usuarios, que en general comparten permisos. Cuando se da de alta un usuario, por defecto se crea un grupo al que queda asociado. Existen dos perfiles de cuentas para usuarios: “root” o administrador con privilegios y usuario (convencional), con permisos limitados. Toda la información de usuarios, grupos, características y contraseñas se almacena en los archivos /etc/psswd, /etc/shadow y /etc/group. Para gestionar los grupos es conveniente usar comandos del sistema, antes que modificar directamente los ficheros. El contenido de estos ficheros es: — /etc/psswd. Almacena los usuarios del sistema e información complementaria. Posee permisos de lectura para el propietario (root), grupo y usuarios. — /etc/shadow. Almacena la contraseña cifrada de cada usuario. Sólo tiene permisos de lectura para “root”. Si existe este fichero, en /etc/psswd no se ve la contraseña. Se aconseja usar este fichero. — /etc/group. Refleja la pertenencia de un usuario a cada grupo. Un usuario puede pertenecer a varios grupos, pero como poco pertenecerá al suyo propio, definido en /etc/psswd. En entornos Unix, a cada archivo se asigna un propietario, grupo y permisos. Por ejemplo, un archivo con los permisos “drwx-w-r-x”, indica que es un directorio (d), cuyo dueño posee todos los permisos (rwx), el grupo sólo permisos de escritura (-w-) y el resto, lectura y ejecución (r-x). El acceso a servidores Unix se hace con nombre y contraseña que se almacena cifrada, en general, con los algoritmos de cifrado DES y MD5. Aun usando un fichero /etc/shadow y teniendo cifradas las contraseñas, éstas pueden romperse con programas (crack) que ejecutan ataques a contraseñas. Por tanto, debe establecerse una política de contraseñas que dificulte este tipo de ataque. Los módulos PAM son las siglas inglesas de Módulos de Autentificación Conectables. Se usan para que los administradores establezcan una política de autentificación sin tener que recompilar programas de autentificación del sistema y conectar módulos de autentificación a un determinado programa con ficheros de configuración sencillos. Por tanto, PAM supone un método útil de seguridad. La configuración PAM se realiza en /etc/pam.d, donde una serie de ficheros representan cada programa al que aplicar los módulos PAM especificados. Para controlar el acceso a los servicios, existen 4 tipos de módulos PAM, auth, que ofrecen autentificación, account, para el control de la misma (p.ej. que una cuenta no esté caducada), password, que determinan contraseñas y session, usados tras la autentificación de usuario. Un ejemplo, sería el uso del servicio, login, que posee su fichero de configuración en /etc/pam.d/login. Cuando alguien hiciese login en el sistema pasará por los módulos y en el orden especificado. 3-10 Administración de redes de área local Por su parte, el archivo limits.conf (en /etc/security) permite definir límites de uso de recursos para usuarios. Permite limitar procesos, memoria, logins, etc. En entornos Unix son famosos los volcados de memoria o “core dumps”, dados al fallar la ejecución de un programa. El fichero “core” contiene información sobre el estado de la memoria al darse el error. Como la memoria puede contener en un momento información sobre ficheros o procesos en los que se trabaje en ese momento, la información volcada puede contener datos confidenciales, como los del fichero /etc/shadow. Para evitar los volcados, se puede editar el fichero /etc/security/limits.conf, configurándolo apropiadamente. El concepto de dominio en entornos Unix difiere del de WS. Lo que se generaliza aquí es la utilización de los servicios NIS (Network Information Service) y NFS (Network File System). El primero centraliza los datos de gestión comunes en la red y NFS ofrece un acceso eficaz a ficheros compartidos en red. La administración de seguridad en estos entornos está muy lograda; es parte de la concepción del sistema y dispone de sus herramientas particulares. Por ejemplo, para realizar copias de seguridad o en aspectos de auditoría del sistema. La práctica totalidad de los eventos del sistema se registran en archivos de log, configurables para especificar la información a recoger. 4. Gestión de dispositivos Un dispositivo es un elemento que permite realizar operaciones de entrada y salida. Según su situación respecto al sistema operativo los dispositivos se clasifican en: — Dispositivos físicos. Son dispositivos hardware como discos o impresoras. — Dispositivos lógicos. Son una abstracción conceptual de un dispositivo. Los representa el SO como el caso de archivos de dispositivos o las tuberías (pipes) para comunicación entre procesos. Suele darse correspondencia entre dispositivos lógicos y físicos, como las impresoras o los puertos de comunicación. Pero hay casos en que no hay correspondencia; caso de las tuberías, p.ej. El SO abstrae al usuario de las características del dispositivo, facilitando su uso. Para ello, el fabricante suele proporcionar un “software” de control (device driver) a bajo nivel, que se instala en el SO con programas de alto nivel que también heredan el nombre de driver. El SO se comunica con el controlador de un dispositivo y éste se gestiona el “hardware”. El SO puede habilitar dispositivos lógicos que son accesibles directamente por el usuario. Por ejemplo: el dispositivo PRN en WS o el dispositivo /dev/lpr en Unix hacen referencia a una impresora, independientemente de su fabricante. Al enviar un trabajo al dispositivo lógico éste gestionará la comunicación física. 3-11 Sistemas y comunicaciones En entornos Windows, se usan palabras reservadas para referirse a dispositivos: CON, PRN, LPT1, AUX, COM1, etc. Destacan: — Dispositivo CON. Abreviatura de consola. Se refiere a teclado y monitor. Como el primero es un dispositivo de entrada y el segundo de salida, no existe ambigüedad. — Dispositivo PRN. Abreviatura de “printer”. Se refiere a la impresora conectada al primer puerto paralelo (LPT1). También existen dispositivos específicos para indicar los puertos paralelo (LPT) y los serie (COM). El dispositivo AUX hace referencia a un puerto auxiliar. — Dispositivo NUL. Abreviatura de “null”. Se refiere a un dispositivo virtual llamado nulo. Se usa para simular transferencias de información. Utilizado como entrada de datos, no hay entrada y usado como salida, no hay salida. Por ejemplo, al enviar mensajes de salida de un programa al dispositivo nulo no se mostrará nada en pantalla aunque el programa lo simulará. En entornos Unix cada dispositivo físico tiene una entrada lógica asociada en el sistema. Los archivos de dispositivos se ubican en /dev. Los principales dispositivos en entornos Unix son: — Dispositivos IDE. /dev/hda. Maestro del primer bus IDE mer bus IDE /dev/hdb. Esclavo del pri- /dev/hdc. Maestro del segundo bus IDE segundo bus IDE /dev/hdd. Esclavo del En caso de discos duros, se añade al final el número de la partición (lógica) a la que se hace referencia, siendo el 1 la primera partición del disco: /dev/hda1, etc. 3-12 — Discos duros SCSI. Se nombran de forma similar como /dev/sd0, sd1, etc. — CD-ROM SCSI. Siguen el convenio en la forma /dev/scd0, scd1, etc. — Puertos serie. Mismo convenio. Ejemplos son /dev/ttyS0 para el primer puerto serie (COM1), /dev/ttyS1, para el segundo, etc. — Puertos paralelos. Mismo convenio. Ejemplo /dev/lp0 para el primer puerto paralelo (LPT1). — Terminal Virtual (consola). /dev/tty1, primer terminal y así sucesivamente. — Otros dispositivos. /eth0, /eth1… para tarjetas de red Ethernet. /audio para tarjetas de sonido y /null para terminal nulo, por citar tres ejemplos. Administración de redes de área local Los dispositivos Unix se clasifican en dispositivos de bloque y de caracteres. En el primer grupo se enmarcan discos duros, CD-ROM, etc. Estos dispositivos deben montarse (comando mount) para ser usados, aunque, este proceso se ha automatizado en la mayoría de casos. Los dispositivos de caracteres engloban puertos de comunicaciones, impresoras, etc. 4.1. Gestión de discos Las pistas de un disco se dividen en sectores, la unidad mínima que se puede leer o escribir. En general son sectores de 512 bytes. La estructura lógica de un disco, distingue: — Sector de arranque (Master Boot Record). El que contiene la tabla de particiones y un pequeño programa de inicialización, ejecutado al arrancar la máquina. Su cometido es leer la tabla de particiones y ceder el control a la partición primaria activa. — Espacio particionado. Con las particiones del disco. Una partición es una división de tamaño fijo de un disco asociada a una unidad lógica (C, D…. en WS). Una partición ocupa un bloque de cilindros contiguos del disco duro. Cada una puede definir un sistema de archivos distinto. — Espacio sin particionar. Se gestiona teniendo en cuenta que la tabla de particiones del disco duro contiene un máximo de 4 entradas, lo que determina el número máximo de particiones primarias a crear en un disco duro. Para ampliar ese límite de 4 se puede usar una entrada para definir una partición extendida (por tanto, como máximo habrá 3 particiones primarias y 1 extendida). En la partición extendida ya se podrán crear tantas unidades lógicas como se desee. Las particiones primarias se usan en general para SO (ya que son arrancables) y las lógicas para almacenamiento, ya que no son directamente arrancables. Para indicar qué partición primaria arranca se marca como partición activa. Antes de usar un disco duro se deben definir sus particiones. Una vez hecho, se les da un formato, es decir, la estructura del almacenamiento con un determinado sistema de archivos. En un sistema de archivos FAT (propio de sistemas Windows), la estructura lógica de una partición está formada por: sector de arranque, copias de la FAT, directorio raíz y área de datos. La FAT (File Allocate Table, tabla de asignación de archivos) es el índice del disco. Indica los grupos (clusters o unidades de asignación) que usa cada archivo, grupos libres y defectuosos. El concepto de grupo usado por los SO se refiere al bloque mínimo que el sistema puede leer o escribir en disco. Un grupo estará formado por 1 o varios sectores físicos del disco. Cuanto mayor sea el grupo más espacio se desaprovechará al almacenar archivos pequeños. Un archivo de 1 byte podría llegar a ocupar 32 KB en disco si el grupo fuesen 64 sectores. Es la idea de fragmentación. La estructura de una partición Unix tradicional está formada por: bloque de arranque, superbloque, vector de inodos y bloques de datos. 3-13 Sistemas y comunicaciones 4.1.1. Herramientas Además de herramientas de creación de particiones y formateo, los SO suelen incorporar programas de mantenimiento y utilidades de disco. Las más comunes: — Desfragmentador. Es una herramienta para reducir la fragmentación generada al grabar en disco los trozos de cada fichero. Esto optimiza el almacenamiento al acelerar la lectura de datos. Consiste en reorganizar esos trozos de los ficheros de forma compacta. Una organización poco fragmentada evita que los cabezales de lectura y escritura del disco realicen muchos movimientos. En entornos Windows se puede usar el comando defrag o la herramienta “Desfragmentador de disco”. En entornos Unix no se requieren estas herramientas puesto que su organización evita estos problemas. — Comprobación de errores. Analizan el disco en busca de incoherencias en el sistema de archivos. Por ejemplo, dos archivos apuntando al mismo contenido generará un error tipo “vínculos cruzados”. Ejemplo de este tipo de herramientas en entornos Windows es ScanDisk, y en entornos Unix fsck, en modo comando. Los errores en la estructura lógica del disco se suelen dar por cortes de luz o cierres del sistema impropios. En estos casos, los SO suelen ejecutar utilidades de comprobación al siguiente arranque del sistema. — Compresión. Consiste en reducir el tamaño de los datos sin pérdida de información. El espacio ganado tiene un coste temporal, ya que los algoritmos de compresión cargan el proceso. Como la compresión depende de la herramienta usada, podrían darse problemas de incompatibilidades o pérdida de datos en caso de error. Los SO de Microsoft incorporan mecanismos de compresión integrados. En entornos Unix el comando para comprimir archivos es “gzip”. Para comprimir un árbol de directorios completo, se usa el comando tar para compactarlo a un único archivo (.tar) seguido del comando “gzip” para comprimirlo (.gz). — Copia de seguridad. La copia de seguridad o backup del contenido del disco en otro medio de almacenamiento es fundamental desde el punto de vista del valor de la información. Se distinguen tres tipos de copias de seguridad: completas, incrementales (o progresivas) y diferenciales. Las primeras realizan una copia de todo el contenido. Las copias incrementales almacenan los datos nuevos o modificados desde la última copia incremental. Las copias diferenciales almacenan los datos nuevos o modificados desde la última copia completa. La diferencia entre éstas últimas está, por tanto, en que para recuperar los datos de una copia incremental se necesitan la última copia completa y todas las incrementales hasta el punto de restauración, mientras en las copias diferenciales precisan la última copia completa y la última diferencial. Los SO suelen incluir herramientas de copias de seguridad. 3-14 Administración de redes de área local 4.1.2. Sistemas RAID RAID es un sistema de redundancia de discos independientes, según su traducción del inglés. Se caracterizan por ser tolerantes a errores y usar un conjunto de discos organizados de forma que si uno falla el ordenador siga trabajando. Esto se consigue con información redundante, que no sería necesaria si no se diese el error. La gestión de sistemas RAID es transparente al usuario. Puede realizarse por “hardware”, con tarjetas RAID específicas o por “”software””, como herramienta del SO. La forma “hardware”, como casi siempre, es más eficiente, al liberar a la CPU de esos procesos, y más cara. Los sistemas RAID suelen distinguir varios niveles de organización: — RAID 0 (disk striping, discos en bandas). La información se distribuye entre los discos del conjunto. Esto acelera la transferencia al acceder todos los discos a un mismo archivo. No es tolerante a fallos. Si falla un disco se pierde la información. Se necesitan 2 discos como mínimo para implementar RAID 0. — RAID 1 (disk mirroring, espejo de discos). Consiste en usar discos adicionales que dupliquen la información. Las escrituras se realizan en todos los discos para mantener la coherencia. Se garantiza que ante el fallo de un disco, el sistema continúe funcionando. Suele implementarse RAID 1 con 2 discos. Lógicamente, el máximo de información a almacenar es la capacidad de un disco, ya que el segundo (espejo) es redundante. RAID 0 puede combinarse con RAID 1 constituyendo el sistema RAID 10 o RAID 1+0. La información se distribuye en bandas por varios discos y cada disco se duplica, por lo que se requiere un número par de discos. — RAID 2. Usa códigos de redundancia como el de Hamming, para detección y/o corrección de errores. Esta técnica se incluye de forma nativa en los discos, por lo que ha dejado de utilizarse. — RAID 3. Se usa un disco para almacenar la paridad. La información de redundancia se distribuye entre los discos del conjunto. En caso de fallo, se reconstruye la información con un XOR (OR exclusivo) del resto de discos. Por tanto, precisa al menos 3 discos. Como los discos funcionan de forma síncrona, posee un coste en rendimiento, en especial en sistemas transaccionales en que se den muchos accesos de poco volumen. — RAID 4. Es similar a RAID 3, distribuyendo los datos a nivel de bloque y permitiendo el acceso individual a cada disco. Aumenta el rendimiento en pequeñas lecturas que afecten a un solo disco. — RAID 5. La información de paridad se almacena de forma distribuida, eliminando el cuello de botella del disco de paridad de los RAID anteriores. Es más eficiente; ofrece mayor tasa de rendimiento y es más barato por unidad de información. Precisa al menos 3 discos, obteniendo el mejor rendimiento a partir de 7 unidades. 3-15 Sistemas y comunicaciones Los sistemas RAID 3, 4 y 5 son conocidos como “disk striping with parity” (discos en bandas con paridad). La capacidad máxima, se obtiene como suma de la capacidad de los discos menos la del disco redundante. RAID 0 no incluye tolerancia, por lo que su capacidad es la del conjunto. La capacidad de RAID 1 es la de un disco. Algunos sistemas soportan “hot swap” (intercambio en caliente), que permite reemplazar un disco que ha fallado por otro nuevo, sin apagar el sistema. La técnica “hot spare” (reserva en caliente) se refiere a mantener 1 disco adicional instalado en el sistema, en reserva, a la espera ante fallos. Los entornos Windows proporcionan niveles RAID 0, 1 y 5 por “software” (Menú Administración de equipos, Administración de discos o similares). 4.2. Gestión de impresoras Las impresoras son periféricos críticos por su uso y generación de problemas. En general, distinguen dos tipos de instalación, como impresoras locales e impresoras en red. Una impresora local se refiere a la que se conecta directamente al equipo en cuestión. Una impresora en red es aquella a la que se accede a su servicio a través de la conexión de red. Una impresora en red requiere la configuración de un servidor de impresión, que ofrezca su servicio al resto de equipos. Pueden conectarse directamente al servidor de impresión, aunque lo normal, es situarlas en otras ubicaciones. La comunicación se hace entonces configurando los parámetros de red de la impresora, que sería gestionada por el servidor de impresión, en particular, para las colas de impresión, ya que la comunicación entre equipos es más rápida que la propia impresión. En entornos Windows, para la instalación de impresoras se dispone el “Asistente para agregar impresoras”, que ofrece la posibilidad de instalar una impresora en red o local. Una vez en funcionamiento, se puede consultar la cola de impresión, cambiar prioridades, etc. El administrador del servidor será el que controle la cola. Los usuarios sólo tendrán permisos sobre sus trabajos enviados a imprimir. En entornos Unix las impresoras en red se configuran con TCP/IP. Las impresoras se definen en el archivo /etc/printcap, cuya configuración presenta un aspecto similar al siguiente: rlaser5|Impresora remota laser:\ :lp=/dev/null:\ :rm=192.168.2.63:\ :rp=impresora:\ :sd=/var/spool/lpd/remote La línea “lp” indica el archivo de dispositivo (si la impresora fuese local se usaría /dev/lp0), “rm” la dirección IP de la impresora en red, “rp” el nombre de impresora remota y “sd” indica el directorio de la cola de impresión. 3-16 Administración de redes de área local 5. Monitorización y Control de Tráfico La optimización del tráfico de red es consecuencia de una adecuada planificación, organización y de la realización de tareas preventivas y correctivas que se basan en la monitorización y control de dicho tráfico. De forma similar a cómo las cámaras de videovigilancia, los semáforos y la cartelería luminosa de señalización regulan el tráfico rodado, el sistema de monitorización y control del tráfico de datos permite tomar decisiones, prevenir y corregir estados de saturación o ineficiencia que pueden tener muy diversos desencadenantes. Por ejemplo, una tarjeta de red defectuosa o un equipo portátil no controlado pueden generar problemas de lentitud y es posible que sea muy difícil diagnosticar la causa de forma ágil. Las herramientas de monitorización serán el principal recurso de diagnóstico mediante la auditoría del tráfico de red. La mera observación del tráfico mediante el “escaneo” de red nos puede ayudar a identificar los posibles fallos, aunque pueden darse casos complicados de diagnosticar como ocurre con ciertos virus, que enmascaran las direcciones IPs fuentes del tráfico irregular. Una vez diagnosticado el problema, las acciones correctoras precisas pueden ir desde desconectar ciertos equipos, cambiar reglas de enrutamiento según proceda o habilitar nuevas medidas de descongestión del tráfico. 3-17 Sistemas y comunicaciones Las funciones de gestión de red se pueden agrupar en dos categorías: — Monitorización, basada principalmente en la “lectura” del tráfico. Su objetivo es observar y analizar el estado y comportamiento de la configuración de red y sus componentes. — Control, basada principalmente en acciones correctora. Su objetivo es la configuración de los parámetros de los componentes de red. La monitorización recogerá información sobre el tráfico de diverso tipo. — Estática: configuración actual de la red y de sus elementos (el número de puertos de un router). Esta información es generada y almacenada por el propio elemento de red (un router almacena su propia configuración). — Dinámica: información relacionada con eventos en la red (la transmisión de un paquete por la red). Esta información puede almacenarla el propio elemento u otro encargado de ello; en una LAN cada elemento puede almacenar el número total de paquetes que envía, o un elemento de la LAN puede estar escuchando y recoger esa información (se denomina monitor remoto). — Estadística: información que puede ser derivada de la información dinámica (el número medio de paquetes transmitidos por unidad de tiempo por un sistema final) de forma que puede enviarse la información dinámica al gestor de red para que realice las estadísticas. Los cuatro elementos principales que intervienen en la monitorización son: 1. La propia aplicación de monitorización que gestiona la visibilidad de la red para el usuario. 2. El gestor o módulo de la red que recoge la información de los elementos de la red. 3. El agente que recoge y almacena información de uno o varios elementos de la red y los envía al gestor. 4. Los objetos gestionados y la información de gestión que representa los recursos de red y su actividad. La información de monitorización es recopilada y almacenada por los agentes y enviada a uno o más gestores. Para el envío de dicha información se usan dos técnicas: 3-18 — Sondeo (polling): el gestor solicita información al agente que responderá a la petición. — Informe de eventos (event reporting): la iniciativa de la comunicación es tomada por el agente teniendo que estar por tanto el gestor a la espera de información de este tipo. Administración de redes de área local Ambas técnicas se suelen usar conjuntamente en la monitorización de una red. SNMP, OSI y los sistemas propietarios le dan al usuario bastante flexibilidad para determinar el énfasis con que utiliza cada uno de los métodos. La elección de uno u otro dependerá de factores como: — La cantidad de tráfico generado por cada método. — Respuesta ante situaciones críticas. — Capacidad de procesamiento de los dispositivos gestionados. — La cantidad de tiempo requerida para que el gestor de la red reciba la información. — Las aplicaciones de gestión que se utilicen Los cuatro elementos principales que intervienen en el control son: 1. La propia aplicación de control que gestiona las funciones de configuración y seguridad. 2. El gestor que es el módulo que envía peticiones de operación al resto de los elementos de la red. 3. El agente que recibe los comandos de control y actúa convenientemente sobre los elementos de la red que depende de él. 4. Los objetos gestionados y la información de gestión que representan los recursos de red y su actividad. Igualmente la propia estación que ejecuta la aplicación de control es también un elemento de la red y debe gestionarse. El gestor comenzará siempre la comunicación enviando comandos a los agentes y, en función del tipo de comando, puede haber una respuesta del agente o no. Los comandos son generados por diversos motivos: — Por iniciativa del administrador de la red. — Por comandos preprogramados que pueden ser periódicos o como respuesta a eventos o sucesos. Estableceremos las políticas de gestión de la red en función de la definición de un cuadro de mando de indicadores donde estableceremos: — Medidas orientadas a los servicios como la disponibilidad, el tiempo de respuesta o la fiabilidad. — Medidas orientadas a la eficiencia como las prestaciones (througtput) o la utilización. 3-19 Sistemas y comunicaciones La disponibilidad se define como el porcentaje de tiempo que un elemento de la red o una aplicación está disponible para el usuario, de forma que la disponibilidad de una red está basada en la fiabilidad de sus componentes. La fiabilidad de un componente es la probabilidad de que éste realice la función esperada durante un tiempo especificado bajo determinadas condiciones también especificadas. La fiabilidad de un componente suele expresarse por los fabricantes por su MTBF (mean time between failures). Idealmente, los tiempos de respuesta deberían ser tan cortos como sea posible, pero casi siempre un menor tiempo de respuesta significa un mayor coste. Aunque se puede medir directamente el tiempo de respuesta global en un entorno de red, esta medida no es por sí sola suficiente para corregir problemas y planificar el crecimiento de la red. La fiabilidad de la transmisión de datos entre los equipos de la red es esencial, es útil monitorizar la tasa de errores que se produce a partir, por ejemplo, de patrones de prueba. Esto puede ser indicativo de fallos intermitentes en una línea o de la existencia de una fuente de ruido o interferencias. Igualmente las prestaciones (througtput) deben ser continuamente evaluadas, por ejemplo: — Las transacciones de un tipo determinado durante un cierto período de tiempo. — Las sesiones para una aplicación determinada durante un cierto período de tiempo. — El número de llamadas para un entorno de conmutación de circuitos. Por otra parte, la utilización real de las diferentes líneas de datos nos puede ayudar a ajustar el tráfico por cada una de ellas, estableciendo rutas alternativas o planificando el aumento o reducción de la capacidad de dichas líneas. Con ajustes de este tipo en la red se puede conseguir una mejor adecuación entre la carga planeada y la real. Como resultado de la monitorización de la red se producirán alarmas por mal funcionamiento, y ante los posibles fallos caben diversas estrategias y consideraciones de diagnóstico atendiendo a sus posibles causas y a la posibilidad de observación directa (un solo fallo puede afectar a muchos elementos, generando mucha información de fallos que puede enmascarar la causa real). A veces los procedimientos de recuperación pueden destruir evidencias importantes sobre la naturaleza del fallo, no permitiendo el diagnóstico preciso, en este contexto adquieren cada vez mayor trascendencia las técnicas de informática forense para poder detectar ante cualquier contingencia lo que ha sucedido, por ejemplo a través del examen de ficheros log, bitácoras, análisis de errores con muestras de prueba, etc. Durante el normal funcionamiento de la red la gestión de la configuración puede llevar a cabo ajustes en respuesta a comandos del usuario o en respuesta a otras funciones de gestión de red (por ejemplo, si la gestión de fallos detecta y aísla un fallo, la gestión de configuración puede reencaminar el tráfico por un camino alternativo). 3-20 Administración de redes de área local En las funciones específicas de control de tráfico de red adquiere especial importancia la gestión de configuración de recursos físicos y lógicos que permita establecer la especificación del recurso y de los atributos de ese recurso (por ejemplo: nombre, dirección, número de identificación, estados, características operacionales y versión del software). El gestor de red podrá actuar sobre esta información reparametrizando elementos de la red mediante la modificación de los diferentes atributos de configuración. Ejemplos de este tipo de operaciones pueden ser permitir al administrador “cortar” una conexión entre dos nodos o designar una dirección alternativa o de backup para utilizar en caso de que el destino primario de una petición de conexión no responda. También la gestión de configuración debe incluir mecanismos que permitan al administrador inicializar o apagar la red o una subred, así como distribuir software como versiones, actualizaciones, ejecutables, tablas y otros datos que controlen, por ejemplo, el comportamiento de un nodo a través de las tablas de encaminamiento. Los mecanismos de seguridad en la gestión de la red deben garantizar que los recursos deben ser modificables sólo por usuarios autorizados. SNMP es el protocolo por excelencia para organización de la información de red. SNMP ofrece mecanismos de descubrimiento de dispositivos, y una base de datos normalizada sobre la red, válida para la mayoría de las plataformas y dispositivos. SNMP se compone de un conjunto de normas para la gestión de la red, incluyendo una capa de aplicación del protocolo, una base de datos de esquema y un conjunto de objetos de datos. Las versiones de SNMP más utilizadas son SNMP versión 1 (SNMPv1) y SNMP versión 2 (SNMPv2). La característica de descubrimiento automático, donde los nuevos dispositivos detectados en la red se sondean automáticamente, representa a veces un riesgo de seguridad por la transmisión en texto plano de dicha información. El Protocolo Simple de Administración de Red (SNMP) es un protocolo de la capa de aplicación que facilita el intercambio de información de administración entre dispositivos de red. Los dispositivos que normalmente soportan SNMP incluyen routers, switches, servidores, estaciones de trabajo, impresoras, bastidores de módem etc. SNMP Facilita a los administradores supervisar el funcionamiento de la red, buscar y resolver problemas, y planificar el crecimiento de la red. En los usos típicos de SNMP se establecen uno o más equipos administrativos, llamados gerentes, que tienen la tarea de supervisión o la gestión de un grupo de hosts o dispositivos de red. En cada sistema gestionado se ejecuta, en todo momento, un componente de software llamado agente que comunica información de red al gerente. El protocolo permite realizar tareas de gestión de activos como la modificación de una nueva configuración a través de la modificación remota de variables. Las variables accesibles a través de SNMP están organizadas en jerarquías y almacenadas en la Base de Información de Gestión (MIB). 3-21 Sistemas y comunicaciones Una red administrada a través de SNMP consta de tres componentes clave: — Los sistemas administradores de red (Network Management Systems, NMS’s). — Los dispositivos administrados. — Los agentes. El sistema administrador de red (NMS) ejecuta las aplicaciones que supervisan y controlan a los dispositivos administrados. Un dispositivo administrado es un dispositivo que contiene un agente SNMP y reside en una red administrada. Estos recogen y almacenan información de administración, la cual es puesta a disposición de los NMS’s. Un agente es un módulo de software de administración de red que reside en un dispositivo administrado. Como herramientas populares para la monitorización de red podemos enumerar: 5.1. SolarWinds Entre sus características ofrecidas por este producto se citan: 3-22 — Supervisa y analiza estadísticas de rendimiento de red detalladas y en tiempo real para enrutadores, conmutadores, puntos de acceso inalámbrico, servidores y cualquier otro dispositivo con SNMP habilitado. — Supervisa servidores VMware® y rastrea automáticamente el rendimiento de las máquinas virtuales (VM). — Supervisa conmutadores virtualizados con la misma facilidad que los servidores físicos. — Supervisa problemas de rendimiento de canal de fibra y VSAN con alertas e informes en tiempo real. — Simplifica la administración de los componentes al proporcionar una visión unificada del estado de la red de centro de datos. — Permite conocer rápidamente el estado de los principales servicios de TI y centros de datos a través de alertas refinadas que agrupan en forma dinámica los sistemas y dispositivos relacionados; genera alertas sobre problemas reales al habilitar dependencias de alertas de red avanzadas para eventos correlacionados, condiciones sostenidas y combinaciones complejas de estados de dispositivos. — Escanea periódicamente la red para detectar cambios, indica que supervise dispositivos nuevos, proporciona capacidades de actualización para los mapas de red, y muestra automáticamente conexiones entre dispositivos. Administración de redes de área local — Muestra la red en forma gráfica y permite rastrear visualmente las estadísticas de rendimiento en tiempo real a través de mapas dinámicos de red. — Admite el análisis dispositivo por dispositivo y la visualización de información detallada de sistema. 5.2. Ethereal Es una herramienta gráfica para identificar y analizar el tráfico. Permite analizar los paquetes de datos en una red activa y desde un archivo de lectura previamente generado, como sería el caso de generar un archivo con TCPDUMP para luego analizarlo con Ethereal. A partir del año 2006 Ethereal es conocido como WireShark y hoy en día está categorizado como uno de los mejores “sniffer” junto a Nessus y Snort. Algunas de las características de WireShark son las siguientes: — Disponible para UNIX, LINUX, Windows y Mac OS. — Captura los paquetes directamente desde una interfaz de red. — Permite obtener detalladamente la información del protocolo utilizado en el paquete capturado. — Cuenta con la capacidad de importar/exportar los paquetes capturados desde/hacia otros programas. — Filtra los paquetes que cumplan con un criterio definido previamente. — Realiza la búsqueda de los paquetes que cumplan con un criterio definido previamente. — Permite obtener estadísticas. — Sus funciones gráficas son muy poderosas ya que identifica mediante el uso de colores los paquetes que cumplen con los filtros establecidos. — Es importante tener presente que WireShark no es un IDS (Instrusion Detection System) ya que no es capaz de generar una alerta cuando se presentan casos anómalos en la red. — Es un programa de software libre y multiplataforma, que podremos instalar tanto en Windows como en Mac o Linux. 3-23 Sistemas y comunicaciones 5.3. WinDump WinDump es la versión para sistemas Windows de TCPDump, un paquete disponible en Linux y Unix para capturar los paquetes de datos que circulan por la red. Tiene una gran funcionalidad, aunque falla el aspecto gráfico, ya que funciona por línea de consola. Es una herramienta de análisis muy potente y de igual modo que en el caso anterior, podemos establecer filtros para tratar de segmentar el filtrado de paquetes. 5.4. Fing Quizás se trate de una herramienta que nos ofrece menos información de la red que las dos anteriores, pero más ordenada y más estructurada. Nos ofrece toda la información recopilada como resultado del análisis: dirección IP, estado, grupo de red, sistema operativo, nombre de host, usuario etc. Al igual que en los casos anteriores se trata de un programa multiplataforma. 3-24 Tema 4 Conceptos de seguridad de los sistemas de información. Seguridad física. Seguridad lógica. Amenazas y vulnerabilidades. Infraestructura física de un CPD: acondicionamiento y equipamiento. Sistemas de gestión de incidencias. Control remoto de puestos de usuario. Sistemas y comunicaciones Guión-resumen 1. Introducción 5. Amenazas y Vulnerabilidades 2. Conceptos de seguridad de los sistemas de información 6. Infraestructura física de un CPD: Acondicionamiento y Equipamiento 3. Seguridad Física 6.1. Infraestructura física de un CPD 4. Seguridad Lógica 6.2. Edificio e instalaciones 4.1. Planificación de la seguridad 4.2. COMPUSEC / NETSEC 4.3. CRYPTOSEC 4.4. TRANSEC 4-2 6.3. Detección y extinción de incendios Conceptos de seguridad de los sistemas de información 1. Introducción Antes de abordar el estudio de los conceptos de seguridad habituales sobre sistemas de información, hay que definir conceptos de seguridad un poco más generales, como son los de activo, riesgo o vulnerabilidad. Por activo se entiende aquello que debe protegerse. En general información, pero también se refiere a personas e infraestructuras. La información destaca porque como activo, porque de ella puede depender la existencia o el colapso de una organización. Por amenaza se entiende aquello que puede causar un mal. Por vulnerable se entiende algo a lo que se puede amenazar, sobre lo que se puede proyectar un daño. Por riesgo se entiende la contingencia o proximidad de un daño, que causa impacto. La relación entre los cuatro conceptos sería, un activo sometido a amenazas, es vulnerable y entonces supone un riesgo. Expresado en forma negativa: un activo vulnerable, que no cause impacto no constituye un riesgo. A pesar de la importancia de la seguridad, es curioso que las pérdidas asociadas a fallos de seguridad crezcan debido a causas internas, en particular el uso que las personas hacen de los sistemas e información. Éstos serán objeto de la seguridad, intentando garantizar, en la medida de lo posible, confidencialidad, integridad y disponibilidad. Al hablar de seguridad se aceptan, de forma genérica, tres grandes significados del término: 1. 2. 3. Condición alcanzada por un activo al protegerlo de forma adecuada. Conjunto de medidas de protección. Condición SEGURIDAD Medidas Organización que proporciona esa condición. Organización También se acepta que el objetivo de la seguridad es proteger activos y actividades. Según el tipo de activo a proteger, se usan los términos de seguridad del personal, de información, material, de las instalaciones y las operaciones. Referida a la información, ésta puede existir en las personas, en la documentación o en sistemas TIC, acuñándose entonces el término STIC (Seguridad TIC). La seguridad del personal se repite, a un primer nivel y como dependiente de la seguridad de la información. Esto se debe a que son dos aspectos los que se cubren, la protección personal, en especial la física y la protección personal, en cuanto a información que se maneja, lo que implica aspectos como habilitaciones, necesidad de conocer o concienciación. 4-3 Sistemas y comunicaciones Personal Información Personal Material Instalación Documentación Actividades STIC SSI SIGSEC ELSEC COMSEC La seguridad TIC (STIC) se refiere a la protección de la información en los sistemas de información (SSI) y la de las señales (SIGSEC). La seguridad de las señales, a veces distingue entre la seguridad electrónica (ELSEC) y la de los sistemas de comunicaciones (COMSEC). La ELSEC se aplica a sistemas que no son de comunicaciones como sensores o sistemas de navegación. Esta distinción se debe al establecimiento de un paralelismo con la terminología de inteligencia, que identifica la inteligencia de señales (SIGINT) y distingue la inteligencia de comunicaciones (COMINT) e inteligencia electrónica (ELINT). Según la definición del término STIC, la seguridad de la información y sistemas que la tratan puede conseguirse protegiendo cada recurso que compone su configuración. Así, las medidas de seguridad, en función del objeto protegido, se pueden clasificarse en medidas: — TRANSEC. Aseguran los canales de transmisión (Seguridad de las Transmisiones). — COMPUSEC. Protegen el proceso automático de datos (Seguridad de equipos). — EMSEC. Protegen frente a emisión de radiaciones no deseadas (seguridad de las emisiones). — NETSEC. Protegen los elementos de red (Seguridad de las Redes). — CRYPTOSEC. Protegen la información con criptografía (Seguridad Criptológica). Conviene señalar que el término NETSEC está relacionado con la protección de las redes contra la modificación, destrucción o revelación de la información mientras circula por ellas, diferenciándose así del término TRANSEC, vinculado este último con la prevención contra la obtención de 4-4 Conceptos de seguridad de los sistemas de información información por medio de la interceptación, radiolocalización y análisis de las señales electromagnéticas. 2. Conceptos de seguridad de los sistemas de información La seguridad de los sistemas de información podría definirse como su capacidad de resistir, con un determinado nivel de confianza, los accidentes o acciones ilícitas que comprometan la confidencialidad, integridad, disponibilidad y autenticidad de la información y servicios que se gestionan. La confianza es la esperanza que se tiene en alguien o algo. Por tanto confiar es dar esperanza a alguien de que conseguirá lo que desea. La seguridad entonces puede entenderse como las acciones orientadas a eliminar los riesgos o sus consecuencias, el impacto. Se establecen tres planos de actuación, la defensa, orientada a disminuir la probabilidad de incidentes, el aseguramiento, que pretende disminuir las consecuencias al producirse un incidente y la denuncia o identificación de causas o causantes de los daños. SEGURIDAD SEGURIDAD LÓGICA Confidencialidad Integridad AMENAZA IMPACTO SEGURIDAD FÍSICA Vulnerabilidad RIESGO Disponibilidad Autenticidad Como se observa, la definición de seguridad tiene sus matices, pero como idea general, puede resumirse en garantizar la confidencialidad, la integridad, disponibilidad y no repudio de la información (autenticidad). 4-5 Sistemas y comunicaciones En la norma ISO/IEC 17799 sólo se habla de los tres primeros y se conocen en conjunto como medidas CIA, por sus siglas inglesas, Confidentialy, Integrity, Availability. — Confidencialidad. Se refiere a la situación en que sólo aquellos entes autorizados tengan acceso a la información que necesiten. Su fundamento es claro, por ejemplo en el caso de un secreto industrial, ya que no es deseable que la competencia tenga acceso a cierta información. — Integridad. Es el aspecto de seguridad que intenta garantizar que determinada información no sea modificada. Sea una transferencia bancaria. Si un intruso, sin conocer la información que se intercambia, es capaz de modificarla puede generar un riesgo, ya que no es lo mismo realizar una transferencia por un importe, que por otro, por ejemplo, muy elevado. La disponibilidad es la característica que garantiza que la información estará presente siempre que se requiera. — Autenticidad (o No-Repudio). Característica que asegura la identidad u origen, es decir, la garantía que demuestra que alguien que genera una información, no podrá retractarse de su acción. El ejemplo típico, es el de una transacción en que se compran acciones en bolsa. Si las acciones se desploman, debe garantizarse que el emisor de la información no niegue la orden de compra. Puede decirse que son tres los componentes a proteger: “hw”, “sw” e información. El acceso a la información se realiza a través del “hw”, lo que implica al mundo físico, objeto de estudio de la seguridad física, y a través del “sw”, eje de la seguridad lógica. Con la protección del “hw” y el “sw” se persigue la protección de la información, aunque ésta incluye otros aspectos. La información, como intangible, en general no es directamente valorable. Si falla el “hw”, por ejemplo, puede estimarse casi instantáneamente qué pérdida se sufre. De igual forma con el “sw”, con matices. Pero la pérdida de información, no siempre es cuantificable, y menos si atiende a la dignidad de las personas. Teniendo en cuenta los activos a proteger y los tipos de amenazas que existen se concluye que la seguridad no es un producto que pueda comprarse e instalarse a modo de antivirus. Debe ser entendida como un proceso continuo que requiere una monitorización y actualización permanente. Esta filosofía desemboca en la definición de unas políticas de seguridad, que se basará en una serie de normas y prácticas que los responsables de seguridad de la empresa deberán implementar y cuidar de su operación diaria, estableciendo los procedimientos y rutinas que se consideren necesarios. Para dotar a un sistema de cierto grado de seguridad, deben implementarse servicios orientados a garantizar ciertas condiciones. Estos servicios se condensan en el modelo CIA. Pero, hay que tener en cuenta otros servicios de seguridad, como son los siguientes. 4-6 — Trazabilidad. Asegura que se podrá determinar quién hizo qué y en qué momento. — Autenticación. Garantiza que la identidad (persona o sistema) del origen es legítima. Conceptos de seguridad de los sistemas de información — Autorización. Es el servicio que controla el acceso de un ente a un servicio. — Anonimato. Puede requerirse en algún servicio. No entrará en conflicto con otros. — Referencia Temporal. Provee características de seguridad con marcas de temporales. — Terceros de Confianza. Para garantizar la identidad de las partes puede recurrirse a un tercero de confianza, que las avala mediante certificados. En cualquier caso, se puede convenir que los cuatro servicios de seguridad que de algún modo engloban al resto son los de confidencialidad, integridad, disponibilidad y autenticidad. Los servicios pueden clasificarse según se refieran al dominio interno o externo de una organización. Así, los servicios de seguridad en el dominio interno deben proveer control de acceso físico y lógico. Éste último incluye la gestión de los sistemas de autenticación y autorización y sistemas de defensa perimetral. Los servicios de seguridad para la protección de activos en un dominio externo, se refiere a la protección de la información en tránsito. Interrupción Modificación Intercepción Fabricación Para su estudio, se distinguen 4 tipos de ataque: interrupción, interceptación, modificación y fabricación. Un ataque de interrupción es el que se materializa en la pérdida de una parte del sistema. Un ataque de interceptación es en el que un intruso consigue acceso a un elemento del sistema, al que lógicamente no estaba autorizado. Un ataque de modificación es el que consigue modificar un elemento del sistema y un ataque de fabricación sería una modificación no destructiva en que se persigue que el sistema trabaje de forma similar o sin levantar sospechas, pero habiéndose cambiado alguna parte del objeto final del mismo. Los métodos de defensa incluyen contramedidas, teniendo en cuenta que no se pueden implantar salvaguardas para disminuir la vulnerabilidad, ya que es imposible asegurar físicamente los medios de transmisión y es necesario asumir que toda comunicación puede ser manipulada. La única salvaguarda posible es disminuir el impacto. Por un lado, debe garantizarse que aunque escuche la comunicación, el atacante no la entiende y que si cambia algo, el autor legítimo se percate de ello. Los métodos de defensa se basan en algoritmos criptográficos aplicados a las comunicaciones. Cubren dos aspectos, el cifrado, para asegurar la confidencialidad y la firma, para asegurar la integridad. 4-7 Sistemas y comunicaciones De esta forma, la seguridad se implanta a distintos niveles. A nivel de enlace sólo se asegura ese enlace, pero no la conexión completa, por ejemplo, con PPP con Encryption Control Protocol. A nivel de red se asegura toda la conexión, afecta a todas las aplicaciones y es transparente al usuario. El protocolo referencia es IPSEC. A nivel de transporte, se aseguran todas las conexiones que usen dicho transporte. Ejemplos son los protocolos SSL, TLS, WTLS. Por fin, a nivel de aplicación, se utiliza seguridad bajo demanda, es decir, sólo cuando se necesita y de la manera en que se necesita, para lo cual, las aplicaciones lo deben soportar y la funcionalidad de seguridad se repite entre ellas. En definitiva, la seguridad de los sistemas de información es un reto. Destaca el aspecto de la conectividad a redes públicas, como Internet, fuera de control de una organización. La seguridad absoluta, del 100 %, ha de definirse como imposible de alcanzar. Por tanto, resulta que la seguridad es proporcional al coste de las medidas de protección y, por tanto, se opone a los sistemas abiertos, sin ningún tipo de protección, que pretenden facilitar el acceso a cualquier usuario. Así, la implementación de seguridad se convierte en un problema de ingeniería, un compromiso entre costes, funcionalidad y protección. Por tanto, hay que planificar y tener en cuenta aspectos como el análisis de riesgos (estudio y valoración del impacto), su gestión (valoración de los controles que reducen el riesgo), establecer una Política de Seguridad (adaptación de la operativa habitual a medidas de seguridad), mantenimiento (control continuo de la eficiencia de las medidas) y establecer planes de contingencia (respuesta ante incidentes de seguridad). 3. Seguridad Física La seguridad física abarca el conjunto de medidas para proteger personas e instalaciones frente a daños eventuales. Las instalaciones incluyen edificios y equipos. Entre los daños se consideran los desastres naturales (incendios, etc.), la presencia de intrusos, accidentes y similares. Una adecuada seguridad física debe proteger el entorno con medidas como personal de seguridad, dependencias seguras, etc. que suelen agruparse en la llamada seguridad perimetral. La seguridad de las dependencias de los equipos críticos de la organización suelen incluir controles de acceso físico. Su variedad va desde tarjetas de banda magnética, teclados para introducir contraseñas o técnicas biométricas. Las técnicas biométricas hacen uso de características biológicas, propias de un individuo como lo es la voz o la huella dactilar. La característica se compara con un patrón guardado y si coincide con el candidato a acceder, se estima que es quien dice ser. Algunas técnicas son: — 4-8 Reconocimiento de huellas dactilares. Hace uso de un escáner de huellas. Similar al reconocimiento de la palma de la mano. Conceptos de seguridad de los sistemas de información — Reconocimiento de voz. El usuario pronuncia una información prefijada o una frase propuesta por el sistema para que el usuario la repita. El sistema grabará su voz y analizando sus características será capaz de reconocerla en el caso de petición de acceso. — Reconocimiento facial. Se analiza el rostro del usuario con técnicas gráficas. — Reconocimiento de firma. El usuario firma sobre una superficie, se analiza y se establece el patrón de reconocimiento. — Reconocimiento de iris. El sistema obtiene una imagen del iris del individuo y la compara con un patrón almacenado. Algunas precauciones relativas a la seguridad física que se deben tener en cuenta y revisar en una organización son: 4. — Comprobar que no sea posible el acceso a dependencias críticas a personas no autorizadas. — En las instalaciones críticas se debe disponer de equipos de alimentación ininterrumpida (SAI o UPS), para servidores y equipos de red. — Los conductos de aire acondicionado deben estar limpios, ya que el polvo es causa frecuente de averías. Se dispondrá de detectores de humo que indiquen la posible presencia de fuego. — En cuanto a los extintores, se debe revisar el número de estos, su capacidad, fácil acceso, peso y tipo de agente extintor. Es frecuente disponer de extintores, pero no estar revisados, según la periodicidad prevista. O tengan un acceso difícil o mala señalización. — El agente usado en los extintores debe ser tal que no cause un perjuicio mayor a las máquinas (extintores líquidos) o que provoquen gases tóxicos. Es decir, debe ser adecuado a la incidencia para la que se dispone. — Se debe verificar que el personal sabe usar los equipos contra incendio y que haya prácticas o simulacros de uso y comportamiento. — Por fin, comprobar también que existan suficientes salidas de emergencia y que estén debidamente controladas para evitar robos a través de las mismas. Seguridad Lógica La seguridad lógica se centra en la protección de la información almacenada o en tránsito. La información es uno de los recursos más valiosos de una organización. Por tanto, los aspectos que debe cubrir la seguridad lógica son el acceso a la información (políticas de contraseñas, gestión de usuarios, etc.), protección ante “software” malicioso, encriptación de datos, etc. 4-9 Sistemas y comunicaciones El componente más débil de un sistema de información, es el “humanware”, las personas. Sus ataques podrán ser conscientes (caso típico del insider) o inconscientes (como el caso de la ingeniería social). Por tanto, y debido a la enorme variedad de problemas de seguridad, la seguridad física y la lógica deben coordinarse. 4.1. Planificación de la seguridad Al enfrentarse a un problema suele ser bueno establecer una estrategia. Y, en general, la estrategia comienza con la planificación. La planificación de la seguridad debe evaluar el nivel de riesgo tolerable para la información para establecer el compromiso coste/beneficio que supone su impacto. Hay que considerar: — Clasificar la instalación en términos de riesgo (alto, mediano, pequeño). — Identificar las aplicaciones de alto riesgo. — Cuantificar el impacto en el caso de suspensión del servicio en las aplicaciones de alto riesgo. — Formular las medidas de seguridad necesarias para el nivel de seguridad requerido. La justificación del costo de implantar las medidas de seguridad para clasificar el riesgo debe responder a las preguntas de qué ocurriría en caso de caída del sistema. Si un riesgo implica la paralización total de la actividad, es indicativo de estar ante un sistema de alto riego. La siguiente pregunta sería qué tiempo máximo podría aguantar la organización sin el sistema en estudio, qué alternativas se contemplan y qué problemas implican y qué procesos se establecen en caso de emergencia. Una vez definido el grado de riesgo, hay que elaborar una lista de sistemas con las medias preventivas a tomar y las correctivas en caso de materializarse, según prioridad. Para clasificar una instalación en términos de riesgo se debe: — Clasificar la información. Y los programas que manejan información estratégica de la organización, así como la de difícil recuperación. — Valorar la información que contiene. En particular si la organización podría sobrevivir a una gran pérdida de esa información. Para cuantificar el riesgo es necesario efectuar entrevistas con la alta dirección afectada directamente por un riesgo y evaluar el impacto de la situación potencial. Para evaluar las medidas de seguridad se debe especificar la aplicación, programas y archivos; las medidas de mitigación en caso de desastre, pérdida total, abuso y los planes necesarios; y las prioridades de las acciones a corto y largo plazo. 4-10 Conceptos de seguridad de los sistemas de información En cuanto a la división del trabajo, al menos se deben evaluar precauciones que dependerán del riesgo que suponga la información y del tipo y tamaño de la organización. Así, en principio, el personal que prepara la información no debe tener acceso a la operación; los analistas y programadores no deben tener acceso al área de operaciones y viceversa y los operadores no debieran tener acceso sin restricciones a bibliotecas ni código fuente o ubicaciones en que residan los archivos almacenados. Es importante separar las bibliotecas de las funciones de operación. Los operadores no deben ser los únicos que tengan control sobre los trabajos procesados y no deben hacer las correcciones de los errores detectados. Al implantar sistemas de seguridad puede reducirse la flexibilidad en el trabajo, pero no debe reducirse la eficiencia. En todas las actividades existe un riesgo aceptable. Es necesario analizar y entender los factores de riesgo para establecer procedimientos que permitan en caso de materializarse, reparar o minimizar el impacto reanudando las operaciones lo antes posible. Se deben elaborar planes para gestionar posibles contingencias. Analizando cada aplicación se deben definir planes de recuperación para asegurar que los usuarios se vean afectados lo menos posible en caso de fallo. 4.2. COMPUSEC / NETSEC La parte de la seguridad que se ocupa de la seguridad en los equipos se denomina COMPUSEC y tiene su esencia en la sofisticación de programas y equipos informáticos. — Acceso. La primera medida a tomar para implantar la seguridad, es restringir el acceso a programas y archivos; los operadores deben trabajar con poca supervisión, sin la participación de los programadores, y no deben poder modificarlos. Se debe asegurar en todo momento que los datos y archivos usados sean los adecuados, procurando no usar respaldos incorrectos. También en este sentido no debe permitirse la entrada a la red a personas no autorizadas, ni la el uso no autorizado de terminales. Se debe realizar periódicamente una verificación física del uso de terminales y de los reportes obtenidos. — Auditoría. Para hacer efectivo el control sobre los equipos, se hace necesario monitorizar y auditar periódicamente el uso de los terminales, hacer auditorías periódicas al área de operación y establecer un estricto control sobre el acceso físico a los archivos. En el caso de programas, se debe asignar a cada uno, una clave que identifique el sistema, subsistema, programa y versión. — Registro. Deben existir registros que reflejen la transformación entre las diferentes funciones de un sistema y controlar la distribución de las salidas (reportes, cintas, etc.). Los listados de procesos correctos e incorrectos deben controlarse, así como el número de copias y la destrucción de la información confidencial. 4-11 Sistemas y comunicaciones — Responsabilidad. El usuario es responsable de la información, por lo que debe asegurarse que los datos sean procesados completamente. Esto se logra con controles adecuados, definidos desde el momento del diseño general del sistema. Asimismo, es conveniente contar con un lugar segundario de alta seguridad para guardar copias de la información. Se deben controlar las copias de información confidencial sin la debida autorización. Sólo el personal autorizado debe tener acceso a la información confidencial. Los programadores deben usar normas de estilo para, por ejemplo, evitar nombres no significativos difíciles de identificar, que oculten otras actividades. — Restauración. Los procedimientos de recuperación son fundamentales ante contingencias. Se hace necesario conocer el motivo que originó el problema y el daño causado, lo que permitirá recuperar en el menor tiempo posible el proceso perdido. También se debe analizar el impacto futuro en el funcionamiento de la organización y prevenir consecuencias negativas. Las acciones de recuperación disponibles a nivel operativo pueden se suelen apoyar en copias periódicas de los archivos para reanudar un proceso a partir de una fecha determinada. Esta medida, junto al registro de transacciones que afectaron al sistema permitirá retroceder a una situación anterior coherente. El análisis del flujo de datos y procesos permitirá cambiar el proceso normal por un proceso alternativo de emergencia que reconfigure los recursos disponibles de sistemas comunicaciones. El procedimiento que se determine será adecuado a la situación de emergencia y planeado y probado previamente. El grupo de emergencia deberá tener un conocimiento de las características de las aplicaciones, tanto desde el punto técnico como de su prioridad, nivel de servicio planeado y su influencia en la operación de la organización. El aspecto de estudio de los elementos de red (NETSEC) aplica criterios similares con las particularidades del entorno de red. Además de procedimientos de recuperación y reinicio de la información, se deben contemplar los referidos a los recursos físicos y comunicaciones, planeando el uso de equipos que permitan seguir operando en caso de fallo, arquitecturas robustas (redundante), instalaciones alternativas, etc. Estas medidas de recuperación y reinicio, entre otras, deberán ser planeadas y probadas previamente. 4.3. CRYPTOSEC La seguridad lógica de la información que usa técnicas criptográficas se engloba en el término “cryptosec”. La criptografía consiste en codificar información de forma que sea de difícil interpretación a alguien no autorizado. Su aplicación habitual es en la transmisión a través de canales indiscretos como Internet. El emisor encripta la información en claro y el receptor la interpreta desencriptándola. 4-12 Conceptos de seguridad de los sistemas de información La encriptación se basa en el uso de claves, que etimológicamente significa llave. Por tanto, la encriptación puede entenderse a nivel conceptual como la disposición de una caja, una cripta, con cerradura. La cerradura se abre y cierra con una (o varias, si hay varios candados o cerraduras) llave, la clave. La cripta o caja, se asimilaría a un algoritmo de cifrado y la llave a la clave. Del mismo modo que en el mundo real, hay cerrojos más fuertes que otros. La robustez de las claves. A nivel lógico, esta robustez se consigue con los algoritmos y la longitud (en “bits”) de la clave. Los distintos criptosistemas se clasifican en simétricos y asimétricos. En los simétricos se usa una única clave para encriptar y desencriptar. Esto obliga a que emisor y receptor la conozcan, lo que no es trivial en un primer momento y más si el número de usuarios es grande. En los sistemas asimétricos existen dos claves: se dispone una caja con dos cerraduras, dos claves, una pública, (que conocen todos) y otra privada (que sólo conoce su propietario). Se da una relación entre las llaves, del estilo aguja-pajar-imán. Si se tira un imán en un pajar y se intenta encontrar con una aguja, mal. Si se tira una aguja en un pajar y se intenta encontrar con un imán, bien. Esa es la idea, con la llave aguja no es fácil encontrar la llave imán. En este tipo de criptografía se basan aplicaciones como el acuerdo de claves de sesión o la firma digital. Pero es más lenta que la criptografía simétrica. Los principales algoritmos simétricos son: — DES (Data Encryption Standard, Estándar de Encriptación de Datos). Creado por IBM, es el más conocido. Encripta bloques de 64 “bits” con claves de 56 “bits”, recomendándose de 90 “bits”. Es relativamente rápido y se utiliza para encriptar grandes cantidades de información. — Triple DES. Hace 3 encriptaciones seguidas usando 2 claves. Esto es: primero con la clave 1, luego con la clave 2 y, finalmente, de nuevo con la clave 1. Se ha propuesto como alternativa de mayor seguridad a DES. — IDEA (International Data Encryption Algorithm). Cifra bloques de 64 b con clave de 128 b. — AES (Advanced Encryption Standard o Rijndael). Cifra bloques de 128 “bits” con claves de 128, 192 ó 256 “bits”. Otros algoritmos simétricos son RC2 (cifrado en bloque), RC4 (cifrado en flujo, diez veces más veloz que DES), RC5 (cifrado en bloque), SAFER y Blowfish. El primer algoritmo asimétrico fue propuesto por Diffie y Hellman en 1976. Todavía sigue en uso, aunque tiene características limitadas. En este grupo se incluyen además: 4-13 Sistemas y comunicaciones — RSA (Rivest, Shamir y Adleman). Creado en 1978 por los autores que le dan nombre, es en la actualidad el más popular. La longitud más común de la clave es de 512 “bits”. — DSS o DSA (Digital Signature Standard/Algorithm). Patrocinado por el gobierno de EEUU. Puede desplazar a RSA. En un algoritmo asimétrico, el emisor puede utilizar su clave privada o la clave pública del destinatario para encriptar su mensaje. Cada caso posee aplicaciones diferentes: Cifrado con clave privada y descifrado con clave pública. Mal. Si todos conocen la clave pública y se cifra con la privada, no hay secreto. Luego, la aplicación es que todos identifiquen a alguien, es decir, firma digital. Ofrece autenticidad, integridad y no repudio. Cifrado con clave pública y descifrado con clave privada. Bien, en el sentido general. Se cifra con algo que todos conocen, es decir, se tira la aguja del receptor al pajar. Y sólo descifra el dueño del imán emparejado con la aguja pública. Ofrece confidencialidad, pero no identifica al emisor. En relación con esto, un certificados digital es un documento de identidad electrónica que identifica a su propietario. Resuelve el problema de la autenticidad en las comunicaciones. Su objetivo es asociar una clave pública con la identidad del propietario. Así, se sabe que la clave pública usada es del supuesto emisor y no de un intruso. Los certificados los emite una autoridad de certificación (CA, Certificate Authority) y su credibilidad depende de su prestigio o convenio. La CA es responsable de la exactitud y veracidad de los datos del certificado. Las CA suponen terceras partes de confianza (TPC o TTP, Trusted Third Party). Esto indica que dos usuarios pueden confiar entre sí por la implicación transitiva de la confianza que ofrece ese tercero. Ejemplos de CA son VeriSign o CERES (Autoridad pública de certificación española). CERES es el resultado de un proyecto puesto en marcha por la AAPP, liderado por la FNMT para aportar seguridad a las comunicaciones con la Administración. El protocolo X.509, definido por la Unión Internacional de Telecomunicaciones (ITU), es el sistema de certificados más usado. Su primera versión data de 1988, siendo la propuesta más antigua para una infraestructura de clave pública (PKI). La versión actual, X.509v3 se usa en los principales protocolos de comunicaciones y de correo electrónico seguro excepto PGP, que usa formato propio. Los certificados tienen una validez limitada. Su renovación reduce el riesgo de compromiso de claves. La revocación puede hacerla el propietario, la AC o autoridades judiciales. Para gestionar los certificados las CA usan listas de certificados revocados o CRL, que es un listado público, firmado por la CA con la fecha de emisión y una lista de certificados revocados. Para cada uno figura su número de identificación y la fecha en que se ha revocado. 4-14 Conceptos de seguridad de los sistemas de información Para agilizar la consulta sobre la validez de un certificado existen servicios de directorio o servicios de consulta de certificados ofrecidos por entidades de confianza que indican al momento si un certificado es válido o si ha sido revocado. 4.4. TRANSEC Es el término que engloba los aspectos de seguridad lógica en las transmisiones. El núcleo de su objetivo es la definición de normas, protocolos de transmisión que ofrezcan seguridad. 4.4.1. SSL El protocolo SSL (Secure Sockets Layer, capa de conexiones seguras), desarrollado por Netscape, permite crear conexiones seguras a través de Internet. Se sitúa entre la capa de transporte y aplicación. En la práctica se aplica sólo a comunicaciones HTTP. Las páginas web protegidas con SSL contienen como esquema de su URI la denominación “https” en lugar de “http”. Utiliza el puerto 443 en lugar del 80 de comunicaciones no seguras y para transmisión de claves públicas certificados X.509v3. El protocolo SSL puede proporcionar autentificación (con certificados), integridad y confidencialidad (con encriptación). El emisor SSL puede fragmentar y comprimir los mensajes en bloques. SSL se divide en dos subcapas: SSL Handshake Protocol (protocolo de saludo). Bajo la capa de aplicación, se encarga de la autentificación del cliente y servidor, negociar parámetros de sesión y establecer la conexión segura. Para cambiar el estado de cada extremo se usa el protocolo Change Cypher Spec. SSL Record Protocol (protocolo de registro). Encima de la capa de transporte, para cifrado de las capas superiores. Para establecer una comunicación segura entre emisor y receptor, primero se establece una sesión con el Handshake. Entre los parámetros negociados en la sesión se encuentra el identificador de sesión, certificado, método de compresión, algoritmo de cifrado y clave de 48 B. La versión actual de SSL es la 3.0, que usa los algoritmos simétricos DES, 3DES, RC2, RC4 e IDEA, el asimétrico RSA, la función hash MD5 y el algoritmo de firma SHA-1. Los algoritmos, claves y “hashes” que se usen en SSL dependen del nivel de seguridad objetivo. 4.4.2. S-HTTP, TLS, SET S-HTTP (Secure HTTP), es un protocolo de seguridad para comunicaciones web desarrollado por EIT (Enterprise Integration Technologies). Se sitúa en la capa de aplicación y se define en el RFC 2660, con categoría de protocolo experimental. 4-15 Sistemas y comunicaciones El protocolo TLS (Transport Layer Security) es un estándar del IETF en su RFC 2246 como alternativa a SSL. El protocolo SET (Secure Electronic Transaction), fue diseñado por Visa y MasterCard para pagos en Internet con tarjetas de crédito. En su desarrollo han participado empresas como IBM, Microsoft y Verisign. Es un sistema abierto (funciona con distintos protocolos, su especificación es de libre distribución) y multiplataforma (no depende del sistema operativo). SET se monta sobre TCP, con los protocolos de correo SMTP y MIME o en sitios web con HTTP. Otras características del protocolo son la codificación estándar (ASN.1 y DER), uso de estándares criptográficos (PKCS, certificados X.509, etc.), basado en criptografía de clave pública y autenticación de partes con certificados digitales. 4.4.3. IPSec IPSec es un conjunto de protocolos que ofrece seguridad en comunicaciones IP. Funciona en la capa 3. Su mayor aplicación se encuentra en la implementación de redes privadas virtuales (VPN) para el acceso a intranets y creación de extranets. Se integra en IPv6 y es opcional en IPv4. Ofrece los servicios de control de acceso, integridad, autentificación y confidencialidad. Permite también compresión, estableciendo para ello el algoritmo LZW (Lempel-ZivWelch). Para su funcionamiento, IPSec define dos modos de trabajo: transporte y túnel. Un modo de trabajo define entre qué entidades se establece la seguridad. El modo de transporte se refiere al establecimiento de la seguridad entre máquinas finales, que lógicamente, deben soportarlo. Es la forma nativa de comunicación en IPSec. Asegura la información enviada, incluso en la LAN. El modo túnel se establece entre equipos frontera o gateways, como puedan ser dos routers. Es transparente a las máquinas finales y por tanto, sólo protege la información entre los “gateways”. Los tramos entre “gateways” y máquinas finales volverían a ser inseguros. La filosofía IPSec consiste en encapsular los datagramas IP con información que implementa la seguridad. Es un modelo apropiado para crear (VPN). Los elementos de IPSec son protocolos de seguridad, asociaciones de seguridad, intercambio de claves y algoritmos de autenticación y cifrado. Como protocolos de seguridad se usa AH (Authentication Header, RFC 2402) y ESP (Encapsulating Security Payload, RFC 2406). AH permite autentificación de los datagramas asegurando su integridad. Asegura la dirección IP de origen y proporciona un mecanismo de protección contra ataques de repetición de datagramas. ESP proporciona confidencialidad a la comunicación usando criptografía. Adicionalmente puede ofrecer autentificación. 4-16 Conceptos de seguridad de los sistemas de información Las asociaciones de seguridad (SA) son conexiones de seguridad establecidas entre dispositivos (host-host, gateway-gateway o host-gateway). Cada extremo establece una SA para el intercambio de claves que contiene la información necesaria para soportar un sentido del tráfico. En una comunicación entre 2 dispositivos existirán 2 SA, aunque se pueden crear asociaciones adicionales (por ejemplo, si se us AH y ESP a la vez). El intercambio de claves se define con IKE (Internet Key Exchange, RFC 2409). Permite el intercambio seguro de las claves usadas en los componentes IPSec. IKE se conocía anteriormente como ISAKMP/Oakley. Los algoritmos de autentificación y encriptado usados en IPSec buscan garantizar la autentificación de usuarios con certificados digitales basados en X.509. Los certificados digitales no forman parte de IPSec aunque se pueden usar. Requieren la intervención de una CA. Para la encriptación de datos el algoritmo típico en IPSec es DES-CBC (DES en modo de encadenamiento de bloques cifrados). 4.4.4. Correo electrónico seguro: PEM, S/MIME y PGP Los principales protocolos usados en correo electrónico seguro son: S/MIME, PGP y PEM. S/MIME (Secure MIME, MIME seguro) supone el estándar más reciente. Usa un formato de certificado basado en X.509. Su versión 3 está estandarizada en las RFC 2632 y 2633. PGP (Pretty Good Privacy, privacidad bastante buena), escrito originalmente por Phil Zimmermann en 1991 y actualmente es el estándar de facto utilizado para seguridad en el correo electrónico. Usa un formato propio de certificado. El “software” para cifrar y descifrar es de libre distribución, bien como módulos que se integran en el gestor de correo, o bien como aplicaciones independientes. PGP, a diferencia de S/MIME, basado en X.509, no requiere una jerarquía de autoridades de certificación: se diseñó bajo el concepto de una red de confianza entre usuarios. Al igual que S/MIME, proporciona autentificación del origen y privacidad de datos. PEM (Privacy Enhanced Mail, correo con privacidad mejorada) es un estándar de Internet definido en las RFC 1421 a 1424. Es menos usado que los anteriores, debido sobre todo a que no está preparado para correos MIME. 5. Amenazas y Vulnerabilidades Como se ha expuesto en la introducción, una amenaza se entiende aquello que puede causar un mal. Una vulnerabilidad es algo sobre lo que se puede proyectar un daño, que puede dañarse. Si la amenaza impacta en una vulnerabilidad existe un riesgo. Estructurando las ideas como sujeto, verbo y complemento, el sujeto sería la amenaza, el verbo impactar y el complemento (directo) la vulnerabilidad. 4-17 Sistemas y comunicaciones La idea de impacto, implica una posibilidad, que se expresa con la palabra riesgo, que se entiende la contingencia o proximidad de un daño. Siguiendo con el esquema, el conjunto que se presenta amenaza + impacto + vulnerabilidad sería un riesgo, una frase u oración. Las amenazas y vulnerabilidades, por tanto se tratan en conjunto, en lo que se da en llamar la gestión de riesgos. Lo que implica identificarlas. En principio son muy variadas, en particular las amenazas lógicas y de software. Por eso, es más fácil identificar las amenazas físicas, por su notoriedad y frecuencia. Y ser de las primeras que están presentes en los planes de contingencia. Las amenazas de agentes físicos pueden dividirse en desastres naturales o artificiales. Entre los desastres naturales están los huracanes, terremotos, tormentas, inundaciones, incendios, etc. La estimación del riesgo los tendrá en cuenta en función de criterios como la frecuencia de suceso. Entre las salvaguardas pueden citarse emplazamientos adecuados (edificios antisísmicos), protección de las edificaciones (fachadas, ventanas, puertas), establecimiento de centros gemelos o la gestión de copias de información, entre otras. Entre los desastres artificiales, destacan las amenazas del agua, el fuego y la alimentación eléctrica. Las amenazas del agua implican inundaciones por causas propias de la empresa o ajenas. Inundaciones por el disparo de un dispositivo de extinción, atascos, incidentes personales (dejar un grifo abierto). Las salvaguardas incluirían revisar conductos de agua, localizar los equipos críticos en un sitio controlado o más seguro, sistemas de drenaje de emergencia o la concienciación de los empleados. Las amenazas del fuego implican las instalaciones eléctricas, descuidos personales (fumar), o problemas debidos a humos. Entre las salvaguardas se pueden establecer detectores de humo y calor, uso de materiales ignífugos, cuidado en el almacenamiento de papel, separación de máquinas, revisión de suelos técnicos o la revisión del estado de extintores. Las amenazas derivadas de la alimentación eléctrica pueden salvaguardarse con sistemas de alimentación ininterrumpida o similar. Si además se cuenta con un centro de respaldo, el riesgo se reduce notablemente. Para dar idea de lo que puede ocurrir si se produce una catástrofe, se puede remitir a un estudio de la Universidad de Minnesota (1996), en que se establecía que el período máximo de paro de una empresa sin poner en peligro su supervivencia era de 5.6 días para el sector seguros, en el sector fabricación, 4.9 días o 2 días si pertenecía al sector financiero. Además, se producen otras pérdidas, que aunque no impliquen la desaparición, si suponen un impacto, no siempre cuantificable, como puede ser la pérdida de clientes, de imagen, de ingresos por ventas, cobros o producción o la pérdida de credibilidad. Desarrollar el conjunto de amenazas y vulnerabilidades lógicas es más complejo. Por ello, se recurre a metodologías estructuradas. Cada uno, podrá definir su estrategia, su método. 4-18 Conceptos de seguridad de los sistemas de información Pero qué mejor que estandarizar alguna propuesta que cubra estos aspectos. Es lo que ha promueve el Consejo Superior de Informática y para el impulso de la Administración Electrónica, con lo que da en llamar MAGERIT, la Metodología formal de Análisis y Gestión de Riesgos de los sistemas de información de las Administraciones Públicas. En líneas generales, se encarga del análisis de riesgos que pueden comprometer un sistema de información y la recomendación de las medidas apropiadas para reducir y controlar los riesgos obtenidos, de forma que se reduzcan al mínimo los posibles perjuicios. Los objetivos de MAGERIT, según el Consejo Superior de Informática y para el impulso de la Administración Electrónica (www.map.es/csi), son: Estudiar los riesgos que soporta un sistema de información y el entorno asociado a él. MAGERIT propone la realización de un análisis de los riesgos que implica la evaluación del impacto que una violación de la seguridad tiene en la organización; señala los riesgos existentes, identificando las amenazas que acechan al sistema de información, y determina la vulnerabilidad del sistema de prevención de dichas amenazas, obteniendo unos resultados. Los resultados del análisis de riesgos permiten a la gestión de riesgos recomendar las medidas apropiadas que deberían adoptarse para conocer, prevenir, impedir, reducir o controlar los riesgos identificados y así reducir al mínimo su potencialidad o sus posibles perjuicios. Como objetivo a más largo plazo, MAGERIT prepara su articulación con los mecanismos de evaluación, homologación y certificación de seguridad de sistemas de información (ITSEC, Criterios Comunes de Evaluación de la Seguridad de los Productos y Sistemas de Información). Pero una metodología, suele ser difícil implantarla. Es el paso de la estrategia a la táctica. Para ello, el Ministerio de AAPP dispone una herramienta, basada en MAGERIT, llamada PILAR, un Procedimiento Informático Lógico para el Análisis de Riesgos. PILAR conjuga los activos TIC de un sistema con las amenazas, calcula los riesgos y permite incorporar salvaguardas para reducir el riesgo a valores residuales aceptables. Esto permite fundamentar la confianza en el sistema. Básicamente, PILAR ofrece un catálogo de amenazas y posibles vulnerabilidades, que el usuario de la herramienta tendrá que ir identificando en su organización. Es decir, ayuda a seguir la metodología, identificando por tanto los riesgos y su tratamiento con salvaguardas. Por su extensión, sólo se dan algunos ejemplos de amenazas y vulnerabilidades, por tanto riesgos clasificados por la propiedad del modelo CIA a la que impacta. — Riesgo para la Confidencialidad. Amenaza: Persona. Impacto: Divulgación de información confidencial. Vulnerabilidad: Perjuicio de la Imagen. 4-19 Sistemas y comunicaciones — Riesgo para la Integridad. Amenaza: Organización de la competencia. Impacto: Calumniar sobre la organización. Vulnerabilidad: Perjuicio de la Imagen, cotización, etc. — Riesgo para la Disponibilidad. Amenaza: Organización activista. Impacto: Detener la operación de la organización. Vulnerabilidad: Pérdida económica por cese temporal de actividad (ataque DDoS). 6. Infraestructura física de un CPD: Acondicionamiento y Equipamiento Los Centros de Proceso de Datos (CPD) son los lugares donde se aloja el equipamiento informático principal que soporta el Sistema de Información de una organización. Esta disposición implica la responsabilidad de prevenir incidencias y desastres en el CPD, de forma que se identifiquen riesgos y establezcan salvaguardadas. Todo con el objetivo de la continuidad funcional, su disponibilidad. De otra forma, que la información pueda recuperarse con un nivel de confianza (fiabilidad e integridad) al que estando autorizado, la solicite (acceso y confidencialidad). 6.1. Infraestructura física de un CPD Por “infraestructura física de un CPD” se entiende el conjunto formado por el edificio e instalaciones de confort y seguridad dispuestos para el CPD de una organización. La infraestructura física de un CPD, se refiere a los requisitos necesarios que deben cumplir dotaciones e instalaciones para asegurar el funcionamiento correcto y seguro de los equipos informáticos físicos y lógicos. También se usa el término “obra civil”, en contraposición a las instalaciones propias y complementarias a la actividad del CPD y a los trabajos que realizan los equipos físicos y lógicos para el tratamiento de la información. Por ello no se considera parte de la infraestructura física las redes de comunicaciones, instalaciones de salvaguarda y recuperación de información, o cualquier otra auxiliar a las instalaciones de proceso o almacenamiento de información. 6.2. Edificio e instalaciones El elemento principal de la infraestructura del CPD es el lugar físico, es decir, el edificio. Entre los requisitos exigibles a los edificios se encuentran los 4-20 Conceptos de seguridad de los sistemas de información de “protección medioambiental”, relativos a su ubicación, para protegerlo frente a desastres naturales (inundaciones, terremotos y similares). A veces son requisitos deseables, más que exigibles. Piénsese en el caso de Japón y la frecuencia de sus terremotos. Asimismo, son importantes los requisitos contra “interferencias internas”, centrados en el diseño arquitectónico interno para ubicar y dimensionar dependencias. Su objetivo es anticipar los efectos de accidentes como inundaciones, problemas eléctricos u otros, buscando el mayor aislamiento del CPD en caso de incidencias. Se considera parte de la infraestructura las instalaciones que aportan y complementan la funcionalidad de las actividades propias del CPD y las que aseguran unos niveles de confort y seguridad a las personas que trabajen en el CPD, como son las instalaciones de aire acondicionado o de refrigeración por agua. La instalación de alimentación eléctrica debe asegurar la potencia necesaria estabilizada y sin interrupciones para la activación de equipos y el resto de las instalaciones que lo requieran, como la iluminación. Las redes de suministro eléctrico deben ser independientes para reducir riesgos al aislar posibles problemas. Debido a que el suministrador eléctrico puede fallar, podría preverse la situación contratando un doble suministro con otro proveedor. Si la importancia del CPD lo requiriese, se podría dotar al con equipos electrógenos u otras alternativas. Una primera solución a la falta de suministro eléctrico se consigue con sistemas de alimentación ininterrumpida, SAI o UPS en inglés, que funcionan con baterías. El resto del equipamiento de un CPD tiene como objetivo mejorar el nivel de seguridad ante riesgos del edificio y sus ocupantes. Así, las instalaciones de seguridad y control de accesos pretenden evitar la invasión de personas no autorizadas. Las instalaciones de detección y extinción de incendios mantendrán controlado el riesgo o, en caso de ocurrencia, limitarán sus efectos. 6.3. Detección y extinción de incendios Los sistemas de detección de incendios más empleados son los de detección por incremento de temperatura y por humos. Para la extinción, se usan varios sistemas, como los que actúan por enfriamiento (agua) o por sofocación (gases). Los sistemas que actúan por enfriamiento son adecuados para fuegos clase A (sólidos). La distribución se realiza con tuberías que contendrán agua a presión en todo momento (columna húmeda), o estarán vacías (columna seca) llenándose una vez detectado el fuego. En esta categoría se encuadran los equipos autónomos basados en carga de agua o espuma (extintores) indicados para la extinción de pequeños fuegos. Los sistemas de columna húmeda no se recomiendan en locales con equipos eléctricos que puedan dañarse por el agua (especialmente salas de ordenadores). Para este tipo de locales están indicados los sistemas de columna seca, que entran en acción sólo cuando otros sistemas fallan y el daño de 4-21 Sistemas y comunicaciones los equipos ya es irreparable. Sea cual sea el sistema empleado, es necesaria una red de drenaje para el agua usada en la extinción. Los sistemas que actúan por sofocación usan como agente gases o compuestos químicos inertes (espumas o polvos) y están indicados para fuegos de Clase A (sólidos), B (líquidos inflamables), C (gases) ó E (los anteriores en el caso de instalaciones eléctricas). Para este último no es aplicable los basados en espumas húmedas, conductoras de electricidad. 7. Sistemas de gestión de incidencias. Control remoto de puestos de usuario Entendemos por incidencia en un Sistema de Información aquellos eventos que causan en los usuarios del mismo la necesidad de comunicarse con los responsables de dicho sistema de información a fin de trasladar algunos de los siguientes ítems: — Pérdida de servicio, equipos o instalaciones. — Fallos del sistema, sobrecargas, malfuncionamiento (p.e. lentitud). — Errores humanos. — Fallos en políticas o directrices (p.e. fallos en el acceso a recursos compartidos). — Cambios del sistema no controlados (p.e. actualizacines inesperadas o no informadas debidamente). — Desconocimiento en el uso del software o del hardware. — Violaciones de acceso. — Eventos que afecten a la identificación y autenticación de los usuarios. — Eventos que afecten a los derechos de acceso a los datos. — Eventos que afecten a los procedimientos de copias de seguridad y recuperación. — Sugerencias de los usuarios respecto del sistema de información. — Cualesquiera otra situación que afecte al normal funcionamiento del sistema. La gestión de estas incidencias comenzará por el adecuado registro de las mismas, con indicación de la fecha de registro, descripción detallada del problema, intentos de soluciones, cada incidencia mantendrá un historial de cada cambio. La gestión de incidencias comunmente tendrá un único punto de entrada que será un centro de atención de usuarios, bien vía telefónica, vía telemática o ambas. En dicho centro de atención se ofrecerá el servicio de soporte al cliente de la organización para crear, actualizar y resolver incidencias reportadas por los usuarios del sistema de información o incluso incidentes reportados por otros empleados de la organización. 4-22 Conceptos de seguridad de los sistemas de información Cada incidencia en el sistema puede tener un nivel de urgencia asignado, basado en la importancia total de ese hito. Los incidentes críticos son los más severos que deben ser resueltos en la forma más expedita posible, tomando precedencia sobre todos los demás incidentes. Una posible clasificación de incidencias sería la que sigue: — Crítica: una emergencia es un incidente cuya resolución no admite demora. Los incidentes de este tipo se procesarán en paralelo de haber varios, y en su resolución se emplearán todos los recursos disponibles disponibles. — Alta: un incidente de alta prioridad es aquél cuyas características requieren que sea atendido antes que otros, aunque sea detectado posteriormente. Para esto se mantiene una cola independiente de incidentes de alta prioridad, y no se procesarán los de prioridad inferior mientras queden de éstos. Los incidentes de alta prioridad se procesan en serie. — Media: por defecto, los incidentes se atienden en serie por orden de llegada, mientras no requiera atención uno de prioridad superior. Un incidente de prioridad normal puede adquirir la categoría de alta prioridad si no recibe atención por un tiempo prolongado. — Baja: los incidentes de llegada baja prioridad se atienden en serie por orden de llegada, mientras no requiera atención uno de prioridad superior. Un incidente de baja prioridad será cerrado automáticamente si no recibe atención por un tiempo prolongado. El seguimiento de incidencias se apoyará en una base de conocimiento que contiene información sobre cada usuario registrado, soluciones a problemas comunes y herramientas para la asignación de resolutores al seguimiento de errores y fallos del sistema. Las preguntas más frecuentes (FAQs) por ejemplo serán un producto típico de dicha base de conocimiento. El registro de cada incidencia otorgará un número de referencia o número de caso, el cual es usado para permitir al cliente o al personal de soporte localizar, añadir o comunicar información de seguimiento al estado del incidente. La arquitectura más común de sistema de seguimiento de incidencias se basa en una base de datos como repositorio de almacenamiento para los datos que son gestionados por la capa de negocio de la aplicación. Cada vez que se produce un hito el sistema de seguimiento de incidentes registra la acción y quién la hizo, llevando un histórico de las acciones tomadas en la resolución del caso. El proceso de trabajo en la gestión de incidencias se ilustra como sigue: — Un técnico del servicio al cliente recibe una llamada telefónica, correo electrónico, o es el usuario quien accede a una web de registro para informar de un problema. Se verifica que el problema es real, que el usuario informante es pertinente y se complementa toda la información posible al respecto. 4-23 Sistemas y comunicaciones — Conforme se trabaja en el incidente, el sistema es actualizado por los resolutores. Cada acción para solventar el problema debe ser anotada en el sistema de incidentes. — Después de que la incidencia está solucionada, se informa al usuario afectado para verificar su acuerdo o permitirle reclamar y reabrir el caso. — A veces la cuestión puede finalmente no ser resuelta por deberse a carencias de diseño, incidencias crónicas conocidas sin solución, o tener solo una solución parcial. Comunicación Registro Clasificación Diagnóstico Resolución Cierre Incidente En el argot de los CPDs la jerga informática emplea los anglicismos “HelpDesk” y “Call Center” para referirse al soporte a usuarios y centro de llamadas respectivamente. Los departamentos TIC y sus centros de llamadas que atienden con frecuencia peticiones para resolver incidencias recurren a aplicaciones software para la gestión de dichas incidencias. Citamos por ejemplo por su popularidad entre las de código abierto la solución RT (Request Tracker) que es probablemente el sistema de gestión de incidencias con más penetración en el mercado con licencia GNU, ha sido desarrollado sobre Perl y sólo requiere de un servidor Apache (Linux, MAC OS o Windows) y una base de datos como MySql, Postgre Sql, Oracle o SQLite. Ofrece un interfaz Web tanto para los usuarios como para los operadores del servicio y dispone de integración con eMail para la interacción con los usuarios. Los correos electrónicos se convierten automáticamente en “tickets” de registro de incidencias y las respuestas llegan a los clientes de igual manera. Los operadores y resolutores trabajan sobre la interfaz Web. En su última versión se han realizado importantes mejoras sobre el interfaz de usuario, el aspecto visual de las notificaciones y la capacidad para agrupar incidencias con relación entre ellas. Cabe señalar que un mal servicio de gestión de incidencias habitualmente comienza con un mal servicio de atención al cliente, operadores mal entrenados o desconocedores del negocio, con escasa sensibilidad para la priorización de los problemas y que se basan en argumentarios muy “robotizados” o incluso el registro de incidencias basado en locuciones pregrabadas pueden causar sobre los usuarios rechazo, pérdida de confianza e incluso desdén ante nuevas incidencias que no serán informadas para su solución. Otro factor importante es la capacitación y agilidad de los resolutores, a veces si la solución de una incidencia está mal enfocada o incorrectamente clasificada se da lugar a múltiples reasignaciones entre los posibles resolutores (partido de tenis) y el usuario final acaba resultando desatendido. 4-24 Conceptos de seguridad de los sistemas de información El soporte de usuarios mediante control remoto suele ser el primer nivel de atención a clientes desde el “HelpDesk” ya que supone un apoyo inmediato y rápido, y en función del tipo de escenario tecnológico un buen número de incidencias podrían ser resueltas de este modo. La combinación de la asistencia telefónica y telemática costituye una herramienta muy potente en la resolución de problemas de forma remota sin que sea necesaria la intervención presencial de un resolutor, lo que desde el punto de vista del análisis de costes en tiempo y costes económicos supone un valor añadido a considerar. Obviamente la asistencia remota ahorra dinero a la empresa y hace más rentables los departamentos de HelpDesk siempre que se sea eficaz en su aplicación, sino el efecto contrario será la sensación de desatención y frustración en los usuarios. El punto de equilibrio será determinar en que caso el cliente requiere un contacto directo con un resolutor que gestione adecuadamente la incidencia y “ponga cara” al servicio de atención a clientes y en que casos es suficiente con la atención remota. La sistematización de los protocolos a seguir en la recogida de llamadas, los argumentarios preestablecidos, la clasificación de prioridades y la determinación del canal más adecuado en cada caso son los puntos clave que determinarán el éxito del servicio de soporte. El acceso remoto no sólo ofrece asistencia al usuario, también puede emplearse para realizar mantenimiento preventivo a servidores o equipos de dificil acceso. Sin se carece de las herramentas de acceso remoto muy frecuentemente cuando se inicia una incidencia el servicio de soporte ha de guiar al usuario telefónicamente sin ver lo que se está haciendo en tiempo real, lo que puede generar complicaciones y pérdidas de tiempo del técnico y el del usuario, incidencias que suelen requerir finalmente desplazamientos para resolver el problema, De entre las herramientas más comunes empleadas en el acceso remoto para ofrecer soporte en la gestión de incidencias a los puestos de usuario se encuentra VNC, por lo que pasamos a revisarla: VNC son las siglas en inglés de Virtual Network Computing (Computación Virtual en Red). VNC es un programa de software libre basado en una estructura cliente-servidor el cual permite tomar el control del ordenador servidor remotamente a través de un ordenador cliente. También llamado software de escritorio remoto, VNC no impone restricciones en el sistema operativo del ordenador servidor con respecto al del cliente: es posible compartir la pantalla de una máquina con cualquier sistema operativo que soporte VNC conectándose desde otro ordenador o dispositivo que disponga de un cliente VNC. El programa servidor suele tener la opción de funcionar como servidor HTTP para mostrar la pantalla compartida en un navegador con soporte de Java. En este caso el usuario remoto (cliente) no tiene que instalar un programa cliente de VNC, éste es descargado por el navegador automáticamente. VNC es una buena opción en el control remoto de puestos de usuario, usando el teclado 4-25 Sistemas y comunicaciones y el ratón, y viendo la pantalla igual que si se estuviera delante de la máquina remota. Hay otros productos comerciales tipo VNC como pcAnywhere, Remote Administrator, incluso Windows incorpora de forma nativa la utilidad Asistencia remota. 4-26 Tema 5 Comunicaciones. Medios de transmisión. Modos de comunicación. Equipos terminales y equipos de interconexión y conmutación. Sistemas y Comunicaciones Guión-resumen 1. Comunicaciones. Modos 1.1. Señales analógicas y digitales 3.1. Paridad 1.2. Banda base y banda ancha 3.2. Códigos de Redundancia Cíclica (CRC) 1.3. Transmisión serie y paralelo 1.4. Modos de comunicación 1.5. Deterioro en la transmisión 1.6. Transmisión síncrona y asíncrona 1.7. Conmutación de circuitos, de mensajes y de paquetes 1.8. Ancho de banda y velocidad de transmisión 4. Medios de transmisión 4.1. Cable de par trenzado 4.2. Cable coaxial 4.3. Fibra óptica 4.4. Medios no guiados 5. Equipos de interconexión y conmutación 1.9. Codificaciones en banda base 5.1. Comparación entre hubs y switches 1.10. Técnicas de multiplexación 5.2. Aprendizaje de los switches 1.11. Tipos de modulaciones 5.3. Dominios de colisión 2. Equipos de comunicaciones. Equipos terminales 2.1. V.24/EIA-232 2.2. Interfaz RDSI 2.3. USB Y Firewire 2.4. Módems 5-2 3. Detección de errores 5.4. Dominios de difusión. VLAN Comunicaciones 1. Comunicaciones. Modos En este tema se estudian los conceptos básicos de transmisión de datos y comunicaciones. Las técnicas utilizadas para el envío de información desde un origen a un destino son muy diversas: transmisión analógica o digital, transmisión serie o en paralelo, síncrona o asíncrona, simple o full-duplex, etc. Se explican todas estas técnicas y se proponen ejemplos. 1.1. Señales analógicas y digitales Para la transmisión de la información a través del medio se utiliza una señal. Una señal es una magnitud física variable en el tiempo como, por ejemplo, una tensión eléctrica. Esto es: si enviamos a través de un cable una sucesión de distintos voltajes, estaremos transmitiendo datos. El emisor y el receptor deben utilizar la misma codificación: 5 voltios podría utilizarse para representar un “1” binario y -5 voltios para un “0” binario. Las señales se pueden clasificar en analógicas y digitales. Las del primer tipo tienen un carácter continuo. Esto significa que pueden tomar cualquier valor dentro de un intervalo. En el ejemplo anterior, se admitiría cualquier valor comprendido entre -5 y 5 voltios. Obsérvese que los receptores de radio tradicionales son analógicos: para su ajuste es necesario girar la rueda del dial, pudiendo tomar cualquier valor entre dos límites. En cambio, las señales digitales pueden tomar únicamente valores concretos (carácter discreto). Es el caso del primer ejemplo: sólo se admiten dos voltajes y cada uno tiene un significado concreto. Las radios actuales son digitales: el salto de un punto del dial al siguiente se realiza pulsando un botón que aumenta o disminuye un valor de frecuencia constante (hay un número de posiciones discretas, no infinitas como en la radio analógica). Los ordenadores funcionan internamente con datos digitales. Sólo entienden ceros (no pasa corriente por un circuito) y unos (pasa corriente). En ocasiones hay que realizar conversiones entre la información analógica y digital. Por ejemplo, cuando queremos enviar datos digitales por una línea telefónica analógica (modulación de señal). Un tono es una señal (onda) que varía con el tiempo de forma cosenoidal según la ecuación f(t) = A cos (ωt + ϕ) o bien, de forma senoidal según la ecuación f(t) = A sen (ωt + ϕ), donde: — Amplitud (A). Mayor valor alcanzado por una onda en un ciclo. — Ciclo. Patrón que se repite continuamente en la señal. — Frecuencia (ω). Número de ciclos en una unidad de tiempo. Se mide en “hertzios” (Hz). — Período (T). Tiempo que tarda en realizarse un ciclo. Es el inverso de la frecuencia. T = 1/ω; ω = 1/T. — Fase (ϕ). Desplazamiento de la señal respecto al eje de tiempo cero, medido en grados o radianes (2 radianes = 360°). Por ejemplo, una fase de 90° significa que la señal está desplazada 1/4 de ciclo. 5-3 Sistemas y Comunicaciones Ejemplo: Una onda con función f(t) = 5 sen (2t + ) oscila entre 5 voltios y -5 voltios, completa 2 ciclos en un segundo y está desplazada medio ciclo. Su periodo es de 0,5 segundos. Según el tipo de datos que se transmiten y el tipo de señal portadora, se pueden dar las siguientes situaciones: — Dato analógico, señal analógica. Ejemplo: Voz transmitida por teléfono. — Dato digital, señal analógica. Ejemplo: Datos de ordenador transmitidos por la línea telefónica mediante un módem. — Dato analógico, señal digital. Ejemplo: Telefonía a través de Internet (VoIP, voz sobre IP). — Dato digital, señal digital. Ejemplo: Datos de ordenador transmitidos por una red local (LAN). 1.2. Banda base y banda ancha Debemos distinguir la transmisión en banda base y en banda ancha. El primer tipo es utilizado habitualmente en las redes locales (nótese la denominación “BASE” de las variantes Ethernet). La banda ancha, en cambio, se utiliza en líneas troncales, para transmitir datos de muchos usuarios a grandes distancias. — Banda ancha (broadband). Los datos son modulados en señales analógicas en el origen y demodulados en el destino. Se utilizan técnicas de multiplexación para permitir varias comunicaciones simultáneas. — Banda base (baseband). Se utiliza todo el canal para la transmisión de una única señal digital. La señal se transmite de forma directa, sin modulación previa (no se utiliza módem). Sólo se puede utilizar en distancias cortas. El medio de transmisión es barato. 1.3. Transmisión serie y paralelo Según el número de líneas de comunicación entre el origen y el destino, la transmisión puede realizarse en serie o en paralelo: 5-4 — Transmisión serie. La información se transmite por una única línea. Los elementos base (bits) que forman un dato (byte) se transmiten de forma consecutiva, uno detrás de otro. Las transmisiones de larga distancia son siempre serie. Es la forma de transmisión preferida para las nuevas tecnologías de transmisión como USB (Universal Serial Bus), S-ATA (Serial ATA) y redes de ordenadores en general. — Transmisión en paralelo. Se transmiten de forma simultánea los distintos elementos base que forman un dato. Se requieren tantas líneas como elementos base tenga el dato. En el caso de los bytes, serán Comunicaciones necesarias 8 líneas, una para cada “bit”. Para distancia largas no es apropiada ya que los datos de unas líneas pueden llegar antes que los de otras, perdiendo la sincronización. 1.4. Modos de comunicación — Simplex. En una comunicación simplex existe un solo canal unidireccional: el origen puede transmitir al destino pero el destino no puede comunicarse con el origen. Por ejemplo, la radio y la televisión. — Half-duplex. En una comunicación “half-duplex” existe un solo canal que puede transmitir en los dos sentidos pero no simultáneamente: las estaciones se tienen que turnar. Esto es lo que ocurre con las emisoras de radioaficionados. — Full-duplex o duplex. Por último, en una comunicación “full-duplex” existen dos canales (físicos o lógicos), uno para cada sentido: ambas estaciones pueden transmitir y recibir a la vez. Por ejemplo, el teléfono. 1.5. Deterioro en la transmisión Durante la transmisión, la señal puede sufrir distintas modificaciones que provocan que la información recibida por el destino sea distinta a la enviada por el origen. Si los medios de transmisión fuesen perfectos la información no se vería alterada pero, desafortunamente, esto no es así y es preciso tenerlo en cuenta. Es necesario utilizar técnicas de detección de errores para que el destino compruebe si la información recibida se ajusta a la enviada originalmente. Los principales problemas que afectan a los medios de transmisión son: — Atenuación. Debilitación de la señal con la distancia. Se compensa utilizando repetidores o amplificadores de señal. — Distorsión de retardo. Se produce porque cada frecuencia viaja a velocidades distintas dentro del mismo canal. Unos datos pueden llegar a solaparse con los anteriores dificultando la correcta recepción de la transmisión. Se puede solucionar mediante técnicas de ecualización. — Ruido. Obedece a señales no deseables, procedentes de fuentes distintas al emisor, que se entremezclan con la señal original. Se distinguen los siguientes tipos de ruido: • Ruido blanco. Provocado por las oscilaciones térmicas del medio. Se distribuye uniformemente por la señal original. No se puede evitar. • Ruido impulsivo o electromagnético. Son interferencias aleatorias, no continuas ni previsibles. Por ejemplo, las producidas por un pico de tensión en el suministro de energía. 5-5 Sistemas y Comunicaciones • 1.6. Diafonía. Acoplamiento no deseado entre las líneas que transportan las señales. Hace unos años la diafonía era un fenómeno frecuente en las líneas telefónicas (cruce de dos conversaciones). Transmisión síncrona y asíncrona El receptor de una transmisión debe saber en qué momento y con qué regularidad el emisor le envía los datos con el fin de interpretar correctamente la información recibida. Es necesario por tanto algún tipo de sincronismo entre el emisor y el receptor. Se diferencian dos modos de transmisión: 1.6.1. Transmisión asíncrona Los datos se transmiten en instantes aleatorios, como es el caso de las pulsaciones de teclas en un teclado o el movimiento de un ratón. La sincronización se produce al enviar cada carácter añadiendo unos bits de sincronismo. Para cada carácter se envían en realidad: 1 bit de comienzo (start), los “bits” del carácter (7 u 8) y 1, 1,5 ó 2 bits mínimos de parada (stop). Después de los “bits” de parada, si no se transmite nada, se mantiene el mismo nivel de tensión (reposo). El bit de comienzo lo que hace es provocar una tensión opuesta, de forma que se genere una transición y el receptor lo detecte. Este tipo de transmisión es asíncrona a nivel de carácter y síncrona a nivel de “bits”. No es un método de transmisión apropiado cuando se requiere enviar una gran cantidad de información, debido a que los numerosos bits de sincronismo necesarios desaprovechan el canal y reducen la velocidad. 1.6.2. Transmisión síncrona El emisor y el receptor utilizan la misma base de tiempos durante toda la comunicación, con objeto de muestrear cada pulso de la señal en el centro sin que se vaya desplazando. La sincronización no se realiza carácter a carácter sino bloque a bloque, consiguiendo así mayor velocidad durante la transmisión de un flujo continuo de datos. Debe existir entonces un mecanismo para que emisor y receptor compartan la señal de reloj. Esto se puede conseguir de dos formas: utilizando una línea adicional para el reloj o bien, incorporando la señal de reloj junto a los datos. Este último mecanismo es más eficiente. El sincronismo puede estar orientado a carácter u orientado a bit. En el primer caso se envían varios caracteres especiales “SYN” para alertar al receptor de que va a comenzar la transmisión de datos, a continuación se envía un carácter de comienzo de texto (STX, start text) seguido de los datos y finalmente, el carácter de fin de bloque (ETX, end of text). En el sincronismo orientado a bit, los dos extremos de la comunicación deben analizar bit a bit, en lugar de carácter a carácter. En concreto, los datos se encierran entre delimitadores formados por 01111110. Una secuencia de seis unos es utilizada como marca especial. El emisor añade un 0 extra cada cinco unos de datos y el receptor lo suprime si observa el 0 detrás de cinco unos. De esta forma la cadena 01111110 será siempre la marca que delimitará a los datos, sin ambigüedades. 5-6 Comunicaciones 1.7. Conmutación de circuitos, de mensajes y de paquetes La comunicación entre un origen y un destino habitualmente atraviesa nodos intermedios que se encargan de encauzar el tráfico. Por ejemplo, en las llamadas telefónicas los nodos intermedios son las centralitas telefónicas y en las conexiones a Internet, los routers o encaminadores. Dependiendo de la utilización de estos nodos intermedios, se distingue entre conmutación de circuitos, de mensajes y de paquetes. — En la conmutación de circuitos se establece un camino físico entre el origen y el destino durante el tiempo que dure la transmisión de datos. Este camino es exclusivo para los dos extremos de la comunicación: no se comparte con otros usuarios (ancho de banda fijo). Si no se transmiten datos o se transmiten pocos se estará infrautilizando el canal. Las comunicaciones a través de líneas telefónicas analógicas (RTB) o digitales (RDSI) funcionan mediante conmutación de circuitos. — Un mensaje que se transmite por conmutación de mensajes va pasando desde un nodo al siguiente, liberando el tramo anterior en cada paso para que otros puedan utilizarlo y esperando a que el siguiente tramo esté libre para transmitirlo. Esto implica que el camino origen-destino es utilizado de forma simultánea por distintos mensajes. Sin embargo, este método no es muy útil en la práctica ya que los nodos intermedios necesitarían una elevada memoria temporal para almacenar los mensajes completos. En la vida real podemos compararlo con el correo postal. — Finalmente, la conmutación de paquetes es la que realmente se utiliza cuando hablamos de redes. Los mensajes se fragmentan en paquetes y cada uno de ellos se envía de forma independiente desde el origen al destino. De esta manera, los nodos (routers) no necesitan una gran memoria temporal y el tráfico por la red es más fluido. Nos encontramos aquí con una serie de problemas añadidos: la pérdida de un paquete provocará que se descarte el mensaje completo; además, como los paquetes pueden seguir rutas distintas puede darse el caso de que lleguen desordenados al destino. Esta es la forma de transmisión que se utiliza en Internet: los fragmentos de un mensaje van pasando a través de distintas redes hasta llegar al destino. Tipos de servicios: • Datagrama: Es no orientado a conexión (CLNS), el envío de paquetes se realiza sin establecimiento previo de circuito físico/virtual, en destino los paquetes puedes llegar desordenados. • Circuito Virtual: Es orientado a conexión (CONS), existe una conexión lógica (circuito virtual) entre origen y destino, los paquetes siguen un camino determinado, sobre un canal físico (entre ETD y ETCD), puede haber varios canales lógicos (cada uno con su identificador). Tipos: • Circuitos Virtuales Permanentes (CVP: no hay establecimiento porque ya lo ha habido previamente, la comunicación siempre se produce entre los mismo extremos —equivalente a una línea punto a punto—). 5-7 Sistemas y Comunicaciones • 1.8. Circuitos Virtuales Conmutados (CVC: orientados a conexión, hay establecimiento y puede establecerse con un extremo distinto cada vez). Ancho de banda y velocidad de transmisión Si transmitimos 1 “bit” en cada pulso, necesitaremos únicamente dos niveles de tensión. Por ejemplo: -5 voltios para el “0” binario y 5 voltios para el “1” binario. Este tipo de codificación se conoce como monobit. Es lógico pensar que podemos aumentar el número de tensiones distintas para así incrementar los “bits” transmitidos en cada pulso de señal. Si ampliamos a 4 el número de tensiones distintas (por ejemplo: -2v, -1v, 1v y 2v) podremos codificar 2 “bits” a la vez (00, 01, 10 y 11). Las codificaciones de varios “bits” se resumen en la siguiente tabla: Nº bits transmitidos en cada pulso (n) Nº de niveles de tensión distintos en cada pulso (V) Nombre de la codificación 1bit 2 niveles Monobil 2 bits 4 niveles Dibit 3 bits 8 niveles Tribit n bits 2n niveles Los baudios son los pulsos por segundo que se pueden transmitir en una línea. En la codificación monobit (n=1), los baudios coinciden con los bits/segundo. La velocidad expresada en bits/segundo de una transmisión es el producto de n por la velocidad en baudios de la línea. Por ejemplo, si tenemos una línea de 1.200 baudios y utilizamos codificación dibit (n=2), estaremos transmitiendo a una velocidad de 2·1200=2400 bits/seg. Las velocidades se expresan habitualmente en bits/segundo. Ejemplo: un módem de 56 Kbps tiene una velocidad de 56.000 “bits” por segundo (no baudios). El ancho de banda de un canal es la diferencia entre la frecuencia máxima y la frecuencia mínima de la señal que puede transmitir. Se mide en “hertzios” (hz) o ciclos por segundo. Una señal digital (onda cuadrada) se transmite por un medio de comunicación como su descomposición de Fourier, que consiste en una serie infinita de distintas frecuencias. El ancho de banda necesario para que esta señal sea completamente cuadrada sería infinito. Como no se puede disponer de este ancho de banda, lo que se hace es una aproximación con las primeras componentes de la serie. Cuanto mayor sea el ancho de banda del canal, mayor será el número de frecuencias distintas que se pueden transmitir. Esto generará una señal de mayor calidad y, por tanto, una velocidad mayor. 5-8 Comunicaciones La capacidad de un canal es la velocidad máxima a la que se pueden transmitir datos por ese canal. Según lo anterior, la capacidad de un canal será mayor cuanto mayor sea el ancho de banda del canal y se transmita un mayor número de bits en cada pulso. Esta relación se expresa mediante el Teorema de Nyquist: C = 2 H log2 V Donde: — C es la capacidad máxima del canal. — H es el ancho de banda o diferencia de frecuencias (H = fsuperior - finferior). — V es el número de niveles de tensión distintos en cada pulso. — log2 V es el número de bits transmitidos en cada pulso (n). Supongamos un canal de 3.100 Hz. En este caso, según el Teorema de Nyquist, podremos transmitir hasta 6.200 bps en caso de codificación monobit y hasta 12.400 bps en caso de codificación dibit. La capacidad de un canal se ve limitada por la cantidad de ruido existente en la línea. Una línea con mucho ruido producirá transmisiones pobres. Este aspecto se refleja en el Teorema de Shannon, que relaciona el ruido de la línea con la velocidad de transmisión: C = H log2 (1+ S/N) Donde: — C es la capacidad máxima del canal. — S es la potencia de señal. — N es la potencia de ruido. — S/N es la relación señal/ruido. Cuanto mayor sea este valor, la señal tendrá mayor calidad. La relación señal ruido expresada en decibelios equivale a 10 por el logaritmo en base 10 de S/N. (S/N)dB = 10 log10 (S/N) Ejemplo: supongamos un canal de 30 dB y 3.100 Hz. Despejando S/N en la fórmula anterior, tenemos una relación señal/ruido de S/N = 10(30/10) = 1000. Sustituyendo en la fórmula del Teorema de Shannon, tenemos la capacidad máxima del canal: C = 3.100 log2 (1+ 1000) = 30.894 bps. ¿Cuántos niveles son necesarios para obtener 30.894 bps en un canal de 3.100 Hz? Despejando V en el Teorema de Nyquist tendremos, V = 2 (3.0894/6.200) = 32 niveles aproximadamente. Es decir, se necesitaría codificar 5 “bits” en cada pulso. 5-9 Sistemas y Comunicaciones 1.9. Codificaciones en banda base En este apartado se estudian las distintas formas de codificación de las señales binarias en tensiones eléctricas. Esto es, ¿qué voltaje se asigna al “1” binario? ¿cuál al “0” binario? Estas codificaciones se realizan por un dispositivo denominado codec (codificadordecodificador) o módem en banda base. Sin embargo, no es un módem propiamente dicho puesto que no realiza tareas de modulación y demodulación. Los principales problemas a los que se enfrentan las codificaciones son: la presencia de componente continua de la señal (mantener un mismo voltaje de forma continua) porque genera distorsión de la señal y la falta de sincronización (se produce si hay pocas transiciones). En la codificación NRZ, según vamos a ver, cuando se envía una secuencia de ceros o unos se producen los problemas mencionados. 5-10 — NRZ (Non Return to Zero). El bit “0” se codifica con un nivel bajo de tensión (-5 ó 0 voltios, por ejemplo) y el bit “1” con un nivel alto (5 voltios, por ejemplo). — NRZ-L (NRZ Level). Las codificaciones son inversas al caso anterior. El bit “0” utiliza un nivel alto de tensión y el bit “1”, un nivel bajo. Tanto NRZ como NRZ-L invierten los bits si se colocan los cables al revés. Ambos generan problemas de sincronización con secuencias de unos o ceros. — NRZI (NRZ Invert on ones). Para codificar el bit “0” no se varía el nivel de tensión anterior. En cambio, el bit “1” invierte el nivel de tensión anterior. Es por tanto una codificación diferencial (se codifica comparando con el nivel de tensión anterior). NRZI es más resistente al ruido y permite la inversión de cables. Las cadenas de unos sincronizan muy bien, aunque las cadenas de ceros mantienen los problemas anteriores. — AMI Bipolar (Alternate Mark Inversion). El bit “0” se codifica con un nivel de 0 voltios. El bit “1” se codifica alternativamente con +5v o -5v. Esta técnica tiene una mayor complejidad ya que requiere 3 niveles de tensión distinguibles para un único bit. Las secuencias de unos se sincronizan muy bien, aunque las secuencias de ceros mantienen los problemas de sincronización. Se pueden detectar errores si se recibe una tensión de 5v o -5v durante dos ciclos seguidos. — Pseudoternario. Similar a AMI aunque se cambian los voltajes. El bit “0” se codifica alternativamente con +5 y -5 voltios; y el bit “1”, con 0 voltios. — Bifase o Manchester. En la mitad de todos los ciclos se genera una transición. Esta transición será positiva (de -5v a 5v) o negativa (de 5v a -5v) según el bit a representar. Por ejemplo, el bit “1” se puede representar con transiciones negativas, esto es, el primer semi-intervalo a 5v y el segundo a -5v. El bit “0” se representa de forma opuesta. Su mayor ventaja es que se anula la componente continua puesto que se realizan transiciones en todos los ciclos. Su sincronización es sencilla. Además, se pueden detectar errores si no se produce la transición obligatoria a mitad de un ciclo. Comunicaciones Su principal inconveniente es que ocupa un mayor ancho de banda (aproximadamente el doble) que el ocupado por NRZ. — Bifase diferencial o Manchester diferencial. Se mantiene la transición a mitad de todos los ciclos. Esta transición será igual a la del ciclo anterior en caso de transmitirse un “0” y se invierte en caso de transmitirse un “1”. Otra forma de verlo es: el bit “0” genera una transición al principio del ciclo y el bit “1”, no. Su mayor ventaja es la facilidad para detectar errores. Además, conserva las ventajas de la codificación anterior. Las codificaciones bifase son apropiadas para su utilización en distancias cortas como por ejemplo en redes locales Ethernet. — Miller. Reduce el número de transiciones de las codificaciones bifase. Su componente continua no se llega a anular, aunque es inferior a NRZ. No precisa mayor ancho de banda que en NRZ. 1.10. Técnicas de multiplexación La multiplexación permite aprovechar al máximo la capacidad de un canal incluyendo varias comunicaciones de forma simultánea. Los dispositivos encargados de realizar la multiplexación de varias comunicaciones en un mismo canal son los multiplexores (n entradas, 1 salida). En el otro extremo del canal un demultiplexor realiza la tarea contraria, obteniendo las distintas comunicaciones a partir de un único canal (1 entrada, n salidas). Distinguimos tres tipos de multiplexación: — Multiplexación por división en frecuencias (MDF o FDM, Frecuency-Division Multiplexing). Se transmiten varias señales por el mismo canal utilizando cada una de ellas una frecuencia distinta. Se puede utilizar si el medio de transmisión dispone de un ancho de banda suficiente para la transmisión de las distintas señales. Es la técnica utilizada para la difusión de radio y televisión. — Multiplexación por división en el tiempo (MDT o TDM, Time-Division Multiplexing) o TDM síncrona. Los datos de cada una de las fuentes son divididos en ranuras temporales. Se va enviando una ranura de cada fuente a continuación de la ranura anterior, de forma cíclica. El resultado final es un conjunto de bits en el canal que pertenecen a distintas comunicaciones. Este tipo de multiplexación se utiliza para el envío de voz digitalizada (teléfonos móviles). — Multiplexación estadística (TDM asíncrona o TDM estadística). Es una técnica más avanzada que la anterior. En lugar de preasignar las 5-11 Sistemas y Comunicaciones ranuras temporales a un número fijo de comunicaciones, detecta las comunicaciones activas y reparte el canal entre todas ellas. De esta forma se evita que una comunicación inactiva malgaste ancho de banda. Como veremos en el próximo tema, este tipo de multiplexación se utiliza en líneas “frame relay”. 1.11. Tipos de modulaciones Los datos digitales requieren un proceso denominado modulación para su transmisión por un medio analógico. Esta transmisión analógica, según hemos estudiado, se basa en una señal continua de frecuencia constante llamada portadora, que varía de forma senoidal o cosenoidal. El proceso de modulación consiste en codificar los datos digitales mediante la variación de los parámetros fundamentales de la señal portadora: amplitud, frecuencia y fase. El dispositivo encargado de la modulación (de digital a analógico) y demodulación (de analógico a digital) de señales es el módem (modulador-demodulador). Para el estudio de los tipos de modulaciones utilizaremos la señal portadora: p(t) = A cos (ωt) que genera una onda cosenoidal. El dato digital que se va a codificar en cada instante del tiempo viene dado por la función x(t) y sólo puede valer 0 ó 1. — Modulación en amplitud (ASK, Amplitude Shift Keying). La señal modulada será y(t) = [A + x(t)] cos (ωt). La amplitud de la señal es distinta si se transmite un cero o se transmite un uno. Este tipo de modulación es sensible al ruido y a variaciones repentinas de la ganancia. Se utiliza en fibra óptica. — Modulación en frecuencia (FSK, Frequency Shift Keying). La señal modulada será y(t) = A cos ((ω + K x(t)) t), siendo K una constante. La frecuencia de la señal es distinta si se transmite un cero o un uno. Si se utilizan varias frecuencias base distintas (ω1, ω2), se pueden transmitir varias señales simultáneamente por el mismo canal. La modulación FSK es menos sensible al ruido. Se utiliza en transmisiones de radio a altas frecuencias y en el cable coaxial. — Modulación en fase (PSK, Phase Shift Keying). Obsérvese la “P” de “Phase” en PSK. La señal modulada será y(t) = A cos (ω t + x(t)), siendo un ángulo constante. La fase de la señal es distinta según se transmita un cero o un uno. Por ejemplo, podríamos asignar una fase de 0° al dígito “0” y una fase de 180° al dígito “1”. — Modulación en fase diferencial (DPSK, Differential Phase Shift Keying). La modulación PSK no es muy utilizada en la práctica debido a la dificultad de comparación de la fase 5-12 Comunicaciones con una señal de referencia invariable. En su lugar se prefiere DPSK que invierte la fase respecto a la señal anterior si es “1” o la mantiene si es un “0”. Las técnicas de modulación anteriores permiten codificar únicamente un “bit” de información en cada instante de tiempo. Sin embargo, podemos afinar más estas modulaciones para que se transmitan varios “bits” simultáneamente. Esto es lo que se conoce como transmisión multinivel. Las técnicas principales son: — QPSK (Quadrature Phase Shift Keying, PSK en cuadratura). Se utilizan cuatro fases, por lo tanto, se pueden representar 2 “bits”: 00, 01, 10 y 11. — 8-PSK. Se distinguen 8 fases, esto es, 3 “bits”: 000, 001, 010, 011, 100, 101, 110 y 111. — 16-PSK. En este caso, son 16 las fases, lo que permite representar 4 “bits”. — 8-QAM (Quadrature Amplitude Modulation, modulación en amplitud en cuadratura). Combina la modulación en fase y en amplitud. Existen 8 estados que dan lugar a 3 bits. La técnica QAM se utiliza habitualmente para la señalización analógica de las líneas ADSL. — 16-QAM. Equivalente a 8-QAM, pero con 16 estados (4 bits). 1.11.1. Otras modulaciones Hasta ahora hemos explicado cómo enviar datos digitales a través de una portadora analógica. Sin embargo, se pueden dar otras combinaciones. Datos analógicos y portadora analógica: — AM (Amplitude Modulation, modulación de amplitud). — FM (Frequency Modulation, modulación de frecuencia). — PM (Phase Modulation, modulación de fase). Datos analógicos y portadora digital: — PAM (Pulse Amplitude Modulation, modulación de pulsos en amplitud). — PPM (Pulse Position Modulation, modulación de pulsos en posición). — PDM (Pulse Duration Modulation, modulación de pulsos en duración). Obsérvese que no existe la modulación de datos digitales con portadora digital. 5-13 Sistemas y Comunicaciones 2. Equipos de comunicaciones. Equipos terminales En la terminología de telecomunicaciones se utilizan los términos DTE y DCE para referirse a los dispositivos que transmiten y reciben datos a través de un medio de transmisión: — DTE o ETD (Data Terminal Equipment, equipo terminal de datos). Dispositivo que genera o recoge datos (puede ser un ordenador). Debido a que los DTE sólo pueden transmitir a una distancia pequeña (mediante un cable serie o USB en el caso de un ordenador), no suelen conectarse directamente al medio de transmisión: necesitan otro dispositivo. — DCE o ETCD (Data Circuit-terminating Equipment, equipo terminal del circuito de datos). Se sitúa entre el DTE y el medio de transmisión. Por ejemplo un módem, cuya misión es modular los datos para que puedan ser transmitidos por el medio, así como demodular los datos procedentes del medio. Los DCE no sólo realizan esta tarea de adaptación de la señal sino que también suelen incorporar control de errores, compresión de los datos y mecanismos para el establecimiento de la conexión. La comunicación entre DTE y DCE se realiza a través de una interfaz. Estas interfaces deben estar normalizadas para que no existan incompatibilidades. Para cada interfaz física se estudian 4 tipos de características: — Características mecánicas. Definen el tipo y forma de los conectores utilizados para conectar los dispositivos con los hilos conductores del medio de transmisión (circuitos). — Características eléctricas. Definen cómo se representa cada “bit” (tensiones eléctricas) y la velocidad de transmisión. — Características funcionales. Especifican la función de cada circuito. Un circuito se corresponde con un hilo conductor en el medio de transmisión y un “pin” en el conector. Si decimos, por ejemplo, que el “pin” 1 es Tx+ y el “pin” 2 Tx- (transmisión), estaremos indicando parte de las características funcionales de una interfaz. — Características de procedimiento (o procedurales). Definen la secuencia de eventos que deben realizarse para el intercambio de bits a través del medio de transmisión, esto es, qué circuitos y con qué orden se deben utilizar para el envío y recepción de datos. Algunas interfaces digitales son: 5-14 — V.24/EIA-232 — Interfaz RDSI — USB Comunicaciones — FireWire — X.21 — HSSI — G.703 — V.35 2.1. V.24/EIA-232 Se utiliza para la conexión de dispositivos DTE a módems (DCE). Los módems están conectados a su vez a una línea telefónica analógica. Es la interfaz conocida sencillamente como serie. La primera versión fue establecida inicialmente por la EIA (Electronic Industries Association) en 1962 con el nombre RS-232. Actualmente se encuentra en su sexta versión: EIA-232. Es la interfaz más extendida y está definida en el estándar V.24 de la UIT-T. Este estándar únicamente define las características funcionales y de procedimiento. Para el resto de características, recurre a otras normas: — Características mecánicas: ISO 2110. Define un conector de 25 contactos, aunque en la mayoría de las aplicaciones no se utilizan los 25 circuitos y es suficiente con 9. — Características eléctricas: V.28. Utiliza una codificación NRZ-L: más de 3 voltios representa un “0” binario y menos de -3 voltios, un “1” binario. Se admiten velocidades de hasta 20 Kbps y distancias de cable de hasta 15 metros. — Características funcionales: V.24. Existen 16 circuitos de control, 4 de datos, 3 de reloj y 1 circuito de tierra. Los principales circuitos y sus números de “pin” son: tierra (pin 1), transmitir (2), recibir (3), petición de envío (4), libre para enviar (5), DCE preparado (6), retorno común (7), detección de portadora (8), DTE preparado (20). Se incluyen circuitos de control para la realización de dos tipos de comprobaciones o tests de funcionamiento: bucle local y bucle remoto. — Características de procedimiento: V.24. Define la secuencia de eventos en los circuitos. La interfaz EIA-232 fue pensada para interconectar dispositivos DTE con DCE, sin embargo, pronto surgió la necesidad de conectar dos ordenadores que disponían de este conector. Para estos casos se requiere un cable de tipo “null” módem que, en realidad, lo que hace es cruzar las señales de transmisión de un DTE con las de recepción del otro DTE. Existe un estándar llamado EIA-449 que trata de ser el sucesor de EIA232. Sus características mecánicas, funcionales y de procedimiento se definen en EIA-449, pero las características eléctricas están definidas en dos normas: 5-15 Sistemas y Comunicaciones EIA-423-A y EIA-422-A. Permite distancias y velocidades mayores que EIA-232: 1.200 metros y hasta 2 Mbps. Utiliza un conector de 37 contactos para el canal principal y uno de 9 para el secundario. 2.2. Interfaz RDSI Establece la interfaz entre el equipo terminal (llamado TE en la terminología de RDSI) y un terminal de red (NT). El estándar V.24 tiene el inconveniente de la utilización de un elevado número de circuitos, lo que incrementa el coste del cableado. La idea de utilizar un menor número de circuitos pero con una mayor lógica de control se utilizó inicialmente en el estándar digital X.21 mediante conectores de 15 contactos. En la interfaz RDSI el número de contactos se ha reducido hasta 8. Las características mecánicas de conector de 8 contactos están definidas en la norma ISO 8877. Se utilizan 2 circuitos para transmitir, 2 para recibir, 2 para suministro de energía del NE al TE y 2 para suministrar energía en sentido contrario. La transmisión RDSI únicamente usa 6 circuitos (no se usa el suministro de energía del TE al NE). Para la codificación de los datos se utiliza la codificación pseudoternario en los accesos básicos de RDSI y la codificación AMI en los accesos primarios. 2.3. USB Y Firewire La interfaz serie USB (Universal Serial Bus, bus serie universal) permite conectar, en caliente, dispositivos al ordenador. Se diseñó con el criterio de hacer un conector universal que valiese para todo tipo de dispositivos (impresoras, ratones, escáneres, etc.) de forma que se pudieran conectar y desconectar fácilmente. Los ordenadores disponen de 1 o más controladoras USB que permiten la conexión de dispositivos. A cada una se pueden conectar hasta 127 dispositivos, conectados en forma de árbol mediante concentradores (hubs) USB, los cuales forman una red personal (PAN, personal area network). Se trata de una configuración asimétrica (cliente/servidor): 1 host controla hasta 127 dispositivos. Un cable USB tiene 4 circuitos: 2 para datos y 2 para corriente eléctrica, los cuales permiten alimentar a dispositivos de bajo consumo (5 voltios). Versión 5-16 Velocidad máxima USB 1.0 y 1.1 12 Mbps = 1,5 MBytes/seg USB 2.0 480 Mbps = 60 MBytes/seg USB 3.0 4,8 Gbps = 600 MBytes/seg USB 3.1 10 Gbps = 1,25 GBytes/seg Comunicaciones Entre las empresas promotoras de USB se encuentran: Intel, Microsoft, NEC, Philips, Hewlett-Packard y Agere Systems. FireWire es el nombre propietario de Apple de la interfaz IEEE 1394. Tiene una velocidad superior a USB y, por este motivo, ha sido muy utilizado para transferencias de audio y vídeo. Versión 3. Velocidad máxima Firewire 400 50 MBytes/seg Firewire 800 100 MBytes/seg Firewire s1600 200 MBytes/seg Firewire s3200 400 MBytes/seg Detección de errores ¿Cómo puede saber el receptor que ha recibido el mismo mensaje que envió el emisor? ¿Cómo puede saber que no se ha producido ningún error que haya alterado los datos durante la transmisión? Estas cuestiones son las que vamos a plantear en este apartado: se necesitan mecanismos de detección de errores para garantizar transmisiones libres de errores. Si el receptor detecta algún error, puede actuar de diversas maneras según los protocolos que esté utilizando. La solución más sencilla es enviarle un mensaje al emisor pidiéndole que le reenvíe de nuevo la información que llegó defectuosa. Los mecanismos de detección se basan en añadir a las transmisiones una serie de bits adicionales, denominados bits de redundancia. La redundancia es aquella parte del mensaje que sería innecesaria en ausencia de errores (es decir, no aporta información nueva: sólo permite detectar errores). Algunos métodos incorporan una redundancia capaz de corregir errores. Estos son los mecanismos de detección y corrección de errores. Como ejemplos de mecanismos de detección de errores vamos a estudiar a continuación la paridad y los códigos CRC. 3.1. Paridad Las transmisiones se dividen en palabras de cierto número de bits (por ejemplo, 8 bits) y se envían secuencialmente. A cada una de estas palabras se le añade un único bit de redundancia (bit de paridad) de tal forma que la suma de todos los bits de la palabra sea siempre un número par (paridad par) o impar (paridad impar). El emisor envía las palabras añadiendo los correspondientes bits de paridad. El receptor comprobará a su llegada que la suma de los bits de la palabra 5-17 Sistemas y Comunicaciones incluyendo la redundancia es un número par (si la codificación convenida entre emisorreceptor es de paridad par) o un número impar (paridad impar). Si el receptor encuentra alguna palabra que no se ajuste a la codificación establecida, le solicitará al emisor que le reenvíe de nuevo la información. La paridad únicamente permite detectar errores simples, esto es, que varíe un único bit en cada palabra. Si varían 2 bits, este mecanismo no es capaz de detectar el error. Para el cálculo de la paridad par se puede utilizar la puerta lógica XOR (“o exclusiva”) da un resultado de 1 cuando el número de entradas a 1 sea impar es decir, habrá detectado un error o bien, la XNOR si se trata de paridad impar que da un resultado de 1 cuando el número de entradas a 1 sea par detectándose el error. Veamos un ejemplo de paridad par: Datos (8 bits) Datos + redundacia (9 bits) Suma de bits 10110110 101101101 6 00101001 001010011 4 11001001 110010010 4 11001001 111110100 6 00010000 000100001 2 El receptor realizará la suma de “bits” a la llegada del mensaje. Si alguna palabra no suma un número par, significará que se ha producido un error durante la transmisión. 3.2. Códigos de Redundancia Cíclica (CRC) Los códigos de paridad tienen el inconveniente de que se requiere demasiada redundancia para detectar únicamente errores simples. En el ejemplo que hemos visto, sólo un 8/9 de la información transmitida contenían datos, el resto era redundancia. Los códigos de redundancia cíclica (CRC) son muy utilizados en la práctica para la detección de errores en largas secuencias de datos. Se basan en representar las cadenas de datos como polinomios. El emisor efectúa ciertas operaciones matemáticas antes de enviar los datos. El receptor realizará, a la llegada de la transmisión, una división entre un polinomio convenido (polinomio generador). Si el resto es cero, la transmisión ha sido correcta. Si el resto es distinto significará que se han producido errores y solicitará la retransmisión al emisor. 4. Medios de transmisión El medio de transmisión es el soporte sobre el cual viajan los datos que se intercambian durante una comunicación. Se clasifican en guiados y no guiados. Los primeros son aquellos que utilizan un medio sólido (un cable) 5-18 Comunicaciones para la transmisión. Los medios no guiados utilizan el aire para transportar los datos: son los medios inalámbricos. Medios guiados: — Cable coaxial. — Par trenzado. — Fibra óptica. Medios no guiados o inalámbricos: — Ondas de radio. — Microondas. — Infrarrojos. — Ondas de luz. Antes de pasar a estudiar cada uno de los medios de transmisión, definiremos el concepto de cableado estructurado. Se define como un sistema de distribución integral de comunicaciones (voz y datos) basado en la normalización de sus cables, conectores y adaptadores de todas las comunicaciones. 4.1. Medios Guiados 4.1.1. Cable de par trenzado Está formado por dos hilos de cobre recubiertos cada uno con un aislante y trenzados entre sí cada cierto paso. Los cables de par trenzado actuales utilizados en las redes locales contienen 4 pares (8 hilos) que a su vez van trenzados entre sí dentro de un aislante externo. El trenzado se utiliza para reducir las interferencias electromagnéticas (diafonía) entre pares de cables adyacentes. A mayor número de trenzas por unidad de longitud el cable admite una mayor velocidad de transmisión. Es el medio de transmisión más utilizado y económico, tanto para transmisiones analógicas (telefonía) como digitales (redes locales). 5-19 Sistemas y Comunicaciones En las redes locales se utiliza un conector de 8 contactos llamado RJ45 aunque, en realidad, sólo se utilizan dos pares: uno para recepción y otro para transmisión. En telefonía se utiliza un conector de 4 contactos conocido como RJ11 aunque sólo es necesario utilizar 2 contactos (un par). La longitud de segmento máxima de cable par trenzado, desde el dispositivo central o concentrador hasta una estación, es de 100 metros. Si comparamos el par trenzado con otros medios de transmisión guiados, el par trenzado es más económico y sencillo de manejar, pero permite menores distancias, ancho de banda y velocidades de transmisión. Es muy susceptible a las interferencias y al ruido, aunque se puede proteger el cable mediante apantallamiento, utilizando una malla metálica que lo envuelva. Existen dos estándares principales que definen las características de los cables o de los enlaces, estos son: — EIA/TIA 568: Normas Americanas del ANSI, referentes a las características físicas en cuanto a especificaciones mecánicas, eléctricas y procedimentales de los elementos o medios físicos de interconexión. Define categorías de cables conectados dos puntos. — ISO/EIS DIS 11801: Normas internacionales de ISO que se encargan de la . estandarización en clases medido extremo a extremo de la conexión. La calidad del cable y, por lo tanto, su velocidad máxima soportada viene determinada según su categoría: 5-20 — Categoría 1. Usada para telefonía. — Categoría 2. Velocidad máxima: 4 Mbps. Utilizada en redes Token Ring de esta velocidad. — Categoría 3. Velocidad máxima: 10 Mbps. Utilizada para transmisión de datos en redes Ethernet hasta 10 Mbps (10BaseT). — Categoría 4. Velocidad máxima: 16 Mbps. Utilizada en redes Token Ring de esta velocidad. — Categoría 5. Se utiliza en redes Ethernet a 100 Mbps (100BaseTX), redes ATM a 155 Mbps y Gigabit Ethernet (1 Gbps). — Categoría 5e. Es una mejora de la categoría 5, que incluye especificaciones más estrictas. Sus velocidades máximas teóricas son las mismas, pero ofrece mejores resultados sobre todo en redes de 1 Gbps. — Categoría 6. Puede alcanzar velocidades del orden de 1 Gbps. — Categoría 6a. Puede alcanzar velocidades del orden de 10 Gbps. — Categoría 7. Puede alcanzar velocidades del orden de 10 Gbps. Comunicaciones Según el tipo de apantallamiento de los cables, se clasifican en: — UTP (Unshielded Twisted Pair, par trenzado no apantallado). — FTP (Foiled Twisted Pair, par trenzado encintado). — STP (Shielded Twisted Pair, par trenzado apantallado). Los cables UTP son los más utilizados debido a su bajo coste y facilidad de instalación. Los cables STP están embutidos en una malla metálica que reduce las interferencias y mejora las características de la transmisión. Sin embargo, tienen un coste elevado y al ser más gruesos son más complicados de instalar. Los cables FTP son una solución intermedia entre UTP y STP. Los tipos de cables más utilizados en la actualidad son UTP CAT5e y UTP CAT6. Los cables STP se utilizan únicamente para instalaciones muy puntuales que requieran una calidad de transmisión muy alta y libre de interferencias. Según la forma de instalar los conectores RJ45 en los extremos del cable, los cables de par trenzado pueden ser directos o cruzados: — Los cables directos tienen ambos extremos según la misma norma (EIA/TIA568A o EIA/TIA-568B, a elegir) y se utilizan para conectar ordenadores/routers con un hub/switch. — Los cables cruzados tienen un conector de la norma EIA/TIA-568A y el otro EIA/TIA-568B. Se utilizan para conectar 2 dispositivos del mismo tipo: 2 ordenadores/routers o 2 hubs/switches. 4.1.2. Cable coaxial Consiste en un hilo de cobre en la parte central rodeado por una malla y separados ambos elementos conductores por un cilindro de plástico (dieléctrico). La forma concéntrica de los dos conductores hace que el cable coaxial sea menos susceptible a las interferencias y diafonías que el par trenzado. Además, permite la transmisión a distancias superiores. Aislante Hilo conductor central Protección exterior Malla protectora 5-21 Sistemas y Comunicaciones El cable coaxial se ha venido utilizando frecuentemente para televisión por cable, telefonía a larga distancia y redes locales. Sin embargo, la fibra óptica lo está sustituyendo en las líneas troncales y el par trenzado en redes locales. El ancho de banda del cable coaxial alcanza frecuencias de 400 ó 500 MHz en señalización analógica. Con este tipo de señalización se requieren repetidores cada pocos kilómetros. En señalización digital se utiliza habitualmente con velocidades de 10 Mbps (Ethernet 10Base5 y 10Base2). Para transmisión a largas distancias de señales digitales se requieren repetidores cada aproximadamente un kilómetro e incluso menos si aumenta la velocidad de transmisión. Existen dos tipos de cables coaxiales: — Coaxial grueso (thickwire). Se utilizaba en las antiguas redes locales Ethernet 10Base5 (el 5 indica una longitud de segmento máxima de 500 metros) y en líneas troncales de telefonía y televisión por cable. Para su conexión, emplea transceptores (transceivers) y conectores de tipo vampiro. Backbone de cable grueso Transceiver Cable de transceiver — Coaxial fino (thin coax o RG-58). Se utiliza en las redes locales Ethernet 10Base2 (185 metros de longitud máxima de segmento). Utiliza conectores BNC en los extremos de los segmentos de cable. Para unir unas estaciones con otras se requieren conectores tipo T en cada estación y terminadores en los extremos del bus. 4.1.3. Fibra óptica Los cables de fibra óptica transmiten la información en forma de pulsos de luz. La fibra consiste en materiales plásticos o de cristal capaces de transmitir luz desde un extremo hasta el extremo opuesto. 5-22 Comunicaciones Capa de protección Revestimiento Polietileno de baja densidad Núcleo Eje de acero Elastómero Núcleo Nailón Tubo de cobre A. Cable Fibra Cable de acero con revestimiento de cobre B. Detalle del núcleo Sus principales ventajas son: — Mayor capacidad. Se han llegado a alcanzar velocidades de cientos de Gbps en decenas de kilómetros de distancia. Su gran velocidad hace de la fibra óptica el medio apropiado para su utilización en líneas troncales. — Menor peso y tamaño. Comparado con otros medios de transmisión, se consiguen mayores tasas de velocidad con menor peso y tamaño. Esto facilita la instalación del cableado. — Menor atenuación. La pérdida de la señal es menor que en otros medios lo que permite distanciar los repetidores de señal incluso a decenas de kilómetros. — Mayor aislamiento. La fibra óptica no es vulnerable a interferencias electromagnéticas. — Mayor seguridad. La dificultad para empalmar dos segmentos de fibra óptica, hace complicado “pinchar” los cables. Los inconvenientes de la fibra óptica radican principalmente en el mayor coste de los dispositivos, cables e instalación. Además, las reparaciones y empalmes de las fibras son complicados. La fibra óptica se ha posicionado como el medio preferido para instalaciones en redes de área extensa tanto para transmisión de voz como de datos digitales. Todavía el coste de su instalación es alto, aunque es de esperar que vaya disminuyendo en un futuro y termine instalándose incluso en redes locales. Una fibra está formada por dos materiales con índices de refracción distintos: núcleo (zona central con mayor índice) y revestimiento (alrededor del 5-23 Sistemas y Comunicaciones núcleo, con menor índice). Los materiales se eligen de tal forma que, debido al principio óptico de reflexión interna total, la luz se propague en el interior del núcleo sin salir hacia el revestimiento. Las ventanas de funcionamiento en las que se envían rayos de luz son intervalos de tiempo en los que la longitud de onda tiene o bien una atenuación constante o bien menor de modo que hace idóneo el envío del haz. A continuación se detallan las ventanas de trabajo: — 1ª ventana: 820nm (nanómetros). — 2ª ventana: 1310nm (nanómetros). — 3ª ventana: 1550nm (nanómetros). — 4ª ventana: 1625nm (nanómetros). Las fuentes ópticas emisoras de luz que se utilizan en fibra óptica son diodos LED o Láser. Por otro lado hay que indicar que las señales ópticas se modulan apagando, encendiendo la luz así como variando su intensidad. Según los modos de propagación (trayectorias de la luz dentro de una fibra), se consideran dos tipos de fibras ópticas: — Monomodo (OS1). Sólo dispone de una trayectoria de luz en su interior. Esto se logra reduciendo el diámetro del núcleo hasta que sólo pueda viajar un modo en su interior. Las instalaciones de fibra monomodo son las más caras, pero a cambio son las que ofrecen una mayor velocidad y menor atenuación de señal. Por este motivo, se utilizan en enlaces de larga distancia a gran velocidad. Los dispositivos utilizados son de alto coste (emisor láser). La dimensión típica (relación del diámetro del núcleo/diámetro de la cubierta) es de 9/125 micras y se alcanzan velocidades del orden de cientos de Gigabits por segundo. — Multimodo (OM). En estas fibras el núcleo tiene un mayor diámetro, de forma que existan distintos caminos para que la luz se propague en su interior. No todos los caminos son iguales de rápidos, lo que genera que el comportamiento de estas fibras sea inferior, tanto en velocidad como en mayor atenuación. Se pueden utilizar con emisores de bajo coste (LED), aunque también con emisores láser. Las fibras multimodo se clasifican, en función de cómo varía el índice de refracción dentro de la fibra en: — 5-24 Multimodo de índice gradual. El índice de refracción del núcleo disminuye progresivamente hacia el exterior. Su comportamiento es intermedio entre las fibras monomodo (mayor rendimiento) y las multimodo de índice discreto (peor rendimiento). Comunicaciones — Multimodo de índice discreto o de salto de índice. El índice de refracción del núcleo es constante, variando de forma brusca al cambiar al revestimiento. Dimensiones típicas de las fibras multimodo: — — — — OM1: 62.5/125 micras, • A una distancia máxima aproximada de 200 metros alcanza una velocidad del orden de 1 Gbps (1Gb Ethernet-1000Base-SX ó 1000Base-LX) • A una distancia máxima aproximada de 33 metros alcanza una velocidad del orden de 10 Gbps (10 Gb Ethernet-10GBase-SR) OM2: 50/125 micras, • A una distancia máxima aproximada de 500 metros alcanza una velocidad del orden de 1 Gbps. (1Gb Ethernet-1000Base-SX ó 1000Base-LX) • A una distancia máxima aproximada de 82 metros alcanza una velocidad del orden de 10 Gbps (10 Gb Ethernet-10GBase-SR) OM3: 50/125 micras optimizada para láser: • A una distancia máxima aproximada de 500 metros alcanza una velocidad del orden de 1 Gbps (1Gb Ethernet-1000Base-SX ó 1000Base-LX) • A una distancia máxima aproximada de 300 metros alcanza una velocidad del orden de 10 Gbps (10 Gb Ethernet-10GBase-SR) • A una distancia máxima aproximada de 100 metros alcanza una velocidad del orden de 40 Gbps (40 Gb Ethernet-40GBase-SR4) • A una distancia máxima aproximada de 100 metros alcanza una velocidad del orden de 100 Gbps (100 Gb Ethernet-100GBase-SR10) OM4: 50/125 micras (optimizada para láser) • A una distancia máxima aproximada de 500 metros alcanza una velocidad del orden de 1 Gbps (1Gb Ethernet-1000Base-SX ó 1000Base-LX) • A una distancia máxima aproximada de 400 metros alcanza una velocidad del orden de 10 Gbps (10 Gb Ethernet-10GBase-SR) • A una distancia máxima aproximada de 150 metros alcanza una velocidad del orden de 40 Gbps (40 Gb Ethernet-40GBase-SR4) • A una distancia máxima aproximada de 150 metros alcanza una velocidad del orden de 100 Gbps (100 Gb Ethernet-100GBase-SR10) Para fibra óptica existen muy diversos tipos de conectores. Algunos de ellos son: MTRJ, ST, SC, LC y FC. 5-25 Sistemas y Comunicaciones 4.2. Medios no guiados El conjunto de frecuencias que “soporta” el aire son muy variadas y conforman el espectro radioeléctrico. Este espectro se divide en bandas y cada una de esas bandas se asocia a servicios específicos (telefonía móvil, radiodifusión analógica de TV y radio, radares para vigilancia de tráfico aéreo, etc) para asegurar la protección de los mismos frente a interferencias. La división del espectro en bandas se realiza mediante ley y para ello el Estado publica el CNAF (Cuadro Nacional de Asignación de Frecuencias). Según la situación en el espectro de radiofrecuencias, la transmisión en unas bandas de frecuencias u otras tiene características distintas. Una transmisión en frecuencias bajas se propaga en todas las direcciones, recorre grandes distancias y atraviesa objetos sólidos. Por el contrario, una transmisión en frecuencias altas es muy direccional, sólo es válida para distancias cortas y no atraviesa objetos sólidos. Según el rango de frecuencias de trabajo, las transmisiones no guiadas se pueden clasificar en tres tipos: a) 5-26 Ondas de radio. Son capaces de recorrer grandes distancias, atravesando edificios incluso. Son ondas omnidireccionales: se propagan en todas las direcciones. Su mayor problema son las interferencias entre usuarios. Banda de Frecuencia Nombre Modulación Razón de Datos Aplicaciones Principales 30-300 kHz LF (low frequency) ASK, FSK, MSK 0,1-100 bps Navegación 300-3000 kHz MF (medium frequency) ASK, FSK, MSK 10-1000 bps Radio AM Comercial 3-30 MHz HF (high frequency) ASK, FSK, MSK 10-3000 bps Radio de onda corta 30-300 MHz VHF (very high frequency) FSK, PSK Hasta 100 kbps Televisión VHF, Radio FM 300-3000 MHz UHF (ultra high frequency) PSK Hasta 10 Mbps Televisión UHF, Microondas Terrestres 3-30 GHz SHF (super high frequency) PSK Hasta 100 Mbps Microondas terrestres y por satélite 30-300 GHz EHF (extremely high frequency) PSK Hasta 750 Mbps Enlaces cercanos con punto a punto experimentales Comunicaciones b) Microondas. Tienen características intermedias entre las ondas de radio y los infrarrojos. En esta zona de frecuencias, transmiten las redes locales inalámbricas (redes Wi-Fi), las cuales tienen una distancia máxima de referencia de 100 metros, suficientes para dar cobertura a un domicilio o una oficina. 1. Radioenlaces de microondas terrestres: sistemas compuestos por estaciones terminales (transmisora y receptora) más estaciones repetidoras. Las antenas parabólicas deben tener visión directa entre ellas lo cual hace que tengan un haz muy estrecho. 2. Satelitales: sistemas encargados de recibir la señal de una estación terrena, la amplifican, cambian de frecuencia y la transmiten a otra estación terrena. Se componen de: a) Estaciones terrenas que pueden ser fijas o móviles y que tienen fijadas las frecuencias del canal ascendente o “uplink” y descendente o “downlink”. b) Satélites: pone en comunicación dos estaciones terrenales. Compuestos por antenas para la retransmisión de señales y paneles solares que les proporcionan energía. Características principales de las redes satelitales: a) Las frecuencias utilizadas están entre 4-11 GHz. b) Vida útil estimada entorno a 10-15 años. c) Se lanzan con el combustible necesario para su vida útil y una vez han finalizado su cometido se mueven de la órbita que describen y se abandonan como basura espacial. d) Describen una órbita alrededor de la tierra y según esta órbita se distinguen los siguientes tipos • GEO Geoestacionarios: Tienen la misma velocidad de giro que la tierra. Orbitan a 35.780 km de altura. • MEO (Medium Earth Orbit): Velocidad mayor que la de la Tierra. Orbitan a 10.000 km de altura. • LEO (Low Earth Orbit): Velocidad mayor que la de la Tierra. Orbitan a una altura de entre 250 y 1.500 km de altura. Conceptos relacionados con los satélites: a) Latencia: Tiempo que tarda en llegar la información de la estación terrena origen a la destino incluyendo la subida al satélite y la bajada del satélite a la estación terrena. A más alta órbita mayor latencia. b) Handover: Tiempo que tarda un satélite en enviarle la información a otro satélite del mismo sistema. 5-27 Sistemas y Comunicaciones c) 5. Ondas de luz 1. Infrarrojos. Son ondas direccionales incapaces de atravesar objetos sólidos (paredes, por ejemplo). Los infrarrojos son apropiados para transmisiones de corta distancia como, por ejemplo, las señales de los mandos a distancia del hogar. 2. Láser. Estas ondas son de luz visible y también direccionales. Se pueden utilizar para comunicar dos edificios próximos instalando en cada uno de ellos un emisor láser y un fotodetector. Equipos de interconexión y conmutación Según en la capa del modelo OSI en que se sitúe, los equipos de interconexión reciben distintos nombres y tienen asignadas funciones diferentes: — (7) Capa de aplicación: pasarelas (gateways). — (3) Capa de red: encaminadores (routers). — (2) Capa de enlace: puentes (bridges) y conmutadores (switches). — (1) Capa física: repetidores, amplificadores y concentradores (hubs). Los dispositivos de la capa física únicamente reenvían la señal del cable o la amplifican, pero no entienden lo que realmente están retransmitiendo. Los repetidores o amplificadores son habituales en enlaces de larga distancia para contrarrestar el efecto de la atenuación de la señal. Los concentradores se utilizan para conectar los ordenadores que forman una red local Ethernet. En la capa de enlace los dispositivos tienen una cierta “inteligencia”. Son capaces de leer las tramas físicas, filtrarlas y entregarlas donde corresponda. Los puentes se utilizan para convertir tramas físicas entre 2 redes distintas (Ethernet y Wi-Fi, por ejemplo). Los conmutadores son una versión mejorada de los concentradores. En lugar de difundir la información a todos los puestos de la red, únicamente la envían al puesto al que va destinada, observando su dirección física (MAC). Los encaminadores o routers (capa de red) conectan unas redes con otras, para formar una red de redes. El principal protocolo utilizado por los routers es IP.El encaminador es el dispositivo encargado de dirigir los datagramas IP hacia una red u otra, observando para ello la dirección IP de destino. Un encaminador tiene una dirección IP por cada red que conecta. Los encaminadores utilizan algoritmos y tablas de enrutamiento para conocer el camino óptimo hacia un host destino. En caso de caída de un enlace, pueden reconfigurarse para encaminar los datagramas por una ruta alternativa. Al contrario que los dispositivos vistos anteriormente, requieren una configuración inicial por parte del administrador de la red. Las empresas utilizan habitualmente los encamina5-28 Comunicaciones dores a la entrada de sus instalaciones para la conexión a Internet o a otras redes (sucursales conectadas por Frame Relay o enlaces punto a punto, por ejemplo). Finalmente, los dispositivos de la capa de aplicación son capaces de entender el protocolo que se está utilizando en las comunicaciones. No sólo observan la dirección IP de los mensajes sino que además pueden procesar o tomar decisiones en virtud de su contenido. Ejemplos: una pasarela de correo entre el correo de Internet (SMTP) y un protocolo específico utilizado por una organización, o el software SNA Server de Microsoft para que los antiguos mainframes de IBM AS/400 puedan operar en redes nuevas (es una pasarela entre TCP/IP y SNA). Aunque no es frecuente, existe un dispositivo que opera en los niveles 2 y 3 llamado brouter (bridge-router). Funciona como un router multiprotocolo, aunque se comporta como un bridge cuando recibe protocolos no soportados. Debido a que la tendencia es a utilizar TCP/IP como único protocolo en todas las redes, las ventajas de un router multiprotocolo no son tales y por este motivo, este dispositivo apenas es utilizado. Si bien los firewalls (cortafuegos) no se consideran elementos de interconexión, también se podrían incluir en el esquema anterior. Existen firewalls que operan a nivel de la capa de red y también a nivel de la capa de aplicación. Los firewalls a nivel de aplicación incluyen capacidades de filtrado por protocolos o servicios. En cambio, los firewalls a nivel de red únicamente pueden filtrar por las direcciones IP origen y destino. 5.1. Hubs Un hub o concentrador es el punto central desde el cual parten los cables de par trenzado o fibra óptica hasta las distintos puestos de la red, siguiendo una topología de estrella. Se caracterizan por el número de puertos y las velocidades que soportan. Por ejemplo, son habituales los hubs 10/100 de 8 puertos. 5.2. — Los hubs difunden la información que reciben desde un puerto por todos los demás (su comportamiento es similar al de un ladrón eléctrico). — Todas sus ramas funcionan a la misma velocidad. Esto es, si mezclamos tarjetas de red de 10/100 Mbps y 10 Mbps en un mismo hub, todas las ramas del hub funcionarán a la velocidad menor (10 Mbps). — Es habitual que contengan un diodo luminoso para indicar si se ha producido una colisión. Además, los concentradores disponen de tantas lucecitas (LED) como puertos para informar de las ramas que tienen señal. Bridges Un puente de red o bridge es un dispositivo de interconexión de redes de ordenadores que opera en la capa 2 (nivel de enlace de datos) del modelo OSI. Este interconecta segmentos de red (o divide una red en segmentos) haciendo la transferencia de datos de una red hacia otra con base en la direc5-29 Sistemas y Comunicaciones ción física de destino de cada paquete. En definitiva, un bridge conecta segmentos de red formando una sola subred (permite conexión entre equipos sin necesidad de routers). Funciona a través de una tabla de direcciones MAC detectadas en cada segmento al que está conectado. Cuando detecta que un nodo de uno de los segmentos está intentando transmitir datos a un nodo del otro, el bridge copia la trama para la otra subred, teniendo la capacidad de desechar la trama (filtrado) en caso de no tener dicha subred como destino. Para conocer por dónde enviar cada trama que le llega (encaminamiento) incluye un mecanismo de aprendizaje automático (autoaprendizaje) por lo que no necesitan configuración manual. 5.2.1. Tipos de Bridge Clasificación según su funcionamiento: • Transparentes (IEEE 802.1): actúan de forma transparente. No se requiere modificación alguna en las estaciones. • Con encaminamiento desde el origen (802.5) las estaciones deben indicar el camino que seguirá la trama. Solo existen en redes Token Ring. Clasificación según su interoperabilidad: • Homogéneos: solo interconectan LANs con el mismo formato de trama, es decir, (802.3-802.3 o bien 802.5-802.5). • Heterogéneos o traductores: interconectan LANs con formato distinto de trama (ej 802.3-802.5). Según su alcance: • Locales: interconectan LANs directamente. • Remotos: enlazan LANs a través de conexiones WAN (líneas dedicadas, enlaces X.25, Frame Relay, ATM, RDSI, etc). 5.3. Switches Un switch o conmutador es un “hub” mejorado: tiene las mismas posibilidades de interconexión que un “hub” (al igual que un hub, no impone ninguna restricción de acceso entre los ordenadores conectados a sus puertos). Sin embargo, se comporta de un modo más eficiente, reduciendo tanto el tráfico en las redes como el número de colisiones. — 5-30 Un “switch” no difunde las tramas Ethernet por todos los puertos, sino que las retransmite sólo por los puertos necesarios. Por ejemplo, si tenemos un ordenador A en el puerto 3, un ordenador B en el puerto 5 y otro ordenador C en el 6, y enviamos un mensaje desde A hasta C, el mensaje lo recibirá el “switch” por el puerto 3 y sólo lo reenviará por el puerto 6 (un “hub” lo hubiese reenviado por todos sus puertos). Ade- Comunicaciones más de la mayor eficiencia, la utilización de redes conmutadas supone un aumento de seguridad, ya que otros hosts no pueden espiar mediante un analizador de red (sniffer) el tráfico que no está dirigido a ellos. — Cada puerto tiene un “buffer” o memoria intermedia para almacenar tramas Ethernet. — Puede trabajar con velocidades distintas en sus ramas (autosensing): unas ramas pueden ir a 10 Mbps y otras a 100 Mbps. — Suelen contener 3 diodos luminosos para cada puerto: uno indica si hay señal (link), otro la velocidad de la rama (si está encendido es 100 Mbps, apagado es 10 Mbps) y el último se enciende si se ha producido una colisión en esa rama. 5.3.1. Aprendizaje de los switches ¿Cómo sabe un “switch” los ordenadores que tiene en cada rama? Lo averigua de forma automática mediante aprendizaje. Los conmutadores contienen una tabla dinámica de direcciones físicas y números de puerto. Nada más enchufar el “switch” esta tabla se encuentra vacía. Un procesador analiza las tramas Ethernet entrantes y busca la dirección física de destino en su tabla. Si la encuentra, únicamente reenviará la trama por el puerto indicado. Si por el contrario no la encuentra, no le quedará más remedio que actuar como un “hub” y difundirla por todas sus ramas. Las tramas Ethernet contienen un campo con la dirección física de origen que puede ser utilizado por el “switch” para agregar una entrada a su tabla basándose en el número de puerto por el que ha recibido la trama. A medida que el tráfico se incrementa en la red, la tabla se va construyendo de forma dinámica. Para evitar que la información quede desactualizada (si se cambia un ordenador de sitio, por ejemplo) las entradas de la tabla desaparecerán cuando agoten su tiempo de vida (TTL), expresado en segundos. 5.3.2. Spanning Tree Protocol (STP) Algoritmo utilizado en redes conmutadas (redes interconectadas a través de un “switch”) para prevenir bucles. Su función principal es la de permitir la duplicidad de rutas conmutadas sin sufrir la latencia de los bucles de red. Una topología de red libre de bucles es aquella en la que existe un único camino a un destino en cada momento. Un buen diseño de red incluirá enlaces redundantes para proporcionar caminos alternativos si uno falla. El protocolo Minimum STP asegura que sólo habrá un camino en cada momento, detectando los bucles y bloqueando los puertos de los switches en consecuencia. El algoritmo selecciona un “root bridge” (un switch), según el BI, Bridge Identification (en función de la dirección MAC y una prioridad configurable). Los otros “switches” calculan entonces la distancia más corta al “root”, produciendo la topología libre de bucles, el árbol. 5-31 Sistemas y Comunicaciones 5.3. Dominios de colisión Un dominio de colisión es un segmento del cableado de la red que comparte las mismas colisiones. Cada vez que se produzca una colisión dentro de un mismo dominio de colisión, afectará a todos los ordenadores conectados a ese segmento pero no a los ordenadores pertenecientes a otros dominios de colisión. Todas las ramas de un “hub” forman un mismo dominio de colisión (las colisiones se retransmiten por todos los puertos del “hub”). Cada rama de un “switch” constituye un dominio de colisiones distinto (las colisiones no se retransmiten por los puertos del “switch”). Este es el motivo por el cual la utilización de conmutadores reduce el número de colisiones, mejorando así la eficiencia de las redes. Al hecho de que a se conecte un PC a una boca de un “switch” se le llama microsegmentación. El ancho de banda disponible se reparte entre todos los ordenadores conectados a un mismo dominio de colisión. 5.4. Dominios de difusión. VLAN Un dominio de difusión o dominio de broadcast lo forman el conjunto de máquinas que comparten las mismas difusiones. Si un dominio de difusión es excesivamente amplio, esto afectará al rendimiento de la red puesto que las difusiones de todos los ordenadores llegarán al resto, y éstos deben atenderlas. En redes grandes, es conveniente segmentar la red en distintos dominios de difusión para así aumentar su rendimiento. Se puede conseguir mediante: — Routers. Dividiendo la red en distintas redes IP con cableados distintos e interconectadas mediante routers. — VLAN (IEEE 802.1Q). Dividiendo la red por departamentos o tipos de tráficos, aunque el cableado sea común. Tanto un “hub” como un “switch”, cuando reciben una trama de difusión (dirigida a la dirección MAC FF:FF:FF:FF:FF:FF), la retransmiten por todas sus ramas. La excepción a lo anterior son los switches con soporte para VLANs. Al contrario que los “hubs” y “switches”, los “routers” sí permiten segmentar la red en distintos dominios de difusión. Las VLAN (redes locales virtuales) se configuran en “switches” especiales que tienen esta característica. En cada “switch” se definen las estaciones que pertenecen a cada VLAN, indicando para ello los puertos donde están conectadas, sus direcciones MAC u otros aspectos. Cada VLAN forma un dominio de difusión distinto. Además, cada VLAN utiliza una numeración de red IP diferente. El principal objetivo de las VLAN es aumentar el desempeño de la red, aunque también incrementan la seguridad. Se pueden crear VLAN según departamentos (VLAN “Compras”, VLAN “Ventas”, etc.) o según tipos de tráfico (VLAN “Datos”, VLAN “VoIP”, etc.) 5-32 Comunicaciones Es posible configurar la misma VLAN en distintos “switches”. Para ello se origina un diálogo entre los “switches” denominado “trunking” (troncal) para identificar las tramas que pertenecen a cada VLAN. El estándar de las redes locales virtuales es IEEE 802.1Q. No se debe confundir este concepto con las VPN (redes privadas virtuales), que no se aplica a redes locales sino a redes de área extensa. Estas redes se estudian más adelante. 5.5. Resumen de dispositivos de interconexión En el siguiente cuadro resumimos los distintos dispositivos de interconexión que ya estudiamos en el tema de comunicaciones. NIVEL 7. Aplicación MODELO OSI DISPOSITIVOS EJEMPLOS DE INTERCONEXIÓN Gateway (pasarela) Proxy Firewall (cortafuegos) 4. Transporte DE PROTOCOLOS HTTp, DNS, FTP, TFTP, SMTP, POP3, IMAC, IRC, NNTP, NTP, LDAP, TELNET, SSH, DHCP TCP, UDP 3. Red Router (encaminador) IP, ARP, RARP, ICMP 2. Enlace Switch (conmutador) Bridge (puente) HDLC, LAPB, LAPF, PPP, SLIP, Ethernet, Token Ring, Token Bus, IEEE 802.11 1. Física Hub (concentrador) Repetidor Amplificador EIA-232, V.90, X.21, USB Notas: 6. — Aunque hemos incluido los “firewall” en la capa de aplicación por ser lo más habitual, también podrían operar a nivel de la capa de red aunque, en este caso, no podrían filtrar en base a puertos ni a aplicaciones. — Existen “switches” que trabajan en capas superiores. Así, se habla de un “switch” L3 (entiende direcciones IP) o un “switch” L4 (entiende puertos). Sistema de Cableado Estructurado (SCE) Un Sistema de Cableado Estructurado es la forma ordenada y planeada de realizar cableados que permitan proveer de un sistema universal de trans5-33 Sistemas y Comunicaciones porte de información, basado en la normalización de todos sus elementos dentro de una organización. Características: • Universal: Capaz de conducir señales multimedia. • Escalable: Que pueda aumentar fácilmente en número de puestos y en ancho de banda. • Flexible: Fácil reorganización. • Estandarizado. • Duradero y fiable: Entre 5 y 20 años. Es el activo más caro de instalar y desplegar de una organización. • Gestionable y seguro. • Topología física en estrella y lógica según corresponda a distintos protocolos. Elementos de un SCE según ISO 11801: • Elementos básicos [Cables, Conectores, Adaptadores, Rosetas de conexión, Bandejas de cables (Cable tray), Patch cable (cordón de parcheo o 'latiguillo'), Panel de Parcheo (Patch panels), Bloques de conexión (Conection Blocks o Terminal Blocks), Bastidores (Racks)]. • Elementos principales [Armarios o Habitaciones Distribuidores de planta, Armarios o Habitaciones Distribuidores de edificio, Habitaciones Distribuidores de campus (o backbone), Cableado de planta (horizontal), Cableado vertical de edificios (troncal), Cableado de campus (cableado de backbone)]. Un SCE se organiza en tres Subsistemas: 5-34 • Subsistema de Campus: Conecta edificios mediante Fibra óptica. • Subsistema Vertical o Troncal o de distribución de edificio: Desde el armario de distribución del edificio hasta los armarios distribuidores de planta mediante Fibra óptica. • Subsistema Horizontal: Desde los armarios distribuidores de planta hasta los puestos de usuario. F.O o par trenzado (cat. 5e, cat.6). Tema 6 Redes de Comunicaciones. Redes de Conmutación y Redes de Difusión. Comunicaciones móviles. Redes inalámbricas. Sistemas y Comunicaciones Guión-resumen 1. Redes de área extensa 2. X.25 3. Frame Relay 4. ATM 5. RDSI 6. ADSL 7. Otras tecnologías DSL 8. Sistema inalámbrico 6-2 9. Concepto y clasificaciones de redes. Redes locales 10. Tipología.Métodos de acceso 11. ETHERNET 12. Tecnologías inalámbricas 13. Comunicaciones móviles Sistemas de comunicación 1. Redes de área extensa 1.1. Clasificación de redes En este tema se estudian las redes de área extensa y los servicios de comunicación que se pueden desplegar sobre las mismas para interconectar las delegaciones de una empresa u organismo. Las redes de área extensa (WAN), a diferencia de las redes locales, cubren grandes distancias y requieren contratar las líneas a un operador. Las empresas tienen que pagar cada mes el mantenimiento de las líneas de comunicación entre sus distintas oficinas. Las redes WAN se pueden clasificar en tres grupos: — Líneas alquiladas punto a punto. Se instala un enlace entre 2 ubicaciones que se quieren conectar. Este enlace es dedicado (no compartido) por lo que todo su ancho de banda es exclusivo del cliente que lo ha contratado. — Redes de conmutación de circuitos. Son las redes de marcación (dial-up), como la red de telefonía básica (RTB) y RDSI. Durante el tiempo que dura la llamada, el ancho de banda es dedicado. — Redes de conmutación de paquetes. Al contrario que en los anteriores, ahora el ancho de banda es compartido entre todos los usuarios que utilizan la red de conmutación de paquetes. Se definen circuitos virtuales para conectar pares de sitios. Se incluyen aquí: X.25, Frame Relay y ATM. 1.2. Protocolos de capa de enlace A continuación estudiamos los principales protocolos de la capa de enlace utilizados en redes de área extensa (subcapa LLC) para interconectar dos estaciones de un enlace: SDLC, HDLC, LAPB, LAPF, PPP y SLIP. El primer protocolo síncrono fue SDLC (Synchronous Data Link Control, control de enlace síncrono de datos), desarrollado por IBM para sus redes SNA (Standard Network Architecture). El protocolo HDLC (High-level Data Link Control, control del enlace de datos a alto nivel) fue desarrollado por ISO como una modificación de SDLC. Es el más representativo de esta familia de protocolos síncronos. Una estación HDLC puede ser: — Primaria. Es la responsable del funcionamiento del enlace (envía órdenes). — Secundaria. Depende de la primaria (envía respuestas). — Combinada. Puede enviar tanto órdenes como respuestas. 6-3 Sistemas y Comunicaciones El enlace es balanceado si las dos estaciones son combinadas. Por el contrario, es no balanceado si existe una primaria y una o más secundarias. El funcionamiento de HDLC tiene tres fases: iniciación, transferencia y desconexión. Para el control de errores utiliza las técnicas ARQ (Automatic Repeat-reQuest) según las siguientes versiones: — ARQ parada y espera: una estación envía un paquete y no envía el siguiente hasta que no recibe el asentimiento de que el receptor lo ha recibido. Si pasado un tiempo el emisor no recibe el asentimiento se produce un timeout y el emisor reenvía el paquete. — ARQ adelante-atrás-N: en este caso no se espera a recibir el asentimiento para ir enviando paquetes. Si un nodo recibe una confirmación negativa de un paquete, se volverá a enviar ese paquete y los siguientes. — ARQ con rechazo selectivo: en este caso si se pierde un paquete intermedio solo se retransmitirá ese y no los siguientes enviados y que hayan llegado correctamente al destino. En cuanto al control de flujo utiliza un algoritmo de ventana deslizante de modo que el emisor va enviando paquetes hasta que llena su ventana, de modo que, hasta que el receptor no le asienta un paquete no podrá seguir enviando. También le puede asentir todos los que tiene en la ventana a la espera de asentimiento de una vez. LAPB (Link Access Procedure Balanced, procedimiento balanceado de acceso al enlace) es un subconjunto de HDLC que proporciona únicamente el llamado modo balanceado asíncrono, modo en el que cualquiera de las dos estaciones puede iniciar la comunicación. Se diseñó para enlaces punto a punto entre el usuario y la red de conmutación. Es el protocolo de la capa de enlace de X.25. El protocolo LAPF (Link Access Procedure for Frame Mode Bearer Services, procedimiento de acceso al enlace para servicios de modo trama) es similar a LAPB aunque más sencillo. Sus tramas no incluyen campos de control de flujo ni corrección de errores. Es el protocolo de la capa de enlace de Frame Relay. Ambos protocolos, LAPB y LAPF, fueron desarrollados por la ITU a partir de HDLC. Como alternativa a HDLC, el IETF desarrolló PPP (Point-to-Point Protocol, protocolo punto a punto) que es muy similar al primero aunque con algunas mejoras. HDLC sólo soporta comunicaciones síncronas pero PPP además tiene el modo asíncrono. Por este motivo, ha sido elegido como el principal protocolo de la capa 2 para enlaces telefónicos a través de RTB o RDSI. Entre las mejoras se incluye la característica de multilink (multienlace), que consiste en la posibilidad de utilizar varios enlaces para repartir el tráfico, aumentando así la velocidad. Esta función se utiliza en RDSI para conexiones con los dos canales B, consiguiendo así 128 kbps. 6-4 Sistemas de comunicación Además, soporta los mecanismos de autentificación PAP (Password Authentication Protocol, protocolo de autentificación por contraseña) y CHAP (Challenge-Handshake Authentication Protocol, protocolo de autentificación por desafío mutuo). El primero es muy inseguro puesto que envía contraseñas sin cifrar. CHAP, por el contrario, intercambia mensajes cifrados entre los dos extremos. Anteriormente a PPP, se utilizó el protocolo SLIP (Serial Line Internet Protocol, protocolo para acceso a Internet por líneas serie) para conexiones a Internet mediante módem por la línea telefónica. Este protocolo hoy en día ha sido sustituido por PPP. 2. X.25 X.25 es un estándar desarrollado por la UIT (Unión Internacional de Telecomunicaciones), entonces llamada CCITT, en los años 70. Define la interfaz DTE-DCE para el acceso a redes públicas de conmutación de paquetes. La red Iberpac de Telefónica usa X.25. DTE (Data Terminal Equipment) es el equipo terminal de datos y DCE o DCTE (Data Circuit Terminating Equipment), el equipo de terminación de circuito de datos. X.25 es un protocolo de conmutación de paquetes por circuitos virtuales (CVC y CVP) ofreciendo un servicio orientado a conexión, es decir, realiza un establecimiento de circuito, realiza la transferencia de datos y libera el canal. Además es fiable, es decir, no duplica, no pierde ni desordena los paquetes. X.25 se ubica en los tres primeros niveles del modelo OSI: — (3) Nivel de paquete. — (2) Nivel de enlace. Utiliza LAPB, que es un subproducto del protocolo HDLC. — (1) Nivel físico. Utiliza el estándar digital X.21 o el estándar analógico X.21 bis para acceso a redes telefónicas conmutadas, enlaces punto a punto. Dentro de un mismo enlace físico DTE-DCE se pueden establecer hasta 4095 canales lógicos (circuitos virtuales). Esto es posible mediante una técnica realizada en la capa 3 conocida como multiplexación “full-dúplex”. El usuario tiene la sensación de que el enlace físico es exclusivo para él aunque, en realidad, está siendo compartido por otros usuarios. Los distintos circuitos virtuales que están funcionando dentro de un mismo enlace físico se identifican mediante un número de canal lógico (LCN). X.25 incorpora control de flujo y errores en las capas 2 y 3. Para el control de errores se usa ARQ adelante-atrás-N: si un nodo recibe una confirmación negativa de un paquete, se volverá a enviar ese paquete y los siguientes. X.25 incluye dos facilidades para recuperar errores graves: — Reinicio. Permite reiniciar un circuito virtual. Se ponen a cero sus números de secuencia. — Rearranque. Se reinician todos los circuitos virtuales. 6-5 Sistemas y Comunicaciones Las velocidades habituales son lentas: entre 1.2Kbps y 64Kbps. Además, el retardo (tiempo desde que se envía un paquete hasta que se recibe) es elevado. Estos inconvenientes son consecuencia de la elevada sobrecarga de procesamiento que se produce en los nodos intermedios, pero a cambio se logra como ventaja una gran fiabilidad. X.25 es apropiado para: — Construir una red WAN que interconecte sucursales u organizaciones. Cada una puede tener su propia LAN. La ventaja de X.25 es que soporta un número elevado de conexiones simultáneas entre pares de equipos de las oficinas conectadas. — Transmisión de pocas cantidades de información aunque con conexiones de larga duración. No es apropiado para aplicaciones en tiempo real o la difusión de audio o vídeo. Para interconectar redes públicas X.25 se utiliza el estándar X.75. En la actualidad esta tecnología se encuentra en desuso. 3. 3.1. Frame Relay Introducción Según hemos visto en el apartado anterior, X.25 es un protocolo complejo que incluye control de flujo y corrección de errores. Debido a que es un protocolo antiguo fue pensado para líneas de baja calidad donde podía perderse o dañarse información. Frame Relay (retransmisión de tramas) es justamente lo contrario. Es un protocolo muy sencillo que sólo se preocupa de enviar tramas (de hasta 1.600 bytes) de un extremo a otro. Presupone, por tanto, que las líneas son de buena calidad. Y por este motivo no incluye control de flujo ni de errores, aunque se podría implementar en las capas superiores. La sencillez del protocolo es la causa de que Frame Relay sea más eficiente que X.25 en líneas de buena calidad. 6-6 Sistemas de comunicación La señalización de control se realiza por una conexión lógica distinta a los datos (al contrario que en X.25). Tanto en X.25 como en Frame Relay se preserva el orden de envío de las tramas. La transmisión, a nivel físico, consiste en una línea punto a punto desde la ubicación del usuario hasta el primer nodo de la red de transmisión de datos y después la información pasa por los nodos de la operadora hasta el tramo final, del último nodo a la ubicación del usuario final. La capa 3 del modelo OSI no está definida en Frame Relay. Las especificaciones de Frame Relay se ubican en la capa 2. Esta capa utiliza el protocolo LAPF e incluye una detección simple de errores (no corrección): si se encuentra un error, se descarta la trama. Se puede considerar Frame Relay como una línea virtual rentada. El ancho de banda que no usamos nosotros, lo pueden usar otros usuarios, al contrario que en una línea real. Frame Relay utiliza multiplexación estadística. Este tipo de multiplexación permite que se pueda compartir ancho de banda entre distintos usuarios de forma dinámica, es decir, no es necesaria una reserva previa de ancho de banda sino que se asigna en el momento en que se necesita. Frame Relay puede alcanzar velocidades de hasta 45 Mbps. No está especialmente indicado para tráfico multimedia en tiempo real. No ofrece garantías sobre el retardo. Lo más importante en Frame Relay es la disponibilidad (un caudal garantizado). 3.2. Campos de las tramas y comprobación de estado Los circuitos virtuales se identifican en Frame Relay mediante un número DLCI (Data Link Connection Identifier). Los DLCI tienen significado local, es decir, cada origen puede utilizar un número DLCI diferente para identificar un mismo destino. Los DLCI en las tramas ocupan 10 bits, por lo que podrían distinguir hasta 1024 circuitos virtuales. Se utiliza el DLCI=0 para señalización que se realiza por canal común (SS7). Las tramas además tienen otros campos destacables: — FECN (Forward Explicit Congestion Notification, notificación de congestión explícita en el sentido de la transmisión). — BECN (Backward Explicit Congestion Notification, notificación de congestión explícita en el sentido contrario a la transmisión). — DE (Discard Eligibility, elegido para descarte). Las tramas que tienen este “bit” a 1 puede ser descartadas en caso de congestión en la red. Se activa en aquellas que exceden del CIR contratado. Los “bits” BECN y FECN se utilizan para avisar que hay congestión al origen y destino de la transmisión, respectivamente. Las capas superiores pueden responder a estas notificaciones disminuyendo la tasa de información enviada. Si no lo hacen, la red descartará las tramas con el “bit” DE activado. 6-7 Sistemas y Comunicaciones Frame Relay utiliza el protocolo LMI (Local Management Interface, interfaz de gestión local) para comprobar el estado de la red, mediante el intercambio de mensajes entre el lado del usuario (DTE, equipo del cliente) y el lado del operador (DCE, switch del nodo de acceso). Cada 10 segundos se comprueba que el enlace no esté caído (mensajes LIV de verificación de la integridad del enlace) y cada minuto se informa sobre los circuitos virtuales que están activos (mensajes FS, full status). 3.3. Conceptos y Contratación CIR (Commited Information Rate, tasa de información comprometida) es la velocidad mínima garantizada acordada con el operador. Se puede expresar en bits por segundo o como un porcentaje sobre el límite físico de la línea (su velocidad máxima). El CIR se puede configurar de forma independiente para cada circuito virtual y para cada sentido. Por ejemplo, podemos contratar una línea Frame Relay de 2 Mbps con un CIR de 512 Kbps (25% garantizado). Esto asegura que en las peores condiciones de la red, tendremos garantizados 512 kilobits por segundo. En condiciones óptimas podremos llegar hasta los 2 Mbps, que es el límite físico de la línea. Cuanto mayor sea el CIR que solicitemos, el coste de la línea aumentará sustancialmente (un CIR del 100% tiene un coste muy elevado). Obsérvese que el CIR es una salvaguarda para evitar que la velocidad de la red decaiga por debajo de lo aceptable. La velocidad habitual de la red estará comprendida entre el CIR y el límite físico de la línea. 6-8 — Velocidad nominal (Vn): Máxima velocidad que puedo conseguir entre todos los circuitos virtuales de la línea sometida a la capacidad física del medio de transmisión. — Volumen de Información Comprometida (Bc): Bits que la red se compromete a transmitir durante un intervalo de tiempo definido (Tc). (Bc = CIR * Tc) — Tasa de Información Restante (EIR): (EIR = Vn-(CIR). El valor de EIR es común para todos los circuitos virtuales, pudiendo ser utilizado por cualquiera de ellos. Sistemas de comunicación — Volumen de Información en Exceso (Be): Cantidad máxima de “bits” que pueden exceder Bc durante el intervalo Tc. La distribución de estos datos (Be) no está garantizada. Aquellos datos que superen Bc+Be se descartan incondicionalmente. En la figura anterior se observa como la primera y segunda trama se envían correctamente pues están dentro del CIR, la tercera es susceptible de descarte en caso de congestión, de ahí que una vez ha superado el CIR, se le ponga el bit DE = 1 y la trama cuarta se descarte directamente pues supera además del CIR, el EIR. Este algoritmo descrito se denomina “leaky bucket”. 4. ATM Para unificar los distintos servicios y redes se creó una nueva red con gran ancho de banda conocida como RDSI-BA. La tecnología que hace posible RDSI-BA es ATM (modo de transferencia asíncrono). La idea es transmitir toda la información en pequeños paquetes de tamaño fijo llamados celdas (cells, células). 4.1. Formato Trama ATM Cada celda tiene un tamaño de 53 bytes y se divide en: — Cabecera (5 bytes). — Datos (48 bytes). Campos de la cabecera: — GFC: Generic Flow Control. No usado. — VPI: Virtual Path Identifier. Hasta 256 caminos distintos para el interfaz de usuario (UNI-User Network Interface) o 4096 para el interfaz entre “switches” ATM (NNI-Network Network Interface). — VCI: Virtual Channel Identifier. Hasta 65536 canales distintos. — PTI: Payload Type Identifier. 3 bits. Tipo de carga. — CLP: Cell Loss Priority. 1 bit. — HEC: Es un CRC de toda la cabecera. 8 bits. 4.2. Protocolos ATM-Capas La tecnología ATM diferencia las siguientes capas: — Capa de adaptación ATM. Fragmenta y reensambla la información en celdas. Según el tipo de servicio y la calidad del mismo existen varias capas de adaptación a ATM, que son: AAL1, AAL2, AAL3/4 y AAL5. 6-9 Sistemas y Comunicaciones — Capa ATM. Envía celdas individuales. Establece y libera circuitos virtuales (se corresponde con las capas 2 y 3 de OSI). Controla la congestión. — Capa física. ATM es independiente del medio de transmisión, aunque la tecnología más usada es SONET/SDH (Synchronous Optical NETwork/Synchronous Digital Hierarchy, red óptica síncrona/jerarquía digital síncrona), que define un sistema de transmisión a altas velocidades a través de fibra óptica. En las celdas ATM se utilizan los campos VPI/VCI para identificar el circuito virtual utilizado. VPI (Virtual Path Identifier, identificador de camino virtual) es un campo de 1 “byte” mientras que VCI (Virtual Channel Identifier, identificador de canal virtual) es de 2 “bytes”. Un posible VPI/VCI es 3/95. 4.3. Arquitectura ATM Plano de Usuario Plano de Control Protocolos de Capas Superiores Capa de Administración Protocolos de Capas Superiores Plano de Administración Plano de Administración Capa de Adaptación ATM Capa ATM Capas Físicas 4.4. Nodos de la red ATM Los nodos de la red ATM son conmutadores que no realizan ninguna función de control de errores. Conmutan las células o celdas ATM a nivel físico/hardware de ahí su rapidez de conmutación. El periodo de conmutación depende de las características técnicas del conmutador y va a determinar la velocidad de la red. No hay garantía de entrega, ya que no hay confirmaciones de las células enviadas a través de la red ATM. ATM es un servicio orientado a conexión esto garantiza una entrega ordenada de células en base a la tupla formada por el VCI/VPI, es decir, la relación de circuito virtual o Virtual Channel (VC) / Camino Virtual o Virtual Path (VP) con identificadores VCI / VPI locales a cada conmutador siendo esta tupla la que cambia salto a salto de conmutador según la información de encaminamiento del “switch”. 6-10 Sistemas de comunicación Cada canal virtual lleva el flujo de información de una comunicación. Un conmutador de canales virtuales se denomina VC-Switch. Un camino virtual agrupa a varios canales virtuales. Un conmutador de caminos virtuales se denomina VP-Switch o Crossconnect (“transconectores”). 4.5. Niveles de Servicio En ATM se pueden garantizar distintos niveles de servicio según la información a transmitir: — Flujo de bits constante (CBR). Se fija el ancho de banda (ejemplo: par de cobre telefónico). — Flujo de bits variable (VBR). Se optimiza el retardo pero pueden perderse datos (ejemplo: videoconferencia). — Flujo de bits disponibles (ABR). Se garantiza cierto ancho de banda, pero no los picos (ejemplo: conexión de sucursales). — Flujo de bits no especificado (UBR). No garantiza nada (ejemplo: Internet). ATM es apropiado para difusión de audio y vídeo en tiempo real. Las velocidades habituales son: 5. — 155 Mbps (suficiente para soportar televisión de alta definición). — 622 Mbps (4 canales de 155 Mbps). RDSI La Red Digital de Servicios Integrados (RDSI) es un sistema digital de conmutación de circuitos. Es similar a la Red de Telefonía Básica (RTB) porque ambos son sistemas conmutados aunque se diferencian en que RTB es analógico y RDSI, digital. RDSI utiliza multiplexación por división en el tiempo (TDM) para manejar varios canales simultáneamente. A cada canal se le asigna un segmento de tiempo (período) y se van alternando de forma circular. Cuando se contrata una línea RDSI hay que indicar los canales que la van a constituir. Estos canales pueden ser de los siguientes tipos: — Canal A. Canal analógico de voz (4 KHz). — Canal B. Canal digital de 64 Kbps utilizado para voz o datos. 6-11 Sistemas y Comunicaciones — Canal C. Canal digital de 8 ó 16 Kbps. — Canal D. Canal digital de 16 Kbps (acceso básico) o 64 Kbps (acceso primario) para señalización fuera de banda. — Canal E. Canal digital de 64 Kbps para señalización de RDSI interna. — Canal H. Canal digital de 384 Kbps (H0), 1536 Kbps (H11) o 1920 Kbps (H12). Existen una serie de combinaciones habituales de canales que reciben los nombres de acceso básico, acceso primario y acceso híbrido. — Acceso básico. Consta de 2 canales B y 1 D (2 B + 1 D). Es la combinación habitual cuando se contrata una línea RDSI para el hogar o la oficina. Permite la conexión de hasta 8 dispositivos dentro del bus RDSI, como teléfonos, PCs, máquinas de fax o videoconferencia. Si se utiliza la línea RDSI para conexión a Internet o para transferencia de datos tendremos 64 Kbps si utilizamos uno de los dos canales o bien, 128 Kbps si utilizamos los dos canales simultáneamente. La utilización de los dos canales equivale, a efectos de facturación, a realizar dos llamadas telefónicas. — Acceso primario. Consta de 30 B + 1 D (2 Mbps) en Europa o de 23 B + 1 D (1,5 Mbps) en EE.UU. y Japón. Es adecuado para empresas que requieran una gran cantidad de ancho de banda para interconectar sus distintas dependencias (repartidas quizás por toda la geografía nacional) con una oficina central. — Acceso híbrido. Consta de 1 A + 1 C. El acceso primario también puede usar combinaciones de canales H: — Estructuras del canal H0. Ejemplos: 4 H0 (1,5 Mbps) y 5 H0 (1.920 Kbps). — Estructuras del canal H1. Ejemplos: 1 H11 (1,5 Mbps) y 1 H12 (1.920 Kbps). — Estructuras mezcla de canales B y H0. Incluye cualquier combinación hasta el límite físico de la línea. Ejemplo: 3 H0 + 5 B + D (1,5 Mbps). RDSI incluye una serie de servicios suplementarios como: — Identificación de llamada entrante. — Reenvío de llamada (incondicional o en ausencia de respuesta). — Llamadas en espera, retención de llamadas. — Cobro revertido. Algunos de estos servicios ya se han incluido en la RTB, aunque originalmente sólo estaban disponibles para RDSI. En RDSI existe una nomenclatura para definir los distintos dispositivos y conexiones entre ellos, que debemos conocer: 6-12 Sistemas de comunicación Oficina del cliente Oficina de la portadora Terminal ISDN Conducto de bits digital T U NT1 Terminal ISDN Teléfono ISDN Alarma ISDN Equipo del cliente Central ISDN A la red interna de la portadora Equipo del proveedor (a) Oficina de la portadora Oficina del cliente Terminal TE1 de ISDN S T S Teléfono no TE1 de ISDN R Terminalno ISDN TA S NT2 ISDN PBX NT1 Conducto de bits digital Central ISDN A la red interna de la portadora Equipo del proveedor Pasarela de LAN Equipo del cliente (b) (a) Ejemplo de sistema ISDN para uso del hogar. (b) Ejemplo de sistema ISDN con PBX para uso en compañías grandes. 6-13 Sistemas y Comunicaciones Equipos: — TE1 (ET1). Equipo RDSI (por ejemplo, un ordenador con adaptador RDSI). — TE2 (ET2). Equipo no RDSI (por ejemplo, una máquina de fax analógica). — TA (AT). Adaptador de terminal. Permite la conexión de equipos no RDSI (analógicos). Terminales de red: — NT1 (TR1). Conecta la red del cliente con la del operador del servicio (se sitúa a la entrada de las dependencias del cliente). — NT2 (TR2). Puede ser una centralita RDSI privada (PBX). Esta centralita sólo es necesaria en empresas que necesitan conectar más de 8 dispositivos. Se sitúa a continuación del NT1. Utiliza la interfaz T para conectarse al NT1 e interfaces S para conectarse a los distintos equipos RDSI. Puntos de referencia: 6-14 — U. Interfaz con el operador. Se sitúa entre la central RDSI (en dependencias del proveedor del servicio) y el NT1 (dependencias del cliente). — S. Interfaz para equipos RDSI. — R. Interfaz para equipos no RDSI. — T. Interfaz entre NT1 y equipos cliente. Si existe una NT2, esta interfaz se sitúa entre los terminales NT1 y NT2. Si no existe, T coincide con S. Sistemas de comunicación 6. ADSL Las líneas ADSL (Asymmetric Digital Subscriber Line, línea digital asimétrica de abonado) permiten el acceso a Internet a hogares y pequeñas empresas utilizando el mismo par de cobre instalado para el teléfono. Utiliza una región de frecuencias diferente del cable por lo que no interfiere con las conversaciones de voz. Esto se consigue mediante tecnología de división de frecuencias (FDM, Frecuency Division Multiplexation). Aunque sea el mismo cable físico, el usuario percibe dos líneas completamente independientes. La conexión a Internet es permanente, sin necesidad de realizar llamada cuando el usuario tenga que conectarse. Las operadoras de ADSL actualmente cobran una cuota mensual fija independiente de la utilización que hagamos de ADSL (tarifa plana). La otra opción sería facturar por tráfico transferido como hacen en la actualidad algunas operadoras de cable. La “A” de ADSL significa asimétrico. Es decir, la velocidad de bajada o descarga (desde Internet al equipo del usuario) es distinta a la de subida (desde el equipo del usuario hacia Internet). Debido a que ADSL ha sido pensado para ofrecer servicios a clientes (navegación y descarga de archivos sobre todo), el ancho de banda predominante es el de bajada. El ancho de banda de subida es muy escaso, lo que impide que ADSL sea una conexión adecuada para utilizarla con servidores. Nótese que durante la navegación el usuario se trae datos a su equipo (cliente). Pero los servidores hacen justo lo contrario: enviar datos a Internet. Las velocidades típicas de los distintos contratos ADSL son expresadas en Kbps: 1.024/300, 2.048/300, 4.096/512, 6.144/512 y 8.192/1.024 (la primera es de bajada y la segunda, de subida). Estas velocidades superan notablemente los 56 Kbps obtenidos por un módem conectado a la red telefónica (RTB). La velocidad máxima conseguida con la norma ADSL G.992.1 es 8/1 Mbps. Sin embargo, la ITU ha desarrollado nuevas recomendaciones que superan esta velocidad: ADSL2 (G.992.3) hasta 12/2 Mbps y ADSL2+ (G.992.5) hasta 24/2 Mbps. La instalación de ADSL en el domicilio del cliente es una tarea que apenas requiere infraestructura por parte de la compañía (se conserva el mismo cableado del teléfono). Al contrario que la conexión a Internet por cable que requiere la instalación de cableado nuevo de fibra óptica hasta los portales de los edificios y, desde cada portal, cables hasta los domicilios particulares, normalmente coaxiales. Sin embargo, el ADSL no funciona igual en todos los domicilios: tiene como requisito que el cable telefónico sea de buena calidad y no exceda el máximo de distancia permitido (unos 5,5 kms para alcanzar velocidades de 2 Mbps) entre el domicilio y la centralita ADSL. En zonas rurales con cableado antiguo y centralitas telefónicas lejanas puede no ser posible instalar ADSL. 7. Otras tecnologías DSL DSL (Digital Subscriber Line) es el conjunto de tecnologías que aprovechan la región de frecuencias no utilizadas por la transmisión analógica de voz del par de cobre telefónico para la transmisión de datos a altas velocidades. 6-15 Sistemas y Comunicaciones Las tecnologías asimétricas de DSL incluyen: ADSL, G.lite ADSL (o simplemente G.lite), RADSL y VDSL. — ADSL. La versión de DSL más difundida. Para distinguirla del resto de versiones asimétricas en ocasiones se utiliza el término full rate. Está definido en la recomendación de la ITU-T G.992.1 y el estándar ANSI T1.413-1998. — G.lite. Versión de ADSL de bajo coste y menor velocidad (ITU G.992.2). — RADSL (Rate Adaptive DSL, DSL de tasa adaptativa). Es una variante no estándar que adapta su velocidad dinámicamente según las condiciones de la línea. — VDSL (Very high bit rate DSL, DSL de tasa muy alta). Puede alcanzar velocidades entre 13 y 52 Mbps de bajada y de 1,5 a 2,3 Mbps de subida. VDSL puede utilizarse para vídeo en tiempo real. También puede funcionar en modo simétrico. (ITU G.993.1) — VDSL2 Es la más rápida de las tecnologías DSL con una velocidad de bajada y subida de 100Mbps. (ITU G.993.2) Las tecnologías simétricas son: SDSL, SHDSL, HDSL-2 y IDSL. Esta simetría posibilita la interconexión de redes locales, videoconferencia y alojamiento de servidores. 8. — SDSL (Symmetric DSL, DSL simétrico). Funciona con un único par de cobre. — HDSL (High data rate DSL, DSL de tasa alta). Puede utilizar 2 ó 3 pares de cobre para alcanzar velocidades (en ambos sentidos) de 1,5 ó 2 Mbps. — HDSL2 (HDSL de segunda generación). Es muy similar a HDSL aunque utilizando un único par de cobre con una velocidad de 1,5 Mbps. — SHDSL (Single pair high bit rate DSL, DSL de tasa alta sobre un único par). Servicio simétrico de hasta 2,3Mbps a una distancia de hasta 3kms. — IDSL (Integrated services digital network DSL, DSL RDSI). Tecnología similar a SDSL pero implementada en líneas RDSI. Permite velocidades de hasta 144 Kbps. Sistema inalámbrico En la actualidad los proveedores de servicios de Internet (ISP) están tirando fibra óptica cada vez más cerca de los abonados. Estas tecnologías surgen de la sustitución total o parcial del cable de cobre en el bucle de acceso por fibra óptica. — 6-16 FTTN (Fibra hasta el nodo-Fiber-to-the-node). La fibra óptica termina en una central del operador de telecomunicaciones que presta el servicio, suele estar más lejos de los abonados que en FTTH y FTTB, típicamente en las inmediaciones del barrio. Sistemas de comunicación 9. — FTTC (Fibra hasta la aceraFiber-to-the-cabinet o fiberto-the-curb). Similar a FTTN, pero la cabina o armario de telecomunicaciones está más cerca del usuario, normalmente a menos de 300 metros. — FTTB (Fibra hasta el edificio -Fiber-to-the-building o Fiber-to-the-basement). La fibra óptica normalmente termina en un punto de distribución intermedio en el interior o inmediaciones del edificio de los abonados. Desde este punto de distribución intermedio, se accede a los abonados finales del edificio o de la casa mediante la tecnología VDSL2 (Very high bit-rate Digital Subscriber Line 2) sobre par de cobre o Gigabit Ethernet sobre par trenzado CAT5. De este modo, el tendido de fibra puede hacerse de forma progresiva, en menos tiempo y con menor coste, reutilizando la infraestructura del edificio del abonado. — FTTH (Fibra hasta el hogar-Fiber-to-the-home). En FTTH o fibra hasta el hogar, la fibra óptica llega hasta el interior de la misma casa u oficina del abonado. Concepto y clasificaciones de redes. Redes locales Una red es un sistema de transmisión de datos que permite el intercambio de información entre ordenadores. Si bien esta definición es demasiado general, nos sirve como punto de partida. La información que pueden intercambiar los ordenadores de una red puede ser de lo más variada: correos electrónicos, vídeos, imágenes, música en formato MP3, registros de una base de datos, páginas web, etc. La transmisión de estos datos se produce a través de un medio de transmisión o combinación de distintos medios: cables de fibra óptica, tecnología inalámbrica, enlaces vía satélite (el intercambio de información a través de medios extraíbles como disquetes no se considera una red). En la definición anterior hemos indicado el término ordenadores en un intento por simplificar. Sin embargo, los ordenadores son sólo una parte de los distintos dispositivos electrónicos que pueden tener acceso a las redes. Otros dispositivos de acceso son los smartphone, las tablets e incluso electro6-17 Sistemas y Comunicaciones domésticos están conectados a Internet dentro del campo de la domótica como pudieran ser frigoríficos capaces de intercambiar información (la lista de la compra) con un supermercado virtual a través de Internet. 9.1. Clasificación según su tamaño: LAN, MAN y WAN — Las redes LAN (Local Area Network, redes locales) son las redes que todos conocemos, es decir, aquellas que se utilizan en una empresa. Son redes pequeñas, entendiendo como pequeñas el tamaño de una oficina o un edificio. Debido a sus limitadas dimensiones, son redes muy rápidas en las cuales cada estación se puede comunicar con el resto. — Las redes MAN (Metropolitan Area Network, redes de área metropolitana) son redes de tamaño de una ciudad. En este grupo puede considerarse la red de un campus universitario para unir sus distintas facultades y escuelas. — Las redes WAN (Wide Area Network, redes de área extensa) son redes punto a punto que interconectan ciudades, países y continentes. Por ejemplo, un cable submarino entre Europa y América, o bien una red de fibra óptica para interconectar dos ciudades. Al tener que recorrer una gran distancia sus velocidades son menores que en las LAN aunque son capaces de transportar una mayor cantidad de datos. 9.2. Redes locales En este tema estudiamos las redes locales. Estas redes ocupan una extensión reducida como puede ser una oficina, una planta industrial o un edificio. Se utilizan para interconectar equipos que habitualmente pueden trabajar de forma independiente: puestos de trabajo, servidores y periféricos. La interconexión de equipos permite la compartición de recursos y la comunicación entre ordenadores. En una red local, la velocidad de transmisión es elevada (100 Mbps o 1 Gbps normalmente) y la tasa de errores, reducida. Las señales transmitidas son digitales, lo que evita realizar una modulación previa. Por último, las interfaces de transmisión (tarjetas de red) son de bajo coste. La unión de las distintas redes locales puede realizarse mediante enlaces punto a punto, líneas RDSI, Frame Relay, ATM o incluso, mediante tecnologías inalámbricas como es el caso de los enlaces de microondas o los enlaces vía satélite. La elección entre una tecnología y otra dependerá del ancho de banda requerido y su coste. 9.3. Clasificación según su distribución lógica Según las funciones que realice un sistema informático se puede clasificar en servidor o cliente. — 6-18 Servidor. Máquina que ofrece información o servicios al resto de los puestos de la red. La clase de información o servicios que ofrezca determina el tipo de servidor que es: servidor de impresión, de archi- Sistemas de comunicación vos, de páginas web, de correo, de usuarios, de IRC (charlas en Internet), de base de datos. — Cliente. Máquina que accede a la información de los servidores o utiliza sus servicios. Ejemplos: Cada vez que estamos viendo una página web nos estamos comportando como clientes. También seremos clientes si utilizamos el servicio de impresión de un ordenador remoto en la red (el servidor que tiene la impresora conectada). Obsérvese que es posible que un mismo sistema informático tenga las dos funciones a la vez, ya sean relativas a distintos servicios o, incluso, al mismo. Dependiendo de si existe una función predominante o no para cada puesto de la red, las redes se clasifican en: — Redes cliente/servidor. Los papeles de cada puesto están bien definidos: uno o más ordenadores actúan como servidores y el resto como clientes. Los servidores suelen coincidir con las máquinas más potentes de la red. No se utilizan como puestos de trabajo. En ocasiones, ni siquiera tienen monitor puesto que se administran de forma remota: toda su potencia está destinada a ofrecer algún servicio a los ordenadores de la red. Internet es una red basada en la arquitectura cliente/servido. Las redes basadas en el modelo de dominio de Microsoft pertenecen también a esta arquitectura. — Redes entre iguales (peer-to-peer). No existe una jerarquía en la red: todos los ordenadores pueden actuar como clientes (accediendo a los recursos de otros puestos) o como servidores (ofreciendo recursos). Son las redes que utilizan las pequeñas oficinas, de no más de 10 ordenadores. 9.4. Topologías de red Según la disposición física del cableado, se pueden definir los siguientes tipos de topologías: — Topología lineal o de bus. Todos los nodos se conectan a un bus central. En esta topología todos los nodos o estaciones comparten el mismo medio de transmisión. — Topología en anillo. Cada nodo se conecta al siguiente y el último, al primero. — Topología en estrella. Se sitúa un elemento de interconexión en el centro de la estrella y desde aquí, se crean enlaces a cada nodo. Al contrario que en las dos topologías anteriores, el fallo de un cable no afecta a las comunicaciones del resto de nodos. Aunque un fallo en el elemento central provocaría que toda la red dejase de funcionar. — Topología de malla. Cada nodo se conecta con todos los demás. Para calcular el número de enlaces necesarios, siendo “n” el número de nodos se aplica la fórmula siguiente: nº de enlaces = n (n-1) / 2. 6-19 Sistemas y Comunicaciones Los nodos mencionados anteriormente pueden corresponderse con ordenadores si nos referimos a redes locales o a redes completas si nos referimos a redes de área extensa. Por ejemplo: si una empresa tiene una sede central en Madrid y distintas delegaciones provinciales, de forma que todas las comunicaciones pasen por Madrid, estaríamos hablando de una topología de estrella. 10. Tipología. Métodos de acceso En este apartado estudiamos los distintos protocolos de redes locales, los cuales se ubican dentro de la subcapa MAC de la capa de enlace (capa 2 del modelo OSI). Cada protocolo determina un tipo de red diferente, para la que se define, por un lado, los criterios que siguen las estaciones para acceder al medio físico cuando necesitan enviar información y, por otro, cuándo una trama que está en el medio físico debe ser recogida por su interfaz de red. 10.1. Capa de enlace y subcapa MAC El modelo OSI propone una división de las redes en capas. En este tema estudiamos la capa 2, que es la llamada capa de enlace. Fue diseñada originalmente para la transmisión de datos y control de flujo entre los dos extremos de una línea punto a punto. Esto es válido para redes WAN, sin embargo las redes LAN no funcionan de esta forma sino que están formadas por un grupo de ordenadores que comparten el mismo canal de comunicación. Fue necesario dividir la capa de enlace en 2 subcapas: — Subcapa de enlace lógico (LLC, Logic Link Control, control de enlace lógico). — Subcapa de acceso al medio (MAC, Media Access Control, control de acceso al medio). La subcapa MAC se sitúa debajo de LLC, junto a la capa física. Es la encargada de establecer los criterios que deben seguir las estaciones para acceder a un medio físico concreto y comenzar a transmitir (¿cuándo se puede transmitir sin que interfiera en las comunicaciones de los demás?) y para reconocer cuándo un paquete de datos es para ellas. Obsérvese que el mismo medio físico es utilizado por todas las estaciones de la red local. MAC es dependiente del medio físico. Prepara los datos para que pueda tratarlos la subcapa LLC sin preocuparse de las peculiaridades del medio físico. Los protocolos que operan en esta capa se pueden dividir en dos grupos: 6-20 — Acceso al medio por paso de testigo. Existe un testigo que va pasando de una estación a otra. Sólo puede transmitir aquella estación que posea el testigo. En este grupo se sitúan Token Ring y Token Bus. — Acceso al medio por contienda. Cuando una estación tiene que transmitir, lo hace sin más. Pueden producirse colisiones entre transmisiones de distintas estaciones, que se evitan o resuelven según distintas técnicas. El protocolo más utilizado es CSMA/CD o Ethernet. Sistemas de comunicación 10.2. Acceso al medio por paso de testigo En estos métodos de acceso al medio las estaciones se van pasando un paquete de datos especial llamado testigo, ficha o “token” siguiendo un cierto orden. Este orden puede ser físico, como es el caso de Token Ring, donde cada estación se lo pasa a la siguiente según el cableado, o lógico, como ocurre en Token Bus. Sólo la estación que tiene el testigo puede transmitir en cada momento. Su principal ventaja es que proporciona un reparto equitativo del canal entre todas las estaciones. Si todas las estaciones quieren transmitir a la vez, el método de testigo asegura que todas ellas podrán transmitir con igual prioridad y que el canal estará siempre utilizado. Por el contrario, si sólo una desea transmitir deberá esperar a que le llegue el testigo (durante ese tiempo el canal no estará aprovechado). El retardo máximo se puede calcular como el producto del número de estaciones de la red y el tiempo máximo de posesión del testigo por cada estación. Una estación puede encontrarse en 3 estados: sin el testigo, con el testigo o pasando el testigo a la siguiente estación. 10.2.1. Token Ring (IEEE 802.5) Las redes Token Ring (paso de testigo en anillo) fueron utilizadas ampliamente en entornos IBM desde su lanzamiento en el año 1985. En la actualidad es difícil encontrarlas salvo en instalaciones antiguas de grandes empresas ya que están obsoletas. El cableado se establece según una topología de anillo. En lugar de emplear difusiones, se utilizan enlaces punto a punto entre cada puesto y el siguiente del anillo. Por el anillo Token Ring circula un mensaje conocido como testigo. Este mensaje consiste habitualmente en un byte formado por ocho bits a uno. Cuando una estación desea transmitir espera a recibir el testigo. En ese momento, lo retira de circulación y lo sustituye por un nuevo paquete de datos llamado conector. A continuación envía su mensaje. Este mensaje circula por el anillo hasta que lo recibe íntegramente el destinatario. Entonces se genera un testigo nuevo. Las redes Token Ring utilizan una estación monitor para supervisar el funcionamiento del anillo. Se trata de un protocolo complejo que debe monitorizar en todo momento el buen funcionamiento del testigo (que exista exactamente uno cuando no se transmiten datos) y sacar del anillo las tramas defectuosas que no tengan destinatario, entre otras funciones. Las redes Token Ring de IBM pueden funcionar a 4 Mbps o a 16 Mbps utilizando cable par trenzado o cable coaxial. 10.2.2. Token Bus (IEEE 802.4) Las redes Token Bus utilizan un medio compartido con topología de bus, dentro del cual se establece un anillo lógico. Cada estación debe saber a qué otra estación debe pasarle el testigo, de forma que éste viaje de forma cíclica por toda la red. La dirección de la siguiente estación viaja en el campo dirección del testigo. Este campo no era necesario en las redes Token Ring debido a que exis6-21 Sistemas y Comunicaciones ten enlaces físicos entre cada estación y la siguiente. En las redes Token Bus todas las estaciones están conectadas al mismo medio físico. El retardo de transmisión entre una estación y otra viene determinado únicamente por la velocidad de propagación de la señal en el cable. Estas redes están totalmente obsoletas y en desuso. 10.2.3. Otras técnicas de acceso al medio por paso de testigo — Anillo con contienda. Soluciona la disminución de eficiencia de Token Ring cuando la carga en la red es baja, utilizando en estos casos un mecanismo de contienda (enviar sin esperar el testigo). Se hace necesario detectar y resolver las posibles colisiones que se produzcan. Todo ello mejora la eficiencia del protocolo a costa de introducir una mayor complejidad. — Anillo ranurado. Es una técnica con control distribuido aplicada a una topología en anillo. Pueden circular varios paquetes por el anillo. Si una estación tiene una gran cantidad de información, podría monopolizar el canal hasta que finalizara sus transmisiones. 10.3. Acceso al medio por contienda Los métodos de acceso al medio por contienda no siguen un sistema de turnos como hemos visto en el apartado anterior. La idea es que las estaciones que desean transmitir lo hacen sin más. Aunque, eso sí, se deberán buscar formas para anticiparse o resolver las posibles colisiones. Se produce una colisión cuando dos estaciones transmiten a la vez. Debido a que el medio es único y compartido para todas las estaciones, sólo una como máximo puede estar utilizándolo en un instante dado. Si dos estaciones tratan de utilizarlo a la vez, sus señales interferirán entre sí y ninguna de las dos transmisiones llegará a su destino. Cuando se produce una colisión el canal se está desaprovechando. Según los distintos mecanismos que se utilizan en el acceso al medio por contienda para evitar las posibles colisiones, podemos clasificar los métodos en: — Sin escucha. Cuando una estación tiene información para transmitir, la deposita en el canal sin comprobar previamente si éste estaba libre. — Con escucha (CSMA). Sólo se transmite si el canal se encuentra libre. Esto no significa que no se puedan producir colisiones ya que debido a los tiempos de propagación de la señal en el cable, puede ocurrir que varias estaciones observen que el cable está libre y transmitan justo a la vez. Estos métodos pueden tener escucha persistente o no persistente: • 6-22 Con escucha persistente (CSMA-P). Cuando una estación encuentra el canal ocupado, continúa escuchando de forma Sistemas de comunicación persistente hasta que queda libre. Una vez que el canal está libre puede proceder de dos formas: • a) CSMA-1P. La estación transmite con una probabilidad 1 (siempre) cuando encuentra el canal libre. b) CSMA-pP. La estación transmite con una probabilidad “p” cuando encuentra el canal libre y espera a la siguiente ranura de tiempo con una probabilidad 1-p (por ejemplo, transmite con 0,75 de probabilidad y retrasa la transmisión en el resto de los casos, 0,25). Con escucha no persistente (CSMA-NP). Cuando una estación encuentra el canal ocupado, espera un tiempo aleatorio y vuelve a intentarlo. Además de la clasificación anterior, las estaciones pueden incorporar detección de colisiones o no. El mecanismo con escucha y detección de colisiones, llamado CSMA/CD, es el más utilizado. Su nombre describe su comportamiento: Carrier Sense Multiple Access/Collision Detect, acceso múltiple con detección de portadora y detección de colisiones. Cuando una estación transmite (porque el canal estaba libre en ese momento), continúa escuchando el canal por si se produce una colisión. En caso de producirse, interrumpe de inmediato la transmisión, espera un tiempo aleatorio y vuelve a intentarlo. La espera de un tiempo aleatorio es fundamental para evitar que dos estaciones estén indefinidamente colisionando. El protocolo CSMA/CD es utilizado por la norma IEEE 802.3 y recibe el nombre de Ethernet. En realidad, existen ligeras diferencias entre estos 3 términos aunque podemos considerarlos equivalentes. 10.4. Normas IEEE 802 En la subcapa de acceso al medio se determina la forma en que los puestos de la red envían y reciben datos sobre el medio físico. Se responden preguntas del tipo: ¿puede un puesto dejar información en el cable siempre que tenga algo que transmitir?, ¿debe esperar algún turno?, ¿cómo sabe un puesto que un mensaje es para él? El organismo de normalización conocido como IEEE (Instituto de ingenieros eléctricos y electrónicos) ha definido los principales protocolos de esta capa en normas 802. Resumimos a continuación estos y otros estándares 802: — 802.1. Arquitecturas de red. Es una introducción al conjunto de estándares y define algunos aspectos comunes. • 802.1p. Control de prioridad. • 802.1Q. VLANs (redes locales virtuales). • 802.1X. Autentificación basada en puertos. — 802.2. Describe el protocolo LLC, que puede proporcionar control de errores y control de flujo al resto de estándares 802. — 802.3. Ethernet (CSMA/CD). 6-23 Sistemas y Comunicaciones • 802.3u. Fast Ethernet. • 802.3z. Gigabit Ethernet sobre fibra óptica. • 802.3ab. Gigabit Ethernet sobre par trenzado. • 802.3ad. Agregación de enlaces (trunking). Permite agrupar varios enlaces Ethernet para conseguir así más velocidad. • 802.3ae. Ethernet a 10 Gbps sobre fibra óptica. • 802.3af. PoE (Power over Ethernet). Define cómo incluir alimentación eléctrica junto a los datos en cables de par trenzado. • 802.3an. Ethernet a 10 Gbps sobre par trenzado. — 802.4. Token Bus. — 802.5. Token Ring. — 802.6. Redes MAN. Se describe el protocolo DQDB (Distributed Queue Dual Bus, bus doble de colas distribuidas), apropiado para este tipo de redes. — 802.7. Redes locales de banda ancha. — 802.8. Fibra óptica. Se describe la interfaz FDDI (Fiber Distributed Data Interface, interfaz de datos distribuidos por fibra). — 802.9. Redes integradas de voz y datos. — 802.10. Seguridad en redes. — 802.11. Estándar de redes WLAN. Wi-Fi. — 802.12. Se trata del protocolo 100BaseVG-AnyLAN para redes locales, conocido como acceso con prioridad de demanda. — 802.15. Estándar de redes WPAN. Bluetooth. — 802.16. Estándar de redes WMAN. WiMax. — 802.20. Estandar de redes WMAN de Banda Ancha (Mobile BroadBand Wireless Access). 11. ETHERNET Las redes Ethernet son actualmente las únicas que tienen interés para entornos LAN cableados. El estándar IEEE 802.3 fue diseñado originalmente para funcionar a 10 Mbps, aunque posteriormente ha sido perfeccionado para trabajar a velocidades superiores: 6-24 — Ethernet 10 Mbps: IEEE 802.3. — Ethernet 100 Mbps (Fast Ethernet): IEEE 802.3u. Sistemas de comunicación — Ethernet 1 Gbps (Gigabit Ethernet): IEEE 802.3z y IEEE 802.3ab. — Ethernet 10 Gbps: IEEE 802.3ae y IEEE 802.3an. Una red Ethernet (no conmutada) tiene las siguientes características: — Canal único. Todas las estaciones comparten el mismo canal de comunicación por lo que sólo una puede utilizarlo en cada momento. — Es de difusión debido a que todas las transmisiones llegan a todas las estaciones (aunque sólo su destinatario aceptará el mensaje, el resto lo descartarán). — Tiene un control de acceso distribuido porque no existe una autoridad central que garantice los accesos. Es decir, no hay ninguna estación que supervise y asigne los turnos al resto de estaciones. Todas las estaciones tienen la misma prioridad para transmitir. Comparación de Ethernet y Token Ring: en Ethernet cualquier estación puede transmitir siempre que el cable se encuentre libre; en Token Ring cada estación tiene que esperar su turno. Ethernet utiliza un canal único de difusión; Token Ring utiliza enlaces punto a punto entre cada estación y la siguiente. Token Ring tiene siempre una estación monitor que supervisa el buen funcionamiento de la red; en Ethernet ninguna estación tiene mayor autoridad que otra. Según esta comparación, la conclusión más evidente es que, a iguales velocidades de transmisión, Token Ring se comportará mejor en entornos de alta carga y Ethernet, en redes con poco tráfico. En las redes Ethernet, cuando una estación envía un mensaje a otra, no recibe ninguna confirmación de que la estación destino haya recibido su mensaje. Una estación puede estar enviando paquetes Ethernet a otra que está desconectada y no advertirá que los paquetes se están perdiendo. Las capas superiores (y más concretamente, TCP) son las encargadas de asegurarse que la transmisión se ha realizado de forma correcta. El protocolo de comunicación que utilizan estas redes es el CSMA/CD-1P. Esta técnica de control de acceso a la red ha sido normalizada constituyendo el estándar IEEE 802.3. En la actualidad, las redes LAN, basadas en Ethernet, utilizan como dispositivos de interconexión los llamados “switches” (Ethernet conmutada) y generalmente con microsegmentación, esto es, que cada interfaz del “swtich” sólo dé servicio a un solo PC con lo que se inhabilita al acceso al medio por contienda con colisión y detección de portadora (CSMA/CD) pues el medio es exclusivo y no compartido. Con ello se gana en velocidad evitando colisiones. Por otro lado la negociación de la velocidad será la mayor que compartan tanto el interfaz del “swtich” como de la tarjeta de red que tenga instalado el PC. 11.1. Direcciones físicas ¿Cómo sabe una estación que un mensaje es para ella? Está claro que hay que distinguir unas estaciones de otras utilizando algún identificador. Esto es lo que se conoce como direcciones físicas o direcciones MAC. 6-25 Sistemas y Comunicaciones Los adaptadores Ethernet tienen asignada una dirección de 48 bits de fábrica que no se puede variar. Los fabricantes nos garantizan que no puede haber dos tarjetas de red con la misma dirección física. Si esto llegase a ocurrir dentro de una misma red, la comunicación se volvería imposible. Los tres primeros “bytes” corresponden al fabricante (CID, Company ID) y los tres últimos al número de serie del fabricante (VID, Vendor ID). Por ejemplo en: 5D:1E:23:10:9F:A3 Los “bytes” 5D:1E:23 identifican al fabricante y los “bytes” 10:9F:A3, al número de serie del fabricante 5D:1E:23. No todas las direcciones representan a máquinas aisladas, algunas de ellas se utilizan para enviar mensajes de multidifusión. Esto es, enviar un mensaje a varias máquinas a la vez o a todas las máquinas de la red. Ethernet permite que el mismo mensaje pueda ser escuchado por más de una máquina a la vez. No todas las direcciones representan a máquinas aisladas: algunas de ellas se utilizan para enviar mensajes a un grupo de estaciones (multidifusión) o a todas las estaciones (difusión). La dirección de difusión es FF:FF:FF:FF:FF:FF. Ethernet permite que el mismo mensaje pueda ser escuchado por más de una máquina a la vez. 11.2. Formato de la trama La comunicación entre una estación y otra a través de una red Ethernet se realiza enviando tramas Ethernet. El mensaje que se quiere transmitir se descompone en una o más tramas con el siguiente formato: Estructura de la trama de 802.3 Ethernet Delimitador MAC de Preámbulo de inicio de destino trama 7 Bytes 1 Byte 6 Byte MAC de origen 802.1Q Etiqueta (opcional) Ethertype (Ethernet II) o longuitud (IEEE 802.3) 6 Byte 4 Bytes 2 Bytes Payload Secuencia de comprobación (32bit CRC) Gap entre frames De 46 (o 42) hasta 15000 Bytes 4 Bytes 12 Bytes 64 – 1522 Bytes 72 – 1530 Bytes 84 – 1542 Bytes Las direcciones origen y destino son las direcciones físicas de los adaptadores de red de cada ordenador. El campo Tipo de trama indica el formato de los datos que se transfieren en el campo Datos de la trama. Por ejemplo, para un datagrama IP se utiliza el valor hexadecimal de 0800 y para un mensaje ARP el valor 0806. Todos los mensajes (datagramas) que se envíen en la capa siguiente irán 6-26 Sistemas de comunicación encapsulados en una o más tramas Ethernet utilizando el campo Datos de la trama. Y esto mismo es aplicable para cualquier otro tipo de red distinta a Ethernet. Como norma general, cada mensaje que transmite una capa se coloca en el campo datos de la capa anterior, aunque es muy frecuente que el mensaje no quepa en una sola trama y se utilicen varias. La longitud mínima de una trama Ethernet la fija el diámetro de la red, ya que para el correcto funcionamiento del protocolo CSMA/CD es preciso que el tiempo de ida y vuelta no sea nunca superior a lo que tarda en emitirse una trama del tamaño mínimo. — En Ethernet a 10 y 100 Mbps la longitud mínima de trama es de 64 “bytes”, este valor se escogió para no confundir tramas con fragmentos de colisión. Este valor es histórico si añadimos los 4 “bytes” opcionales que se añadieron con el IEEE 802.1q de modo que pasaría a ser la trama mínima de 68 “bytes”. — En GigabitEthernet la longitud mínima de trama es de 512 “bytes” (4096 bits), esto se consigue incorporando al final de la trama un segundo relleno denominado extensión de portadora. La extensión de portadora no es formalmente parte de la trama Ethernet, por lo que solo existirá mientras ésta viaje por GigabitEthernet. En el caso de que una trama con extensión de portadora sea transmitida a una red de 100 o 10 Mb/s la extensión de portadora se eliminará, e inversamente, si una trama menor de 512 “bytes” llega a una red GigabitEthernet desde Fast-Ethernet o Ethernet el conmutador correspondiente añadirá la extensión de portadora necesaria para que la longitud sea de 512 “bytes”. La longitud máxima de una trama Ethernet es de 1522 “bytes” (1500 bytes de datos más campos de cabecera y CRC); históricamente se decía que tenía un tamaño máximo de 1518 “bytes” (la diferencia de 4 bytes es debido a las etiquetas VLAN del IEEE 802.1q). 11.3. Variantes de 802.3 Según el tipo de cableado y velocidad, la norma Ethernet se puede clasificar en distintas variantes. A continuación resumimos las más destacables: — Ethernet 10Base5. Cable coaxial grueso, 10 Mbps, 500 metros de distancia máxima de segmento. — Ethernet 10Base2. Cable coaxial fino, 10 Mbps, 185 metros de distancia máxima de segmento. — Ethernet 10BaseT. Par trenzado, 10 Mbps. — Ethernet 10BaseF. Fibra óptica, 10 Mbps. — Ethernet 100BaseTX y Ethernet100BaseT4. Par trenzado, 100 Mbps. — Ethernet 100BaseFX. Fibra óptica, 100 Mbps. — Ethernet 1000BaseT. Par trenzado, 1 Gbps. — Ethernet 1000BaseSX. Fibra óptica multimodo (onda corta), 1 Gbps. 6-27 Sistemas y Comunicaciones — Ethernet 1000BaseLX. Fibra óptica monomodo (onda larga), 1 Gbps, entre 3 y 10 km de distancia máxima de segmento. — Ethernet 1000BaseCX. Cable par trenzado STP, 1 Gbps, 25 metros de distancia máxima de segmento. Esta variante ha sido sustituida por 1000BaseT. — Ethernet 10GBaseT. Par trenzado, 10 Gbps — Ethernet 10GBaseSR. Fibra óptica multimodo (short reach), 10 Gbps. — Ethernet 10GBaseLR. Fibra óptica monomodo (long reach), 10 Gbps, hasta 10 km de distancia máxima de segmento. — Ethernet 40GBaseSR4. Fibra óptica multimodo (short reach), 40 Gbps, hasta 150 m de distancia máxima de segmento. — Ethernet 100GBaseSR10. Fibra óptica multimodo (short reach), 100 Gbps, hasta 150 m de distancia máxima de segmento. 12. Tecnologías inalámbricas Como punto central de este apartado estudiamos las redes locales inalámbricas (WLAN) conocidas como Wi-Fi. Además, estudiamos otras tecnologías inalámbricas WPAN, WLAN, WMAN y WWAN: — Redes personales inalámbricas (WPAN): Blueetooth (IEEE 802.15), Zigbee (IEEE 802.15.4). — Redes locales inalámbricas (WLAN): Wi-Fi (IEEE 802.11), HiperLAN/2, 5-UP. — Redes metropolitanas inalámbricas (WMAN): LMDS, IEEE 802.16. — Redes de área extensa inalámbricas (WWAN). Aquí se pueden incluir los enlaces vía satélite, así como el conjuntos de tecnologías de la red móvil: GSM, GPRS, UMTS. 12.1. WPAN-BLUETOOTH-IEEE 802.15.1 Bluetooth es una tecnología WPAN (Wireless Personal Area Network), lo que significa que su función es conectar dispositivos con un ordenador. Bluetooth no se utiliza para conectar ordenadores entre sí, que sería la función de las WLAN. Los dispositivos que soportan Bluetooth son en general de tamaño reducido, bajo consumo y corto alcance. Lo que antes se conectaba a través de la interfaz cableada USB (cámaras de fotos, teléfonos móviles, teclados, ratones, impresoras, mandos de consolas de videojuegos, enlaces inalámbricos entre sistemas de audio y los altavoces, etc.) ahora es posible conectarlo mediante Bluetooth. 6-28 Sistemas de comunicación La especificación inicial de Bluetooth contemplaba una velocidad de 1 Mbps y una distancia máxima de 10 metros, aunque estos límites han sido excedidos por los fabricantes en sucesivas versiones. Utiliza la banda de 2,4 GHz, la misma que las redes Wi-Fi 802.11b y 802.11g. Para reducir interferencias incorpora un sistema de saltos de frecuencias dentro de la banda, conocido como FHSS (Frecuency-hopping Spread Spectrum, espectro disperso de salto de frecuencia). Fue desarrollado por Ericsson, Nokia, Motorola, Toshiba, IBM e Intel, entre otras compañías. Ha sido estandarizado por el IEEE en la norma 802.15. 12.1.1. Versiones de Bluetooth — Bluetooth v1.0 y v1.0b. • — — Bluetooth v1.1 (2002). • Ratificado como estándar IEEE 802.15.1-2002. • Se corrigen errores de versiones anteriores. • Conecta hasta 7 dispositivos simultáneamente en topología en estrella (1 master-7 slave), conocido también como piconet. • La combinación de redes piconet en una de mayor alcance recibe el nombre de scatternet. • Velocidad bruta de 1Mbps, reales 721Kbps. • Introdujo el control de flujo. Bluetooth v2.0 + EDR (Enhanced Data Rate) (2004). • — Velocidad práctica 2,1Mbps, bruta de 3Mbps. Bluetooth v2.1 + EDR (2007). • — Solo conectaba 1 dispositivo simultáneamente. Mejora la seguridad mediante Secure Simple Pairing. Bluetooth v3.0 + HS(2009). • Velocidad práctica 24Mbps. • La conexión Bluetooth nativa se utiliza para la negociación y el establecimiento de la conexión mientras que el tráfico de datos de alta velocidad se realiza mediante un enlace 802.11. Estos dispositivos se identifican con "+HS" (High Speed). 6-29 Sistemas y Comunicaciones — Bluetooth v4.0 (2010) • Velocidad práctica 24Mbps. • Es una agrupación de versiones anteriores, incluye: – Bluetooth clásico. – Bluetooth de alta velocidad “+HS”. – Bluetooth de baja energía (Bluetooth Low Energy-BLE) implementado en chips de pequeños dispositivos. Ej. Calculadoras Texas Instruments. 12.2. WPAN-ZigBee-IEEE 802.15.4 ZigBee, especificación industrial promovida por la ZigBee Alliance recogida en diciembre de 2004 por el IEEE 802.15.4. El objetivo de ZigBee es convertirse en el estándar dominante para las aplicaciones de control remoto (mandos de control remoto, automatización en el hogar, etc), que no requieren altas velocidades de transmisión, pero que por el otro lado requieren un muy bajo consumo de potencia, bajo coste y facilidad de uso. Para ello habilita la transmisión de datos sobre distintas bandas de frecuencias. Así, presenta una capacidad de 250 Kbits a 2.4 GHz, 40 Kpbs a 915 Mhz, y 20 Kpbs a 868 Mhz dentro de un rango de 10 a 100 metros. 12.3. WLAN-WI-FI-IEEE 802.11 La norma 802.11 del IEEE, más conocida como Wi-Fi (Wireless Fidelity), define un estándar de redes WLAN. Ofrece un alcance de referencia de 100 metros en espacios abiertos y velocidades elevadas (54 Mbps en 802.11a y 802.11g), aunque esta velocidad disminuye a medida que aumenta la distancia o los obstáculos intermedios (paredes, por ejemplo). Una instalación de red Wi-Fi (utilizando un solo punto de acceso) puede dar cobertura a toda una vivienda u oficina. Si Ethernet (IEEE 802.3) es el estándar para redes locales cableadas, Wi-FI (IEEE 802.11) lo es para las redes locales inalámbricas. Wi-Fi Alliance es una asociación sin ánimo de lucro, formada por más de 300 empresas, dedicada a la adopción de un único estándar de redes WLAN aceptado a nivel mundial (IEEE 802.11) y al fomento del mismo. Se encarga de la certificación de sus productos de acuerdo a las normas del IEEE, para garantizar así la interoperabilidad de dispositivos de distintos fabricantes. 12.3.1. Normas IEEE 802.11 La siguiente tabla resume los distintos tipos de redes Wi-Fi: 6-30 Sistemas de comunicación 802.11a 802.11b 802.11g 802.11n Interfaz OFDM DSSS DSSS, OFDM OFDM, MIMO Banda 5GHz 2,4 GHz 2,4 GHz 2,4 ó 5 GHz Velocidad TEÓRICA 24-54 Mbps 11 Mbps 36-54 Mbps 600 Mbps Velocidad Real 24-54 Mbps 5-6 Mbps 20 Mbps 80-100 Mbps Nº de Portadoras Simultáneas / AP (Acess Point) 8 3 3 2 Alcance 100 mts 100 mts 100 mts 200 mts Aspectos a tener en cuenta: — Dos normas 802.11 son compatibles entre sí si operan en la misma banda de frecuencias. Se transmite a la velocidad del más lento. Esto significa que dispositivos 802.11b y 802.11g pueden comunicarse entre sí (a 11 Mbps), pero no pueden comunicarse con un dispositivo 802.11a. — Las velocidades indicadas son velocidades máximas, las cuales van disminuyendo dinámicamente al aumentar la distancia o en presencia de obstáculos o interferencias. Por ejemplo, 802.11b dispone de modos de funcionamiento a 1, 2, 5.5 y 11 Mbps. — Los canales son divisiones de una banda de frecuencia, para permitir varias transmisiones simultáneas en la misma banda. La banda de los 2,4 GHz se dividen en canales de 5 MHz cada uno (canal 1: 2,412 GHz; canal 2: 2,417 GHz; canal 3: 2,422 GHz; etc.) — Aunque los productos 802.11b y 802.11g permitan elegir entre un número elevado de canales, sólo 3 de ellos se pueden utilizar simultáneamente sin que interfieran (solapen) entre sí. Los tres canales elegidos habitualmente son: canal 1 (2.412MHz), canal 6 (2.437MHz) y canal 11 (2.462MHz), que distan entre sí de 25 MHz (5 canales de 5MHz cada uno). — La última norma de redes WLAN es 802.11n, que se espera que llegue a 600 Mbps. Utiliza ambas bandas (2,4 GHz y 5 GHz), por lo que es compatible con todas las normas anteriores. El alcance se ve también incrementando a 200 metros. IEEE 802.11n utiliza una tecnología conocida como MIMO (múltiples entradas/múltiples salidas) que se basa en el uso simultáneo de varias antenas. 6-31 Sistemas y Comunicaciones Otras versiones del IEEE 802.11 — IEEE 802.11e. Introduce parámetros de calidad de servicio (QoS). — IEEE 802.11h. Mejora de la potencia transmitida y la selección de canales en 802.11a. — IEEE 802.11i. Mejora la seguridad y autenticidad (WPA2). — IEEE 802.11j. Permite la coexistencia del 802.11a y el estándar europeo HiperLAN2 y 802.11 en Japón. — 802.11k permite mejorar la gestión del recurso radio. — IEEE 802.11p Será la base de las comunicaciones dedicadas de corto alcance especialmente indicado para automóviles. — IEEE 802.11r También se conoce como Fast Basic Service Set Transition, y su principal característica es permitir a la red que establezca los protocolos de seguridad que identifican a un dispositivo en el nuevo punto de acceso antes de que abandone el actual y se pase a él. Permite que la transición entre nodos se demore menos de 50 milisegundos permitiendo mantener una comunicación vía VoIP. — IEEE 802.11v servirá para permitir la configuración remota de los dispositivos cliente. — IEEE 802.11aa-2012: — — • Indicado para el transporte de video en streaming. • Divide el espectro en canales 40MHz. IEEE 802.11ac: • Trabaja en la banda de los 5GHz. • Divide el espectro en canales de 20, 40, 80 y opcionalmente 160MHz. • Velocidad de hasta 3,47Gbps. IEEE 802.11ad: • Trabaja en la banda de los 60GHz. • Divide el espectro en canales de 2160MHz. • Velocidad de hasta 6,75Gbps (6.912 Mbps). — IEEE 802.11ae. — IEEE 802.11af: • 6-32 Conocida como “White-Fi” y “Super Wi-Fi”. Sistemas de comunicación • Permite conectividad WLAN en los espectros de VHF y UHF que comprenden las bandas de entre los 54 y los 790 MHz. • Velocidades de hasta: a) 426,7Mbps para canales de 6 y 7Mhz. b) 568,9Mbps para canales de 8Mhz. — Versiones en proceso: • IEEE 802.11ay: Next Generation 60GHz. • IEEE 802.11ax: High Efficency WLAN. • IEEE 802.11ak: General Link. • IEEE 802.11aq: Preassociation Discovery. • IEEE Std P802.11aj: China Millimeter Wave. • IEEE 802.11ai: Fast Initial Link Setup. • IEEE Std P802.11ah: Sub 1GHz. 12.3.2. Configuración Cada red Wi-Fi tiene un nombre que lo identifica conocido como SSID (Service Set Identifier, identificador de conjunto de servicios). Una red Wi-Fi se puede instalar en 2 modos: — Modo ad-hoc o IBSS (Independent Basic Service Set). No requiere un punto de acceso. Cada estación se puede comunicar directamente con otras estaciones próximas. — Modo infraestructura o BSS (Basic Service Set). Requiere un punto de acceso. El punto de acceso es el dispositivo que regula las comunicaciones dentro de la red Wi-Fi. Todas las comunicaciones entre las estaciones pasan a través del punto de acceso, que hace de intermediario. Las redes Wi-Fi habitualmente funcionan en el modo infraestructura, pues permiten un mayor número de opciones. Los puntos de acceso que ofrecen los fabricantes son además puentes (bridges), para poder interconectar la red Wi-Fi a una red cableada (Ethernet). En un punto de acceso se configura el nombre de la red (SSID), el número de canal (6, por ejemplo) y las opciones de seguridad. En las estaciones hay que indicar el SSID de la red a la que queremos conectarnos y, si la red está protegida con contraseña, las opciones de seguridad. 6-33 Sistemas y Comunicaciones Si un solo punto de acceso es insuficiente para dar cobertura a toda una zona, se pueden instalar varios puntos de acceso. Todos ellos se configuran con el mismo SSID pero se eligen, si es posible, canales distintos. Las estaciones se conectarán a aquel punto de acceso que ofrezca mejor señal, pudiendo cambiar esta elección de forma transparente al usuario. 12.3.3. Seguridad Las redes Wi-Fi se consideran inseguras puesto que las transmisiones de una red inalámbrica superan normalmente la cobertura deseada, llegando a zonas que no controlamos y donde podría haber una tercera persona capturando la señal. Esto no es así en las redes cableadas porque en este caso se requiere acceso físico al cable. Un ataque pasivo a una red inalámbrica consiste en capturar datos, sin transmitir nada, lo que los hace indetectables. Otro ataque muy habitual consiste en acceder a una red inalámbrica y hacer uso de sus recursos (Internet, por ejemplo). Para prevenir este tipo de ataques se han desarrollado distintos protocolos específicos de seguridad: — WEP (Wired Equivalent Privacy, privacidad equivalente al cable). Incluido en la norma original 802.11 del IEEE de 1997. — WPA (Wi-Fi Protected Access, acceso protegido Wi-Fi). Subconjunto de IEEE 802.11i, atribuido a Wi-Fi Alliance. De 2002. — WPA2 o IEEE 802.11i. Estándar del IEEE de 2004. WEP es el protocolo de seguridad más básico. Se basa en el algoritmo RC4 (algoritmo simétrico). Utiliza claves estáticas que se han de teclear tanto en el punto de acceso como en cada una de las estaciones. A la clave que teclea el administrador de la red, el protocolo le concatena una parte dinámica, llamada vector de inicialización, que es siempre de 24 “bits”. El vector de inicialización (IV) varía en cada mensaje. Para que el destino pueda descifrar el mensaje, el origen envía en texto plano el IV dentro de cada trama 802.11. Según lo anterior, las claves WEP de 64 “bits” están formadas en realidad por 40 “bits” estáticos y 24 “bits” dinámicos. Las claves WEP de 128 “bits” son 104 “bits” estáticos y 24 “bits” dinámicos. Existen procedimientos conocidos para romper el protocolo WEP (descubrir su clave), por lo que se debería elegir otro protocolo más fuerte como WPA. WPA se lanzó en octubre de 2002 por Wi-Fi Alliance como un subconjunto del trabajo que estaba haciendo el IEEE en 802.11i, debido a la necesidad de las empresas para proteger sus redes. Debido a las debilidades de WEP, y antes de la aparición de WPA, las empresas se vieron obligadas a optar por otro tipo de alternativas, como la utilización de VPN (redes privadas virtuales) cifradas. WPA utiliza también RC4, aunque soluciona las debilidades de WEP mediante la variación dinámica de las claves cada cierto tiempo. El vector de 6-34 Sistemas de comunicación inicialización se aumenta a 48 “bits”. Entre las tecnologías que utiliza podemos citar: TKIP (Temporal Key Integrity Protocol, protocolo de integridad de clave temporal) y MIC (Message Integrity Code, código de integridad de mensaje). Este protocolo fue pensado para la utilización con un servidor RADIUS (Remote Authentication Dial-In User Service, servicio de autentificación de usuarios remotos por marcación) junto al estándar para autentificación basada en puertos (802.1x) y el protocolo de autentificación extendida (EAP). Este modo de WPA se conoce como WPA-Enterprise y es el recomendado para las empresas. Para pequeñas oficinas o para el hogar, se diseñó el modo WPA-Personal o WPA-PSK, que parte de una clave inicial compartida entre todos los usuarios (PSK: pre-shared key). IEEE 802.11i, conocido como WPA2, es el protocolo más seguro de los 3 que estudiamos. WPA2 utiliza el nuevo algoritmo simétrico de seguridad llamado AES (Advanced Encryption Standard, estándar de cifrado avanzado) en lugar de RC4. El resto de características descritas para WPA también se aplican en WPA2. 12.4. WLAN-HiperLAN/2 HiperLAN/2 es la implementación de ETSI equivalente a IEEE 802.11a. Opera en la banda de 5 GHz transmitiendo a 54 Mbps. Para mejorar y unificar estos dos estándares, el fabricante de tarjetas de red inalámbricas Atheros propuso un tercero, conocido como 5UP (5GHz Unified Protocol), que alcanza velocidades hasta 108 Mbps. 12.5. WMAN-LMDS LMDS (Local Multipoint Distribution Service, sistema de distribución local multipunto) ha sido muy utilizado para llevar Internet a núcleos urbanos donde no es rentable, para las operadoras, la instalación de ADSL u otros sistemas cableados. Permite ofrecer servicios de banda ancha (telefonía, televisión e Internet) por microondas (utiliza frecuencias entre 26 y 31 GHz). El sistema es “multipunto” porque se establecen enlaces punto a multipunto, entre la estación base y los distintos usuarios. Estos enlaces son “locales” porque requieren que exista línea de visión y una distancia máxima entre 3 y 5 km. 12.6. WMAN-WiMAX-IEEE 802.16 WiMax (IEEE 802.16). Es también una tecnología de microondas, aunque opera a frecuencias más bajas (2.5, 3.5 o 5GHz normalmente), lo que permite un mayor alcance (hasta unos 50 Km sin línea de visión directa) y la posibilidad de atravesar obstáculos. Puede ofrecer velocidades hasta 124 Mbps. Sus productos los certifica WiMax Forum (Worldwide Interoperability for Microwave Access, interoperabilidad mundial para acceso por microondas), asociación formada por más de 100 empresas. La alternativa a WiMax de ETSI es HiperMAN. 6-35 Sistemas y Comunicaciones 12.7. WMAN-HiperMAN (High Performance Radio Metropolitan Area Network) HiperMAN es el estándar europeo para el acceso fijo inalámbrico a redes desarrollado por ETSI. Permite operar en la banda comprendida entre 2 GHz y 11 GHz. La parte de las especificaciones IEEE 802.16 que trabajan en dicha banda y ETSI HiperMAN comparten las mis-mas capas física (PHY) y de acceso al medio (MAC). 802.16 se diseñó desde un primer momento para ser compatible e interoperable con el estándar europeo. 12.8. WMAN-Redes inalámbricas móviles (MBWA): -IEEE 802.20 IEEE 802.20 (MBWA = Mobile Broadband Wireless Acces) es un estándar para redes wireless de banda ancha basadas en servicios IP móviles y pretende ser una especificación de los sistemas móviles de 4ª generación. Tiene como misión la de desarrollar la especificación de la capa física (PHY) y la capa MAC de una interfaz de aire basado en conmutación de paquetes y optimizado para el transporte IP que opere en las bandas de trabajo licenciadas por debajo de 3,5 GHz., que trabaje con velocidades de pico por encima de 1 Mbps, que soporte movilidad en movimiento por encima de los 250 km/h y que cubra tamaños de celda que permitan coberturas continuas de áreas metropolitanas. 13. Comunicaciones móviles El Reglamento de Radiocomunicaciones de la UIT define el servicio de comunicaciones móviles como un servicio de radiocomunicaciones entre estaciones móviles y estaciones fijas, o entre estaciones móviles únicamente. 13.1. Telefonía Inalámbrica La telefonía sin hilos se ha diseñado para usuarios cuyos movimientos están limitados a un área bien definida, y cuyos desplazamientos se realizan a velocidades bajas (movilidad reducida). Son sistemas de alcance limitado, inferior a los cien metros en entornos cerrados, y su utilización en la actualidad se encuentra restringida al uso doméstico. Este sistema lo forman una estación base conectada a la red telefónica y uno o varios terminales portátiles de usuario, con una cobertura de entorno a 40-60m. Los estándares son: 6-36 — CT0, CT1, CT2 (CT = Cordless Telecommunications). — DECT (Digital Enhanced Cordless Telecomms) que es el que se utiliza actualmente: • Trabaja en la banda de los 1800 MHz. • Velocidad de 32Kbps. Sistemas de comunicación 13.2. Telefonía Móvil Automática (TMA) El servicio de Telefonía Móvil Automática (T.M.A.) permite a sus abonados móviles establecer comunicación de voz y datos con otros móviles o con abonados a las redes fijas. La única restricción es que el móvil debe encontrarse dentro del área de cobertura radioeléctrica de la red. Los sistemas que prestan el servicio de TMA se denominan “sistemas celulares” debido a que su cobertura radioeléctrica total la consiguen mediante yuxtaposición de coberturas (células o celdas) proporcionadas por estaciones base de radio, a las que se asigna un cierto número de frecuencias con las cuales se proporcionan canales de comunicación o radiocanales. Se denomina célula o celda a cada una de las unidades básicas de cobertura en que se divide un sistema celular. La idea fundamental detrás de los sistemas móviles celulares es la reutilización de frecuencias mediante la división del terreno en celdas continuas. La reutilización de frecuencias no es posible en células contiguas, ya que se producirían interferencias, pero sí entre otras alejadas entre sí. De esta forma, se emplea el concepto de “clúster” o “racimo” para designar un conjunto de células adyacentes de manera que, entre todas, agrupan la práctica totalidad de las frecuencias disponibles por la red celular. El concepto de Hand-over o traspaso es el procedimiento mediante el cual se consigue que una conexión se mantenga cuando el móvil cambia de celda, de manera que su enlace con la red es establecido a través de una nueva estación base, dependiente de la misma Central de Conmutación. En caso de que cambiara de central de conmutación nos encontraríamos ante el concepto de Roaming o Itinerancia. 13.3. Generaciones 13.3.1. 1G: Telefonía Móvil Analógica La primera generación de sistemas de telefonía móvil la constituye la telefonía móvil analógica. En líneas generales, esta generación se caracteriza por utilización de señales analógicas para la transmisión de voz, mediante el empleo de modulación en frecuencia (FM) con reducida eficiencia espectral. Los diversos sistemas definidos no son interoperables entre sí, por lo que es imposible la comunicación entre países. Los principales estándares englobados en esta generación son: — AMPS: primer sistema celular, americano (desplegado por primera vez en Chicago en 1983). Trabajaba en la banda de 800 MHz. — NMT-450: europeo, sobre la banda de 450 MHz. 6-37 Sistemas y Comunicaciones — NMT-900: Evolución del anterior sobre la banda de 900 MHz, con una mayor capacidad. — TACS: versión europea del sistema AMPS en la banda de 900MHz. 13.3.2. 2G: Telefonía Móvil Digital En la segunda generación se salta a la transmisión de señales digitales, tanto para la transmisión de voz como de datos, aunque éstos a bastante baja velocidad (9,6 Kbps). Los estándares europeos pertenecientes a esta generación son el sistema GSM y el DCS-1800. En América se define también el PCS-1900. GSM es un estándar europeo que trabaja en la banda de los 900 MHz a una velocidad de datos 9,6Kbps para servicios WAP y conexión a Internet. Utiliza conmutación de circuitos de modo que cuando a un abonado se le asigna un canal de tráfico, éste queda reservado en modo dedicado. Permite la transmisión de datos pero no de forma simultánea a una transmisión de voz. Introdujo la mensajería instantánea SMS (Short Message Service). Los identificadores son: — IMEI: (“International Mobile Station Equipment Identity”) que es un número único para comprobar la validez del terminal y que no se repite en ningún otro terminal. — IMSI: (“International Mobile Subscriber Identity”) identificativo único de cada abonado móvil integrado en la tarjeta SIM. Hasta 15 dígitos. — SIM: (“Subscriber Identity Module”): Tarjeta. Para dar a los usuarios de las redes 2G aplicaciones reales de transmisión de datos, y en concreto el acceso a Internet, se desarrolló el protocolo WAP (Wireless Application Protocol) que es un protocolo de comunicaciones que permite acceder a Internet desde cualquier dispositivo inalámbrico. Para ello hace uso de WML (Wireless Markup Language), sencillo y muy apropiado para las pequeñas pantallas de un terminal móvil. WAP se puede implantar en teléfonos móviles, PDAs (Asistentes Digitales Personales), portátiles, y en cualquier otro dispositivo que acceda a Internet sin conexión física. Las capas contempladas son las siguientes: 6-38 — Capa de aplicación (WAE, Wireless Application Environment) es un entorno de aplicación de propósito general diseñado para permitir el desarrollo de aplicaciones sin estar ligados al dispositivo en el que se ejecuten (móvil, PDA, etc.). Este entorno incluye un micro navegador que interpreta WML y WMLScript. — Capa de sesión (WSP, Wireless Session Protocol) proporciona a la Capa de Aplicación una interfaz con dos servicios de sesión: un servicio orientado a conexión y otro no orientado a conexión, adaptados a aplicaciones basadas en la navegación Web. — Capa de transacciones (WTP, Wireless Transacción Protocol) proporciona seguridad usuario-a-usuario opcional para confirmar cada men- Sistemas de comunicación saje que llega, así como la confirmación de múltiples datagramas para reducir el número de mensajes enviados. Equivale a HTTP en la arquitectura Web. — Capa de seguridad (WTLS, Wireless Transport Layer Security) es un protocolo basado en el estándar TLS, y ha sido especialmente diseñado para los protocolos de transporte de WAP y optimizado para ser utilizado en canales de comunicación de banda estrecha. — Capa de transporte (WDP, Wireless Datagram Protocol) proporciona un servicio fiable a los protocolos de las capas superiores de WAP y permite la comunicación de forma transparente sobre los protocolos portadores soportados por los distintos tipos de redes inalámbricas. Debido a que este protocolo proporciona una interfaz común a los protocolos de las capas superiores, las de Seguridad, Sesión y Aplicación pueden trabajar independientemente de la red inalámbrica que dé soporte al sistema. Equivale a TCP en la arquitectura Web. Para el diseño de contenidos orientados a dispositivos móviles, WAP ofrece el lenguaje de diseño de contenidos WML (Wireless Markup Language), basado en el estándar XML (Extensible Markup Language). La estructura de un archivo WML gira en torno a elementos denominados fichas (cards), que el usuario es capaz de visualizar en la pantalla de su terminal WAP. 13.3.3. 2.5G: Telefonía Móvil Multimedia (banda estrecha) La generación 2.5 ofrecía la prestación de servicios de datos a velocidades más elevadas que las ofrecidas por GSM. Se comenzó a ofertar mediante el estándar HSCSD, aunque el estándar principal de la generación es sin duda GPRS. También se incluye en esta generación el estándar EDGE, evolución de GPRS. El estándar GPRS abandona la conmutación de circuitos para la transmisión de datos y se pasa a una red de conmutación de paquetes. En este tipo de técnica no se establece un canal dedicado para cada usuario, sino que la conexión se realiza en el momento de utilización del canal. Por lo tanto, se pierde el concepto de facturación por tiempo, pasando a ser por utilización del canal de emisión. Al sistema GPRS se le conoce también como GSM-IP, ya que usa la tecnología IP (Internet Protocol) para acceder directamente a los proveedores de contenidos de Internet. Es una tecnología que permite reaprovechar el interfaz aire de la red GSM, sin necesidad de invertir en nuevas antenas. Además, la voz y los datos se multiplexan, permitiendo su recepción y envío de manera simultánea. La velocidad de conexión puede llegar a los 115 Kbps, 12 veces más que la permitida por la red GSM (9,6 Kbps). Por su parte, el estándar EDGE, realiza una serie de modificaciones para evolucionar el anterior estándar de modo que alcance una velocidad de 384 Kbps. 6-39 Sistemas y Comunicaciones 13.3.4. 3G: Telefonía Móvil Multimedia (banda ancha) La tercera generación en la telefonía móvil está marcada por el estándar internacional de la ITU denominado IMT-2000 (Internacional Mobile Telecommunication in the year 2000). En Europa el estándar desarrollado a partir de dichas especificaciones es el UMTS. UMTS se contempla como el sistema que lleve a las comunicaciones móviles hacia la Sociedad de la Información, mediante la provisión directa a los usuarios de información, imágenes, vídeos y aplicaciones, al tiempo que les proporcionará acceso a los nuevos servicios basados en la información. Utiliza la banda de los 2GHz con una multiplexación WCDMA. La tasa de transmisión digital proporcionada por UMTS varía en función de la velocidad a la que se desplace el abonado y del tipo de celda en que se encuentre ubicado: • Macroceldas: como mínimo 144 Kbps con desplazamiento de hasta 500 Km/h. • Microceldas: tasas de 384Kbps a una velocidad máxima de 120Km/h. • Picoceldas: puede llegar hasta los 2 Mbps a velocidades inferiores a los 10 Km/h. 13.3.5. 3.5G: Enlace Descendente de Alta Velocidad En la actualidad, la demanda de ancho de banda es cada día más elevada. Para dar respuesta a esta necesidad surge la tecnología HSDPA, incluida dentro de las especificaciones de UMTS, y que puede elevar la capacidad del enlace descendente hasta los 14,4 Mbps a través de un nuevo canal descendente cuyo uso puede ser compartido entre varios usuarios. 13.3.6. 3.75G Incremento de la velocidad de la banda ancha Dentro de esta generación se encuentra el estándar HSUPA, especificado en la versión 6 de la 3GPP, y que consiste en una optimización de UMTS para proporcionar velocidades de hasta 5,76 Mbps en un enlace ascendente dedicado. Más allá, se encuentra la propuesta HSOPA, también conocida como LTE, Long Term Evolution. En esta propuesta se define un nuevo interfaz aire basado en la aplicación de OFDM (Orthogonal Frequency Division Multiplexing) y antenas MIMO (Multiple Input Multiple Output) para conseguir hasta 42 Mbps en el enlace descendente. 13.3.7. 3.9G UTRAN LTE: Universal Terrestrial Radio Access Network Long Term Evolution La generación 3.9G la conforma la especificación del 3GPP conocida como UTRAN LTE (Universal Terrestrial Radio Access Network–Long Term Evolution) o también “Super 3G”. Con este sistema se pretende conseguir una cobertura a nivel mundial mediante la modificación de las redes 3G actuales para permitir picos de transmisión de hasta 100 Mbps de bajada y 50 Mbps de subida. 6-40 Sistemas de comunicación 13.3.8. 4G LTE-Long Term Evolution La principal diferencia con las generaciones predecesoras será la capacidad para proveer velocidades de acceso mayores de 100 Mbps en movimiento y 1 Gbps en reposo, manteniendo una calidad de servicio (QoS) de punta a punta de alta seguridad que permitirá ofrecer servicios de cualquier clase en cualquier momento, en cualquier lugar, con el mínimo coste posible. 6-41 Tema 7 El Modelo de Referencia de Interconexión de Sistemas Abiertos (OSI) de ISO. Protocolos TCP/IP. Sistemas y Comunicaciones Guión-resumen 1. Modelos de referencia de interconexión de sistemas abiertos (OSI) de ISO 1.1. Introducción 1.2. División de capas 1.3. Principios generales del modelo OSI y terminología 1.4. Relación del modelo OSI con el modelo TCP/IP 2. Introducción a TCP/IP 3. Capa de red 3.1. Interconexión de redes, direcciones físicas y direcciones IP 3.2. Direccionamiento IP 3.3. Clases de direcciones 3.4. Direcciones IP especiales y reservadas 3.5. Máscara de subred 3.6. Protocolo IP 3.7. Encaminamiento 3.8. Protocolo ARP 3.9. Protocolo RARP 3.10. Protocolo ICMP 3.11. IGMP 7-2 4. Capa de transporte 4.1. Puertos 4.2. Protocolo UDP 4.3. Protocolo TCP 5. IPV6 5.1. Formato de cabecera Ipv6 5.2. Características de Ipv6 5.3. Direccionamiento IPv6 6. MPLS (MultiProtocol Label Switching) 6.1. Arquitectura 6.2. Aplicaciones de MPLS El Modelo de Referencia de Interconexión de Sistemas Abiertos (OSI) de ISO 1. Modelos de referencia de interconexión de sistemas abiertos (OSI) de ISO 1.1. Introducción El modelo OSI (Open Systems Interconnection, interconexión de sistemas abiertos) fue un intento de la Organización Internacional de Normas (ISO) para la creación de un estándar que siguieran los diseñadores de nuevas redes. Fue creado en 1977 y publicado como estándar internacional en 1984. El modelo OSI está recogido en el estándar ISO/IEC 7498 y en la recomendación X.200 de la UIT (Unión Internacional de Telecomunicaciones). Se trata de un modelo teórico de referencia: únicamente explica lo que debe hacer cada componente de la red sin entrar en los detalles de implementación. El modelo divide las redes en capas. Cada una de estas capas debe tener una función bien definida y relacionarse con sus capas inmediatas mediante unos interfaces también bien definidos. Esto debe permitir la sustitución de una de las capas sin afectar al resto, siempre y cuando no se varíen los interfaces que la relacionan con sus capas superior e inferior. Los creadores del modelo OSI consideraron que era 7 el número de capas que mejor se ajustaba a sus requisitos. 7 Aplicación Aplicación 6 Presentación Presentación 5 Sesión Sesión 4 Transporte Transporte 3 Red Red Red Red 2 Enlace de datos Enlace de datos Enlace de datos Enlace de datos 1 Física Física Física Física Red 1 Host A Red 2 Router 1 Red 3 Router 2 Host B 7-3 Sistemas y Comunicaciones El gráfico anterior muestra las 7 capas del modelo OSI. Las tres primeras capas se utilizan para enrutar, esto es, mover la información de unas redes a otras. En cambio, las capas superiores son exclusivas de los nodos origen y destino. La capa física está relacionada con el medio de transmisión (cableado concreto que utiliza cada red). En el extremo opuesto se encuentra la capa de aplicación: un programa de mensajería electrónica, por ejemplo. El usuario se situaría por encima de la capa 7. El siguiente gráfico muestra el flujo de información entre capas. Datos Se envían datos 7 Aplicación 6 Presentación 5 Sesión 4 Transporte 3 Red 2 Enlace de datos 1 Física Se reciben datos C Datos C C C C C Aplicación Presentación Datos Sesión Datos Transporte Datos Red Datos Datos F Enlace de datos Bits Host A Física Host B El “host” A es el nodo origen y el “host” B, el nodo destino. Nótese que estos papeles se intercambian continuamente en cualquier comunicación. Supongamos que mediante este modelo queremos enviar un mensaje al usuario del “host” B. El mensaje son los “datos” que se han dibujado por encima de la capa 7. Estos datos van descendiendo de capa en capa hasta llegar a la capa física del “host” A. Cada capa añade un encabezado (C = cabecera) a los datos que recibe de la capa superior antes de enviárselos a su capa inferior. En la capa de enlace de datos se ha añadido también una serie de códigos al final de la secuencia (F = final) para delimitar no sólo el comienzo sino también el final de un paquete de datos. La capa física no entiende de datos ni de códigos: únicamente envía una secuencia de “bits” por el medio de transmisión (un cable). Estos “bits” llegarán, probablemente pasando por varios encaminadores intermedios, hasta la capa física del “host” destino. A medida que se van reci7-4 El Modelo de Referencia de Interconexión de Sistemas Abiertos (OSI) de ISO biendo secuencias de “bits”, se van pasando a las capas superiores. Cada capa elimina su encabezado antes de pasarlo a una capa superior. Obsérvese que el mensaje que envía cada capa del “host” A a su capa inferior es idéntico al que recibe la capa equivalente del “host” B desde una capa inferior. Finalmente los datos llegarán a la capa de aplicación, serán interpretados y mostrados al usuario del “host” B. 1.2. División de capas Cada capa se comunica con la capa equivalente de otro “host” (por ejemplo, la capa de red de un “host” se entiende con la capa de red de otro “host”). Sin embargo, como hemos visto, la comunicación realmente se realiza descendiendo capas en el ““host”” origen, transmitiendo por el medio físico y aumentando capas en el “host” destino. Cada capa añade algo nuevo a la comunicación, como vamos a ver ahora: — (1) Capa física. Se encarga de la transmisión de “bits” por un medio de transmisión, ya sea un medio guiado (un cable) o un medio no guiado (inalámbrico). Esta capa define, entre otros aspectos, el aspecto físico de los conectores (características mecánicas), la función de cada cable o circuito (características funcionales), el voltaje que representa un 1 y el que representa un 0 (características eléctricas) y la secuencia de activación de señales en el cable (características de procedimiento). La capa física será diferente dependiendo del medio de transmisión (cable de fibra óptica, cable par trenzado, enlace vía satélite, etc.) No interpreta la información que está enviando: sólo transmite ceros y unos. — (2) Capa de enlace de datos. Envía tramas de datos entre “hosts” (o routers) de una misma red. Delimita las secuencias de “bits” que envía a la capa física, escribiendo ciertos códigos al comienzo y al final de cada trama. Esta capa fue diseñada originalmente para enlaces punto a punto, en los cuales hay que aplicar un control de flujo para el envío continuo de grandes cantidades de información. Para las redes de difusión (redes en las que muchos ordenadores comparten un mismo medio de transmisión) fue necesario diseñar la llamada subcapa de acceso al medio. Esta subcapa determina quién puede acceder al medio en cada momento y cómo sabe cada “host” que un mensaje es para él, por citar dos problemas que se resuelven a este nivel. Según lo anterior, la capa de enlace se puede dividir en dos subcapas: • (2.1) Subcapa de acceso al medio (MAC). Esta subcapa incluye los protocolos de redes locales, como Ethernet (802.3) y Wi-Fi (802.11). • (2.2) Subcapa de control de enlace lógico (LLC). La subcapa LLC abarca los protocolos utilizados en redes de área extensa como HDLC, LAPB, LAPF y PPP. LLC puede proporcionar 3 tipos de servicios: • Servicio sin conexión y sin confirmación. Es el que se utiliza en redes locales de difusión. No aporta nada nuevo a la comunicación. Serán las capas superiores las que ofrezcan los controles de flujo y errores (en concreto, la capa de transporte). 7-5 Sistemas y Comunicaciones • Servicio con conexión y con confirmación o también llamado, servicio orientado a la conexión. Requiere establecer una conexión antes de transmitir datos y cerrarla después. Se utilizan mensajes de confirmación (ACK, acknowledge) para garantizar que los mensajes llegan correctos al destino. • Servicio sin conexión y con confirmación. No precisa establecer una conexión previa. Los datos se envían sin más y son confirmados por el otro extremo de la comunicación. • Utilización de la técnica de “piggybacking”, envío de acuses de recibo dentro de tramas de datos. — (3) Capa de red. Se encarga del encaminamiento de paquetes entre el origen y el destino, atravesando tantas redes intermedias como sean necesarias. Los mensajes se fragmentan en paquetes y cada uno de ellos se envía de forma independiente. Su misión es unificar redes heterogéneas: todos los “host” tendrán un identificador similar a nivel de la capa de red (en Internet son las direcciones IP) independientemente de las redes que tengan en capas inferiores (Token Ring con cable coaxial, Ethernet con cable de fibra óptica, enlace submarino, enlace por ondas, etc.) — (4) Capa de transporte. Únicamente se preocupa de la transmisión origen-destino. Podemos ver esta capa como una canalización fiable que une un proceso de un “host” con otro proceso de otro “host”. Un “host” puede tener varios procesos ejecutándose: uno para mensajería y otro para transferir archivos, por ejemplo. No se preocupa del camino intermedio que siguen los fragmentos de los mensajes. Integra control de flujo y control de errores, de forma que los datos lleguen correctamente de un extremo a otro. — (5) Capa de sesión. Se encarga de iniciar y finalizar las comunicaciones. Además proporciona servicios mejorados a la capa de transporte como, por ejemplo, la creación de puntos de sincronismo para recuperar transferencias largas fallidas. — (6) Capa de presentación. Codifica los datos que recibe de la capa de aplicación a un sistema convenido entre emisor y receptor, con el propósito de que tanto textos como números sean interpretados correctamente. Una posibilidad es codificar los textos según la tabla ASCII y los números en complemento a dos. — (7) Capa de aplicación. Aquí se encuentran los protocolos y programas que utiliza el usuario para sus comunicaciones en red, como correo electrónico o transferencia de archivos. El modelo OSI, patrocinado por la Comunidad Europea y, más tarde, por el gobierno de los Estados Unidos, nunca llegó a tener la implantación esperada. Entre otros motivos, porque el modelo TCP/IP ya había sido aceptado por aquella época entre investigadores los cuales se resistieron a un cambio que, para la mayoría, era un cambio a peor. Las bases que sustentan Internet son realmente sencillas y quizás esto ha sido la clave de su éxito; el modelo OSI, en cambio, fue tan ambicioso y complejo que terminó arrinconado en las estanterías de los laboratorios. 7-6 El Modelo de Referencia de Interconexión de Sistemas Abiertos (OSI) de ISO Sin embargo, la idea de la división por capas del modelo OSI es realmente valiosa. Esta misma idea se aplica a todas las redes actuales, incluyendo Internet. Las divisiones en capas se rigen por las siguientes premisas: 1.3. — Cada capa realiza tareas únicas y diferentes del resto de las capas. Sólo se debe crear una capa nueva cuando exista un nivel de abstracción suficiente. De esta forma el sistema deja de ser un todo complejo para consistir en un conjunto de capas abordables independientemente. — Cada capa tiene interfaces definidas para comunicarse con las capas anterior y siguiente. Una capa se comporta como una caja negra para el resto de las capas, esto es, conocen los servicios que ofrece y cómo deben solicitárselos (interfaces) pero no cómo los realiza internamente (implementación). — Cada capa utiliza los servicios de su capa inferior y ofrece servicios a su capa superior. — La implementación de una capa se puede variar siempre que no se modifiquen sus interfaces y servicios ofrecidos. Esto permite la sustitución de una de las capas sin necesidad de modificar las demás. Principios generales del modelo OSI y terminología En este apartado repasamos los principios generales que rigen el modelo OSI e introducimos nueva terminología que debemos conocer. Los “hosts” (ordenadores y otros dispositivos) que intervienen en una comunicación se conocen como sistemas. Recordemos que el modelo OSI propone una comunicación entre “sistemas abiertos”. Cada sistema se divide en subsistemas, también llamados niveles o capas. El número de niveles definidos en OSI son 7, como hemos estudiado anteriormente. Esta división tiene como principal objetivo aportar un diseño modular, de forma que se pueda reemplazar una capa sin afectar a las demás. Los subsistemas adyacentes se comunican a través de su interfaz. Es decir, el subsistema N (por ejemplo, la capa de red de un ordenador) se comunica a través de sendas interfaces con los subsistemas N+1 (capa de transporte en este caso) y N-1 (capa de enlace). Los subsistemas inferiores proporcionan servicios a los inmediatamente superiores. Por ejemplo, la capa física (subsistema inferior) proporciona el servicio de transmitir los “bits” a través de un medio de transmisión a la capa de enlace (subsistema superior). Otro ejemplo: la capa de enlace proporciona el servicio de comunicación entre dos estaciones de la misma red a la capa de red. La capa de red no conoce la tecnología subyacente (enlace inalámbrico, conexión punto a punto, red Ethernet...) por lo que recurrirá a los servicios proporcionados por la capa de enlace. Un subsistema puede estar constituido por una o varias entidades (unidades funcionales) independientes. La comunicación entre entidades homó7-7 Sistemas y Comunicaciones logas (entidades equivalentes en distintos sistemas) se realiza mediante un protocolo. Se utilizará, por ejemplo, el protocolo IP para comunicar la capa de red de un ordenador (más precisamente, una entidad dentro de ese subsistema) con la capa de red de otro. O el protocolo HTTP para comunicar las capas de aplicación de dos ordenadores. Recordemos que, aunque cada capa dialoga con su capa homóloga utilizando un protocolo, en realidad la comunicación se realiza descendiendo capas en un extremo y subiendo capas en el otro. El modelo OSI utiliza el concepto de PDU (Protocol Data Unit, unidad de dato de protocolo) para referirse a una secuencia de “bits” formada por una cabecera y datos, que genera el origen, según un protocolo, para enviárselo al destino. A las PDUs nos hemos referido anteriormente como paquetes de datos. Cada protocolo tiene un formato de PDU diferente. Por ejemplo, una PDU de la capa de red deberá indicar en su cabecera cuál es la dirección de red del origen y la dirección del destino, entre otra información. En el campo de datos viaja la información propiamente dicha. Observemos que a nivel de enlace, existe además de la cabecera y los datos, una cola (o final) a continuación de los datos. Resumimos, a continuación, el proceso seguido para enviar y recibir datos en el modelo OSI: — Envío de datos. Una entidad de nivel superior encapsula la información a transmitir y se la pasa a su entidad inferior. Por “encapsulamiento” se entiende la adición de una nueva cabecera a la información, esto es, almacenar la información en el campo de datos de una nueva PDU. Antes del encapsulamiento, en ocasiones, es necesario fragmentar la información en varias PDUs. Se realizarán encapsulaciones sucesivas hasta llegar al nivel 1, el cual transmitirá los datos por el medio físico. — Recepción de datos. Cada entidad desencapsula la información (elimina la cabecera, extrae los datos) y se la pasa a su entidad superior. Así se continúa hasta llegar a la entidad homóloga de la que generó los datos. En el modelo OSI se utilizan primitivas para solicitar un servicio a un nivel inferior y obtener la respuesta. Las primitivas pueden verse en el modelo OSI como las funciones en programación. En cada primitiva se incluye el nombre del servicio que se está invocando y puede que también parámetros adicionales. Se definen 4. Supongamos que la entidad N del sistema A quiere comunicarse con su entidad homóloga en otro sistema B: 7-8 — Request (petición). La entidad N de A solicita un servicio a su entidad N-1. — Indication (indicación). La entidad N-1 de B envía una indicación a la entidad N de B para informar de que se ha solicitado una comunicación desde el otro extremo. — Response (respuesta). La entidad N de B devuelve la respuesta a su entidad N-1. — Confirm (confirmación). Finalmente, se completa la solicitud en el sistema A. Su entidad N-1 envía mensaje de confirmación a su entidad N, la cual realizó la petición original. El Modelo de Referencia de Interconexión de Sistemas Abiertos (OSI) de ISO El modelo OSI utiliza distintos nombres de PDUs en función de los niveles. Ya adelantamos que estos nombres no coinciden exactamente con los utilizados en el modelo TCP/IP, según veremos más adelante en este tema. Indicamos los principales nombres de PDUs: 1.4. — Nivel de transporte: Mensaje. — Nivel de red: Paquete. — Nivel de enlace: Trama. — Nivel físico: se transmite una secuencia de “bits”. Relación del modelo OSI con el modelo TCP/IP Como hemos comentado al principio, OSI es un modelo teórico general que da preferencia a un buen diseño en papel, antes que a la implementación de los protocolos. El modelo TCP/IP se hizo justamente al revés: primero vinieron los protocolos y después se pensó en sus especificaciones. Por este motivo, el modelo TCP/IP únicamente es aplicable para la pila de protocolos TCP/IP pero no es válido para nuevas redes. El modelo TCP/IP tiene únicamente 3 capas: capa de red, de transporte y de aplicación. No tiene las capas de sesión ni de presentación que, por otro lado, estaban prácticamente vacías en el modelo OSI. Tampoco dice nada de las capas física y de enlace a datos. En la práctica, el modelo que se utiliza es un modelo de 5 capas: las capas física y de enlace de datos, que son necesarias en una red, sumadas a las 3 capas del modelo TCP/IP. 2. Introducción a TCP/IP TCP/IP es el resultado de la investigación a finales de los años 60 para la creación de una familia de protocolos que permitiera la interconexión de redes, con independencia de la plataforma, sistema operativo y tipo de red. Esto que actualmente nos parece algo sencillo, en aquella época era un problema realmente complejo debido a la diversidad de protocolos y esquemas de red distintos. El proyecto fue iniciado por DARPA (Agencia de proyectos de investigación avanzados de defensa) perteneciente al Departamento de Defensa de los Estados Unidos (DoD). La idea era que los distintos centros de defensa no quedasen incomunicados en caso de un ataque: TCP/IP es capaz de seguir rutas alternativas en caso de que alguna se interrumpa. No existe una autoridad central que sea necesaria para mantener los paquetes en circulación. En 1978, DARPA diseñó la pila de protocolos TCP/IP, según los conocemos en la actualidad. En el año 1980, DARPA comenzó a implementar en su propia red, llamada Arpanet, los nuevos protocolos TCP/IP. Esta red se puede considerar la primera implementación de Internet. En el año 1983 se terminó la conversión y todas las máquinas quedaron funcionando con TCP/IP. La red se dividió en dos: Milnet para fines militares y Arpanet para investigación. 7-9 Sistemas y Comunicaciones El hecho que determinó probablemente la difusión de TCP/IP fue su inclusión en el sistema operativo Unix. La primera versión de Unix que incluyó TCP/IP fue en el año 1983, BSD 4.2 de la Universidad de California en Berkeley. Las siguientes versiones de BSD fueron la 4.3 en 1986 y la 4.4 en 1993. A medida que TCP/IP se extendía, se fueron interconectando nuevas redes a Arpanet, dando origen a lo que actualmente conocemos como Internet. Como hemos visto, la historia de Internet está estrechamente ligada a la de TCP/IP. Al fin y al cabo, Internet no es otra cosa que la mayor red pública de redes TCP/IP. Unas redes se han ido conectando con otras hasta formar actualmente una verdadera telaraña mundial. Lo que hace factible la comunicación de las diversas redes entre sí es la utilización de un protocolo o lenguaje de comunicaciones común: TCP/IP. Aunque en ocasiones digamos que TCP/IP es un protocolo es, en realidad, una familia compuesta por un gran número de protocolos. Los más importantes los resumimos a continuación: — Capa de red: IP, ICMP, ARP, RARP. — Capa de transporte: TCP, UDP. — Cada de aplicación: HTTP, SMTP, FTP, TELNET, DNS, NNTP, SNMP. Las especificaciones de los protocolos de Internet se encuentran definidas en unos documentos técnicos denominados RFCs (Request For Comments, peticiones de comentarios). Estos documentos están numerados según se han ido editando y se pueden consultar libremente en Internet. Tienen consideración de estándares “de facto” (de hecho) puesto que no han sido aprobados por ningún organismo de normalización. De la edición y publicación de los RFCs se encarga el IAB (Internet Architecture Board). Este grupo supervisa el desarrollo técnico de los RFCs realizado por los grupos de trabajo que constituyen el IETF (Internet Engineering Task Force). Estos grupos de trabajo están clasificados en las siguientes áreas funcionales: aplicaciones, general, Internet, operaciones y gestión, “routing”, seguridad, sub-IP y, por último, transporte. 3. Capa de red 3.1. Interconexión de redes, direcciones físicas y direcciones IP Cada “host” (ordenador) conectado a una red TCP/IP tiene dos direcciones: • 7-10 Una dirección física (MAC) que viene determinada por su adaptador de red. Estas direcciones se corresponden con la capa de acceso al medio y se utilizan para comunicar dos ordenadores que pertenecen a la misma red. Constan de 6 “bytes”: los 3 primeros identifican al fabricante y los 3 últimos a un número de pieza asignado por el fabricante, de tal forma que no existan dos tarjetas de red con la misma dirección física. El Modelo de Referencia de Interconexión de Sistemas Abiertos (OSI) de ISO • Una dirección IP para identificar globalmente a un ordenador dentro de un conjunto de redes TCP/IP. Este número pertenece a la capa de red. Observando otra dirección IP e interpretándola según la máscara de subred sabremos si pertenece a nuestra propia red o a una distinta. Todas las direcciones IP de la misma red comienzan con los mismos números, según veremos más adelante. El concepto de red está relacionado con las direcciones IP que se configuren en cada ordenador, no con el cableado. Es decir, si tenemos varias redes dentro del mismo cableado solamente los ordenadores que permanezcan a una misma red podrán comunicarse entre sí. Para que los ordenadores de una red puedan comunicarse con los de otra red es necesario que existan routers que interconecten las redes. Un router o encaminador no es más que un ordenador con varias direcciones IP, una para cada red, que permite el tráfico de paquetes entre sus redes. La capa de red se encarga de fragmentar cada mensaje en paquetes de datos llamados datagramas IP y de enviarlos de forma independiente a través de la red de redes. Cada datagrama IP incluye un campo con la dirección IP de destino. Esta información se utiliza para enrutar los datagramas a través de las redes necesarias que los hagan llegar hasta su destino. Para conocer de forma precisa si un “host” pertenece a la misma red que otro se utiliza el concepto de máscara de subred, que veremos más adelante. 3.2. Direccionamiento IP Una dirección IP tiene dos funciones principales: — Identificador. La dirección IP es el identificador de cada “host” dentro de su red de redes. Cada “host” conectado a una red tiene una dirección IP asignada, la cual debe ser distinta a todas las demás direcciones que estén vigentes en ese momento en el conjunto de redes visibles por el “host”. En el caso de Internet, no puede haber dos ordenadores con 2 direcciones IP (públicas) iguales. Pero sí podríamos tener dos ordenadores con la misma dirección IP siempre y cuando pertenezcan a redes independientes entre sí (sin ningún camino posible que las comunique). — Localizador. Conociendo la dirección IP de un “host”, es posible localizarlo geográficamente. Esto es así porque la dirección IP que toma un “host” es dependiente de la red a la que se conecte. La excepción a esta norma es la tecnología conocida como Mobile IP (IP móvil), cuyo objetivo es mantener una misma IP válida para todas las redes. Las direcciones IP se clasifican en: — Direcciones IP públicas. Son visibles en todo Internet. Un ordenador con una IP pública es accesible (visible) desde cualquier otro ordenador conectado a Internet. Para conectarse a Internet es necesario tener una dirección IP pública. 7-11 Sistemas y Comunicaciones — Direcciones IP privadas. Son visibles únicamente por otros “hosts” de su propia red o de otras redes privadas interconectadas por routers. Se utilizan en las empresas para los puestos de trabajo. Los ordenadores con direcciones IP privadas pueden salir a Internet por medio de un router, utilizando su dirección IP pública. Sin embargo, desde Internet no se puede acceder a ordenadores con direcciones IP privadas, salvo que así se configure en el router. Existen unos rangos de direcciones IP reservados para uso privado que se pueden utilizar libremente. Debido a que las direcciones IP privadas no pueden figurar como origen ni como destino de ningún datagrama IP que viaje por Internet, se requieren mecanismos de traducción entre direcciones IP privadas y públicas. La tecnología que lo permite es NAT (Network Address Translation) o NAPT (Network Address Port Translation). Los routers que tienen una interfaz pública y otra privada utilizan NAT. Este es el caso, por ejemplo, de los routers ADSL que instalan las operadoras. Su función básica es permitir que un conjunto de usuarios conectados con direcciones IP privadas tengan acceso a Internet a través de una única IP pública (NAT dinámico). También es posible configurar NAT para permitir que desde Internet se acceda a un determinado servidor situado en la red privada, a través de la IP pública del “router” (NAT estático). A su vez, las direcciones IP pueden ser: — Direcciones IP estáticas (fijas). Un “host” que se conecte a la red con dirección IP estática siempre lo hará con una misma IP. Las direcciones IP públicas estáticas son las que utilizan los servidores de Internet con objeto de que estén siempre localizables por los usuarios de Internet. Las direcciones IP públicas estáticas hay que contratarlas. — Direcciones IP dinámicas. Un “host” que se conecte a la red mediante dirección IP dinámica, cada vez lo hará con una dirección IP distinta. Las direcciones IP públicas dinámicas son las que se utilizan en las conexiones a Internet mediante un módem. Los proveedores de Internet utilizan direcciones IP dinámicas debido a que tienen más clientes que direcciones IP (es muy improbable que todos se conecten a la vez). En ocasiones también se utilizan dentro de oficinas (IP privadas dinámicas), de tal forma que cuando arranca un puesto de trabajo recibe una IP dentro de un rango especificado. Una máquina, conocida como servidor DHCP, es la encargada de asignar las direcciones IP dinámicas a los “hosts” que la soliciten. El direccionamiento IP está gestionado por distintos organismos. Originalmente IANA (Internet Assigned Numers Authority, Autoridad de asignación de números de Internet, www.iana.org) era el organismo responsable de todo el conjunto de direcciones. Sin embargo, en la actualidad, el ICANN (Internet Corporation for Assigned Names and Numbers, www.icann.org) ha asumido sus tareas. El 15 de diciembre de 2002 la estructura del ICANN fue reformada, adoptando tres organizaciones de soporte (Supporting Organizations, SO): ASO (Address Supporting Organization, www.aso.icann.org), ccNSO (Country-Code Names Supporting Organization) y GNSO (Generic Names Supporting Organization, gnso.icann.org). La misión de ASO consiste 7-12 El Modelo de Referencia de Interconexión de Sistemas Abiertos (OSI) de ISO en supervisar y desarrollar recomendaciones sobre políticas de direccionamiento IP. En la actualidad, la asignación de direcciones IP ha sido delegada en distintos registros regionales (Regional Internet Registry's, RIR): — APNIC (Asia Pacific Network Information Centre, www.apnic.net): Asia y el Pacífico. — ARIN (American Registry for Internet Numbers, www.arin.net): Estados Unidos, Canadá y el África Sud-Sáhara. — LACNIC (Regional Latin-American and Caribbean IP Address Registry, www.lacnic.net): Latinoamérica y Caribe. — RIPE (Réseaux IP Européens, www.ripe.net): Europa y parte de África. — AfriNIC (African Regional Internet Registry, www.afrinic.org). Se encarga del registro de las direcciones de África. Las direcciones IP que ofrecen los ISP (proveedores de servicios de Internet) a sus clientes las obtienen de registros locales (LIR, Local Internet Registry), registros nacionales (NIR, National Internet Registry) o bien del correspondiente registro regional (RIR). 3.3. Clases de direcciones Las direcciones IP están formadas por 4 “bytes” (32 bits). Se suelen representar de la forma a.b.c.d donde cada una de estas letras es un número comprendido entre el 0 y el 255. Por ejemplo la dirección IP del servidor de IBM (www.ibm.com) es 129.42.18.99. Las direcciones IP también se pueden representar en hexadecimal, desde la 00.00.00.00 hasta la FF.FF.FF.FF o en binario, desde la 00000000.00000000.00000000.00000000 hasta la 11111111.11111111.11111111.11111111. Las tres direcciones siguientes se refieren a la misma máquina: (decimal) 128.10.2.30 (hexadecimal) 80.0A.02.1E (binario) 10000000.00001010.00000010.00011110 ¿Cuántas direcciones IP existen? Si calculamos 2 elevado a 32 obtenemos más de 4000 millones de direcciones distintas. Sin embargo, no todas las direcciones son válidas para asignarlas a “hosts”. Las direcciones IP no se encuentran aisladas en Internet, sino que pertenecen siempre a alguna red. Todas las máquinas conectadas a una misma red se caracterizan en que los primeros “bits” de sus direcciones son iguales. De esta forma, las direcciones se dividen conceptualmente en dos partes: el identificador de red (netid) y el identificador de “host” (hostid). 7-13 Sistemas y Comunicaciones Dependiendo del número de “hosts” que se necesiten para cada red, las direcciones de Internet se han dividido en las clases primarias A, B y C. La clase D está formada por direcciones de multidifusión, que identifican no a un “host” sino a un grupo de ellos. Las direcciones de clase E no se utilizan (están reservadas). Las direcciones usadas en Internet están definidas en la RFC 1166. 8 16 24 31 Clase A 0 Clase B 1 0 Clase C 1 1 0 Clase D 1 1 1 0 grupo de multicast (multidifusión) Clase E 1 1 1 1 (direcciones reservadas: no se pueden utilizar) red (7 bits) host red (14 bits) host red (21 bits) host Clase Formato (r=red, h=host) Número de redes A r.h.h.h 128 16.777.214 0.0.0.0 - 127.0.0.0 255.0.0.0 B r.r.h.h 16.384 65.534 128.0.0.0 - 191.255.0.0 255.255.0.0 C r.r.r.h 2.097.152 254 192.0.0.0 - 223.255.255.0 255.255.255.0 D grupo - - 224.0.0.0 - 239.255.255.255 - E no válidas - - 240.0.0.0 - 255.255.255.255 - Número de hosts por red Rango de direcciones redes Máscara de subred El término difusión (broadcast) se refiere a todos los “hosts” de una red; multidifusión (multicast) se refiere a varios “hosts” (aquellos que se hayan suscrito dentro de un mismo grupo). Siguiendo esta misma terminología, en ocasiones se utiliza el término unidifusión para referirse a un único “host”. Aspectos a tener en cuenta: — 7-14 Número de redes de clase A. Aunque en la tabla hayamos indicado 128 redes (basándonos en la RFC 1166), debemos indicar, a efectos de resolución de exámenes, que la respuesta correcta sería 126. Esto es así porque la red 0 y la red 127 están reservadas. El significado de estas dos redes se explica más adelante. El Modelo de Referencia de Interconexión de Sistemas Abiertos (OSI) de ISO — Para el cálculo del número de “hosts” por red se han eliminado la primera y última dirección de cada una. Como veremos más adelante, la primera dirección de cualquier red es la dirección de red y la última, su dirección de difusión. — Las únicas direcciones asignables a “hosts” son las de las clases A, B y C. Por ejemplo, si en una pregunta de examen nos ofrecen varias direcciones y debemos elegir una válida (para asignársela a un “host”), descartaremos todas aquellas cuyo primer “byte” sea 224 o superior. — Dada una dirección IP, debemos saber ubicarla en la clase a la que pertenece. Para ello es suficiente con buscar el primer “byte” de la dirección IP en la tabla anterior. Por ejemplo, la dirección 200.7.33.1, es de clase C porque 200 está comprendido entre 192 y 223. — Según la tabla anterior, las direcciones 192.168.1.1 y 192.168.2.33 pertenecen a redes distintas (son de clase C por lo que los tres primeros “bytes” determinan la red), pero las direcciones 10.168.1.1 y 10.168.2.33 son de la misma clase (clase A, sólo el primer “byte” indica la red). 3.4. Direcciones IP especiales y reservadas No todas las direcciones comprendidas entre la 0.0.0.0 y la 223.255.255.255 son válidas para un “host”: algunas de ellas tienen significados especiales. Las principales direcciones especiales se resumen en la siguiente tabla. Su interpretación depende del “host” desde el que se utilicen. BITS DE RED BITS DE HOST SIGNIFICADO EJEMPLO Mi propio host 0.0.0.0 host Host indicado dentro de mi red 0.0.0.10 todos 0 Red indicada 192.168.1.0 Difusión a mi red 255.255.255.255 todos 0 todos 0 red todos 1 red todos 1 Difusión a la red indicada 192.168.1.255 127 cualquier valor válido de host Loopback (mi propio host) 127.0.0.1 Aspectos a tener en cuenta: — Difusión o broadcasting es el envío de un mensaje a todos los ordenadores que se encuentran en una red. — La dirección de loopback (normalmente 127.0.0.1) se utiliza para fines de diagnóstico. Permite comprobar que los protocolos TCP/IP están correctamente instalados en nuestro propio ordenador. 7-15 Sistemas y Comunicaciones — Obsérvese que la tabla anterior es la explicación de por qué las redes 0 y 127 no pueden contener “hosts”. — También nos muestra que hay 2 direcciones IP en cada red que no se pueden asignar a un “host” (la primera y la última). — La dirección 255.255.255.255 se conoce como dirección de difusión limitada (sólo a la red en la que estamos). — Las direcciones del tipo “difusión a la red indicada” se conocen como direcciones de difusión dirigida. — Los ordenadores que no tienen una dirección IP estática bien porque no dispongan de disco duro donde guardarla o bien, porque han sido configurados de esta manera, deben solicitarla mediante los protocolos BOOTP o DHCP cuando arrancan. En este momento se envía un mensaje a la dirección 255.255.255.255 (para que le llegue al servidor de arranque que le proporcionará los datos de inicialización) indicando como origen la IP 0.0.0.0. Las direcciones de redes siguientes se encuentran reservadas para su uso en redes privadas (intranets). Una dirección IP que pertenezca a una de estas redes se dice que es una dirección IP privada. CLASE RANGO DE DIRECCIONES RESERVADAS DE REDES A 10.0.0.0 B 172.16.0.0 - 172.31.0.0 C 192.168.0.0 - 192.168.255.0 Por ejemplo, si estamos construyendo una red privada con un número de ordenadores no superior a 254 podemos utilizar una red reservada de clase C. Al primer ordenador le podemos asignar la dirección 192.168.23.1, al segundo 192.168.23.2 y así sucesivamente hasta la 192.168.23.254. Como estamos utilizando direcciones reservadas, tenemos la garantía de que no habrá ninguna máquina conectada directamente a Internet con alguna de nuestras direcciones. De esta manera, no se producirán conflictos y desde cualquiera de nuestros ordenadores podremos acceder a la totalidad de los servidores de Internet. 3.5. Máscara de subred Cada dirección IP tiene asociada una máscara de subred para indicar los “bits” de la IP que corresponden a la red y los que corresponden al “host”. Permite conocer si otra dirección IP pertenece a nuestra subred o no. Recordemos que el mecanismo de envío es distinto en cada uno de los dos casos: 7-16 El Modelo de Referencia de Interconexión de Sistemas Abiertos (OSI) de ISO — Si el destino es una IP de la misma red: entrega directa. — Si el destino es una IP de otra red: el mensaje hay que enviarlo a un router conectado a nuestra red (en ocasiones conocido como puerta de enlace, puerta de salida o “gateway”) para que lo encamine hacia la red apropiada. Este router pasará el mensaje al siguiente de la cadena y así sucesivamente hasta que se alcance la red del “host” destino y se complete la entrega del mensaje. Cada dirección IP tiene una máscara asociada según la clase a la que corresponda, aunque podría modificarse si se desea dividir una red en subredes: CLASE MÁSCARA DE SUBRED Nº DE BITS A 1 A 255.0.0.0 8 B 255.255.0.0 16 C 255.255.255.0 24 Si expresamos la máscara de subred de clase A en notación binaria, tenemos: 11111111.00000000.00000000.00000000 Los unos indican los “bits” de la dirección correspondientes a la red y los ceros, los correspondientes al “host”. Según la máscara anterior, el primer byte (8 bits) es la red y los tres siguientes (24 bits), el “host”. Por ejemplo, la dirección de clase A 35.120.73.5 pertenece a la red 35.0.0.0. Supongamos una subred con máscara 255.255.0.0, en la que tenemos un ordenador con dirección 148.120.33.110. Si expresamos esta dirección y la de la máscara de subred en binario, tenemos: 148.120.33.110 10010100.01111000.00100001.01101110 (IP) 255.255.0.0 11111111.11111111.00000000.00000000 (Máscara) ----------------------------------- 148.120.0.0 10010100.01111000.00000000.00000000 (Subred) <------RED------> <------“HOST”-----> Al hacer el producto binario de las dos primeras direcciones (donde hay dos 1 en las mismas posiciones ponemos un 1 y en caso contrario, un 0) obtenemos la tercera. Si hacemos lo mismo con otro ordenador, por ejemplo el 148.120.33.89, obtenemos la misma dirección de subred. Esto significa que ambas máquinas se encuentran en la misma subred (la subred 148.120.0.0). 7-17 Sistemas y Comunicaciones 148.120.33.89 10010100.01111000.00100001.01011001 (IP) 255.255.0.0 11111111.11111111.00000000.00000000 (Máscara) ----------------------------------- 148.120.0.0 10010100.01111000.00000000.00000000 (Subred) En cambio, si tomamos la 148.115.89.3, observamos que no pertenece a la misma subred que las anteriores. 148.115.89.3 10010100.01110011.01011001.00000011 (IP) 2155.255.0.0 11111111.11111111.00000000.00000000 (Máscara) ----------------------------------- 148.115.0.0 10010100.01110011.00000000.00000000 (Subred) Ya hemos visto que el producto lógico binario (AND) de una IP y su máscara devuelve su dirección de red. Para calcular su dirección de difusión, hay que hacer la suma lógica en binario (OR) de la IP con el inverso (NOT) de su máscara. En una red de redes TCP/IP no puede haber “hosts” aislados: todos pertenecen a alguna red y todos tienen una dirección IP y una máscara de subred (si no se especifica se toma la máscara que corresponda a su clase). La máscara se suele indicar a continuación de la dirección IP separada con una barra (por ejemplo: 10.7.3.1 / 255.0.0.0), aunque también se puede indicar el número de “bits” que están a 1 (por ejemplo: 10.7.3.1 / 8). En ambos casos se da la misma información ya que no se utilizan máscaras que no tengan todos los unos al principio y los ceros al final. Las máscaras 255.0.0.0 (clase A), 255.255.0.0 (clase B) y 255.255.255.0 (clase C) suelen ser suficientes para la mayoría de las redes privadas. Sin embargo, las redes más pequeñas que podemos formar con estas máscaras son de 254 “hosts” y para el caso de direcciones públicas, su contratación tiene un coste muy alto. Por esta razón suele ser habitual dividir las redes públicas de clase C en subredes más pequeñas. A continuación se muestran las posibles divisiones de una red de clase C. La división de una red en subredes se conoce como subnetting. 7-18 El Modelo de Referencia de Interconexión de Sistemas Abiertos (OSI) de ISO Nº BITS A 1 MÁSCARA DE SUBRED NÚMERO BINARIO NÚMERO DE DE HOST SUBREDES POR SUBRED Ejemplos de subredes (x=a•b•cpor ejemplo, 192.168.1) 24 255.255.255.0 00000000 1 254 x.0 25 255.255.255.128 10000000 2 126 x.0, x.128 26 255.255.255.192 11000000 4 62 x.0, x.64, x.128, x.192 27 255.255.255.224 11100000 8 30 x.0, x.32, x.64, x.96, x.128, ... 28 255.255.255.240 11110000 16 14 x.0, x.16, x.32, x.48, x.64, ... 29 255.255.255.248 11111000 32 6 x.0, x.8, x.16, x.24, x.32, x.40, ... 30 255.255.255.252 11111100 64 2 x.0, x.4, x.8, x.12, x.16, x.20, ... 31 255.255.255.254 11111110 128 0 ninguna posible 32 255.255.255.255 11111111 256 0 ninguna posible Ejemplo: 1. La red 194.143.17.8 con máscara 255.255.255.248 admite 6 “hosts”: desde el 194.143.17.9 hasta el 194.143.17.14. Se excluyen las direcciones primera (194.143.17.8) y última (194.143.17.15) por encontrarse reservadas en todas las redes. 2. ¿Cuántos “hosts” admite la red 140.12.1.64/27? Con este formato de máscara se indica que la máscara tiene 27 unos, por lo tanto quedan 32 – 27 = 5 ceros. Completando la siguiente fórmula, obtenemos el número de “hosts”: 2(nº de ceros de la máscara) – 2 = 25 – 2 = 30 “hosts”. 3. Para crear un enlace punto a punto entre 2 “routers”, sólo se necesitan 2 direcciones IP, una para cada extremo. En esta situación, la máscara apropiada es 255.255.255.252. Ejemplo: podríamos dar la IP 180.100.1.9 para el router de Alicante y la IP 180.100.1.10 para el de Madrid. Las dos direcciones IP pertenecen a la red 180.100.1.8/30. Su dirección de difusión es 180.100.1.11. 4. ¿Qué máscara utilizaremos para dividir la red 200.3.1.0/24 en 4 subredes? La máscara sería 255.255.255.192 y las redes: 200.3.1.0, 200.3.1.64, 200.3.1.128 y 200.3.1.192. 5. Si necesitamos crear una red para un máximo de 10 “hosts”, ¿qué máscara deberemos elegir utilizando criterios de economía de IPs? Según la tabla anterior, la máscara 255.255.255.248 sólo admite redes de 6 “hosts”, por lo que no es lo suficientemente grande. Tomaremos entonces la siguiente, 255.255.255.240, que da cabida a 14 “hosts”. Las máscaras con “bytes” distintos a 0 ó 255 también se pueden utilizar para particionar redes de clase A o de clase B, sin embargo no suele ser lo más habitual. Por ejemplo, la máscara 255.255.192.0 dividiría una red de clase B en 4 subredes de 16382 “hosts” (2 elevado a 14, menos 2) cada una. 7-19 Sistemas y Comunicaciones A continuación se indican las tablas de “subnetting” para redes de clase A y de clase B. Nº BITS MÁSCARA DE 2º BYTE EN NÚMERO DE SUBREDES NÚMERO DE HOST Ejemplos de subredes (x=a por ejemplo, 27) SUBRED BINARIO 8 255.0.0.0 0000 0000 1 16.777.214 x.0.0.0 9 255.128.0.0 1000 0000 2 8.388.606 x.0.0.0, x.128.0.0 10 255.192.0.0 1100 0000 4 4.194.302 x.0.0.0, x.64.0.0, x.128.0.0, 11 255.224.0.0 1110 0000 8 2.097.150 x.0.0.0, x.32.0.0, x.64.0.0, ... 12 255.240.0.0 1111 0000 16 1.048.574 x.0.0.0, x.16.0.0, x.32.0.0, ... 13 255.248.0.0 1111 1000 32 524.286 x.0.0.0, x.8.0.0, x.16.0.0, ... 14 255.252.0.0 1111 1100 64 262.142 x.0.0.0, x.4.0.0, x.8.0.0, ... 15 255.254.0.0 1111 1110 128 131.070 x.0.0.0, x.2.0.0, x.4.0.0, ... MÁSCARA 3º A 1 Nº BITS DE BYTE EN DE CLASE NÚMERO A DE SUBREDES POR SUBRED NÚMERO DE HOST Ejemplos de subredes (x=a•b por ejemplo, 130.2) SUBRED BINARIO 16 255.255.0.0 0000 0000 1 65.534 x.0.0 17 255.255.128.0 1000 0000 2 32.766 x.0.0, x.128.0 18 255.255.192.0 1100 0000 4 16.382 x.0.0, x.64.0, x.128.0, x.192.0 19 255.255.224.0 1110 0000 8 8.190 x.0.0, x.32.0, x.64.0, x.96.0, ... 20 255.255.240.0 1111 0000 16 4.094 x.0.0, x.16.0, x.32.0, x.48.0, ... 21 255.255.248.0 1111 1000 32 2.044 x.0.0, x.8.0, x.16.0, x.24,0, ... 22 255.255.252.0 1111 1100 64 1.022 x.0.0, x.4.0, x.8.0, x.12.0, ... 23 255.255.254.0 1111 1110 128 510 x.0.0, x.2.0, x.4.0, x.6.0, ... A 1 DE CLASE B POR SUBRED Ejemplos: 7-20 1. ¿Qué máscara utilizaremos para implementar una red para 400 “hosts”, siguiendo criterios de economía de IPs? La máscara de 24 “bits” es insuficiente porque sólo da cabida a 254 “hosts”. Tomamos entonces la máscara de 23 “bits” (255.255.254.0) que admite hasta 510 “hosts”. 2. La red 140.5.16.0 con máscara 255.255.248.0 abarca los “hosts” desde el 140.5.16.1 hasta el 140.5.23.254, siendo 140.5.23.255 su dirección de difusión. El Modelo de Referencia de Interconexión de Sistemas Abiertos (OSI) de ISO 3.6. Protocolo IP IP es el principal protocolo de la capa de red. Este protocolo define la unidad básica de transferencia de datos entre el origen y el destino, atravesando toda la red de redes. Además, el “software” IP es el encargado de elegir la ruta más adecuada por la que los datos serán enviados. Se trata de un sistema de entrega de paquetes (llamados datagramas IP) que tiene las siguientes características: — Es no orientado a conexión debido a que cada uno de los paquetes puede seguir rutas distintas entre el origen y el destino. Entonces pueden llegar duplicados o desordenados. — Es no fiable porque los paquetes pueden perderse, dañarse o llegar retrasados. — No implementa control de errores ni control de congestión. El protocolo IP está definido en la RFC 791 y más tarde modificado por la RFC 1349. 3.6.1. Datagrama IP El formato del datagrama IP es el siguiente: — Version (4 bits): Indica la versión del protocolo al que pertenece el datagrama. Actualmente hay dos versiones: la 4 (Ipv4) y la 6 (Ipv6). — IHL (Internet Header Length) (4 bits): Indica la longitud de la cabecera en palabras de 32 “bits”, ya que esta no tiene una longitud constante. Si no hay opciones, este valor es mínimo e igual a 5. El valor máximo es 15 (4 bits a 1). Como cada palabra equivale a 4 7-21 Sistemas y Comunicaciones “bytes”, el tamaño máximo de la cabecera es de 60 “bytes” y, por tanto, de 40 “bytes” el campo de opciones, es decir, el tamaño mínimo de la cabecera es de 20 “bytes” variables. 7-22 — Tipo de servicio (8 bits): La subred ofrece distintos grados de confiabilidad y seguridad. Con este campo el “host” puede indicarle a la subred el tipo de servicio que quiere, combinando fiabilidad y seguridad. Este campo contiene, a su vez, de izquierda a derecha: — Campo de precedencia (3 bits): Indica la prioridad, de 0 (normal) a 7 (paquete de control de red). — Tres “bits” indicadores: D (Delay=retardo), T (Throughput=rendimiento) y R (Reliability=fiabilidad), que permiten especificar qué interesa más. — Dos “bits” no usados. — Longitud total (16 bits): Longitud total en octetos del datagrama, incluyendo cabecera y datos. La longitud teórica máxima es 65535 “bytes” (64 Kbytes) pero en la práctica los datagramas vienen fijados por el tamaño de trama de nivel de enlace y el más común es el de Ethernet, en torno a 1500 “bytes”. — Identificación (16 bits): Cuando se transmite un datagrama a través de Internet puede ser necesario fragmentarlo en unidades más pequeñas a lo largo del camino. Este campo permite al “host” destino determinar a qué datagrama pertenece un fragmento recién llegado, ya que todos los fragmentos de un mismo datagrama contienen el mismo valor de identificación. — 1 “bit” sin uso actualmente. — Bit DF (Don’t Fragment): Puesto a “1”, indica a los enrutadores que no pueden fragmentar el datagrama porque el destino no va a poder unir las piezas de nuevo. Si es demasiado grande y no se puede enviar, se descarta y se envía al origen un mensaje de error. — Bit MF (More Fragment): Este “bit” está a “1” en todos los fragmentos de un datagrama excepto en el último. De esta forma, se sabe cuándo han llegado todos los fragmentos. — Desplazamiento del fragmento (13 bits). Indica en qué posición del datagrama original, medido en unidades de 8 octetos (64 bits), se encuentra el fragmento actual. Todos los fragmentos, menos el último del datagrama, deben tener una longitud múltiplo de 8 “bytes”. Puede haber 8192 fragmentos como máximo por datagrama. — TTL o tiempo de vida (8 bits): Contador que sirve para limitar la vida de un paquete. Teóricamente, cuenta el tiempo en segundos, permitiendo una vida máxima de 255 segundos (“11111111”=255 en decimal). Debe disminuirse en cada salto. En la práctica, simplemente cuenta saltos. Cuando el contador llega a 0 el paquete se descarta y se envía al “host” origen un paquete de aviso. Este campo evita que los paquetes estén dando vueltas eternamente por la red. El Modelo de Referencia de Interconexión de Sistemas Abiertos (OSI) de ISO — Protocolo (8 bits): Indica la entidad de la capa de transporte a la que debe entregarse el datagrama una vez que la capa de red del “host” destino lo ensambla por completo. — CRC o Suma de comprobación de la cabecera (16 bits). Verifica sólo la cabecera y es útil para la detección de errores generados por palabras de memoria en mal estado en un enrutador. — Dirección de origen y dirección de destino (32 bits, cada una). Indican la dirección IP origen y la dirección IP destino. — Opciones (de 0 a 40 bytes). Las opciones son de longitud variable. Empiezan con un código de 1 “byte”, que identifica la opción. A continuación, sólo para algunas opciones, 1 “byte” que indica la longitud de la opción. Finalmente, uno o más “bytes” de datos. El campo de opciones se rellena para obtener palabras completas o, lo que es lo mismo, múltiplos de 4 “bytes”. Las opciones las eligen las aplicaciones de origen aunque es bastante raro usarlas. El datagrama IP es la unidad básica de transferencia de datos entre el origen y el destino. Viaja en el campo de datos de las tramas físicas de las distintas redes que va atravesando. Cada vez que un datagrama tiene que atravesar un router, el datagrama saldrá de la trama física de la red que abandona y se acomodará en el campo de datos de una trama física de la siguiente red. Este mecanismo permite que un mismo datagrama IP pueda atravesar redes distintas: enlaces punto a punto, redes ATM, redes Ethernet, redes Token Ring, etc. Los dos campos principales del datagrama IP son la dirección IP origen y la dirección IP destino. El datagrama IP tiene también un campo de datos: será aquí donde viajen los paquetes de las capas superiores. Encabezado del datagrama Encabezado de la trama Área de datos del datagrama IP Área de datos de la trama Final de la trama Supongamos que el “host” A envía un datagrama al “host” B. Para salir de la red del “host” A existe un “router R”. Pueden darse dos situaciones: — — B se encuentra en la misma red que A: • El campo dirección IP destino del datagrama indica la IP de B. • El campo dirección física destino de la trama física indica la MAC de B. B se encuentra en una red distinta que A: • El campo dirección IP destino del datagrama indica la IP de B. • El campo dirección física destino de la trama física indica la MAC del “router R”. El “router” generará una nueva trama físi7-23 Sistemas y Comunicaciones ca que tenga como dirección física de destino la del siguiente router o bien, la del destino si ya se ha llegado a la red de B. Para evitar que un datagrama que no consigue llegar a su destino circule indefinidamente por la red de redes, los datagramas incluyen un campo llamado Tiempo de vida (TTL). Su valor indica el número máximo de segundos que puede estar un datagrama en la red de redes. Cada vez que el datagrama atraviesa un router se disminuye el TTL en al menos una unidad. Cuando llegue a cero, el datagrama se descarta y se devuelve un mensaje ICMP de tipo Tiempo excedido para informar al origen de la incidencia. 3.6.2. Fragmentación Ya hemos visto que las tramas físicas tienen un campo de datos y que es aquí donde se transportan los datagramas IP. Sin embargo, este campo de datos no puede tener una longitud indefinida debido a que está limitado por el diseño de la red. El MTU (Maximum Transfer Unit, unidad máxima de transmisión) de una red es la mayor cantidad de datos que puede transportar su trama física. El MTU de las redes Ethernet es 1.500 bytes y el de las redes Token-Ring, 8.192 bytes. Esto significa que una red Ethernet nunca podrá transportar un datagrama de más de 1.500 bytes sin fragmentarlo. Un encaminador (router) fragmenta un datagrama en varios si el siguiente tramo de la red por el que tiene que viajar el datagrama tiene un MTU inferior a la longitud del datagrama. Cada fragmento incluye su posición dentro del datagrama original para que el destino pueda reensamblar correctamente las distintas partes aunque lleguen desordenadas. En los datagramas IP existe un bit llamado DF (Don’t Fragment, no fragmentar) que debe estar a cero para que los routers puedan fragmentar los datagramas cuando sea necesario. 3.7. Encaminamiento Una red de redes está formada por redes interconectadas mediante “routers” o encaminadores. Cuando enviamos un datagrama desde un ordenador hasta otro, éste tiene que ser capaz de encontrar la ruta más adecuada para llegar a su destino. Esto es lo que se conoce como encaminamiento. Los routers (encaminadores o enrutadores) son los encargados de elegir las mejores rutas. Estas máquinas pueden ser ordenadores con varias direcciones IP o bien, dispositivos específicos. Los “routers” deben conocer, al menos parcialmente, la estructura de la red que les permita encaminar de forma correcta cada mensaje hacia su destino. Esta información se almacena en las llamadas tablas de encaminamiento (tablas de rutas o tablas de enrutamiento). Observemos que debido al sistema de direccionamiento IP esta misión no es tan complicada. Lo único que necesitamos almacenar en las tablas son los prefijos de las direcciones (que nos indican la red). Por ejemplo, si el destino es la máquina 149.33.19.4 con máscara 255.255.0.0, nos basta con conocer el encaminamiento de la red 149.33.0.0 ya que todas las que empiecen por 149.33 se enviarán hacia el mismo sitio. Las tablas de encaminamiento contienen habitualmente una entrada por defecto (default) para encaminar los datagramas que no encajen con el resto de entradas de la tabla. 7-24 El Modelo de Referencia de Interconexión de Sistemas Abiertos (OSI) de ISO 3.7.1. Protocolos de encaminamiento El encaminamiento puede ser de dos tipos: • Estático. La información de encaminamiento se almacena en una tabla de rutas estática. Esta tabla se genera a partir de la configuración TCP/IP del “host” y, posteriormente, el administrador puede añadir, eliminar o modificar manualmente sus entradas para reflejar cambios de la red (comando route add/delete/change). Si la red es sencilla y apenas se realizan cambios el encaminamiento estático puede ser suficiente. Ejemplo: el comando route add 5.0.0.0 mask 255.0.0.0 8.0.0.1, añade una entrada estática en la tabla de rutas para enviar por 8.0.0.1 (gateway) todo el tráfico dirigido a la red 5.0.0.0/255.0.0.0. • Dinámico. La información de encaminamiento se genera y actualiza automáticamente. Cuando se producen cambios en la red, el “host” debe descubrir las nuevas rutas y actualizar dinámicamente su tabla. El encaminamiento dinámico requiere algoritmos (protocolos) de encaminamiento para intercambiar información con otros “routers” y actualizar la suya propia. Este tipo de encaminamiento se estudia a continuación. Un sistema autónomo (AS) es un conjunto de redes gestionadas por una misma organización la cual tiene definida una única política de encaminamiento de cara al exterior. Un ISP (proveedor de servicios de Internet) típicamente tiene integradas todas sus redes bajo un mismo sistema autónomo. Internet es, en realidad, un conglomerado de sistemas autónomos conectados entre sí. Cada sistema autónomo es un conjunto de redes IP. Se dice que un sistemas autónomo A ofrece tránsito si permite que un tráfico iniciado en un AS B tenga como destino un AS C, siendo B y C sistemas autónomos diferentes a A. Cada sistema autónomo tiene su propia política de encaminamiento (por ejemplo, aceptar o rechazar tráfico de tránsito). Los protocolos de encaminamiento que se utilizan dentro de un sistema autónomo, en los llamados “routers” internos, para encaminar entre sus distintas redes, se conocen como protocolos IGP (Interior Gateway Protocols) y los que se utilizan, en los llamados routers frontera, para interconectar unos sistemas autónomos con otros, protocolos EGP (Exterior Gateway Protocols). Cada sistema autónomo habitualmente utiliza un único protocolo IGP en sus “routers” internos. Los principales protocolos de tipo IGP de vector de distancia: — RIP (Routing Information Protocol, protocolo de información de encaminamiento). Está basado en el algoritmo del vector distancia, siendo la distancia el número de nodos que hay que atravesar para llegar a una red. RIP es el protocolo más sencillo y antiguo. Difunde su tabla de rutas periódicamente a sus routers vecinos (cada 30 segundos). Si un router detecta un camino con un menor número de nodos hacia un destino a través de un vecino, modifica su propia tabla para encaminar a través de ese vecino. El tráfico RIP puede llegar a ser excesivo, por lo que no es un protocolo apropiado para utilizarlo en redes grandes. Otro de sus inconvenientes es su lenta convergencia, esto es, pueden transcurrir varios minutos desde que se produce un cambio en la red (un enlace interrumpido, por ejemplo) hasta que todos los “routers” internos actualizan sus rutas. 7-25 Sistemas y Comunicaciones — IGRP (Open Shortest Path First Protocol), protocolo de CISCO que utiliza principalmente vector de distancia y una métrica compuesta para determinar la mejor ruta basándose en el ancho de banda, el retardo, la confiabilidad y la carga del enlace. — OSPF (Open Shortest Path First Protocol, protocolo de primero el camino más corto). Está basado en el estado de los enlaces (vínculos). Utiliza un algoritmo más complejo y eficaz que RIP. No difunde la información periódicamente como hace RIP, sino que únicamente envía datos a otros routers cuando se producen cambios en el direccionamiento de la red, mediante mensajes de multidifusión. En el momento de producirse un cambio, la nueva información se envía inmediatamente por lo que los tiempos de convergencia, hasta lograr que todos los routers conozcan el cambio, suele ser de apenas unos segundos. Es adecuado para redes internas grandes o muy grandes. OSPF divide las redes en áreas conectadas a un área troncal o “backbone”. Los “routers” que conectan dos áreas, una de ellas suele ser el área troncal, se conocen como “routers” de borde de área (ABR, Area Border Router). En cambio, si todas las interfaces de un encaminador están conectadas a la misma área, el “router” recibe el nombre de “router” interno. OSPF fue desarrollado por IETF (Internet Engineering Task Force) para sustituir a RIP y solucionar sus inconvenientes. Además de OSPF, otro protocolo interno de estado de los enlaces es IS-IS (Intermediate System to Intermediate System, sistema intermedio a sistema intermedio). — EIGRP (Enhanced IGRP, IGRP mejorado) es un protocolo híbrido ya que implemento lo mejor de los algoritmos de vector de distancia y de estado de enlaces. El principal protocolo externo es BGP (Border Gateway Protocol, Protocolo de “router” frontera). Prácticamente todo el tráfico de Internet entre sistemas autónomos se encamina utilizando BGP, concretamente con su última versión, BGP-4. Está definido en la RFC 1771. Otro protocolo de tipo EGP, utilizado en los orígenes de Internet, es el igualmente llamado EGP (Exterior Gateway Protocol). En una primera fase se utilizó en Internet un encaminamiento con clases (classfull), lo que significa que sólo podían existir redes de clases A, B o C. En la actualidad, el encaminamiento es sin clases (classless), es decir, los routers pueden encaminar redes de cualquier tamaño utilizando para ello las máscaras de red. Su principal ventaja es que para encaminar un conjunto de redes cuyos primeros “bits” sean iguales, bastará con una única entrada en la tabla de encaminamiento de los routers. Esto es lo que se conoce como CIDR (Classless Inter-Domain Routing, enrutamiento entre dominios sin clases). 3.7.2. Tablas de encaminamiento Cada “host” que participe en una red IP tiene una tabla de encaminamiento que le indica a dónde debe dirigir cada datagrama IP, fijándose en su IP de destino. Las tablas de encaminamiento más interesantes son las de los routers por tener un mayor número de entradas, aunque los “hosts” finales también tienen sus propias tablas. 7-26 El Modelo de Referencia de Interconexión de Sistemas Abiertos (OSI) de ISO Una tabla de encaminamiento tiene las siguientes columnas: — Dirección IP y máscara. Combinando ambos elementos, indica el encaje de patrón que deberá cumplir una dirección IP para que se utilice esa entrada. Se pueden dar 3 situaciones: • IP 0.0.0.0 y máscara 0.0.0.0. Indica la entrada predeterminada que se utilizará en caso de que no se produzca encaje de patrón en el resto de entradas. • Máscara 255.255.255.255. Se refiere a un “host” concreto. Sólo se utilizará esa entrada si la dirección IP coincide exactamente con la indicada. • Una máscara de una red. Se utilizará esa entrada si la dirección IP pertenece a la red indicada. — Gateway. Indica el “host” (router) al que se reenviará el datagrama IP cuando se utilice esa entrada. — Métrica. Indica el coste que conlleva enviar un datagrama IP por esa ruta. Un valor más bajo indica una ruta mejor que si el valor es mayor y, por lo tanto, esa ruta tendrá prioridad. Las métricas más habituales son el número de saltos (routers intermedios) o el retardo. Si no figura esta columna en las tablas de encaminamiento, se entiende que todas las rutas tienen igual métrica. Estudiemos el siguiente ejemplo formado por 6 redes y 3 “routers”. En cada una de las redes habrá una serie de “hosts” conectados, pero no se han dibujado para una mayor claridad. 1.0.0.1 R1 2.0.0.1 4.0.0.1 4.0.0.3 2.0.0.2 R2 3.0.0.2 5.0.0.2 R3 5.0.0.3 6.0.0.3 7-27 Sistemas y Comunicaciones Ejemplo de tabla de encaminamiento de R1: DIRECCIÓN IP MÁSCARA Gateway 1.0.0.0 255.0.0.0 1.0.0.1 2.0.0.0 255.0.0.0 2.0.0.1 3.0.0.0 255.0.0.0 2.0.0.2 4.0.0.0 255.0.0.0 4.0.0.1 5.0.0.30 255.255.255.255 2.0.0.2 0.0.0.0 0.0.0.0 4.0.0.3 Observamos que el “router” R1 tiene 3 “interfaces”, una para cada red que interconecta. Cuando tenga que encaminar un datagrama IP dirigido a las redes 1.0.0.0, 2.0.0.0 ó 4.0.0.0, bastará con darle salida por su interfaz correspondiente (no tiene que reenviar a ningún otro “router”). Según la tabla anterior, un datagrama IP dirigido a la red 3.0.0.0, el “router” R1 lo reenviará al “router” R2. Y un datagrama IP dirigido a otras redes (5.0.0.0 y 6.0.0.0) se encaminará a través de R3, excepto un posible “host” con IP 5.0.0.30 que será reencaminado a través de R2. Ejemplo 1: el “host” 1.0.0.15 envía un datagrama IP dirigido a 5.0.0.83, ¿cuál será la ruta? 1.0.0.15 > R1 [1.0.0.1] > R3 [4.0.0.3] > 5.0.0.83 Ejemplo 2: el “host” 1.0.0.15 envía un datagrama IP dirigido a 5.0.0.30, ¿cuál será la ruta? 1.0.0.15 > R2 [1.0.0.1] > R2 [2.0.0.2] > 5.0.0.83 3.8. Protocolo ARP Dentro de una misma red, las máquinas se comunican enviándose tramas físicas. Las tramas Ethernet contienen campos para las direcciones físicas origen y destino (6 bytes cada una). El problema que se nos plantea es cómo podemos conocer la dirección física de la máquina destino. El único dato que se indica en los datagramas es la dirección IP de destino. ¿Cómo se pueden entregar entonces estos datagramas? Necesitamos obtener la dirección física de un ordenador a partir de su dirección IP. Esta es justamente la misión del protocolo ARP (Address Resolution Protocol, protocolo de resolución de direcciones). El protocolo ARP está definido en la RFC 826. Las preguntas ARP consisten en mensajes del tipo “¿Cuál es la dirección física de la máquina con dirección IP 192.168.0.1?”. Son mensajes de difusión (se envían a todas las máquinas) pero sólo responde el “host” que tiene la dirección IP solicitada. La respuesta se envía directamente a la máquina que formuló la pregunta. Cada ordenador almacena una tabla de direcciones IP y direcciones físicas llamada tabla o caché ARP. Estas tablas reducen el tráfico de la red al evitar preguntas ARP innecesarias. Cada vez que un ordenador formula una pregun7-28 El Modelo de Referencia de Interconexión de Sistemas Abiertos (OSI) de ISO ta ARP y le responden, inserta una nueva entrada en su tabla. Las siguientes veces que tenga que comunicarse con el mismo “host” no será necesario formular una nueva pregunta ARP debido a que la dirección física está ya contenida en la tabla. Sin embargo, para evitar que las entradas queden desfasadas como consecuencia de cambios de direcciones IP o adaptadores de red, se asigna un tiempo de vida de cierto número de segundos a cada entrada de la tabla. Cuando se agote el tiempo de vida de una entrada, ésta será eliminada de la tabla. Lo que hemos explicado es para comunicar dos máquinas conectadas a la misma red. Si la otra máquina no estuviese conectada a la misma red, sería necesario atravesar uno o más “routers” hasta llegar al “host” destino. La máquina origen, si no la tiene en su tabla, formularía una pregunta ARP solicitando la dirección física del “router” y le transferiría a éste el mensaje. Estos pasos se van repitiendo para cada red hasta llegar a la máquina destino. 3.9. Protocolo RARP La misión del protocolo RARP (Reverse Address Resolution Protocol, protocolo de resolución inversa de direcciones) es justo la contraria que el caso anterior: obtener una dirección IP a partir de una dirección física. Este protocolo lo utilizan estaciones sin disco que no conocen su dirección IP en el momento de arrancar. Envían su dirección física esperando que exista un servidor RARP en la red que les indique cuál es la dirección IP que tienen asignada (“Yo soy 33:fe:11:2a:c9:81, ¿cuál es mi dirección IP?”). El servidor RARP responde a las peticiones consultando una tabla de direcciones físicas y direcciones IP configurada por el administrador de la red. Otras alternativas a RARP para la asignación de dirección IP son los protocolos BOOTP (Bootstrap Protocol, protocolo de arranque) y DHCP (Dynamic “host” Configuration Protocol, protocolo de configuración dinámica de “host”). — El protocolo BOOTP fue definido originalmente en la RFC 951 para sustituir a RARP. Su cometido es el mismo que el del protocolo RARP aunque en lugar de funcionar en la capa de enlace lo hace en la capa de aplicación utilizando mensajes UDP. — DHCP también funciona en la capa de aplicación aunque es más complejo. Proporciona, no sólo la dirección IP, sino también el resto de la configuración IP como pueden ser las direcciones de los servidores DNS, servidores WINS o “routers”. DHCP se utiliza habitualmente para centralizar toda la configuración IP de los puestos de trabajo en un servidor. Va ofreciendo direcciones IP distintas a los clientes que lo solicitan, dentro de un rango configurado (por ejemplo, entre la 192.168.0.10 y la 192.168.0.100). Cuando un “host” se desconecta de la red, el servidor DHCP libera su dirección IP y la pone a disposición de otros “hosts” que soliciten IP. Se pueden realizar reservas de direcciones IP a “hosts”, registrando para ellos su dirección física. El servicio DHCP también es interesan7-29 Sistemas y Comunicaciones te cuando existen más ordenadores que direcciones IP, pero se sabe con antelación que no todos los ordenadores van a estar conectados simultáneamente. Este es el caso de los proveedores de Internet que ofrecen conexiones de acceso telefónico por módem. DHCP está definido en la RFC 1541. 3.10. Protocolo ICMP Debido a que el protocolo IP no es fiable, los datagramas pueden perderse o llegar defectuosos a su destino. El protocolo ICMP (Internet Control Message Protocol, protocolo de mensajes de control) se encarga de informar al origen si se ha producido algún error durante la entrega de su mensaje. Pero no sólo se encarga de notificar los errores, sino que también transporta distintos mensajes de control. El protocolo ICMP está definido en la RFC 792. El protocolo ICMP únicamente informa de incidencias en la red pero no toma ninguna decisión. Esto será responsabilidad de las capas superiores. Los mensajes ICMP viajan en el campo de datos de un datagrama IP, como se puede apreciar en el siguiente esquema: Tipo Encabezado del datagrama Encabezado de la trama Datos ICMP Área de datos del datagrama IP Área de datos de la trama Final de la trama Debido a que el protocolo IP no es fiable puede darse el caso de que un mensaje ICMP se pierda o se dañe. Si esto llega a ocurrir no se creará un nuevo mensaje ICMP sino que el primero se descartará sin más. Los mensajes ICMP comienzan con un campo de 8 “bits” que contiene el tipo de mensaje, según se muestra en la tabla siguiente. El resto de campos son distintos para cada tipo de mensaje ICMP. El listado completo de tipos de mensajes ICMP puede encontrarse en la dirección de la IANA http://www.iana.org/assignments/icmp-parameters. Campo de tipo 0 Respuesta de eco (Echo Reply). 3 Destino inaccesible (Destination Unreachable). 4 Disminución del tráfico desde el origen (Source Quench). 5 Redireccionar (cambio de ruta) (Redirect). 8 Solicitud de eco (Echo). 11 7-30 Tipo de mensaje ICMP Tiempo excedido para un datagrama (Time Exceeded). El Modelo de Referencia de Interconexión de Sistemas Abiertos (OSI) de ISO Campo de tipo Tipo de mensaje ICMP 12 Problema de Parámetros (Parameter Problem). 13 Solicitud de marca de tiempo (Timestamp). 14 Respuesta de marca de tiempo (Timestamp Reply). 15 Solicitud de información (obsoleto) (Information Request). 16 Respuesta de información (obsoleto) (Information Reply). 17 Solicitud de máscara (Addressmask). 18 Respuesta de máscara (Addressmask Reply). Comentarios sobre los tipos de mensajes: — Los mensajes de solicitud y respuesta de eco, tipos 8 y 0 respectivamente, se utilizan para comprobar si existe comunicación entre 2 “hosts” a nivel de la capa de red. Estos mensajes comprueban que las capas física (cableado), acceso al medio (tarjetas de red) y red (configuración IP) están correctas. Sin embargo, no dicen nada de las capas de transporte y de aplicación las cuales podrían estar mal configuradas; por ejemplo, la recepción de mensajes de correo electrónico puede fallar aunque exista comunicación IP con el servidor de correo. La orden ping envía mensajes de solicitud de eco a un “host” remoto e informa de las respuestas. Ejemplos: – ping www.adams.es – ping 195.53.29.245 – ping 127.0.0.1 — Mensaje de tiempo excedido (tipo 11). Recordemos que los datagramas IP tienen un campo TTL que impide que un mensaje esté dando vueltas indefinidamente por la red de redes. Cuando este campo llega a 0 se descarta el datagrama y se envía un mensaje ICMP de tipo 11 (Time Exceeded) para informar al origen. Los mensajes ICMP de tipo 11 se pueden utilizar para hacer una traza del camino que siguen los datagramas hasta llegar a su destino. ¿Cómo? Enviando una secuencia de datagramas con TTL=1, TTL=2, TTL=3, TTL=4, etc... hasta alcanzar el “host” o superar un límite fijado de saltos. El primer datagrama caducará al atravesar el primer “router” y se devolverá un mensaje ICMP de tipo 11 informando al origen del “router” que descartó el datagrama. El segundo datagrama hará lo propio con el segundo “router” y así sucesivamente. Los mensajes ICMP recibidos permiten definir la traza. El comando Unix que realiza una traza a un “host” es “traceroute”. En Windows, el comando equivalente es “tracert”. Por ejemplo: tracert 195.53.29.245. 7-31 Sistemas y Comunicaciones — — Mensaje de destino inaccesible (tipo 3). Se genera cuando un “router”no tiene información en su tabla de rutas para encaminar el mensaje hacia el destino. Los códigos de error que genera son los siguientes: • Código=0: Se usa cuando no se puede encontrar la red del destino del mensaje. • Código=1 Cuando el propio “host” o aplicación destino está inalcanzable. • Código=2 Cuando el campo de protocolo del datagrama no coincide con ninguno de los protocolos del “host” destino. • Código=3 No se puede llegar al puerto destino o la aplicación destino no está libre. • Código=4 Cuando una red no puede transportar un paquete IP demasiado grande para ella pero lleva el bit DF activado, indicando que no se permite fragmentación. • Código=5 La ruta de origen no es correcta. • Código=6 No se conoce la red destino. • Código=7 No se conoce el “host” destino. • Código=8 El “host” origen está aislado. • Código=9 La comunicación con la red destino está prohibida por razones administrativas. • Código=10 La comunicación con el “host” destino está prohibida por razones administrativas. • Código=11 No se puede llegar a la red destino debido al Tipo de servicio. • Código=12 No se puede llegar al “host” destino debido al Tipo de servicio. Mensaje de disminución del tráfico desde el origen (tipo 4). Se utiliza para solicitar al origen que disminuya la velocidad de envío de nuevos datagramas porque su buffer (memoria intermedia) de recepción se está llenando. 3.11. IGMP La comunicación IP normal es entre un transmisor y un receptor. En algunas aplicaciones, sin embargo, es útil poder transmitir a una cantidad grande de receptores de forma simultánea. Por ejemplo, las actualizaciones de réplicas, las bases de datos distribuidas, etc. IP maneja la multitransmisión usando direcciones clase D (direcciones multicast) que identifican cada una a un grupo de “hosts” (estos “host” mantienen su dirección IP individual de forma que responden a ambas direccio7-32 El Modelo de Referencia de Interconexión de Sistemas Abiertos (OSI) de ISO nes). Cuando se envía un paquete a una dirección clase D se intenta entregar a todos los miembros de grupo, pero no se dan garantías (protocolo “best-effort”). La multitransmisión se lleva a cabo mediante enrutadores especiales. Aproximadamente cada minuto todos los enrutadores multitransmisión envían una multitransmisión de “hardware” a los “host” de su red local, solicitándoles que indiquen las direcciones clase D o los grupos en los que están interesados. Cada “host” responde con dicha información. Estos paquetes de solicitud y respuesta usan el protocolo IGMP (Internet Group Management Protocol). 4. Capa de transporte La capa de red transfiere datagramas entre dos ordenadores a través de la red utilizando como identificadores las direcciones IP. La capa de transporte añade la noción de puerto para distinguir entre los muchos destinos dentro de un mismo “host”. No es suficiente con indicar la dirección IP del destino, además hay que especificar la aplicación que recogerá el mensaje. Cada aplicación que esté esperando un mensaje utiliza un número de puerto distinto; más concretamente, la aplicación está a la espera de un mensaje en un puerto determinado (escuchando un puerto). Pero no sólo se utilizan los puertos para la recepción de mensajes, también para el envío: todos los mensajes que envíe un ordenador debe hacerlo a través de uno de sus puertos. El siguiente diagrama representa una transmisión entre el ordenador 194.35.133.5 y el 135.22.8.165. El primero utiliza su puerto 1256 y el segundo, el 80. 194.35.133.5 Puerto 1256 Puerto 80 135.22.8.165 La capa de transporte transmite mensajes entre las aplicaciones de dos ordenadores. Por ejemplo, entre nuestro navegador de páginas web y un servidor de páginas web, o entre nuestro programa de correo electrónico y un servidor de correo. 7-33 Sistemas y Comunicaciones HTTP (navegador web) HTTP (servidor web) Capa de aplicación TCP (puerto mayor de 1023) TCP (puerto 80) Capa de transporte IP (dirección IP privada o pública dinámica) IP (direcciones IP públicas) IP (dirección IP pública estática) Ethernet (dirección física) Ethernet (direcciones físicas) Ethernet (dirección física) UTP CAT 5 UTP CAT 5 en ambas redes UTP CAT 5 Red 1 Cliente 4.1. mensaje HTTP segmento TCP Capa de red datagrama IP Capa de acceso a la red trama Ethernet Capa de física secuencia de bits Red n Secuencia de n routerrs Servidor Puertos Un ordenador puede estar conectado con distintos servidores a la vez; por ejemplo, con un servidor de noticias y un servidor de correo. Para distinguir las distintas conexiones dentro de un mismo ordenador se utilizan los puertos. Un puerto es un número de 16 “bits”, por lo que existen 65536 puertos en cada ordenador. Las aplicaciones utilizan estos puertos para recibir y transmitir mensajes. Las aplicaciones cliente utilizan puertos asignados dinámicamente superiores al 1023. Cuando una aplicación cliente quiere comunicarse con un servidor, busca un número de puerto libre y lo utiliza. En cambio, las aplicaciones servidoras utilizan unos números de puerto conocidos (por ejemplo, el servicio de páginas web utiliza el puerto 80). Cuando los clientes se conectan a un servidor utilizan el puerto servidor predeterminado. Por ejemplo, si escribimos en el navegador la dirección http://www.adams.es, se abre automáticamente una conexión al puerto 80 del servidor. El resultado sería el mismo que si especificásemos este puerto en la URL: http://www.adams.es:80. Aunque no es algo habitual, el administrador podría modificar estos números de puerto conocidos con objeto de ocultar algún servicio. En esto caso, sería necesario especificar el puerto para poder acceder al servicio: http://www.adams.es:4533 (suponiendo que el servicio web estuviese a la escucha en el puerto 4533). El listado de puertos fue publicado originalmente en la RFC 1700. En la actualidad, se puede encontrar un listado actualizado en la página de la IANA http://www.iana.org/assignments/port-numbers. 7-34 El Modelo de Referencia de Interconexión de Sistemas Abiertos (OSI) de ISO Los 65536 puertos se clasifican en 3 grupos: — Del 0 al 1023 son los puertos bien conocidos (Well Known Ports). Son los puertos que debemos conocer pensando en la preparación del examen. Al menos los más importantes, que resumimos más adelante. Estos puertos se corresponden con las aplicaciones servidoras más importantes, como HTTP, FTP o NNTP. No deberían utilizarse para otros fines. — Del 1024 al 49151 son los puertos registrados (Registered Ports). Son puertos que utilizan aplicaciones de fabricantes concretos, como por ejemplo el 1863 para el MSN Messenger o el 1512 para el servicio de resolución de nombres de Microsoft, WINS. Este listado es únicamente orientativo: estos puertos se pueden utilizar libremente para otro tipo de procesos o uso privado. — Del 49152 al 65535 son los puertos dinámicos y/o privados (Dynamic and/or Private Ports). Puertos utilizados en el lado cliente para iniciar conexiones dinámicamente o para otro tipo de uso. Los puertos registrados también se utilizan habitualmente para este uso. Los puertos bien conocidos más importantes son: Servicio Puerto ftp (datos) ftp (control) telnet smtp dns bootp tftp gopher finger http pop3 sunrpc nntp netbios imap snmp irc ldap http over ssl 20 21 23 25 53 67 69 70 79 80 110 111 119 139 143 161 194 389 443 7-35 Sistemas y Comunicaciones SMTP over SSL 587 IMAP4s 993 POP3s 995 Los puertos tienen una memoria intermedia (buffer) situada entre los programas de aplicación y la red. De tal forma que las aplicaciones transmiten la información a los puertos. Aquí se va almacenando hasta que pueda enviarse por la red. Una vez que pueda transmitirse, la información irá llegando al puerto destino donde se irá guardando hasta que la aplicación esté preparada para recibirla. Los dos protocolos principales de la capa de transporte son UDP y TCP. El primero ofrece una transferencia de mensajes no fiable y no orientada a conexión y el segundo, una transferencia fiable y orientada a conexión. El formato de paquete de ambos protocolos incluye campos para el puerto origen y el puerto destino. 4.2. Protocolo UDP El protocolo UDP (User Datagram Protocol, protocolo de datagrama de usuario) proporciona una comunicación muy sencilla entre las aplicaciones de dos ordenadores. Al igual que el protocolo IP, UDP es: — No orientado a conexión. No se establece una conexión previa con el otro extremo para transmitir un mensaje UDP. Los mensajes se envían sin más y éstos pueden duplicarse o llegar desordenados al destino. — No fiable. Los mensajes UDP se pueden perder o llegar dañados. UDP utiliza el protocolo IP para transportar sus mensajes. Como vemos, no añade ninguna mejora en la calidad de la transferencia; aunque sí incorpora los puertos origen y destino en su formato de mensaje. Las aplicaciones (y no el protocolo UDP) deberán programarse teniendo en cuenta que la información puede no llegar de forma correcta. Formato: Puerto de origen (16 bits) Puerto de destino (16 bist) Longitud total (16 bits) Suma de comprobación del encabezado (16 bits) Datos (longuitud variable) 7-36 — Puerto origen y destino de 16 “bits” — Longitud UDP de 16 “bits”: Indica la longitud del datagrama UDP incluyendo cabecera y datos. El Modelo de Referencia de Interconexión de Sistemas Abiertos (OSI) de ISO — Suma de comprobación del encabezado (16 bits): Esta suma es opcional. Si no se calcula su valor es 0. A continuación se muestra el encapsulado desde la capa de transporte utilizando UDP hasta el nivel de enlace. Encabezado UDP Encabezado del datagrama Encabezado de la trama 4.3. Área de datos UDP Área de datos del datagrama IP Área de datos de la trama Final de la trama Protocolo TCP El protocolo TCP (Transmission Control Protocol, protocolo de control de transmisión) está basado en IP que es no fiable y no orientado a conexión, y sin embargo es: — Orientado a conexión. Es necesario establecer una conexión previa entre las dos máquinas antes de poder transmitir ningún dato. A través de esta conexión los datos llegarán siempre a la aplicación destino de forma ordenada y sin duplicados. Finalmente, es necesario cerrar la conexión. — Fiable. La información que envía el emisor llega de forma correcta al destino. El protocolo TCP permite una comunicación fiable entre dos aplicaciones. De esta forma, las aplicaciones que lo utilicen no tienen que preocuparse de la integridad de la información: dan por hecho que todo lo que reciben es correcto. El flujo de datos entre una aplicación y otra viajan por un circuito virtual. Sabemos que los datagramas IP pueden seguir rutas distintas, dependiendo del estado de los encaminadores intermedios, para llegar a un mismo sitio. Esto significa que los datagramas IP que transportan los mensajes siguen rutas diferentes aunque el protocolo TCP logre la ilusión de que existe un único circuito por el que viajan todos los “bytes”, uno detrás de otro (algo así como una tubería entre el origen y el destino). Para que esta comunicación pueda ser posible es necesario abrir previamente una conexión. Esta conexión garantiza que todos los datos lleguen correctamente de forma ordenada y sin duplicados. La unidad de datos del protocolo es el “byte”, de tal forma que la aplicación origen envía “bytes” y la aplicación destino recibe estos “bytes”. Sin embargo, cada “byte” no se envía inmediatamente después de ser generado por la aplicación, sino que se espera a que haya una cierta cantidad de “bytes”, se agrupan en un segmento y se envía el segmento completo. 7-37 Sistemas y Comunicaciones Para ello son necesarias unas memorias intermedias o buffers. Cada uno de estos segmentos viaja en el campo de datos de un datagrama IP. Si el segmento es muy grande será necesario fragmentar el datagrama, con la consiguiente pérdida de rendimiento; y si es muy pequeño, se estarán enviando más cabeceras que datos. Por consiguiente, es importante elegir el mayor tamaño de segmento posible que no provoque fragmentación. El protocolo TCP envía un flujo de información no estructurado. Esto significa que los datos no tienen ningún formato, son únicamente los “bytes” que una aplicación envía a otra. Ambas aplicaciones deberán ponerse de acuerdo para comprender la información que se están enviando. Cada vez que se abre una conexión, se crea un canal de comunicación bidireccional en el que ambas aplicaciones pueden enviar y recibir información, es decir, una conexión es “full-dúplex”. 4.3.1. Formato del Segmento TCP El formato del segmento TCP es el siguiente: 7-38 — Puerto origen y destino de 16 “bits” — Número de secuencia (32 bits). Indica el primer “byte” de datos que hay en el segmento. — Número de acuse de recibo (32 bits). Especifica el siguiente byte esperado, no el último “byte” recibido correctamente. Para que este campo se tenga en cuenta el “bit” ACK debe estar activado (“1”). El Modelo de Referencia de Interconexión de Sistemas Abiertos (OSI) de ISO — Longitud de cabecera TCP. Cantidad de palabras de 32 “bits” contenidas en la cabecera TCP. Es necesaria, ya que el campo de opciones es de longitud variable. El tamaño de la cabecera completa puede oscilar entre 5 y 60 “bytes”. — 6 “bits” que no se usan. Su valor es “0” y están reservados para usos futuros. — 6 banderas o indicadores de 1 “bit” con funciones de control. • URG a “1” indica que el segmento contiene datos urgentes. El Apuntador urgente (16 “bits”) indica el siguiente “byte” del campo de Datos que sigue a los datos urgentes, es decir, indica cuál es el último “byte” de datos que es urgente. Al recibirse los datos urgentes en el destino se interrumpe la aplicación receptora para que pueda leer el flujo de datos hasta encontrar los datos urgentes. • ACK a “1” indica que el Número de acuse de recibo es válido. Si ACK=0 se ignora el campo de Número de acuse de recibo. Hay que tener en cuenta que un mismo segmento puede transportar datos en un sentido y confirmaciones en el sentido opuesto de la comunicación. • PSH Indica datos empujados. Se activa para solicitar al receptor que entregue los datos a la aplicación a su llegada y no los almacene en el “buffer” hasta la recepción de un “buffer” completo. • RST Sirve para reestablecer una conexión y para rechazar un segmento no válido o un intento de abrir una conexión. • SYN Campo para la sincronización de los números de secuencia, que se utiliza al establecer la conexión. SYN indica el primer número de secuencia con el que se va a empezar a transmitir. Puede ser distinto de 0. • FIN Se utiliza para liberar conexiones. — Tamaño de la ventana (16 bits). Indica la cantidad de “bytes” que pueden enviarse a partir del último “byte” del que se ha recibido acuse de recibo. El receptor pone el valor de la ventana a 0 cuando no puede recibir más datos. — Suma de comprobación (16 bits). Suma de comprobación de la cabecera, los datos y una pseudocabecera conceptual. — Opciones. Permite agregar características extra no cubiertas en la cabecera normal. La más importante es la que permite que cada “host” especifique la carga útil TCP máxima que está dispuesto a aceptar. — Para completar el tamaño del segmento TCP hasta que sea múltiplo de 32 “bits” se usan “bits” de relleno (técnica de “padding”). 7-39 Sistemas y Comunicaciones 4.3.2. Control de flujo El control de flujo más simple es el que se lleva a cabo mediante el sistema de parada y espera. El transmisor guarda un registro de cada segmento que envía, esperando un ACK antes de enviar el siguiente. También arranca un temporizador cuando envía el segmento. Si el temporizador expira antes de recibir el acuse de recibo, retransmite el segmento y reinicia el temporizador. Este mecanismo es el más barato y el más usado cuando se transmiten tramas muy grandes pero es ineficiente ya que está el canal de transmisión desaprovechado la mayor parte del tiempo. Este esquema es perfectamente válido aunque muy ineficiente debido a que sólo se utiliza un sentido de la comunicación a la vez y el canal está desaprovechado la mayor parte del tiempo. Para solucionar este problema se utiliza un protocolo de ventana deslizante, que permite que el transmisor envíe varios segmentos sin esperar los ACK correspondientes. En este sistema el emisor y el receptor se ponen de acuerdo en el número de segmentos sin procesar que puede guardar éste último, dependiendo del tamaño de sus “buffers”. También se ponen de acuerdo en el número de “bits” a utilizar para numerar cada segmento. Cuando la ventana tiene un tamaño cero el emisor no puede enviar más segmentos, salvo en dos casos excepcionales: cuando se trata de datos urgentes y cuando el emisor envía un segmento de 1 “byte” para provocar que el receptor genere un nuevo acuse de recibo con un nuevo tamaño de ventana, evitando así un bloqueo indefinido de la conexión. Este sistema es mucho más eficiente que el de parada y espera ya que puede haber más de un segmento a la vez en las líneas de transmisión. La siguiente figura lo ilustra: Eventos en el lado del emisor Mensajes en la red Eventos en el lado del receptor Envío del paquete 1 Envío del paquete 2 Recepción del paquete 1 Envío de ACK 1 Envío del paquete 3 Recepción del paquete 2 Envío de ACK 2 Recepción del ACK 1 Recepción del paquete 3 Envío de ACK 3 Recepción del ACK 2 Recepción del ACK 3 Una variedad mejorada del sistema de ventana deslizante es el sistema de control de flujo con adelante-atrás-N, en el que cuando la estación destino encuentra un segmento erróneo devuelve un ACK negativo, rechazando todos los que le lleguen hasta que no reciba otra vez el segmento incorrecto en buenas condiciones. El emisor, al recibir el ACK negativo, sabe que tiene que volver a transmitir ese segmento y todos los siguientes. 7-40 El Modelo de Referencia de Interconexión de Sistemas Abiertos (OSI) de ISO Por último, existe otro sistema denominado sistema de control con rechazo selectivo, que se basa en que los únicos segmentos que se vuelven a retransmitir son aquellos rechazados por el receptor o aquellos cuyo temporizador expira sin confirmación. Este método es más eficiente que los anteriores pero precisa que el receptor disponga de un buffer intermedio de gran capacidad (y por lo tanto caro) en el que guardar todos los segmentos recibidos tras el rechazo de uno dado hasta recibir de nuevo el segmento rechazado de forma correcta. Además, debe ser capaz de colocarlo en su lugar de secuencia correcto. Por su parte, el emisor debe tener la capacidad de reenviar segmentos fuera de orden. Estos motivos hacen que este método, a pesar de ser el más efectivo, sea el menos utilizado. 4.3.3. Conexiones Una conexión son dos pares dirección IP: puerto. No puede haber dos conexiones iguales en un mismo instante en toda la red de redes. Aunque bien es posible que un mismo ordenador tenga dos conexiones distintas y simultáneas utilizando un mismo puerto. El protocolo TCP utiliza el concepto de conexión para identificar las transmisiones. En el siguiente ejemplo se han creado tres conexiones. Las dos primeras son al mismo servidor Web (puerto 80) y la tercera a un servidor de FTP (puerto 21). Host 1 Host 2 194.35.133.5:1256 135.22.8.165:80 184.42.15.16:1305 135.22.8.165:80 184.42.15.16:1323 135.22.10.15:21 Para que se pueda crear una conexión, el extremo del servidor debe hacer una apertura pasiva del puerto (escuchar su puerto y quedar a la espera de conexiones) y el cliente, una apertura activa en el puerto del servidor (conectarse con el puerto de un determinado servidor). Se puede utilizar el comando netstat para conocer las conexiones abiertas en un momento dado. Este comando también muestra estadísticas de los distintos protocolos de Internet. 4.3.4. Establecimiento de una conexión Antes de transmitir cualquier información utilizando el protocolo TCP es necesario abrir una conexión. Un extremo hace una apertura pasiva y el otro, una apertura activa. El mecanismo utilizado para establecer una conexión consta de tres vías. 7-41 Sistemas y Comunicaciones Eventos en la localidad 1 Eventos en la loalidad 2 Mensajes en la red Envío deSYN seq = x Recepción del segmento SYN Envío de SYN seq = y, ACK x +1 Recepción de SYN + segmento ACK Envío de CK y + 1 Recepción del segmento ACK 1. La máquina que quiere iniciar la conexión hace una apertura activa enviando al otro extremo un mensaje que tenga el “bit” SYN activado. Le informa además del primer número de secuencia que utilizará para enviar sus mensajes. 2. La máquina receptora (un servidor generalmente) recibe el segmento con el “bit” SYN activado y devuelve la correspondiente confirmación. Si desea abrir la conexión, activa el “bit” SYN del segmento e informa de su primer número de secuencia. Deja abierta la conexión por su extremo. 3. La primera máquina recibe el segmento y envía su confirmación. A partir de este momento puede enviar datos al otro extremo. Abre la conexión por su extremo. 4. La máquina receptora recibe la confirmación y entiende que el otro extremo ha abierto ya su conexión. A partir de este momento puede enviar ella también datos. La conexión ha quedado abierta en los dos sentidos. Observamos que son necesarios 3 segmentos para que ambas máquinas abran sus conexiones y sepan que la otra también está preparada. En cada sentido de la comunicación se utilizan números de secuencia distintos. Como hemos visto, el primer número para cada sentido se acuerda al establecer la comunicación. Cada extremo se inventa un número aleatorio y envía éste como inicio de secuencia. Observamos que los números de secuencia no comienzan entonces en el cero. ¿Por qué se procede así? Uno de los motivos es para evitar conflictos: supongamos que la conexión en un ordenador se interrumpe nada más empezar y se crea una nueva. Si ambas han empezado en el cero es posible que el receptor entienda que la segunda conexión es una continuación de la primera (si utilizan los mismos puertos). 4.3.5. Cierre de una conexión Cuando una aplicación ya no tiene más datos que transferir, el procedimiento normal es cerrar la conexión utilizando una variación del mecanismo de 3 vías explicado anteriormente. 7-42 El Modelo de Referencia de Interconexión de Sistemas Abiertos (OSI) de ISO Eventos enla localidad 1 Mensajes en la red Eventos en la localidad 2 (la aplicación cierra la conexión) Envío de FIN seq = x Recepción de segmento ACK Recepción de FIN + segmento ACK Envío de ACK y + 1 Recepción del segmento FIN Envío deACK x + 1 (la aplicación informa) (la aplicación cierra la conexión) Envío de FIN seq = y, ACK x + 1 Recepción del segmento ACK El mecanismo de cierre es algo más complicado que el de establecimiento de conexión debido a que las conexiones son “full-duplex” y es necesario cerrar cada uno de los dos sentidos de forma independiente. 5. 1. La máquina que ya no tiene más datos que transferir envía un segmento con el “bit” FIN activado y cierra el sentido de envío. Sin embargo, el sentido de recepción de la conexión sigue todavía abierto. 2. La máquina receptora recibe el segmento con el “bit” FIN activado y devuelve la correspondiente confirmación. Pero no cierra inmediatamente el otro sentido de la conexión sino que informa a la aplicación de la petición de cierre. Aquí se produce un lapso de tiempo hasta que la aplicación decide cerrar el otro sentido de la conexión. 3. La primera máquina recibe el segmento ACK. 4. Cuando la máquina receptora toma la decisión de cerrar el otro sentido de la comunicación, envía un segmento con el “bit” FIN activado y cierra la conexión. 5. La primera máquina recibe el segmento FIN y envía el correspondiente ACK. Observemos que aunque haya cerrado su sentido de la conexión sigue devolviendo las confirmaciones. 6. La máquina receptora recibe el segmento ACK. IPV6 Se podría decir que IPv4 ostenta el récord de persistencia en el mundo de las tecnologías, porque tiene más de 30 años de antigüedad. A principios de 2010, quedaban menos del 10 % de direcciones IPv4 sin asignar. Tras tan larga andadura, el protocolo IPv4 empieza a mostrar signos de debilidad, como son: — Agotamiento de las direcciones IP actuales. 7-43 Sistemas y Comunicaciones — Asignación a cada “host” de una dirección IP dependiente de la red en la que se encuentre. Esto obliga a reconfigurar las direcciones IP de usuarios que utilizan ordenadores portátiles para conectarse a distintas redes. — Poca seguridad. El progresivo agotamiento de las direcciones IPv4 se debe al aumento de dispositivos conectados a Internet frente al formato de direcciones de 4 “bytes” (32 bits) y a la elevada cantidad de direcciones que se desaprovechan con el sistema de direccionamiento actual (recuérdese el apartado de direcciones especiales y reservadas). Sin embargo, este agotamiento no ha sido tan grave como se esperaba en un principio, debido a la utilización de direcciones IP privadas junto a mecanismos de traducción entre 1 pública y muchas privadas (NAT). Las especificaciones de Ipv6 se definen en varias RFCs pero las más significativas son la RFC 2460, que especifica el protocolo en cuanto al formato de cabecera fija y cabeceras de extensión y la RFC 2373 en la que se especifica el nuevo direccionamiento. Las principales ventajas de IPv6 son: 7-44 — Capacidad de direccionamiento ampliada. Ipv6 incrementa el tamaño de la dirección desde los 32 “bits” a los 128 “bits”, para dar soporte a más niveles de jerarquías de direccionamiento, un mayor número de nodos direccionables, y a una autoconfiguración más sencilla de las direcciones. La escalabilidad del encaminamiento multicast se ve incrementada por la inclusión de un campo “scope” (finalidad) a las direcciones multicast addresses. Y se define un nuevo tipo de dirección denominada “anycast address”, usada para enviar un paquete a cualquiera de un grupo de nodos. — Configuración automática de “hosts”. Un “host” IPv6 puede establecer su propia dirección IP sin necesidad de un servidor DHCP. Basta con conectarlo a la red y automáticamente se configura. Para la construcción de la dirección IPv6 se utiliza la dirección física del adaptador del red. — Simplificación del formato de cabecera. Algunos campos de la cabecera de Ipv4 han sido eliminados o convertidos en opcionales para reducir el coste de proceso normal de los paquetes y limitar el coste en ancho de banda de la cabecera Ipv6. Esto agiliza el tratamiento de los datagramas por parte de los routers. Se pueden definir opciones dentro del datagrama, pero en lugar de hacerse dentro de la cabecera del datagrama IP se hace en su campo de datos incluyendo aquí las cabeceras que sean necesarias (cabecera de fragmentación, cabecera de encaminamiento, cabecera AH, etc.) y finalizando con los datos del datagrama. — Mayor soporte para extensiones y opciones. Los cambios en la forma en que se codifican las opciones de la cabecera IP permiten una transmisión más eficiente, menos limitaciones para la longitud de las opciones y mayor flexibilidad para incluir nuevas opciones en un futuro. El Modelo de Referencia de Interconexión de Sistemas Abiertos (OSI) de ISO — Capacidad de etiquetado de flujo. Se ha añadido una nueva posibilidad para permitir el etiquetado de paquetes pertenecientes a un determinado “flujo” de tráfico para el que el emisor requiere de un manejo especial, como una calidad diferente de la de por defecto o servicio en tiempo real. — Utilidades de autenticación y privacidad. Extensiones para dar soporte de autenticación, integridad de los datos y opcionalmente confidencialidad de los datos. Se incluyen extensiones para autentificación, integridad de datos y confidencialidad mediante la inclusión de cabeceras especiales en el datagrama IP. Estas cabeceras pueden ser de tipo AH (Authentication Header, cabecera de autentificación) o de tipo ESP (Encapsulating Security Payload, carga de seguridad de encapsulación). 5.1. Formato de cabecera Ipv6 Versión Clase de tráfico Etiqueta de flujo Tamaño de carga útil Siguiente encabezado Límite de salto Dirección de origen Dirección de destino — Versión. Numero de versión de Internet Protocol (4 bits). Su valor es 6. — Clase de tráfico. Campo de clase de tráfico (8 bits). — Etiqueta de flujo (20 “bits”). — Longitud de carga útil. Entero sin signo de 16 “bits”. Longitud de la carga útil IPv6, es decir, el resto del paquete que sigue a esta cabecera IPv6, en octetos. (notar que cuales quiera de las cabeceras de extensión presente es considerada parte de la carga útil, es decir, incluida en el conteo de la longitud). — Cabecera siguiente. Selector de 8 “bits”. Identifica el tipo de cabecera que sigue inmediatamente a la cabecera IPv6. Utiliza los mismos valores que el campo Protocolo del IPv4 [RFC-1700]. — Limite de salto (TTL). Entero sin signo de 8 “bits”. Decrementado en 1 por cada nodo que reenvía el paquete. Se descarta el paquete si el Límite de saltos es decrementado hasta cero. — Dirección de origen. Dirección de 128 “bits” del originador del paquete. 7-45 Sistemas y Comunicaciones — Dirección destino. Dirección de 128 “bits” del recipiente pretendido del paquete (posiblemente no el último recipiente, si está presente una cabecera Enrutamiento). Se han mejorado las cabeceras de los paquetes, eliminado algunos campos de la cabecera Ipv4, haciendo que otros sean opcionales y utilizando cabeceras de extensión. Las cabeceras de extensión son cabeceras separadas que, con una excepción, no las examina ningún “host” en la ruta desde el origen al destino, mejorando la eficiencia del enrutamiento. También permite una mayor flexibilidad en la codificación de opciones y capacidades de expansión para opciones futuras. En Ipv6 se introduce el etiquetado de flujos, lo que permite indicar que los paquetes pertenecen a determinado “flujo” de tráfico, de esta forma se permite manejar QoS y la administración de ancho de banda sin tener que analizar cabeceras de TCP ni de UDP. 5.2. 7-46 Características de Ipv6 — La nueva versión debe ser capaz de coexistir e interoperar con las especificaciones actuales de Ipv4. — Admite un espacio de direccionamiento exponencialmente mayor que Ipv4. — Los paquetes de Ipv6 son más ligeros para facilitar la transmisión por distintos medios. — IPv6 retiene la mayoría a de los conceptos básicos de IPv4. — Al igual que IPv4, IPv6 es un servicio de entrega de datagramas no confiable y sin conexión. — El formato de los datagramas en IPv6 es muy diferente al de IPv4. — IPv6 provee nuevas funcionalidades como autentificación y seguridad. — IPv6 organiza cada datagrama como una secuencia de encabezados seguida de datos. — Un datagrama siempre comienza con un encabezado base de 40 octetos, el cual contiene las direcciones fuente y destino y un identificador de flujo. — El encabezado base puede estar seguido de 0 o más encabezados de extensión, seguido de datos. — Los encabezados de extensión son opcionales; IPv6 los usa para codificar la mayoría de las opciones de IPv4. — Las direcciones en IPv6 son de 128 “bits”. — Las direcciones están divididas en tipos, de manera análoga a las clases en IPv4. El Modelo de Referencia de Interconexión de Sistemas Abiertos (OSI) de ISO 5.3. Direccionamiento IPv6 El direccionamiento se encuentra especificado en la RFC 2373. Las direcciones IPv6 son identificadores de 128 “bits” (16 bytes) para “interfaces” y conjuntos de “interfaces”. Las direcciones IPv6 tienen un ámbito de validez (local de enlace y sitio o global) y un tiempo de vida. Hay tres tipos de direcciones: — Unicast: identifica unívocamente una interfaz de un nodo IPv6. Un paquete dirigido a una dirección unicast se envía a la interfaz asociada a esa dirección. — Multicast: identifica un grupo de interfaces IPv6. Un paquete dirigido a una dirección multicast es procesado por todos los miembros del grupo. — Anycast: se asigna a múltiples interfaces (típicamente en múltiples nodos). Un paquete dirigido a una dirección anycast es enviado a sólo una de esas interfaces (normalmente, la más próxima desde el punto de vista de latencia). Además: — No hay direcciones de broadcast => Su función es sustituida por direcciones multicast. — Las direcciones IP se asignan a “interfaces” (como en IPv4) — — • Cada interfaz necesita, al menos, una dirección “unicast”. • Una interfaz puede tener asignadas múltiples direcciones de cualquier tipo (unicast, multicast o anycast). • Un nodo se identifica por cualquier dirección de cualquiera de sus “interfaces”. • También es posible asignar la misma dirección unicast a múltiples “interfaces” (p.e. para compartir carga), pero debe ser soportado por el “hw” y “sw”. Una dirección IPv6 se divide en tres partes: • Prefijo de enrutamiento global (n “bits”): identifica una dirección especial (p.ej. multicast) o un rango de direcciones asignado a un sitio. • Identificador de subred (m “bits”): identifica un enlace (subred) dentro de un sitio. Cada enlace tendrá su identificador y un enlace puede disponer de múltiples identificadores. • Identificador de interfaz (128-n-m): identifica una interfaz dentro del enlace. Debe ser único. En ocasiones esta parte tiene un tamaño de 48 “bits” y corresponde a la dirección MAC de una interfaz. Prefijo: Indica grupos de direcciones que comparten un mismo valor para los primeros “bits”. La notación es: dirección_IPv6/número_de_“bits”_comunes. Ejemplos: 4000::/3; 5A00::/8; 5A01:0203:0400::/40. 7-47 Sistemas y Comunicaciones — — Como ya hemos comentado, las direcciones IPv6 tienen un tamaño de 128 “bits” (16 bytes). El formato es de 8 bloques de 16 “bits” expresados en hexadecimal y separados por “:”. Por ejemplo: • FEDC:BA98:7654:3210:FEDC:BA98:7654:3210 • FE80:0000:0000:0000:0202:B3FF:FE1E:8329 Se pueden eliminar los ceros por la izquierda en cada bloque, por lo que la última dirección del ejemplo anterior quedará como: • — Para simplificar aún más, se pueden eliminar bloques consecutivos de ceros utilizando el carácter “::”, pero este carácter sólo puede aparecer una vez en la dirección: • — FE80:0:0:0:202:B3FF:FE1E:8329 FE80::202:B3FF:FE1E:8329 Otro ejemplo: • CAFF:CA01:0000:0056:0000:ABCD:EF12:1234 • CAFF:CA01::56:0:ABCD:EF12:1234 • CAFF:CA01:0:56::ABCD:EF12:1234 5.3.1. Direcciones especiales 7-48 — Dirección de Loopback. 0:0:0:0:0:0:0:1 => ::1 => ::1/128 — Dirección sin especificar. 0:0:0:0:0:0:0:0 => :: => ::/128 (por ejemplo en el campo dirección origen del datagrama, corresponde a un “host” que está iniciándose y aún no conoce su dirección). — Dirección Multicast: Comienzan por FF00:: y su prefijo es /8 — Dirección Multicast a toda la red (sustituye a broadcast) FF01::1 (a todos los nodos). — Link-local unicast (direcciones privadas): Comienzan por FE80:: y su prefijo es /10 (En el enlace todas las direcciones empezaran por: 1111111010). — Site-Local Unicast (direcciones privadas): Comienzan por FEC0:: y su prefijo es /10 (En el enlace todas las direcciones empezaran por: 1111111011). — Global unicast (direcciones públicas): Todas las demás. — Direcciones IPv6 compatibles con IPv4: Permiten la retransmisión de trafico IPv6 sobre infraestructuras IPv4 (túneles dinámicos de IPv6 sobre IPv4), de forma transparente: 96 “bits” a 0 + 32 “bits” (dirección Ipv4) => (::). El Modelo de Referencia de Interconexión de Sistemas Abiertos (OSI) de ISO — 6. Direcciones Ipv6 mapeadas desde Ipv4: Permiten que los nodos que solo soportan IPv4 puedan seguir trabajando en redes IPv6. 80 “bits” a 0 + 16 “bits” a 1 + 32 “bits” (dirección Ipv4) => (::FFFF:). Por ejemplo: • 205.2.30.4 (IP v4) • 0:0:0:0:0:FFFF:205.2.30.4 (IP v6). MPLS (MultiProtocol Label Switching) MPLS (MultiProtocol Label Switching) es una nueva tecnología de conmutación creada para proporcionar circuitos virtuales en las redes IP. Fue desarrollado por el IETF para unificar diferentes soluciones de conmutación multinivel, propuestas por distintos fabricantes a mitad de los 90. Esta tecnología ofrece capacidades de multiprotocolo, porque sus técnicas son aplicables a cualquier protocolo de nivel de transporte de datos (ATM, Frame Relay, PP Ethernet, etc.). Los objetivos establecidos por el IETF en la elaboración del estándar MPLS fueron: 6.1. — Funcionar sobre cualquier tecnología de transporte, no sólo ATM. — Soportar el envío de paquetes tanto unicast como multicast. — Ser compatible con el Modelo de Servicios Integrados del IETF, incluyendo el protocolo RSVP (Resource reSerVation Protocol). — Permitir el crecimiento constante de la Internet. — Ser compatible con los procedimientos de operación, administración y mantenimiento de las redes IP. Arquitectura 7-49 Sistemas y Comunicaciones Una red MPLS está compuesta por los siguientes elementos: — LSR: Label switching router: elemento que conmuta etiquetas. Los LSR representan el núcleo de la red MPLS. Son “routers” de gran velocidad, encargados de: • Participar en el establecimiento de los circuitos extremo-extremo de la red (LSP) utilizando un protocolo de señalización apropiado. • Conmutar rápidamente el tráfico en función de las etiquetas que tengan asignadas a través de los LSP establecidos. — LER: Label Edge Router: elemento que inicia o termina el túnel (pone y quita cabeceras MPLS). Son los encaminadores (routers) encargados de realizar la interfaz con otras redes. — LSP: Label switched Path: nombre genérico de un circuito virtual MPLS. Los LSPs son símplex, es decir, se establecen para un sentido del tráfico en cada punto de entrada a la red (el tráfico dúplex requiere dos LSPs, uno en cada sentido). Cada LSP se crea a base de concatenar uno o más saltos (hops) desde el LER de entrada al LER de salida, atravesando los LSR que sean necesarios. — FEC: Forwarding Equivalence Class: conjunto de paquetes que se envían sobre el mismo LSP, ya que comparten unas mismas características para su transporte. Cada FEC puede representar unos requerimientos de servicio para un conjunto de paquetes o para una dirección fija. La clase FEC a la cual se asigna el paquete se codifica como un campo de unos pocos “bits”, de longitud fija, conocido como etiqueta (label), y que se añade a la cabecera del mismo. — Protocolo de distribución de etiquetas: Protocolo utilizado para establecer los LSP sobre los conmutadores MPLS. Habitualmente se trata de LDP (Label Distribution Protocol). Para incorporar requisitos de calidad de servicio se utilizan otros como RSVP-TE (extensión de RSVP-Resource reSerVation Protocol para ingeniería de tráfico) o CR-LDP (Constrain-based Routing LDP). Cuando se implementa MPLS sobre un protocolo de transporte de datos (nivel 2) que contiene un campo para la identificación de circuitos virtuales (como ATM, con los campos VPI/CVI, o Frame Relay, con el campo DLCI), se pueden utilizar dichos campos para las insertar las etiquetas MPLS. Lo mismo ocurre si el protocolo de nivel 3 utilizado es IPv6, que habilita en su cabecera el espacio necesario para implementar MPLS. Por el contrario, si la tecnología empleada no soporta un campo para etiquetas (por ejemplo, Ethernet o PPP), entonces se emplea una cabecera genérica MPLS de 4 octetos, que contiene un campo específico para la etiqueta y que se inserta entre la cabecera del nivel 2 y la del nivel 3 (paquete IPv4). 7-50 El Modelo de Referencia de Interconexión de Sistemas Abiertos (OSI) de ISO 6.2. Aplicaciones de MPLS Las principales aplicaciones que tiene MPLS hoy en día son: — Ingeniería de tráfico. — Diferenciación de niveles de servicio mediante clases (Class of Service). — Servicio de redes privadas virtuales (VPN). 7-51 Tema 8 Internet: Origen, evolución y estado actual. Servicios: correo electrónico, WWW, FTP, Telnet. Protocolos HTTP, HTTPS y SSL. Sistemas y Comunicaciones Guión-resumen 1. Internet: Origen, evolución y estado actual 1.1. Origen y evolución 4.1. Identificadores de recursos: URI, URL y URN 1.2. Organizaciones 4.2. Navegación WWW 1.3. Arquitectura 4.3. Correo electrónico 1.4. La Web 2.0. Herramientas de trabajo colaborativo 4.4. FTP 1.5. La Web Semántica 2. Redes IP 3. Sistemas de nombres de dominio (DNS) 3.1. Necesidad de DNS 3.2. Espacio de nombres de dominio 3.3. Dominios de primer nivel 3.4. Normativa de sintaxis según Red.es 3.5. Zonas de autoridad 3.6. Tipos de servidores DNS 3.7. Resolución de nombres de dominio 8-2 4. Servicios de Internet 4.5. Noticias 4.6. Telnet 4.7. IRC 4.8. Servicios antiguos 4.9. Nuevos servicios Internet: Origen, evolución y estado actual 1. Internet: Origen, evolución y estado actual 1.1. Origen y evolución A principios de los años 70, cuando se produjo el nacimiento de Internet, posiblemente nadie imaginase la repercusión y la difusión que llegaría a alcanzar años después. En los primeros años la red Internet era únicamente utilizada para investigación. Posteriormente, comenzó su implantación en grandes empresas y, en la actualidad, está cubriendo poco a poco todos los hogares. La disminución de los costes de acceso está siendo decisivo para la definitiva popularización de la Red. Pero, ¿qué es Internet? Lo podemos definir sencillamente como la mayor red pública de redes TCP/IP. Esto es: un conjunto de redes TCP/IP conectadas entre sí. La historia de Internet está estrechamente ligada a la de la pila de de protocolos TCP/IP, que estudiamos en el tema anterior. En España, Internet comenzó a implantarse a finales de los 80, a través del programa IRIS (Interconexión de los Recursos Informáticos). En el año 1991, cuando se consideró que IRIS había finalizado su etapa de promoción y lanzamiento, se transformó en lo que es actualmente RedIRIS (www.rediris.es): la red académica y de investigación nacional, patrocinada por el Plan Nacional de I+D+I (Ministerio de Educación y Ciencia) y gestionada por la Entidad Pública Empresarial Red.es (adscrita al Ministerio de Industria, Turismo y Comercio). En 1991 surgió Goya, el primer proveedor español de acceso privado a Internet. Entre 1992 y 1994 se conectaron a Internet la mayor parte de las universidades y comenzó a aumentar el número de servicios y proveedores de acceso. 1995 fue el año definitivo para la popularización de Internet en España y también la fecha del nacimiento de InfoVía, una red TCP/IP de ámbito nacional perteneciente a Telefónica y conectada a Internet, que redujo los costes de acceso a los usuarios que deseaban conectarse a Internet y no tenían un proveedor de acceso en su ciudad (nodo local). De esta forma, el coste de la conexión a Internet se reducía al precio de una llamada local durante el tiempo que estuviésemos conectados. Los siguientes hitos para la difusión de Internet entre los usuarios domésticos en España han sido las tarifas planas de RTB y posteriormente, las conexiones de alta velocidad (ADSL y cable). 1.2. Organizaciones Entre las organizaciones que conforman el Ecosistema de Internet tal y como la describe la ISOC, Internet Society, se incluyen: — Técnicos, ingenieros, arquitectos, creativos, organizaciones como por ejemplo la Fuerza de Tareas de Ingeniería de Internet (IETF) y el Consorcio World Wide Web (W3C) que ayudan a coordinar e implementar estándares abiertos. — Organizaciones locales y globales que gestionan recursos para funciones de asignación de direcciones globales, tales como la Corporación de Internet para la Asignación de Nombres y Números 8-3 Sistemas y Comunicaciones (ICANN), incluida la Autoridad para la Asignación de Números de Internet (IANA), los Registros Regionales de Internet (RIR) y los Registradores y Registros de Nombres de Dominios. — Operadores, ingenieros y proveedores que ofrecen servicios de infraestructura de red, como por ejemplo proveedores de Servicio de nombres de dominio (DNS), operadores de redes y puntos de intercambio de tráfico en Internet (IXP). — Usuarios de Internet que utilizan Internet para comunicarse entre sí y ofrecer servicios. — Educadores que ofrecen formación y crean capacidad para desarrollar y utilizar tecnologías de Internet, tales como organizaciones multilaterales, instituciones educativas y agencias gubernamentales. — Políticos encargados de tomar decisiones que promueven el desarrollo de políticas locales y globales, y ofrecen gobernanza. 1.3. Arquitectura Internet es un conjunto descentralizado de redes de comunicación interconectadas que utilizan una familia común de protocolos. La utilización de esta familia común de protocolos garantiza que las redes físicas heterogéneas que componen Internet funcionen como una única red global. Es decir, aunque Internet se comporte como una red global única a la que pueden conectarse millones de dispositivos distintos (sistemas finales), realmente está formada por miles de redes de comunicación diferentes, cada una de ellas con su propia arquitectura, medio físico y tecnología. Existen numerosos servicios que pueden ser ofrecidos a través de Internet, siendo el más popular la World Wide Web (WWW), comúnmente conocido como la web. 1.4. La Web 2.0. Herramientas de trabajo colaborativo El modelo de negocio de la Web 1.0 se limitaba a un espacio de publicación de contenidos corporativos y de servicios, sin participación abierta ni gratuidad en contenidos o servicios de alta relevancia. Las comunidades se formaban fundamentalmente a partir de la oferta de servicios, prescindiendo de espacios para que los miembros publicaran contenidos. Es decir, los usuarios fueron relevantes en tanto eran consumidores. La lección básica de la Web 2.0 es hacer uso del autoservicio del cliente y de la gestión de datos algorítmica para llegar a toda la web, a los extremos y no sólo al centro, a “la larga cola” (“the long tail”) y no sólo a la cabeza, basándose en el principio dominante de la Web 2.0: el servicio mejora automáticamente cuanta más gente lo use. Principales características: 1. 8-4 Los usuarios deben ser tratados como co-desarrolladores, considerando las prácticas de desarrollo del software abierto. De hecho, la Internet: Origen, evolución y estado actual máxima del “software” abierto “libera pronto y libera frecuentemente”, ha derivado hacia una posición aún más radical, “la versión beta perpetua”, en la cual se desarrolla el producto continuamente, incorporando nuevas funcionalidades mensual, semanal, o incluso diariamente. No es ninguna casualidad que servicios como por ejemplo Gmail, Google Maps, Flickr, delicious y similares sigan siendo “Beta” durante años. 2. Se buscan modelos de programación ligeros que permiten sistemas débilmente acoplados. 3. Innovación en el ensamblado: Cuando los componentes “commodity” son abundantes, se puede crear valor simplemente ensamblándolos de forma novedosa o eficaz. 4. Cualquier aplicación web se puede considerar “software” no limitado a un solo dispositivo. 5. Aprovechar la inteligencia colectiva como por ejemplo Wikipedia, en donde, cualquier usuario puede editar una página y contribuir con su conocimiento mediante una distribución mundial. 6. La gestión de la base de datos como competencia básica. 7. Herramientas colaborativas: a. Social Networking: describe todas aquellas herramientas diseñadas para la creación de espacios que promuevan o faciliten la conformación de comunidades e instancias de intercambio social. i. Facebook ii. Twiter iii. Tuenti iv. Myspace b. Contenidos: hace referencia a aquellas herramientas que favorecen la lectura y la escritura en línea, así como su distribución e intercambio de contenidos generados por el usuario. i. Blogs 1. www.blogger.com 2. blogspot.com 3. blogalia.com ii. Contenidos 1. wordpress.org 8-5 Sistemas y Comunicaciones 2. dupral.org 3. joomla.org iii. Wikis 1. wikispaces.com 2. www.mediawiki.org iv. Documentos similares a MS-Office 1. thinkfree.com 2. docs.google.com 3. www.goffice.com 4. www.writeboard.com v. De fotos 1. www.flickr.com 2. picasa.google.com 3. photobucket.com vi. De videos: 1. www.youtube.com 2. www.dalealplay.com vii. Calendarios 1. calendar.google.com 2. calendar.msn.com 3. calendar.yahoo.com viii. Diapositivas: 1. c. 8-6 slideshare.net (presentación de diapositivas) Organización Social e Inteligente de la Información: herramientas y recursos para etiquetar, sindicar e indexar, que facilitan el orden y almacenamiento de la información, así como de otros recursos disponibles en la Red. A esta libertad del usuario para etiquetar la información se ha bautizado con el nombre de “folksonomía”. Por ejemplo, la indexación por popularidad que hace Google. Opiniones de lectores como hace Amazon... Los estándares de sindicación Internet: Origen, evolución y estado actual utilizados son RSS (Really Simple Syndication en formato XML), Atom (en formato XML), RDF (Resource Description Framework) y OPML (Outline Processor Markup Language, en formato XML). i. Buscadores: 1. www.google.com 2. www.yahoo.com 3. www.bing.com 4. www.search.com ii. Agregadores Feeds (RSS) 1. http://feedburner.com 2. http://alesti.org 3. www.feedblitz.com 4. www.feedreader.com 5. www.feedster.com 6. www.google.com/reader 7. www.my.yahoo.com 8. www.simplefeed.com iii. Marcadores Sociales de Favoritos (Social Bookmark) y Nubes de Tags d. 1. http://del.icio.us 2. www.stumbleupon.com 3. http://connotea.org 4. http://bluedot.us 5. http://digg.com Aplicaciones y servicios (mashup): dentro de esta clasificación se incluye un sin número de herramientas, “software”, plataformas en línea y un híbrido de recursos creados para ofrecer servicios de valor añadido al usuario final. i. www.meebo.com ii. http://earth.google.com iii. http://gmail.google.com 8-7 Sistemas y Comunicaciones 1.5. iv. www.tagzania.com v. www.panoramio.com vi. www.dotproject.net vii. www.eproject.com viii. www.projectplace.com ix. www.projectscenter.com La Web Semántica Se podría identificar la Web semántica como una forma de Web 3.0. Existe una diferencia fundamental entre ambas versiones de web (2.0 y semántica) y es el tipo de participante y las herramientas que se utilizan. La 2.0 tiene como principal protagonista al usuario humano que escribe artículos en su blog o colabora en un “wiki”. El requisito es que además de publicar en HTML emita parte de sus aportaciones en diversos formatos para compartir esta información como son los RSS, ATOM, etc. mediante la utilización de lenguajes estándares como el XML. La Web semántica, sin embargo, está orientada hacia el protagonismo de procesadores de información que entiendan de lógica descriptiva en diversos lenguajes más elaborados de metadatos como SPARQL, POWDER u OWL (Ontology Web Language) que permiten describir los contenidos y la información presente en la web, concebida para que las máquinas “entiendan” a las personas y procesen de una forma eficiente la avalancha de información publicada en la Web. 2. Redes IP Una red IP es una red de ordenadores que utiliza el protocolo TCP/IP para sus comunicaciones. Internet es una red IP. Las intranets que utilizan las empresas son también redes IP. Sin embargo, el término de red IP referido a operadoras telefónicas describe una red que ocupa todo el territorio nacional y que ofrece servicios de conectividad a empresas y usuarios finales. Las principales redes IP desplegadas en España son: — Infovía Plus y UNO-IP de Telefónica. — Retenet de Retevisión. — Global IP de Global One, subsidiaria de France Telecom, Deutsche Telekom y Sprint. — Interpista e Intrapista de BT. Los llamados “Puntos Neutros de Acceso a Internet” o Internet Exchange Point (IXP) es una infraestructura física de red operada por una entidad con el objeto de facilitar el intercambio de tráfico de Internet entre los distintos proveedores. De esta forma, se evita que el tráfico entre dos puntos recorra una distancia 8-8 Internet: Origen, evolución y estado actual mayor y, por tanto, se acelera la comunicación. Además, al reducirse el volumen de tráfico de datos en las redes troncales o principales de los operadores, también se reducen los costes, dejando libre más ancho de banda para las comunicaciones que sí necesitan transitar por dichas troncales. En España, actualmente existen los siguientes puntos: — Catalunya Neutral Internet Exchange (CATNIX), Barcelona. — Nap de las Americas (Terremark), Madrid. — España Internet Exchange (ESPANIX), Madrid. — Galicia Neutral Internet Exchange (GALNIX), Santiago de Compostela. — Punto Neutro Vasco (EuskoNIX), San Sebastián. El primer Punto Neutro Español fue Espanix. Permite que los ISP asociados intercambien entre ellos su tráfico, mejorando la calidad de servicio ofrecida a sus clientes. Para ser miembro de Espanix, los proveedores de Internet deben disponer de una infraestructura internacional de conexión a Internet. Algunos de los miembros de Espanix son Telefónica Data, Jazztel, NTT/Verio, RedIRIS, Retevisión, Uni2 y Ono. 3. Sistemas de nombres de dominio (DNS) En el tema anterior estudiamos la pila de protocolos TCP/IP. Vimos que cada “host” tiene una dirección IP que le identifica de forma unívoca en una red de redes. Las direcciones IP constan de 4 “bytes” en IPv4 (versión actual) y de “16 bytes” en la versión IPv6. Sin embargo, nosotros no trabajamos directamente con direcciones IP sino con nombres de dominio del estilo de www.adams.es o ftp.microsoft.com. Para que esto pueda ser posible es necesario un proceso previo de conversión de nombres de dominio a direcciones IP, ya que el protocolo IP requiere direcciones IP al enviar sus datagramas. Este proceso se conoce como resolución de nombres. DNS se encapsula sobre TCP o UDP ambos en el puerto 53. 3.1. Necesidad de DNS En los orígenes de Internet, cuando sólo había unos cientos de ordenadores conectados, la tabla con los nombres de dominio y direcciones IP se encontraba almacenada en un archivo llamado “hosts” que residía en un ordenador central. El resto de ordenadores tenían que consultarle a éste cada vez que necesitaban resolver un nombre. El archivo hosts contenía una estructura plana de nombres: 127.0.0.1 localhost 129.168.0.1 router 192.168.0.2 servidor 192.168.0.31 maria 8-9 Sistemas y Comunicaciones Este método funcionó bien en un principio ya que el número de actualizaciones era pequeño. Sin embargo, a medida que se fueron conectando más ordenadores a la red comenzaron los problemas: el fichero “hosts” comenzó a ser demasiado extenso y el mantenimiento se volvió complicado. Se requería más de una actualización diaria y el tráfico de la red hacia este ordenador llegaba a saturarlo. Es por ello que fue necesario diseñar un nuevo sistema de resolución de nombres que distribuyese el trabajo entre distintos servidores. Se ideó un sistema jerárquico de resolución conocido como DNS (Domain Name System, sistema de resolución de nombres). 3.2. Espacio de nombres de dominio El espacio de nombres de dominio es una estructura jerárquica con forma de árbol que clasifica los distintos dominios en niveles. A continuación se muestra una pequeña parte del espacio de nombres de dominio de Internet: Dominio raíz ucm aq com edu es upm fi org ibm op www.upm.es www.ibm.es www.fi.upm.es El punto más alto de la jerarquía es el dominio raíz. Los dominios de primer nivel (es, edu, com...) parten del dominio raíz y los dominios de segundo nivel (upm, ucm, microsoft...), de un dominio de primer nivel; y así sucesivamente. Cada uno de los dominios puede contener tanto hosts como más subdominios. Un nombre de dominio es una secuencia de nombres separados por el carácter delimitador punto. La palabra situada más a la izquierda es el nombre del “host” o bien un alias suyo. Por ejemplo, www.fi.upm.es. Esta máquina, llamada www, pertenece al dominio fi (Facultad de Informática) que a su vez pertenece al dominio upm (Universidad Politécnica de Madrid) y éste, a su vez, al dominio es (España). Generalmente cada uno de los dominios es gestionado por un servidor distinto; es decir, tendremos un servidor para el dominio aq.upm.es (Arquitectura), otro para op.upm.es (Obras Públicas), etc. 8-10 Internet: Origen, evolución y estado actual 3.3. Dominios de primer nivel El organismo que gestiona el sistema de nombres de dominio y el mantenimiento de los servidores DNS raíz es ICANN (Internet Corporation for Assigned Names and Numbers, corporación para la asignación de números y nombres de Internet, www.icann.org). Este organismo ya apareció en el tema anterior cuando estudiamos la gestión de direcciones IP. Para el registro de nombres de dominio en Internet, podemos encontrar también información en la página web de InterNIC (www.internic.net), sitio dependiente del ICANN. Los dominios de primer nivel (TLD, Top-Level Domains) han sido clasificados por el ICANN en los siguientes grupos: — Dominios regionales (ccTLDs, country-code TLDs). Están formados por dos letras. Más de 240 países y otras zonas geográficas tienen asignado un dominio regional. Ejemplos: .es (España), .fr (Francia), .de (Alemania), .ru (Rusia), .tw (Taiwán), .tv (Tuvalu). Se puede obtener un listado completo de todos los dominios regionales en la dirección http://www.iana.org/root-whois/. Cada país es responsable de gestionar el dominio que tiene asignado. — Dominios genéricos (gTLDs, generic TLDs). Están formados por tres o más letras. Dentro de estos dominios genéricos, existen tres categorías: • Genéricos de propósito general: Son gestionados directamente por la ICANN y están disponibles para cualquier persona o entidad para cualquier uso. En este grupo están incluidos entre otros .com, .net, .org e .info. Los tres primeros tenían inicialmente un público objetivo específico. Sin embargo, debido a su falta de restricciones y al hecho de que no había nadie que controlara su uso correcto, han adquirido un carácter comercial no siempre relacionado con su propósito inicial. Por otra parte, .info fue fletado expresamente con restricciones, aunque posteriormente fueron eliminadas y actualmente su uso es libre. • Genéricos-restringidos: Aunque son gestionados por la ICANN igual que los anteriores, su uso está restringido a unos determinados propósitos, lo que limita su utilización comercial. Dentro de este grupo están incluidos .biz, .name y .pro. El registro y uso dentro de estos dominios está condicionado al cumplimiento de una serie de requisitos. Por ejemplo, el dominio .pro solo puede ser utilizado por profesionales acreditados. • Patrocinados: Son dominios apoyados y gestionados por entidades independientes de la ICANN, aunque siguen una política y reglamentación fijada de forma compartida entre la ICANN y el organismo patrocinador. Estos dominios están destinados a un uso específico, por lo que su uso es restringido. Por ejemplo, el dominio .cat creado como dominio para la cultura e idioma catalanes, tiene expresamente prohibido su uso para páginas web de gatos (cat es gato en inglés), salvo que la página esté relacionada con la cultura o lengua catalana. El incumplimiento de la restricción da lugar a la pérdida del dominio. 8-11 Sistemas y Comunicaciones Algunos de estos dominios son los que se enumeran en la siguiente tabla: — .com (comercial) .name (personas individuales) .net (redes) .pro (profesionales) .org (organizaciones no lucrativas) .aero (industria aeronáutica) .edu (instituciones educativas) .coop (cooperativas) .gov (gobierno de EEUU) .museum (museos) .mil (ejército de EEUU) .travel (viajes) .int (internacional) .mobi (dispositivos móviles) .biz (negocios) .jobs (recursos humanos) .info (información) .cat (comunidad lingüística y cultural catalana) El dominio de primer nivel especial .arpa. Este dominio es utilizado por el ICANN para propósitos de infraestructura técnica. Entre los dominios anteriores, hay algunos como com, net y org que se pueden registrar sin restricciones, pero otros incluyen condiciones o peculiaridades concretas. Por ejemplo, el dominio .tv, pese a ser el dominio regional correspondiente a un desconocido archipiélago del Pacífico de 10.600 habitantes, se ha gestionado oportunamente para sacar partido de su coincidencia con la abreviatura de la palabra televisión. Por encima de los tres tipos listados anteriormente existen 13 servidores de DNS llamados “root servers” y son los siguientes: Hostname IP Addresses Manager a.root-servers.net 198.41.0.4, 2001:503:ba3e::2:30 VeriSign, Inc. b.root-servers.net 192.228.79.201, 2001:500:84::b University of Southern California (ISI) c.root-servers.net 192.33.4.12, 2001:500:2::c Cogent Communications d.root-servers.net 199.7.91.13, 2001:500:2d::d University of Maryland e.root-servers.net 192.203.230.10 NASA (Ames Research Center) f.root-servers.net 192.5.5.241, 2001:500:2f::f Internet Systems Consortium, Inc. g.root-servers.net 192.112.36.4 US Department of Defence (NIC) h.root-servers.net 128.63.2.53, 2001:500:1::803f:235 US Army (Research Lab) i.root-servers.net 192.36.148.17, 2001:7fe::53 Netnod j.root-servers.net 192.58.128.30, 2001:503:c27::2:30 VeriSign, Inc. k.root-servers.net 193.0.14.129, 2001:7fd::1 RIPE NCC l.root-servers.net 199.7.83.42, 2001:500:3::42 ICANN m.root-servers.net 202.12.27.33, 2001:dc3::35 WIDE Project 8-12 Internet: Origen, evolución y estado actual El comité asesor del sistema de servidores DNS raíz (en inglés DNS Root Server System Advisory Committee) es un comité de la ICANN, que por estatutos tienen autoridad sobre la operación del sistema. Sin embargo, la zona raíz es controlada por el Departamento de Comercio de Estados Unidos, que debe aprobar todos los cambios en el archivo de zona raíz solicitados por la ICANN. Para registrar un dominio hay que acudir a un registrador autorizado por el ICANN. Cada registrador contemplará unos dominios de primer nivel concretos. En el momento del registro de un dominio, hay que especificar un servidor DNS primario y al menos, un servidor DNS secundario. El dominio correspondiente a España, .es, está administrado por ES-NIC (www.nic.es), que es un departamento de la Entidad Pública Empresarial Red.es (www.red.es). Esto significa que si deseamos registrar un dominio .es deberemos acudir a la página web de ES-NIC. Se ofrecen dominios de segundo nivel dependientes de .es y también, a un precio inferior, dominios de tercer nivel dependientes de .com.es, .nom.es y .org.es. Desde la entrada en vigor del nuevo Plan Nacional de Nombres de Dominio, el 1 de junio de 2005, se aplican los siguientes criterios para las solicitudes de registros: — Un dominio se asigna de forma automática si se encuentra libre (salvo .gob.es y .edu.es). — Cualquier persona física o jurídica con intereses o vínculos con España tiene derecho a obtener el dominio. — Se han eliminado distintas restricciones que se contemplaban anteriormente. — Existe una serie de términos reservados que no se pueden utilizar para registrar nombres de segundo nivel (dependientes de .es). Estos nombres están relacionados con términos de Internet (ejemplos: email, java), organizaciones (UNESCO, ITU), órganos constitucionales (diputados, casareal) y topónimos (madrid, noruega). 3.4. Normativa de sintaxis según Red.es Los únicos caracteres permitidos para un nombre de dominio son: — Los pertenecientes al alfabeto español: de la “a” a la “z” — Los dígitos del 0 al 9 — El guión: “-” (No puede ser ni el primero ni el último carácter del nombre). — Caracteres multilingües: “á,à, é,è,í,ï,ó,ò,ú,ü,ñ,ç,l·l”. No hay distinción entre minúsculas y mayúsculas. 8-13 Sistemas y Comunicaciones Las longitudes máximas y mínimas de un nombre de dominio son: — Para los dominios de segundo nivel, un máximo de 63 y un mínimo de 3. — Para los dominios de tercer nivel, un máximo de 63 y un mínimo de 2. 3.5. Zonas de autoridad Una zona de autoridad es la porción del espacio de nombres de dominio de la que es responsable un determinado servidor DNS. La zona de autoridad de un servidor DNS abarca al menos un dominio y también pueden incluir subdominios; aunque generalmente los servidores de un dominio delegan sus subdominios en otros servidores. La información de la zona en un servidor DNS se almacena en archivos de zona. Estos archivos son de texto y están formados por registros de recursos, uno por línea, siendo los principales: 8-14 — SOA (inicio de autoridad). Contiene información de la zona, como la dirección de email del administrador, su número de serie y tiempos de actualización de los datos. — NS (servidor DNS): Name Server–(Servidor de Nombres) Define la asociación que existe entre un nombre de dominio y los servidores de nombres que almacenan la información de dicho dominio. Cada dominio se puede asociar a una cantidad cualquiera de servidores de nombres. — MX (servidor de correo): Mail Exchange–(registro de intercambio de correo) Asocia un nombre de dominio a una lista de servidores de intercambio de correo para ese dominio. Tiene un balanceo de carga y prioridad para el uso de uno o más servicios de correo. — A (dirección IPv4): Address–Este registro se usa para traducir nombres de servidores de alojamiento a direcciones IPv4. — AAAA (dirección IPv6): Address–Este registro se usa en IPv6 para traducir nombres de hosts a direcciones IPv6. — CNAME (nombre canónico o alias): Canonical Name–(nombre canónico) Se usa para crear nombres de servidores de alojamiento adicionales, o alias, para los servidores de alojamiento de un dominio. Es usado cuando se están corriendo múltiples servicios (como FTP y servidor web) en un servidor con una sola dirección IP. Cada servicio tiene su propia entrada de DNS (como ftp.ejemplo.com. y www.ejemplo.com.). Esto también es usado cuando se tienen múltiples servidores HTTP, con diferentes nombres, sobre el mismo host. Se escribe primero el alias y luego el nombre real. Ej. Ejemplo1 IN CNAME ejemplo2 — PTR = Pointer–(indicador) También conocido como 'registro inverso', funciona a la inversa del registro A, traduciendo IPs en nombres de dominio. Se usa en el archivo de configuración de la zona DNS inversa. Internet: Origen, evolución y estado actual 3.6. Tipos de servidores DNS Dependiendo de la configuración del servidor, éste puede desempeñar distintos papeles: — Servidores primarios (primary name servers). Estos servidores almacenan la información de su zona en una base de datos local. Son los responsables de mantener la información actualizada y cualquier cambio que afecte a su zona debe ser notificado a este servidor. — Servidores secundarios (secundary name servers). Son aquellos que obtienen los datos de su zona desde otro servidor que tenga autoridad para esa zona. El proceso de copia de la información se denomina transferencia de zona. — Servidores maestros (master name servers). Los servidores maestros son los que transfieren las zonas a los servidores secundarios. Cuando un servidor secundario arranca busca un servidor maestro y realiza la transferencia de zona. Un servidor maestro para una zona puede ser a la vez un servidor primario o secundario de esa zona. Estos servidores extraen la información desde el servidor primario de la zona. Así se evita que los servidores secundarios sobrecarguen al servidor primario con transferencias de zonas. — Servidores locales (caching-only servers). Los servidores locales no tienen autoridad sobre ningún dominio: se limitan a contactar con otros servidores para resolver las peticiones de los clientes DNS. Estos servidores mantienen una memoria caché con las últimas preguntas contestadas. Cada vez que un cliente DNS le formula una pregunta, primero consulta en su memoria caché. Si encuentra la dirección IP solicitada, se la devuelve al cliente; si no, consulta a otros servidores, apunta la respuesta en su memoria caché y le comunica la respuesta al cliente. Los servidores secundarios son importantes por varios motivos. En primer lugar, por seguridad debido a que la información se mantiene de forma redundante en varios servidores a la vez. Si un servidor tiene problemas, la información se podrá recuperar desde otro. Y en segundo lugar, por velocidad porque evita la sobrecarga del servidor principal distribuyendo el trabajo entre distintos servidores situados estratégicamente (por zonas geográficas, por ejemplo). 3.7. Resolución de nombres de dominio La resolución de un nombre de dominio se realiza comenzando desde el dominio raíz. Por ejemplo, para resolver el nombre servidor.adams.es, se dan los siguientes pasos: 1º. Se consulta a un servidor DNS raíz (existen 13 root servers en Internet) la IP de un servidor DNS del dominio .es; 2º. Se consulta al servidor DNS de .es, la IP del servidor DNS de adams.es; 3º. Se consulta al servidor DNS de adams.es la IP del “host” servidor.adams.es. 8-15 Sistemas y Comunicaciones Los clientes pueden realizar tres tipos de preguntas a los servidores DNS: recursivas, iterativas e inversas. — Preguntas recursivas. Si un cliente formula una pregunta recursiva a un servidor DNS, éste debe intentar por todos los medios resolverla aunque para ello tenga que preguntar a otros servidores. — Preguntas iterativas. Si, en cambio, el cliente formula una pregunta iterativa a un servidor DNS, este servidor devolverá o bien la dirección IP si la conoce o si no, la dirección de otro servidor que sea capaz de resolver el nombre. — Preguntas inversas. Una pregunta inversa permite conocer el nombre de dominio dada una dirección IP. Para evitar una búsqueda exhaustiva por todo el espacio de nombres de dominio, existe un dominio especial llamado in-addr.arpa. Cuando un cliente DNS desea conocer el nombre de dominio asociado a la dirección IP a.b.c.d, formula una pregunta inversa a d.c.b.a.in-addr.arpa. La inversión de los “bytes” es necesaria debido a que los nombres de dominio son más genéricos por la derecha, al contrario que ocurre con las direcciones. Las búsquedas DNS inversas para direcciones IPv6 utilizan el dominio especial ip6.arpa. Una dirección IPv6 aparece como un nombre en este dominio como una secuencia de nibbles (conjunto de cuatro dígitos binarios o medio octeto) en el orden inverso, representado en forma de dígitos hexadecimales como subdominios. Por ejemplo, el nombre de dominio del puntero correspondiente a la dirección IPv6 2001:db8::567:89ab es b.a.9.8.7.6.5.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.8.b.d.0.1.0 .0.2.ip6.arpa. Los usos más comunes de la DNS inverso son: 8-16 — El uso original de los rDNS: solucionar problemas de red a través de herramientas como traceroute, Ping, y el campo de encabezado para seguimiento “Recibido”: para el protocolo de e-mail SMTP, los sitios web de seguimiento de los usuarios (especialmente en foros de Internet), etc. — Una técnica de antispam: la comprobación de los nombres de dominio en los rDNS para ver si los usuarios pueden ser de redes de acceso telefónico, direcciones asignadas dinámicamente, u otros servicios de bajo costo de Internet. Los propietarios de este tipo de direcciones IP suelen asignarles nombres rDNS genéricos como 1-2-3-4-dinámica-ip.example.com. Dado que la gran mayoría, pero no todos, de los e-mail que se origina en estos equipos es “spam”, muchos filtros de “spam” rechazan e-mail con estos nombres rDNS.3 4 — Una “verificación forward-confirmed reverse DNS” (FCrDNS) puede crear una forma de autenticación que muestra una relación válida entre el titular de un nombre de dominio y el propietario del servidor que se ha dado una dirección IP. Aunque no es muy completo, esta validación es lo suficientemente fuerte como para ser utilizado a menudo para propósitos de crear listas blancas, sobre todo porque los “spammers” y Internet: Origen, evolución y estado actual “phishers” por lo general no pueden pasar esta verificación cuando se utilizan ordenadores zombies que falsifican dominios. — Registro del sistema o herramientas de monitoreo a menudo reciben las entradas con los dispositivos pertinentes especificados solamente por direcciones IP. Para proporcionar datos más utilizables por humanos, estos programas suelen realizar una búsqueda inversa antes de escribir el registro, escribiendo así un nombre en lugar de la dirección IP Se pueden hacer consultas a un determinado servidor DNS mediante la utilidad nslookup, cuyas opciones son las siguientes: Opción Uso NOMBRE Muestra la información de NOMBRE con el servidor predeterminado, siendo “NOMBRE” un host o un dominio de internet. NOMBRE SERVIDOR Igual que el anterior, pero en este caso se utiliza el servidor especificado en “SERVIDOR” para solicitar la información. server SERVIDOR Establece como SERVIDOR el servidor DNS predeterminado al que solicitarle las consultas, sustituye “SERVIDOR” por el nombre o dirección IP del servidor. lserver SERVIDOR Establece como “SERVIDOR” el servidor DNS predeterminado inicial, útil si el que se especificó anteriormente no puede resolver las consultas. root Ir a la raíz del servidor especificado como tal en el parámetro set root=. ls DOMINIO Muestra información o la escribe a un archivo, sustituye “DOMINIO” por el nombre de dominio o host solicitado. Opciones para su uso. set all Muestra todas las opciones disponibles. set [no]debug Muestra o no información más avanzada. set [no]d2 Muestra o no información aún más avanzada. set defname Añade nombre de dominio en cada consulta. set [no]recurse Solicitar o no respuesta de forma recursiva. set [no]vc Emplea o no TCP para consultas en vez de UDP. set puerto= Puerto (predeterminado 53). set type= Especifica el tipo de consulta, por ejemplo: A, ANY, CNAME, MX, NS, PTR, SOA, SRV (valor predeterminado A+AAAA). set querytype= Lo mismo que el anterior. set q= Lo mismo que el anterior. set class= Especifica la clase de la consulta, por ejemplo, IN (Internet), ANY(cualquiera), (valor predeterminado IN). set timeout= Especifica tiempo de espera en segundos (valor predeterminado 2). set retry= Especifica número de reintentos (valor predeterminado 1). 8-17 Sistemas y Comunicaciones set retry= Especifica número de reintentos (valor predeterminado 1). set root=SERVIDOR Especificar servidor raíz, sustituye "SERVIDOR" por el nombre o dirección IP del servidor DNS. set domain= Especifica el dominio o host predeterminado del que se realizarán todas las consultas. set [no]msxfr Usar o no transferencia de zona rápida MS. set [no]search Usar o no una lista de dominios para efectuar búsquedas. set srchlist= N1[/N2/.../N6] Especifica orden de los dominios usados para buscar. Veamos un ejemplo práctico: 1. Nos conectamos al servidor de DNS que nos proporcione nuestro ISP. C:\Users\Javier>nslookup DNS request timed out. timeout was 2 seconds. Servidor predeterminado: Address: 2. UnKnown 2111:3c:123:0:c:135:9a:a15 Vemos del anterior que ya se identifica con una dirección IPv6, ahora podemos, si queremos, cambiar a otro servidor de DNS, por ejemplo a uno de Google, el 8.8.8.8. > server 8.8.8.8 DNS request timed out. timeout was 2 seconds. Servidor predeterminado: Address: 3. 8.8.8.8 A continuación le preguntamos por la IP de un servidor web cualquiera como puede ser la del diario de noticias de “El Pais”. > www.elpais.es Servidor: Address: 8-18 [8.8.8.8] [8.8.8.8] 8.8.8.8 Internet: Origen, evolución y estado actual Respuesta no autoritativa: Nombre: a1749.g.akamai.net Addresses: 185.43.181.208 185.43.181.200 Aliases: www.elpais.es elpais.es.edgesuite.net 4. Del anterior observamos que indica una respuesta “No autoritativa”, es decir, que no posee autoridad directa sobre el nombre consultado” indicándonos las dirección IP que tiene 185.43.181.208 y 200. Ahora modificamos la información que queremos que nos proporcione de modo que nos mostrará los nombres de dominio de los servidores de DNS asociados en este caso a la web del diario “El Pais”. > set type=ns > www.elpais.es Servidor: Address: [8.8.8.8] 8.8.8.8 Respuesta no autoritativa: www.elpais.es canonical name = elpais.es.edgesuite.net elpais.es.edgesuite.net canonical name = a1749.g.akamai.net g.akamai.net primary name server = n0g.akamai.net responsible mail addr = hostmaster.akamai.com serial = 1435770670 refresh = 1000 (16 mins 40 secs) retry = 1000 (16 mins 40 secs) expire = 1000 (16 mins 40 secs) default TTL = 1800 (30 mins) > 8-19 Sistemas y Comunicaciones 4. Servicios de Internet En el tema anterior estudiamos detalladamente las capas de red y transporte del modelo TCP/IP. La capa de aplicación, la más próxima al usuario, se corresponde con los protocolos, servicios y aplicaciones que utiliza finalmente el usuario. Ya hemos estudiado el servicio de nombres de dominio (DNS) el cual se sitúa dentro de esta capa. 4.1. Identificadores de recursos: URI, URL y URN Las siglas URL se han asociado tradicionalmente con Universal Resource Locator (localizador de recurso universal). Consiste en una forma de nombrar un objeto en Internet, mediante un nombre que lo distinga del resto de objetos (por ejemplo, una página web). Sin embargo, en la RFC 2396, de agosto de 1998, se ofrece una especificación detallada de los identificadores de recursos: — URI (Uniform Resource Identifiers, identificadores de recursos uniformes). Son cadenas de caracteres que identifican recursos en Internet: páginas web, imágenes, archivos para descargar, servicios y otros recursos. La forma de representación es uniforme independientemente del método de acceso que se utilice para llegar al recurso (HTTP si es una página web, FTP si es un archivo, etc.) Un URI puede ser un localizador (URL), un nombre (URN) o en ambos. — URL (Uniform Resource Locator, localizador de recurso uniforme). Obsérvese que se ha modificado el significado de la “U” para indicar “uniforme” en lugar de “universal”. Son un subconjunto de los URI que identifica los recursos según su método de acceso. — URN (Uniform Resource Name, nombre de recurso uniforme). Subconjunto de los URI que identifica los recursos según su nombre o algún otro atributo suyo. Un URN debe ser único y permanente aunque el recurso deje de existir o no esté disponible. Los URN son relativamente nuevos y apenas se utilizan. Un URN es más fácil de recordar que un URL y es independiente a su localización o forma de acceso. Si movemos un archivo de un servidor a otro, el URN permanecerá constante, aunque su URL haya cambiado. Se necesita, por tanto, un servicio de directorio para relacionar cada URN con su actual URL. La sintaxis completa de un URI es algo compleja, aunque en general obedecen a la siguiente estructura: esquema://usuario:contraseña@host:puerto/camino-del-objeto 8-20 — Esquema. Se corresponde habitualmente con el nombre del protocolo utilizado para acceder al objeto. Ejemplos: http, ftp, gopher, mailto, news, nntp, telnet y file. — Usuario y contraseña. Se utilizan para validar a un usuario en protocolos como FTP y TELNET. Internet: Origen, evolución y estado actual — Host. Dirección IP o nombre de dominio de un servidor. — Puerto. Puerto del servidor que se utilizará. Si no se especifica, se utiliza el puerto bien conocido correspondiente. — Camino del objeto. Especifica la forma de alcanzar el objeto dentro del servidor. Habitualmente se corresponde con una secuencia de directorios terminada en un nombre de archivo. Ejemplos de URI: — ftp://ftp.rs.internic.net/domain/named.root Se accede por FTP al servidor ftp.rs.internic.net (puerto 21) y se trae el archivo “named.root” almacenado en el directorio “/domain”. Como no se ha especificado nombre de usuario, se asume el usuario anónimo “Anonymous” y como contraseña, la dirección de correo del usuario. Si el servidor FTP no tuviese habilitado el acceso anónimo, hubiese sido necesario especificar un nombre de usuario y contraseña. — http://192.168.0.33:8080 Se accede por HTTP al servidor 192.168.0.33 (puerto 8080). Como no se ha especificado ningún archivo, se trae la página índice especificada en el servidor (normalmente llamada index.htm o index.html). — http://www.adams.net/lista/mendes.php?n=793&dir=1 Detrás del nombre del archivo “mendes.php” se puede utilizar el carácter “?” para indicar que a continuación se envían una serie de variables y valores que debe procesar el archivo (un programa o página dinámica). En caso de existir más de una variable y valor, se separarán con el carácter “&”. — http://www.adams.net/pub/redes/c.htm#6 El carácter “#” indica una marca (marcador) dentro de una página web. Se utiliza para indicar posiciones concretas en páginas web muy extensas. — mailto:[email protected] Se envía un correo a la cuenta de correo indicada. — telnet://luis:[email protected] Conexión telnet al servidor emducms1.sis.ucm.es (puerto 23) con el nombre de usuario “luis” y contraseña “secreto”. — news://msnews.microsoft.com/microsoft.public.es.win2000 Se accede al grupo de noticias “microsoft.public.es.win2000” del servidor NNTP msnews.microsoft.com a través del puerto 119. 8-21 Sistemas y Comunicaciones — news:es.rec.deportes.mountain-bike Grupo de noticias “es.rec.deportes.mountain-bike”. 4.2. Navegación WWW El protocolo de transferencia de hipertexto (HTTP) es el responsable de la navegación por las páginas web. Su misión es enviar desde un servidor web los documentos que el cliente solicita a través de su navegador. Los documentos son recogidos y representados en pantalla por el navegador cliente. El servicio de navegación se conoce como WWW (World Wide Web). Ofrece un conjunto de documentos, normalmente escritos en lenguaje HTML, conectados entre sí mediante enlaces (links). Aunque sea de los servicios más utilizados, el WWW es realmente nuevo en Internet. Su desarrollo comenzó en 1989 por el CERN (European Laboratory for Particle Physics, laboratorio europeo de física de partículas) en Ginebra. Su objetivo era encontrar un sistema para intercambiar información entre investigadores, de tal forma que los documentos publicados en un ordenador pudiesen verse fácilmente desde cualquier otro conectado a la red. Como en el resto de servicios TCP/IP, basados en la arquitectura cliente/servidor, tenemos los componentes: — Servidor web. Se trata de un ordenador que ofrece documentos, escritos habitualmente en HTML, a los clientes que lo solicitan. Permanece a la escucha de peticiones de clientes en el puerto 80. Las aplicaciones más utilizadas como servidores web son Apache (para entornos Unix) e Internet Information Server (sistemas Windows de servidor). Otros servidores web son: Novell Enterprise Server, EnterpriseWeb/MVS, Lotus Domino Webserver, Netscape Enterprise Server y Oracle Web Application Server. — Cliente web. Consiste en el navegador (browser) utilizado por el usuario. Los navegadores reciben e interpretan el código HTML enviado por el servidor. Las representaciones de los navegadores pueden variar ligeramente dependiendo de la plataforma y navegador utilizado. El navegador más utilizado es Microsoft Internet Explorer. Otros navegadores son: Firefox, Chrome, Safari, Mozilla, Opera, Galeon y Lynx, este último es un navegador de sólo texto. 4.2.1. Páginas web El principal lenguaje utilizado para la creación de páginas web es HTML (HyperText Markup Language, lenguaje de marcas con hipertexto). No se considera un lenguaje de programación sino únicamente se habla de “lenguaje de marcas”. Las marcas o etiquetas son trozos de código que habitualmente delimitan un texto para asociarle un significado o unas características. Por ejemplo, el código: Página web indica que el texto “Página web” es un título importante en el documento. Los códigos colocados entre los signos “< “y” >” son las etiquetas. Las páginas web tienen habitualmente las extensiones .htm y .html. 8-22 Internet: Origen, evolución y estado actual HTML es un subconjunto de SGML (Standard Generalized Markup Lenguage, lenguaje de marcas estándar generalizado). Contiene etiquetas con un significado fijo (por ejemplo, siempre indica texto centrado). Se entremezclan información estructural y de presentación. XML (eXtensible Markup Lenguage, lenguaje de marcas extensible) es también un derivado de SGML. Se trata de un metalenguaje utilizado para definir nuevos lenguajes. En XML, el significado de las etiquetas puede variar. Sólo se define la estructura. Ejemplo: Juan 912345678 (no especificamos cómo se debe mostrar esta información). Otras características de XML son anidación de niveles y posibilidad de validación de documentos, para comprobar que su sintaxis es correcta. El metalenguaje XML se ha utilizado para redefinir el lenguaje HTML, generando el lenguaje XHTML (eXtensible HyperText Markup Lenguage). XHTML se considera la evolución de HTML para la creación de páginas web. El organismo encargado del desarrollo técnico de los estándares de la Web es W3C (World Wide Web Consortium, www.w3.org). En su web podemos encontrar las especificaciones o recomendaciones de los lenguajes HTML, XML y XHTML, entre otros. El elemento principal de una página web es el enlace o “link” a otra página. Esta posibilidad de saltar de unas páginas a otras es lo que se conoce como navegación. En realidad, el nombre de web (telaraña) procede precisamente del entramado de enlaces entre unas páginas y otras. Una página web puede contener texto, elementos multimedia (principalmente imágenes), enlaces y objetos incrustados (como scripts, applets de JAVA u objetos Flash). Los principales formatos de imágenes utilizados en páginas web son: — GIF (Graphics Interchange Format). Formato propietario de Compuserve. Apropiado para pequeños iconos y dibujos, que utilizan colores sólidos, no degradados. 256 colores como máximo. Permite animaciones (una secuencia de imágenes GIF mostradas de forma circular) y transparencias (un color es marcado como transparente). Utiliza compresión sin pérdida. — JPEG o JPG (Joint Photographics Experts Group, grupo de expertos fotográficos unidos). Formato abierto que soporta hasta 16 millones de colores. Sus características son opuestas a GIF. Apropiado para fotografías. Se puede elegir el ratio de compresión: a más compresión, menor tamaño pero menor calidad de imagen, es decir, utiliza compresión con pérdida. — PNG (Portable Network Graphics, gráficos portables de red). Formato abierto, propuesto recientemente por W3C, para sustituir al formato propietario GIF. Utiliza compresión sin pérdida y admite 16 millones de colores. Permite guardar imágenes en modo entrelazado para que el visitante de la página vaya viendo la imagen progresivamente a medida que el navegador la carga (esto también es posible con GIF y JPEG). Soporta canales alfa, para especificar hasta 256 grados de transparencias. PNG no 8-23 Sistemas y Comunicaciones admite animaciones, en su lugar se está desarrollando el formato MNG (Multiple image Network Graphics, gráficos de red de imagen múltiple). Los principales formatos de audio utilizados en páginas web son: — MP3: Fue en el año 1987 cuando el Instituto Graunhofer de la Universidad Alemana de Eslangen inició la búsqueda de un método que permitiese la trasmisión de audio en formato de comprensión digital, logrando que un minuto de calidad similar a un fichero que ocupa en un CD unos 10 “megabytes”, se comprimiera con MP3 en menos de 1 MB. El grupo MPEG (Moving Picture Expert Group) aprobaba la nueva tecnología en 1992 y desde entonces MP3 es un modo abreviado de decir MPEG y Layer 3. — WAV: es un formato de audio digital normalmente sin compresión de datos desarrollado por Microsoft e IBM que se utiliza para almacenar sonidos en el PC, admite archivos mono y estéreo a diversas resoluciones y velocidades de muestreo, su extensión es .wav. — MIDI: (Musical Instrument Digital Interface) es un estándar tecnológico que describe un protocolo, una interface digital y conectores que permiten que varios instrumentos musicales electrónicos, computadoras y otros dispositivos relacionados se conecten y comuniquen entre sí. Para separar la estructura de la presentación de los documentos HTML, se recomienda utilizar hojas de estilo CSS (Cascade style sheets, hojas de estilo en cascada). Una hoja de estilos permite definir cuál será la apariencia de la estructura del documento. Por ejemplo, mediante CSS se puede definir que todas las etiquetas (título importante) tengan asociada las características de presentación “color rojo” y “centrado”. Se puede utilizar una única hoja de estilos en todo un sitio web para economizar código y facilitar los posibles cambios de presentación futuros. Las páginas utilizadas tradicionalmente en los servidores web son páginas estáticas: el servidor ofrece siempre el mismo contenido cuando el usuario las solicita. Estas páginas suelen tener extensión .htm o .html. Sin embargo, debido a las necesidades crecientes de los sitios web, se han desarrollado lenguajes específicos para páginas dinámicas. Cuando el usuario solicita la página, el servidor interpreta el código fuente de la página, genera un código HTML y lo devuelve al usuario. Las páginas dinámicas se utilizan habitualmente para realizar consultas a bases de datos y ofrecer así, resultados dinámicos al usuario. Los principales lenguajes de páginas dinámicas son: 8-24 — ASP (Active Server Pages, páginas activas de servidor). Lenguaje propietario de Microsoft. Programación basada en Visual Basic. — PHP (Hypertext Preprocessor, preprocesador de hipertexto). Lenguaje abierto con sintaxis similar a C. — JSP (JavaServer Pages, páginas Java de servidor). Sintaxis basada en JAVA. Internet: Origen, evolución y estado actual Otras tecnologías relacionadas con las páginas web que debemos conocer son: — DHTML (Dynamic HTML, HTML dinámico). Permite modificar las propiedades de presentación de un documento después de haberse cargado en el navegador del usuario. Esto es lo que se conoce como “dotar de movimiento” a una página. Mediante DHTML podríamos hacer que una imagen se desplazara continuamente por la pantalla. Esto es posible mediante un código JavaScript que modifique continuamente las coordenadas de la imagen establecidas inicialmente en la hoja de estilos del documento. — VRML (Virtual Reality Markup/Modeling Language, lenguaje de marcas/modelado de realidad virtual). Ofrece al usuario la posibilidad de realizar acciones dentro de escenarios tridimensionales de realidad virtual. — SMIL (Syncronized Multimedia Integration Language, lenguaje de integración de multimedia sincronizado). Desarrollado por W3C, permite crear presentaciones utilizando un conjunto de objetos multimedia independientes. El programador puede definir la situación de los objetos y su comportamiento temporal. Está basado en XML. 4.2.2. Buscadores Debido al creciente número de páginas web en toda la Red, se ha hecho imprescindible la utilización de buscadores que localicen informaciones concretas o muestren páginas sobre un tema determinado. Los buscadores se pueden dividir en 3 categorías: — Índices o directorios. Contienen un listado de sitios web organizados de forma jerárquica mediante un árbol del conocimiento humano. Los enlaces de un directorio son incluidos manualmente por expertos. Para cada enlace se redacta una breve descripción que resuma su contenido. Son útiles para encontrar todos los sitios web que tratan sobre un tema concreto. Un ejemplo de categoría de un directorio es: /deportes_y_ocio/deportes/motociclismo/pilotos. — Motores de búsqueda. Al contrario que en los directorios, su información se obtiene automáticamente recorriéndose la web. Los programas encargados de recoger sitios web se llaman robots o arañas (spiders). Para conocer nuevos sitios comienzan por una página dada y van saltando a todos sus enlaces de forma recursiva. Los sitios web se indexan en virtud de palabras clave. Son apropiados para encontrar informaciones concretas, aunque los resultados de las búsquedas pueden contener informaciones no requeridas (ruido). Los motores de búsqueda suelen ofrecer la posibilidad de realizar búsquedas avanzadas en las cuales es posible la utilización de operadores lógicos (AND, OR, NOT) para forzar la aparición de varias palabras, frases, excluir otras, etc. — Metabuscadores. Son buscadores de buscadores. El término que se desea buscar se busca simultáneamente en distintos buscadores. Los resultados se combinan y se ofrecen al usuario. 8-25 Sistemas y Comunicaciones Entre los directorios destacados podemos citar Dmoz.org y Yahoo. Entre los motores de búsqueda destacan Google, Bing de Microsoft, Yahoo y Lycos. Un ejemplo de metabuscador es Metacrawler. 4.2.3. HTTP Mientras el Lenguaje de marcado de hipertexto (HTML) es el lenguaje empleado para describir el interior de los documentos Web, el Protocolo de transferencia de hipertexto (HTTP) es el lenguaje empleado para describir cómo se envían estos documentos por Internet. La clave para comprender la programación Web es comprender este protocolo y el entorno en el que opera. HTTP proporciona las normas para que los navegadores hagan peticiones y los servidores entreguen respuestas. Este conjunto de normas, o protocolo, incluye la manera de: — Solicitar un documento por su nombre. — Ponerse de acuerdo en el formato de los datos. — Determinar quién es el usuario. — Decidir cómo manejar recursos obsoletos. — Indicar los resultados de una petición. — Otras funciones útiles. HTTP consiste en un conjunto de comandos escritos como líneas de texto ASCII ordinario. Cuando se utiliza un navegador Web, no se tiene acceso directo a los comandos HTTP. Sin embargo, al escribir una dirección URL o al hacer clic en un hiperenlace el navegador convierte su acción en comandos HTTP que piden el documento al servidor especificado en la URL. El servidor Web encuentra el documento y lo envía al navegador, que lo muestra al usuario junto con los gráficos asociados y otros hiperenlaces. La especificación describe HTTP como un protocolo de petición/respuesta sin estado cuya operación básica es la siguiente: 1. Una aplicación cliente, por ejemplo un navegador Web, abre un conector “socket”. al puerto HTTP del servidor Web (el puerto predeterminado es el 80). 2. A través de la conexión el cliente escribe una línea de petición de texto ASCII, seguida de ninguna, una o varias cabeceras HTTP, una línea en blanco y cualquier dato que acompañe a la petición. GET /index.html HTTP/1.1 Host: www.adams.es User-Agent: nombre-cliente [Línea en blanco] 8-26 Internet: Origen, evolución y estado actual 3. El servidor Web analiza la petición y localiza el recurso especificado. 4. El servidor envía una copia del recurso al conector, donde es leído por el cliente. HTTP/1.1 200 OK Date: Fri, 31 Dec 2003 23:59:59 GMT Content-Type: text/html Content-Length: 1221 Página principal del Host (Contenido) . . . 5. El servidor cierra la conexión. Los comandos que utiliza HTTP para comunicarse el servidor web y un cliente cualquiera son: — HEAD: Pide una respuesta idéntica a la que correspondería a una petición GET, pero sin el cuerpo de la respuesta. Esto es útil para la recuperación de meta-información escrita en los encabezados de respuesta, sin tener que transportar todo el contenido. — GET: Pide una representación del recurso especificado. Por seguridad no debería ser usado por aplicaciones que causen efectos ya que transmite información a través de la URI agregando parámetros a la URL. La petición puede ser simple, es decir en una línea o compuesta de la manera que muestra el ejemplo. — • Ejemplo: GET /images/logo.png HTTP/1.1 obtiene un recurso llamado logo.png. • Ejemplo con parámetros:/index.php?page=main&lang=es. POST: Envía los datos para que sean procesados por el recurso identificado. Los datos se incluirán en el cuerpo de la petición. Esto puede resultar en la creación de un nuevo recurso o de las actualizaciones de los recursos existentes o ambas cosas. 8-27 Sistemas y Comunicaciones — PUT: Sube, carga o realiza un upload de un recurso especificado (archivo), es el camino más eficiente para subir archivos a un servidor, esto es porque en POST utiliza un mensaje multiparte y el mensaje es decodificado por el servidor. En contraste, el método PUT te permite escribir un archivo en una conexión “socket” establecida con el servidor. La desventaja del método PUT es que los servidores de hosting compartido no lo tienen habilitado. • Ejemplo:PUT /path/filename.html HTTP/1.1. — DELETE: Borra el recurso especificado. — TRACE: Este método solicita al servidor que envíe de vuelta en un mensaje de respuesta, en la sección del cuerpo de entidad, toda la data que reciba del mensaje de solicitud. Se utiliza con fines de comprobación y diagnóstico. — OPTIONS: Devuelve los métodos HTTP que el servidor soporta para un URL específico. Esto puede ser utilizado para comprobar la funcionalidad de un servidor web mediante petición en lugar de un recurso específico. — CONNECT: Se utiliza para saber si se tiene acceso a un “host”, no necesariamente la petición llega al servidor, este método se utiliza principalmente para saber si un “proxy” nos da acceso a un “host” bajo condiciones especiales, como por ejemplo “corrientes” de datos bidireccionales cifradas (como lo requiere SSL). Hay que indicar que HTTP va indicando el estatus en el que se encuentra la solicitud de una página en función de una lista de códigos de respuesta y frases estándar. De este modo tenemos los siguientes códigos: 8-28 — 1XX: Respuestas informativas: Petición recibida, continuando proceso. — 2XX: Peticiones correctas: esta clase de código indica que la petición fue recibida correctamente, entendida y aceptada. • 200 OK: Respuesta estándar para peticiones correctas. • 201 Creado: La petición ha sido aceptada para procesamiento, pero este no ha sido completado. La petición eventualmente pudiere no ser satisfecha, ya que podría ser no permitida o prohibida cuando el procesamiento tenga lugar. • 203 Información no autoritativa. • 204 Sin contenido. • 205 Recargar contenido. • 206 Contenido parcial: La petición servirá parcialmente el contenido solicitado. Esta característica es utilizada por herramientas de descarga como “wget” para continuar la transferencia de descargas anteriormente interrumpidas, o para dividir una descarga y procesar las partes simultáneamente. Internet: Origen, evolución y estado actual • — 207 Estado múltiple (Multi-Status, WebDAV [grupo de trabajo del Internet Engineering Task Force. El término significa “Edición y versionado distribuidos sobre la web” (Web Distributed Authoring and Versioning)]. El cuerpo del mensaje que sigue es un mensaje XML y puede contener algún número de códigos de respuesta separados, dependiendo de cuántas sub-peticiones sean hechas. 3XX: Redirecciones: El cliente tiene que tomar una acción adicional para completar la petición. • 300 Múltiples opciones: Indica opciones múltiples para el URI que el cliente podría seguir. Esto podría ser utilizado, por ejemplo, para presentar distintas opciones de formato para video, listar archivos con distintas extensiones. • 301 Movido permanentemente: Esta y todas las peticiones futuras deberían ser dirigidas a la URI dada. • 302 Movido temporalmente: Este es el código de redirección más popular, pero también un ejemplo de las prácticas de la industria contradiciendo el estándar. La especificación HTTP/1.0 (RFC 1945) requería que el cliente realizara una redirección temporal (la frase descriptiva original fue “Moved Temporarily”), pero los navegadores populares lo implementaron como 303 See Other. Por tanto, HTTP/1.1 añadió códigos de estado 303 y 307 para eliminar la ambigüedad entre ambos comportamientos. Sin embargo, la mayoría de aplicaciones web y bibliotecas de desarrollo aún utilizan el código de respuesta 302 como si fuera el 303. • 303 Vea otra (desde HTTP/1.1): La respuesta a la petición puede ser encontrada bajo otra URI utilizando el método GET. • 304 No modificado: Indica que la petición a la URL no ha sido modificada desde que fue requerida por última vez. Típicamente, el cliente HTTP provee un encabezado como If-Modified-Since para indicar una fecha y hora contra la cual el servidor pueda comparar. El uso de este encabezado ahorra ancho de banda y reprocesamiento tanto del servidor como del cliente. • 305 Utilice un proxy (desde HTTP/1.1). Muchos clientes HTTP (como Mozilla2 e Internet Explorer) no se apegan al estándar al procesar respuestas con este código, principalmente por motivos de seguridad. • 306 Cambie de proxyEsta respuesta está descontinuada. • 307 Redirección temporal (desde HTTP/1.1): Se trata de una redirección que debería haber sido hecha con otra URI, sin embargo aún puede ser procesada con la URI proporcionada. En contraste con el código 303, el método de la petición no debería ser cambiado cuando el cliente repita la solicitud. Por ejemplo, una solicitud POST tiene que ser repetida utilizando otra petición POST. 8-29 Sistemas y Comunicaciones — 8-30 4XX: Errores del Cliente: La solicitud contiene sintaxis incorrecta o no puede procesarse. • 400 Solicitud incorrecta: La solicitud contiene sintaxis errónea y no debería repetirse. • 401 No autorizado: Similar al 403 Forbidden, pero específicamente para su uso cuando la autentificación es posible pero ha fallado o aún no ha sido provista. • 402 Pago requerido: Este código nunca se utilizó. • 403 Prohibido: La solicitud fue legal, pero el servidor se rehúsa a responderla. En contraste a una respuesta 401 No autorizado, la autentificación no haría la diferencia. • 404 No encontrado: Recurso no encontrado. Se utiliza cuando el servidor web no encuentra la página o recurso solicitado. • 405 Método no permitido: Una petición fue hecha a una URI utilizando un método de solicitud no soportado por dicha URI; por ejemplo, cuando se utiliza GET en una forma que requiere que los datos sean presentados vía POST, o utilizando PUT en un recurso de solo lectura. • 406 No aceptable: El servidor no es capaz de devolver los datos en ninguno de los formatos aceptados por el cliente, indicados por éste en la cabecera "Accept" de la petición. • 407 Autenticación Proxy requerida. • 408 Tiempo de espera agotado: El cliente falló al continuar la petició –excepto durante la ejecución de videos Adobe Flash cuando solo significa que el usuario cerró la ventana de video o se movió a otro–. • 409 Conflicto: Indica que la solicitud no pudo ser procesada debido a un conflicto con el estado actual del recurso que esta identifica. • 410 Ya no disponible: Indica que el recurso solicitado ya no está disponible y no lo estará de nuevo. • 411 Requiere longitud. • 412 Falló precondición. • 413 Solicitud demasiado larga. • 414 URI demasiado larga. • 415 Tipo de medio no soportado. • 416 Rango solicitado no disponible: El cliente ha preguntado por una parte de un archivo, pero el servidor no puede pro- Internet: Origen, evolución y estado actual porcionar esa parte, por ejemplo, si el cliente preguntó por una parte de un archivo que está más allá de los límites del fin del archivo. — • 417 Falló expectativa. • 418 “I’m a teapot” o “Soy una tetera”. • 422 Entidad no procesable (WebDAV-RFC 4918): La solicitud está bien formada pero fue imposible seguirla debido a errores semánticos. • 423 Bloqueado (WebDAV-RFC 4918): El recurso al que se está teniendo acceso está bloqueado. • 424 Falló dependencia (WebDAV) (RFC 4918) La solicitud falló debido a una falla en la solicitud previa. • 425 Colección sin ordenar. • 426 Actualización requerida (RFC 2817): El cliente debería cambiarse a TLS/1.0. • 429 Demasiadas peticiones: Hay muchas conexiones desde esta dirección de internet. • 449 Reintente con: Una extensión de Microsoft: La petición debería ser reintentada después de hacer la acción apropiada. 5XX Errores de servidor: El servidor falló al completar una solicitud aparentemente válida. • 500 Error interno: Es un código comúnmente emitido por aplicaciones empotradas en servidores web, mismas que generan contenido dinámicamente, por ejemplo aplicaciones montadas en IIS o Tomcat, cuando se encuentran con situaciones de error ajenas a la naturaleza del servidor web. • 501 No implementado. • 502 Pasarela incorrecta. • 503 Servicio no disponible. • 504 Tiempo de espera de la pasarela agotado. • 505 Versión de HTTP no soportada. • 506 Variante también negocia (RFC 2295). • 507 Almacenamiento insuficiente (WebDAV-RFC 4918). • 509 Límite de ancho de banda excedido: Este código de estatus, a pesar de ser utilizado por muchos servidores, no es oficial. • 510 No extendido (RFC 2774). 8-31 Sistemas y Comunicaciones 4.2.4. Versiones de HTTP — 0.9: Obsoleta. Soportaba sólo un comando, GET, y además no especifica el número de versión. No soportaba cabeceras, tampoco el comando POST por lo que el cliente no podía enviarle información. — HTTP/1.0 (1996): En esta versión se indica en las comunicaciones la primera versión de HTTP en las comunicaciones, y todavía se usa ampliamente, sobre todo en servidores proxy. RFC 1945. — HTTP/1.1 (1999): Versión actual. Las conexiones persistentes están activadas por defecto y funcionan bien con los “proxies”. También permite al cliente enviar múltiples peticiones a la vez por la misma conexión (pipelining) lo que hace posible eliminar el tiempo de retardo por cada petición. RFC 2616. — HTTP/1.2 o HTTP Extension Framework (2000). Extensiones definidas en la RFC 2774. — En 2007, el grupo de trabajo HTTPbis Working Group se formó para clarificar y revisar las especificaciones de HTTP/1.1. En Junio de 2014, el grupo de trabajo presentó seis partes dividiendo la especificación obsoleta RFC 2616: — • RFC 7230-HTTP/1.1: Message Syntax and Routing. • RFC 7231-HTTP/1.1: Semantics and Content. • RFC 7232-HTTP/1.1: Conditional Requests. • RFC 7233-HTTP/1.1: Range Requests. • RFC 7234-HTTP/1.1: Caching. • RFC 7235-HTTP/1.1: Authentication. HTTP/2.0 (Mayo de 2015): es más eficiente mediante el uso de recursos de red y una reducida percepción de latencia introduciendo campos comprimidos en la cabecera y múltiples intercambios de información concurrentes sobre la misma conexión. 4.2.5. Transacciones seguras en Internet (HTTP-S, SSL y SET) La información que se envía a un servidor web viaja en texto plano, sin encriptar. Esto no tiene por qué ser un inconveniente si enviamos nuestro nombre o dirección de correo. Sin embargo, cuando se requiere enviar un número de tarjeta de crédito para completar una transacción comercial u otro tipo de información confidencial se hace necesario que la información viaje de forma encriptada. Para estos casos HTTP no es suficiente: se requieren nuevos protocolos seguros: — 8-32 S-HTTP (Secure HTTP, HTTP seguro). Protocolo de seguridad específico para HTTP que asegura los datos transmitidos. Funciona en la capa de aplicación. Desarrollado por Netscape. Internet: Origen, evolución y estado actual — — SSL (Secure Sockets Layer, capa de conexiones seguras). Proporciona conexiones seguras entre servidor y cliente, asegurando los paquetes enviados, sólo el servidor es el autenticado, es decir, se garantiza su identidad, mientras que el cliente se mantiene sin autenticar. Se sitúa entre las capas de red y transporte y la capa de red. Aunque habitualmente se utiliza para comunicaciones con servidores web, puede utilizarse para otros protocolos distintos a HTTP como POP3, SMTP... Al igual que S-HTTP proporciona confidencialidad, integridad y autentificación. La última versión disponible es la 3.0 publicada en la RFC 6101. Las fases en que se divide SSL son: • Negociar entre las partes el algoritmo que se usará en la comunicación. • Intercambio de claves públicas y autenticación basada en certificados digitales. • Cifrado del tráfico basado en cifrado simétrico. TLS (Transport Layer Security) es un protocolo Internet Engineering Task Force (IETF), definido por primera vez en 1999 y actualizado por última vez en el RFC 5246 (agosto de 2008) y en RFC 6176 (marzo 2011). Se basa en las especificaciones previas de SSL. Versiones: • TLS 1.0 RFC 2246 • TLS 1.1 RFC 4346 • TLS 1.2: RFC 5246 • TLS 1.3 en borrador — SET (Secure Electronic Transactions, transacciones electrónicas seguras). Se utiliza para pagos en Internet mediante tarjetas de crédito (capa de aplicación). Fue desarrollado por VISA y MasterCard. Utiliza técnicas criptográficas tales como certificados digitales y criptografía de clave pública para permitir a las entidades llevar a cabo una autenticación entre sí y además intercambiar información de manera segura. — 3D SECURE (3 Domain Secure): Desarrollado por VISA, es un protocolo que trabaja utilizando seguridad en 3 dominios: 8-33 Sistemas y Comunicaciones 4.3. • Dominio Emisor: emisor o entidad financiera que emite la tarjeta de crédito. Los emisores participantes en Verified by Visa deben tener un servidor que atienda las solicitudes de autenticación de pago. • Dominio Adquirente: comercios virtuales y físicos junto a sus respectivas entidades financieras que se encargarán de solicitar los pagos al dominio emisor través del dominio de interoperabilidad. • Dominio de Interoperabilidad: dispone de toda la infraestructura necesaria para permitir las transacciones electrónicas entre el dominio emisor y el dominio adquirente. Este dominio es administrado directamente por Visa Internacional. Correo electrónico El correo electrónico es el servicio más antiguo y utilizado de Internet. Permite el envío de mensajes entre usuarios. Cada usuario tiene una dirección de correo de la forma usuario@dominio. El símbolo de la arroba significa en inglés “at” (en), por lo que la dirección podríamos leerla como “usuario en dominio” o “usuario que pertenece a dominio”. Por ejemplo, la cuenta de correo del usuario Juan López que trabaja en Adams podría ser [email protected]. El nombre del dominio debe estar registrado y tener asociado, mediante su correspondiente servidor DNS, una o más máquinas servidoras de correo electrónico (son los llamados registros “MX”, Mail eXchanger o intercambiador de correo del servidor DNS). Todos los mensajes enviados a las cuentas de correo terminadas en @adams.es se entregarán a la máquina especificada como intercambiador de correo en el servidor DNS del dominio adams.es. Los usuarios deberán consultar su servidor de correo para comprobar si han recibido mensajes nuevos. Las cuentas (buzones) de los usuarios están protegidas en el servidor de correo mediante una contraseña. La arquitectura de un sistema de tratamiento de mensajes emplea una terminología que debemos conocer: 8-34 — MUA o UA (Mail User Agent, agente de usuario de correo). Programa que permite, como mínimo, leer nuevos mensajes y redactar mensajes nuevos. Son los llamados clientes o gestores de correo electrónico, como Outlook, Eudora, Pegasus Mail, Netscape Messenger, Mutt o Pine. Pine es uno de los clientes de correo más antiguos. Únicamente funciona en modo texto. — MTA (Mail Transfer Agent, agente de transferencia de correo). Programa que transfiere y encamina los mensajes generados por los usuarios. Son, en realidad, los servidores de correo. Los agentes de usuario envían sus mensajes a un MTA para que éste lo entregue al MTA del destinatario. Ejemplos: sendmail, qmail, smail, postfix y Microsoft Exchange. El conjunto de MTAs que forman un sistema de mensajería se llama MTS (Message Transfer System, sistema de transferencia de mensajes). Internet: Origen, evolución y estado actual — MDA (Mail Delivery Agent, agente de entrega de correo). Habitualmente es el mismo que el MTA. En caso de hacer diferenciación, MDA se refiere al programa encargado de entregar el correo al buzón del destinatario. No transfiere mensajes entre servidores. — MS (Mail Store, almacén de correo). Lugar donde se almacenan los mensajes de los buzones de los usuarios. Suele corresponderse con el MTA, aunque no necesariamente. Todos estos componentes se conocen como MHS (Message Handling System, sistema de tratamiento de mensajes). En este sentido podemos citar la recomendación X.400 y el estándar SMTP. Este último es el utilizado en Internet. 4.3.1. SMTP SMTP (Simple Mail Transfer Protocol, protocolo de transferencia sencilla de correo). Definido en las RFCs 821, 2821 y 5321. Es el principal protocolo de correo electrónico perteneciente a la capa de aplicación. Lo utilizan los servidores para transferirse mensajes. También lo utilizan los clientes para enviar mensajes. Utiliza los puertos 25 TCP, 587 TCP para clientes de correo y 465 TCP para SMTPS. Una transacción de SMTP se compone de tres secuencias de comando / respuesta y son: — MAIL: comando para establecer la dirección de retorno, también conocido como Return-Path, remitente o sobre. Esta es la dirección para mensajes de despedida. — RCPT: comando, para establecer un destinatario de este mensaje. Este mandato puede emitirse varias veces, una para cada destinatario. Estas direcciones son también parte de la envolvente. — DATA: para enviar el mensaje de texto. Este es el contenido del mensaje, en lugar de su envoltura. Se compone de una cabecera de mensaje y el cuerpo del mensaje separado por una línea en blanco. DATA es en realidad un grupo de comandos, y el servidor responde dos veces: una vez para el comando de datos adecuada, para reconocer que está listo para recibir el texto, y la segunda vez después de la secuencia final de los datos, para aceptar o rechazar todo el mensaje. Órdenes básicas de SMTP: — HELO, para abrir una sesión con el servidor. — MAIL FROM, para indicar quien envía el mensaje. — RCPT TO, para indicar el destinatario del mensaje. — DATA, para indicar el comienzo del mensaje, éste finalizará cuando haya una línea únicamente con un punto. — QUIT, para cerrar la sesión. 8-35 Sistemas y Comunicaciones — RSET Aborta la transacción en curso y borra todos los registros. — SEND Inicia una transacción en la cual el mensaje se entrega a una terminal. — SOML El mensaje se entrega a un terminal o a un buzón. — SAML El mensaje se entrega a un terminal y a un buzón. — VRFY Solicita al servidor la verificación de todo un argumento. — EXPN Solicita al servidor la confirmación del argumento. — HELP Permite solicitar información sobre un comando. — NOOP Se emplea para reiniciar los temporizadores. — TURN Solicita al servidor que intercambien los papeles. De los tres dígitos del código numérico, el primero indica la categoría de la respuesta, estando definidas las siguientes categorías: — 2XX, la operación solicitada mediante el comando anterior ha sido concluida con éxito — 3XX, la orden ha sido aceptada, pero el servidor está pendiente de que el cliente le envíe nuevos datos para terminar la operación — 4XX, para una respuesta de error, pero se espera a que se repita la instrucción — 5XX, para indicar una condición de error permanente, por lo que no debe repetirse la orden Modo de funcionamiento: 8-36 1. Cuando un cliente establece una conexión con el servidor SMTP, espera a que éste envíe un mensaje “220 Service ready” o “421 Service non available”. 2. Se envía un HELO desde el cliente. Con ello el servidor se identifica. Esto puede usarse para comprobar si se conectó con el servidor SMTP correcto. 3. El cliente comienza la transacción del correo con la orden MAIL FROM. Como argumento de esta orden se puede pasar la dirección de correo al que el servidor notificará cualquier fallo en el envío del correo (Por ejemplo, MAIL FROM:). Luego si el servidor comprueba que el origen es válido, el servidor responde “250 OK”. 4. Ya le hemos dicho al servidor que queremos mandar un correo, ahora hay que comunicarle a quien. La orden para esto es RCPT TO:. Se pueden mandar tantas órdenes RCPT como destinatarios del correo queramos. Por cada destinatario, el servidor contestará “250 OK” o bien “550 No such user here”, si no encuentra al destinatario. Internet: Origen, evolución y estado actual 5. Una vez enviados todos los RCPT, el cliente envía una orden DATA para indicar que a continuación se envían los contenidos del mensaje. El servidor responde “354 Start mail input, end with .” Esto indica al cliente como ha de notificar el fin del mensaje. 6. Ahora el cliente envía el cuerpo del mensaje, línea a línea. Una vez finalizado, se termina con un . (la última línea será un punto), a lo que el servidor contestará “250 OK”, o un mensaje de error apropiado. 7. Tras el envío, el cliente, si no tiene que enviar más correos, con la orden QUIT corta la conexión. También puede usar la orden TURN, con lo que el cliente pasa a ser el servidor, y el servidor se convierte en cliente. Finalmente, si tiene más mensajes que enviar, repite el proceso hasta completarlos. Ejemplo: S: 220 Servidor SMTP C: HELO miequipo.midominio.com S: 250 Hello, please to meet you C: MAIL FROM: S: 250 Ok C: RCPT TO: S: 250 Ok C: DATA S: 354 End data with . C: Subject: Campo de asunto C: From: [email protected] C: To: [email protected] C: C: Hola, C: Esto es una prueba. C: Hasta luego. C: C: . 8-37 Sistemas y Comunicaciones S: 250 Ok: queued as 12345 C: quit S: 221 Bye 4.3.2. POP3 — POP3 (Post Office Protocol, protocolo de oficina postal). Permite recibir mensajes. Solicita autentificación al usuario antes de devolverle sus mensajes. Sin embargo, la contraseña se envía sin encriptar. Lo habitual con este protocolo es que el usuario descargue los mensajes del servidor y los almacene en su ordenador. Utiliza los puertos TCP 110 y TCP 995 sobre SSL. — IMAP (Internet Message Access Protocol, protocolo de acceso a mensajes). Se utiliza para consultar los mensajes en el servidor. Los mensajes residen en el servidor y el usuario los gestiona mediante IMAP. Utiliza contraseñas encriptadas. La última versión disponible es la IMAPv41 definido en la RFC 3501 y utiliza los puertos TCP 143, 220 (IMAPv3) y TCP 993 para IMAPS. — MIME (Multipurpose Internet Mail Extensions, extensiones de correo multipropósito). Definido en la RFC 1870. Es una extensión del formato de los correos electrónicos para permitir no sólo mensajes de texto ASCII de 7 bit del original SMTP permitiendo que datos binarios se puedan codificar sobre representaciones ASCII de 7 u 8 bits según sea conveniente. También permite a un receptor especificar el tamaño máximo de mensaje que puede recibir, sobrepasando la limitación de 1000 caracteres antes de un retorno de carro. 4.3.3. Correo electrónico seguro Los mensajes de correo se envían habitualmente sin encriptar (cifrar). Esto significa que nuestros envíos podrían ser interceptados, leídos o incluso, modificados. Para evitarlo, se han diseñado una serie de protocolos que aportan seguridad al correo electrónico. Una firma digital en un mensaje garantiza que el mensaje lo ha enviado la persona que dice haberlo hecho. El destinatario tiene la garantía de que ese mensaje procede de la persona indicada y de que no ha sufrido alteraciones en el camino. Por otro lado, para garantizar que nadie pueda leer un mensaje en el transcurso de una comunicación, éste necesita ser cifrado. Los sistemas anteriores se basan en la llamada infraestructura de clave pública (PKI, Public Key Infraestructure) que consiste en disponer de dos claves: una privada y otra pública. Para la firma digital, el emisor firma con su clave privada y el receptor utiliza la clave pública del emisor para comprobar la validez del mensaje. Por el contrario, para el cifrado de los mensajes, el emisor lo encripta con la clave pública del destinatario y el receptor utiliza su clave privada para desencriptarlo. 8-38 Internet: Origen, evolución y estado actual Los principales protocolos utilizados para correo seguro son: — S/MIME (Secure MIME, MIME seguro). S/MIME está definido en el RFC 2634 y es un sistema de cifrado, firma y certificación de mensajes que se fundamenta sobre MIME. Está soportado por RSA y utiliza los estándares PCKS números 7 y 10 (estándares de criptografía de clave pública) desarrollados por esta empresa para encriptación y certificación, respectivamente. Emplea un mecanismo de “triple envuelta” en el que el mensajes es primero firmado, después encriptado y finalmente firmado nuevamente sin que ambas firmas procedan necesariamente de la misma persona o entidad. El uso conjunto de este envoltorio permite garantizar todas las propiedades de seguridad anteriormente mencionadas. El RFC define cabeceras MIME específicas para integrar las firmas y especificar los algoritmos de firmado y encriptación así como las partes firmadas o cifradas. — PGP (Pretty Good Privacy, privacidad bastante buena). PGP es una herramienta de encriptación de correo electrónico que utiliza el algoritmo RSA para implementar un mecanismo de cifrado de clave pública (uso simultáneo de clave simétrica y asimétrica). Inicialmente se distribuyó como software libre. Para enviar un mensaje, la herramienta genera una clave de sesión aleatoria con la que se cifra el mensaje (algoritmo IDEA). A su vez la clave de sesión se cifra según RSA con la clave pública del receptor y se envía adjunta al mensaje. Así, sólo el poseedor de la correspondiente clave privada podrá descifrar por completo el mensaje. No obstante, el modelo de certificación que emplea PGP (para validar la clave pública) se basa en una red de confianza (con distribución previa de claves públicas de usuarios) y no en el uso de certificados digitales, lo cual puede imponer limitaciones para su utilización a gran escala. Finalmente, el IETF ha publicado el RFC 1847 para soportar el uso de firmas y cifrado PGP en mensajes con MIME. — 4.4. PEM (Privacy Enhanced Mail, correo con privacidad mejorada). Es el menos utilizado de los tres. Al contrario que los otros dos, no está preparado para correos MIME. FTP El servicio FTP (File Transfer Protocol, protocolo de transferencia de archivos) permite la transferencia y gestión de archivos dentro de una red TCP/IP. Sus usos principales son: — Descarga de archivos. Esto es: bajar archivos desde un servidor hasta un ordenador cliente. Por ejemplo, podríamos configurar un servidor FTP para almacenar una serie de programas que estamos desarrollando. Los clientes podrían conectarse al servidor FTP, buscar un programa y descargarlo a su ordenador. 8-39 Sistemas y Comunicaciones — Publicación de archivos. Se trata de la operación inversa a la anterior: subir archivos desde el cliente al servidor. En el ejemplo anterior, el administrador tendría permiso de escritura con el fin de actualizar las versiones de los programas o incluir nuevos. En un servidor FTP también se pueden realizar operaciones para borrar, copiar, mover o renombrar archivos o carpetas. Los servidores FTP se utilizan habitualmente como herramientas de actualización de los contenidos de los servidores web. Los servidores FTP requieren un nombre de usuario y contraseña para iniciar sesión. El servidor solicitará estos datos antes de comenzar una sesión. Aunque también se pueden enviar mediante un URL: ftp://usuario:[email protected] En la configuración de un servidor FTP se puede habilitar el acceso anónimo para permitir que usuarios sin usuario/contraseña puedan conectarse al servidor, normalmente para descarga de archivos. Los usuarios que utilicen el acceso anónimo deben escribir “anonymous” en el usuario y su cuenta de correo en la contraseña (en realidad, se admitiría cualquier dirección de correo válida). Un URL como ftp://ftp.adams.es trataría de validarse como usuario anónimo. 4.5. Noticias Las noticias (news) son uno de los servicios más potentes y desconocidos de Internet. Consisten en lugares de discusión para grupos de usuarios interesados en unos mismos temas. Estos lugares son los grupos de noticias. Existen grupos de noticias para casi cualquier tema que podamos imaginar. La red de grupos de noticias utilizada en Internet es Usenet (User's Network). Está formada por un elevado número de servidores que replican sus mensajes entre sí. El protocolo utilizado para el servicio de noticias es NNTP (Network News Transfer Protocol, protocolo de transferencia de noticias de red). La forma habitual de trabajar con este servicio es conectarse a un servidor, listar los grupos de noticias disponibles, suscribirse a uno de ellos, leer los mensajes y publicar un mensaje nuevo o bien, responder a uno ya existente. Los mensajes de respuesta se van enlazando con los anteriores formando hilos de mensajes. El nombre de los grupos de noticias está formado por varias palabras separadas por puntos. Son similares a los nombres de dominio aunque en los grupos de noticias la palabra más general está situada a la izquierda. Ejemplos: comp.os.windows (sistema operativo Windows), soc.culture.estonia (vida y cultura en Estonia), alt.tv.simpsons (sobre la popular serie de televisión). Las categorías superiores más habituales son: 8-40 — comp. Informática. — soc. Sociedad. — sci. Ciencias. Internet: Origen, evolución y estado actual 4.6. — talk. Debate de temas actuales. — news. Grupos relacionados con Usenet. — rec. Tiempo libre y ocio. — alt. Grupos alternativos de discusión. — misc. Temas que no encajan en otras categorías. Telnet El servicio Telnet permite la conexión a un servidor remoto y el establecimiento de una sesión en modo texto como si estuviésemos trabajando en el servidor de forma local. El servidor Telnet solicita autentificación al cliente mediante un nombre de usuario y contraseña. Cada carácter que teclea el cliente se envía por la red hasta el servidor. El servidor procesa las órdenes recibidas y envía las respuestas al cliente. El cliente funciona como un terminal del servidor. Hace unos años era muy utilizado para acceder a bases de datos, como pueden ser las bibliotecas de universidades. Sin embargo, todos estos servicios se han ido migrando progresivamente a páginas web. En la actualidad se utiliza sobre todo para administrar de forma remota servidores Unix. Sin embargo, el mayor problema es que la contraseña del usuario viaja sin encriptar por la red (al igual que en FTP y otros servicios). Esto puede comprometer gravemente la seguridad de un servidor Unix si se accede al servidor con la cuenta de superusuario (root). Existen unos programas llamados sniffers que muestran todo el tráfico que se está transmitiendo en una red, incluidas las contraseñas si éstas no están encriptadas. Para solucionar la falta de seguridad de Telnet, este servicio ha sido sustituido por SSH (Secure SHell, interfaz de órdenes seguro). Su principal ventaja es que toda la información viaja encriptada, incluidas las contraseñas. La utilización de Telnet se considera hoy en día un agujero de seguridad. Windows 2000 incluye un servicio Telnet mejorado que incorpora métodos de autentificación más seguros. La mayor limitación de Telnet y SSH es que funcionan en modo texto. Existen, sin embargo, programas gráficos de control remoto. Uno de los más utilizados en múltiples sistemas operativos es el programa gratuito VNC (Virtual Network Computing) de los laboratorios AT&T. El usuario ve en una ventana de su ordenador (cliente o visor VNC) el escritorio de otro ordenador remoto (que ejecuta el módulo servidor VNC). Microsoft incorporó en Windows 2000 el control remoto de servidores mediante los Servicios de Terminal. Los Servicios de Terminal de Windows 2000 también pueden utilizarse como servidores de aplicaciones. Los clientes pueden utilizar sistemas operativos sencillos y máquinas poco potentes debido a que todo el proceso se realiza en el servidor. 8-41 Sistemas y Comunicaciones 4.7. IRC El servicio de charlas en la red o IRC (Internet Relay Chat) se utiliza para conversar en tiempo real con otros usuarios. Un usuario puede enviar un mensaje (frase corta textual) a un conjunto de usuarios pertenecientes a un mismo canal o bien, a un usuario determinado. Los canales son lugares de reunión sobre algún tema determinado. El servicio IRC no almacena mensajes como hace el servicio de noticias (es asíncrono) sino que los entrega inmediatamente. Para utilizar IRC, los usuarios deben primero conectarse a un servidor de IRC y después, unirse a los canales que sean de su interés. Los servidores IRC pueden agruparse creando redes de servidores de tal forma que, independientemente del servidor al que se conecte un usuario, todos puedan participar en un mismo canal intercambiándose mensajes. La mayor red de habla hispana del mundo es iRC-Hispano (www.irc-hispano.org). Existen canales de muy diversos temas: política, sociedad, salud, informática, amor y amistad, etc. Los usuarios deben utilizar un cliente IRC como mIRC o bien, conectarse desde una página web que ejecute un cliente IRC, normalmente programado en JAVA mediante un Applet. 4.8. 4.9. Servicios antiguos — Talk. El servicio IRC, que hemos estudiado, se utiliza para conversar con un grupo de personas que constituyen un canal. Talk también permite conversar textualmente en la red, aunque sólo con un interlocutor. — Archie. Mantiene índices de archivos de servidores FTP. Es útil para localizar en qué servidor se encuentra el archivo que necesitamos. — Gopher. Ofrece información clasificada jerárquicamente en forma de menús. El usuario va eligiendo opciones de menús hasta alcanzar la información deseada. Nuevos servicios 4.9.1. Difusión de audio y vídeo Los archivos de audio y vídeo siempre han podido descargarse de servidores web o FTP y reproducirse posteriormente en el ordenador cliente. Con este servicio nos referimos a la difusión de audio y vídeo de forma que se vaya reproduciendo a medida que se trae la información del servidor. Esto es lo que se conoce como streaming (difusión de secuencias multimedia). Se utilizan técnicas de compresión como MP3 y MPEG-4. Los servidores web deben habilitar esta capacidad para ofrecer difusión de audio y vídeo a los clientes. Microsoft dispone de su servidor de secuencias Windows Media 8-42 Internet: Origen, evolución y estado actual (anteriormente llamado NetShow), RealNetworks de su servidor Helix Universal Server (anteriormente llamado RealServer) y Apple de QuickTime Streaming Server. Cada compañía ha desarrollado sus correspondientes programas clientes (Reproductor de Windows Media, RealOne Player y QuickTime). En Internet, podemos encontrar emisiones en directo de radio televisión, así como grabaciones anteriores para reproducir en cualquier momento. Uno de los mayores fenómenos de Internet ha sido YouTube que, al igual que Google Video, permite que los usuarios compartan sus propios vídeos mediante streaming. 4.9.2. Voz sobre IP (VoIP) Con el término VoIP (Voice over IP) o telefonía IP nos referimos a la tecnología que permite mantener conversaciones telefónicas a través de redes IP, como puede ser Internet. La voz se transmite mediante conmutación de paquetes, al contrario que en la telefonía tradicional que es conmutación de circuitos. El mayor inconveniente de VoIP deriva de su naturaleza: la voz se fragmenta en paquetes de datos que deben viajar a través de una red de redes IP. Estos paquetes, como sabemos, pueden perderse, llegar dañados o sufrir retrasos generando mala calidad en las conversaciones telefónicas. Para evitarlo se deberían implementar mecanismos de QoS (Calidad de Servicio) que garanticen, entre otros aspectos, el menor retardo posible de los paquetes de voz, dándoles un tratamiento preferente. Los dos protocolos principales de VoIP, válidos tanto para telefonía como para videoconferencia, son H.323 y SIP, ambos de la capa de aplicación. El primero es un estándar de la ITU de 1996 que fue muy utilizado años atrás. En la actualidad se prefiere el protocolo SIP (Session Initiation Protocol, protocolo de inicialización de sesión) que ha sido desarrollado por el IETF (RFC 3261, de 2002). Los dos protocolos utilizan el llamado protocolo de transporte de tiempo real (RTP), el cual funciona sobre UDP. RTP utiliza además RTCP (protocolo de control de RTP) para proporcionar control de flujo sobre los datos transmitidos por RTP. Las principales ventajas de la telefonía IP son: — Nomadismo. Posibilidad de movernos geográficamente manteniendo el mismo número. — Ahorro de costes. Sobre todo en llamadas entre delegaciones (utilizando la red de datos ya instalada) y en llamadas internacionales a través de Internet. — Mayor variedad de servicios. Como terminal, se puede utilizar un ordenador o un smartphone o una tablet o bien un teléfono IP específico. Estos últimos son teléfonos IP fijos (similares a un teléfono convencional), que se conectan a una toma de un switch mediante cable UTP con conectores RJ45, así como teléfonos IP Wi-Fi. 8-43 Sistemas y Comunicaciones La arquitectura que presenta define tres elementos, que son: 8-44 — Terminales: que son los telefonos IP o cuales quira otros dispositivos. — Gatekeepers: que vienen a ser las centralitas, que suelen ser elementos software. Por ejemplo Asterix, que es una aplicación bajo licencia GPL que soporta SIP y H.323 y que porporciona funcionalidades de una central telefonica (PBX). — Gateways: es el paso de la red IP con la red telefónica tradicional, siendo transparente para el usuario. Tema 9 Seguridad y protección en redes de comunicaciones. Sistemas de cortafuegos. Redes Privadas Virtuales (VPN). Seguridad en el puesto de usuario. Sistemas y Comunicaciones Guión-resumen 1. Introducción 2. Seguridad y Protección en redes de comunicaciones 2.1. Nivel Físico 2.2. Nivel Enlace 2.3. Nivel Interred 2.4. Nivel Transporte 2.5. Nivel Aplicación 2.6. Nivel Meta Aplicación 2.7. Seguridad de red por objetivo 9-2 3. Sistemas de Cortafuegos 3.1. Tipos de cortafuegos 3.2. Criterios de seguridad 3.3. Arquitecturas 3.4. Topologías 4. Redes Privadas Virtuales (VPN) 4.1. Tipos 4.2. Arquitecturas Seguridad y protección en redes de comunicaciones 1. Introducción La seguridad de los sistemas en red ha crecido de forma paralela al crecimiento de redes y organizaciones. Una organización que no implemente seguridad de la información de su negocio puede desaparecer, como ocurrió en los ataques a las torres gemelas. La seguridad total es imposible. Puede entenderse como un proceso orientado a reducir, el riesgo de sufrir un daño. Cualquier sistema debe ser considerado vulnerable. Por esto es necesario gestionar la seguridad. Además, para evitar abusos y proteger los derechos de los ciudadanos existe una legislación que describe los derechos y deberes de las partes. 2. Seguridad y Protección en redes de comunicaciones Los conceptos de seguridad de los sistemas de información, se exponen en el Tema 4. Y aplicados a las redes de comunicaciones, se podría definir la seguridad de las redes de comunicaciones como la capacidad de una red de resistir, con un nivel de confianza, las acciones que comprometan la confidencialidad, integridad, disponibilidad y autenticidad de la información almacenada o transmitida y de los servicios que se ofrecen. Como allí también se decía, el estudio de la seguridad se suele dividir en seguridad física y lógica. Por tanto aquí, aunque teniendo en cuenta esos dos ámbitos, y que el aspecto físico se incluye en un nivel de la arquitectura de protocolos de una red, parece lógico abordar el estudio de la seguridad por niveles OSI. En la siguiente exposición, se hablará habitualmente de ataques, más que amenazas, de forma que, según el contexto, podrán considerarse sinónimos. 2.1. Nivel Físico A este nivel, se encuadraría lo estudiado sobre seguridad física. Habría que citar un tipo de ataque referido al nivel físico del modelo OSI, que se realiza con “software”. Es el ataque de monitorización de tráfico de red. Para ello, se usan programas de análisis de tráfico, conocidos también como rastreadores o “sniffers”. Estos programas trabajan aprovechando los protocolos que usan un acceso al medio por difusión, como Ethernet o Wifi. La información está en el cable o en el aire disponible para cualquiera. En el caso habitual, un destinatario no legítimo de la información la ignora, pero un intruso podría analizarla configurando su interface en modo promiscuo. Medidas de protección contra este tipo de ataques serían la instalación de programas “antisniffers” y la segmentación de LAN (creación de VLAN). Existen analizadores de red físicos, instrumentos con apariencia similar a un polímetro, que requieren un acceso físico al cable, o al equipo de red (switch, router), por lo que las medidas de seguridad contra estos equipos se englobarían en las de la seguridad física. 9-3 Sistemas y Comunicaciones En cuanto a redes inalámbricas, poco se puede hacer a nivel físico para evitar que un intruso recoja la radiación. Por tanto la protección debe hacerse a nivel lógico: restricción de direcciones de red, filtrado MAC, emisión de menor potencia, etc. Sería el ejemplo típico de intercepción. 2.2. Nivel Enlace La subred posee debilidades que dependen de la tecnología que implemente. El caso de estudio típico es Ethernet. Este nivel es el primero en usar direccionamiento. Para ilustrar el tipo de ataque a este nivel, se recurre al protocolo ARP, Address Resolution Protocol, que consiste en las normas que rigen la forma de relacionar direcciones MAC con direcciones IP. Cuando un equipo necesita conocer la dirección IP de destino en su subred, preguntará quién posee la dirección MAC correspondiente a esa IP, para poder enviarle la información. El ataque típico es el conocido como Man In The Middle (MITM), consistente en usar el protocolo ARP para hacer corresponder direcciones IP con direcciones MAC que no son correctas, de forma que el emisor envíe la información al intruso, que a su vez la retransmitirá al receptor legítimo. Con esto, el intruso consigue tener acceso a la información transmitida. Sería un ejemplo típico de ataque de modificación. La defensa en este nivel consiste en la utilización de “switches”, segmentación de la red, creación de tablas ARP estáticas (solución de difícil mantenimiento, que no suele ser habitual), DHCP “snooping” o programas que detectan estos ataques. Existen otros ataques referidos a los equipos, en particular “switches”, como los desbordamientos de tablas ARP, o vulnerabilidades del protocolo STP. STP es un protocolo de “árbol de expansión”, encaminado a evitar los problemas de bucles en el cableado de una red local. En general estas vulnerabilidades se evitan configurando los equipos siguiendo indicaciones del fabricante. 2.3. Nivel Interred Los ataques del nivel de Interred poseen un denominador común, que consiste en explotar las debilidades de los protocolos, en particular IP. Una primera idea clasifica los ataques en: “sniffing” o monitorización, “spoofing” o falsificación y “denial of service”, o denegación de servicio. A éstos últimos pertenecen un tipo particular de ataques llamados de inundación o “flooding”. Por ello, para recordar mejor los ataques, puede pensarse en tres categorías: “sniffing”, “spoofing” y “flooding”. El “sniffing” ya ha sido explicado. Consiste en analizar el tráfico de una red. Puede parecer simple, pero son muchas las ocasiones en que se interceptan contraseñas que comprometen la seguridad. El “spoofing” consiste en la falsificación de algún parámetro. En el ataque MITM se hace uso de técnicas de spoofing, al falsificar una dirección MAC. A nivel IP se habla de IP “spoofing” o falsificación de direcciones IP. 9-4 Seguridad y protección en redes de comunicaciones Si un intruso se hace pasar por otra máquina, utilizando la falsificación IP, puede obtener información sensible o realizar acciones perjudiciales. Una forma de conseguir una falsificación es mediante el robo o secuestro de una sesión (hijacking). Este ataque consiste en analizar la conversación entre dos máquinas, y fabricar paquetes con su dirección IP falsificada y otros parámetros del protocolo que se han adivinado para quedarse con la conversación como si se fuera el equipo legítimo. Los ataques de denegación de servicio (DoS) pretenden evitar que una máquina ofrezca el servicio para el que trabaja. No es necesaria inteligencia especial para “tirar” el servidor, salvo en los ataques de denegación distribuida. Sin embargo, son efectivos, en cuanto que consiguen notoriedad, “expulsar” a una organización de la red durante un tiempo y afectar a la reputación de la víctima. Un ejemplo notorio ha sido el ataque distribuido dirigido hacia la SGAE. Los ataques DoS son numerosos. Se distinguen los de fragmentación, inundación y denegación de servicio distribuida (DDoS). Los primeros aprovechan debilidades en la programación de protocolos para que ante paquetes mal construidos, la máquina víctima caiga. Ejemplos son el “ping” de la muerte y “teardrop”. Los ataques de inundación consisten en enviar mucho tráfico inútil (espúreo o ruido), de forma que cuando una máquina intente responder a ese tráfico se vea saturada, y por tanto un cliente legítimo no podría obtener servicio. Ejemplos de este tipo de ataque son “smurf”, “fraggle”, “echo-chargen”, etc. Los dos primeros son muy instructivos: consisten en enviar peticiones con dirección origen la víctima a una dirección broadcast. De esta forma, todas las máquinas contestarían a la dirección víctima, saturándola. Por su parte, los ataques DDoS se basan en el mismo concepto. Un equipo dominaría numerosos equipos, gracias a la infección con troyanos, o por coordinación, de forma que se sincronizan y lanzan el ataque a la vez, generando ruido contra la víctima y evitando que preste su servicio. La solución a estos ataques está muy documentada. En general, los SO vienen programados para evitarlos. Sin embargo, los dispositivos de red deben configurarse, por ejemplo deshabilitando el broadcast, etc. 2.4. Nivel Transporte Los puertos suponen uno de los puntos de entrada más comunes de los ataques a sistemas en red. Uno típico es el escaneo de puertos, consistente en ir realizando peticiones de conexión a los puertos de una máquina. Si el puerto contesta, se sabe que allí existirá un servicio. Si no contesta, puede ser que o no haya servicio o esté filtrado. Si el puerto contesta de forma diferente, podrá identificarse esa contestación como perteneciente a cierto SO. Esta técnica es OS fingerprint, o huella del puerto. También se aprovechan debilidades de los protocolos, como la negociación de sesión o el intercambio de números de secuencia. Dada una conversación entre máquinas, puede escucharse e intentar adivinar los números de secuencia que se intercambian emisor y receptor. Hay ciertos sistemas, que se sabe que generan números de secuencia no del todo aleatorios y por tanto, puede intentarse adivinar esos números y hacerse pasar por la víctima. Son los robos de sesión. 9-5 Sistemas y Comunicaciones Otro ataque que aunque no de capa cuatro, puede incluirse aquí, por ser didáctico, son los ataques de repetición, en los que un atacante que no tiene idea de romper una conversación o hacerse con su control, observando el tráfico de la red podría repetir la información y generar un grave perjuicio a la víctima. El ejemplo típico es una transferencia bancaria. Si ésta se repite cien veces, la víctima habría realizado una transferencia de cien veces la original. Para evitar estas situaciones, el software se mejora desarrollando parches (actualizaciones), que van tapando agujeros de programación. A nivel cuatro, el equipo o “software” característico es el “firewall”, que realizan la función de filtro o control de la comunicación. Implementan seguridad. La herramienta básica que usan, son las listas de control de acceso o ACL. Una ACL es un conjunto de comandos que definen reglas de filtrado de tráfico en un interfaz y en un sentido (entrada o salida). Un ejemplo de aplicación sería una situación de falsificación de IP, en la que un intruso intente acceder a una red, con una dirección de la propia red. Esa acción es sospechosa, puesto que un acceso externo debería tener direccionamiento externo. Si la configuración de una ACL sólo permite acceso externo de direcciones externas, se evita ese tipo de tráfico. La inclusión de “firewalls” en la red, da origen a la definición de una estructura de seguridad. Habitualmente, al hablar de “firewalls” en la red, se suele pensar en lo que se da en llamar la zona desmilitarizada, o DMZ, en inglés. Una DMZ es una zona de la red de una empresa, que se define como de seguridad. Por tanto, en esa zona, se colocan los activos más importantes: los servidores, es decir, la información. Allí será típico encontrar los servidores web, de correo, de aplicaciones, etc. La zona, se limita con al menos un “firewall”, de manera que el tráfico de acceso a los servidores y a la red interna de la organización esté controlado. El “firewall” permite comunicar la zona interna con la DMZ y esta con el exterior, pero no directamente. Otra medida de seguridad no puramente de capa 4, es el establecimiento de “honeypots” y “honeynets”. Estas estructuras se definen como anzuelos o señuelos. Consisten en exponer un equipo (“honeypot”, tarro de miel) a ataques malintencionados, de forma que el análisis posterior de los ataques recibidos sirva para descubrir patrones de ataque, métodos usados por los intrusos, etc. Se recoge información que ayude a proteger el sistema. Una “honeynet”, es el mismo concepto, una red dulce, real o virtual. 9-6 Seguridad y protección en redes de comunicaciones 2.5. Nivel Aplicación El nivel de aplicación genera más problemas por la cantidad de “software” que incluye. Enumerar los ataques a este nivel es difícil. Por ello se establecen tres ámbitos de seguridad: el SO, las aplicaciones e Internet. En cuanto a los SO, en particular los servidores, deben configurarse de forma que proporcionen, al menos una seguridad básica. Un solo equipo mal securizado puede ser el punto de entrada de graves ataques. La definición de usuarios, recursos y permisos, debe ser correcta, limitando al máximo los permisos necesarios para desarrollar el trabajo habitual. Esto es válido para el resto de entidades como grupos, dominios, etc. En general, las políticas de filtrado deben ser restrictivas. Así, se deben filtrar todos los puertos, excepto los estrictamente necesarios o instalar sólo los servicios necesarios, lo que debe revisarse ya que, por defecto, puede haber SO que los implementen. Es conveniente configurar registros (logs), archivos en que se anotan las acciones que se dan en el sistema. Su utilidad es avisar cuando existe una acción sospechosa y ofrecer información de análisis cuando el incidente se ha producido. Cuando se da un incidente de seguridad, su análisis, a partir de las huellas que pueda haber dejado el intruso, se denomina análisis forense. El SO y el “software” debe ser actualizado con “parches” y actualizaciones de los fabricantes, puesto que cada actualización, además de ofrecer casi siempre una mejora de rendimiento, suele solucionar problemas de seguridad. Como ya se dijo, medidas transversales de seguridad son las copias de seguridad o las contraseñas fuertes en los controles de acceso. En las aplicaciones se dan vulnerabilidades provenientes de la ejecución de programas que o bien presentan agujeros de seguridad o bien son la vía de transmisión de programas tipo virus. Éstos son programas usados para causar un daño. Distintos tipos de virus son bombas lógicas, troyanos y gusanos. Las bombas lógicas son virus que se activan al darse una condición, como una fecha o una combinación de teclas. De este tipo era el famoso “barrotes” que impedía el uso del equipo si se encendía en Nochebuena. Los troyanos, son virus que instalan un servidor remoto en la víctima. El intruso realizará peticiones a ese servidor que conoce, puesto que lo ha propagado él, y podrá obtener el control de esa máquina infectada. Los gusanos son virus que se duplican utilizando procesos del SO infectado. La propagación de virus se realiza por muchas vías. Una de las más comunes es embebidos en archivos comunes, como archivos de texto u hojas de cálculo, de forma que al abrir el archivo infectado se instala el virus. Otra vía, cada vez más común son los dispositivos de almacenamiento extraíbles tipo “usb”. Para evitar la acción de los virus, se usan antivirus, programas que intentan detectar y eliminarlos. Su funcionamiento consiste en comparar el posible virus con un patrón o firma que posea en su BBDD de virus. Si coincide, muy probablemente, el candidato a virus lo es. Debido a la rapidez con la que evolucionan los virus (genéricamente malware), es importante actualizar el antivirus a menudo. 9-7 Sistemas y Comunicaciones El “software” que utiliza Internet o la conexión a redes no seguras, es potencial vía de infección o inseguridad. Los servicios pueden ofrecerse con aplicaciones vulnerables, explotadas por programas o personas para realizar una acción dañina. Los programas que aprovechan vulnerabilidades se denominan exploits. Ejemplos de exploits son los que aprovechan debilidades NetBios para ofrecer una consola remota. Ejemplos de debilidades del software es la inyección SQL, consistente en introducir sentencias SQL en formularios o consultas “web”. A través de los clientes de correo electrónico es común la propagación de virus, muchas veces camuflados en archivos de bromas o juegos. Asegurar con una configuración correcta los clientes y servidores de correo electrónico es fundamental, para evitar que intrusos usen los recursos para realizar “mail-bombing” (envío masivo de correo) o generar “spam”. Los programas P2P para compartir archivos, suelen ser vías de descarga de “software” dañino. Otros programas son los “keyloggers”, programas que una vez instalados en una máquina capturan las pulsaciones del teclado, lo guardan en un archivo y lo envían al atacante. Si se teclea un nombre de usuario y su contraseña, habrán sido registrados y por tanto podrán ser usados por el intruso. También poseen versión “hardware”, cuya incidencia quedaría limitada con las medidas de seguridad física. Como resumen de medidas de protección a nivel aplicación están la configuración segura de los servidores y SO, uso de antivirus, actualización y parcheado de aplicaciones y precaución en el uso de programas que accedan a Internet. Además, en general, la seguridad va enfrentada a la velocidad, es decir, a mayor seguridad, mayores chequeos y por tanto habrá que pagar un precio en el rendimiento de los sistemas. 2.6. Nivel Meta Aplicación No es normal en la literatura hablar del nivel de meta aplicación. Se ha querido acuñar este término para incluir y estructurar de algún modo aspectos algo más allá del software, del nivel de aplicación. Estas ideas se refieren a aspectos más humanos que técnicos. Dos conceptos: ingeniería social y criptografía. La ingeniería social puede definirse como el conjunto de técnicas basadas en relaciones humanas, que usa un intruso para generar una situación de inseguridad. Ejemplo típico es una llamada de una persona que se hace pasar por una autoridad y solicita a una víctima su usuario y contraseña para solucionar un problema. La buena voluntad de la víctima hace que el intruso supere toda la seguridad con una llamada de teléfono. Los ataques de ingeniería social se apoyan en la misma base: la interacción humana. Variante típica es el “phising”, consistente en enviar un correo electrónico haciéndose pasar por una entidad bancaria e invitar a la víctima a pulsar un enlace para confirmar unos datos, por ejemplo número de cuenta y clave de acceso. El enlace que se pulsa lleva a una página web fraudulenta. La víctima introduce los datos, se indica un error y se redirige a la página legítima. Los datos introducidos quedan grabados en la máquina delincuente. 9-8 Seguridad y protección en redes de comunicaciones La criptografía podría traducirse por escribir en una tumba o cripta, y probablemente sea más apropiado hablar de cifrado. Se presenta la seguridad que ofrecen las técnicas que reescriben la información de forma que no sea capaz de leerse fácilmente. La información se interpreta con convenios habituales en texto plano, no cifrado. Si se usan métodos para dificultar su lectura se habla de información o texto cifrado. Estos conceptos son verticales, afectan a toda la comunicación y pueden implementarse en una o en cada capa de la pila OSI. Se suele hablar de dos tipos de cifrado: simétrico y asimétrico. El simétrico consiste en una clave secreta que comparten emisor y receptor. Cuando intercambian información, el emisor cifra el mensaje con esa clave, lo envía, y el receptor lo descifra con esa misma clave. El cifrado asimétrico se basa en dos claves, una secreta y otra pública. Pueden visualizarse como un candado y una llave. Cuando el emisor envía un mensaje, lo cifra con el candado del receptor, su clave pública. Cuando el mensaje llega al receptor éste lo descifra con su clave privada, la llave del candado. Puede parecer que si todo el mundo conoce la clave pública, se conoce el cifrado del mensaje y no hay seguridad. No es así, porque la clave pública, cifra, no descifra, y conociendo la clave pública no se conoce la privada. Esto significa que un mensaje cifrado con clave pública, sólo se descifra con la privada. Y obtenerla a partir de la pública es muy difícil. Los aspectos humanos se refieren a la confianza. Para usar cifrado asimétrico se intercambian certificados digitales de confianza, que son una clave pública, emitida por una autoridad en la que se confía, como la FNMT. Las autoridades de certificación garantizan que alguien es quien dice ser. El cifrado simétrico, para el mismo número de “bits” de la clave, es más robusto que el asimétrico y más rápido. En general, el cifrado asimétrico se utiliza al comienzo de la comunicación para establecer una clave secreta válida para una sesión. Estos conceptos tienen aplicación en dos ámbitos: el cifrado de las comunicaciones y creación de redes privadas virtuales y la firma digital. Para cifrar comunicaciones a nivel dos se utiliza cifrado simétrico preconfigurado con protocolos como PPTP, L2F o L2TP y cifrado PAP o CHAP. A nivel 3 se utiliza IPSEC y a niveles superiores SSL o TLS. Una VPN es una red privada virtual. Es implementada creando y cifrando una conexión virtual entre dos equipos. Se puede crear en dos modos de trabajo, modo túnel, que crea un túnel entre dos equipos intermedios de la red o modo extremo a extremo, que crea una conexión cifrada de emisor a receptor. 9-9 Sistemas y Comunicaciones La firma digital persigue garantizar la autenticidad (no repudio) y la integridad. Un resumen es el producto de una función que actuando sobre una entrada genera una combinación de longitud fija. Al resumir un texto, se obtendrá una serie de varios “bits” y será muy difícil encontrar otro texto con el mismo resumen. Básicamente el proceso es éste: Un emisor genera un mensaje, que es resumido. El resumen se cifra con la clave privada del emisor. De esta manera se podrá descifrar con la clave pública del emisor. Pero qué información se obtiene: ninguna, sólo un resumen, 256 “bits”. Lo que si aporta es conocer al firmante, ya que si el resumen es correcto, el origen es correcto, porque sólo se puede descifrar con su clave pública. Por otro lado, se envía el mensaje original, junto con la firma, cifrados con la clave pública del receptor. El receptor descifra dos cosas: el mensaje original y la firma (el resumen cifrado). Con el mensaje descifrado, se calcula un resumen candidato. Con la clave pública del emisor, se descifra el resumen de la firma. Si coinciden, la comunicación es correcta, el mensaje original es íntegro y el autor, es el firmante. 2.7. Seguridad de red por objetivo A modo de resumen y para integrar una visión más horizontal de la seguridad en redes con la visión vertical que se acaba de exponer, se relaciona la defensa del sistema en red en función de su objeto, con los niveles de la arquitectura en que se aplican. Confidencialidad. Antivirus, conexiones seguras (SSL, IPSec, SSH…), técnicas de resumen y cifrado, redes privadas virtuales (VPN). Disponibilidad. Sistemas de cortafuegos, antivirus, acceso remoto, redes privadas virtuales (VPN), servicios de respaldo y recuperación, técnicas de monitorización, etc. Autenticidad. Sistemas de gestión de dominios y usuarios, sistemas de IDS–IPS, antivirus, técnicas biométricas, técnicas de resumen y cifrado, firma digital. Integridad. Técnicas de resumen y cifrado, firma digital. 3. Sistemas de Cortafuegos La implantación de cortafuegos es una estrategia de defensa basada en limitar los puntos críticos de entrada a lo que defender. En otras palabras reducir la superficie de exposición o asegurar el perímetro. La complejidad de los servicios TIC, no sólo precisa la instalación de un equipo o “software” para dotar de seguridad a una organización. Esta infraestructura debe gestionarse. De ahí que se definan arquitecturas “firewall”, políticas de control de acceso, etc. Por eso los sistemas cortafuegos, se consideran la pieza clave de la seguridad perimetral. 3.1. Tipos de cortafuegos El cortafuegos encuentra entre sus funciones la distinción de zonas de una red según sus requisitos de seguridad o nivel de riesgo y el control del trá9-10 Seguridad y protección en redes de comunicaciones fico entre esas zonas. Por tanto, el cortafuegos es un dispositivo o aplicación (o su combinación) que hace cumplir una política de control de acceso en las comunicaciones entre equipos de red según una política de seguridad. Se puede dar una definición más sencilla: “Un conmutador de nivel 4”. Siguiendo el modelo OSI, el nivel de transporte define un punto de acceso al servicio, SAP, lo que se conoce como puerto. Como básicamente el cortafuegos lo que hace es conmutar, en este caso permitir o no, el acceso al servicio, una definición más breve es difícil de encontrar. Lo explicado es válido, pero la idea radical, puede condensarse así; conmutador de nivel 4. Por política de control de acceso se entiende las acciones de permitir o denegar el acceso a un recurso de red a un ente. Como el contexto es el nivel 4 OSI, ese recurso se identificará con un NSAP o número de identificación del punto de acceso al servicio, un número de puerto. El servicio concreto tendrá un nivel de privilegio que se definirá, en general, con una ACL, lista de control de acceso. La ACL es un conjunto de sentencias secuenciales llamadas juegos de reglas (rulesets) que van realizando el filtrado del servicio en función de las condiciones que evalúan. Es importante, dada la criticidad del cortafuego, tener en cuenta parámetros como el rendimiento, disponibilidad o su facilidad de uso y gestión. Como en todo estudio, lo primero es usar un criterio de clasificación del sujeto en cuestión. Para los cortafuegos se suelen usar dos criterios, ubicación y funcionalidad. Otros criterios pueden ser la inteligencia en la inspección del tráfico, servicios añadidos, como traducción de direcciones, RPV (redes privadas virtuales) o la integración de mecanismos de autenticación. 3.1.1. Por ubicación Según el criterio de ubicación del cortafuego, se distinguen: Cortafuegos de red. Controlan el tráfico de la red, siendo un dispositivo activo. Permite la gestión centralizada de seguridad. Cortafuegos de sistema. Forma parte de un equipo de red. Su ámbito es local y controla el tráfico de ese equipo. No es muy usado, pero los entornos de movilidad difuminan las fronteras y se tiende a una mayor implementación, que permita también la gestión centralizada. 3.1.2. Por función Según el criterio de su función en la torre de protocolos OSI, se distinguen cortafuegos de: — Nivel de enlace. Filtran direcciones MAC. — Nivel de red. Filtran direcciones IP. 9-11 Sistemas y Comunicaciones 3.2. — Nivel de transporte. Filtran por protocolo (TCP, UDP) y puertos. Suelen permitir NAT, añadiendo seguridad. — Nivel de aplicación. Filtran por características propias de un protocolo como peticiones DNS o URLs. Pueden realizar tareas de Proxy. Criterios de seguridad La seguridad perimetral ha de identificar zonas en las que se puede dividir una red, en función de criterios de nivel de seguridad exigibles. En general, las zonas que pueden identificarse son la “intranet” (red interna de la organización), “extranet” (parte de la red que es pública y destinada a ofrecer recursos o servicios a entes que no son de la organización) y DMZ (zona desmilitarizada, De-Militarized Zone, redes con un nivel de protección especial, donde se ubican equipos críticos). Siguiendo terminología militar, puede identificarse una DMZ como la zona entre el dominio propio y el del enemigo. Así, la DMZ sería la zona entre el cortafuego y la intranet. La segregación de redes, implica necesariamente la composición de una arquitectura, una forma de estructurar la red, que lógicamente variará en función de la complejidad de la organización. Esto además, deriva en que una DMZ puede complicarse, ya que puede referirse a varias subredes. En un cortafuego, se pueden definir varias DMZ si deben establecerse distintas zonas con requisitos de seguridad distintos. Un correcto diseño de la infraestructura de seguridad perimetral alcanzará un compromiso entre el servicio de seguridad y la operatividad del sistema, conforme a los criterios de la política de seguridad. Los criterios comunes de seguridad para la identificación de redes con DMZ pueden ser los siguientes. 3.2.1. En profundidad La seguridad en profundidad o multicapa es un criterio imprescindible en la implementación de seguridad. La implementación de la política de seguridad debe tener en cuenta que ninguna tecnología es infalible, podrán existir errores de configuración, podrá haber condiciones de operatividad que relajen las configuraciones de seguridad y siempre hay que considerar la posibilidad de compromiso o intrusión. La posibilidad de compromiso obliga a pensar en una solución de seguridad estructurada en niveles para reducir esa probabilidad de intrusión o el impacto si se materializa. Por tanto, el cortafuego debe combinarse con otras medidas como la seguridad de los SO, con especial atención a servidores, la separación de servicios en distintas máquinas, según su criticidad (DNS, SMTP, web, BBDD), la aplicación del mínimo privilegio, seguridad de los dispositivos de red, cifrado de las comunicaciones, IDS, IPS u otros. Además, se considerará el coste de implantación de seguridad. Si es mayor que los activos a proteger, en principio, no tendría sentido. El esfuerzo 9-12 Seguridad y protección en redes de comunicaciones de este criterio es muy grande, por tanto, al menos, hay que identificar un mínimo de recursos críticos sobre los que centrar la seguridad. 3.2.2. Diversidad tecnológica En general, las distintas tecnologías y fabricantes son complementarias. Unos ofrecen mejores prestaciones que otros en algunos aspectos y viceversa. La idea es buscar las tecnologías que mejor se adapten a los criterios o necesidades de seguridad marcados por la organización. Hay que evitar los tópicos publicitarios. Del mismo modo, se pueden combinar equipos que proporcionando, en principio, la misma funcionalidad, sean de distintos fabricantes. Lógicamente se les exigirá compatibilidad de uso. Esta estrategia se encamina a reducir el impacto de problemas que puedan derivarse del “firmware” o evitar vulnerabilidades de una tecnología que no afecten a otra. Así se eliminan puntos críticos de fallo. La diversidad tecnológica puede aplicarse también a SO, servidores u otros. El problema, es que tiene un coste en formación y mantenimiento. Por tanto, una indicación es buscar los estándares que en principio facilitarán el mantenimiento y poder encontrar profesionales formados. La diversidad tecnológica, en el fondo, es redundancia. Pero el criterio de redundancia debe aplicarse, en general con la perspectiva de la arquitectura, además de la tecnología. Esto evitará o limitará faltas de disponibilidad, aunque, como siempre, a costa del coste de la duplicidad. 3.2.3. Mínimo privilegio Es un criterio de seguridad básico. Se basa en conceder los privilegios estrictamente necesarios para la realización de labor en concreto. En general, es preferible causar molestias por una restricción fuerte, es decir, restar algo de operatividad, a cambio de un control más severo del permiso sobre el recurso. Este principio se ha de establecer también en el control de acceso. A parte de asegurar que todo el tráfico de red y usuarios sean sometidos a un control de acceso, tanto tráfico como usuarios han de cumplir la condición de otorgarles el mínimo privilegio para sus acciones. 3.2.3. Sencillez La solución más sencilla suele ser la correcta. Este criterio general es más significativo en este contexto, ya que el mantenimiento de estructuras complejas dificulta el análisis y la administración, aparte de incrementar las vulnerabilidades. El criterio también se llama KISS (Keep It Simple, Stupid). Del mismo modo, aunque la seguridad debe interferir lo menos posible con la operatividad, ésta no debe ser la excusa para relajar los criterios y requisitos de seguridad. 9-13 Sistemas y Comunicaciones Asimismo, la sencillez favorece las necesidades de evolución de una organización, la escalabilidad. Si se ha de evolucionar o crecer, unos criterios de seguridad sencillos, harán más fácil el cambio. Por ejemplo, puede ser una buena decisión un sobredimensionado de la capacidad de los equipos. 3.3. Arquitecturas La arquitectura de un sistema describe su organización lógica y física en cuanto a componentes, su relación con el entorno y principios que guían su diseño y evolución. Para definir la arquitectura de un sistema, se usan dos tipos de modelos: funcionales y estructurales. Los funcionales o de caja negra describen la función del sistema con relación al entorno. Los modelos estructurales o de caja transparente describen el sistema detallando sus partes y relaciones. Se distinguen varias arquitecturas cortafuego. 3.3.1. SOHO. DMZ. Multizona con varios cortafuegos SOHO hace referencia a una red de pequeña oficina o doméstica (Small Office-Home Office). Representa la arquitectura más simple de seguridad perimetral, el caso en que no se ofrecen servicios externos. En este caso, el propio “router” de acceso puede realizar funciones de cortafuego. Es el esquema de la izquierda. El siguiente paso evolutivo es una organización que ofrezca servicios en Internet, que llevarán aparejado más riesgo y mayores necesidades de seguridad. Por esto, y de cara a evitar que el compromiso de un sistema afecte al resto de la infraestructura, se separan los servicios públicos del resto de la red interna con una DMZ, como muestra la central. Es un diseño simple, que en general será corto para los requisitos de la organización, que suelen requerir en la intranet separación entre servidores y estaciones de trabajo. Esta arquitectura refina el diseño, poniendo énfasis en el atacante interno, que suele ser habitual y más grave. Consiste en añadir un nuevo nivel que identifique recursos más críticos, si cabe. Es el esquema mostrado a la derecha. 3.3.2. Multi-DMZ con un cortafuego, varios y por VLAN En general, los servidores externos deben comunicarse con servidores internos. Si un servidor de la DMZ externa es comprometido, el intruso obtie9-14 Seguridad y protección en redes de comunicaciones ne una posición privilegiada de ataque a servidores internos. Por eso conviene separarlos en la forma representada en la figura izquierda. Su inconveniente es que se genera un punto crítico de fallo (el cortafuego de entrada), lo que obliga a prevenirlo. Si se identifican varias DMZ, como en redes multizona, se aconseja usar varios cortafuegos como muestra la figura central. Cada cortafuego de una infraestructura multicapa añade un nivel adicional de seguridad. Además, facilita la gestión de redes complejas cumpliendo los requisitos de seguridad, al dividir el problema en partes, aunque la configuración de los equipos se complica. También, se incrementan los puntos de fallo, lo que en principio robustece la red. Algunas recomendaciones de diseño de una infraestructura multicapa es que los cortafuegos sean de distintos fabricantes, que el “router” de acceso no implemente funciones del primer cortafuego, que distintos cortafuegos sean gestionados por distintos administradores y equilibrar el número de máquinas y redes por dispositivo, que cumpliendo los requisitos de separación en zonas de seguridad, prevenga daños críticos en caso de compromiso. La situación típica es la de la figura central (service leg), en que el “router” de acceso actúa como primera línea de defensa apoyando al primer cortafuego. Si el cortafuego permite gestionar VLAN, la arquitectura Multi-DMZ permite aislar servidores en un mismo nivel de seguridad. En la figura derecha se muestra el aislamiento de servidores de correo, nombres y web en varias VLAN conectadas a un cortafuegos. 9-15 Sistemas y Comunicaciones 3.4. Topologías La topología de una red es la forma física que dibuja la forma de conexión de sus elementos. Según este criterio, se distinguen varios tipos de topología cortafuegos. 3.4.1. Host Bastión. Screening router. Dual-Homed-Host La topología más simple de cortafuego consiste en un equipo que conecta la red externa con la interna. Las arquitecturas SOHO, DMZ y multi-DMZ con un cortafuego dibujan esta topología. Las diferencias están en la lógica de funcionamiento. El problema, es que a veces se mezclan denominaciones. El caso típico es el de router en que se configuran filtros o el “sw” de cortafuegos personal. Dado que los usuarios siguen teniendo conexión directa a nivel de red con el exterior esta solución no es fiable. La definición de filtros en el router está limitada y afecta a su rendimiento. Otra denominación para la misma topología es “screening router” o “router” de filtrado. La diferencia se refiere a reglas de filtrado con alguna prestación más, como la posibilidad de bloqueo del tráfico de una red o nodos específicos. La topología, la forma de la red es la misma. La topología “dual-homed-host” o “dual-homed-gateway”, según literatura, sería un equipo cortafuego sin “screening router” y varios “interfaces” de red. Se viene a corresponder con la DMZ. El cortafuego puede ser un “host” bastión e implementar otros servidores. La diferencia está a nivel lógico, ya que realiza funciones de “proxy”, haciendo de pasarela de aplicación, según las reglas definidas, impidiendo el reenvío de tráfico directo entre la red interna y la externa. Esta solución ofrece mayor seguridad ya que el servidor puede procesar filtros más complejos. La administración dependerá de si el acceso de los usuarios se realiza con pasarelas para las aplicaciones o mediante cuentas en el host bastión. En el primer caso lo que no se permite explícitamente, se deniega. El permiso para cada aplicación se suele habilitar con “sw” de “proxy”. En el segundo caso, el acceso de los usuarios a Internet es más sencillo, pero la seguridad depende del compromiso de una cuenta de usuario. Esta estructura con respecto al “screening router”, es más fácil de actualizar su “sw”. 3.4.2. Screened host. Screened subnet Arquitecturas más complejas, dibujan topologías más complejas. Por ejemplo, una multizona o multi-DMZ con varios cortafuegos, un “host” y dos 9-16 Seguridad y protección en redes de comunicaciones “routers” en una LAN protegida o arquitecturas similares, son topologías que, pudiéndose denominar, en árbol, o similar, se suelen llamar “screened host” o “subnet”, para indicar además su forma lógica de trabajo. “Screened host” se entendería un “firewall” apantallado tras un “router”. Por “screened subnet”, una “subred” apantallada, como por ejemplo un “firewall” entre dos “routers”, formando entre los 3 una LAN (figura derecha). El firewall implementaría un “proxy”, y esa LAN sería una zona o DMZ. 4. Redes Privadas Virtuales (VPN) Las VPN (Virtual Private Network, Redes Privadas Virtuales, RPV) son redes, que aun siendo compartidas por varios usuarios, éstos quedan identificados de forma que el tráfico que cursan es independiente. Ejemplo es la red de un operador de telecomunicaciones, que presta servicio a varias empresas. Todas transmiten su información sobre la misma infraestructura, pero el tráfico está diferenciado, de forma que no se mezcla ni se da posibilidad a error. Las VPN se usan entre otras aplicaciones para proporcionar acceso seguro, en un entorno inseguro, a los recursos de una organización. En general el acceso será de delegaciones remotas o usuarios móviles. Los cortafuegos, en general ofrecen esta funcionalidad, combinando VPN y control de acceso. Por fin, las VPN usan cifrado, por lo que debe considerarse su carga de proceso. 4.1. Tipos Los tipos de VPN que suelen identificarse son: — PPTP. (Point-to-Point Tunneling Protocol). Fue la solución típica para VPN en WS. Su evolución no lo ha librado de la vulnerabilidad a ataques MITM. El problema del protocolo es que la autenticación es poco flexible ya que sólo soporta contraseñas. En su lugar se aconseja el uso de L2TP o IPSec. — L2TP. (Layer 2 Tunneling Protocol). Es una extensión de PPP (Point-to-Point Protocol) para definir VPN. Funciona a nivel 2 OSI y permite tunelizar tráfico de nivel 3 (red). No soporta cifrado de mensajes, por lo que habitualmente se suele combinar con IPSec para ofrecer confidencialidad. — SSH tunneling. SSH (Secure SHell) es un protocolo estándar de conexión remota. Ofrece la posibilidad de tunelizar tráfico TCP con un canal cifrado, creando en la práctica una VPN. Establece correspondencias entre puertos locales y remotos que permiten acceso sencillo a servicios del sistema remoto. Para su establecimiento, origen y destino deben seguir la arquitectura cliente-servidor. — SSL. Ofrece más simplicidad que IPSec para implementar una VPN debido a que no requiere instalación de “sw” en cliente. Las VPN basadas en SSL establecen la conexión con un navegador web. El 9-17 Sistemas y Comunicaciones equipo de la organización que gestione SSL será el interfaz con los servidores internos para proporcionar acceso a los recursos. En versiones avanzadas también se permite tunelizar puertos o redes. Además, proporciona un control de acceso fuerte y flexible y un registro de eventos detallado. — IPSec. (Internet Protocol Security) es un conjunto de protocolos que permite establecer VPN a nivel 3 entre un nodo y uno o dos “gateways”. En IPv4 IPSec es optativo y obligatorio en IPv6. Desde 2005 su tercera versión, considerada segura, se detalla en los RFC 4301 y 4309. — MPLS. (MultiProtocol Label Switching) es un protocolo de WAN que trabaja en los niveles 2 y 3 de OSI. Aunque otros protocolos de esta familia, como FR lo permiten, su versatilidad lo ha convertido en la opción más usada. El funcionamiento de MPLS se describe en el RFC 3031 y se basa en el etiquetado del tráfico de nivel 2 (tramas). Los paquetes de nivel 3 al entrar en una red MPLS a través del Ingress Label Switched Router (Ingress LER), se encapsulan o etiquetan como tramas MPLS de nivel 2. Las tramas MPLS viajan a destino a través de un túnel previamente establecido entre el Ingress LER y el punto de salida, Egress LER. Los “routers” intermedios de la red MPLS se denominan Transit Label Switched Routers (TLSR). Al llegar al final de la red, las tramas se desetiquetan y siguen su ruta por la red que sea. 4.2. Arquitecturas Para aliviar el problema de la carga de proceso que introduce el cifrado, se suelen usar concentradores VPN, de los que se distinguen dos tipos, soluciones cerradas (con “hw” para cifra) y servidores generalistas (con “sw” de gestión y establecimiento de la VPN). El primer tipo se muestra en la figura izquierda y el segundo a la derecha. 9-18 Seguridad y protección en redes de comunicaciones La solución cerrada aprovecha que el cortafuego es el punto de entrada a la red externa. La solución de servidor generalista utiliza un concentrador de VPN que puede situarse en otro sitio que no sea la frontera de la red, aunque es normal encontrarlo cerca. Las opciones más habituales de posicionamiento son entre el cortafuego y la red externa, en la red interna, tras el cortafuego o en una DMZ dedicada. No se recomienda situar el concentrador entre el cortafuego y la red externa, ya que no estaría protegido, sino directamente fuera del perímetro de seguridad. Tampoco es recomendable la segunda opción, detrás del cortafuego, en la red interna ya que el tráfico del concentrador está cifrado al cruzar el cortafuego, por lo que no se puede analizar. Sólo se recomendaría si se garantizase que las redes conectadas poseen el mismo nivel de seguridad y no es posible situarlo en otra posición por otras cuestiones. Lo suyo es situar el concentrador en una DMZ dedicada. Así, estaría protegido por el cortafuego y puede controlarse el tráfico del concentrador hacia el interior. Se muestra en la figura derecha. Algunas configuraciones VPN pueden tener problemas con la traducción de direcciones, lo que debe considerarse al elegir la posición del concentrador. 9-19 Tema 10 Redes locales. Tipología. Métodos de acceso. Dispositivos de interconexión. Sistemas y Comunicaciones Guión-resumen 1. Introducción 2. Redes Locales 2.1. Características 2.2. Topologías de red 3. Tipología 3.1. IEEE 802.3. Ethernet 3.2. IEEE 802.4. Token Bus 3.3. IEEE 802.5. Token Ring 3.4. IEEE 802.11. WIFI 3.5. IEEE 802.15. BLUETOOTH 10-2 4. Métodos de acceso 4.1. Acceso por contienda o aleatorio 4.2. Acceso por turno, token o determinístico 5. Dispositivos de interconexión Redes locales 1. Introducción En el campo de las tecnologías de la información y comunicaciones (TIC), la definición de una red podría ser un conjunto de equipos conectados que intercambian información. Una vez definido el concepto de red informática, debe establecerse su clasificación. La clasificación puede responder a distintos criterios. En el caso que se trata, las redes locales, el criterio de clasificación es la extensión. De esta forma se distinguen redes de área extensa o WAN, por sus siglas inglesas, de área Metropolitana o MAN y redes de área local, es decir, redes locales o LAN. Para conectar los equipos que forman parte de una red, se necesita un medio de transmisión. Conviene distinguir entre transmisión y comunicación. La transmisión es el transporte de señales. Las señales son magnitudes físicas, en general en las TIC, son electromagnéticas: luz, tensión, corriente, etc. La comunicación es la transmisión de señales mediante un código común a emisor y receptor. Es decir, la transmisión se refiere al transporte de señales físicas y la comunicación a la interpretación de las señales que significan algo, en general, información. Puede haber transmisión y no haber comunicación; pero si hay comunicación, necesariamente hay transmisión. Un medio de transmisión es un entorno físico que permite y facilita el transporte de señales entre dos entidades. De los más utilizados son los pares de cobre, cable coaxial, fibra óptica y el aire, que se estudian a continuación. Lógicamente, debe existir un interfaz para acceder al medio de transmisión. Esta es la definición de un método de acceso, en este caso a una red. Por fin, para realizar funciones de interpretación de la transmisión, se necesitan máquinas, equipos que implementen esa comunicación, integrando las labores de transmisión y comunicación: los dispositivos de interconexión. 2. Redes Locales Como se ha indicado, la clasificación de una red informática, atendiendo al criterio de la extensión identifica tres tipos: LAN, MAN y WAN. Una red local (LAN, Local Area Network) es una red que cubre un área circunscrito a una oficina, una red doméstica, un edificio o similar. Una red metropolitana (MAN, Metropolitan Area Network) es una red que cubre un área del entorno de una ciudad, campus, etc. Una red extensa (WAN, Wide Area Network) es una red que cubre un área de varias ciudades, países o de ámbito mundial. 10-3 Sistemas y Comunicaciones Actualmente la distinción entre MAN y LAN se va difuminando, debido a la adopción de técnicas de transmisión típicas de LAN en entornos MAN, con lo que la idea clásica de red LAN ahora es más amplia y se acuñan términos tipo MetroLAN, MacroLAN o del estilo, dando a entender redes que con tecnologías propias de LAN alcanzan extensiones metropolitanas. Conviene conocer otros criterios de clasificación de redes, ya que suelen complementarse. Por tanto, es el contexto en que se trate el que marcará el significado de lo que se quiere decir. Así, según su propósito empresarial, las redes pueden dividirse en “extranets” e “intranets”. Hablar en estos términos es referirse a un entorno web, en el que la empresa facilita aplicaciones y recursos. Si esas facilidades en entorno web se refieren a un carácter interno, privado, para uso de los empleados, se habla de “intranet”. Si se refiere a la parte pública, accesible a cualquier usuario, se habla de extranet. Puede haber partes de la intranet a las que se permita acceso externo, mediante validación. Según la topología de la red, es decir, según su forma de conexión las redes se dividen en redes en estrella, bus, anillo y malla. En la red en estrella los elementos se conectan mediante un concentrador (HUB). Es fácil de instalar y detectar errores. Si un equipo falla sólo falla ese, pero la red se cae si falla el “hub”. Una red en bus se conecta con un sólo cable con terminaciones. Es fácil de instalar y no existen nodos centrales. Presenta problemas si se rompe el bus. Una red en anillo es una red en bus en la que se unen los extremos. Se analiza la información recibida en cada estación. Es difícil de instalar y mantener. Como en el bus, si se rompe el anillo la red cae. Una red en malla conecta cada equipo al resto de equipos de la red. Según el criterio de dar servicio, las redes se clasifican en Cliente-Servidor y Redes de Pares o Peer To Peer (P2P). En las primeras, un servidor ofrece servicios (web, correo electrónico, autenticación, etc.) y los clientes los demandan. En el modelo de redes de pares cualquiera puede ofrecer o dar un servicio. Según la propiedad de la red se distinguen tres tipos: Redes públicas, privadas y virtuales. Una red pública es la de un operador de telecomunicaciones. El acceso a una red pública se formaliza mediante un contrato entre usuario y operador. Una red privada es la de uso específico por parte de un organismo o empresa. Una red privada virtual, VPN (Virtual Private Network) es una parte de una red pública o privada que se asigna en exclusividad a un cliente, en general para conectar las delegaciones de la empresa. La diferencia entre una red pública y privada virtual está en que a partir de la central del operador, los recursos que se han contratado en el primer caso tie10-4 Redes locales nen una utilización pública, mientras que en el segundo son de utilización exclusiva. En una VPN, la diferenciación entre clientes se hace por software. 2.1. Características El desarrollo de las redes, y en particular de las LAN ha sido paralelo al de la informática. Al principio, los ordenadores eran caros y se buscaba aprovechar al máximo los recursos. Las primeras LAN se montaban con clientes “ligeros” o “terminales tontos”, simplificando, equipos sin disco que servían de terminales remotos que se conectaban a los servidores de la organización. El desarrollo de nuevas tecnologías, estandarización y el abaratamiento e incremento de la potencia informática balanceó el proceso hacia el usuario. Los equipos y estaciones de trabajo ya no eran tan ligeros y podían ofrecer inteligencia a la red. Este nuevo escenario también contribuyó al desarrollo de las redes LAN, ya que cada vez se exigía más velocidad de transmisión y prestaciones del “software”. La necesidad de compartir recursos antes caros, como impresoras y cantidades mayores de datos con todo el “software” asociado (copias de seguridad, integridad de datos en tiempo real, etc.) requiere soluciones que ofrece perfectamente una LAN, al eliminar redundancias, incrementar la productividad y ahorrar costes. En una red LAN deben tenerse en cuenta además otros factores importantes. Entre ellos la escalabilidad, es decir, la posibilidad de ampliación no traumática. Este aspecto está muy logrado, y cualquier ampliación de la red, suele ser transparente al resto de usuarios. La flexibilidad, posibilidad de cambiar la configuración de la red, permisos del usuario, tanto a nivel más físico (VLANs) como a nivel lógico (cambios de grupo de trabajo o dominio, por ejemplo) también se puede realizar en una LAN de forma ágil, aunque dependiente del “software” con que se trabaje. Deben destacarse los aspectos de seguridad, que pueden enfocarse desde un punto de vista físico o lógico. Físicamente se deben establecer controles de acceso, protección física de los equipos, etc. En general, los administradores de la LAN tienen en cuenta estos aspectos en la medida que obligan las leyes. Los aspectos lógicos, más relacionados con el software están más difundidos y suelen estructurarse bien, dentro de su complejidad. Entre las características de las LAN hay que identificar al menos, su topología, la tecnología de transmisión, la velocidad de transmisión, escalabilidad y “hardware” y “software”. La velocidad de transmisión de una LAN, varía en función de la tecnología. Los valores a recordar son 100 Mbps para FastEthernet, 1 Gbps (800Mbps, en realidad) para GigaEthernet, 54 Mbps de Wifi, que en tasa efectiva se quedan en torno a la mitad y 16 Mbps de velocidad típica para Token Ring. En general, independientemente del tipo de tecnología LAN utilizado pueden señalarse características comunes como son la relativa cercanía de sus equipos, la escalabilidad, fácil mantenimiento y fiabilidad. 10-5 Sistemas y Comunicaciones Los medios de transmisión típicos son el cable de par trenzado, coaxial, fibra óptica y transmisión radio. Las LAN tienen la posibilidad de conectar una gran variedad de dispositivos diferentes y conectarse varias redes LAN distantes a través de una WAN o Internet. 2.2. Topologías de red La topología es el estudio de la forma. Por tanto, la topología de una red se establece como criterio para clasificar la forma que presenta, la forma de disponer los equipos en la red. Ahora bien, hay que distinguir los tipos de topología: la física y la lógica. La topología física se refiere a la forma que dibuja la red. La topología lógica lo hace a la forma de organizarse la transmisión en la red. Se distinguen dos: difusión (broadcast) y token, que se puede traducir por testigo o turno. Más gráfico es el término turno. La difusión consiste en disponer la información al medio de transmisión de forma que estará disponible a todos los equipos. El acceso al medio se realiza cuando se necesita. Esta filosofía de funcionamiento se da en llamar acceso al medio por contienda, es decir los equipos luchan por hacerse con el medio de transmisión. Y lógicamente, esta situación puede provocar conflictos, si dos equipos intentan transmitir a la vez. A esta contienda, cuando genera conflicto, se conoce como colisión, que habrá que resolver. Es el caso de Ethernet o Wifi. Por su parte, la topología lógica en Token consiste en la transmisión cuando llega un turno que se envía por la red. Cuando un equipo tiene el turno, puede transmitir. Transmita o no, al terminar, cede el “token” a la siguiente estación. No se producen colisiones. Es el caso de Token Ring y Token Bus. Las topologías física y lógica están estrechamente unidas y en la mayoría de casos las referencias a la topología son referencias a la topología física, donde prácticamente se supone que una topología en estrella va a usar una topología lógica de difusión y una topología de bus o anillo usará una topología lógica de turno. Una vez establecidos los criterios básicos, surgen las variaciones y mejoras. Para enfrentar un examen, de oposición, por ejemplo, lo importante puede ser el concepto. Sin embargo, conviene extender, siempre con un compromiso entre el tiempo y la amplitud del temario este tipo de variaciones que pudieran presentarse como cuestiones. Por esta razón hay que destacar dos mejoras en la filosofía de acceso al medio por paso de testigo o turno: el anillo con contienda y el ranurado. El anillo con contienda soluciona mejora la eficiencia de Token Ring cuando la carga en la red es baja, introduciendo el mecanismo de contienda, es decir, enviar sin esperar el turno. Sin embargo, hace necesario solucionar las posibles colisiones. Se mejora la eficiencia del protocolo a costa de mayor complejidad. El anillo ranurado es una técnica de control distribuido en que se permite el tráfico de tramas de estaciones distintas en el anillo. El problema surge 10-6 Redes locales de la posibilidad de que una estación con gran cantidad de información a transmitir, monopolice el canal. Otra vez, mayor complejidad a cambio de mayor eficiencia. 2.2.1. Estrella Todas las estaciones se conectan a un nodo central o concentrador. Si la red es cableada, los equipos se conectan con cables dedicados. Es una red fácil de instalar y permite detectar errores de forma simple. Si un equipo falla sólo falla ese, pero la red queda inoperativa si falla el concentrador. Al diseñar una red en estrella hay que contar con su complejidad y número de equipos que la formarán. Ventajas que ofrece son aceptar terminales con tasas de transmisión diferentes, facilidad de detección de averías y posibilidad de uso de distintos medios de transmisión. Como inconvenientes destacan lo caro del cableado, vulnerabilidad ante caídas del concentrador y ralentización de la red ante picos de actividad elevada. Puede encontrarse el término “topología en árbol”, referido a una topología en estrella que se repite en alguna de sus ramas. No tendría más interés si no fuese por algunas consideraciones: Si se combinan varios hubs en una red tipo estrella o árbol, no pueden generarse bucles. En este caso, la red dejaría de funcionar. Para evitar estos problemas existen algoritmos que los detectan y evitan. Un ejemplo es el protocolo de expansión de árbol, o STP, spaning-tree protocol, que implementan los “switches”. 2.2.2. Bus Una red en bus se conecta con un sólo cable con terminaciones. Es fácil de instalar y no existen nodos centrales. Presenta problemas si hay una discontinuidad en el bus y pueden ser difíciles de localizar. Todos los equipos comparten el bus y se conectan a él, en general usando conectores en T. Al diseñar una red en bus hay que tener en cuenta su complejidad, en general da solución a pequeñas redes con poco tráfico. Entre sus ventajas se encuentran la facilidad de crecimiento e instalación de nuevos equipos. Desventajas son la máxima longitud de cable a usar, no permitir la conexión de redes tan grandes como Ethernet y el sistema no reparte los recursos por igual. Suele usar tecnología Token Bus y cable coaxial. Prácticamente han sido sustituidas por redes tipo Ethernet por ser más barata y escalable. 2.2.3. Anillo Una red en anillo es una red en bus en la que se unen los extremos. Es difícil de instalar y mantener. Si se rompe el anillo la red cae. Cada estación realiza funciones de repetidor, enviando la información a la siguiente estación del anillo. Para implementar una red en anillo hay que tener en cuenta el 10-7 Sistemas y Comunicaciones “hardware” de red y los tiempos de espera medios, que suelen ser altos. Presentan respuestas buenas frente a picos de transmisión y es fácil ampliarla. Ventajas son la independencia de nodos centrales, redundancia y no existir colisiones. Inconvenientes son la complicación de la instalación y posibles problemas con los repetidores. En LAN se usan cable coaxial y tecnología Token Ring. Prácticamente han sido desplazadas por Ethernet. Esta topología es común en redes MAN y WAN con fibra óptica. La disposición suele ser la de un doble anillo de fibra óptica para ofrecer redundancia y disponibilidad. Las tecnologías de transmisión con fibra óptica en redes MAN y WAN, están pensadas para la gestión y transporte de grandes volúmenes de información. Una de las más utilizadas es JDS, Jerarquía Digital Síncrona, o SDH por sus siglas en inglés. 2.2.4. Malla Una topología mallada es aquella que conecta cada equipo de la red con el resto, lo que no ofrece una solución óptima, aunque si una alta redundancia. En un caso general no se usa un mallado total, sino que se establecen varias conexiones de un nodo con los adyacentes. Esta disposición se suele dar en redes WAN, en núcleos de red de operadores para proveer alta disponibilidad frente a fallos. Pueden existir casos en que se aplique un cierto mallado en redes locales por las mismas razones. Al permitir que la información viaje de origen a destino por distintas rutas cada paquete de datos, se trata de forma independiente en la red. La condición de diseño de una red mallada es el compromiso entre coste y funcionalidad, ya que para una red de pocos nodos, el número de enlaces puede no ser muy elevado, pero una malla total implica un número de enlaces que crece con el cuadrado del número de nodos en la red. 3. Tipología La tipología de redes LAN, abstrayendo la mayoría de aspectos responde a las dos filosofías de acceso al medio vistas: contienda y turno. Las tecnologías más utilizadas en redes LAN ofrecen una visión completa de su funcionamiento y tipología. La siguiente tabla resume las características de las tecnologías LAN: Tecnología LAN Protocolo Soporte TX Modo Velocidad Topología Ethernet CSMA/CD Cable Pares HD-HUB DCSwitch 10 Mbps Bus Fast Ethernet CSMA/CD Par / Fibra HD / DC 100 Mbps Bus/Estrella Giga Ethernet CSMA/CD Par / Fibra HD / DC 1 Gbps Bus/Estrella Token Ring Token Capture Fibra HD / DC 4-16 Mbps Anillo FDDI Token Capture Fibra HD / DC 100 Mbps Doble anillo WIFI CSMA/CA Radio HD – HUB 54 Mbps Estrella 10-8 Redes locales 3.1. IEEE 802.3. Ethernet Entre las normas y recomendaciones del IE3 se encuentra la IEEE 802.3 y sus variantes, también conocida como Ethernet. Es el estándar de redes LAN más extendido. IEEE 802.3 y Ethernet no son especificaciones exactas, pero a efectos prácticos se tratan y se refieren como si fueran la misma norma. Ethernet define una red de difusión con una topología típica en estrella. Los equipos acceden a la red mediante contienda. Su especificación se llama CSMA/CD, o Acceso al Medio por Sensibilidad de Portadora / Detección de Colisiones. Si un equipo quiere transmitir, comienza por comprobar si hay alguna señal presente en el cable, es decir, si hay otra estación transmitiendo (CSMA). Si hay datos, el equipo espera para transmitir. Si el canal está libre, el equipo transmite. Si dos equipos escuchan y no detectan actividad, pueden intentar transmitir justo a la vez. Esto produce una colisión. Si se produce colisión, hay que retransmitir. En las primeras implementaciones del protocolo, no se detectaba la colisión hasta el final de la transmisión. La mejora CD, Colission Detection, implementa la detección temprana de colisiones, de forma que al detectarse la colisión, los equipos dejan de transmitir. El protocolo está programado para que las retransmisiones no se efectúen a la vez. De esta característica se deriva el concepto de dominio de colisión, el conjunto de todos los equipos de la red, que al transmitir pueden generar una colisión. Esta idea se enfrenta a la de dominio de difusión, o conjunto de equipos que pueden recibir mensajes de difusión en la red. Esto no implica que sus datos colisionen. Una red Ethernet representa un único dominio de difusión, aunque según su estructura puede haber varios dominios de colisión. Para transmisión, Ethernet usa una codificación Manchester diferencial. Codificación Manchester: 1: 0: Codificación Manchester Diferencial 1: Codificación Bifase: 1: o 0 o 0 o +0,85V IEEE 802.3: o -0,85V En la información que se transmite va incluida la dirección MAC origen y destino. Los datos que se envían con el protocolo Ethernet se estructuran en paquetes, que por estar a nivel dos se denominan tramas. El formato de trama Ethernet es: Lo que debe conocerse es la estructura de tramas y el funcionamiento de la red. Trama IEEE 802.3 Preámbulo 7B SOF 1B Destino 6B Origen 6B Longuitud 2B Datos 0 - 15000 B Relleno 0 - 46 B FCS 4B 10-9 Sistemas y Comunicaciones La función de los campos de la trama Ethernet es la siguiente: — Preámbulo: Secuencia de 7 Bytes usada para sincronizar y estabilizar el medio físico antes de iniciar la transmisión de datos. El patrón del preámbulo es: 10101010… (En total 7 Bytes)… 10101010. Estos “bits” se transmiten en orden, de izquierda a derecha y en código Manchester. — SOF (Inicio de Trama-Start Of Frame): campo de 1 Byte con un patrón de 1s y 0s alternados que termina con dos 1s consecutivos. El patrón SOF es: 10101011. Indica que el siguiente bit será el más significativo del campo de dirección MAC destino. Aunque se detecte una colisión durante la emisión del preámbulo o del SOF, el emisor debe continuar enviando todos los “bits” de ambos hasta el fin del SOF. — Dirección destino: 6 Bytes que especifican la dirección MAC de tipo EUI-48 a la que se envía la trama. Esta dirección de destino puede ser de una estación, de un grupo “multicast” o la dirección “broadcast”. — Dirección origen: 6 Bytes con la dirección MAC de la máquina que genera la trama. — Tipo: Campo de 2 Bytes que identifica el protocolo de red de alto nivel asociado a la trama o la longitud del campo de datos. La capa de enlace de datos interpreta este campo. (En la IEEE 802.3 es el campo longitud y debe ser menor o igual a 1526 bytes). — Datos: Campo variable de 0 a 1500 “Bytes”. Es la información que se transmite. Contiene información y cabeceras de los niveles superiores. — Relleno: Campo de 0 a 46 “bytes” utilizado cuando la trama Ethernet no posee los 64 Bytes mínimos para no presentar problemas de detección de colisiones cuando la trama es muy corta. — FCS (Frame Check Sequence-Secuencia de Verificación de Trama): son 4 Bytes con un CRC (Código de Redundancia Cíclica). El emisor calcula el CRC de toda la trama, desde el campo destino al campo CRC suponiendo que vale 0. El receptor lo recalcula, si el valor calculado es 0 la trama es valida. En la Ethernet típica, cada host se conecta al concentrador con dos pares de alcance típico hasta 100 m. Fast Ethernet tiene una tasa de 100 Mbps, destacando el 100baseT4 con cable UTP y CSMA/CD como el 10baseT. 100baseTX posee transmisión dúplex total y UTP cat. 5. GigaEthernet, logra transmisiones de hasta 1000Mbps. El 1000baseT usa los 4 pares de UTP cat. 5 y el 1000baseCX usa 2 pares del cable STP blindado. Si la conexión se hace con fibra óptica, FastEthernet cuenta con la norma 100baseFX y GigaEthernet con 1000baseSX y 1000baseLX. 10-10 Redes locales La siguiente tabla resume el hardware y sus propiedades: Tipo/Característica Cable Conector Tasa de Tx. Distancia Máxima 10base5 Coaxial Grueso BNC 10Mbps 500m 10base2 Coaxial BNC 10Mbps 200m 10baseT Par Trenzado RJ45 10Mbps 100m 100baseTX UTP cat5 RJ45 100Mbps 100m 100BaseT4 Par Trenzado RJ45 1Gbps 100m 1000BaseTx Par Trenzado RJ45 1Gbps 100m 100baseFX FO multimodo ST 100Mbps 400m 1000BaseFX FO multimodo ST 1Gbps 100m 3.2. IEEE 802.4. Token Bus Token Bus define una red con medio compartido con topología de bus, en que se establece un anillo lógico. Cada estación debe saber a qué estación pasar el testigo, de forma que se establezca un sistema de turnos periódico. La dirección de la siguiente estación que podrá transmitir viaja en el campo dirección del testigo. Este campo no es necesario en las redes Token Ring debido a los enlaces físicos entre cada estación y la siguiente. En las redes Token Bus todas las estaciones están conectadas al mismo bus. El retardo de transmisión entre estaciones viene determinado por la velocidad de propagación de la señal en el cable y su longitud. 3.3. IEEE 802.5. Token Ring La norma IEEE 802.5, básicamente define las especificaciones Token Ring y muestra una topología en anillo. Token Ring fue desarrollado por IBM en la década de los 70 y se basa en una red por turno. Actualmente Token Ring está prácticamente obsoleto por el mayor rendimiento que ofrece Ethernet. Sin embargo, ilustra bien la naturaleza de este tipo de tecnología. Su funcionamiento se resume en que cada elemento habla sólo con el contiguo. Con este sistema se evitan colisiones. Existe una trama que va circulando por toda la red constantemente aun cuando no hay transmisión, el token o testigo. Existe el problema de que un corte en la red provoca el corte 10-11 Sistemas y Comunicaciones de la red entera. El token sólo puede retenerse cierto tiempo en cada estación, típicamente no más de 10 ms. Token Ring suele utilizarse con cable coaxial, pero puede implementarse con par trenzado. Las distancias máximas de la red se especifican en torno a 350 m y la velocidad máxima de transmisión entre 4 y 16 Mbps, aunque hay normas como HSTR (Token Ring de Alta Velocidad), que especifican velocidades de hasta 100 Mbps, pero no suelen estar soportadas, razón por la que Ethernet es una opción más interesante. El formato de trama de datos Token Ring es: Trama IEEE 802.5 SD 1B AC 1B FC 1B Destino 6B Origen 6B Origen FCS No limitado 4B ED 1B FS 1B Siendo su significado: SD: Delimitador de comienzo de trama AC: Control de Acceso FC: Campo de Control Destino: Dirección MAC de destino Origen: Dirección MAC origen FCS: Verificación de trama-checksum ED: Delimitador de fin de trama FS: Estado de trama No se profundiza en las funciones que realiza la información de cada campo, simplemente se enumeran. Hay que notar su gran parecido con la trama Ethernet. Esto es importante para comprender la diferencia entre el “switch” y el “bridge”. En principio, un “switch” no podría conectar una red Ethernet y otra Token Ring. Sin embargo un bridge si se diseña para esas labores de puente para la conexión de redes similares. Hoy día, no tienen mucho sentido su utilización porque Token Ring prácticamente ha desaparecido. Lo importante es tener una idea de su definición. 3.4. IEEE 802.11. WIFI La norma IEEE 802.11 o Wifi define, para una red LAN, la capa de subred con una tecnología de transmisión inalámbrica. En la banda de 5 GHz se usan hasta 52 portadoras multiplexadas por división ortogonal de frecuencia (OFDM) con tasa máxima de 54 Mbps y real de unos 20 Mbps. La norma 802.11g (utilizada en Wifi doméstico) define 11 canales configurables. El acceso al medio es CSMA/CA y el despliegue puede ser en modo infraestructura (ESS) o modo adhoc (BSS), ya presentados. La asignación de canales se suele hacer en el Access Point. En las redes “ad-hoc” los clientes detectan automáticamente el canal. Todas las versiones 10-12 Redes locales de 802.11x son compatibles entre sí. Para ofrecer seguridad, Wifi usa típicamente dos métodos de cifrado en la transmisión: WEP y WPA. WEP (Wired Equivalent Privacy, privacidad equivalente cableada) es un método de seguridad para redes inalámbricas que emplea el algoritmo de cifrado RC4 de RSA Data Security. No es seguro. Para proteger la integridad de los datos (que no sean modificados por un intruso), se aplica un algoritmo (CRC-32) al texto en claro, que genera un valor de comprobación de integridad (ICV). El ICV se añade al texto cifrado formando una especie de firma digital y se envía. El receptor descifra el mensaje con la clave y vuelve a recalcula la firma. Si coincide con el vector ICV recibido, se supone integridad de los datos. WPA se define en la versión 802.11i, ofrece más seguridad que WEP y utiliza un servidor de autentificación que distribuye claves diferentes a cada usuario. Puede utilizarse en modo de clave pre-compartida (PSK-Pre-Shared Key). También utiliza RC4 con clave de 128 “bits” y un vector de inicialización de 48 “bits”. La mejora con respecto a WEP es la implementación del Protocolo de Integridad de Clave Temporal o TKIP por sus siglas en inglés, que cambia claves dinámicamente. Cuando se combina con un vector de inicialización (IV) más grande, evita los ataques estadísticos a los que es susceptible WEP. La autenticación y cifrado WPA mejora la integridad de la información. La comprobación de redundancia cíclica CRC-32 usado en WEP es inseguro, ya que es posible alterar la información sin conocer la clave. WPA implementa un MIC (Código de Integridad del Mensaje “Michael”) y protección contra ataques de repetición. La versión WPA con PSK se denomina WPA-Personal y WPA2-Personal. La versión con autenticación 802.1x/EAP, se la conoce como WPA-Enterprise y WPA2-Enterprise. WPA2 utiliza el algoritmo de cifrado AES (Advanced Encryption Standard) y se considera seguro de acuerdo a lo establecido en el estándar 802.11i. Puede realizarse una comparación entre los tipos de LAN presentados. Token Ring está prácticamente desechado debido al mayor coste y menor velocidad que Ethernet. La decisión de la tecnología a emplear requerirá un compromiso entre coste y prestaciones, que en general decantarán la balanza a favor de Ethernet, a cambio de un mayor coste que Wifi. Wifi, ofrece menor coste, pero en función del número de equipos puede perder prestaciones más rápido. Es más cómodo, al permitir movilidad y más inseguro, lo que implica un esfuerzo adicional, pero representa una solución adecuada para muchas aplicaciones. 3.5. IEEE 802.15. BLUETOOTH La norma IEEE 802.15, estandariza la especificación Bluetooth desarrollada por fabricantes como Intel, IBM, Motorola, Nokia y otros. Define una tecnología específica de red local que se conoce como WPAN (Wireless Per10-13 Sistemas y Comunicaciones sonal Area Network). Una WPAN puede considerarse, o no, una red LAN. Esto es debido a que conecta dispositivos entre sí, con características diferentes a las que definen una LAN, como por ejemplo el alcance. De ahí, la distinción como WPAN, y al mismo tiempo, su consideración como LAN inalámbrica. En el caso general, una red WPAN conecta de forma inalámbrica dispositivos pequeños con corto alcance. La especificación inicial de Bluetooth contemplaba una tasa de transmisión del orden de 1 Mbps y distancia máxima de 10 metros, que han sido optimizados. Bluetooth usa la banda de 2,4 GHz, la misma que Wi-Fi “b” y “g”. Para reducir interferencias incorpora un sistema de saltos de frecuencias dentro de la banda, conocido como FHSS (Frecuency-hopping Spread Spectrum, espectro disperso de salto de frecuencia). Por fin, otras tecnologías inalámbricas que deben conocerse son: HomeRF (Radiofrecuencia doméstica). Es un estándar para uso doméstico, apropiado para transmisión de voz y datos. Utiliza el protocolo SWAP (Shared Wireless Access Protocol) y opera en la banda de 2,4 GHz. HiperLAN/2. Es la definición de ETSI homóloga a IEEE 802.11a. Opera en la banda de 5 GHz a 54 Mbps. Para mejorar y unificar estos dos estándares, Atheros propuso un tercero, conocido como 5-UP (5GHz Unified Protocol), que alcanza velocidades hasta 108 Mbps. LMDS (Local Multipoint Distribution Service). Dentro de esa frontera cada vez más difuminada entre LAN y MAN, LMDS supone un estándar para dar servicio de Internet en localizaciones donde no es rentable cablear. Ofrece servicios de banda ancha por microondas, en la banda entre 26 y 31 GHz. El sistema es “multipunto” porque se establecen enlaces punto a multipunto, entre la estación base y los usuarios. Los enlaces exigen visión directa con una distancia máxima entre 3 y 5 km. WiMax (IEEE 802.16). Es un estándar con objetivo similar a LMDS. Es una tecnología de microondas que opera en la banda de 2.5, 3.5 o 5GHz, lo que permite alcances de hasta 50 Km. La tasa de transmisión llega hasta 70 Mbps. Sus productos los certifica el WiMax Forum, formado por más de 100 empresas. La alternativa a WiMax de ETSI es HiperMAN. IrDA (asociación de datos por infrarrojos). Es una tecnología WPAN. Una vez que permite conectar dispositivos con un alcance reducido (en torno al metro) y visión directa, es decir, la alineación de los dispositivos. 4. Métodos de acceso Los métodos de acceso a una LAN definen la forma en que un equipo accede a los recursos. Aunque ya se han ido desgranando, se profundiza un poco más, para incrementar el manejo de la literatura y asentar los conceptos. 10-14 Redes locales 4.1. Acceso por contienda o aleatorio Los equipos acceden al medio cuando lo necesitan. Esto implica que deben luchar por la utilización del medio, competir, entrar en contienda. De ahí el nombre. La denominación de aleatorio responde a esa filosofía: se accede cuando se necesita, de forma aleatoria. Suele estar asociado a topologías en estrella. En principio, también se asocia a la idea de broadcast o difusión. La información se lanza al medio y está disponible a todos los equipos de la red, o el segmento de red del equipo emisor. El problema surge si dos estaciones, aleatoriamente, transmiten a la vez. En esta situación, se produce una interferencia en el medio, que se conoce como colisión. Por tanto, se distingue entre dominio de colisión y dominio de difusión. El dominio de colisión es el conjunto de equipos en que se puede dar una colisión. El dominio de difusión es el conjunto de equipos que pueden comunicarse sin posibilidad de colisión. El ejemplo esquemático es la VLAN (Virtual LAN). Dos equipos en la misma VLAN, en principio, pertenecen al mismo dominio de colisión. Si están en VLAN diferentes podrán estar en el mismo dominio de difusión, pero no de colisión. El método de contención paradigmático es CSMA, como se ha presentado. Consiste en escuchar el medio antes de transmitir. Si está ocupado, se espera. Si no, se transmite. Si aun así, se produce colisión, hay que solucionarla. La forma de solucionarlo suele utilizar dos técnicas: CA (Collision Avoidance, Prevención de Colisión) y CD (Collision Detection, Detección de Colisión). La diferencia estriba en que CA, espera que el receptor confirme que los datos han llegado correctamente. Si hay colisión, no se recibe la confirmación y se retransmite. Esto, merma la eficiencia. La detección de colisión es proactiva. Se identifica la colisión al poco de comenzar la transmisión y se deja de transmitir. La retransmisión comienza en otro momento marcado por la programación del protocolo con valores estadísticos para que las retransmisiones no vuelvan a colisionar. Si vuelve a producirse la colisión, se vuelve a repetir el proceso, con menor probabilidad todavía que exista una tercera colisión. Aunque parezca poco eficaz, la programación funciona bien con cargas de tráfico normales. Pero debido a la cada vez mayor cantidad de datos que se transmiten, los problemas de colisiones se solucionan segmentando las redes, de forma que el equipo conmutador (switch) sólo retransmite la información por el puerto al que está conectado el receptor, eliminando prácticamente toda posibilidad de colisión. 4.2. Acceso por turno, token o determinístico La filosofía es transmitir en espacios de tiempo determinados, por turnos. De ahí el nombre del método. La denominación de “token” se refiere a un testigo, una señal que indica que se posee el turno, como en las carreras de relevos. 10-15 Sistemas y Comunicaciones Por tanto, una estación sólo transmitirá cuando posea el testigo, es decir, sea su turno. El testigo se representa con una secuencia que no puede repetirse en la información para evitar malas interpretaciones. Para evitarlo se usan técnicas como “bit stuffing”, que se menciona como curiosidad y no se expone, pero su función es esa, evitar la confusión del “token”. El testigo recorre la red de forma que si una estación tiene que transmitir, lo “guarda”, es decir no lo retransmite y comienza a transmitir su información. Cuando termina, vuelve a “soltar” el testigo, es decir, lo vuelve a transmitir, de forma que le llegará a la siguiente estación. Ésta repetirá la operación, y si no ha de transmitir nada, retransmite el testigo. Así sucesivamente. Este método de acceso posee su esencia en el soporte de grandes cargas de tráfico. La elección del método de acceso será un compromiso de eficiencia. En general, una LAN con gran intensidad de tráfico, podría implementar acceso de turno, ya que habría menos retardo al no haber colisiones. Suele ser el caso de redes troncales de fibra con topología física en anillo. En el caso general, con carga de tráfico normal, los métodos de contienda son los habituales, como en la mayoría de redes LAN, con tecnología Ethernet, ya que eliminan el retardo de tránsito del testigo. 5. Dispositivos de interconexión Los dispositivos de interconexión en una LAN, se suelen englobar en lo que se conoce como electrónica de red. Posee un marcado carácter físico, es decir, se debe entender como un elemento “hardware”. Hay que hacer la distinción, porque el término interconexión haciendo referencia a una conexión recíproca, se podría limitar al aspecto de transmisión. Pero también suele entenderse como comunicación, lo que le confiere un aspecto lógico. Para zanjar la cuestión, ha de convenirse que la interconexión se refiera a la comunicación y el dispositivo al aparato mecánico o físico. Así, el “software” de interconexión quedaría fuera de los dispositivos. Siguiendo un sentido ascendente en la pila de protocolo OSI, se distinguen: Concentrador o “hub”. Es un conmutador físico, por tanto de nivel 1. Es un equipo pasivo que presenta varios puertos físicos para la conexión de los equipos. Su funcionamiento es el de repetir las señales que le llegan por un puerto al resto de puertos para alcanzar su destino. Puede entenderse como un ladrón de conexiones de red. No introduce inteligencia en la red, simplemente retransmite la señal. Repetidor. Es el dispositivo que incrementa el nivel de la potencia de señal recibida y la retransmite para poder cubrir la distancia hasta el destino. Esto se debe a que cuando la longitud de los cables es grande, la señal puede atenuarse y no ser interpretada en destino. 10-16 Redes locales Puente o “bridge”. Es un adaptador entre redes de tecnología muy similar. Por ejemplo, dadas dos redes LAN con cableados de par y coaxial, que usan tecnología Ethernet y Token Ring, pueden conectarse ambas redes con un “bridge” como si fueran una única LAN. Esto es posible porque la estructura lógica de transmisión en Ethernet y Token Ring es muy similar. Si la tecnología fuera muy diferente habría que recurrir a otros dispositivos como por ejemplo “routers”. “Switches” o conmutadores. Son conmutadores de nivel 2. Representan dispositivos que segmentan de forma lógica la red. Es decir, la red es dividida en varios dominios para conseguir objetivos de estabilidad, seguridad, etc. Una primera idea es pensar en un switch como un equipo que puede configurarse como varios “hubs” independientes. Los equipos que se conecten a ese hub virtual, configurado, podrán comunicarse entre sí, formando una VLAN (LAN Virtual). Los equipos que pertenezcan a otra VLAN podrán comunicarse entre sí, pero no con los de otras VLAN. “Routers” y “firewalls”. Un “router” es un conmutador de nivel 3. Un “firewall” es un conmutador de nivel 4. Aunque suelen entenderse como parte de la electrónica de red, y por tanto con cierto carácter “hardware”, un “router” y un “firewall” poseen una lógica asociada que introduce inteligencia en la red. Podría hablarse de “fireware” de red, una parte intermedia entre “hardware” y “software”. Por tanto, se pueden incluir como dispositivos de interconexión, aunque con una parte “software” importante. Un “router” es un equipo que conecta redes de distinta naturaleza y cuya función es dirigir la información que recibe por la ruta óptima para alcanzar el destino. A diferencia del “bridge”, conecta redes de tecnologías muy diferentes. Para ello dispone tantos “interfaces” de red como redes conecte. Un “router” puede ser un dispositivo hardware, como un router doméstico, o puede implementarse por “software”. En un router se configuran mediante software aspectos del tipo rutas a seguir por los datos, características de las redes a las que da acceso, o protocolos de encaminamiento. El router, al conectar varias redes puede cursar datos por diferentes rutas para alcanzar un destino. La decisión de la ruta a seguir la marca el protocolo de encaminamiento y dependerá de factores como el coste de transmitir información por un operador u otro, si una línea esta congestionada o caída, etc. Un “router” como parte del “software” de red, con mayores o menores prestaciones, puede realizar funciones de “firewall”. Un “firewall” o cortafuegos, es un dispositivo “hardware” (de aspecto similar al “router”) o “software” y cuya función es el control del tráfico de red. Es un dispositivo orientado a la seguridad y su trabajo consiste en evaluar puertos de conexión, direcciones IP, descarte de tráfico mal construido, o que intenta obtener información de la red (escaneos de puertos) o eliminar correo electrónico basura (spam) para evitar malos usos y ataques de red. Puede entenderse la idea de firewall como una aduana. Es un punto de control del tráfico de entrada y salida a una red. El control se realiza analizan10-17 Sistemas y Comunicaciones do la información de control incluida en los datos de usuario. Ejemplos de “firewall” implementados por “software” son los programas habituales de entornos domésticos para establecer un control de las conexiones y ofrecer medidas de seguridad. Son muy conocidos los “firewalls” que se integran con los SO, como el “firewall” de Windows de Microsoft. En general, los “firewalls” se sitúan en la frontera entre una LAN e Internet. Pero existen configuraciones más complejas, por ejemplo para establecer controles de conexión a zonas protegidas de una red, en la que por ejemplo, se alberguen los servidores. Este caso típico, define una DMZ o zona desmilitarizada. Los “firewalls” poseen capacidad de aprendizaje, configurándolos con reglas de decisión para que ante tráfico sospechoso se emita un aviso o deje constancia en un archivo de “log” o registro. La siguiente tabla resume los dispositivos de interconexión de una LAN, en relación al nivel OSI en que se encuadran y ejemplos de normas y protocolos que gestionan. 10-18 Report "Temario 2 Técnicos Axiliares de Informática de La Admnistración" Your name Email Reason Description Copyright © 2025 IDOC.TIPS. All rights reserved. About Us | Privacy Policy | Terms of Service | Copyright | Contact Us | Cookie Policy Sign In Email Password Remember me Forgot password? Our partners will collect data and use cookies for ad personalization and measurement. Learn how we and our ad partner Google, collect and use data. Agree & close

Temario 2 Técnicos Axiliares de Informática de La Admnistración

Recommend Documents

Página web

" + title + "

Título que aparecerá centrado

,

,

,

,

y

Títulos.

es el título (epígrafe) más general,

es un subtítulo de

y así sucesivamente, hasta llegar a

Ceremonia de los Oscars

indica que un bloque de texto es un encabezamiento y que es más importante que un bloque etiquetado como

. Versiones más antiguas de HTML permitían atributos extra dentro de la etiqueta abierta para darle formato (como el color o el tamaño de fuente). No obstante, cada etiqueta

debía disponer de esa información si se deseaba un diseño consistente para una página, y además, una persona que lea esa página con un navegador pierde totalmente el control sobre la visualización del texto. Cuando se utiliza CSS, la etiqueta

no debería proporcionar información sobre como va a ser visualizado, solamente marca la estructura del documento. La información de estilo separada en una hoja de estilo, especifi8-78 Aplicaciones Web ca como se ha de mostrar

Página web

Página principal del Host

no debería proporcionar información sobre como va a ser visualizado, solamente marca la estructura del documento. La información de estilo separada en una hoja de estilo, especifi8-78

Aplicaciones Web

ca como se ha de mostrar