Teor´ eor´ıa de la Credibilida Credib ilidad d El presente trabajo constituye una breve introducci´on on al tema de Teor´ eor´ıa de la Credibilidad Credibili dad donde las principas ideas expuestas expuestas son tomadas tomadas del libro Esta libro Estad d´ıstica ıst ica actuaria actu ariall Teor´ Teor´ıa ıa y aplicacion apli caciones es de de Sarabia, G´omez omez y V´azquez. azquez. Introducci´ on on a los principios de la Estad´ Estad´ıstica Bayesiana Para entender las diferencias entre la l a estad´ıstica ıstica Bayesiana y la frecuentista, p odemos considerar los siguientes aspectos: 1. Perspectiva Perspectiva frecuentista frecuentista Solo los sucesos sucesos susceptible susceptibless de ser repetidos tienen probabilidad probabilidad.. Un suceso puede ser incierto por el hecho de ser intr´ intr´ınsecamente impredicible, es decir, se encuentra sujeto a variabilidad aleatoria. 2. Perspectiva Perspectiva Bay Bayesiana esiana La probabilidad describe incertidumbre. Ademas de contemplar que un suceso puede ser incierto por el hecho de ser intr´ intr´ınsecamente impredicible (variabilidad aleatoria) tambi´en en puede ser incierto por el hecho de que tengamos un conocimiento imperfecto sobre el mismo. La necesidad de esta interpretaci´on on de la probabilidad queda de manifiesto cuando observamos la cantidad de sucesos de los que tratamos de extraer probabilidades que no pueden ser interpretados desde un punto de vista frecuentista. Un ejemplo de esto constituye en saber cu´al al es la probabilidad asociada a una hip´otesis, otesis, pues una hip´otesis otesis puede ser cierta o falsa, pero no podemos considerar una repetici´on del estudio como si se tratase del lanzamiento de una moneda. La idea b´asica asica del an´alisis alisis bayesiano lo resumimos en el siguiente parrafo: El an´ alisis alisis est´ adistico adistico de unos datos observados observados x ˆ suele comenzar con una evaluaci´on on descriptiva mediante la cual puede sugerirse alg´ un modelo probabilistico f ( un f (x θ ) : θ Θ que represente para alg´un un valor desconocido de θ el mecanismo probabilistico que ha generado los datos ˆx observados. El paradigma bayesiano establece que es necesario asignar una distribuci´on on a priori π priori π((θ) sobre el espacio param´ etrico etrico Θ que describa el conocimiento disponible sobre el valor θ antes de haber observados los datos. Se sigue entonces que si el modelo de probabilidad es correcto, toda la informaci´ on disponible sobre el valor de θ despu´es on es de observar x ˆ estar´a contenida en la densidad a posteriori π(θ x ˆ) obtenida mediante (Caso continuo):
{ |
∈ }
|
π (θ x ˆ) =
|
f (ˆ (ˆx θ )π (θ ) f (ˆ f (ˆ x θ)π(θ) dθ Θ
| |
∝ f (ˆ f (ˆx|θ )π (θ )
(1)
donde (?? (??)) constituye una aplicaci´on on del teorema de Bayes. Al utilizar secuencialmente este teorema, tenemos que a partir de una muestra inicial x ˆ conocemos que: π (θ x ˆ)
| ∝ π(θ) · L(ˆx|θ)
(2)
donde L donde L es la funci´on on de verosimilitud de los datos: n
L(ˆx θ ) =
|
con n con n como el tama˜no no de la muestra.
i=1
f ( f (xi θ )
|
Ejemplo 1 Si la densidad a priori es gamma ( gamma (a, 1/b) /b) y al muestreo es Poisson (θ), calcule la densidad a posteriori.
1
En efecto supongamos que los datos est´ a dada por:
x
de una muestra de tama˜no t tienen distribuci´on Poisson(θ) donde la verosimilitud
L(θ x) =
|
e−tθ θ
t
i=1 x i
∝
t i=1 xi !
donde:
1 x ¯ = t
θt¯x exp( tθ)
−
t
xi
i=1
∝ θa−1exp(−bθ). Por lo tanto: π(θ |x ¯) ∝ θt¯x exp(−tθ)θ a−1 exp(−bθ) = θ t¯x+a−1 exp(−(t + b)θ) ∼ Gama(t¯ x + a; 1/(t + b))
Si la densidad a priori es gamma entonces π(θ)
(3)
Procedemos ahora a considerar el tema de teor´ıa de la credibilidad. Se considera que la primeras ideas sobre credibilidad aparecen a principios del siglo XX en los trabajos de Mowbray (1914) y Whitney (1918). El problema b´asico es el siguiente: Supongamos que disponemos para un asegurado o contrato de la experiencia de siniestralidad X 1 ,...,X t de modo que E [X j ] = ε y V ar[X j ] = σ2 j = 1,...,t. El objetivo de la aseguradora es decidir qu´ e prima cargar a esa p´ oliza o asegurado.
∀
Para resolver este problema existen tres alternativas: 1. Ignorar la experiencia de siniestralidad y cargar lo que se conoce como una prima manual M . Esta prima est´ a basada en la experiencia de otros contratos similares. ¯ = 2. Cobrarle X
1 t
t j=1 X j ;
es decir, dar credibilidad total a la experiencia del asegurado.
3. Cobrar una prima que venga dada como un punto medio o combinaci´on lineal convexa entre la experiencia individual y M . Esto es: ¯ + [1 Prima = Z (t)X donde el factor Z
− Z (t)]M
(4)
∈ [0, 1] se conoce como el factor de credibilidad.
Es importante considerar la siguiente informaci´on (Hickmann 1973): Definici´ on 1 La teor´ıa de la credibilidad es el mecanismo que permite el ajuste sistem´ atico de las primas de seguros a medida que se obtiene la experiencia de siniestralidad. Credibilidad total Desde la perspeciva de los asegurados, a estos les conviene que la prima que deben pagar est´e basada ´unicamente en su propia experiencia de siniestralidad en caso de que para ellos la experiencia de reclamaci´on les sea favorable; es decir, que la aseguradora le asigna a ´esta un 100 % de credibilidad. Sin embargo, desde le punto de vista del asegurador, esto ser´a posible si la experiencia de reclamaci´on es estable. ¯ es estable si existe una probabilidad alta de que la diferencia Una manera de resolver este problema es suponer que X ¯ y ε sea peque˜ entre X na. En t´erminos matem´aticos esto supondr´ıa suponer credibilidad total si: P r[(1
− c)ε ≤ X ¯ ≤ (1 + c)ε] = P r[|X ¯ − ε| ≤ cε] = P r
Definimos x p como:
m´ın P r x
¯ ε X σ/ t
−√ ≤ x ≥ p 2
−√ ≤ cε√ t ≥ p σ
¯ ε X σ/ t
(5)
(6)
¯ sigue una distribuci´on de tipo continua, est´a u Suponiendo que X ´ ltima expresi´on es equivalente a: Pr
¯ ε X σ/ t
−√ ≤ x p
= p
(7)
Por lo tanto, de (??) la condici´on que ha de verificarse para suponer credibilidad total es:
√
cε t σ
≥ x p
(8)
o de forma equivalente: σ ε
≤ √
c t = x p
2
t
=
2
xp c
t λ0
(9)
con λ0 = ( xcp ) . La expresi´on (??) puede interpretarse en el siguiente sentido: se supone credibilidad total si el t ¯ es la media muestral, se observa que se coeficiente de variaci´on es menor o igual que . Ahora, recordando que X
λ0
supone credibilidad total si:
σ2 ¯ V ar[X ] = t
2
≥ λε 0
(10)
Por otro lado, el valor que ha de tomar t para suponer credibilidad total ha de cumplir seg´un (??): t
≥ λ0( σε )2.
Si en la pr´actica, la experiencia del asegurado es suficientemente grande, aplicando el Teorema Central del L´ımite, si ¯ −ε X √ t vemos de (??) que P r[ x p Z x p ] = φ(x p ) φ( x p ) = 2φ(x p ) 1 = p, de modo que x p es el hacemos Z = σ/ 1+ p 2
− ≤ ≤
− −
percentil de la distribuci´ on normal est´andar.
−
Ejemplo 2 Suponemos que se cuenta con la experiencia X j , j = 1,...,t de un contrato de seguro perteneciente a una cartera de seguros y que X 1 ,...,X t son variables aleatorias independientes e id´ enticamente distribuidas Poisson (θ = 200). Obtener el valor m´ as peque˜ no de t para suponer credibilidad total de la experiencia observada, suponiendo c = 0, 04, p = 0.95 y que la aseguradora tarifica atendiendo s´ olo al n´ umero de reclamaciones p En este caso ε = σ 2 = 200. Como x p es el 1+ 2 percentil de la normal, con el valor de p se tiene que Luego, seg´ un la tabla de la normal φ(1.96) = 0.975, de modo que x p = 1.96. Por otro lado:
λ0 = y por tanto: t
x p c
2
1.96 0.04
=
1+ p 2
=
1+0.95 2
= 0.975.
2
= 2401
≥ 2401 200 = 12.005 2002
Credibilidad Parcial Para muchos asegurados la experiencia de siniestralidad es insuficiente para suponer credibilidad total; es decir, que Z (t) = 1. Ahora se supone que la prima a cargar sea una combinaci´on lineal entre la experiencia del asegurado y la experiencia del colectivo o prima manual, de modo que nos encontramos en la situaci´on descrita por (??) y habr´a que determinar el valor de Z (t) para obtener la prima. Dado que: ¯ + [1 V ar[P ] = V ar[Z (t)X igualando este t´ermino a
ε2 λ0
2
¯ ] = Z (t)2 σ − Z (t)]M ] = Z (t)2V ar[X t
[ver (??)] resulta: ε Z (t) = σ
de modo que se elige Z (t) de acuerdo a la expresi´on: 3
t λ0
Z (t) = m´ın
ε σ
t ;1 λ0
(11)
Ejemplo 3 Con los datos del ejemplo ?? se pide ahora calcular el valor del factor de credibilidad para una experiencia de reclamaciones correspondientes a 10 a˜ nos. Usando (??) tenemos: Z (10) = m´ın
√ 200 200
10 ;1 2401
= 0, 9126
Credibilidad e inferencia bayesiana El uso de distribuciones a priori resulta ´util en el mercado de seguros, sobre todo si se tiene en cuenta que cuando se quiere tarificar un riesgo nuevo no se cuenta con datos disponibles. Ahora, con las herramientas de la estad´ıstica bayesiana, el problema de la teor´ıa de la credibilidad consiste en determinar las ponderaciones que afectan a la experiencia de siniestralidad de una p´oliza respecto a la experiencia de un colectivo al que pertenece dicha p´oliza. Consideremos entonces la cartera de seguros que aparece en el cuadro ( ??) que consta de k p´olizas y t periodos de observaci´on: 1 2 .. .
1 x11 x12 .. .
2 x21 x22 .. .
... ... ... .. .
j xj1 xj2 .. .
... ... ... .. .
k xk1 xk2 .. .
t
x1t
x2t
...
xjt
...
xkt
Cuadro 1: Cartera de seguros La cuesti´on b´asica de la teor´ıa de la credibilidad es determinar una prima establecida como una combinaci´ on convexa entre la experiencia particular de un asegurado y la experiencia del colectivo, esto es de toda la cartera. Una expresi´on v´alida es: P j = [1
− Z (t)]P 0 + Z (t)Pj
donde: P j : Prima a aplicar a los asegurados al riesgo j .
P 0 : Prima a aplicar a un colectivo al que pertenece el asegurado j .
Pj : Prima obtenida en base a la experiencia del asegurado j . Z (t): Factor de credibilidad. Donde Z (t) = 1 indica que la experiencia del asegurado es creible al 100 %, mientras que Z (t) = 0 entonces P j = P 0 ; es decir, la prima del asegurado j coincide con la del colectivo a que pertenece dicha p´oliza. La f´ormula de credibilidad puede por tanto interpretarse tambi´ en de la siguiente manera: puede considerarse a P 0 como la informaci´on a priori; P j la nueva informaci´on obtenida mediante la observaci´on de la siniestralidad del riesgo j y P j el resultado de combinar la informaci´on a priori con la informaci´on a priori con la informaci´on adquirida. Por tanto:
Prima(a posteriori) = [1
− Z (t)]Prima a priori + Z (t)Experiencia Observada
Visto de esta manera, la teor´ıa de la credibilidad sigue un esquema bayesiano, donde se da entrada a la informaci´on a priori con la informaci´on muestral, para obtener finalmente un estimador revisado de la prima. Consideramos ahora el siguiente ejemplo: 4
Ejemplo 4 Comprobar que la prima Bayes obtenida en la presentaci´ on anterior se puede escribir como una f´ ormula de credibilidad La prima obtenida fue: a + t¯ x b + tν 2 (ν + 1)t a(ν + 1) = ¯+ x b + tν 2 b + tν 2 νt ν + 1 b 2 a(ν + 1) = ¯+ x b + tν 2 ν b + tν 2 b 2 ν + 1 = Z (t)( ¯) + [1 Z (t)]P x ν
P (x) = (ν + 1)
−
−
−
−
−
−
−
−
con Z (t) =
νt b+tν 2 .
−
Ejemplo 5 Sean X i variables aleatorias iid con X i Poisson(θ) y funci´ on de estructura gamma(a, 1/b). Comprobar que la prima calculada bajo el principio de prima neta se puede escribir como una f´ ormula de credibilidad.
∼
Del ejemplo ?? sabemos que la distribuci´on posteriori es gamma(a + t¯ x; 1/(b + t)). Utilizando ahora el concepto de prima neta de Bayes: P (x) = E π(θ|x¯) [E f [X θ]] a + t¯ x = b + t t b a = x ¯ + b + t b + t b = Z (t)¯ x + [1 Z (t)]E [θ]
|
−
con Z (t) =
t b+t .
Modelo de Bulhlmann de distribuci´ on libre El modelo de Bulhmann de distribuci´on libre constituye unos de los puntos de partida de la moderna teor´ıa de la credibilidad. El objetivo de este modelo es estimar la prima correspondiente a un asegurado o grupo de asegurados que conforman una p´oliza en una cartera de seguros, restringi´endose a las primas lineales y utilizando el m´ etodo de los m´ınimos cuadrados. Lo revelante de este propuesta es la no necesidad de establecer hip´otesis alguna, ni sobre la distribuci´ on que gobierna los riesgos individuales, ni sobre la distribuci´on a priori de los par´ametros de riesgo, de ah´ı el nombre de modelo de distribuci´on libre. El objetivo del modelo de Buhlmann consiste en calcular la mejor prima lineal
H(µ(θ)|X 1,...,X t)
(12)
dependiente de los datos observados, mediante el m´etodo de los m´ınimos cuadrados. Para ello establecemos la siguiente notaci´ on: Prima de riesgo individual: µ(θ) = E [X θ].
|
Prima de riesgo colectivo: m = E [X ] = E [µ(θ)]. (Valor esperado de todas las primas de riesgo individuales) Varianza de las primas de riesgo individual: a = V ar[E [X θ]] = V ar[µ(θ)]. (Indicador de la heterogeneidad de la cartera)
|
5
Medida de dispersi´ on de la siniestralidad individual: s 2 = E [V ar[X θ]].
|
Se supone tambi´en que X 1 θ,...,X t θ est´an id´enticamente distribuidas con media y varianza comunes µ(θ) y σ 2 (θ) respectivamente. Como predecente al modelo de Buhlmann consideramos la siguiente proposici´on:
|
|
Proposici´ on 1 Si X e Y son variables aleatorias con distribuci´ on conjunta dependiente de la variable aleatoria Θ se verifica: E [X ] = E θ [E X [X Θ]]
(13)
|
Cov[X, Y ] = E [Cov[X, Y Θ]] + Cov[E [X Θ], E [Y Θ]]
|
|
(14)
|
Prueba: La igualdad (??) es una aplicaci´on de la regla de la esperanza iterada. Para verificar (??) hacemos: Cov[X, Y ] = = = = =
E [(X E [X ])(Y E [Y ])] E [(X E [X Θ] + E [X Θ] E [X ])(Y E [Y Θ] + E [Y Θ] E [Y ])] E [( X E [X Θ] + E [X Θ] E [X ] )( Y E [Y Θ] + E [Y Θ] E [Y ] )] E Θ [E X,Y |Θ [( X E [X Θ] + E [X Θ] E [X ] )( Y E [Y Θ] + E [Y Θ] E [Y ] )]] E Θ [E X,Y |Θ [ X E [X Θ] Y E [Y Θ] ]] + E Θ [E X,Y |Θ [ X E [X Θ] E [Y Θ] E [Y ] ]] +E Θ [E X,Y |Θ [ E [X Θ] E [X ] Y E [Y Θ] ]] + E Θ [E X,Y |Θ [ E [Y Θ] E [Y ] E [X Θ] E [X ] ]] = E [Cov[X, Y Θ]] + 0 + 0 + Cov [E [X Θ], E [Y Θ]]
− − − | | − − | | − { − | } { | − } { − | } { | { − | } { | − } { − | } { − | }{ − | } { − { | − }{ − | } { | | |
− } { | − } | }{ | − } | − }{ | −
}
Procedemos a probar el resultado de Bulhmann: Teorema 1 La mejor aproximaci´ on lineal
H(µ(θ)|X 1,...,X t) es: ¯ = a + b 1 a + bX t
donde: a = (1 b = k =
t
X i
(15)
i=1
− b)m
t t + k
E [σ 2 (θ)] V ar[µ(θ)]
Prueba: Queremos encontrar la mejor estimaci´ on de la prima neta de riesgo que dependa linealmente de los datos observados, esto es: t
H(µ(θ)|X 1,...,X t) = c0 +
ci X i
i=1
Para ello hagamos m´ınima la esperanza del cuadrado de la desviaci´ on de la prima de riesgo individual respecto a (µ(θ) X 1 ,...,X t ), esto es:
H
|
m´ın E ci
− 2
t
µ(θ)
− c0
ci X i
i=1
Calculando las derivadas con respecto a c0 y cr para alg´ un r = 1,...,t e igualando a cero se tiene:
6
d E dc0
− 2
t
µ(θ)
− c0
− − − − − − − − − − t
ci X i
= 2E
i=1
µ(θ)
c0
ci X i
i=1
t
= 2 E
µ(θ)
ci X i
c0
i=1
t
= 2 E [µ(θ)]
E
ci X i
c0
i=1
t
= 2 m
ci E [X i ]
c0
i=1 t
= 2 m
ci m
c0
i=1
= 0 Por tanto m
−
d E dcr
t i=1 ci m = c 0 .
Por otro lado, al sustituir c0 vemos que:
− 2
t
µ(θ)
− c0
ci X i
=
i=1
− − − − − − − − − − − − − − − − − − − − − 2
t
d E dcr
µ(θ)
m
ci (X i
m)
i=1
t
= 2E
µ(θ)
m
ci (X i
m) (X r
m)
i=1
t
= 2E (µ(θ)
m) (X r
m)
ci (X i
m)(X r
m)
i=1
t
= 2 E [(µ(θ)
m)(X r
m)]
E
ci (X i
m)(X r
m)
i=1
t
= 2 cov[µ(θ), X r ]
ci E [(X i
m)(X r
m)]
i=1 t
= 2 cov[µ(θ), X r ]
ci cov[X i , X r ]
i=1
= 0 Por tanto
t
cov[µ(θ), X r ] =
ci cov[X i , X r ]
i=1
Como X 1 θ,...,X t θ est´ an id´ enticamente distribuidas con media y varianza comunes µ(θ) y σ2 (θ) entonces:
|
|
cov[X r , X i ] = a + δ ri s2 cov[µ(θ), X r ] = a
y sustituyendo lo anterior en ( ??) tenemos que: t
a =
ci (a + δ ri s2 )
i=1
7
(16)
t
a =
t
ci a +
i=1
ci δ ri s2
i=1
t
ci a + cr δ rr s2
a =
i=1
t
ci a + cr s2
a =
i=1
Por la simetr´ıa del sistema tomamos c = c1 = Despejando c en la relaci´ on anterior tenemos que:
· · · = ct tenemos entonces que a = c =
Por otro lado, puesto que c0 = m
−
t i=1 ci m = m
a + at
s2
− mtc = m(1 − tc) = m
t 2 i=1 ci a + c r s
= act + cs 2 .
− 1
s2
at se concluye entonces que: + at
t
H(µ(θ)|X 1,...,X t)
= c0 +
ci X i
i=1 t
= c0 +
ci X i
i=1
− − −
= m 1 = m 1 = m(1 = m(1 con: Z (t) =
s2
t
at 2 s + at
+
at s2 + at
+
Z (t)) +
1 t
i=1
1 t
s2
t
i=1
a X i + at at X i s2 + at
t
Z (t)X i
i=1
¯ − Z (t)) + Z (t)X
at tV ar[µ(θ)] t = = 2 + at tV ar[µ(θ)] + E [σ (θ)] t + k
(17)
Consideremos ahora el siguiente ejemplo: Ejemplo 6 Comprobar que el factor de credibilidad obtenida en el ejemplo ?? mediante la metodolog´ıa bayesiana coincide con el de Buhlmann. El factor de credibilidad del ejemplo ?? fue Z (t)Bayes = por (??) donde:
t b+t .
Ahora el factor de credibilidad de Buhlmann viene dado
µ(θ) = σ 2 (θ) = θ E [σ 2 (θ)] = E [θ] =
a b
1) a 2 − E [θ]2 = a(a + − ( ) b2 b
V ar[µ(θ)] = V ar[θ] = E [θ 2 ] Por lo tanto: Z (t)Buhlmann =
t ba t a b + 2
2
a b
8
=
t = Z (t)Bayes b + t
Ejercicio Propuesto (Modelo Poisson-gama) Se postula que cada una de las variables aleatorias independientes S 1 ,...,S m tiene distribuci´ on Poisson con par´ametro λ, el cual se considera aleatorio con distribuci´o n a priori gamma(γ, α), con γ y α par´ametros conocidos. Observe que en este modelo E [S ] = λ y se considera que los montos de las reclamaciones toman valores enteros. Calcule: La funci´on de densidad a posteriori de λ para x > 0. Calcule la prima de credibilidad (esperanza de la densidad calculada en el inciso anterior). Soluci´ on: Para este modelo, E [S ] = λ. Luego, la funci´on de densidad a posteriori de λ est´a dada por:
π(θ S 1 ,...S m ) =
|
=
L(λ S 1 ,...,S m )h(λ)
||
∞ L(λ S ,...,S )h(λ) dλ 1 m 0 − m λ e α γ −1 −αλ e j=1 ( S ! ) Γ(α) λ ∞ m ( λ e− ) α λγ −1 e−αλ dλ 0
=
Sj
λ
γ
j
Sj
λ
γ
j=1 S j ! Γ(α) ¯ mS +γ 1 (m+α)λ
− e− λ ∞ λmS ¯+γ −1 e−(m+α)λ dλ
0
¯+γ mS
=
(m + α) ¯ λmS +γ −1 e−(m+α)λ ¯ Γ(mS + γ )
¯ + γ, m + α). Por lo tanto, la prima por credibilidad (Esperanza de esta Es decir, la densidad a posteriori es gama( mS densidad) es: prima
= E [S ] ¯ + γ mS = m + α m ¯ α γ = S + m + α m + α α γ = z ¯ S + (1 z) α
−
Donde z =
m m+α es
el factor de credibilidad
9