Matemática Financeira - Universidade Nova de Lisboa
Transcrição
Matemática Financeira - Universidade Nova de Lisboa
Distribuiç ã o Estimada: [email protected], 2.4, 2111.D 0.00002 0.000015 0.00001 5. ´ 10-6 50 000 100 000 150 000 200 000 Colecção Métodos Estocásticos para a Matemática Financeira III Matemática Financeira Notas de Lições Manuel L. Esquı́vel Professor Associado de Probabilidade e Processos Estocásticos April 4, 2013 O Modelo Binomial MF0910 26 de Novembro de 2009 1 Modelo a um Perı́odo Apresentamos seguidamente o modelo binomial a um perı́odo. A nossa apresentação segue de perto a de Tomas Björk na obra de consulta obrigatória para uma iniciação bem sucedida à matemática financeira actual [Björk 98]. No entanto, o leitor beneficiará, certamente, com outras leituras sobre este tema para as quais são indicadas na bibliografia algumas referências. Para descrevermos o modelo binomial a um perı́odo consideramos os seguintes pressupostos e notações. • Designamos o tempo pela variável t. Representar-se-á por t = 0 a data de hoje, que será o inı́cio do perı́odo e, por t = 1 a data de amanhã, a data final do perı́odo. • Consideramos que o mercado é constituı́do por dois activos transaccionáveis que descriminamos a seguir. – A obrigação (bond1 ), designando-se por Bt o preço da obrigação à data t; – A acção (stock), designando-se por St o preço da acção à data t. • Pressupomos também que a dinâmica dos preços dos activos, isto é, a evolução dos preços está definida do modo a seguir descrito. – A obrigação tem uma dinâmica determinı́stica dada por: ( B0 = 1 preço à data t = 0 B1 = 1 + R preço à data t = 1 onde R representa a taxa de juro spot para o perı́odo ou, alternativamente, R é a taxa de juro paga pelo banco por um depósito numa conta bancária. – A acção tem uma dinâmica aleatória, isto é, definida por um processo estocástico. Note-se que esta designação deve ser entendida genericamente. S0 = s (preço à data t = 0 s · u com probabilidade pu S1 = s · d com probabilidade pd 1 De modo geral indicaremos as denominações financeiras em lı́ngua Inglesa para mais cómoda referência do leitor à literatura internacional sobre este tema. 1 Capı́tulo I Modelo Binomial Secção: 2 Assim sendo, temos que a dinâmica do activo com risco admite a representação seguinte. S1 = s · Z onde Z é uma variável aleatória tal que: ( u com probabilidade pu Z= d com probabilidade pd • Podemos assim indicar a seguinte representação esquemática para as dinâmicas dos activos. Supondo que d < u e pu + pd = 1, que é condição para que P = (pu , pd ) represente uma probabilidade, tem-se para o activo sem risco, Bt : 1 −→ 1 × (1 + R) e para o activo com risco: su com probabilidade pu e u ∼ up ∼↑ S0 = s @ @ @ R @ sd com probabilidade pd e d ∼ down ∼↓. Fica deste modo definido o contexto em que se desenrolará o nosso estudo do modelo binomial a um perı́odo. 2 Carteiras (Portfolios) e Arbitragem Nesta secção estudar-se-á uma noção fundamental no contexto dos modelos de mercados financeiros, a noção de carteira. Esta noção, que modela um conjunto de investimentos com determinada coerência, será determinante na obtenção de um preço adequado para produtos financeiros derivados. 2.1 A noção de carteira Comecemos com a definição formal de carteira. Definição 1. Uma carteira no mercado de activos (B, S) é dada por h = (x, y) em que se tem • x é o número (quantidade) de obrigações detidas na carteira; • y é o número (quantidade) de acções detidas na carteira. MF0910 2 26 de Novembro de 2009 Capı́tulo I Modelo Binomial Secção: 2 Observação 1. Tanto x como y podem ser negativos. O significado desta possibilidade é o seguinte. Por exemplo, se x = 3 detemos três obrigações o que se denomina por long position no activo sem risco; se y = −2 vendemos duas acções o que se denomina por short position no activo sem risco (veja-se [Etheridge 02][p. 2]). 2.2 Hipóteses sobre o modelo binomial a um perı́odo Convem precisar algumas hipóteses simplificadoras sobre o funcionamento do mercado deste modelo. Estas hipóteses podem aparecer como irrealistas, no sentido em não se aplicam aos mercados reais, mas simplificam significativamente o estudo do modelo. • São permitidas carteiras com posições não inteiras e com sinal arbitrário, isto é, h = (x, y) ∈ R2 • O bid-ask spread é nulo, isto é, a diferença entre o preço de compra e o preço de venda dos activos é nula. • Os custos de transacção são nulos. • Há liquidez completa do mercado, isto é, a compra e venda de quaisquer quantidades é sempre possı́vel. Observação 2. Note-se que dada uma carteira h = (x, y), o seu valor de mercado verifica o seguinte. Em t = 0 é determinı́stico; Em t = 1 é estocástico uma vez que depende do valor de B e S e este último é estocástico. A cada carteira corresponde um valor determinado de forma natural em função dos preços dos activos. Definição 2. O processo valor da carteira h, denominado Vth é definido, para t ∈ {0, 1}, por: Vth = x · Bt + y · St . Isto é, ( V0h = x + y · s V1h = x · (1 + R) + y · s · Z Descreve-se seguidamente uma eventualidade que, a ocorrer, significa que o mercado não é eficiente. Definição 3. Uma carteira de arbitragem, no modelo binomial a um perı́odo, é toda a carteira h = (x, y) tal que se verifica: V0h = 0 e ainda, V1h > 0 com probabilidade um . MF0910 3 26 de Novembro de 2009 Capı́tulo I Modelo Binomial Secção: 2 Observação 3. Uma carteira de arbitragem é, por esta definição, um processo quase certo de de realizar proveitos sem investimento. Nesse caso, o mercado tem uma deficiência grave. É sempre possı́vel ganhar arbitrariamente muito. Uma tal possibilidade nos mercados contraria a noção de funcionamento eficiente em que as leis da oferta e da procura conduzem, em permanência, o mercado a alcançar equilı́brios. O resultado seguinte caracteriza, com uma condição simples sobre os parâmetros do modelo, os mercados em que não existem oportunidades de arbitragem. Proposição 1. Num mercado satisfazendo as hipóteses descritas acima o mercado é livre de arbitragem se e só se: d ≤ (1 + R) ≤ u (1) Demonstração. Suponha-se que se verifica (1 + R) > u isto é s(1 + R) > s · u Então ter-se-á que s(1 + R) > s · d e logo, é sempre mais rentável investir em obrigações do que em acções. Seja, agora, a carteira h = (s, −1), isto é, vendemos a acção (short position) e investimos tudo na obrigação (long position). Calcule-se o valor desta carteira. Temos ( s(1 + R) − su > 0 se Z = u V0h = 0 e V1h = s(1 + R) − sZ = s(1 + R) − sd > 0 se Z = d . Logo, V1h > 0 com probabilidade um. Em consequência, há uma oportunidade de arbitragem. Suponha-se agora verificada a condição 1. Considere-se uma carteira h arbitrária tal que V0h = 0, isto é, tal que x + ys = 0, isto é ainda, x = −ys. Então ter-se-á: V1h ( ys(u − (1 + R)) se Z = u = ys(d − (1 + R)) se Z = d Suponha-se que y > 0. Então, h é uma carteira de arbitragem se e só se: u > (1 + R) d > (1 + R) o que é impossı́vel tendo em conta a condição 1. Faz-se o mesmo raciocı́nio para y < 0 e a conclusão segue imediatamente. Observação 4. Impõe-se a seguinte interpretação da cadeia de desigualdades na condição 1. Num mercado livre de arbitragem, o retorno na acção não pode dominar sempre o retorno na obrigação e o retorno na obrigação não pode dominar sempre o retorno na acção. MF0910 4 26 de Novembro de 2009 Capı́tulo I Modelo Binomial Secção: 2 2.3 Medidas de Martingala Para efeito de uma utilização futura relembremos este resultado simples da geometria elementar dos conjuntos convexos. Proposição 2. Sejam d, z, u números reais tais que d < u. Tem-se então que: d ≤ z ≤ u ⇔ ∃λ ∈ [0, 1] tal que z = λu + (1 − λ) · d . Demonstração. Considere-se a função f (λ) := λu + (1 − λ)d definida para λ ∈ [0, 1]. 0 Trata-se de uma função continuamente derivável, com função derivada dada por f (λ) = u − v > 0. Tem-se que f é estritamente crescente, logo injectiva sobre [0, 1]. Como se tem f (0) = d e f (1) = u, se se verificar d < 1 + R < u, pelo carácter injectivo de f , existe necessariamente λ0 ∈]0, 1[ tal que f (λ0 ) = 1 + R. Para determinarmos λ0 podemos observar que a variável λ representa a proporção de proximidade de f (λ) a d. Com efeito, recorde-se que f (0) = d. Em consequência deveremos ter: λ0 = (1 + R) − d . u−d (2) Como se tem u − (1 + R) , u−d verifica-se imediatamente, com um cálculo trivial que f (λ0 ) = 1 + R. 1 − λ0 = (3) Observação 5. Em consequência do resultado acima sobre os conjuntos convexos tem-se então que: ∃qu , qd ≥ 0 , qu + qd = 1, 1 + R = qu · u + qd · d . Com efeito, basta considerar: qu = (1 + R) − d u − (1 + R) e qd = . u−d u−d Associemos, agora, ao par (qu , qd ) uma probabilidade Q do modo seguinte. Q[Z = u] = qu , Q[Z = d] = qd . Se EQ for a esperança matemática relativamente a Q temos 1 1 1 EQ [S1 ] = [qu su + qd sd] = · s · (1 + R) = s 1+R 1+R 1+R e logo s= 1 EQ [S1 ] . 1+R Isto é, o preço (s) hoje, isto é à data t = 0, é o valor esperado (EQ (S1 )) do preço amanhã, descontado à taxa R, ou seja multiplicado por 1/(1 + R) mas atenção, o valor esperado é calculado em relação à medida Q. Esta medida foi construı́da supondo ausência de arbitragem. Uma medida de probabilidade com esta propriedade é denominada medida neutra face ao risco, medida ajustada ao risco ou ainda medida de martingala MF0910 5 26 de Novembro de 2009 Capı́tulo I Modelo Binomial Secção: 2 Definição 4. A medida Q é uma medida de martingala para o modelo binomial a um perı́odo, se e só se a seguinte condição se verifica: S0 = 1 EQ [S1 ] 1+R (4) A proposição seguinte mostra que uma caracterização do modelo binomial a um perı́odo e sem arbitragem é a existência de uma medida de martingala. Proposição 3. O modelo de mercado é livre de arbitragem se e só se existe uma medida de martingala. Demonstração. Suponhamos que com Q = (qu , qd ), sendo qu + qd = 1, se verifica a condição 4 do enunciado. Temos então que: S0 = 1 1 1 EQ [S1 ] = EQ [S0 · Z] = [qu S0 u + qd S0 d] . 1+R 1+R 1+R Supondo S0 6= 0 termos então: 1 + R = qu · u + qd · d (5) o que mostra que d ≤ 1 + R ≤ u. Tal como como já sabemos, esta relação é equivalente à ausência de arbitragem. Suponhamos que o mercado é livre de arbitragem, o que é equivalente à condição d ≤ 1 + R ≤ u pela proposição 1. Pela proposição 2 sabemos então que: ∃qu , qd ∈ [0, 1], qu + qd = 1 , 1 + R = qu · u + qd · d . Considerando a probabilidade Q definida pelo par (qu , qd ) virá a partir da fórmula 5 que S0 = 1 1 [qu S0 u + qd S0 d] = EQ [S1 ] , 1+R 1+R pelo que a probabilidade Q é uma medida de martingala. Proposição 4. Para o modelo binomial a medida de martingala Q é dada pelo vector de (qu , qd ) ∈ R2 definido por: qu = (1 + R) − d u − (1 + R) e qd = . u−d u−d (6) Demonstração. As fórmulas definindo o par (qu , qd ) são exactamente as fórmulas 2 e 3. 2.4 Produtos financeiros derivados no modelo binomial Um produto financeiro derivado derivative tem o seu cash flow definido a partir de um outro activo denominado o activo subjacente. Definição 5. Um direito contingente (contingent claim) ou ainda um derivado financeiro é uma qualquer variável aleatória função do preços da acção à data t = 1. MF0910 6 26 de Novembro de 2009 Capı́tulo I Modelo Binomial Secção: 2 Observação 6. Um direito contingente X = φ(S1 ) é um contrato que paga X unidades monetárias a quem o possuir à data t = 1. A função φ é a função contrato. Exemplo 1. Uma call option com strike price K. Consideremos a seguintes hipótese: s·d<K <s·u. Se acontecer que S1 > K, então: • compra-se a acção ao preço K • vende-se a acção ao preço su com lucro su − K Na eventualidade alternativa, isto é, se se verificar que S1 < K, então: • a opção não tem valor. Logo, podemos concluir que o direito contingente X = φ(S1 ) se pode representar por: ( su − K se Z = u X= 0 se Z = d tendo-se então a função de contrato φ dada por: ( φ(u) = su − K φ(d) = 0 Em consequência, com notações já conhecidas tem-se que: X = (S1 − K)+ . Podemos agora considerar dois problemas fundamentais. • Qual é o preço justo para um direito contingente? • Na eventualidade de sermos parte tomadora ou emissora de um direito contingente como é que cobrimos o risco eventual associado a essa posição tomadora ou emissora? Observemos que se Π(t, X) for o preço de X no instante t então Π(1, X) está determinado uma vez que necessariamente, atendendo à definição de X, temos que Π(1, X) = X. Temos pois que determinar qual o valor de Π(0, X). Para esse efeito vamos considerar a possibilidade de reproduzir o cash flow gerado pelo direito contingente por meio de uma carteira adequada. Definição 6. Um direito contingente é atingı́vel (reachable) se e só se existe uma carteira h tal que o valor desta carteira à data t = 1 iguala certamente X, isto é: V1h = X com probabilidade igual a 1. Quando assim é, h é uma carteira de cobertura (hedging portfolio) ou uma carteira réplica (replicating portfolio) Um mercado em que todos os direitos contingentes podem ser replicados ou cobertos diz-se um mercado completo. MF0910 7 26 de Novembro de 2009 Capı́tulo I Modelo Binomial Secção: 3 Observação 7. O conceito de carteira réplica de um direito contingente X, permite-nos intuir qual deverá ser o preço a pagar por este direito. Com efeito, se X for replicável então não há qualquer diferença em deter o direito contingente X ou a carteira réplica visto que, em qualquer caso, à data t = 1 se verifica sempre V1h = X. Em consequência, o preço justo do direito deverá ser V0h ou seja o valor à data t = 0 da carteira h. A proposição seguinte confirma esta observação. Proposição 5. Seja X atingı́vel com carteira réplica h. Se o preço em t = 0 de X for diferente de V0h , então há oportunidades de arbitragem. Demonstração. Suponhamos que se tem V0h > Π(0, X). A ideia consiste em, à data t = 0, vender o mais caro (a carteira que é composta de activos transaccionáveis) comprar o mais barato (o direito contingente X) e colocar a diferença no activo sem risco. À data t = 1 os cash flows gerados pelo direito contingente e pela carteira compensam-se mas continuamos a ter o que investimos no activo sem risco. Esta ideia pode-se representar na tabela seguinte. Note-se que a uma posição short corresponde uma venda e logo uma entrada e a uma posição long corresponde uma compra e logo uma saı́da, pelo que por exemplo, na segunda coluna Π(0, X) está multiplicado por −1. Posição short na carteira Posição long no direito Posição no activo sem risco Cash flow total (soma nas colunas) Data t = 0 +V0h −Π(0, X) −(V0h − Π(0, X)) 0 Data t = 1 −V1h +Π(0, X) (V0h − Π(0, X)) · (1 + R) (V0h − Π(0, X)) · (1 + R) Pode pois constatar-se que sem investimento inicial foi possı́vel realizar os lucros certos (V0h − Π(0, X)) · (1 + R) havendo assim uma possibilidade de arbitragem. Proposição 6. Se o mercado no modelo binomial for livre de arbitragem então, o mercado é completo. Demonstração. Para X = φ(Z) mostre-se que existe uma carteira h = (x, y) tal que V1h = X com probabilidade um, isto é: V1h = φ(u) se (Z = u) e também, V1h = φ(d) se (Z = d) isto é, ainda, solução para o sistema ( (1 + R)x + suy = φ(u) (1 + R)X + sdy = φ(d) Como u < d temos que existe a solução única do sistema com duas equações lineares e duas incógnitas, que nos define a carteira réplica. x= 1 uφ(d) − dφ(u) 1 φ(u) − φ(d) · ey= · . 1+R u−d s u−d (7) Em consequência, X é atingı́vel e como X é arbitrário o mercado é completo. MF0910 8 26 de Novembro de 2009 Capı́tulo I Modelo Binomial Secção: 3 3 Apreçamento Neutro Face ao Risco Em consequência da proposição 6 é possı́vel apreçar qualquer direito contingente X. Com efeito, pelo princı́pio geral do apreçamento que temos vindo a aplicar e que diz que é equivalente deter o direito contingente ou a carteira de cobertura desse direito, virá: Π(0, X) = V0h , como pela proposição 6 se tem que: x= 1 uφ(d) − dφ(u) 1 φ(u) − φ(d) · y= · 1+R u−d s u−d virá que: Π(0, X) = V0h = x + sy = 1 uφ(d) − dφ(u) φ(u) − φ(d) = + = 1+R u−d u−d 1 ((1 + R) − d)φ(u) (u − (1 + R)) + φ(d) = = 1+R u−d u−d 1 1 [qu φ(u) + qd φ(d)] = EQ [X]. = 1+R 1+R Note-se que a fórmula Π(0, X) = 1/(1 + R) EQ [X] diz-nos que o preço à data t = 0 de X é o valor esperado de X, relativamente à medida de probabilidade neutra face ao risco, descontado relativamente à taxa de juro do activo sem risco. Podemos pois concluir resumindo os resultados até agora obtidos na proposição seguinte. Proposição 7. Se o modelo binomial for livre de arbitragem então o preço livre de arbitragem de um activo contingente X é dado por: Π(0, X) = 1 EQ [X] 1+R onde a medida de martingala Q é definida univocamente pela relação: S0 = 1 EQ [S1 ] 1+R Temos que Q = (qu , qd ) com: qu = (1 + R) − d u − (1 + R) e qd = . u−d u−d e a carteira de cobertura h = (x, y) é dada por: x= MF0910 1 uφ(d) − dφ(u) 1 φ(u) − φ(d) · e y= · 1+R u−d s u−d 9 26 de Novembro de 2009 Capı́tulo I Modelo Binomial Secção: 3 Observação 8. O cálculo do preço livre de arbitragem processa-se como se o mundo fosse neutro face ao risco (veja-se [Hull 00][p. 205]). Qualquer agente do mercado é indiferente ao risco e a sua expectativa para o retorno do activo com risco é que este retorno seja igual a R. Exemplo 2. Consideremos, neste exemplo demonstrativo os seguintes dados: • O movimento de subida do preço do activo com risco é caracterizado por: u = 1.2 e pu = 0.6 . O movimento de descida do preço do activo com risco é caracterizado por: d = 0.8 pd = 0.4 A dinâmica dos preços é pois descrita por: ( 120 com probabilidade 0.6 S0 = 100 −→ S1 = 80 com probabilidade 0.4 • A taxa de juro do activo sem risco é dada por: R=0 Suponhamos que calculávamos o valor esperado descontado segundo a probabilidade P. Terı́amos então: 1 EP [S1 ] = 1 × [120 × 0.6 + 80 × 0.4] = 104 1+R Observação 9. Podemos em consequência observar que: • dado que o preço hoje, que é igual a 100, é inferior a este valor 104, pode concluir-se que o mercado tem aversão ao risco. • dado que: 0.8 < 1 < 1.2 sabemos que o mercado é livre de arbitragem. Considere-se agora uma call option com preço de exercı́cio K = 110. O direito contingente X é dado por 120 − 110 = 10 se S1 = 120 X = (S1 − K)+ = ou 0 se S1 = 80 A questão a que temos de responder é pois, qual o preço justo para esta call option? A primeira resposta possı́vel é a de que o preço é o valor esperado, descontado, segundo a probabilidade P que dá: 1 × [10 × 0.6 + 0 × 0.4] = 6 . 1+0 MF0910 10 26 de Novembro de 2009 Capı́tulo I Modelo Binomial Secção: 4 A segunda resposta possı́vel é a que corresponde a efectuarmos o apreçamento por via da probabilidade de martingala. Temos deste modo: qu = (1 + 0) − 0.8 0, 2 = = 0.5 logo qd = 0.5 1.2 − 0.8 0, 4 e 1 [10 × 0.5 + 0 × 0.5] = 5 . 1+0 Observe-se que o preço livre de arbitragem é inferior ao preço obtido na primeira resposta. De acordo com a proposição a carteira de cobertura é a seguinte. 1 1.2 × 0 − 0.8 × 10 1 10 − 0 1 x= = −20 e y = · = . 1+0 0.4 100 0.4 4 A interpretação destes resultados é a seguinte. Para constituir a carteira de cobertura da call option X: Π(0, X) = • contrai-se um empréstimo de 20 unidades monetárias • e compra-se 25% de uma acção Tem-se então que o valor desta carteira é dado à data t = 0, 1 V0h = −20 + × 100 = 5 4 e à data t = 1 por, ( −20 + 41 × 120 = 10 se S1 = 120 V1h = −20 + 91 × 80 = 0 se S1 = 80 Mostrando-se assim que se trata efectivamente de uma carteira réplica. Observação 10 (Comentário Fundamental). O preço livre de arbitragem é o preço justo e adequado. Com efeito, suponhamos que o preço de mercado, à data t = 0, da opção era seis unidades monetárias. Vendendo uma call option por seis unidades monetárias podese aplicar cinco unidades monetárias na carteira de cobertura e colocar uma unidade monetária em obrigações no activo sem risco. Em t = 1, com a carteira, cobria-se as exigências da call option vendida e dispunha-se de uma unidade monetária em obrigações. Deste modo o mercado ofereceria uma oportunidade de arbitragem. A existência de um preço justo e adequado para todo o direito contingente num modelo binomial a um perı́odo e livre de arbitragem decorre da existência de uma carteira de cobertura; Tal como foi visto na proposição 6, o carácter completo do modelo binomial decorre da existência de um sistema de duas equações construı́das a partir de dois activos descrevendo dois estados do mundo. Há nesta observações como que um meta-teorema: um modelo será completo se o número de activos for igual ao número de estados do mundo. Este último resultado sugere uma das limitações do modelo binomial a mais do que um perı́odo obtido por sobreposição de modelos binomiais a um perı́odo numa árvore binária arbitrŕia. Com efeito, se exigirmos uma adequação à distribuição de preços real deveremos ter um número de perı́odos significativo, isto é por exemplo a 20 perı́odos teremos de ter 220 ' 106 activos para o mercado ser completo. MF0910 11 26 de Novembro de 2009 Capı́tulo I Modelo Binomial Secção: 4 4 O modelo binomial multi-perı́odo Nesta secção estudar-se-á um modelo que se obtem pela concatenação de modelo binomiais idênticos a um perı́odo. Trata-se de um modelo simples que já permite aplicações práticas relevantes. Consideramos um horizonte temporal T ∈ N que corresponde ao número de perı́odos do modelo. Indicamos por t ∈ {0, · · · , T } as sucessivas datas correspondentes ao inı́cio de cada perı́odo. O mercado é composto por dois activos, nomeadamente, um activo com risco, a acção com o preço à data t dado por St e um activo sem risco, a obrigação, com o preço à data t dado por Bt . Considera-se no mercado uma taxa de juro determinı́stica para o activo sem risco que é indicada por R. A evolução temporal dos preços dos activos é descrita pelas respectivas dinâmicas. Seja S0 o preço do activo com risco à data t = 0. A evolução do preço do activo com risco nos primeiros três perı́odos está esquematizada na figura seguinte. S0 u 3 S0 u 2 @ @ @ @ R S0 u S0 u 2 d @ @ @ @ R S0 S0 ud @ @ @ @ @ @ R @ @ R S0 v S0 ud2 @ @ @ @ R S0 d 2 @ @ @ @ R MF0910 12 S0 d 2 26 de Novembro de 2009 Capı́tulo I Modelo Binomial Secção: 4 Formulemos agora as leis de evolução dos activos. O activo sem risco evolui seguindo a lei descrita pelas seguintes fórmulas. ( B0 = 1 Bn+1 = (1 + R)Bn Trata-se de um retorno aditivo. O activo com risco tem a sua dinâmica descrita pelas relações seguintes. ( S0 = s Sn+1 = Sn · Zn , em que Z0 , Z1 , . . . , ZT −1 são variáveis aleatórias independentes e identicamente distribuı́das com Z com a distribuição descrita por: P[Z = u] := pu = 1 − P[Z = d] := 1 − pd Tal como no modelo binomial a um perı́odo podemos definir a noção de carteira. Definição 7. Uma carteira ((portfolio) ou um processo carteira é um processo estocástico tal que: h ≡ ht = (xt , yt ) para t = 1, · · · , T , tal que, ht = ht (S0 , S1 , · · · , St−1 ) com h0 ≡ h1 O processo valor correspondente à carteira h é definido por: Vth = xt (1 + R) + yt St t = 1, · · · , T . A interpretação desta definição é a seguinte. • xt representa a quantidade de dinheiro (obrigação) investida no banco à data t − 1, data inicial do perı́odo, e conservada assim até à data t data final do perı́odo. • yt representa a quantidade do activo com risco compradas à data t−1 e conservada assim até à data t. • A carteira, quando é constituı́da usa, apenas, a informação disponı́vel até à data t − 1. • Vth é o valor de mercado da carteira h à data t, carteira constituı́da e detida desde a data t − 1 . Impõe-se, no modelo binomial multiperı́odo restringir as carteiras úteis. Esta restrição pode ser entendida como limitando o número de activos nos quais existirá investimento. Com efeito, um consumo pode ser entendido como um investimento se o bem consumido for como tal considerado. Definição 8. A carteira h é autofinanciada se e só se a seguinte condição é verificada: ∀t = 0, . . . , T − 1 MF0910 xt · (1 + R) + yt · St = xt+1 + yt+1 · St . 13 (8) 26 de Novembro de 2009 Capı́tulo I Modelo Binomial Secção: 4 Podemos interpretar esta definição do modo seguinte. • A condição 8 exprime um equilı́brio de balanço contabilı́stico. Em cada data t o valor de mercado da carteira definida por (xt , yt ), carteira que foi constituı́da na data t − 1, é igual ao valor dispendido na compra da nova carteira (xt+1 , yt+1 ) constituı́da na data t (e detida até à data t + 1). • Assim sendo, a variação no valor do processo carteira fica a dever-se apenas à variação do valor dos dois activos que nela estão incluı́dos e não à entrada (ou saı́da) de capital para consumo ou investimento noutros activos. Tal como no modelo a um perı́odo, temos que impor ao mercado a ausência de possibilidades de arbitragem o que deverá implicar um funcionamento eficiente deste mercado. Definição 9. Uma possibilidade de arbitragem é um processo carteira autofinanciado h tal que se verificam as seguintes propriedades: 1. V0h = 0 2. P[VTh ≥ 0] = 1 3. P[VTh > 0] > 0 O estudo já feito no modelo a um perı́odo pode ser imediatamente utilizado no modelo multiperı́odo. Proposição 8 (Condição necessária de não existência de arbitragem). Para um modelo livre de arbitragem verificam-se as condições expressas na seguinte cadeia de desigualdades. d ≤ (1 + R) ≤ µ . Demonstração. A demonstração é idêntica à do caso a um perı́odo considerando uma sub-árvore qualquer, nomeadamente, a sub-árvore inicial. Observação 11. Veremos adiante que esta condição é necessária e suficiente para a ausência de arbitragem. No que vai seguir-se faremos, pois, a seguinte hipótese. Supomos que d < u e que d ≤ (1 + R) ≤ u. Definição 10. A probabilidade de martingala Q = (qu , qd ) é definida pela relação: 1 EQ [St+1 | St = s] . (9) 1+R Esta definição é a generalização natural da definição do modelo a um perı́odo uma vez que no modelo multiperı́odo, que estamos a estudar, todas as árvores são semelhantes. s= Proposição 9. A probabilidade de martingala Q, definida acima, é única e é dada, tal como no modelo binomial a um perı́odo, por: qu = MF0910 (1 + R) − d u − (1 + R) e qd = . u−d u−d 14 (10) 26 de Novembro de 2009 Capı́tulo I Modelo Binomial Secção: 4 Demonstração. A observação da figura acima 4, mostra-nos que podemos considerar apenas o primeiro perı́odo pelo que a relação 9é equivalente a s= 1 EQ [S1 | S0 = s] 1+R e esta fórmula foi demonstrada anteriormente no modelo binomial a um perı́odo. Definição 11. Um direito contingente é uma variável aleatória X dada por X = φ(ST ) onde φ : R −→ R é a função contrato. Observação 12. Podemos interpretar esta definição desta forma. O detentor de um direito contingente X recebe o montante X à data t = T . Note-se que os direitos contingentes considerados são simples, isto é, X = X(ST ) , o que quer dizer que dependem apenas do preço do activo no instante final. Tal como no modelo a um perı́odo, podem formular-se agora os dois problemas fundamentais relativos aos direitos contingentes. • Determinar (Π(t, X))t=0,··· ,T o processo de preços justos para o direito contingente X. • Determinar a melhor cobertura possı́vel do risco associado à emissão ou subscrição um direito contingente. Vamos utilizar o método das carteiras réplicas. Impõe-se, por isso, definir os direitos contingentes replicáveis. Definição 12. Um direito contingente é atingı́vel se e só se existe uma carteira autofinanciada h tal que VTh = X com probabilidade 1. Quando assim é h é uma carteira de cobertura ou carteira réplica do activo X. Se todos os direitos contingentes forem atingı́veis o modelo de mercado é dito completo. Observação 13 (Princı́pio de apreçamento). Tal como no modelo binomial a um perı́odo, se X é atingı́vel com carteira réplica h o preço justo para X é dado por: ∀t ∈ {0, · · · , T } Π(t, X) = Vth . Com efeito, suponhamos X atingı́vel com processo carteira h. A t fixo suponhamos dispor do montante Vth . Investindo Vth na carteira h, como a carteira é auto-financiada podemos reconstituı́-la em cada data u > t até que à data t = T a carteira terá o valor (aleatório) VTh . Como VTh = X com probabilidade um, temos que h e X são financeiramente equivalentes pelo que devem ter o mesmo preço. Se tal não for o caso pode mostrar-se que existem oportunidades de arbitragem tal como foi feito no modelo binomial a um perı́odo. MF0910 15 26 de Novembro de 2009 Capı́tulo I Modelo Binomial Secção: 4 Proposição 10. Seja X atingı́vel com carteira réplica h. Se à data t for possı́vel comprar X a um preço mais barato que Vth (ou vender a um preço mais caro que Vth )então existe uma oportunidade de arbitragem. Demonstração. A ideia da demostração é idêntica à que foi usada no modelo binomial a um perı́odo. Compra-se X vendendo Vth e espera-se até T realizando proveitos certos. No modelo binomial multiperı́odo todos os direitos contingentes podem ser apreçados por meio de carteiras réplica. Proposição 11. O modelo binomial multiperı́odo é completo. Demonstração. Esta demonstração deverá ser realizada como exercı́cio. Para o efeito dever-se-á estudar um exemplo e formalizar seguidamente a demonstração. Exemplo 3. Propomo-nos agora estudar um exemplo numérico. Os dados são os seguintes T = 3, S0 = 10, u = 1.2, d = 0.8, pu = 0.6 e pd = 0.4 Consideramos R = 0. Seja uma call option europeia com data de exercı́cio T = 3 e preço de exercı́cio K = 10. Representemos na árvore binomial a evolução dos preços do activo com risco correspondente a estes dados. Na coluna da direita representamos ainda o cash flow correspondente à call option. X = (ST − K)+ = max(S3 − 10, 0) MF0910 16 26 de Novembro de 2009 Capı́tulo I Modelo Binomial Secção: 4 17.3 7.3 @ R @ 11.5 1.5 14.4 @ @ 12 @ @ @ R @ 9.6 10 @ @ @ @ @ R @ @ R @ 7.7 8 0 @ @ @ R @ 6.4 @ @ @ R @ 5.1 0 Podemos agora determinar, por indução retrógrada, os preços da call option em cada data, preços que são dados pelos valores nessas datas de uma carteira réplica. Com efeito ter-se-á para uma dada carteira réplica h que. V3h = X , pelo que as duas coluna mais à direita, na figura seguinte, serão iguais. MF0910 17 26 de Novembro de 2009 Capı́tulo I Modelo Binomial Secção: 4 7.3 7.3 @ R @ 1.5 1.5 4.4 @ @ 2.6 @ @ @ R @ 0.8 1.5 @ @ @ @ @ R @ @ R @ 0.4 0 0 0 0 @ @ @ R @ 0 @ @ @ R @ Seguidamente, apliquemos a definição da probabilidade de martingala. Deveremos ter que 1 s= EQ [S3 | S2 = s] 1+R Portanto para o nodo superior correspondente a t = 2 deveremos ter s = qu 7.3 + qd 1.5 = 0.5 × 7.3 + 0.5 × 1.5 = 4.4 onde qu = qd = 0.5 foram obtidas com as fórmulas 10. Procedendo de igual modo para os outros nodos teremos a árvore preenchida como na figura. Podemos assim concluir que Π(0, X) = 1.5. Este valor é o preço da call option à data t = 0. Implementou-se no programa Excel no ficheiro ArvoreBinAula.xls este processo de apreçamento permitindo-nos, assim, estudar em detalhe a constituição da carteira e a verificação de que a carteira permite replicar os cash flows da call option. 4.1 Conclusões Podemos agora concluir resumindo em duas proposições o estudo do modelo binomial multiperı́odo. MF0910 18 26 de Novembro de 2009 Capı́tulo I Modelo Binomial Secção: 5 Proposição 12 (Algoritmo Binomial). Seja um direito contingente X = φ(ST ) atingı́vel com carteira réplica h. Se St (k) = suk dt−k k = 0, · · · , t onde k representa o número de movimentos ascendentes de amplitude u e, portanto, (t, k) representa o nodo k à data t, então temos: Vt (h) = 1 [qu Vt+1 (h + 1) + qd Vt+1 (h)] e VT (h) = φ(suh dT −h ) , 1+R com qu = u − (1 + R) (1 + R) − d e qd = . u−d u−d (11) e xt (h) = uVt+1 (h) − dVt+1 (h + 1) 1 1 Vt+1 (h + 1) − Vt+1 (h) , yt (h) = · . 1+R u−d St−1 (h − 1) u−d Sendo que o preço livre de arbitragem para K é dado por V0h (X) no instante zero. Demonstração. Por indução aplicando os resultados anteriores. Proposição 13 (Apreçamento). O preço livre de arbitragem em t = 0 do direito contingente X é dado por: 1 Π(0, X) = EQ [X] (1 + R)T Sendo Q = (qu , qd ) a medida de martingala definida por 11 tem-se que: T X 1 T Π(0, X) = quh qdT −h φ(suh dT −h ) T h (1 + R) h−0 Demonstração. Se y for o número de movimentos ascendentes na árvore pode escrever-se: X = φ(ST ) = φ(suy dT −y ) . Como y tem distribuição binomial tem-se que se verifica a fórmula acima. Proposição 14 (Condições para a ausência de arbitragem). No modelo binomial multiperı́odo, a condição d < (1 + R) < u é equivalente à ausência de arbitragem. Demonstração. Seja h um processo carteira auto-financiado tal que: h i h i P VTh ≥ 0 = 1 e P VTh > 0 > 0 É certo que então V0h = h i 1 Q E VTh > 0. (1 + R)T Logo h não é uma carteira livre de arbitragem. MF0910 19 26 de Novembro de 2009 Capı́tulo I Modelo Binomial Secção: 5 5 Sobre as aplicações práticas O modelo binomial pode ser utilizado tanto para apreçar direitos contingentes como para constituir carteiras de cobertura para esses activos. Para esse efeito, os parâmetros do modelo devem ser determinados de acordo com os dados reais relativos aos preços do activo subjacente. Indicamos sumariamente uma forma de o fazer que pode ser estudada em detalhe nas obras [Hull 00][p. 338–404] e [Beninga 97][p. 161–178]. Tomemos r a taxa de juro para o activo sem risco calculada em contı́nuo para um intervalo de tempo [0, U ]. Temos então que : 1 + R = exp(r∆t) em que R é a taxa de retorno aditiva do activo sem risco para um perı́odo e ∆t = U/T em que, relembramos, T é o número de perı́odos. Seja σ a variância de Z. Pode mostrar-se que se tem então, aproximadamente e considerando u = 1/d uma convenção proposta por Cox, Ross e Rubinstein, que: u = eσ √ ∆t d = e−σ √ ∆t , sendo qu e qd dados pelas fórmulas habituais. Referências [Bannock & Manser] G. Bannock, W. Manser, The Penguin international dictionary of finance, Penguin books, 1995. [Barreto 96] I. Barreto, Manual de Finanças, Abril/ControlJornal, 1996. [Beninga 97] S. Beninga, Financial Modelling, The MIT Press, 1997. [Baxter & Rennie96] M. Baxter, A. Rennie, Financial Calculus, Cambridge University Press, 1996. [Berck & Sydsaeter 93] P. Berck, K. Sydsaeter, Manual de Matemática para Economistas, McGraw-Hill, 1993. [Björk 98] T. Björk, Arbitrage Theory in Continuous Time, Oxford University Press, 1998. [Bouleau 98] N. Bouleau, Martingales et marchés financiers, Éditions Odile Jacob, 1998. [Dana & Jeanblanc 03] R.-A. Dana, M. Jeanblanc Financial Markets in Continuous Time, Springer Verlag, 2003. [Elliot & Kopp 99] R. J. Elliot, P. Ekkehard Kopp, Mathematics of Financial Derivatives, Springer, 1999. [Etheridge 02] A. Etheridge, A course in financial calculus, CAmbridge University Press, 2002. MF0910 20 26 de Novembro de 2009 Capı́tulo I Modelo Binomial Secção: 5 [Hull 00] J. C Hull, Options Futures and other derivatives, fourth edition, Prentice-Hall International Inc., 2000. [Pliska 97] S. R. Pliska, Introduction to Mathematical Finance, Blackwell Publishers, 1997. [Quintart & Zisswiller 94] A. Quintart, R. Zisswiller, Teoria Financeira, Caminho. 1994. [Musiela & Rutkowski 97] M. Musiela, M. Rutkowski, Martingale methods in financial modelling, Springer, 1997. [Shiryaev 99] A. N. Shiryaev, Essentials of Stochastic Finance, World Scientific, 1999. MF0910 21 26 de Novembro de 2009 Modelos Discretos de Mercados Financeiros MF0910 24 de Novembro de 2009 1 Modelos para mercados finitos 1.1 Introdução e motivação Suponhamos um contrato que nos dá o direito, mas não a obrigação, de comprar a um dado preço K, denominado preço de exercı́cio e numa determinada data T , denominada data de exercı́cio, um activo financeiro denominado activo subjacente, cujo preço corrente S0 é conhecido. Um tal contrato denomina-se uma call option. Suponhamos ainda que a taxa de juro sem risco, por exemplo, a taxa de juro de uma conta bancária, é constante e dada por R. Suponhamos ainda que o preço do activo financeiro na data de exercı́cio poderá tomar apenas dois valores S u e S d , com probabilidades, respectivamente, pu e pd . O problema fundamental colocado nesta situação é o de determinar um preço justo para o contrato que acabámos de descrever. Com efeito, uma vez que este contrato dá ao seu possuidor um direito na data de exercı́cio, ainda que opcional, tem um valor corrente que procuramos determinar. Para tornarmos concreta a situação, suponhamos que: S0 = 280 , K = 280 , S u = 320 , S d = 260 . Vamos adoptar um modelo em que há dois estados do mundo Ω = {ω1 , ω2 }. Seja o preço do activo financeiro, à data T , dado por: ST (ω1 ) = S u = 320 e ST (ω2 ) = S u = 260 . 1.1.1 O método das probabilidades naturais ou subjectivas Vamos supor que um dado investidor encara o mercado como um bear market, isto é, tal que: P[{ω1 }] = 0.2 = 1 − P[{ω2 }] . Observação 1. Note que um urso é considerado um animal pachorrento e que quando ataca, ataca com uma pata num movimento descendente. Talvez por isto, a denominação de bear market, para um mercado com fraca probabilidade de fazer subir os preços, está bem atribuı́da. Encarando ST como uma variável aleatória temos, obviamente, que: ST = 320I{ω1 } + 260I{ω2 } . 1 Capı́tulo II Modelos Discretos Secção: 1 Determinemos CT , o cashflow gerado pelo contrato, ou seja, o payoff terminal ou à data de exercı́cio. Se se verificar ST = 320 então, o contrato pode ser exercido, compra-se o activo pelo preço de exercı́cio 280 e vende-se o activo no mercado com uma receita de 320 − 280 = 40; se se verificar que ST = 320 então, o contrato não deverá ser exercido sendo o cahhflow nulo. É óbvio, pois, que: CT = 40I{ω1 } isto é CT (ω1 ) = 40 e CT (ω2 ) = 0 , isto é, temos a expresão importante seguinte para o payoff terminal da call option: CT = max(ST − K, 0) = (ST − K)+ . Utilizemos, para o apreçamento, o princı́pio do valor esperado actualizado do payoff terminal. Então, Π(0) o preço corrente da call option virá: Π(0) = EP [ CT 1 ]= (P[{ω1 }]CT (ω1 ) + P[{ω2 }]CT (ω2 )) = 7.62 . 1+R 1+R Vamos supor, agora, que um outro investidor encara o mercado como um bull market, isto é, tal que: P[{ω1 }] = 0.8 = 1 − P[{ω2 }] . Observação 2. Note que um touro é considerado um animal agressivo e que quando ataca, ataca com um movimento ascendente da cabeça e dos chifres. Talvez por isto, a denominação de bull market, para um mercado com grande probabilidade de fazer subir os preços, está bem atribuı́da. Utilizando o princı́pio do valor esperado actualizado do payoff terminal, para apreçar a call option, virá: Π(0) = EP [ CT 1 ]= (P[{ω1 }]CT (ω1 ) + P[{ω2 }]CT (ω2 )) = 30.48 . 1+R 1+R Observação 3. Note-se que o método que empregámos usando as probabilidades naturais ou subjectivas, (na medida em que estas probabilidades dependem da atitude de cada investidor), não fornece um preço único para o contrato uma vez que, tal como vimos, o preço depende destas probabilidades subjectivas. Uma tal solução para o problema do apreçamento deixa muito a desejar na medida em que escolhendo adequadamente as probabilidades poderemos obter, praticamente, qualquer valor num dado intervalo para o preço do contrato. 1.1.2 O método das carteiras réplicas Segundo [6], o método das carteiras réplicas foi introduzido por Sharpe em 1978 e Rendleman & Barter em 1979, isto é, praticamente, cinco anos após a contibuição fundamental de Black, Scholes e Merton. Este método consiste em realizar uma carteira com uma certa quantidade do activo financeiro subjacente e com uma certa quantidade de dinheiro numa conta bancária, de tal forma que o valor da carteira na data de exercı́cio coincida com o payoff terminal do contrato. Neste sentido, a carteira replica ou reproduz o contrato. A carteira Φ aparece, pois, definida inicialmente como um par de números Φ = Φ0 = (α0 , β0 ), em que: MF0910 2 24 de Novembro de 2009 Capı́tulo II Modelos Discretos Secção: 1 • a quantidade α0 representa o número de acções do activo subjacente; • a quantidade β0 representa o número de unidades monetárias na conta bancária. Observação 4. Note-se que: • Consideramos que a taxa de juro activa é igual à taxa de juro passiva. • Admitimos que (α0 , β0 ) ∈ R2 . Tal significa, para α0 < 0, que constituı́mos uma posição short (curta) no activo subjacente recebendo dinheiro por uma venda não concluı́da dado não termos em nossa posse o activo que vendemos. Admitir β0 < 0 significa que contraı́mos um empréstimo em unidades monetárias no montante |β0 |. • Após constituição da carteira, na data inicial, a composição desta não se altera até à data terminal. Designemos por 0 a data inicial e, por Vt (Φ), o valor da carteira Φ nas datas t = 0 e t = T . É óbvio que o valor da carteira numa dada data se obtem adicionando os termos (um para o activo subjacente e outro para a conta bancária) que resultam do produto quantidade pelo preço, nessa data, do activo considerado. Assim sendo: V0 (Φ) = α0 × S0 + β0 e VT (Φ) = α0 × ST + β0 (1 + R) . Pela descrição que fizémos acima de carteira réplica deveremos ter que: CT = VT (Φ) . Note-se que se trata de uma igualdade entre variáveis aleatórias pelo que se tem de facto: CT (ωi ) = VT (Φ)(ωi ) i = 1, 2 . Reescrevendo esta expressão, tomando em conta a definição de VT (Φ), temos o sistema de equações: ( VT (Φ)(ω1 ) = α0 × ST (ω1 ) + β0 (1 + R) = CT (ω1 ) VT (Φ)(ω2 ) = α0 × ST (ω2 ) + β0 (1 + R) = CT (ω2 ) . Com os dados concretos que tomámos este sistema pode escrever-se, ( α0 × 320 + β0 × 1.05 = 40 α0 × 260 + β0 × 1.05 = 0 , tendo este sistema a solução única dada por: α0 = 2 e β0 = −165.08 . 3 A nossa carteira (α0 , β0 ) constitui-se, pois, da seguinte forma. Por cada call option em que estamos short temos α0 = 2/3 unidades de activo subjacente e contraı́mos um empréstimo de β0 = −165.08 unidades monetárias. Por construção, a carteira assim constituı́da permite reproduzir o payoff terminal do contrato. MF0910 3 24 de Novembro de 2009 Capı́tulo II Modelos Discretos Secção: 1 Na posse desta carteira réplica é possı́vel agora apreçar o contrato usando o princı́pio de não arbitragem que se pode enunciar, neste contexto, na forma seguinte: se dois produtos têm o mesmo valor à data T então deverão ter o mesmo valor à data inicial zero. Desta forma, o preço do contrato será o custo inicial de constituição da carteira réplica ou seja, ainda, o investimento inicial necessário apara adquirir a carteira réplica. Temos pois: Π(0) = V0 (Φ) = α0 × S0 + β0 = 2 × 280 − −165.08 = 21.59 . 3 Observação 5. Em consequência do que expusémos podemos observar que: • O preço do contrato aparece definido univocamente pois depende apenas de α0 e β0 que ficaram determinados como solução de um sistema de equações algébricas. • O preço obtido não depende das probabbilidades subjectivas, ou seja, não depende da forma sob a qual cada agente avalia a evolução mais provável do mercado. • Na determinação do preço do contrato usámos, apenas, o preço de exercı́cio do contrato, o preço corrente do activo financeiro subjacente, as variações deste activo ao longo do tempo e, a taxa de juro de uma conta bancária ou de um activo sem risco. 1.1.3 O método das medidas martingalas Suponhamos que é possı́vel encontrar uma medida de probabilidade P∗ sobre o espaço de probabilidade Ω = (ω1 , ω2 ), munido da álgebra -σ maximal, tal que P∗ coincida com a probabilidade natural nos conjuntos de probabilidade nula e tal que S ∗ , o preço actualizado à taxa de juro R seja uma P∗ martingala. Temos, então, que sendo S ∗ o preço actualizado à taxa de juro R dado por: S0∗ = S0 ST ST = S0 e ST∗ = = , 0 1 (1 + R) (1 + R) (1 + R) a condição de martingala exprime-se por: ∗ S0∗ = EP [ST∗ ] . (1) Uma medida verificando a consição (1) é denominada medida de martingala ou ainda, por razões óbvias, medida neutra face ao risco. Determinemos, com os dados concretos, a solução do problema de apreçamento que já encontrámos por outros dois métodos. Podemos dizer que P∗ é determinada por p∗ ∈]0, 1[ tal que, por exemplo p∗ = ∗ P [{ω1 }], uma vez que necessariamente virá: 1 − p∗ = P∗ [{ω2 }]. Podemos reescrever a fórmula (1) na seguinte forma: S0∗ = 1 × (p∗ × ST (ω1 ) + (1 − p∗ ) × ST (ω2 )) , 1+R o que resolvendo em ordem a p∗ nos dá: p∗ = P∗ [{ω1 }] = MF0910 (1 + R) × S0 − ST (ω2 ) ST (ω1 ) − ST (ω2 ) 4 24 de Novembro de 2009 Capı́tulo II Modelos Discretos Secção: 1 e. por conseguinte, 1 − p∗ = P∗ [{ω2 }] = ST (ω1 ) − (1 + R) × S0 . ST (ω1 ) − ST (ω2 ) Para apreçarmos o contrato usamos o princı́pio do valor esperado actualizado do payoff terminal, mas relativamente à medida neutra face ao risco. Logo para apreçar a call option virá, para Π∗ (0) o preço, neutro face ao risco, do contrato: ∗ Π∗ (0) = EP [ = + CT ∗ (ST − K) ] = EP [ ]= 1+R 1+R 1 (p∗ × CT (ω1 ) + (1 − p∗ ) × CT (ω2 )) = 21.59. 1+R Observação 6. Note-se que o preço obtido com este método coincide com o preço obtido para o contrato pelo método da carteira réplica. Esta coincidência é um facto geral que será explorado no que vai seguir-se. 1.2 Pressupostos probabilı́sticos Consideremos um espaço de probabilidade finito (Ω, F, P). A tı́tulo de interpretação temos como pressuposto que há k ∈ N estados do mundo podendo então escrever-se que: Ω = {ω1 , . . . , ωk } . Consideramos um horizonte temporal N ∈ N∗ , que poderá ser interpretado como a data maturidade ou de exercı́cio dos contratos relativos a produtos financeiros e o conjunto de datas ou instantes dado por: T := {0, 1, . . . , N } . O fluxo de informação disponı́vel é-nos dado por uma filtração F = (Fn )n∈T sobre (Ω, F, P), isto é uma sequência F0 ⊆ F1 , . . . , ⊆ FN , de subálgebras σ de F em que, Fn pode ser interpretada como o conjunto da informação disponı́vel à data n ∈ {0, 1, . . . , N }. Observação 7. Usualmente e, salvo aviso em contrário, consideramos em vigor as seguintes hipóteses: • F0 = {∅, Ω}. • FN = F = P(Ω). • ∀ω ∈ Ω P[{ω}] > 0 . MF0910 5 24 de Novembro de 2009 Capı́tulo II Modelos Discretos Secção: 1 1.3 O mercado Consideramos que no mercado existem d + 1 activos com d ∈ N∗ dados pelos respectivos preços à data n ∈ {0, 1, . . . , N }. Representaremos estes preços pela sequência de variáveis aleatórias positivas: Sn0 , Sn1 , . . . , Snd , mensuráveis relativamente a Fn , isto é tal que para j ∈ {0, 1, . . . , d} se tenha (Snj )0≤n≤N processo estocástico adaptado. Observação 8. Sn := (Sn0 , Sn1 , . . . , Snd ) ∈ Rd+1 é o vector dos preços à data n. 1.3.1 O activo sem risco Consideramos que um dos activos, o que é representado pelo processo (Sn0 )0≤n≤N , tem uma dinâmica ou, evolução ao longo do tempo, dada por: S00 ≡ 1 , ∀n ∈ {1, 2, . . . , N } Sn0 = (1 + r)n , em que r é a taxa de juro do activo sem risco. Observação 9. A quantidade, 1 , Sn0 é o factor de desconto da data n à data 0 isto é, se βn for investida à data 0 no activo sem risco então, poderemos recuperar uma unidade monetária à data n. βn := Observação 10. Por oposição ao activo sem risco, os activos representados pelos processos (Snj )0≤n≤N para 0 < j ≤ (d + 1) são activos com risco. Em geral não especificaremos a dinâmica dos activos com risco. No caso particular do modelo binomial é especificada uma dinâmica, binomial, do activo com risco. 1.4 Estratégias ou carteiras 1.4.1 Noção intuitiva de carteira No passado, a posse de um tı́tulo de participação de uma empresa era formalizada por um documento impresso, geralmente, numa folha de papel única. Para preservar um conjunto desses documentos usava-se um portfolio ou carteira. 1.4.2 Descrição de uma carteira no modelo Consideramos que a quantidade de tı́tulos do activo i detidos à data n depende dos estados do mundo e é, por isso, representada por uma variável aleatória: Φin para i = 0, 1, . . . , d e n ∈ {0, 1, . . . , N } . Definição 1. Ao processo estocástico Φ := (Φ0n , Φ1n , . . . , Φdn )0≤n≤N chamamos carteira sse Φ for previsı́vel, isto é, se se verificar que: ( Φ0n ∈ mF0 Φ0n ∈ mFn−1 para n ≥ 1 . MF0910 6 24 de Novembro de 2009 Capı́tulo II Modelos Discretos Secção: 1 Observação 11. Note-se que para n ≥ 1, o conjunto das posições da carteira no instante n, representado pelo vector (Φ0n , Φ1n , . . . , Φdn ), é decidido com base da informação disponı́vel à data n − 1. 1.4.3 Valor e valor descontado de uma carteira Para determinar o valor de uma certa carteira numa dada data, é necessário efectuar, para cada activo, o produto da quantidade detida desse activo pelo preço, à data, do activo e, em seguida, somar os termos assim obtidos para cada activo. Justifica-se pois a seguinte definição. Definição 2. Processo valor e valor descontado de uma carteira. 1. O processo estocástico V (Φ) = (Vn (Φ))0≤n≤N , processo valor da carteira Φ, é dado, para n = 0, 1, . . . , N , por: Vn (Φ) = Φn · Sn = d X N Φin Sni = Φ0n Sn0 + · · · + ΦN n Sn . i=0 2. O processo estocástico Ṽ (Φ) = (Ṽn (Φ))0≤n≤N , processo valor descontado da carteira Φ, é dado, para n = 0, 1, . . . , N , por: Ṽn (Φ) := βn Vn (Φ) , onde βn é o factor de desconto definido acima. Observação 12. Note-se que, βn Vn (Φ) = βn (Φn · Sn ) = d X Φin βn Sni = Φn · S̃n , i=0 onde se tem que, S̃n = 1, βn Sn1 , . . . , βn Snd , é o preço à data n descontado à data 0. 1.4.4 Carteiras autofinanciadas Admitimos que o processo de gestão das carteiras é o seguinte. Constituı́mos a carteira à data zero. Numa data posterior qualquer, vendemos e compramos activos que mantemos até à data seguinte, altura em que voltamos a vender e a comprar activos; em qualquer data não é permitida a entrada ou saı́da de capitais que não seja para efeitos de venda ou compra de activos da carteira. Este processo corresponde no modelo à noção de carteira autofinanciada. Definição 3. Uma carteira Φ diz-se autofinanciada sse: ∀n ∈ {0, 1, . . . , N − 1} Φn · Sn = Φn+1 · Sn . MF0910 7 (2) 24 de Novembro de 2009 Capı́tulo II Modelos Discretos Secção: 1 Observação 13. Para melhor se entender o significado desta definição fundamental atentese que: 1. Se suposermos que d = 1, isto é, a existência de, apenas, um activo para além do activo sem risco a condição (2) acima pode escrever-se: Φ0n Sn0 + Φ1n Sn1 = Φ0n+1 Sn0 + Φ1n+1 Sn1 . Como consequência desta igualdade fica claro que, se à data n + 1, decidirmos aumentar a quantidade do activo sem risco na carteira, teremos que diminuir a quantidade do activo com risco na carteira uma vez que os preços dos activos permanecem os mesmos na condição. 2. A condição (2) pode ainda ler-se: ∀n{0, 1, . . . , N − 1} (Φn+1 − Φn ) · Sn = 0 . (3) Esta outra forma admite a seguinte leitura: dados os preços à data n, a recomposição da carteira faz-se sem entradas ou saı́das de capital; os cash-flows na recomposição são apenas os que decorrem de compras de activos financiados exclusivamente por vendas de activos. 3. A partir da condição (2) tem-se, ainda, que: Φn · Sn = Φn+1 · Sn ⇐⇒Φn+1 · Sn+1 − Φn · Sn = Φn+1 · Sn+1 − Φn+1 · Sn ⇐⇒ ⇐⇒Vn+1 (Φ) − Vn (Φ) = Φn+1 (Sn+1 − Sn ) . (4) Podemos pois afirmar que uma dada carteira é autofinanciada sse a variação de valor da carteira entre duas datas consecutivas se deve apenas à variação de preço dos activos entre essas datas. Apresentamos de seguida uma caracterização fundamental das carteiras autofinanciadas. Teorema 1. São equivalentes: 1. A carteira Φ é autofinanciada; 2. ∀n ∈ {1, . . . , N } Vn (Φ) = V0 (Φ) + Pn j=1 Φj (Sj − Sj−1 ) ; 3. Sendo S̃j := βj Sj , ∀n ∈ {1, . . . , N } Ṽn (Φ) = V0 (Φ) + Pn j=1 Φj (S̃j − S̃j−1 ) . Demonstração. Suponhamos que se verifica a condição 2. Tem-se então: Vn+1 (Φ) − Vn (Φ) =V0 (Φ) + n+1 X Φl (Sl − Sl−1 ) − l=1 V0 (Φ) + n X ! Φl (Sl − Sl−1 ) = l=1 =Φn+1 (Sn+1 − Sn ) , MF0910 8 24 de Novembro de 2009 Capı́tulo II Modelos Discretos Secção: 1 pelo que se tem que a carteira Φ é auto-fianciada. Suponhamos, agora, que a carteira Φ é autofinanciada. Podemos, então, escrever que: Vn+1 (Φ) − Vn (Φ) = Φn+1 (Sn+1 − Sn ) = Φn+1 ∆Sn+1 Vn (Φ) − Vn−1 (Φ) = Φn (Sn − Sn−1 ) ········· = ········· = Φn ∆Sn = ········· V2 (Φ) − V1 (Φ) = Φ2 (S2 − S1 ) = Φ2 ∆S2 V1 (Φ) − V0 (Φ) = Φ1 (S1 − S0 ) = Φ1 ∆S1 , pelo que somando membro a membro as igualdades acima se pode obter imediatamente: Vn+1 (Φ) − Vn (Φ) = n+1 X Φl (Sl − Sl−1 ) = l=1 n+1 X Φl ∆Sl , l=1 e esta é exactamente a condição 2. Para demosntrar a equivalência entre as condições 1 e 3 pode repetir-se a demonstração com S̃l = βl Sl dado que a condição sobre uma carteira para que esta seja autofinanciada é invariante por desconto ou actualização ou seja: a carteira Φ é autofinanciada sse: ∀n ∈ {0, 1, . . . , N − 1} Φn S̃n = Φn+1 S̃n . Observação 14. Note-se que a expressão Ṽn (Φ) = V0 (Φ) + n X Φj (S̃j − S̃j−1 ) , j=1 na condição 2 do teorema, pode interpretar-se da forma seguinte: Ṽn (Φ), o valor descontado de uma carteira autofinanciada Φ, depende da riqueza inicial V0 (Φ) e, da carteira dada por: (Φ1n , Φ2n , . . . , Φdn )0≤n≤N , isto é, onde não aparece a quantidade referente ao activo sem risco. Com efeito pode observar-se também que: 0 ∆S̃j0 = S̃j0 − S̃j−1 = 1 0 1 Sj − S0 = 1 − 1 = 0 . βj βj−1 j−1 A interpretação dada na observação anterior põe em evidência um facto importante que é explicitado na proposição seguinte e que pode ser visto como uma proposição recı́proca da constatação feita na observação. Proposição 1. Dado o processo (φ1n , . . . , φdn )0≤n≤N , previsı́vel e V0 ∈ mF, existe um processo previsı́vel (φ0n )0≤n≤N , tal que a carteira Φ := (φ0 , . . . , φd ) é autofinanciada e V0 (Φ) = V0 . MF0910 9 24 de Novembro de 2009 Capı́tulo II Modelos Discretos Secção: 1 Demonstração. Pela proposição e dado que Φ é autofinanciada: Ṽn (Φ) =Φ0n + Φ1n S̃n1 + · · · + Φdn S̃nd = (def. valor descontado) n X =V0 + Φj · ∆S̃j = (proposição 3) j=1 =V0 + n X Φ1j ∆S̃j1 + · · · + Φdj ∆S̃jd = (Φj · ∆S̃j = . . . ) j=1 Logo, verifica-se que: Φ0n = V0 + n X Φ1j ∆S̃j1 + · · · + Φdj ∆S̃jd − Φ1n S̃n1 + · · · + Φdn S̃nd j=1 = V0 + n−1 X Φj · ∆S̃j + Φ1n ∆S̃n1 + · · · + Φdn ∆S̃nd − Φ1n S̃n1 + · · · + Φdn S̃nd j=1 = V0 + n−1 X 1 d Φj · ∆S̃j + Φ1n (−S̃n−1 ) + · · · + Φdn (−S̃n−1 ) j=1 pelo que Φ está bem definido e é previsı́vel, tal como foi anunciado. 1.5 Estratégias admissı́veis e arbitragem Observação 15. Os valores que tomam as componentes Φin de uma dada carteira Φ = (Φ0 , . . . , Φd ), têm sinal arbitrário. Com efeito: • Φ0n < 0 : pode ser interpretado como tendo nós tomado emprestado |Φ0n | no activo sem risco. • Φin < 0 para i ≥ 1: pode ser interpretado como sendo a carteira curta (short) na quantidade |Φin | no activo sem risco indexado por i. • Carteiras curtas em activos com risco e empréstimos são admitidos desde que o valor da carteira seja não negativo em qualquer data. Definição 4. Uma estratégia ou carteira Φ é admissı́vel sse se verificar: 1. Φ é autofinanciada. 2. ∀n ∈ {0, 1, . . . , N } Vn (Φ) ≥ 0 . Observação 16. De acordo com esta definição, com uma dada carteira admissı́vel um investidor deve poder pagar as suas dı́vidas (nos activos com e sem risco) em qualquer data. A noção intuitiva de arbitragem pode ser descrita como a possibilidade de criar uma proveito certo, sem risco, a partir de um custo inicial nulo. MF0910 10 24 de Novembro de 2009 Capı́tulo II Modelos Discretos Secção: 1 Definição 5. Uma estratégia, ou carteira, Φ é uma carteira de arbitragem sse se verificar: 1. Φ é admissı́vel; 2. V0 (Φ) = 0 e VN (Φ) 6≡ 0 isto é, VN (Φ) é uma variável aleatória não nula. Observação 17. Uma estratégia de arbitragem é pois uma carteira admissı́vel com valor inicial nulo e com valor terminal não nulo. 1.6 Tranformação de uma martingala por um processo previsı́vel Relembramos nesta secção alguns resultados releventes da teoria das martingalas, para os modelos finitos de mercados financeiros. Seja F := (Fn )0≤n≤N uma filtração sobre o espaço de probabilidade (Ω, F, P). Definição 6. Um processo H := (Hn )0≤n≤N é um processo F previsı́vel se se verificar: H0 ∈ mF0 e ∀n ∈ {1, . . . , N } Hn ∈ mFn . Teorema 2. Seja M := (Mn )0≤n≤N uma F martingala e H := (Hn )0≤n≤N um processo F previsı́vel (e limitado). Então, o processo X := (Xn )0≤n≤N definido por: ( X0 := H0 M0 Xn := H0 M0 + H1 ∆M1 + · · · + Hn ∆Mn 1 ≤ n ≤ N , onde ∆Mi := Mi − Mi−1 , é uma F martingala. Observação 18 (Comentário importante). Pela proposição (3) vemos que se os preços descontados (S̃n )0≤n≤N formarem uma martingala e, sendo Φ a carteira um processo previsı́vel então o processo valor actualizado (Ṽn (Φ))0≤n≤N é uma martingala. Logo podemos concluir que: E[ṼN (Φ)] = E[V0 (Φ)] , isto é, o valor esperado final da riqueza gerada por uma estratégia autofinanciada é igual ao valor esperado da riqueza inicial. Demonstração. Por construção o processo X é soma de processos adaptados pelo que é um processo adaptado. Note-se que X0 ∈ mF0 visto que H0 , M0 ∈ mF0 . Como H é limitado tem-se que: E[| Xn |] < +∞ . Para verificarmos a propriedade de martingala observamos, apenas, que: E[Xn+1 − Xn | Fn ] = E [Hn+1 (Mn+1 − Mn ) | Fn ] (visto que: Hn+1 ∈ mFn ) = Hn+1 E[Mn+1 − Mn | Fn ] (visto que: E[Mn+1 | Fn ] = Mn ) . Logo, X é uma martingala. MF0910 11 24 de Novembro de 2009 Capı́tulo II Modelos Discretos Secção: 1 Proposição 2. Seja M := (Mn )0≤n≤N um processo F adaptado de variáveis aleatórias integráveis. São equivalentes: 1. M é uma F martingala; 2. Para qualquer processo previsı́vel e limitado H = (Hn )0≤n≤N , verifica-se: " E N X # Hn ∆Mn = 0 . n=1 Demonstração. Verifiquemos que a condição é necessária. Seja H0 ≡ 0 e (Hn )0≤n≤N uma qualquer sequência previsı́vel, relativamente a F, limitada, de variáveis aleatórias. Pela proposição 2 o processo X definido por: ( X0 := 0 Pn Xn := i=1 Hi ∆Mi 1≤n≤N , é uma F martingala. Dado que uma martingala tem valor médio constante, tem-se que: " E n X # Hi ∆Mi = E[Xn ] = E[X0 ] = 0 . i=1 Verifiquemos que a condição é suficiente. Seja j ∈ {0, 1, . . . , N − 1} fixo e A ∈ Fj arbitrário. Seja por definição, ( IA Hn = 0 n=j+1 n 6= j + 1 ou seja, tem-se a seguinte definição: H0 0 H1 0 ... ... Hj−1 0 Hj IA Hj+1 0 Hj+2 0 ... ... HN 0 O processo (Hn )0≤n≤N é previsı́vel e obviamente limitado. Em consequência da condição admitida por hipótese: " 0=E N X # Z Hi ∆Mi = E [IA (Mj+1 − Mj )] = (Mj+1 − Mj )dP . A i=1 Tem-se, pois, pela definição de esperança condicional e atendendo a que A é arbitrário: E [Mj+1 − Mj | Fj ] = 0 para j = 0, 1, . . . N − 1 , isto é, M é uma martingala. MF0910 12 24 de Novembro de 2009 Capı́tulo II Modelos Discretos Secção: 1 1.7 Mercados financeiros viáveis Podemos formalizar a noção de mercado considerando o processo de preços e o conjunto de todas as carteiras autofinanciadas. Definição 7. Um mercado financeiro diz-se viável sse não existirem carteiras de arbitragem isto é sse for impossı́vel gerar lucros certos a partir de um investimento incial nulo. Observação 19. • Para P probabilidade e A ∈ F um qualquer acontecimento, sabemos que P[A] ∈ [0, 1] exprime a confiança que temos na realização do acontecimento A. P[A] = 0 diz-nos que o acontecimento A é impossı́vel. dadas duas probabilidades P e P∗ , podemos considerar P equivalente a P∗ se e só se P e P∗ coincidem sobre os acontecimentos de probabilidade nula. A coincidência sobre os acontecimentos de probabilidade nula deve ser um denominador comum a todos os agentes de mercado. • Dado que Ω é finito e que F = P(Ω) temos que se A ∈ F então, necessariamente, A = ∪qi=1 {ωi } onde q é o número de elementos de A. Nestas condições tem-se que P[A] = 0 se e só se para todo o i = 1, . . . , q se tem P[{ωi }] = 0. Como, por hipótese, para qualquer ω em Ω se tem que P[{ω}] = 0 temos finalmente que: P∼ = P∗ ⇔ ∀ω ∈ Ω P∗ [{ω}] = 0 . Com efeito: P∼ = P∗ ⇔ ∀A ∈ F (P[A] = 0 ⇔ P∗ [A] = 0) ⇔ (P[A] > 0 ⇔ P∗ [A] > 0) . É notável que a existência de uma medida de probabilidade relativamente à qual o processo de preços descontados seja uma martingala caracterize os mercados viáveis. Teorema 3 (Primeiro teorema fundamental sobre o apreçamento de activos). Um o mercado é viável sse existir uma medida de probabilidade P∗ , equivalente a P∗ tal que o processo de preços actualizados seja uma martingala relativamente a P∗ . Definição 8. Uma medida de probabilidade verificando a condição do teorema diz-se uma medida neutra face ao risco ou uma medida de martingala. Demonstração. Suponhamos que existe uma medida P∗ equivalente a P tal que o processo de preços actualizados seja uma martingala relativamente à medida P∗ . Para uma qualquer carteira Φ autofinanciada e limitada: ∀n ≥ 1 Ṽn (Φ) = V0 + n X Φj ∆S̃j , j=1 em consequência do teorema 1. Logo (Ṽn (Φ))0≤n≤N é uma martingala relativamente a P∗ pelo teorema 2. Suponhamos agora Φ admissı́vel tal que V0 (Φ) = 0. Pelas propriedades das martingalas tem-se que: E∗ [ṼN (Φ)] = E∗ [V0 (Φ)] = 0 . MF0910 13 24 de Novembro de 2009 Capı́tulo II Modelos Discretos Secção: 1 Como se tem que ṼN (Φ) ≥ 0, dado que Φ é admissı́vel e E∗ [ṼN (Φ)] = r X ṼN (Φ)(ωi ) P∗ [{ωi }] = 0 , i=1 com ṼN (Φ)(ωi ) ≥ 0 e P∗ [{ωi }] > 0, terá que ser ṼN (Φ) ≡ 0. Em consequência, não há carteiras de arbitragem. 1.8 Mercados completos Consideramos num modelo de mercado financeiro contratos conferindo direitos com exercı́cio opcional caracterizados pelo correspondente cashflow ou payoff. Neste contexto um direito contingente pode definir-se da seguinte forma. Definição 9. Um direito contingente é uma variável aleatória, não negativa, FN mensurável. Os exemplos seguintes são fundamentais. Exemplo 1. Call option europeia: o cash-flow deste direito contingente sobre, por exemplo, o activo com preço S1 = (Sn1 )0≤n≤N , depende de um parâmetro, o preço de exercı́cio K e é definido por: ( 1 ≥K 1 −K se SN SN 1 (5) h := (SN − K)+ = 1 ≤K 0 se SN Exemplo 2. Put option europeia: o cash-flow deste activo contingente é definido por: 1 h := (K − SN )+ (6) Observação 20. 1. Um direito contingente h depende apenas do valor do activo subjacente à data de exercı́cio isto é, tem-se que: h = h(SN ) . 2. Noutro tipo de produtos financeiros derivados pode ter-se: h = h(S0 , S1 , . . . , SN ) , tal como, por exemplo, no caso das opções asiáticas em que o preço de exercı́cio é um valor médio do preço do subjacente calculado entre a data de exercı́cio e uma data anterior. Definição 10. Um direito contingente h é atingı́vel sse existe uma estratégia admissı́vel cujo valor à data N seja exactamente h. Teorema 4. Num mercado viável é condição suficiente para que um direito contingente h seja atingı́vel que exista uma carteira autofinanciada Φ, cujo valor na data de maturidade seja h. MF0910 14 24 de Novembro de 2009 Capı́tulo II Modelos Discretos Secção: 1 Observação 21. Neste teorema substitui-se a hipótese da carteira ser admissı́vel, na definição acima, pela hipótese mais fraca da carteira ser autofinanciada. Demonstração. Seja Φ uma carteira autofinanciada tal que VN (Φ) = h e P∗ uma probabilidade de martingala. Uma tal probabilidade existe dado que o mercado é viável. (Ṽn (Φ))0≤n≤N é uma martingala relativamente a P∗ uma vez que é transformação de martingala do processo de preços descontados que é uma martingala devido à definição de P∗ . Tem-se pois que: ∀n ∈ {0, 1, . . . , N } Ṽn (Φ) = E∗ [ṼN (Φ) | Fn ] . 0 ≥ 0 tem-se que Ṽ (Φ) ≥ 0, para 0 ≤ n ≤ N em consequência Como ṼN (Φ) = h/SN n das propriedades da noção de esperança condicional, verificando-se pois que Vn (Φ) ≥ 0, sendo então a estratégia admissı́vel. Definição 11. Um mercado financeiro diz-se completo sse todo o direito contingente é atingı́vel. Observação 22. Assumir que um mercado é completo é uma hipótese restritiva cuja motivação económica não é tão óbvia como a hipótese de não arbitragem. Teorema 5 (Segundo teorema fundamental no apreçamento de activos). Um mercado viável é completo sse existir uma medida de martingala P∗ única, i.e. se existir uma única medida de probabilidade equivalente a P, relativamente à qual o processo de preços descontados seja uma martingala. Demonstração. Suponhamos o mercado viável e completo. Para h ≥ 0, h ∈ mFN , existe uma carteira admissı́vel tal que VN (Φ) = h. Como Φ é autofianciada temos que: N X h VN (Φ) = = Ṽ (Φ) = V + Φj · ∆S̃j . 0 N 0 0 SN SN j=1 (7) Suponha-se que F0 = {∅, Ω} e sejam P∗1 e P∗2 duas medidas de martingala tem-se então que para i = 1, 2: E∗i [ṼN (Φ)] = E∗i [V0 (Φ)] ( propriedades de martingala) = V0 (Φ)( dado que F0 = {∅, Ω}) . Em consequência da fórmula 7 tem-se que: E∗1 [ h h ] = E∗2 [ 0 ] . 0 SN SN Como h ∈ mFN é arbitrária tem-se que P∗1 ≡ P∗2 sobre FN . Supondo F = FN temos o resultado anunciado. MF0910 15 24 de Novembro de 2009 Capı́tulo II Modelos Discretos Secção: 2 1.9 Apreçamento e cobertura de direitos contingentes em mercados completos Consideremos um mercado viável e completo denotando-se por P∗ a única medida de martingala. Seja h ∈ mFN , h ≥ 0 um direito contingente. Seja Φ uma carteira admissı́vel e réplica de h. Dado que (Ṽn (Φ))0≤n≤N é P∗ martingala tem-se que: V0 (Φ) = E∗ [ṼN (Φ) | F0 ] = E∗ [ṼN (Φ)] = E∗ [ h 0 ]. SN Mais geralmente, para n = 0, 1, . . . , N tem-se que: Vn (Φ) = Ṽn (Φ) · Sn0 = Sn0 · E∗ [ h 0 | Fn ] , SN isto é: ∀n ∈ {0, . . . , N } Vn (Φ) = Sn0 ∗ ·E h 0 | Fn SN . (8) Pode pois afirmar-se que o valor de uma carteira réplica de h é completamente determinado por h é pois natural que num mercado viável e completo o preço livre de arbitragem de um direito contingente h seja dado pela fórmula 8. Com efeito Vn (Φ) é a riqueza necessária à data n para replicar h à data N seguindo a estratégia admissı́vel Φ. 0 ] e seguir reSe à data zero o investidor vender o direito contingente por E∗ [h/SN constituindo a carteira Φ, pode gerar o valor h à data N . Está por isso perfeitamente coberto (hedged). Exemplo 3. Considere um mercado com dois activos um com risco e o outro sem risco e tal que N = 1. Considere um direito contingente h sobre o activo com risco e Φ uma carteira réplica de h. O quadro seguinte demonstra que se o preço à data zero do direito contingente não for exactamente V0 (Φ), então existe no mercado uma oportunidade de arbitragem. Suponha, por exemplo, que Π(0, h) o preço de h à data zero verifica Π(0, h) < V0 (Φ). Posição short Posição long Total no Activo sem risco Data 0 V0 (Φ) −Π(0, h) V0 (Φ) − Π(0, h) Data 1 VN (Φ) = h −Π(0, h) = −h (V0 (Φ) − Π(0, h))(1 + R) > 0 2 O modelo de Cox Ross Rubinstein No enquadramento definido até agora consideramos: • a existência de apenas um activo com risco i.e. d = 1; • denotamos o preço do activo com risco por (Sn )0≤n≤N . MF0910 16 24 de Novembro de 2009 Capı́tulo II Modelos Discretos Secção: 2 • a dinâmica do activo sem risco é dada por: ∀n ∈ {0, . . . , N } Sn0 = (1 + r)n , com r ∈ R∗+ . • a dinâmica do activo com risco é dada por S0 ∈ R∗+ e Sn+1 ( Sn (1 + a) = Sn (1 + b) (9) para −1 < a < b. Exercı́cio 1 (Uma concretização). . 1. Represente graficamente (para N = 3) a árvore de evolução dos preços do activo com risco e mostre que pode identicar Ω o conjunto dos estados do mundo com {(1 + a), (1 + b)}N . 2. Verifique que: ∀ω = (y1 , . . . yN ) ∈ Ω ∀i ∈ {0, . . . , N − 1} yi+1 = Si+1 (ω) . Si Consideramos ainda como hipóteses: • F0 = {∅, Ω} ∀n ∈ {1, . . . , N } Fn := σ(S1 , . . . , Sn ). • F = P(Ω) • A probabilidade inicial sobre Ω está definida a menos de equivalência, i.e.: ∀ω ∈ Ω P[{ω}] > 0 . Definição 12. Seja, por definição, para cada n = 1, . . . , N Tn := Sn Sn−1 Exercı́cio 2. 1. Mostre que L(T1 , . . . , TN ) ≡ P i.e. que a lei do N -uplo de variáveis aleatórias (T1 , . . . , TN ) é, exactamente, P. 2. Mostre que ∀n ∈ {1, . . . , N } Fn = σ(T1 , . . . , Tn ) Exercı́cio 3. Mostre que se o processo dos preços descontados (S̃n )0≤n≤N é P martingala então: ∀n ∈ {0, . . . , N − 1} E[Tn+1 | Fn ] = 1 + r . MF0910 17 24 de Novembro de 2009 Capı́tulo II Modelos Discretos Secção: 2 Exercı́cio 4. Mostre que se o mercado for livre de arbitragem então, r ∈]a, b[. Exercı́cio 5. Mostre que se a condição r ∈]a, b[ não for satisfeita então há oportunidades de arbitragem. Exercı́cio 6. Suponha-se que r ∈]a, b[ e seja: b−r . b−a p := 1. Mostre são equivalentes (a) (S̃n )0≤n≤N é P martingala (b) (Tn )1≤n≤N é uma sucessão iid e P[T1 = 1 + a] = p = 1 − P[T1 = 1 + b] 2. Conclua que, sob a hipótese feita acima (r ∈]a, b[) o mercado é livre de arbitragem e completo. Exercı́cio 7. Seja Cn (respectivamente Pn ) o preço à data n de uma Call (respectivamente Put) Option europeia sobre o activo com risco com preço de exercı́cio K e data de maturidade N . 1. Mostre a relação de paridade Call-Put: Cn − Pn = Sn − K(1 + r)−(N −n) . 2. Mostre que Cn = c(n, Sn ) onde: c(n, x) = (1 + r)−(N −n) × N −n X (N − n)! pj (1 − p)N −n−j x(1 + a)j (1 + b)N −n−j − K + . × (N − n − j)!j! j=0 2.1 Questão de desenvolvimento Suponha-se no contexto de um mercado a um perı́odo (N = 1), num espaço de probabilidade com uma infinidade numerável de estados do mundo e com uma infinidade de activos d = +∞ Seja Ω = {1, 2, . . . , }, F0 = {∅, Ω} e F1 = F a σ-álgebra gerada pelos subconjuntos finitos de Ω. Seja a probabilidade P definida sobre (Ω, F) por: ∀k ∈ Ω P[{k}] = 2−k . Seja para cada activo i ∈ {1, 2, . . . , } a sucessão dos preços Sni , para n = 0, 1 definida pela diferença: ω=i 1 i i (S1 − S0 )(ω) = −1 ω = i + 1 0 i 6= ω 6= i + 1 MF0910 18 24 de Novembro de 2009 Capı́tulo II Modelos Discretos Secção: 2 Exercı́cio 8. 1. Suponha que B0 = B1 P = 1. Mostre que para uma carteira Φ = (φi )i∈{1,2,...,} que verifique a condição +∞ i=1 | φi |< +∞ o valor da carteira V1 (Φ), à data 1, pode ser dado por: V1 (Φ) = φ0 + +∞ X φi S1i = V0 (Φ) + i=1 se for V0 (Φ) = φ0 + P+∞ i=1 +∞ X φi (S1i − S0i ) , i=1 φi . 2. Suponha que V0 (Φ) = 0 e que V1 (Φ) ≥ 0. Mostre que V1 (Φ) = 0 P quase certamente. 3. Mostre que se existir uma medida de martingala P∗ então: E∗ S1i − S0i = 0 , e conclua que P∗ [{i}] = P∗ [{i + 1}]. 4. Mostre que o mercado com as caracterı́sticas que acabou de utilizar é livre de arbitragem e exprima uma conclusão dos resultados obtidos nas alı́neas anteriores. Referências [1] S. Beninga Financial Modeling, The MIT press, 1997. [2] T. Björk An introduction to Arbitrage Theory in Continuous Time, Oxford University Press, 1998. [3] R. J. Elliot, P. Ekkehard Kopp Mathematics of Financial Markets, Springer Verlag, 1999. [4] John C. Hull Options Futures and other Derivatives, fourth edition, Prentice Hall International, Inc., 2000. [5] D. Lamberton, & B. Lapeyre, Introduction to Stochastic Calculus Applied to Finance, Chapman & Hall 1996. [6] M. Musiela, & M. Rutkowski, Martingale Methods in Financial Modelling, Springer Verlag, 1997. [7] S. R. Pliska, Introduction to Mathematical Finance, Blackwell Publishers, 1997. [8] A. N. Shiryaev, Essentials of Stochastic Finance, World Scientific, 1999. MF0910 19 24 de Novembro de 2009 As Árvores Trinomiais nos Modelos de Mercados Financeiros FCT/UNL, Matemática Financeira 07-08 MLE 1 Introdução Faz-se uma apresentação sumária do modelo trinomial. As questões colocadas poderão, talvez, vir a ser aprofundadas no âmbito duma dissertação de mestrado. 2 O modelo trinomial O modelo trinomial é muito semelhante ao modelo binomial, havendo no entanto algumas diferenças. No modelo trinomial consideram-se também dois activos primários. A obrigação (bond ), activo sem risco cuja lei de evolução do respectivo preço é dada por: ( B0 = 1 Bn+1 = (1 + R)Bn n ≥ 0 , em que R ≥ 0 é a taxa de juro sem risco, determinı́stica, associada a um dado perı́odo de tempo ∆t que deveremos ter sempre o máximo cuidado em explicitar 1 . A acção (stock ), activo com risco cuja lei de evolução do respectivo preço é dada por: ( S0 > 0 Sn+1 = Zn+1 Sn n ≥ 0 , em que (Zn )n≥1 é uma amostra de u com Z = s com d com uma variável aleatória trinomial Z tal que: probabilidade pu probabilidade ps probabilidade pd = 1 − (pu + ps ) e que representa o retorno da acção no perı́odo ∆t 2 . Os parâmetros do modelo, sob a probabilidade natural, são descritos, evidentemente, por Θ = (R, u, s, d, pu , ps ). Chamamos a atenção do leitor para o seguinte. A árvore que descreve o modelo trinomial de acordo com (Hull 00)[p. 405] é a seguinte. 1 2 Por exemplo a taxa pode ser: diária, semanal, mensal, anual, etc. De facto, por definição, o retorno aditivo é dado por (S1 − S0 )/S0 = Z − 1. 1 MF0708 Árvores Trinomiais Subsecção: 3.0 S0 u 3 - S u2 0 S0 u 2 @ @ @ S0 u - S0 u @ @ @ R @ @ @ @ S0 - S0 @ R S0 @ @ @ @ @ R @ R S0 @ @ @ @ @ S0 u S0 d @ R - S0 d @ R - S0 d @ @ @ @ @ @ @ R @ R - S d2 0 S0 d 2 @ @ @ @ R S0 d 3 Pode ver-se que neste caso particular são feitas as seguintes hipóteses. ( s=1 d = 1/u 3 Questões em aberto Ficam por elucidar as seguintes questões. O leitor corajoso poderá tentar verificar se as sugestões propostas respondem ou não às questões. 1. O modelo trinomial é livre de arbitragem? Uma primeira ideia seria copiar a Primeira versão 2 28 de Novembro de 2007 MF0708 Árvores Trinomiais Subsecção: 3.0 construção da medida de martingala no caso trinomial. Terı́amos: S0 = 1 EQ [S1 ] = pu S0 u + ps S0 s + (1 − pu − ps )S0 d 1+R ou seja, com pu , ps ∈ [0, 1]: 1 + R = pu u + ps s + (1 − pu − ps )d , isto é, 1 + R combinação convexa dos três pontos d < s < u. Observe-se que se ps = 0 então 1 + R ∈ [d, u] por ser combinação convexa de d e u. Em qualquer caso como d < s < u tem-se que s = αu + (1 − α)d pelo que 1 + R = (pu + αps )u + [(1 − pu − ps ) + (1 − α)ps ]d com (pu + αps ) + [(1 − pu − ps ) + (1 − α)ps ] = 1 pelo que 1 + R ∈ [d, u]. 2. Será que a condição de não arbitragem é, na mesma, 1+R ∈ [d, u]? A demonstração deve ir pela mesma via que no caso binomial. 3. Como fazer o apreçamento e a cobertura? É de esperar que se tenha para X = Φ(ST ) a fórmula de apreçamento usual, a saber, Π(0, X) = 1 1 EQ [X] = EQ [Φ(ST )] . (1 + R)T (1 + R)T (1) Sendo que se estivermos a considerar T perı́odos e se Y = (Yu , Ys , Yd ) for uma variável trinomial de parâmetros T e Q = (qu , qs , qd ) 3 então ter-se-à que: X = Φ(ST ) = Φ(S0 uYu sYs dYd ) . (2) Em consequência das fórmulas 1 e 2 deverá vir: X T! q k q l q m Φ(S0 uk sl dm ) , Π(0, X) = k! l! m! u s d k+l+m=T o que justificaria o cálculo de Monte Carlo efectuado na aula prática e descrito no ficheiro Mathematica da aplicação prática. 4. O modelo trinomial é completo? Queremos uma carteira réplica formada por dois activos. No caso do modelo binomial sabemos (ver a proposição 6 das notas de aula) que se o modelo for livre de arbitragem então é completo. No caso do modelo trinomial temos que resolver o sistema (1 + R)x + S0 uy = φ(u) (1 + R)x + S0 sy = φ(s) (1 + R)x + S0 dy = φ(d) o que em geral é impossı́vel (três equações e duas incógnitas (x, y)). Uma alternativa é considrar uma carteira réplica com um terceiro activo. Outra aproximação é investigar o apreçamento em mercados não completos. 3 Q represetará a probabilidade neutra face ao risco. Primeira versão 3 28 de Novembro de 2007 MF0708 Árvores Trinomiais Subsecção: 3.1 5. Se o modelo trinomial não for completo, como construir uma carteira de cobertura? Mais uma vez a ideia seria escolher um activo adicional no mercado. 6. Como efectuar a calibração do modelo? A literatura propõe várias expressões 4 . Um exemplo comum, para o caso particular que é descrito na figura apresentada, é: u = eσ √ 2∆t , s = 1, d = e−σ √ 2∆t Su = S · u, Ss = S, Sd = S · d √ !2 eR∆t/2 − e−σ ∆t/2 √ √ pu = eσ ∆t/2 − e−σ ∆t/2 √ !2 eσ ∆t/2 − eR∆t/2 √ √ pd = eσ ∆t/2 − e−σ ∆t/2 ps = 1 − pu − pd , sendo σ a volatilidade estimada a partir dos dados. Um outro exemplo de parametrização é apresentado em (Hull 00)[p. 405]. Poder-se-ia tentar uma aproximação semelhante à que seguimos no modelo binomial para o caso geral? 7. É sabido que o modelo binomial tem boas propriedades de convergência podendose, num dos limites possı́veis, obter os preços de Black-Scholes. Que tipo de preços com modelos contı́nuos se podem obter num limite do modelo trinomial? Se pudermos obter distribuições limite não Gaussianas a utilização do modelo trinomial geral poderá encontrar amplas aplicações. 3.1 Aplicação prática No ficheiro Mathematica distribuı́do estudamos o caso geral descrito acima e o caso particular com os parâmetros semelhantes aos que foram utilizados para estudar o modelo binomial no caso das opções sobre o PSI-20. Referências [Hull 00] J. C Hull, Options Futures and other derivatives, fourth edition, Prentice-Hall International Inc., 2000. [Broadie et al 98] Mark Broadie, Paul Glasserman (editors) , Hedging with Trees, Risk Books, 1998. 4 Veja-se, por exemplo, (Kamrad et al 91). Primeira versão 4 28 de Novembro de 2007 MF0708 Árvores Trinomiais Subsecção: 3.1 [Kamrad et al 91] Kamrad, B. and P. Ritchken, Multinomial Approximating Models for Options with k-State Variables, Management Science 37, No. 12 (1991), pp. 1640-1652. Primeira versão 5 28 de Novembro de 2007 Árvores Trinomiais Estudam-se as árvores trinomiais gerais. O caso tradicional (Hull página 405) é o caso em que s=1 e u=1/d. A ideia de usar árvores trinomiais é que permitem resultados muito mais variados que o modelo binomial. << Statistics`DiscreteDistributions` << Statistics`ContinuousDistributions` << Graphics`Graphics` << Statistics`HypothesisTests` << Statistics`ConfidenceIntervals` Árvore trinomial geral A um período pu = .6; ps = .2; pd = 1 - Hpu + psL; u = 1.0223; s = 1.009; d = 0.888581; S0 = 100; T = 130; K = 105; R = .041 ê 360; nRep = 10000; Esta função fTri permite gerar uma variável aleatória trinomial fTri@u_, s_, d_, pu_, ps_, a_D := If@0 § a < pu, u, 0D + If@pu <= a < pu + ps, s, 0D + If@pu + ps <= a § pu + ps + pd, d, 0D alea = Table@Random@D, 8k, 1, nRep<D; TriAlea = Table@S0 * fTri@u, s, d, pu, ps, alea@@kDDD, 8k, 1, nRep<D; TrinomialTrees.nb 2 Histogram@TriAleaD 6000 5000 4000 3000 2000 1000 90 92 94 96 98 100 102 Ü Graphics Ü 8Mean@TriAleaD, StandardDeviation@TriAleaD< 899.2488, 5.27412< Árvore trinomial geral multi-período MulAlea = Table@Random@D, 8k, 1, nRep * T<D; MulTriAlea = Table@S0 * Product@fTri@u, s, d, pu, ps, MulAlea@@kDDD, 8k, 1 + Hm - 1L * T, m * T<D, 8m, 1, nRep<D; TrinomialTrees.nb 3 Histogram@MulTriAleaD 600 500 400 300 200 100 50 100 150 200 Ü Graphics Ü 8Skewness@MulTriAleaD, Kurtosis@MulTriAleaD< 81.75705, 7.85363< Pode constatar-se que não é aceitável supor que a distribuição limite quando T cresce é normal neste caso. Direito Contingente ou Derivado X@S_, K_D := Max@S - K, 0D PreXis = Table@X@MulTriAlea@@kDD, KD, 8k, 1, Length@MulTriAleaD<D; PriceCall = H1 ê H1 + RL ^ TL * Mean@PreXisD 0.655796 TrinomialTrees.nb 4 Árvore trinomial particular A um período Os dados são quase os mesmos que os que foram usados no modelo binomial no casso da opção sobre o Psi-20. O objectivo é permitir recuperar o resultado da Call option calculada no modelo binomial quando s=1, ps=0. pu = 0.499431; ps = .0005; pd = 1 - Hpu + psL; u = 1.01142; s = 1; d = 1 ê u; S0 = 7307.99; T = 30; K = 7161.83; R = .041 ê 360; nRep = 10000; alea2 = Table@Random@D, 8k, 1, nRep<D; TriAlea2 = Table@S0 * fTri@u, s, d, pu, ps, alea2@@kDDD, 8k, 1, nRep<D; Histogram@TriAlea2D 5000 4000 3000 2000 1000 7225 7250 7275 7300 7325 7350 Ü Graphics Ü 8Mean@TriAlea2D, StandardDeviation@TriAlea2D< 87308.24, 82.9775< 7375 TrinomialTrees.nb 5 Árvore trinomial particular multi-período MulAlea2 = Table@Random@D, 8k, 1, nRep * T<D; MulTriAlea2 = Table@S0 * Product@fTri@u, s, d, pu, ps, MulAlea2@@kDDD, 8k, 1 + Hm - 1L * T, m * T<D, 8m, 1, nRep<D; Histogram@MulTriAlea2D 1400 1200 1000 800 600 400 200 6000 6500 7000 7500 8000 8500 9000 Ü Graphics Ü 8Skewness@MulTriAlea2D, Kurtosis@MulTriAlea2D< 80.195504, 2.9831< Direito Contingente ou Derivado no caso particular PreXis2 = Table@X@MulTriAlea2@@kDD, KD, 8k, 1, Length@MulTriAlea2D<D; PriceCall2 = H1 ê H1 + RL ^ TL * Mean@PreXis2D 272.545 O Integral Estocástico FCT/UNL, Matemática Financeira MLE 1 Introdução Consideremos a evolução de bactérias num meio apropriado de cultura. Uma forma de descrever essa evolução pode consistir em considerar a concentração definida como o número de bactérias por unidade de volume em função do tempo. Representamos a concentração por βt . Uma hipótese plausı́vel é a de que havendo condições adequadas em espaço e alimentos - a variação da concentração é proporcional à concentração. Uma forma de traduzir esta hipótese num modelo matemático simples consiste em escrever: dβt = αβt . dt (1) Admitindo que à data t = 0 a concentração de bactérias vale β0 temos que a equação diferencial acima admite como solução: βt = β0 exp(αt) . Esta forma adoptada para traduzir matematicamente o fenómeno da evolução da concentração de bactérias num meio adequado pode ser considerada simplista dado que pressupõe uma uniformidade na evolução que, raramente, se observa. Uma alternativa pode ser considerar que as condições em que decorre o fenómeno de evolução admitem uma decomposição numa tendência forte mas que é perturbada por um ruı́do de fundo com caracterı́sticas aleatórias. Podem considerar-se neste contexto dois tipos de modelos: modelos a tempo discreto e modelos a tempo contı́nuo. 1.1 Um modelo a tempo discreto Suponha-se então que à evolução descrita acima na fórmula 1 se sobrepõe um termo aditivo Θ(t) representando o ruı́do ou a incerteza das condições no instante t. A evolução passa a ser dada pela fórmula: dβt = αβt + Θ(t) . dt Esta fórmula admite a representação βt+∆t − βt ≈ αβt + Θ(t) , ∆t 1 Capı́tulo IV Integral Estocástico Secção: 1 considerando a aproximação usual para a derivada. Supondo que ∆t 6= 0 tem-se ainda, βt+∆t − βt ≈ αβt ∆t + Θ(t)∆t , que é equivalente a: βt+∆t ≈ (1 + α∆t)βt + Θ(t)∆t . Supondo ∆t = 1 e que a data inicial é t = 0 tem-se como modelo ∀n ∈ N∗ βn+1 = (1 + α)βn + Θ(n) . É usual considerar que Θ(n), o termo correspondente ao ruı́do, se pode escrever como: Θ(n) = θn , em que a sucessão (n )n∈N representa uma sucessão de variáveis aleatórias independentes e identicamente distribuı́das (iid), centradas e com variância comum igual à unidade. O modelo que assim se obtem pode ser representado por ∀n ∈ N∗ βn+1 = (1 + α)βn + θn (2) em que α e θ são parâmetros - a serem objecto de estimação e calibração em caso de aplicação do modelo - e com i E[n ] = 0, V[n ] = 1, L(n ) ≡ L(m ), m 6= n ⇒ n ↔ m , (3) define um processo autoregressivo de ordem um que é bem conhecido e sobre o qual se dispõe de muita informação (veja-se, por exemplo, [Dacunha-Castelle (I)][p. 132, 158, 176], [Dacunha-Castelle (II)][p. 140, 141]). Exercı́cio 1 (Existência do ruı́do branco em tempo discreto). Mostre que existe um espaço de probabilidade e um ruı́do branco sobre este espaço; isto é, uma sucessão de variáveis aleatórias - definidas sobre este espaço de probabilidade - independentes e identicamente distribuı́das - eventualmente com uma dada distribuição prescrita - centradas e com variância comum igual à unidade. 1.2 Um modelo a tempo contı́nuo Suponhamos que pretendemos encontrar um modelo a tempo contı́nuo semelhante ao modelo descrito pela fórmula 2 e pelas hipóteses ou condições 3. Formalmente deverı́amos ter dβt = αβt dt + Θ(t)dt ou ainda, com Θ(t)dt = θt , dβt = αβt dt + θt , em que se deveriam verificar as seguintes condições, i E[t ] = 0, V[t ] = 1, L(s ) ≡ L(t ), s 6= t ⇒ s ↔ t . MF0910 2 21 de Dezembro de 2009 Capı́tulo IV Integral Estocástico Secção: 1 Isto é (t )t≥0 seria um processo estocástico de variáveis iid, centradas e com a variância igual à unidade. Pode mostrar-se que um processo satisfazendo estas condições não pode ter funções mensuráveis como trajectórias (veja-se [Øksendal 98][p. 21]). É-se, assim, levado a procurar uma outra interpretação ou modelo em tempo contı́nuo. Para tal, recordemos que existe um processo estocástico (Wt )t∈[0,+∞[ , de variáveis gaussianas, com trajectórias contı́nuas - o processo de Wiener, também denominado processo browniano - e incrementos independentes. Esta última propriedade permite-nos tentar interpretar a equação diferencial com ruı́do dβt = αβt + Θ(t) , dt ou a fórmula aproximada por discretização βt+∆t − βt ≈ αβt + Θ(t) , ∆t pela expressão seguinte βt+∆t − βt ≈ αβt ((t + ∆t) − t) + θ(t)(Wt+∆t − Wt ) , de uma forma semelhante à que usámos para o modelo a tempo discreto. Considerando agora, 0 = t0 ≤ t1 = (t0 + ∆t) ≤ t2 ≤ · · · ≤ tn−1 ≤ tn = t = (t0 + n∆t) , pode escrever-se por superposição de termos com a forma dada pela expressão anterior que: n−1 n−1 n−1 X X X βt − β0 = (βti+1 − βti ) = αβti ∆t + θ(t)(Wti+1 − Wti ) . i=0 i=0 i=0 Passando ao limite quando ∆t tende para zero virá: βt = β0 + lim ∆t→0 n−1 X αβti ∆t + i=0 n−1 X ! θ(t)(Wti+1 − Wti ) . i=0 Pn−1 αβti ∆t) pode ser interpretado - sob hipóteses Pode observar-se que o termo lim∆t→0 ( i=0 de regularidade adequadas - como umP integral de Riemann ou de Lebesgue mas o que n−1 θ(t)(Wti+1 − Wti ) ? Se fosse possı́vel interé que se pode dizer do termo lim∆t→0 i=0 pretá-lo também como um integral poderı́amos ter um modelo, em tempo contı́nuo, para o crescimento populacional na presença de ruı́do. A evolução dos efectivos da população seria descrita pela fórmula, Z t Z t βt = β0 + (Lebesgue) αβ(u)du + (?) θ(u)dWu , 0 0 em notação integral ou, na notação diferencial associada naturalmente à notação integral, dβt = αβt dt + θt dWt . MF0910 3 21 de Dezembro de 2009 Capı́tulo IV Integral Estocástico Secção: 2 No que vai seguir-se estudaremos a noção de integral estocástico introduzida por K. Ito1 em três artigos datados de 1944, 1946 e 1951 (veja-se [Itô] para uma apresentação sintética dos trabalhos deste autor). Esta noção permitir-nos-á dar um sentido à expressão Z t θ(u)dWu , 0 de tal modo que muitas aplicações úteis poderão ser estudadas em grande profundidade com recurso a esta noção. 2 O Integral Estocástico de Ito Seja (Ω, F, P) um espaço de probabilidade, G = (Gt )t∈R+ uma filtração sobre este espaço de probabilidade. Definição 1. Um processo B = (Bt )t∈R+ , com trajectórias contı́nuas, é um G processo browniano se e só se: 1. B é G adaptado, isto é: ∀t ∈ R+ Bt ∈ mGt ; 2. Os incrementos de B são G independentes, isto é: i ∀s, t ∈ R+ s ≤ t ⇒ (Bt − Bs ) ↔ Gs ; 3. Os incrementos de B são estacionários, isto é: ∀s, t ∈ R+ s ≤ t ⇒ L(Bt − Bs ) ≡ L(Bt−s − B0 ) . Exemplo 1. O principal exemplo de processo browniano que devemos ter presente no que vai seguir-se é o do processo browniano usual relativamente à sua filtração natural. Definição 2. F = (Ft )t∈R+ , a filtração natural associada ao processo browniano B é, por definição: ∀t ∈ R+ Ft := σ({Bs : s ≤ t})∼ . Trata-se da filtração formada pelas σ álgebras Ft , geradas em cada instante t pelas variáveis aleatórias Bs em que s ≤ t, completadas relativamente aos conjuntos de probabilidade nula. Assim sendo, em cada uma das σ álgebras Ft todos os conjuntos P desprezáveis pertencem a Ft e têm probabilidade nula. 1 Kiyosi Itô, matemático japonês nascido em 1915. MF0910 4 21 de Dezembro de 2009 Capı́tulo IV Integral Estocástico Secção: 2 Exercı́cio 2. Mostre que se B é um G processo browniano então B é um F processo browniano, isto é, B é um processo browniano relativamente à sua filtração natural F. Consideramos seguidamente a definição de um espaço de processos relevante para o integral estocástico. Trata-se de definir uma classe de processos que podem ser integrados relativamente ao processo browniano tendo o integral estocástico resultante boas propriedades. Definição 3. Seja (Ω, F, P) um espaço de probabilidade completo. Para S, T ∈ R+ , S < T e para H filtração sobre (Ω, F, P), o espaço N([S, T ], H) é o espaço dos processos estocásticos Ψ = (ψt )t∈R+ que verificam as três condições seguintes. 1. Os processos Ψ são mensuráveis relativamente à álgebra σ produto B([0, +∞) ⊗ F. 2. Os processos Ψ são adaptados relativamente a H = (Ht )t≥0 , isto é, são tais que ∀t ≥ 0, ψt ∈ mHt . 3. Os processos Ψ verificam a condição de integrabilidade local: Z T 2 ψt dt < +∞ . E S Definição 4. Por definição temos ainda o espaço de processos localmente integráveis: \ N(H) := N([S, T ], H) . S,T ∈R+ ,S<T Numa primeira etapa da definição do integral de Ito consideraremos que as funções integrandas pertencem ao espaço N(F) em que F é a filtração associada ao processo G browniano definido acima. Para futura comodidade na escrita é conveniente precisar a seguinte notação relativa aos processos mensuráveis localmente de quadrado integrável relativamente à medida produto natural. Definição 5. Sejam S, T ∈ R+ tais que S < T e seja L2[S,T ] (λ ⊗ P) o espaço dos processos estocásticos Ψi= (ψt )t∈R+ , mensuráveis relativamente a B([0, +∞[) ⊗ hR T 2 F e tais que E S ψt dt < +∞. Exercı́cio 3. Mostre que N([S, T ], H) é um subespaço vectorial de L2[S,T ] (λ ⊗ P). MF0910 5 21 de Dezembro de 2009 Capı́tulo IV Integral Estocástico Secção: 2 Observação 1. Note que se definir para Ψ = (ψt )t∈R+ ∈ L2[S,T ] (λ ⊗ P), a norma de Ψ como Z T 1/2 2 || Ψ ||L2 (λ⊗P) := E ψt dt , [S,T ] S se tem que L2[S,T ] (λ ⊗ P), || · ||L2 [S,T ] (λ⊗P) , é um espaço de Banach, isto é um espaço vectorial normado completo (veja-se [Williams][p. 65]). Definição 6. Seja G = (Gt )t∈R+ uma filtração. Chamamos função Gelementar a toda a função que se possa representar sob a forma: φn (t, ω) = +∞ X ej (ω) I[j2−n ,(j+1)2−n [ (t) , j=0 em que n ∈ N∗ , ej (ω) ∈ mGj2−n e ej (ω) ∈ L2 (P). Uma representação gráfica de uma função elementar mostra-nos que estas funções são funções em escada cujos degraus são variáveis aleatórias. Com uns segundos de reflexão esta imagem permite uma justificação intuitiva da propriedade seguinte. Proposição 1. As funções G-elementares pertencem ao espaço N(G). Demonstração. Seja S, T ∈ R+ , S < T . É imediato verificar que as funções elementares definem processos estocásticos bastando para esse efeito aplicar as propriedades das funções mensuráveis e o teorema de Fubini. Para verificar que as funções elementares são processos estocásticos adaptados seja t0 ∈ R+ qualquer. Dado que a famı́lia ([i2−n , (i + 1)2−n [)i∈N forma uma partição de R+ , existe i = i(t0 ) ∈ N, único, tal que t0 ∈ [i(t0 )2−n , (i(t0 ) + 1)2−n [. Como i(t0 )2−n ≤ t0 e por isso Gi(t0 )2−n ⊂ Gt0 : φn (t0 , ω) = ei(t0 ) (ω) ∈ mGt0 . MF0910 6 21 de Dezembro de 2009 Capı́tulo IV Integral Estocástico Secção: 2 Para verificar a propriedade de integrabilidade tem-se então que: Z E T φ2n (t, ω) dt = S ! Z T X +∞ +∞ X = E ej I[j2−n ,(j+1)2−n [ (t) ei I[i2−n ,(i+1)2−n [ (t) dt = S Z = E T j=0 T =E S = = +∞ X i=0 +∞ X E[e2i ] = = i=0 +∞ X ej ej I[j2−n ,(j+1)2−n [∩[i2−n ,(i+1)2−n [ (t) dt = j=0 i=0 +∞ X ! e2i I[i2−n ,(i+1)2−n [ (t) # dt = i=0 Z T (4) I[i2−n ,(i+1)2−n [ (t) dt = S E[e2i ] Z E[e2i ] Z i=0 +∞ X +∞ X +∞ X S "Z i=0 +∞ I[S,T ]∩[i2−n ,(i+1)2−n [ (t) dt = −∞ +∞ I[sup(S,i2−n ),inf(T,(i+1)2−n [) (t)) dt = −∞ E[e2i ] sup(inf(T, (i + 1)2−n ), sup(S, i2−n )) − sup(S, i2−n ) . i=0 = +∞ X E[e2i ] (T ∧ (i + 1)2−n ) ∨ (S ∨ i2−n )) − (S ∨ i2−n ) . i=0 Na última soma acima só não são nulas as parcelas em que [i2−n , (i + 1)2−n [∩[S, T ] 6= ∅ (verificar!). Trata-se pois de uma soma finita de parcelas que são limitadas, logo é uma quantidade limitada. O exercı́cio seguinte mostra que a cada processo estocástico adaptado é possı́vel associar uma sucessão natural de funções elementares. Veremos adiante que esta sucessão tem boas propriedades de aproximação. Exercı́cio 4. Seja Y = (Yt )t∈[0,+∞[ um processo estocástico adaptado a uma dada filtração G e tal que, para cada t ∈ [0, +∞[, a variável aleatória Yt é de quadrado integrável. Mostre que: Yen (t, ω) := +∞ X Yj 2−n (ω)I[j 2−n ,(j+1) 2−n [ (t) j=0 é uma função G elementar. MF0910 7 21 de Dezembro de 2009 Capı́tulo IV Integral Estocástico Secção: 2 2.1 O integral de Ito das funções elementares Seja G = (Gt )t≥0 uma filtração sobre um espaço de probabilidade completo (Ω, F, P). Considere-se, B = (Bt )t≥0 um G processo browniano. De acordo com o exercı́cio 2, B é um F processo browniano relativamente à sua filtração natural dada pela definição 2. Definição 7. Um processo browniano B = (Bt )t≥0 diz-se standard se: B0 = 0, E[Bt ] = 0, E[Bt2 ] = t . Salvo aviso em contrário, supomos que os processos brownianos que consideraremos em seguida, são standard. Vamos procurar dar um sentido à expressão Z T f (t, ω)dBt (ω) , S quando f pertence ao espaço de processos estocásticos N(G). Para tal começamos por definir o integral de Ito das funções G elementares. Para se ter uma definição de integral estocástico que seja um operador linear com propriedades calculatórias naturais pode propor-se que seja válida a cadeia de igualdades seguinte. Z T Z +∞ I[j2−n ,(j+1)2−n [ (t)dBt (ω) = I[S,T ]∩[j2−n ,(j+1)2−n [ (t)dBt (ω) = −∞ S Z +∞ = I[sup(S,j2−n ),inf(T,(j+1)2−n )[ (t)dBt (ω) = −∞ ( BT ∧(j+1)2−n − BS∨j2−n = 0 se [S ∨ j2−n , T ∧ (j + 1)2−n [6= ∅ no caso contrário = B(T ∧(j+1)2−n )∨(S∨j2−n ) − BS∨j2−n Observação 2. O leitor é convidado a verificar que se tem: B(T ∧(j+1)2−n )∨(S∨j2−n ) − BS∨j2−n = B(j+1)2−n ∨S − Bj2−n = 0 B(j+1)2−n ∨S − BS = B(j+1)2−n − BS = BT ∨j2−n − Bj2−n = BT − Bj2−n B(j+1)2−n ∨j2−n − Bj2−n = B(j+1)2−n − Bj2−n BT ∨j2−n − Bj2−n = 0 se se se se se j2−n < (j + 1)2−n ≤ S j2−n ≤ S ≤< (j + 1)2−n ≤ T S ≤ j2−n ≤ T ≤< (j + 1)2−n S ≤ j2−n < (j + 1)2−n ≤ T T ≤ j2−n < (j + 1)2−n . Em consequência pode sempre adoptar-se a notação prática seguinte (veja-se [Øksendal 98][p. 23]): j · 2−n se S ≤ j2−n ≤ T (n) t j = tj = S se j2−n < S T se j2−n > S MF0910 8 21 de Dezembro de 2009 Capı́tulo IV Integral Estocástico Secção: 2 tendo-se, com esta notação, que Z T I[j2−n ,(j+1)2−n [ (t)dBt (ω) = Btj+1 − Btj S Recomendamos fortemente ao leitor o uso desta notação. Tal faremos, por exemplo, em algumas das demonstrações seguintes. Atendendo mais uma vez à linearidade e continuidade que se pretende para o integral estocástico sai naturalmente a definição seguinte. Definição 8. Tem-se, por definição que o integral de Ito da função G elementar φn , relativamente ao processo G browniano B, é: Z T φn (t, ω)dBt (ω) := S +∞ X ej (ω) B(T ∧(j+1)2−n )∨(S∨j2−n ) − BS∨j2−n = j=0 = +∞ X (5) ej (ω) Btj+1 − Btj . j=0 Observação 3. Note-se que a no membro à direita na definição acima figura uma variável aleatória bem definida. Com efeito, por um argumento semelhante ao que foi já utilizado acima a soma interveniente é uma soma finita. Para obter a extensão do integral de Ito ao espaço de processos N(G) o resultado seguinte é essencial. Teorema 1 (Isometria de Ito). Seja φn uma qualquer função elementar limiRT tada. Então S φn (t, ω)dBt (ω) o integral estocástico de φn relativamente ao processo browniano é uma variável aleatória que pertence a L2 (P) e verifica-se: Z T Z T 2 2 E ( φn (t, ω)dBt (ω)) = E φn (t, ω)dt , (6) S S o que é equivalente, de acordo com as notações introduzidas no exercı́cio 3 e na observação 1, a Z T || S φn dBt ||L2 (P) =|| φn ||L2 [S,T ] (λ⊗P) . (7) Observação 4. Note-se que de acordo com o que se verificou na fórmula 4 o membro da direita na igualdade 6 (ou na igualdade 7) é finito. Demonstração. A demonstração decorre de um cálculo simples que utiliza apenas as MF0910 9 21 de Dezembro de 2009 Capı́tulo IV Integral Estocástico Secção: 2 propriedades essenciais do processo browniano. " Z 2 # φn (t, ω)dBt (ω) =(a) T E S +∞ X = E ej (ω) (B(T ∧(j+1)2−n )∨(S∨j2−n ) − BS∨j2−n ) × j=0 +∞ X × !# ei (ω) (B(T ∧(i+1)2−n )∨(S∨i2−n ) − BS∨i2−n ) =(b) i=0 = +∞ X E ej (ω)ei (ω) (B(T ∧(i+1)2−n )∨(S∨i2−n ) − BS∨i2−n ) × i<j × B(T ∧(j+1)2−n )∨(S∨j2−n ) − BS∨j2−n + +∞ X E + B(T ∧(i+1)2−n )∨(S∨i2−n ) − BS∨i2−n × j<i × ej (ω)ei (ω) (B(T ∧(j+1)2−n )∨(S∨j2−n ) − BS∨j2−n + +∞ h X 2 i + E e2j (ω) (B(T ∧(i+1)2−n )∨(S∨i2−n ) − BS∨i2−n =(c) i=j = = +∞ X i=0 +∞ X E e2i (ω) E (B(T ∧(i+1)2−n )∨(S∨i2−n ) − BS∨i2−n )2 =(d) E e2j (ω) (T ∧ (i + 1)2−n ) ∨ (S ∨ i2−n ) − S ∨ i2−n ) =(e) i=0 Z T =E φ2n (t, ω)dt S As justificações para as igualdades são as seguintes. (a) Substituição do integral estocástico pela expressão dada por definição em 5 e expressão geral para o quadrado de uma soma. (b) Associação da soma sobre todos os pares de ı́ndices (i, j) ∈ N × N, segundo os três casos i < j, j < i e i = j. (c) Os dois primeiros termos da soma são nulos. Por exemplo, para o primeiro tem-se que sendo i < j, vem que ti+1 ≤ tj , pelo que ej (ω)ei (ω) (B(T ∧(i+1)2−n )∨(S∨i2−n ) − BS∨i2−n ) é mensurável relativamente a Gtj ; como B(T ∧(j+1)2−n )∨(S∨j2−n ) − BS∨j2−n é inMF0910 10 21 de Dezembro de 2009 Capı́tulo IV Integral Estocástico Secção: 2 dependente de Gtj tem-se que o primeiro termo da soma vale: +∞ X E ej (ω)ei (ω) (B(T ∧(i+1)2−n )∨(S∨i2−n ) − BS∨i2−n ) × i<j × E B(T ∧(j+1)2−n )∨(S∨j2−n ) − BS∨j2−n = 0 , dado que E[B(T ∧(j+1)2−n )∨(S∨j2−n ) ] = E[BS∨j2−n ]. O mesmo tipo de argumento pode ser dado para o segundo termo da soma. Por último, tem-se que ei é mensurável relativamente a Gti e B(T ∧(i+1)2−n )∨(S∨i2−n ) − BS∨i2−n é independente de Gti . (d) Uma vez que para s ≤ t se tem que E[(Bt − Bs )2 ] = t − s dado que o processo B é standard. (e) Pela expressão deduzida na sequência de fórmulas 4. Observação 5. Considerando o operador linear IST , que a uma dada função elementar φn associa o respectivo integral estocástico IST (φn ), a fórmula 7 pode interpretar-se da seguinte forma. || IST (φn ) ||L2 (P) =|| φn ||L2 (λ⊗P) . Isto significa que IST é uma isometria - isto é, um operador linear limitado que preserva as distâncias - de N([S, T ], F) em L2 (P). 2.2 A extensão de um operador linear limitado O exercı́cio seguinte que pode ser encarado como revisão de matérias estudadas noutra disciplina, dá a ideia geral do processo a seguir para a definição do integral de Ito no caso geral. A leitura é facultativa. Exercı́cio 5. Sejam (E, || · ||E ) e (F, || · ||F ) dois espaços de Banach, D ⊂ E uma parte densa de E e I uma aplicação de D em F linear e contı́nua. 1. Mostre que para z ∈ E existe (xn )n∈N sucessão de pontos de E convergente para z em E e que (I(xn ))n∈N é uma sucessão de Cauchy em F . ˜ := limn→+∞ I(xn ) e que a aplicação I˜ assim definida é uma extensão 2. Mostre que pode definir I(z) linear e contı́nua de I. Resolução: Aconselha-se o leitor a tentar trabalhar o exercı́cio antes de estudar esta resolução. 1. Seja (B(z, 1/n))n∈N∗ uma sucessão de bolas abertas centradas em z e de raio 1/n e, para cada n, escolha-se um ponto xn ∈ B(z, 1/n) ∩ D que, por ser D denso em E, existe certamente. A sucessão assim construı́da satisfaz o enunciado do exercı́cio dado que por ser I linear contı́nua se tem para n e m arbitrários: || I(xn ) − I(xm ) ||F ≤||| I ||| · || xn − xm ||E . MF0910 11 21 de Dezembro de 2009 Capı́tulo IV Integral Estocástico Secção: 2 Como a sucessão (xn )n∈N , por ser convergente é de Cauchy, a sucessão (I(xn ))n∈N também é. 2. Sejam (x1n )n∈N e (x2n )n∈N duas sucessões de pontos de D convergentes para z e I˜1 (z) := limn→+∞ I(x1n ) e I˜2 (z) := limm→+∞ I(x2m ) os respectivos limites. Observe-se que: || I˜1 (z) − I˜2 (z) ||F =|| I˜1 (z) − I(x1n ) + I(x1n ) − (I˜2 (z) − I(x2n ) + I(x2n )) ||F ≤ ≤|| I˜1 (z) − I(x1n ) ||F + || I˜2 (z) − I(x2n ) ||F + || I(x1n ) − I(x2n ) ||F . Como limn→+∞ || I˜1 (z) − I(x1n ) ||F = 0 e limn→+∞ || I˜2 (z) − I(x2n ) ||F = 0 e se tem que || I(x1n ) − I(x2n ) ||F ≤||| I ||| || x1n − x2n ||E ≤||| I ||| || x1n − z ||E + || z − x2n ||E , e se tem naturalmente que limn→+∞ || x1n − z ||E = 0 e limn→+∞ || z − x2n ||E = 0 fica demonstrado que I˜ está bem definida. Com efeito, a imagem de I˜ num dado ponto não depende da sucessão escolhida para a construir. Observe-se ainda que: ˜ ||F =|| lim I(xn ) ||F = || I(z) n→+∞ = lim || I(xn ) ||F ≤||| I ||| · n→+∞ lim || xn ||E = n→+∞ =||| I ||| · || z ||E , pelo que I˜ sendo limitada é contı́nua. ♦ 2.3 O teorema de Ito Considere-se, mais uma vez, G = (Gt )t≥0 uma filtração sobre um espaço de probabilidade completo (Ω, F, P). e B = (Bt )t≥0 um G processo browniano standard. Relembremos que, de acordo com o exercı́cio 2, B é um F processo browniano relativamente à sua filtração natural que é, por definição, Ft := σ({Bs : s ≤ t})∼ . MF0910 12 21 de Dezembro de 2009 Capı́tulo IV Integral Estocástico Secção: 2 Teorema 2 (Existência do Integral de Ito). Seja f ∈ N(F), e S, T ∈ R+ com S < T. 1. Existe (φfn )n∈N uma sucessão de funções G elementares tal que: Z T φfn (t, ω))2 dt (f (t, ω) − lim E n→+∞ =0. S RT 2. Existe I = IST (f ) = S f (t, ω)dBt (t, ω) uma variável aleatória pertencente a L2 (P), denominada integral de Ito de f relativamente ao processo browniano dada por: IST (f ) T Z T Z f (t, ω)dBt (ω) =L2 (P) lim = n→+∞ S S φfn (t, ω)dBt (ω) , tendo-se que I não depende da sucessão (φfn )n∈N . 3. Verifica-se ainda o resultado denominado isometria de Ito: Z T Z T 2 2 E ( f (t, ω)dBt (ω)) = E f (t, ω)dt . S (8) S Demonstração. Suponhamos demonstrada a alı́nea (1) do enunciado. Seja então (φfn )n∈N uma sucessão de funções G elementares tal que: lim || f − φfn ||L2 n→+∞ [S,T ] (λ⊗P) = 0. Seja, para cada n ∈ N, a variável aleatória em L2 (P) definida por Z T ψn := φn dBt . S Observe-se que a sucessão (ψn )n∈N é uma sucessão de Cauchy em L2 (P). Com efeito, por aplicação do resultado relativo à isometria de Ito (fórmula 6) na igualdade assinalada com o subı́ndice (a), tem-se que para m, n ∈ N: || ψn − ψm ||2L2 (P) Z T (φfn =|| − φfm )dBt S Z ||2L2 (P) = T =E (φfn − φfm )2 dt S Z E ( T (φfn − φfm )dBt )2 =(a) S =|| φfn − φfn ||2L2 [S,T ] (λ⊗P) . As hipóteses feitas sobre a sucessão (φfn )n∈N implicam que esta sucessão é de Cauchy em L2[S,T ] (λ ⊗ P) uma vez que é convergente neste espaço. Em consequência verifica-se que: lim m,n→+∞ MF0910 || ψn − ψm ||2L2 (P) = lim m,n→+∞ 13 || φfn − φfn ||2L2 [S,T ] (λ⊗P) = 0, 21 de Dezembro de 2009 Capı́tulo IV Integral Estocástico Secção: 2 pelo que a sucessão (ψn )n∈N é de Cauchy em L2 (P). Como este espaço é completo existe uma variável aleatória IST (f ) ∈ L2 (P) tal que a sucessão (ψn )n∈N converge para IST (f ) em L2 (P), isto é: lim || IST (f ) − ψn ||L2 (P) = 0 , n→+∞ ou ainda, tal como se anunciou no enunciado, " Z T φfn dt f dBt − lim E n→+∞ T Z 2 # =0. S S Para demonstrar a alı́nea 3 do enunciado basta observar que tendo: || IST (f ) ||L2 (P) =|| IST (f ) − ψn + ψn ||L2 (P) ≤|| IST (f ) − ψn ||L2 (P) + || ψn ||L2 (P) e que limn→+∞ || IST (f ) − ψn ||L2 (P) = 0 e, lim || ψn ||L2 (P) = lim || φn ||L2 n→+∞ n→+∞ f ||L2 (λ⊗P) , |≤|| f − φfn ||L2 (λ⊗P) , [S,T ] (λ⊗P) =|| [S,T ] uma vez que | || f ||L2 [S,T ] (λ⊗P) − || φfn ||L2 [S,T ] (λ⊗P) [S,T ] sai que: || IST (f ) ||L2 (P) ≤|| f ||L2 [S,T ] (λ⊗P) . Para a desigualdade em sentido contrário observe-se do mesmo modo que, || IST (f ) ||L2 (P) =|| IST (f ) − ψn + ψn ||L2 (P) ≥| || IST (f ) − ψn ||L2 (P) − || ψn ||L2 (P) | pelo que passando ao limite, com uma argumentação idêntica à já usada acima, se tem, || IST (f ) ||L2 (P) ≥|| f ||L2 [S,T ] (λ⊗P) . Exercı́cio 6. Inspirando-se no exercı́cio 5, mostre que a definição do integral estocástico de f na demonstração acima não depende da sucessão aproximante (φfn )n∈N de funções elementares. As propriedades do processo browniano utilizadas nas demonstrações acima mostram que é possı́vel uma primeira extensão da noção de integral estocástico a um espaço de processos ligeiramente mais geral. MF0910 14 21 de Dezembro de 2009 Capı́tulo IV Integral Estocástico Secção: 3 Definição 9. Seja (Ω, F, P) um espaço de probabilidade completo e seja B = (Bt )t≥0 um processo browniano standard sobre este espaço. Para S, T ∈ R+ , S < T e para H filtração sobre (Ω, F, P), o espaço O([S, T ], B, H) é o espaço dos processos estocásticos Ψ = (ψt )t∈R+ que verificam as quatro condições seguintes. 1. O processo browniano standard B é uma H martingala. 2. Os processos Ψ são mensuráveis relativamente à álgebra σ produto B([0, +∞) ⊗ F. 3. Os processos Ψ são adaptados relativamente a H = (Ht )t≥0 , isto é, são tais que ∀t ≥ 0, ψt ∈ mHt . 4. Os processos Ψ verificam a condição de integrabilidade local: Z T 2 E ψt dt < +∞ . (9) S Exercı́cio 7. Mostre que a construção do integral de Ito, que acabou de efectuar se mantem válida para o espaço O([S, T ], B, H) de processos estocásticos definido acima. Exercı́cio 8. Com as notações usadas no exercı́cio 4, supunha que Y = (Yt )t∈[0,+∞[ é um processo do espaço N(F). Mostre que ((Yen )t )t≥0 é uma sucessão aproximante de Y = (Yt )t∈[0,+∞[ . 3 Propriedades do Integral de Ito Uma primeira propriedade importante do integral de Ito verificada para processos suficientemente gerais é a de que o integral estocástico tem valor médio constante e nulo. Teorema 3. Seja F a filtração natural associado ao processo browniano usual. Seja N(F) o espaço dos processos localmente integráveis a relativamente à filtração F. Para f ∈ N(F) fixo, seja o processo (It )t≥0 dado para T > 0 por Z ∀t ∈ [0, T ] It := t fs dBs 0 Então E[It ] = 0. a MF0910 Segundo a definição 4. 15 21 de Dezembro de 2009 Capı́tulo IV Integral Estocástico Secção: 3 Demonstração. A prova decorre das propriedades do processo browniano. Consideremos primeiramente uma função elementar φn (t, ω) qualquer. T Z E +∞ X φn (t, ω)dBt (ω) = E ej (ω) (B(T ∧(j+1)2−n )∨(S∨j2−n ) − BS∨j2−n ) =(a) S = +∞ X j=0 E ej (ω) (B(T ∧(j+1)2−n )∨(S∨j2−n ) − BS∨j2−n ) =(b) j=0 = +∞ X E E ej (ω) (B(T ∧(j+1)2−n )∨(S∨j2−n ) − BS∨j2−n ) | FS∨j2−n =(c) j=0 = +∞ X E ej (ω)E (B(T ∧(j+1)2−n )∨(S∨j2−n ) − BS∨j2−n ) | FS∨j2−n =(d) j=0 = +∞ X E ej (ω)E (B(T ∧(j+1)2−n )∨(S∨j2−n ) − BS∨j2−n ) =(e) 0 . j=0 Com as justificações seguintes. (a) Apesar da indexação indicar o contrário, trata-se de uma soma finita pelo que a esperança da soma é a soma das esperanças sem necessidade de qualquer hipótese adicional. (b) Pela propriedade da tower law das esperanças condicionais. (c) Pelas propriedades da esperança condicional e dado que ej ∈ mFj2−n e, naturalmente, Fj2−n ⊆ FS∨j2−n (d) Uma vez que B(T ∧(j+1)2−n )∨(S∨j2−n ) − BS∨j2−n é independente de FS∨j2−n , pelas propriedades da esperança condicional. (e) Dado que consideramos um processo browniano os incrementos têm média nula. Para um processo f ∈ N(F) arbitrário, seja então (φfn )n∈N uma sucessão de funções G elementares tal que: lim || f − φfn ||L2 (λ⊗P) = 0 . n→+∞ [S,T ] o que implica de acordo com o teorema 2 que " Z 2 # Z t t lim E f dBs − φfn ds =0. n→+∞ 0 0 No caso de f ser um processo limitado o resultado segue imediatamente em consequência do teorema da convergência dominada de Lebesgue. No caso geral procede-se por truncatura. MF0910 16 21 de Dezembro de 2009 Capı́tulo IV Integral Estocástico Secção: 4 Uma das propriedades mais importantes do integral de Ito é a que assegura que um processo definido por um integral de Ito é modificável num processo com trajectórias contı́nuas. Esta propriedade é muito semelhante à propriedade de continuidade do integral de Riemann função do limite superior de integração. Teorema 4. Com as mesmas notações do teorema 3, (It )t≥0 é um processo que admite uma versão com trajectórias contı́nuas, isto é, existe (Jt )t≥0 tal que quase certamente em ω ∈ Ω, J· (ω)é uma função contı́nua (na variável t ∈ [0, T ]) e tal que: ∀t ∈ [0, T ] P [Jt = It ] = 1 . Demonstração. A demonstração deste teorema não é muito complicada embora seja tecnicamente exigente numa primeira aproximação. Uma segunda propriedade importantes do integral de Ito é a que descreve o carácter de martingala de um processo definido por um integral de Ito. Teorema 5. Com as mesmas notações do teorema anterior tem-se que (It )t≥0 é uma F-martingala e verifica-se por isso a desigualdade de Doob: " # Z T 1 2 fs ds . ∀λ > 0 ∀t ∈ [0, T ] P sup |It | ≥ λ ≤ 2 P λ 0≤t≤T 0 Demonstração. A demonstração deste resultado que reproduzimos seguidamente é simples e esclarecedora (veja-se [Itô][p. 186]). Seja T fixo qualquer. Seja (φfn )n∈N uma sucessão de funções elementares, de acordo com a alı́nea 1 do teorema 2, aproximante de f isto é tal que: lim f − φfn 2 =0. (10) n→+∞ L[0,T ] (λ⊗P) Rt Definindo os integrais estocásticos das funções aproximantes I(n)t := 0 (φfn )s dBs , temse pelo teorema da construção do integral de Ito 2.3 que para cada t fixo se verifica limn→+∞ kIt − I(n)t kL2 = 0. Pelas propriedades da esperança condicional tem-se, para P s > t fixos e para todo o n ≥ 1, que: E[Is | Ft ] = E[Is − I(n)s + I(n)s | Ft ] = E[Is − I(n)s | Ft ] + E[I(n)s | Ft ] = = E[Is − I(n)s | Ft ] + I(n)t . Uma vez que pelos teoremas de convergência da esperança condicional se verifica que limn→+∞ E[Is − I(n)s | Ft ] =L2 0 e que limn→+∞ I(n)t =L2 It , o resultado anunciado no P P teorema sai verificado. MF0910 17 21 de Dezembro de 2009 Capı́tulo IV Integral Estocástico Secção: 4 4 A fórmula de Ito Definição 10. Um processo estocástico (Xt )t≥0 é um processo de Ito se e só se admite uma representação na forma Z t Z t Xt = X0 + us ds + vs dBs 0 0 ou na representação diferencial usual: dXt = ut dt + vt dBt em que se tem que (vt )t≥0 ∈ N(F) e (ut )t≥0 é tal que para cada t se tem Z t P |us | ds < +∞ ∀t ≥ 0 = 1 . 0 Observação 6. Podem considerar-se como processos de Ito os processos em que se verifica apenas que: Z t P vs2 ds < +∞ ∀t ≥ 0 = 1 . 0 em vez da condição de integrabilidade local mais forte dada pela fórmula 9. O teorema seguinte mostra-nos como aplicar as regras do cálculo diferencial próprias à aproximação de Ito. Teorema 6 (Fórmula de Ito I). Seja (Xt )t≥0 um processo de Ito admitindo a representação dXt = ut dt + vt dBt Seja g ∈ C 2 ([0, +∞[×R) e para cada t ≥ 0, Yt := g(t, Xt ) . Então, para (Yt )t≥0 tem-se a denominada fórmula de Ito: dYt = ∂g ∂g 1 ∂2g (t, Xt )dt + (t, Xt )dXt + (t, Xt )(dXt )2 ∂t ∂x 2 ∂x2 (11) em que (dXt )2 = (ut dt + vt dBt )2 = vt2 dt com a tabela de multiplicação dada por dt · dt = dt · dBt = dBt · dt = 0 dBt · dBt = dt . (12) Observação 7. Pode observar-se que os primeiros dois termos da fórmula 11 correspondem à diferencial usual. Para além destes dois termos surge um termo inesperado de segunda ordem que resulta das propriedades especiais do processo browniano. MF0910 18 21 de Dezembro de 2009 Capı́tulo IV Integral Estocástico Secção: 5 Demonstração. Um esquema geral da demonstração da fórmula de Ito pode ser estudado na obra [Øksendal 98][p. 47]. As demonstrações rigorosas requerem o uso de técnicas de processos estocásticos maia avançadas. Corolário 1 (Fórmula de Ito II). Sob as hipóteses do teorema 6 tem-se ainda que (Yt )t≥0 admite a representação: 2 ∂g ∂g ∂g 21 ∂ g dYt = (t, Xt ) dt + vt (t, Xt )dBt (t, Xt ) + ut (t, Xt ) + vt (13) 2 ∂t ∂x 2 ∂x ∂x sendo por isso também um processo de Ito. Demonstração. A fórmula 13 resulta da fórmula 11 aplicando a tabela de multiplicação 12. Observação 8. Para aplicar a fórmula de Ito, quer na diferenciação quer na integração, deverá ter-se presente a seguinte metodologia geral. 1. Identificar exactamente o processo correspondente a (Xt )t≥0 através da sua representação diferencial, isto é, indicar os processos (ut )t≥0 e (vt )t≥0 . 2. Identificar a função g que verifica Yt = g(t, Xt ). 3. Procure que as escolhas do processo (Xt )t≥0 e da função g não compliquem muito os cálculos das derivadas parciais. Rt Exemplo 2. Determine-se 0 Bs dBs . Uma escolha natural é pôr: Xt = Bt e logo dXt = dBt e g(t, x) = (1/2)x2 . Ter-se-á Yt = (1/2)Bt2 donde resulta por aplicação da fórmula de Ito: Z t 1 1 2 1 dYt = Bt dBt + dt ⇔ Bt = Bs dBs + t . 2 2 2 0 Exemplo 3. Supondo que para t ≥ 0 se tem Yt = exp(σBt + µt) com µ ∈ R e σ ∈]o, +∞[, diferenciando o processo pode mostrar-se que se trata de um processo de Ito. Com efeito se for Xt = σBt + µt e logo dXt = σdBt + µdt e se g(t, x) = exp(x), tem-se pela fórmula de Ito que: 1 2 dYt = Yt σdBt + µ + σ dt 2 5 Outras aplicações da fórmula de Ito Nesta secção detalhamos algumas aplicações importantes da fórmula de Ito. 5.1 Cálculo de Esperanças Matemáticas A fórmula de Ito tem uma aplicação natural em Matemática Financeira quando se utiliza para o cálculo de valores esperados envolvendo o processo browniano (vejase [Björk 98][p. 40]). O método geral para determinar E[Y ] pode ser assim descrito. MF0910 19 21 de Dezembro de 2009 Capı́tulo IV Integral Estocástico Secção: 5 1. Representar Y sob a forma Y = Zt0 em que Z é um processo estocástico de Ito, segundo a definição 10. 2. Pela fórmula de Ito determinar os processos (µt )t≥0 e (σt )t≥0 tais que: t Z Z t σs dBs µs ds + Zt = z0 + 0 0 Rt 3. Pelo teorema 3 uma vez que E[ 0 σs dBs ] tem-se que Z E[Y ] = E[Zt0 ] = z0 + E t t Z µs ds = z0 + 0 E [µs ] ds 0 se o processo (µt )t≥0 for suficientemente regular. 4. Sob reserva de ser possı́vel calcular E[µs ] ter-se-á a resposta ao problema da determinação do valor esperado desejado. Alguns exercı́cios das aulas práticas tiram partido desta metodologia. 5.2 Difusões e Operadores Seja um processo de Ito (Xt )t≥0 dado na sua forma diferencial por: dXt = µ(Xt )dt + σ(Xt )dBt , sendo µ e σ funções reais de variável real regulares tais que o operador diferencial Lµ,σ = µ(x) d 1 d2 + σ 2 (x) 2 dx 2 dx está bem definido num espaço de funções não trivial 2 que denominaremos H. Definição 11. Uma função φ ∈ H é uma função própria do operador Lµ,σ se e só se ∃λ 6= 0 Lµ,σ (φ) = λφ (14) sendo λ o valor próprio associado à função própria φ. 2 Tipicamente será um subespaço do espaço das funções de quadrado integrável. MF0910 20 21 de Dezembro de 2009 Capı́tulo IV Integral Estocástico Secção: 6 Proposição 2. Seja o processo Yt := e−λt φ(Xt ), definido para t ≥ 0 em que φ é uma função própria de Lµ,σ . 1. Então (Yt )t>0 é um processo de Ito, mais concretamente, dYt = e−λt φ0 (Xt )σ(Xt )dBt . (15) 2. Sob a condição Z T ∀S, T ∈ [0, +∞[ E 2 φ (Xt )σ(Xt ) dt < +∞ , −λt 0 e S o processo (Yt )t>0 é uma martingala. Demonstração. A demonstração da fórmula 15 faz-se por aplicação imediata da fórmula de Ito usando a relação dada pela fórmula 14 . Observação 9. O problema da determinação das funções e valores próprios do operador Lµ,σ (φ) pode fazer-se usando a teoria de Sturm-Liouville. Com efeito, uma estratégia geral para colocar a equação diferencial 1 µ(x)y 0 (x) + σ 2 (x)y 00 = λy 2 na forma de um operador de Sturm-Liouville consiste em dividir a equação por σ 2 (x)/2, Rx 2 (t)dt 2µ(t)/σ multiplicando pelo factor integrante p(x) := e e efectuar as operações de forma a colocar a equação na forma: d d p(x) y(x) + (q(x) − λρ(x))y(x) = 0 , dx dx (com q(x) = 0) e ρ(x) = (2/σ 2 (x))p(x)) forma esta que pode ser tratada usando a teoria geral dos operadores de Sturm-Liouville (veja-se por exemplo, [Zettl 05]). 6 Sobre as referências bibliográficas O leitor poderá tirar enorme proveito da consulta das referências bibliográficas clássicas sobre o integral estocástico. O estudo do cálculo estocástico em toda a profundidade requer algum domı́nio da teoria moderna dos processos estocásticos, em particular, do processo browniano. Apresentamos seguidamente alguns comentários sobre a bibliografia referida com vista a encorajar leituras adicionais. 1. [Björk 98] mostra o que é preciso saber de cálculo estocástico para entender a matemática financeira moderna. 2. [Øksendal 98] é a leitura recomendada para uma primeira aproximação. MF0910 21 21 de Dezembro de 2009 Capı́tulo IV Integral Estocástico Secção: 7 3. [Karatzas 91] é recomendado para um estudo completo e profundo. 4. [Lamberton 96] é uma aproximação expedita e eficaz para quem pretende utilizar o cálculo estocástico na matemática financeira. a secção sobre as equações diferenciais estocásticas é particularmente recomendada. 5. [Chung et al 90] e [Protter 90] são adequados para quem deseje uma aproximação mais geral à integração estocástica. 6. [Durrett 96] estabelece a ligação às equações nas derivadas parciais. 7. [Klebaner 98] tem aplicações do cálculo estocástico à Biologia e à Engenharia e à Fı́sica. 7 Exercı́cios 7.1 Generalidades Exercı́cio 9. Sendo W = (Wt )t≥0 o processo de Wiener, mostre que: ˆ ˜ 1. E [Wt ] = 0, E Wt2 = t, ∀t ≥ 0. 2. E [Wt Ws ] = min(t, s), ∀t, s ≥ 0. ˆ ˜ 3. E (Wt − Ws )2 = t − s, t ≥ s. ft = Wt0 +t − Wt0 Exercı́cio 10. Sejam W = (Wt )t≥0 o processo de Wiener e t0 ≥ 0 fixo. Prove que W é um processo de Wiener. Exercı́cio 11. Seja Bt um processo de Wiener em R tal que B0 = 0 1. Mostre, usando propriedades conhecidas, que: 1 ∀u ∈ R E[eiuBt ] = exp(− u2 t) . 2 2. Usando o desenvolvimento de Taylor da função exponencial nos dois membros da igualdade acima, compare os termos com a mesma potência em u e deduza que: E[Bt4 ] = 3t2 e, mais geralmente que: ∀k ∈ N E[Bt2k ] = (2k)! k t . 2k k! 3. Uma outra justificação do resultado anterior é a seguinte. Mostre que: Z 1 x2 E[f (Bt )] = √ f (x) exp(− )dx , 2t 2πt R para todas as funções f tais que o integral à direita converge. Aplique então este resultado à função f (x) = x2k e use integração por partes e indução em k. MF0910 22 21 de Dezembro de 2009 Capı́tulo IV Integral Estocástico Secção: 7 7.2 Integral de Ito, Tempos de Paragem e Martingalas Exercı́cio 12. Mostre que com Bt o processo browniano e considerando B0 = 0. Então Z t 1 1 Bs dBs = Bt2 − t. 2 2 0 Exercı́cio 13. Mostre directamente usando a definição do integral de Ito que: Z t Z t sdBs = tBt − Bs ds . 0 0 Indicação: Considere que B0 = 0 e que: X X X ∆(sj Bj ) = sj ∆(Bj ) + Bj+1 ∆(sj ) . j j j Exercı́cio 14. Mostre directamente usando a definição do integral de Ito que: Z t Z t 1 Bs2 dBs = Bt3 − Bs ds . 3 0 0 Indicação: Considere que B0 = 0. Exercı́cio 15. Seja X = (Xt )t∈[0,+∞[ um processo estocástico e seja HtX = Ht para t ∈ [0, +∞[, a σ-álgebra gerada pela famı́lia de variáveis aleatórias {Xt : 0 ≤ s ≤ t}. Isto é, HX = (Ht )t∈[0,+∞[ é a filtração associada ao processo estocástico X. 1. Mostre que se X é uma martingala relativamente a uma dada filtração N = (Nt )t∈[0,+∞[ então X é também uma martingala relativamente à filtração que lhe está associada HX . 2. Mostre que se X é uma martingala relativamente a HX então: ∀t ∈ [0, +∞[ E[Xt ] = E[X0 ] . Exercı́cio 16. Mostre que o processo de Wiener W = (Wt )t≥0 é uma martingala com respeito à filtração Ft = σ ({Ws ; s ≤ t}) . Exercı́cio 17. Verifique quais os processos seguintes são ou não martingalas: 1. Xt = Bt + 4t , 2. Xt = Bt2 , 3. Xt = t2 Bt − 2 Z t sBs ds , 0 4. Xt = Bti × Btii , onde Bti e Btii são processos brownianos independentes. Exercı́cio 18. Mostre directamente que: Mt = Bt2 − t , é uma martingala relativamente à filtração do processo browniano. MF0910 23 21 de Dezembro de 2009 Capı́tulo IV Integral Estocástico Secção: 7 Exercı́cio 19. Mostre que: Mt = Bt3 − 3tBt , é uma martingala relativamente à filtração do processo browniano. Exercı́cio 20. Seja ∆ = {s(1), s(2), . . . s(n)} uma subdivisão do intervalo [t, u] em R+ isto é, tal que: t = s(1) < s(2) < · · · < s(n) = u. Seja δ(∆) o passo da subdivisão ∆ definido por: δ(∆) = |s(i + 1) − s(i)| . sup 1≤i≤n−1 Seja r2 (∆) a variação quadrática do processo browniano em ∆ dada por: r2 (∆) = n−1 X (Bs(i+1) − Bs(i) )2 . i=1 Seja r1 (∆) a variação (simples) do processo browniano em ∆ dada por: r1 (∆) = n−1 X |Bs(i+1) − Bs(i) | . i=1 1. Mostre que E[r2 (∆)] = u − t . P 2 2 2. Mostre que E[(r2 (∆))2 ] = 2 n−1 i=1 (s(i + 1) − s(i)) + (u − t) . Indicações: Poderá usar que: • E[(Bs(i+1) − Bs(i) )4 ] = 3(s(i + 1) − s(i))2 . • Os incrementos do processo browniano são independentes. 3. Mostre que E[(r2 (∆) − (u − t))2 ] = E[(r2 (∆))2 ] − (u − t)2 e conclua que em L2 (P): lim r2 (∆) = u − t . δ(∆)→0 4. Mostre que existe uma sucessão de partições (∆n )n∈N tal que, salvo talvez num conjunnto de probabilidade nula: lim r2 (∆n ) = u − t . n→+∞ 2 Indicação: A convergência em L (P) implica a existência de uma sucessão convergente salvo talvez num conjunnto de probabilidade nula. 5. Mostre que se ∆n = {s(1, n), s(2, n), . . . s(k(n), n)} com u = s(1, n) < · · · < s(k(n), n) = t então: k(n) sup r1 (∆) ≥ ∆ X Pk(n) |Bs(i+1,n) − Bs(i,n) | ≥ i=1 |Bs(i+1,n) − Bs(i,n) |2 . sup1≤i≤k(n) |Bs(i+1,n) − Bs(i,n) | i=1 6. Conclua que salvo talvez num conjunto de probabilidade nula: sup r1 (∆) = sup ∆ ∆ n−1 X |Bs(i+1) − Bs(i) | = +∞ . i=1 Exercı́cio 21. Mostre que qualquer função constante não negativa é um stopping time. Exercı́cio 22. Mostre que se T é um stopping time de (Ft )t≥0 então para ∀t ≥ 0{T < t} ∈ Ft . MF0910 24 21 de Dezembro de 2009 Capı́tulo IV Integral Estocástico Secção: 7 Exercı́cio 23. Se T é um stopping time e a > 0 uma constante então T + a é um stopping time. Exercı́cio 24. Mostre que se T e S são stopping times então também o são T ∧ S e T ∨ S. Exercı́cio 25. Prove que FT é uma σ−álgebra e que T é FT −mensurável. Mostre que se ∀ω ∈ Ω T (ω) = a para a ≥ 0 constante, então FT = Fa Exercı́cio 26. Mostre que para quaisquer dois stopping times T e S e para qualquer A ∈ FS , temos A ∩ {S ≤ T } ∈ FT . Em particular, se S ≤ T em Ω então FS ⊆ FT . Exercı́cio 27. Dados S e T stopping times. Mostre que FT ∧S = FT ∩ FS . Exercı́cio 28. Sejam Bt o processo browniano, ∆tk = tk+1 − tk e ∆Bk = Btk+1 − Btk com 0 = t0 < t1 < . . . < tn = t. Mostre que !2 # " n n X X E (∆Bk )2 − t =2 (∆tk )2 k=1 k=1 e conclua que n X (∆Bk )2 → t quando ∆tk → 0 (n → ∞) k=1 em L . 2 7.3 Fórmula de Ito Exercı́cio 29. Use a fórmula de Ito para escrever os seguintes processos estocásticos na forma diferencial habitual: dXt = u(t, ω)dt + v(t, ω)dBt . 1. Xt = (Bt )2 . 2. Xt = 2 + t + exp(Bt ). Exercı́cio 30. Use a fórmula de Ito para demonstrar que: Z t Z t 1 Bs2 dBs = Bt3 − Bt ds, B0 = 0. 3 0 0 Exercı́cio 31. Sejam Xt e Yt dois processos de Ito dados na forma diferencial habitual por: dXt = σ(t, ω)dt + µ(t, ω)dBt , dYt = ρ(t, ω)dt + ν(t, ω)dBt . Mostre usando a fórmula de Ito e o facto Xt Yt = 1 ((Xt + Yt )2 − Xt2 − Yt2 ) , 2 que: d(Xt Yt ) = Xt dYt + Yt dXt + µ(t, ω)ν(t, ω)dt . MF0910 25 21 de Dezembro de 2009 Capı́tulo IV Integral Estocástico Secção: 7 Exercı́cio 32. Sejam Xt e Yt dois processos de Ito. Mostre que d(Xt Yt ) = Xt dYt + Yt dXt + dXt dYt e conclua com a seguinte fórmula de integração por partes: Z t Z t Z Xs dYs = Xt Yt − X0 Y0 − Ys dXs − 0 0 t dXs dYs . 0 Exercı́cio 33. Seja θ(t, ω) ∈ N([0, T ]) onde N([0, T ]) é o espaço das funções integrandas para as quais o integral de Ito foi definido inicialmente. Seja para t ∈ [0, T ]: Z t Z 1 t 2 θ(s, ω)dBs − Zt = exp( θ (s, ω)ds) . 2 0 0 1. Use a fórmula de Ito para mostrar que dZt = Zt θ(t, ω)dBt . 2. Conclua que Zt é uma martingala para t ∈ [0, T ] se se verificar que Zt θ(t, ω) ∈ N([0, T ]). Exercı́cio 34. 1. Para c e α constantes seja Xt = exp(ct + αBt ). Mostre que: dXt = (c + 1 2 α )Xt dt + αXt dBt . 2 2. Para c e α1 , . . . , αn constantes e (Bti )i∈{1,...,n} famı́lia de n processos brownianos independentes seja: n X Xt = exp(ct + αi Bti ) i=1 Mostre que: dXt = (c + n n X 1X 2 αi )Xt dt + Xt ( αi dBti ) . 2 i=1 i=1 Exercı́cio 35. Seja Xt um integral de Ito dXt = v(t, ω)dBt . 1. Dê um exemplo que mostre que Xt2 não é em geral uma martingala. 2. Mostre que Mt = Xt2 − Z t |v(s, ω)|2 ds , 0 é uma martingala. Exercı́cio 36. Sejam Bt1 e Bt2 dois processos brownianos independentes. Escreva na forma diferencial o processo bidimensional definido por: ` ´ ` ´ Zt = Zt1 , Zt2 = Bt1 Bt2 , exp(Bt1 )Bt2 . Exercı́cio 37. Suponha-se que Xt satisfaz a equação dXt = αXt dt + σXt dWt e que Yt satisfaz a equação dYt = γYt dt + δYt dVt , onde V é um processo de Wiener independente de W . Defina-se Z por Z = XY e obtenha o desenvolvimento diferencial de Z. Nota: Se X descreve o processo do preço de uma acção da IBM em dólares e Y a taxa de conversão escudos/dólares então Z descreve a dinamica do preço da acção da IBM em escudos. MF0910 26 21 de Dezembro de 2009 Capı́tulo IV Integral Estocástico Secção: 7 Exercı́cio 38. Seja Xt o processo solução da equação: dXt = (αXt + β) dt + (σXt + ρ) dWt X0 =0 ` ´ Façamos St = exp( α − σ 2 /2 t + σWt ). 1. Escreva a equação diferencial que St−1 satisfaz. ` ´ 2. Prove que d Xt St−1 = St−1 ((β − σρ)dt + ρdWt ). 3. Obtenha a representação explicita de Xt . Exercı́cio 39. O processo de Ornstein-Ulhenbeck é a solução da equação: dXt = −cXt dt + σdBt X0 = x0 1. Mostre que Xt = x0 e−ct + σe−ct Rt 0 ecs dBs . 2. Calcule E [Xt ] e V [Xt ]. Indicação: Aplique a fórmula de Ito à função f (t, Xt ) = Xt exp(ct). Exercı́cio 40. O movimento browniano geométrico é a solução da equação: dXt = αXt dt + σXt dWt X0 = x0 “ ” 2 1. Mostre que Xt = x0 exp( α − σ2 t + σWt ). 2. Mostre que E [Xt ] = x0 exp(αt). Indicação: Aplique a fórmula de Ito à função f (t, Xt ) = ln(Xt ). Exercı́cio 41. Mostre que o processo exp(Wt − (1/2)t) é a solução da equação: dXt = Xt dWt X0 =1 Indicação: Aplique a fórmula de Ito à função f (t, x) = exp(x − (1/2)t). Exercı́cio 42. Mostre que o processo exp(2Wt − t) é a solução da equação: dXt = Xt dt + 2Xt dWt X0 =1 Indicação: Aplique a fórmula de Ito a uma função f (t, x) escolhida adequadamente. Exercı́cio 43. Suponha que o processo Xt é a solução da equação: dXt = αXt dt + σXt dWt X0 =1 Considere o processo Yt = Xtβ . Determine a equação diferencial estocástica satisfeita por Yt . MF0910 27 21 de Dezembro de 2009 Capı́tulo IV Integral Estocástico Secção: 7 7.4 O Modelo de Black-Scholes Exercı́cio 44 (Paridade put-call). Considere uma carteira contendo três posições relativas ao mesmo activo, nomeadamente uma acção com o preço S, uma opção put com valor Vp e uma posição curta numa opção call com valor Vc . 1. Admitindo que ambas as opções têm a mesma data de exercı́cio T , que não há dividendos, que o mercado é livre de arbitragem e que não há custos de transacção mostre directamente que: ∀t ∈ [0, T ] S + Vp − Vc = KE −r(T −t) em que K é o preço de exercı́cio (strike price) e r é a taxa de juro sem risco. 2. Mostre usando as fórmulas de Black-Scholes para as opções put e call que a fórmula da paridade put-call é satisfeita. Exercı́cio 45 (Volatilidade implı́cita). Considere a fórmula de apreçamento de Black-Scholes para um derivado X representada na forma Π(t, X) = f (St , t, T, K, r, σ) com as notações habituais. Suponha que para uma certa escolha St , t, T, K, r conhece Π(t, X). 1. Mostre que é possı́vel determinar σ = σ((St , t, T, K, r) de forma a que se verifique a fórmula de Black-Scholes. 2. Considere t, T, r fixos. Usando dados reais para, pelo menos, dois activos distintos do mesmo mercado, para pelo menos cinco valores distintos de K e para os correspondentes preços dos activos determine as volatilidades σ = σ((St , t, T, K, r) de forma a que se verifique a fórmula de Black-Scholes. 3. Represente graficamente, para cada activo, σ em função de K e compare os gráficos entre si e com as hipóteses que assumiu no modelo dede Black-Scholes. Exercı́cio 46. Considere que no modelo de Black-Scholes a evolução dos preços dos activos é dada pelas equações: dSt = µSt dt + σSt dBt , dβt = rβt dt onde (Bt )t∈R+ é um processo browniano usual. 1- Mostre que: (2.1) St+∆t = St exp(σ(Bt+∆t − Bt ) + (µ − 12 σ 2 )∆t) e conclua que os retornos logarı́tmicos do activo em questão são normais com média e variância definidas. 2- Usando a fórmula (2.1) mostre que: µ− E[ln(St+∆t /St )] 1 2 σ = , 2 ∆t σ2 = V[ln(St+∆t /St )] ∆t onde E[X] e V[X] representam a média e a variância da variável aleatória X. 3- Considere os seguintes dados para a evolução dos preços (St )t∈{0,...,11} em que os preços são dados mensalmente. t St t St 0 6 900 6 6 021 1 6 710 7 5 536 2 6 535 8 5 419 3 6 281 9 5 641 4 6 232 10 5 380 5 6 098 11 5 216 Determine µ e σ. 4- Determine o preço de uma call option europeia, no instante t = 11 sobre o activo representado por St , com taxa nominal de 3,6% ao ano, maturidade de 3 meses e preço de Execı́cio de 5 500. MF0910 28 21 de Dezembro de 2009 Capı́tulo IV Integral Estocástico Secção: 7 Exercı́cio 47. Para c e α constantes, seja Xt = exp (ct + αBt ). Use a fórmula de Ito para mostrar que « „ 1 dXt = c + α2 Xt dt + αXt dBt 2 Exercı́cio 48. Considere que no modelo de Black-Scholes a evolução dos preços dos activos é dada pelas equações: dSt = µSt dt + σSt dBt , dβt = rβt dt onde (Bt )t∈R+ é um processo browniano usual. 1- Mostre que: (2.1) St+∆t = St exp(σ(Bt+∆t − Bt ) + (µ − 12 σ 2 )∆t) e conclua que os retornos logarı́tmicos do activo em questão são normais com média e variância definidas. 2- Usando a fórmula (2.1) mostre que: µ− E[ln(St+∆t /St )] 1 2 σ = , 2 ∆t σ2 = V[ln(St+∆t /St )] ∆t onde E[X] e V[X] representam a média e a variância da variável aleatória X. 3- Considere os seguintes dados para a evolução dos preços (St )t∈{0,...,13} em que os preços são dados mensalmente. t St t St 0 3 478 6 4 065 1 3 587 7 4 154 2 3 760 8 4 187 3 3 613 9 4 357 4 3 690 10 4 473 5 4 014 11 4 600 Determine µ e σ. 4- Determine o preço de uma put option europeia, no instante t = 11 sobre o activo representado por St , com taxa nominal de 3,6% ao ano, maturidade de 4 meses e preço de Execı́cio de 4 500. Exercı́cio 49. Considere que no modelo de Black-Scholes a evolução dos preços dos activos é dada pelas equações: dSt = µSt dt + σSt dBt , dβt = rβt dt onde (Bt )t∈R+ é um processo browniano usual. 1- Mostre que: (2.1) St+∆t = St exp(σ(Bt+∆t − Bt ) + (µ − 12 σ 2 )∆t) e conclua que os retornos logarı́tmicos do activo em questão são normais com média e variância definidas. 2- Usando a fórmula (2.1) mostre que: µ− E[ln(St+∆t /St )] 1 2 σ = , 2 ∆t σ2 = V[ln(St+∆t /St )] ∆t onde E[X] e V[X] representam a média e a variância da variável aleatória X. 3- Considere os seguintes dados para a evolução dos preços (St )t∈{0,...,13} em que os preços são dados mensalmente. t St t St MF0910 0 6 900 6 6 021 1 6 710 7 5 536 2 6 535 8 5 419 29 3 6 281 9 5 641 4 6 232 10 5 380 5 6 098 11 5 216 21 de Dezembro de 2009 Capı́tulo IV Integral Estocástico Secção: 7 Determine µ e σ. 4- Usando a fórmula de Black-Scholes determine uma volatilidade implı́cita para a qual a fórmula de apreçamento de uma Call Option europeia dá um preço de 4, dado que o preço do activo subjacente é 45, o preço de Execı́cio é 50, a taxa de juro sem risco mensal é 0.4% e que a maturidade é 3 meses. Sugestão: Poderá usar uma interpolação linear. Referências [Bass 1995] Bass, R. F. (1995 )Probabilistic Techniques in Analysis. Springer Verlag. [Bass 1998] Bass, R. F. (1998) Diffusions and Elliptic Operators. Springer Verlag. [Bertoin] Bertoin, J. (1996) Lévy Processes. Cambridge University Press. [Björk 98] Björk, T. (1998), Arbitrage Theory in Continuous Time, Oxford University Press. [Brzeźniak] Brzeźniak, Z.; Zastawniak, T. (1999) Basic Stochastic Processes. Springer Verlag. [Chung et al 90] Chung, K. L.; Williams R. J. (1990) Introduction to Stochastic Integration. Second Edition, Birkhäuser. [Dacunha-Castelle (I)] Dacunha-Castelle, D.; Duflo, M. (1983) Probabilités et Statistiques. Volume I, Masson. [Dacunha-Castelle (II)] Dacunha-Castelle, D.; Duflo, M. (1983) Probabilités et Statistiques. Volume II, Masson. [Durrett 96] Durrett, R. (1996) Stochastic Calculus. CRC Press. [Itô] Itô, K. (1961) Lectures on Stochastic Processes. Tata Institute of Fundamental Research Bombay. [Karatzas 91] Karatzas, I.; Shreve, S. E. (1991) Brownian Motion and Stochastic Calculus. Second Edition, Springer Verlag. [Klebaner 98] Klebaner, F. C. (1998) Introduction to Stochastic Calculus with Applications. Imperial College Press. [Lamberton 96] Lamberton, D.; Lapeyre, B. (1996) Introduction to Stochastic Calculus Applied to Finance. Chapman & Hall. [Øksendal 98] Øksendal, B. (1998) Stochastic Differential Equations. Fifth edition, Springer. [Protter 90] Protter, P. (1990) Stochastic Integration and Differential Equations. Springer Verlag. [Shiryaev] Shiryaev, A. N. (1999) Essentials of Stochastic Finance, World Scientific. MF0910 30 21 de Dezembro de 2009 Capı́tulo IV Integral Estocástico Secção: 7 [Williams] Williams, D. (1991) Probability with Martingales. Cambridge University Press. [Zettl 05] Zettl, A. (2005) Sturm-Liouville Theory, American Mathematical Society. MF0910 31 21 de Dezembro de 2009 NOTAS DE LIÇÕES PARA TEORIA DO INVESTIMENTO MODELO DE BLACK-SCHOLES E APREÇAMENTO 1. Notações Seja (Ω, F, P) um espaço de probabilidade, G = (Gt )t∈R+ uma filtração sobre este espaço de probabilidade. Definição 1. O processo B = (Bt )t∈R+ é um G processo browniano se e só se: (1) B é G adaptado, isto é: ∀t ∈ R+ Bt ∈ mGt ; (2) Os incrementos de B são G independentes, isto é: i ∀s, t ∈ R+ s ≤ t ⇐ (Bt − Bs ) ↔ Gs ; (3) Os incrementos de B são estacionários (têm a mesma lei), isto é: ∀s, t ∈ R+ s ≤ t ⇐ L(Bt − Bs ) ≡ L(Bt+s − B0 ) . Definição 2. F = (Ft )t∈R+ , a filtração natural associada ao processo browniano B é, por definição: ∀t ∈ R+ Ft := σ({Bs : s ≤ t})∼ . Exercı́cio 1. Mostre que se B é um G processo browniano então B é um F processo browniano, isto é, B é um processo browniano relativamente à sua filtração natural F. Relembramos seguidamente as definições de dois espaços de processos relevantes para o integral estocástico Definição 3. Para T ∈ R+ e para H filtração, o espaço N([0, T ], H) é o espaço dos processos estocásticos (φt )t∈R+ que são H adaptados tais que: Z T 2 E φt dt < +∞ . 0 Por definição temos ainda : N(H) := \ N([0, T ], H) . T ∈R∗+ Observação 1. É sabido que o integral estocástico relativamente ao processo B de um processo no espaço N(G) é uma martingala contı́nua1. Se as hipóteses forem enfraquecidas temos um outro espaço útil. 1Veja-se, por exemplo [7][p. 33], [4][p. 38]. 1 2 MODELO DE BLACK-SCHOLES E APREÇAMENTO Definição 4. Para T ∈ R+ e para H filtração, o espaço M([0, T ], H) é o espaço dos processos estocásticos (ψt )t∈R+ que são H adaptados tais que: Z T 2 P ψt dt < +∞ = 1 . 0 Por definição temos ainda : \ M(H) := M([0, T ], H) . T ∈R∗+ Observação 2. Em contraste com o que se afirmou na observação 1, o integral estocástico relativamente ao processo B, considerado como G processo browniano, de um processo no espaço M(G) não é, em geral, uma martingala, mas apenas uma martingala local contı́nua2. Por razões que se prendem com o carácter técnico das definições não estudaremos a noção de martingala local. 2. O modelo de mercado segundo Black-Scholes Supomos dado um activo sem risco cujo preço se encontra especificado pela dinâmica dβt = rβt dt , β0 = 1 e um activo com risco cujo preço é a solução da seguinte EDE: dSt = µSt dt + σSt dBt , S0 ∈ R+ , em que r, µ e σ são parâmetros do modelo. 3. Carteiras Definição 5. Uma carteira Φ = (φ1 , φ2 ) é um processo estocástico com valores em R2 tal que φ1 = (φ1t )t∈R+ ∈ W(F) e tal que o processo φ2 = (φ2t )t∈R+ é F adaptado e verifica ainda: Z T ∗ 1 2 ∀T ∈ R+ P (φt ) dt < +∞ = 1 . 0 Definição 6. Sendo Φ uma carteira, V (Φ), o processo valor desta carteira é dado por: ∀t ∈ R+ Vt (Φ) = φ1 St + φ2 βt . Definição 7. A carteira Φ é autofinanciada se e só se se verificar: ∀t ∈ R+ dVt (Φ) = φ1 dSt + φ2 dβt . 4. Medidas de Martingala Definição 8. Uma medida de probabilidade Q sobre (Ω, F) diz-se equivalente à medida de probabilidade P (o que se representa por P ∼ Q) se e só se: ∀F ∈ F P[F ] = 0 ⇔ Q[F ] = 0 Exercı́cio 2. Seja g ∈ mF tal que g > 0 e Qg definida por: Z ∀F ∈ F Qg [F ] := g(ω)dP(ω) . F Mostre que P ∼ Qg . 2Veja-se, por exemplo [5][p. 116]. NOTAS DE LIÇÕES PARA TEORIA DO INVESTIMENTO 3 Exercı́cio 3. Mostre, utilizando o teorema de Radon-Nicodym que duas probabilidades P e Q são equivalentes se e só se existe g ∈ mF tal que g > 0, verificando, por exemplo: Z g(ω)dP(ω) . ∀F ∈ F Q[F ] := F O processo de preços descontados S∗ = (St∗ )t∈R+ é definido por: St . βt O processo valor descontado, V ∗ (Φ) = (Vt∗ (Φ))t∈R+ , de uma dada carteira Φ, é definido por: Vt (Φ) ∀t ∈ R+ Vt∗ (Φ) := . βt ∀t ∈ R+ St∗ := Definição 9. Uma medida de probabilidade Q, equivalente a P diz-se uma medida de martingala para o processo de preços (MMP) se e só se o processo S ∗ é uma F martingala para a probabilidade Q. Exercı́cio 4. Mostre, utilizando o teorema de representação de martingalas3 que Q é MMP se e só se existir B Q = (BtQ )t∈R+ um processo browniano relativamente à probabilidade Q e um processo (ht )t∈R+ ∈ N(Ω, F, Q) tal que: Z t ∗ ∗ ∀t ∈ R+ St = S0 + hu dBuQ . 0 Definição 10. Uma medida de probabilidade Q, equivalente a P diz-se uma medida de martingala generalizada para o processo de preços (MMgP)4 se e só se existir B Q = (BtQ )t∈R+ um processo browniano relativamente à probabilidade Q e um processo (ht )t∈R+ ∈ W(Ω, F, Q) tal que: Z t ∗ ∗ ∀t ∈ R+ St = S0 + hu dBuQ . 0 Definição 11. Uma medida de probabilidade Q, equivalente a P diz-se uma medida de martingala para o mercado spot (MMM) se e só se, para qualquer carteira autofinanciada, o processo V ∗ (Φ) é uma F martingala para a probabilidade Q. Exercı́cio 5. Mostre, utilizando o teorema de representação de martingalas 5 que Q é MMM se e só se existir B Q = (BtQ )t∈R+ um processo browniano relativamente à probabilidade Q e um processo (gt )t∈R+ ∈ N(Ω, F, Q) tal que: Z t ∀t ∈ R+ Vt∗ (Φ) = V0∗ (Φ) + gu dBuQ . 0 Definição 12. Uma medida de probabilidade Q, equivalente a P diz-se uma medida de martingala generalizada para o mercado spot (MMgM) se e só se, para qualquer carteira autofinanciada, existir B Q = (BtQ )t∈R+ um processo browniano relativamente à probabilidade Q e um processo (gt )t∈R+ ∈ W(Ω, F, Q) tal que: Z t ∗ ∗ ∀t ∈ R+ Vt (Φ) = V0 (Φ) + gu dBuQ . 0 3Veja-se, por exemplo, [3][p. 187]. 4Veja-se como justificação [2][p. 303], [3][p. 188] ou [8][p. 200]. 5Veja-se para este teorema, por exemplo, [5][pgs. 171 e 177] 4 MODELO DE BLACK-SCHOLES E APREÇAMENTO Teorema 1. Mostre que uma medida de probabilidade Q, equivalente a P é MMP (respectivamente MMgP) se e só se for MMM (respectivamente MMgM). Demonstração. Mostre-se primeiramente, usando a fórmula de Ito, que: dVt∗ (Φ) = φ1t dSt∗ . (1) A conclusão segue a partir das definições. Com efeito, uma aplicação do exercı́cio 6 mostra-nos que: 1 1 1 1 ∗ dVt (Φ) = d Vt (Φ) × = × dVt (Φ) + Vt (Φ) × d( ) + d( ) × dVt (Φ) . βt βt βt βt Pela fórmula de Ito, observamos que com g(t, x) = 1/x e Yt = g(t, βt ) se tem que: dYt = d( 1 ∂g −1 −r ∂g 1 ∂2g )= (t, βt )(dβt )2 = 2 rβt dt = dt , (t, βt )dt + (t, βt )dβt + 2 βt ∂t ∂x 2 ∂x βt βt uma vez que ∂g (t, βt ) = 0 = (dβt )2 . ∂t Por outro lado como a carteira é autofinanciada temos que: 1 1 1 −r φ1t dSt + φ2t dβt e d( ) × dVt (Φ) = ( dt) × φ1t dSt + φ2t dβt = 0 . × dVt (Φ) = βt βt βt βt Em consequência temos que: 1 −r dVt∗ (Φ) = φ1t dSt + φ2t dβt + φ1t St + φ2t βt × ( dt) = βt βt −rS dS t t +( dt) = φ1t dSt∗ , = φ1t βt βt observando que pelo exercı́cio já referido acima se tem que: 1 dSt −rSt ∗ dSt = d St × = +( dt) . βt βt βt Exercı́cio 6 (Fórmula de integração por partes). Sejam Xt e Yt dois processos de Ito admitindo as representações dXt = ut dt + vt dBt e dYt = rt dt + st dBt . Mostre, por aplicação da fórmula de Ito a (Xt + Yt )2 Xt2 e a Yt2 , que: d (Xt Yt ) = Xt dYt + Yt dXt + dhXY it , onde por convenção: dhXY it = vt st dt . Exercı́cio 7. Mostre que se for St∗ = St /βt e se dSt = µSt dt+σSt dBt , com µ ∈ R e σ ∈ R∗+ então: ∗ ∗ µ−r (2) dSt = σSt dt + dBt σ Teorema 2 (Girsanov). Seja (Ω, F, P) um espaço de probabilidade e (Bt )t∈R+ um processo browniano neste espaço. Seja F = (Ft )t∈R+ a filtração naturalmente associada ao processo browniano. Seja (γt )t∈[0,T ] um processo estocástico adaptado verificando: Z 1 T 2 P exp( γ dt) < +∞ = 1 2 0 t NOTAS DE LIÇÕES PARA TEORIA DO INVESTIMENTO e tal que o processo (Lt )t∈[0,T ] dado por: Z Lt = exp − T 0 1 γt dBt − 2 Z T γt2 5 dt 0 seja uma martingala. Existe então uma medida de probabilidade única Q tal que: (1) Q ∼ P (2) A medida Q admite a seguinte representação: Z T Z 1 T 2 γ dt dP dQ = Lt dP = exp − γt dBt − 2 0 t 0 (3) O processo definido por dBtQ = γt dt + dBt é um processo browniano em relação ao espaço (Ω, F, Q). Observação 3. Uma condição suficiente para que o processo (Lt )t∈[0,T ] definido acima seja uma martingala é a chamada condição de Novikov: Z 1 T 2 EP exp( γt dt) < +∞ 2 0 Os exercı́cios seguintes retirados de [4][p. 76], têm por objectivo demonstrar o teorema de Girsanov no caso de uma mudança para um drift (γt )t∈[0,T ] constante. Exercı́cio 8 (Questão preliminar). Seja X uma variável aleatória real. Mostre que que X é independente de uma dada σ álgebra B se e só se: ∀u ∈ R E eiuX | B = E eiuX q. c. Exercı́cio 9 (Teorema de Girsanov: caso particular). Considere as notações do teorema 2. Seja µ um número real e seja o processo (Lt )t∈[0,T ] definido por (Lt = exp −µBt − (µ2 /2)t . (1) Mostre que (Lt )t∈[0,T ] é uma martingala relativamente à filtração F e que: ∀t ∈ [0, T ] EP [Lt ] = 1 (2) Seja, por definição e para t ∈ [0, T ], Pt := Lt P. Mostre que Pt e PT coincidem na σ álgebra Ft . (3) Seja Z uma variável aleatória limitada e mensurável relativamente à σ álgebra FT . Mostre que: EP [ZLT | Ft ] t EP [Z | Ft ] = . Lt (4) Seja o Bµ = (Bµt )t∈R+ o processo estocástico construı́do a partir do processo browniano dado pela seguinte fórmula Btµ = µt + Bt . Mostre que: t ∀u ∈ R ∀s, t ∈ [0, T ], s ≤ t EP [exp (iu(Btµ − Bsµ )) | Ft ] = e −u2 (t−s) 2 . Conclua usando o resultado obtido na questão preliminar anterior. O teorema de Girsanov permite agora construir a medida de martingala única para os preços descontados. Proposição 1. A medida de martingala única para o processo dos preços descontados é dada por: r−µ 1 r−µ 2 (3) dQ = exp BT − ( ) T dP . σ 2 σ 6 MODELO DE BLACK-SCHOLES E APREÇAMENTO Demonstração. Pondo, por definição, µ−r σ e aplicando o teorema de Girsanov tem-se que a probabilidade Q definida na fórmula 3, que é equivalente a P, torna o processo µ−r dt + dBt dBtQ = σ um processo browniano relativamente a Q. Atendendo agora à fórmula 2, que se pode escrever, γt := dSt∗ = σSt∗ dBtQ (4) e, atendendo à regularidade St∗ temos que, pela definição, St∗ é uma martingala (local). Exercı́cio 10. Mostre que, no contexto da proposição anterior, (1) o processo de preços admite a representação: dSt = rSt dt + σSt dBtQ e após comparar esta representação com a representação inicial comente as diferenças; (2) as filtrações geradas pelos processos (Bt )t∈R , (St )t∈R , (St∗ )t∈R e (BtQ )t∈R coincidem. Definição 13. Uma carteira Φ é admissı́vel se e só se: (1) Φ é autofinanciada; (2) (Vt∗ (Φ))t∈R é um processo estocástico de variáveis aleatórias não negativas e tal que: sup Vt∗ (Φ) ∈ L2 (Q) . (5) t∈[0,T ] O exercı́cio seguinte dá-nos uma forma de mostrar que uma dado integral estocástico define de facto uma martingala e fornecerá uma aplicação possı́vel para a condição 5, enunciada na definição anterior. Exercı́cio 11. Seja (ht )t∈[0,T ] um processo estocástico adaptado tal que: Z T 2 P ht dt < +∞ = 1 . 0 Seja por definição: Z ∀t ∈ [0, T ] Mt := t hs ds 0 e suponha que: " E # sup Mt2 < +∞ t∈[0,T ] Rt (1) Considere a sucesssão τn := inf{t ≥ 0 : 0 h2s ds = n}. Mostre que τn é um tempo de paragem e que Z T ∧τn 2 2 E MT ∧τn = E ht dt . 0 (2) Conclua que: Z E 0 T h2t dt < +∞ . NOTAS DE LIÇÕES PARA TEORIA DO INVESTIMENTO 7 Definição 14. Um direito contingente com data de exercı́cio T é dado por h ∈ mFT que representa o cashflow à data T . Exemplo 1. Uma call option com strike price K é representada por h = f (ST ) em que f (x) = (x − K)+ . Definição 15. Um direito contingente h é replicável se e só se existir uma carteira admissı́vel tal que: VT (Φ) = h . Uma tal carteira é denominada carteira réplica do direito contingente h. Exercı́cio 12. Mostre que se h é replicável então necessariamente h ∈ L2 (Q). Mostre que esta última propriedade é verificada no caso de uma call option. Teorema 3. Qualquer que seja o direito contingente h ≥ 0, h ∈ mFT , h ∈ L2 (P), h é replicável e para qualquer carteira réplica Φ: h i (6) ∀t ∈ [0, T ] Vt (Φ) = EQ e−r(T −t) h | Ft . Demonstração. Pela fórmulas fundamentais 1 e 4 já demonstradas acima: dVt∗ (Φ) = φ1t dSt∗ = σφ1t S ∗ dBtQ . Temos pois, daod que a carteira é admissı́vel e em consequência do exercı́cio 11, que (Vt∗ )t∈R+ é uma martingala logo: Vt∗ = EQ [VT∗ | Ft ] isto é pelas definições, h i Vt = EQ e−r(T −t) h | Ft . Resta mostrar que h é replicável, isto é que que existe uma carteira Φ = (φ1 , φ2 ) tal que: h i φ1t St + φ2t βt = EQ e−r(T −t) h | Ft . Observando que o processo Mt := EQ e−rT h | Ft , é uma martingala de quadrado integrável, que F = (Ft )t∈R+ é a filtração gerada pelo processos browniano (Bt )t∈R+ e também por (BtQ )t∈R+ , logo existe um processo adaptado (gt )t∈R+ tal que Z 0 Q 2 E (gt ) dt < +∞ e Mt = gt dBtQ . T Seja agora, por definição: φ1t := gt σSt∗ e φ2t := Mt − φ1 St∗ . Então o processo Φ = (φ1 , φ2 ) é uma carteira autofinanciado e o processo valor desta carteira é dado por: h i Vt (Φ) = βt Mt = EQ e−r(T −t) h | Ft , logo (Vt (Φ))t∈R+ é um processo não negativo e VT (Φ) = h. 8 MODELO DE BLACK-SCHOLES E APREÇAMENTO 5. A fórmula de Black-Scholes Um argumento semelhante ao que foi utilizado nos modelos a tempo discreto mostra que num mercado livre de arbitragem o preço de um direito contingente replicável é determinado pelo valor de uma carteira réplica qualquer. Com efeito assuma-se um mercado livre de arbitragem e h um direito contingente replicável, denotando-se por Πt o preço de h à data t. Seja Φ uma carteira réplica de h e seja (Vt (Φ))t∈R+ o processo valor de Φ. O quadro seguinte demonstra que se o preço à data zero do direito contingente não for exactamente V0 (Φ), então existe no mercado uma oportunidade de arbitragem. Suponha, por exemplo, que se verifica Π(0, h) < V0 (Φ). Data t = 0 Data t = T Posição short na carteira +V0 (Φ) −VT (Φ) Posição long no direito −Π(0) +Π(0, h) Posição no activo sem risco V0 (Φ) − Π(0) (V0 (Φ) − Π(0, h))erT Cash flow total (soma nas colunas) 0 (V0 (Φ) − Π(0, h))erT Observação 4. Este argumento para além de fazer uso da noção de oportunidade de arbitragem, noção que até agora ainda não foi definida, pressupõe que é possı́vel transaccionar a carteira e o direito contingente. Exercı́cio 13. O objectivo deste exercı́cio é demonstrar a fórmula de Black e Scholes para o preço de uma opção de compra europeia. (1) Mostre que Π0 , o preço à data zero de uma call option com data de exercı́cio T e com preço de exercı́cio K é dado por: Π0 = e−rT E (ST − K)+ √ (2) Mostre que se Z ∈ N(−1/2σ 2 T, σ 2 T ) então ST tem a lei da variável aleatória S0 exp(Z + rT ) e que portanto, Π0 é dado por: Π0 = e−rT E (S0 exp(Z + rT ))+ (3) Mostre que se for: 1 ϕ(x) := √ 2π (7) Z x 2 − v2 e −∞ (ln( SK0 ) + (r − 12 σ 2 )T ) √ dv e vc := , σ T então temos para o preço da call option a fórmula denominada fórmula de BlackScholes: √ Π0 = S0 ϕ(vc + σ T ) − Ke−rT ϕ(vc ) . 6. Estimação Para aplicar o modelo de Black-Scholes torna-se necessário estimar os parâmetros do modelo com especial relevo para a volatilidade σ. Um dos métodos utilizados consiste em utilizar a informação contida no registo dos preços tal como mostra o exercı́cio seguinte. Exercı́cio 14. Considere-se no modelo de Black-Scholes sendo a evolução dos preços dos activos é dada pelas equações: dSt = µSt dt + σSt dBt , onde (Bt )t∈R+ é um processo browniano usual. dβt = rβt dt NOTAS DE LIÇÕES PARA TEORIA DO INVESTIMENTO 9 (1) Mostre que: 1 2 (8) St+∆t = St exp σ(Bt+∆t − Bt ) + (µ − σ )∆t , 2 e conclua que os retornos logarı́tmicos do activo em questão são normais com média e variância definidas. (2) Usando a fórmula 8 mostre que: 1 E[ln(St+∆t /St )] V[ln(St+∆t /St )] µ − σ2 = , σ2 = 2 ∆t ∆t onde E[X] e V[X] representam a média e a variância da variável aleatória X. (3) Dê intervalos de confiança para os parâmetros que estimou. 7. A equação às derivadas parciais de Black-Scholes Seja o modelo de Black-Scholes usual em que a dinâmica do activo com risco é regida pela equação diferencial estocástica: dSt = µSt dt + σSt dBt , S0 ∈ R+ e em que o activo sem risco (ou conta bancária) tem como dinâmica segue a equação diferencial ordinária: dβt = rβt dt , β0 = 1 . Seja uma carteira autofinanciada (at , bt )t≥0 cujo processo valor é dado por: ∀t ≥ 0 Vt = at St + bt βt . Relembre que sendo a carteira autofinanciada se verifica: dVt = at dSt + bt dβt . Suponha que a estratégia permite replicar o direito contingente C(St , t), isto é que: ∀t ≥ 0 Vt = C(St , t) . Exercı́cio 15. O objectivo deste exercı́cio é obter a equação às derivadas parciais cuja solução permite apreçar um direito contingente no modelo de Black-Scholes. (1) Mostre, usando a fórmula de Ito que: 1 (2) (1) (1) 2 2 ∀t ≥ 0 dC(St , t) = Ct (St , t) + Cx (St , t)St µ + Cxx (St , t)σ St dt 2 (9) (1) + Cx (St , t)σSt dBt , onde se tem para a função de duas variáveis C(x, t): ∂C ∂C ∂2C (2) (x, t) , Cx(1) (x, t) = (x, t) , Cxx (x, t) = (x, t) . ∂t ∂x ∂x2 (2) Mostre que sendo a estratégia auto-financiada e permitindo replicar C(St , t), se tem: (1) Ct (x, t) = ∀t ≥ 0 dC(St , t) = (bt rβt + at St µ) dt + at St σdBt . (3) Mostre que se a decomposição de um processo estocástico de Ito na soma de um integral em dt com um integral em dBt fôr única, virá então: (1) C(St , t) − St Cx (St , t) β−t e conclua que C(x, t) é solução da equação com derivadas parciais de Black-Scholes: at = Cx(1) (St , t) , bt = (10) ∂C ∂C 1 ∂2C (x, t) − rC(x, t) + (x, t)St r + (x, t)σ 2 St2 = 0 . ∂t ∂x 2 ∂x2 10 MODELO DE BLACK-SCHOLES E APREÇAMENTO Observação 5. No caso de uma opção de compra (call option) europeia com preço de exercı́cio K tem-se que o valor do contrato é C(ST , T ) = (ST − K)+ onde C(x, t) é solução da equação 10. Resolução:[Exercı́cio 15] (1) Pela fórmula de Ito vem que: 1 (2) (1) dC(St , t) = Ct (St , t) dt + Cx(1) (St , t) dSt + Cxx (St , t)(dSt )2 . 2 Como dSt = (µdt + σdBt )St vem que (dSt )2 = σ 2 (St )2 dt e logo: 1 (2) (1) dC(St , t) = Ct (St , t) dt + Cx(1) (St , t)St µdt + Cx(1) (St , t)St σdBt + Cxx (St , t)σ 2 St2 dt = 2 1 (2) (1) (St , t)σ 2 St2 dt + Cx(1) (St , t)St σdBt , = Ct (St , t) + Cx(1) (St , t)St µ + Cxx 2 tal como se pretendia. (2) Seja agora Φ = (at , bt )t∈R+ uma carteira réplica do direito contingente C(St , t). Tem-se então que: dC(St , t) = dVt (Φ) = at dSt + bt dβt = (bt rβt + at St µ)dt + at St σdBt . (3) Obserando que a representação de um processo de Ito como soma de um integral usual e de um integral estocástico é única 6 tem-se que a carteira φ satisfaz necessa(1) riamente a equação at St σ = Cx (St , t)St σ de onde se tira que: at = Cx(1) (St , t) , uma vez que, por hipótese σ 6= 0 e que por construção St 6= 0. Dado que C(St , t) = (1) at St + bt βt = Cx (St , t)St + bt βt , vem que (1) C(St , t) − Cx (St , t)St bt = . βt Podemos usar mais uma vez o argumento da unicidade da decomposição de um integral de Ito desta vez relativamente ao integral usual para concluir que: 1 (2) (1) bt rβt + at St µ = Ct (St , t) + Cx(1) (St , t)St µ + Cxx (St , t)σ 2 St2 . 2 Se reportarmos nesta fórmula os valores encontrados para os processos da carteira tem-se, (1) C(St , t) − Cx (St , t)St βt + Cx(1) (St , t)St µ = βt 1 (2) (1) Ct (St , t) + Cx(1) (St , t)St µ + Cxx (St , t)σ 2 St2 , 2 ou seja, tal como querı́amos: 1 (2) (1) Ct (St , t) − rC(St , t) + Cx(1) (St , t)St r + Cxx (St , t)σ 2 St2 = 0 . 2 ♦ 6Veja-se [4][p. 43]. NOTAS DE LIÇÕES PARA TEORIA DO INVESTIMENTO 11 Referências 1. [Bjrk98] T. Björk, Arbitrage Theory in Continuous Time, Oxford University Press, 1998. 2. [Kllbr97] O. Kallenberg, Foundations of Modern Probability, Springer Verlag, 1997. 3. [Kleb98] F. C. Klebaner, Introduction to Stochastic Calculus with Applications, Imperial College Press, 1998. 4. [LmbLp96] D. Lamberton, B. Lapeyre, Introduction to Stochastic Calculus Applied to Finance, Chapman & Hall, 1996. 5. [LptShr01] R. S. Lipster, A. N. Shiryaev Statistics of Random Processes, Vol. I, Second Edition, Springer Verlag, 2001. 6. [MuRu97] M. Musiela, M. Rutkowski, Martingale Methods in Financial Modelling, Springer, 1997. 7. [Oksen98] B. Øksendal, Stochastic Differential Equations, fifth edition, Springer, 1998. 8. [RvYor99] D. Revuz , M. Yor, Continuous Martingales and Brownian Motion, Springer, 1999. Estimação e Clibração de Modelos de Mercados Financeiros FCT/UNL, Matemática Financeira 07-08 MLE 1 Introdução Para aplicar um dado um modelo para os mercados financeiros há, pelo menos, duas formas de proceder: a estimação e a calibração. Um modelo é caracterizado pelas leis de evolução dos activos financeiros considerados como subjacentes ou primitivos. As leis de evolução dependem de um vector de parâmetros Θ = (θ1 , . . . , θN ). Essas leis são, geralmente, formuladas sob uma probabilidade natural que é a probabilidade observada. Os resultados do modelo são, fundamentalmente, fórmulas para apreçamento livre de arbitragem para activos financeiros secundários ou derivados e para as correspondentes carteiras de cobertura. Estas fórmulas são, regra geral, calculadas por meio de uma probabilidade de martingala, ou probabilidade neutra face ao risco, associada de forma canónica ao modelo. O modelo formulado sob a probabilidade neutra face ao risco 0 ). De notar que, em geral, depende de um outro vector de parâmetros Θ0 = (θ10 , . . . , θN os preços calculados com a probabilidade natural não são preços livres de arbitragem. Suponhamos conhecidos os dados relativos à evolução dos activos primários ou subjacentes, por exemplo, séries cronológicas de preços. Se aplicarmos os procedimentos estatı́sticos usuais aos dados relativos à evolução dos activos para estimar Θ, sob a probabilidade natural ou observada, estamos a estimar o modelo. A estimação é, em regra, um método de tipo histórico. Suponhamos conhecidos os dados relativos a certos activos financeiros derivados, por exemplo um conjunto de preços para um conjunto de activos. Se for possı́vel inverter, (ainda que numericamente) as fórmulas dos preços desses activos derivados de modo a obter Θ0 , o vector de parâmetros do modelo sob a probabilidade martingala ou neutra face ao risco, estamos a calibrar o modelo. Com os resultados da calibração é possı́vel apreçar, no quadro do modelo em estudo, outros activos financeiros derivados que não os inicialmente considerados. A calibração é, em geral, um método de tipo implı́cito. 2 O modelo binomial Nesta secção estudaremos o caso particular do modelo binomial. O leitor é fortemente aconselhado a rever as suas notas de trabalho sobre este assunto. 1 MF0708 Estimação e Calibração Subsecção: 2.1 No modelo binomial consideram-se dois activos primários. A obrigação (bond ), activo sem risco cuja lei de evolução do respectivo preço é dada por: ( B0 = 1 Bn+1 = (1 + R)Bn n ≥ 0 , em que R ≥ 0 é a taxa de juro sem risco, determinı́stica, associada a um dado perı́odo de tempo ∆t que deveremos ter sempre o máximo cuidado em explicitar 1 . A acção (stock ), activo com risco cuja lei de evolução do respectivo preço é dada por: ( S0 > 0 Sn+1 = Zn+1 Sn n ≥ 0 , em que (Zn )n≥1 é uma amostra de uma variável aleatório de Bernoulli Z tal que: ( u com probabilidade pu Z= d com probabilidade pd = 1 − pu e que representa o retorno da acção no perı́odo ∆t 2 . Os parâmetros do modelo, sob a probabilidade natural, são descritos, evidentemente, por Θ = (R, u, d, pu ). 2.1 Estimação Seja P = (pu , pd ) a probabilidade natural que, relembramos, é a probabilidade observada no modelo. Suponhamos conhecida (sn )n≥1 uma série de preços do activo primário com risco num perı́odo fundamental τ determinado (suponhamos mensal para fixar as ideias). Sabemos grande P pela lei forte dos grandes números que para N suficientemente P [Z τ ] em s /s pode ser tomado como boa aproximação para E mN = (1/N ) N n=1 n+1 n que Z τ é o retorno mensal. Podemos, pois, tomar EP [Z τ ] como a taxa de retorno (média) Da mesma forma poderemos considerar sN = (1/(N − P mensal observada. 2 como boa aproximação para VP [Z τ ] a variância de Z τ . VP [Z τ ] (s /s −m 1)) N ) N n=1 n+1 n representará, pois, a volatilidade (média) mensal observada. Tal como já referimos acima, supomos que se está a estudar o modelo binomial tomando como perı́odo de referência uma fracção ∆t do perı́odo fundamental τ 3 Sabendo que ( uS0 com probabilidade pu S1 = dS0 com probabilidade pd = 1 − pu tem-se, uma vez que o retorno médio no perı́odo ∆t deverá ser EP [Z] = EP [Z τ ]∆t que; EP [S1 ] = EP [ZS0 ] = S0 EP [Z] = S0 (pu u + (1 − pu )d) = S0 EP [Z τ ]∆t 1 Por exemplo a taxa pode ser: diária, semanal, mensal, anual, etc. De facto, por definição, o retorno aditivo é dado por (S1 − S0 )/S0 = Z − 1. 3 Se por exemplo estivermos interessados num perı́odo de referência diário teremos ∆t = τ /30 em que, relembramos, τ é o perı́do fundamental que acima escolhemos, por exemplo, ser mensal. 2 Primeira versão 2 6 de Novembro de 2007 MF0708 Estimação e Calibração Subsecção: 2.2 ou seja EP [Z τ ]∆t = pu u + (1 − pu )d o que implica que, necessariamente, pu = (1 + EP [Z τ ]∆t) − d . u−d (1) Da mesma forma virá relativamente à volatilidade no perı́odo ∆t, uma vez que se tem pelas regras habituais VP [Z] = VP [Z τ ]∆t, que: VP [S1 ] = VP [ZS0 ] = S02 VP [Z] = S02 ((pu u2 +(1−pu )d2 −(pu u+(1−pu )d)2 ) = S02 VP [Z τ ]∆t ou seja: VP [Z τ ]∆t = pu u2 + (1 − pu )d2 − (pu u + (1 − pu )d)2 . (2) Seja agora para maior comodidade no que vai seguir-se, µ = EP [Z τ ]∆t e σ 2 = VP [Z τ ]∆t. Observe-se primeiramente que por substituição da fórmula 1: pu u2 +(1−pu )d2 = d2 +(u2 −d2 )pu = d2 +(u2 −d2 ) (1 + µ) − d = d2 = (u+d)(1+µ)−ud . u−d De novo, substituindo a fórmula 1 na fórmula 2 vem, desenvolvendo o quadrado e efectuando as contas, que: (1 + µ) − d u − (1 + µ) 2 2 (pu u + (1 − pu )d) = u+ d = (1 + µ)2 u−d u−d Em consequência tem-se que (u + d)(1 + µ) − ud − (1 + µ)2 = σ 2 ou seja, revertendo para as notações iniciais que: (u + d)(1 + EP [Z τ ]∆t) − ud − (1 + EP [Z τ ]∆t)2 = VP [Z τ ]∆t (3) O problema da estimação ficará resolvido se encontrarmos uma solução para a equação 3 nas duas incógnitas u e d. Uma forma usual de proceder (Hull 00)[p. 214] consiste em desenvolver o quadrado e desprezar as potências de ∆t de ordem superior a um, obtendose uma equação aproximada ou seja: (u + d)(1 + EP [Z τ ]∆t) − ud − (1 + 2EP [Z τ ]∆t) ≈ VP [Z τ ]∆t observando-se imediatamente que: ( p u = 1 + VP [Z τ ]∆t p d = 1 − VP [Z τ ]∆t (4) (5) é uma solução possı́vel para a equação aproximada 4. Deste modo é possı́vel estimar os valores de u e d que são compatı́veis com os dados observados. Observe-se que no modelo binomial esta estimação não nos permite, em princı́pio, determinar o preço livre de arbitragem de um derivado. Para esclarecermos este assunto necessitamos estudar a calibração. Primeira versão 3 6 de Novembro de 2007 MF0708 Estimação e Calibração Subsecção: 2.2 2.2 Calibração Seja Q = (qu0 , qd0 ) a probabilidade martingala ou neutra face ao risco associada ao modelo binomial. Note-se que o modelo de evolução da acção sob esta probabilidade neutra face ao risco é dado por: ( u0 S0 com probabilidade qu0 S1 = d0 S0 com probabilidade qd0 = 1 − qu0 em que u0 e v 0 representam as taxas de apreciação e depreciação da acção sob a probabilidade neutra face ao risco. Os parâmetros do modelo, sob a probabilidade neutra face ao risco, são descritospor Θ0 = (R, u0 , d0 , qu0 ). Tal como na secção sobre a estimação, supomos que Rτ é a taxa de juro sem risco num perı́odo de referência τ . No perı́odo de tempo em que estudamos o modelo binomial denotado por ∆t, sabemos que Q é tal que: S0 = 1 1 1 EQ [S1 ] = EQ [S0 Z] = S0 (qu0 u0 + (1 − qu0 )d0 ) τ τ 1 + R ∆t 1 + R ∆t 1 + Rτ ∆t o que implica necessariamente que: q u0 = (1 + Rτ ∆t) − d0 . u0 − d0 (6) Tal como anteriormente, substituindo 6 na fórmula da variância do retorno sob a probabilidade martingala, correspondente à fórmula 2, tem-se uma fórmula semelhante a 3, ou seja: qu0 (u0 )2 +(1−qu0 )(d0 )2 −(qu0 u0 +(1−qu0 )d0 )2 = (u0 +d0 )(1+Rτ ∆t)−u0 d0 −(1+Rτ ∆t)2 (7) Observa-se agora imediatamente que os valores obtidos na fórmula 5 para solução da equação aproximada 4 são tais que se for ( p u0 = 1 + VP [Z τ ]∆t p d0 = 1 − VP [Z τ ]∆t então desprezando os termos em ∆t de ordem superior a um no lado esquerdo da fórmula 7 virá que qu0 (u0 )2 + (1 − qu0 )(d0 )2 − (qu0 u0 + (1 − qu0 )d0 )2 ≈ VP [Z τ ]∆t Podemos pois concluir que no modelo binomial debaixo da probabilidade neutra face ao risco: 1. u0 e v 0 , as taxas de apreciação e depreciação da acção sob a probabilidade neutra face ao risco, podem ser consideradas idênticas a u e v, as taxas de apreciação e depreciação da acção sob a probabilidade natural; 2. a variância do retorno da acção sob a probabilidade martingala coincide com a variância do retorno da acção sob a probabilidade natural. Primeira versão 4 6 de Novembro de 2007 MF0708 Estimação e Calibração Subsecção: 4.0 Em consequência, ficou demonstrado que é possı́vel resolver o problema da calibração do modelo binomial a partir dos dados históricos sendo, em seguida, possı́vel a determinação do preço de qualquer activo financeiro derivado no modelo binomial desde que seja possı́vel estimar a variância dos retornos do activo subjacente. 2.3 Aplicação prática No ficheiro Mathematica em anexo aplicam-se os resultados estudados ao apreçamento de uma call option sobre o ı́ndice Psi-20. 3 O modelo de Black-Scholes (A completar) 4 Modelos de produtos de rendimento fixo (A completar) Referências [Hull 00] J. C Hull, Options Futures and other derivatives, fourth edition, Prentice-Hall International Inc., 2000. Primeira versão 5 6 de Novembro de 2007 Métodos das Probabilidades e da Estatı́stica para a avaliação e cobertura do risco operacional Manuel L. Esquı́vel 2 de Dezembro de 2009 Resumo No que vai seguir-se propõe-se uma primeira aproximação sobre as técnicas de probabilidades e estatı́stica relevantes para o risco operacional. Procurou-se aflorar sucinta mas rigorosamente alguns dos aspectos fundamentais destas técnicas: as noções básicas subjacentes, o ajustamento dos modelos à severidade e à frequência, a teoria dos valores extremos no ajustamento de caudas pesadas e na determinação do Value at Risk. A tı́tulo de ilustração tratou-se um exemplo com auxı́lio do software R e do software Mathematica que será apresentado na aula. 1 Introdução De acordo com o documento [Basel 01][p. 2] o risco operacional é definido como o risco de perdas directas ou indirectas resultando de falhas ou desadequações nos processos internos e nas pessoas ou resultando de acontecimentos externos. Uma equipa técnica que seja incumbida, por uma administração, de quantificar o risco operacional deverá adoptar uma metodologia que produza resultados fiáveis e que seja aceite pelos organismos de regulação externos à companhia. Actualmente, as metodologia mais praticadas admitem uma esquematização nos seguintes passos. • Ajustar, testar e validar um modelo para a severidade dos eventos de risco operacional. Para a severidade dos eventos importa realçar que o ajustamento de uma distribuição Gaussiana aos dados não faz sentido, na maior parte dos casos, devido à existência de caudas pesadas na amostra. Tal pode, em geral, ser inferido pelo cálculo da kurtosis da amostra. Embora muitas vezes se procure um ajustamento com outras distribuições com caudas pesadas (Weibull ou Pareto, por exemplo) nem sempre este tipo de ajustamentos tem em conta os dados extremais que de facto são os mais relevantes para uma correcta previsão das medidas de risco. Nesse contexto, pode ser muito importante a aplicação das técnicas da teoria dos valores extremos. • Ajustar, testar e, finalmente, validar um modelo para a frequência dos eventos. • Determinar a distribuição das perdas agregadas usando os modelos da severidade e da frequência de forma a poder projectar a curto e médio prazo as medidas de 1 Capı́tulo VI Risco Operacional Secção: 2 risco requeridas pela administração como, por exemplo, o VaR. Se se dispuser de distribuições manejáveis para a severidade e para a frequência pode ser possı́vel a determinação explı́cita da distribuição das perdas agregadas. Regra geral tal não irá acontecer pelo que se terá de recorrer a métodos aproximados de entre os quais se destaca a simulação. Pressupõe-se que a base de dados sobre a qual se vai praticar a análise tem as caracterı́sticas mais adequadas às técnicas a aplicar. Após a realização da análise, é indispensável uma apreciação muito crı́tica dos resultados obtidos com estes modelos para garantir resultados sensatos e, sobretudo, explicáveis a não especialistas. As análises ganharão em ser feitas com o auxı́lio de software adequado por exemplo o R 1 . Se possı́vel, a análise deveria ser efectuada independentemente em, pelo menos, dois softwares distintos e os resultados obtidos comparados. 2 Probabilidades e Estatı́stica Começamos por evocar algumas noções que são imprescindı́veis para o estudo das técnicas quantitativas de análise e cobertura do risco operacional. Muitas destas noções são estudadas em disciplinas apropriadas nos cursos universitários de Matemática, Ciências Actuariais, Economia, Finanças e Engenharias, entre outros. 2.1 Variáveis aleatórias De forma intuitiva uma variável aleatória é apenas o resultado quantitativo da observação, numa dada população, de um fenómeno regido pelo acaso. Exemplos de variáveis aleatórias são a idade ou o peso da população de uma cidade. Convencionamos representar uma variável aleatória pelas letras maiúsculas X, Y, Z, . . . . Habitualmente distinguem-se duas classes de variáveis aleatórias consoante o tipo de valores que tomam. Assim, uma variável aleatória que tome como valores os números (reais) a1 , a2 , . . . , an , . . . diz-se discreta enquanto que uma variável aleatória que possa tomar todos os valores entre dois números a e b se diz contı́nua. O comportamento de uma variável discreta X tomando como valores os números a1 , a2 , . . . , an , . . . é descrito pela sucessão P[X = ak ] ∈ [0, 1], k = 1, 2, . . . , n . . . isto é a sucessão das probabilidades dos acontecimentos definidos por: X toma exactamente o valor ak . Por outro lado, o comportamento, a lei, ou a distribuição, de uma variável contı́nua Y , é descrito pela função de distribuição de X definida por: FY (y) := P[Y ≤ y] ∈ [0, 1], y ∈ R , isto é, tal que para cada número real y, FY (y) é dado pela probabilidade da variável Y tomar valores inferiores ou iguais a y. En certos casos, muito importantes na prática, a 1 Veja-se a página http://cran.r-project.org/ . MF0910 2 2 de Dezembro de 2009 Capı́tulo VI Risco Operacional Secção: 2 função distribuição pode escrever-se como integral de uma função regular fY , a que se dá o nome de densidade de probabilidade de Y , sob a forma: Z y FY (y) = fY (u) du . −∞ Neste caso, define-se para cada inteiro positivo r = 1, 2, . . . o momento de ordem r da variável Y , quando existe, por: E[Y r ] := Z +∞ ur fY (u) du . −∞ O valor esperado (ou valor médio) da variável Y , representado por E[Y ] é, quando existe, o momento de ordem 1 e a variância de Y é dada, quando existe, por p V[Y ] = E[Y 2 ] − E[Y ]2 ; tanto a variância como o desvio padrão, definido por σ(Y ) = V[Y ] são medidas clássicas de dispersão de uma variável aleatória em torno do correspondente valor esperado. 2.2 Amostras, a kurtosis e caudas pesadas Para uma amostra de dimensão n inteiro positivo X1 , X2 , . . . , Xn , composta de observações independentes e identicamente distribuı́das usamos a notação Xn = (X1 , X2 , . . . , Xn ) , ou X = (X1 , X2 , . . . , Xn ), sem o ı́ndice n que identifica a dimensão da amostra, sempre que não haja risco de confusão. Para o valor médio da amostra X usamos a notação: n 1X X= Xi . n i=1 A partir do valor esperado amostral e da variância amostral pode definir-se um indicador importante para o diagnóstico de dados no risco amostral. Definição 1. A kurtosis da amostra X1 , X2 , . . . , Xn é definida por: N 1 1 X κ := (Xi − X)4 σ(X)4 N i=1 em que σ(X) é o desvio padrão amostral. A kurtosis pode ser encarada como uma medida do peso das caudas numa distribuição de probabilidade. É frequente que uma amostra com um valor alto de kurtosis apresente uma densidade com um pico pronunciado perto da média, decrescendo rapidamente e apresentando caudas pesadas. Um valor de referência para a kurtosis é κ = 3 que corresponde ao valor teórico para a distribuição normal. MF0910 3 2 de Dezembro de 2009 Capı́tulo VI Risco Operacional Secção: 2 O comportamento da cauda de uma definição de uma variável aleatória X é dado pelo comportamento assimptótico de P[X ≥ x], isto é, pelo comportamento desta probabilidade quando x toma valores arbitrariamente grandes. No caso em que a distribuição admite uma densidade tem-se que Z +∞ P[X ≥ x] = f (u) du x pelo que se procura caracterizar o comportamento da área delimitada por f e pelo eixo das abcissas. Quando se compara o comportamento das caudas a referência é a 2 distribuição normal cuja cauda se comporta para x grande como e−γx (veja-se adiante na secção 3 a observação 10). 2.3 As leis dos grandes números Uma lei dos grandes números diz, grosso modo, que a média aritmética dos valores de um dado número de observações independentes de uma variável aleatória é tão mais próximo do valor esperado da variável aleatória quanto maior for o número de observações considerado. O significado que se atribui à locução mais próximo determina se se trata de uma lei dos grandes números forte ou fraca. As leis dos grandes números são de uso constante em Probabilidades e Estatı́stica. Exemplos desses usos serão apresentados seguidamente. O enunciado seguinte da lei forte dos grandes números é de formulação simples mas necessita a noção de acontecimento quase certo ou acontecimento com probabilidade um que por ser intuitivamente acessı́vel não detalharemos mais. Teorema 1 (Lei forte de Kolmogorov). Seja X1 , X2 , . . . Xn , . . . uma sucessão de variáveis aleatórias integráveis, independentes e com a mesma distribuição comum. Então, com probabilidade um: N 1X lim Xn = E[X1 ] . N →+∞ n n=1 Podem enfraquecer-se as hipóteses formuladas para a lei forte dos grandes números no sentido de não exigir a mesma distribuição mas tão somente um valor esperado comum e que as variâncias sejam uniformemente limitadas. Com essas hipóteses mais fracas obtem-se um resultado semelhante ao da lei forte mas com uma outra noção de convergência. Com efeito, a formulação rigorosa da lei fraca dos grandes números requer a noção de convergência em probabilidade que é uma noção mais fraca que a noção de convergência quase certa ou com probabilidade um. Esta noção de convergência consiste em considerar que a probabilidade dos acontecimentos {| Xn − X |> } = {ω ∈ Ω :| Xn (ω) − X(ω) |> } , em que > 0 é uma quantidade arbitrariamente pequena, tende para zero quando a ordem n cresce indefinidamente. Note-se que os acontecimentos acima são também dados por: {| Xn − X |> } = {ω ∈ Ω : Xn (ω) < X(ω) − ou X(ω) + < Xn (ω)} , MF0910 4 2 de Dezembro de 2009 Capı́tulo VI Risco Operacional Secção: 2 o que mostra que quando há convergência em probabilidade, a probabilidade de uma dada observação Xn (ω) se encontrar fora do intervalo ]X(ω) − , X(ω) + [ é tão mais pequena quanto n for grande e isto para qualquer > 0, arbitrariamente pequeno. Definição 2. Uma sucessão X1 , X2 , . . . Xn , . . . de variáveis aleatórias converge em probabilidade para uma variável aleatória X se e só se se verifica a seguinte condição: ∀ > 0 lim P [| Xn − X |> ] = 0 n→+∞ (1) O enunciado seguinte tem um conjunto de hipóteses de fácil verificação mas suficientemente geral para poder ser aplicado a uma classe alargada de situações Teorema 2 (Lei fraca). Seja X1 , X2 , . . . Xn , . . . uma sucessão de variáveis aleatórias independentes e com o mesmo valor médio e tais que exista uma constante M > 0 tal que as variâncias das variáveis da sucessão são majoradas por essa constante, isto é, ∀n ∈ N V[Xn ] ≤ M . Então, entendendo-se o limite como limite em probabilidade: N 1 X lim Xn = E[X1 ] . N →+∞ N n=1 Demonstração. A demonstração é uma consequência da desigualdade de Chebychev dado que, por esta desigualdade, " # "N # N 1 X X 1 M P (Xn − E[X1 ]) ≤ Xn − E[X1 ] > ≤ 2 V −−−−−→ 0 , N N N N →+∞ n=1 n=1 em consequência da hipótese feita sobre o comportamento assimptótico da sucessão de variáveis aleatórias. 2.4 O teorema do limite central Em traços largos, o teorema do limite central diz-nos que uma soma, convenientemente normalizada, de variáveis aleatórias tem uma lei ou distribuição que é tão mais próxima da lei normal quanto mais termos forem tomados na soma. É imediatamente perceptı́vel o interesse de um tal resultado. Com efeito, a distribuição de uma soma de variáveis aleatórias quaisquer, por exemplo um valor médio amostral, não é, em geral, conhecida; se a distribuição limite ou assimptótica for reconhecidamente a distribuição normal, por aplicação do teorema do limite central, muitos cálculos antes impossı́veis passam a fazer-se com simplicidade. O conceito de mais próximo exigido neste contexto é o da convergência em lei ou em distribuição. Teorema 3 (Lévy-Lindbergh). Seja X1 , X2 , . . . Xn , . . . uma sucessão de variáveis aleatórias independentes e com a mesma distribuição comum. Então, considerando a soma normalizada definida para cada N ≥ 1 por: N 1 X Xn − E[X1 ] p SN := √ N n=1 V[X1 ] MF0910 5 2 de Dezembro de 2009 Capı́tulo VI Risco Operacional Secção: 2 com função de repartição FSN tem-se que Z x 2 1 − u2 =0. √ e lim sup F (x) − du S N N →+∞ −∞<x<+∞ 2π −∞ Observação 1. Outras formulações do teorema limite central são possı́veis relaxando as hipóteses feitas sobre a sucessão (veja-se, por exemplo, [Pestana 02][p. 987]). 2.5 Estimação de parâmetros pelo método dos momentos Em linhas gerais, a estimação dos parâmetros de uma distribuição pelo método dos momentos faz-se resolvendo, em ordem aos parâmetros, o sistema de equações que se obtem igualando a a expressão teórica dos momentos, que deve envolver os parâmetros, aos correspondentes momentos empı́ricos calculados a partir da amostra. Em princı́pio haverá tantas equações como parâmetros. Um exemplo simples, o da distribuição exponencial (veja-se a subsecção 3.3 abaixo)é dado pela estimação do parâmetro δ da distribuição pelo método dos momentos. Se X tiver distribuição exponencial com parâmetro δ então o primeiro momento é E[X] = δ e o primeiro momento amostral, dada a amostra X = (X1 , X2 , . . . , Xn ), é a média X, pelo que δ̂, o estimador pelo método dos momentos do parâmetro δ, é δ̂ = X. No caso geral, consideremos que pretendemos estimar o parâmetro θ = (θ1 , θ2 , . . . , θk ) ∈ Θ de X _ G(θ), uma variável aleatória com distribuição G(θ) a partir de uma amostra Xn = (X1 , X2 , . . . , Xn ). Observe-se que para r = 1, 2, . . . k se fθ representar a densidade da distribuição G(θ) que o momento teórico de ordem r r Z +∞ xr fθ (x)dx Eθ [X ] = −∞ é uma função de θ (e também de r). O algoritmo para obter o estimador de θ pelo método dos momentos consiste em obter a solução θ̂ = (θ̂1 , θ̂2 , . . . , θ̂k ) ∈ Θ do sistema de k equações: n 1X r (2) Eθ [X r ] = Xi r = 1, 2, . . . , k . n i=1 A justificação deste método resulta, por exemplo, da lei forte dos grandes números de Kolmogorov. Com efeito, considerando X1 , X2 , . . . , Xm , . . . uma sucessão de variáveis aleatórias independentes e identicamente distribuı́das com X, tem-se que: m 1 X r com probabilidade 1 Xi −−−−−−−−−−−−−−−−−→ Eθ [X r ] m→+∞ m i=1 P pelo que para uma dada amostra Xn = (X1 , X2 , . . . , Xn ) faz sentido identificar n1 ni=1 Xir com Eθ [X r ] desde que n, a dimensão da amostra, seja significativamente grande. Pode mostrar-se numa classe numerosa de modelos que o estimadores assim obtidos são (fortemente) consistentes (veja-se, por exemplo, [Ivchenko 90][p. 97]). Tal resulta da aplicação do teorema das funções implı́citas, sob reserva de regularidade. MF0910 6 2 de Dezembro de 2009 Capı́tulo VI Risco Operacional Secção: 2 Observação 2. Naturalmente que este método só pode ser aplicado quando a distribuição da variável do modelo admite os momentos necessários para o algoritmo descrito acima. As estimativas dos parâmetros obtidas por este meio são pouco eficientes e são geralmente utilizadas como valores iniciais para outros métodos mais eficientes. 2.6 Estimação de parâmetros pelo método da verosimilhança máxima Em traços largos, este método para estimação de um parâmetro de uma lei admitindo densidade baseia-se na ideia de que a densidade toma, num dado ponto, valores tanto maiores quanto maior for a probabilidade de se observar esse ponto. Com efeito, para X _ G(θ), uma variável aleatória com distribuição G(θ) admitindo fθ como densidade tem-se que para qualquer > 0: Z x+ P[x − ≤ X ≤ x + ] = fθ (u) du x− pelo que é natural admitir que para θ fixo, quanto maior for a probabilidade de X tomar valores na vizinhança do ponto x maior serão os valores que fθ tomará nessa vizinhança. Suponhamos que pretendemos estimar o parâmetro θ = (θ1 , θ2 , . . . , θk ) ∈ Θ a partir de uma amostra Xn = (X1 , X2 , . . . , Xn ). Consideramos a verosimilhança Lθ definida para uma qualquer realização da amostra (x1 , x2 , . . . , xn ) por: Lθ (x1 , x2 , . . . , xn ) := fθ (x1 ) · fθ (x2 ) · · · · · fθ (xn ) = n Y fθ (xi ) . i=1 A verosimilhança Lθ não é mais que a densidade da lei da amostra Xn , isto é, a lei conjunta do vector aleatório (X1 , X2 , . . . , Xn ). Aplicando a ideia descrita acima, é razoável supor que para uma dada realização da amostra (x1 , x2 , . . . , xn ), Lθ (x1 , x2 , . . . , xn ) será tanto maior quanto mais perto estiver θ do verdadeiro valor do parâmetro da lei que regeu a obtenção daquela realização da amostra. O algoritmo para o método de estimação dos parâmetros pelo método da verosimilhança máxima consiste assim em determinar θ̂ tal que quando (x1 , x2 , . . . , xn ) estão fixos, Lθ̂ (x1 , x2 , . . . , xn ) tome o valor máximo, isto é: θ̂ := Argmáxθ∈Θ Lθ (x1 , x2 , . . . , xn ) . Para aplicar este algoritmo temos então de maximizar uma função de várias variáveis reais (θ1 , θ2 , . . . , θk ) usando para o efeito os princı́pios do cálculo diferencial. Sob reserva da regularidade, um ponto de verosimilhança máxima é um ponto estacionário, isto é, verifica o sistema de equações: ∂ Lθ (x1 , x2 , . . . , xn ) = 0, r = 1, 2, . . . , k . ∂θr sendo necessário verificar em seguida se o ponto estacionário assim obtido maximiza de facto a função. Para um estudo das propriedades assimptóticas dos estimadores obtidos com este método recomendamos [Ivchenko 90][p. 82–97] ou [Pestana 02][p. 510–520]. MF0910 7 2 de Dezembro de 2009 Capı́tulo VI Risco Operacional Secção: 2 2.7 Testes de hipóteses A metodologia estabelecida em Estatı́stica para testar uma hipótese a partir da observação de uma amostra de um fenómeno aleatório pode ser reduzida, nas suas linhas gerais, aos seguintes passos (veja-se, por exemplo, [Pestana 02][p. 489] ou [Lewis 04][pp. 61–63]). • A fixação da hipótese nula, geralmente representada por H0 . Esta hipótese é o postulado que efectuamos sobre a distribuição da nossa amostra. O objectivo do teste é rejeitar esta hipótese (note-se que quando não conseguimos rejeitar a hipótese nula não a estamos a aceitar; a metodologia dos testes de hipótese em Estatı́stica é assim baseada numa atitude de grande prudência). • A escolha da estatı́stica do teste que é dada por nova variável aleatória T := g(X1 , . . . , XN ) construı́da a partir da amostra por imagem por uma função g, que pode depender da dimensão N da amostra. Para poder efectuar o teste é imperativo ter informações sobre a distribuição da estatı́stica do teste: ou se conhece a distribuição exacta ou se conhece uma distribuição limite da estatı́stica do teste quando a dimensão da amostra N cresce indefinidamente. • Convencionar um nı́vel de significância aceitável para o teste, geralmente representado por α e tomando na prática um dos dois valores α = 0.05 ou α = 0.01. O nı́vel de significância corresponde à probabilidade de cometer um erro de primeira espécie, isto é corresponde à probabilidade de rejeitar a hipótese nula no caso em que esta é verdadeira. Naturalmente pretendemos esta probabilidade tão pequena quanto possı́vel. • A determinação da região crı́tica do teste usando para o efeito as informações de que dispomos sobre a distribuição da estatı́stica do teste e o valor do nı́vel de significância. Esta região crı́tica é tal que, quando se observa uma dada concretização da amostra x = (x1 , . . . , xn ) e o correspondente valor da estatı́stica do teste T (x) = g(x1 , . . . , xn ) se T (x) pertencer à região crı́tica rejeita-se a hipótese nula. No caso de uma hipótese nula simples e em que T toma valores reais, a cada nı́vel de significância α corresponde uma região crı́tica definida por um valor crı́tico Tα = FT← (1 − α); neste caso, a região crı́tica pode corresponder, por exemplo a T (x) > Tα . • O valor-p, que representa a probabilidade, condicional à hipótese nula considerada de observar na estatı́stica do teste um valor maior ou igual àquele que foi efectivamente observado. Na maioria dos softwares para a estatı́stica este valor-p é um dos resultados dos programas. Regra geral a tomada de decisão quanto à eventual rejeição da hipótese nula efectua-se quando se observa um valor-p inferior ao nı́vel de significância. Exemplo 1 (Teste de Ajustamento de Kolmogorov-Smirnov). Trata-se de um teste que se pode usar para testar a qualidade de um ajustamento permitindo decidir se uma dada amostra provêm ou não de uma população com uma distribuição especı́fica. A ideia subjacente é a de comparar a distribuição empı́rica com a distribuição teórica. A justificação MF0910 8 2 de Dezembro de 2009 Capı́tulo VI Risco Operacional Secção: 3 teórica repousa sobre o facto da função de distribuição empı́rica ser assimptóticamente gaussiana. Em consequência pode verificar-se que os valores crı́ticos não dependem da distribuição que está a ser tomada em consideração na hipótese nula. Neste teste, a hipótese nula é de que a amostra provêm de uma dada distribuição (Kolmogorov) ou que duas amostras provêm da mesma distribuição (Smirnov). Representando por F a distribuição teórica tomada na hipótese nula e tendo-se que a função de distribuição empı́rica é dada, a partir da amostra X1 , . . . , XN , por: F̂ (X1 , . . . , XN )(x) = Número de elementos{i : Xi ≤ x} . N A estatı́stica do teste é dada por: DN (X1 , . . . , XN ) = sup | F̂ (X1 , . . . , XN )(x) − F (x) | x∈R Como DN converge para zero quando N cresce indefinidamente o princı́pio do teste é o de decidir pela rejeição da hipótese nula se para uma dada concretização da amostra (x1 , . . . xN ), a estatı́stica do teste DN (x1 , . . . xN ) é suficientemente pequena. Na tabela seguinte figuram os valores crı́ticos correspondentes a três valores correntes do nı́vel de significância, para o teste de Kolmogorov-Smirnov. α Valor crı́tico 10% √ 1.224/ N 5% √ 1.358/ N 1% √ 1.628/ N Observação 3. Um teste relevante para o ajustamento de distribuições discretas (ou para distribuições contı́nuas após transformação adequada) é o conhecido teste do χ2 . Outros testes usados para aferir a qualidade de um ajustamento de distribuições contı́nuas são os testes de Anderson-Darling e o de Cramer-Von Mises (veja-se, por exemplo, [Lewis 04][p. 86] ou [Ricci 05][p. 22]). 3 Severidade A análise estatı́stica da severidade tira proveito das técnicas que foram abordadas acima. Assim, muito sucintamente, referimos as etapas principais de uma modelização inicial da severidade. • Efectuar uma análise preliminar dos dados para determinar as principais caracterı́sticas destes incluindo a kurtosis. • Após escolha reflectida de uma dada distribuição, efectuar a estimação dos parâmetros e procurar validar essa escolha por meio de testes adequados. Uma primeira verificação de adequação passa pelos testes gráficos a que se poderão seguir os testes de ajustamento referidos na subsecção 2.7. • Na eventualidade dos resultados dos testes não serem favoráveis poder-se-á efectuar um ajustamento de uma distribuição de Pareto generalizada à cauda da distribuição observada utilizando as técnicas da teoria dos extremos. Poder-se-á ajustar MF0910 9 2 de Dezembro de 2009 Capı́tulo VI Risco Operacional Secção: 3 uma distribuição de tipo lognormal à parte da distribuição complementar à cauda. Para a aplicação da teoria dos valores extremos existem já pacotes como o EVIR para uso com o software R ou o Xtremes referido na bibliografia (veja-se [Reiss 01]). Seguidamente resumiremos alguns factos notáveis relativos a algumas das distribuições mais utilizadas na modelização inicial da severidade. Muitas outras distribuições podem ser usadas para esse efeito. Encorajamos o leito a consultar um qualquer texto clássico de Estatı́stica ou, por exemplo, [Abell 99][pp. 231–273], se estiver interessado numa exploração destas distribuições usando o software Mathematica. Para cada um destes modelos clássicos indicamos os momentos e alguns dos estimadores que se podem utilizar para os parâmetros dessas distribuições. 3.1 Gaussiana X _ Gaussiana (µ, σ), a variável tem distribuição Gaussiana de parâmetros µ número real, σ > 0 se a densidade de probabilidade se representa sob a forma " # 1 1 x−µ 2 fGaussiana (µ,σ) (x) = √ exp − 2 σ 2σπ A função caracterı́stica é: t2 σ 2 ϕGaussiana (µ,σ) (t) = exp iµt − 2 . Os momentos são dados por: E[X] = µ , V[X] = σ 2 . Os estimadores dos parâmetros obtidos pelo método dos momentos (veja-se [Cruz 02][p. 50]), são para uma amostra X = (X1 , X2 , . . . Xn ): v u n n X 1 u 1X µ̂ = X = Xi , σ̂ = √ t (Xi − X)2 n n i=1 i=1 Observação 4. Devido à sua omnipresença na modelização Estatı́stica é uma primeira escolha natural para distribuição modelo da severidade. Tal como já foi dito a propósito do teorema limite central é o modelo natural de um fenómeno cujo resultado deriva da soma dos resultados de um grande número de variáveis aleatórias independentes com dispersões controladas. 3.2 Lognormal X _ Lognormal(µ, σ), a variável tem distribuição lognormal ou logaritmicamente normal de parâmetros µ número real, e σ > 0 se a densidade de probabilidade se representa sob a forma " # 1 1 ln x − µ 2 fLognormal (µ,σ) (x) = √ exp − , x>0. 2 σ x 2σπ MF0910 10 2 de Dezembro de 2009 Capı́tulo VI Risco Operacional Secção: 3 Os momentos k E[X ] = exp 1 2 4 k σ + kµ , V[X] = exp(σ 4 + µ) exp(σ 4 ) − 1 . 2 Se Y _ Gaussiana (0, 1) então X := exp(σ 2 Y + µ é tal que X _ Lognormal (µ, σ). Em consequência, o estimador pelo método dos momentos considerando-se Zi = ln Xi − µ é (veja-se [Cruz 02][p. 51]): v u n n X 1X 1 u µ̂ = Zi = Z , σ̂ = √ t (Zi − Z)2 . n n i=1 i=1 Observação 5. Dado que se obtém esta distribuição tomando a exponencial de uma variável gaussiana é uma distribuição para variáveis aleatórias tomando valores positivos que se justifica em modelos em que o resultado deriva do produto dos resultados de um grande número de variáveis aleatórias independentes, não negativas e com dispersões controladas. 3.3 Exponencial X _ Exponencial (δ), a variável tem distribuição exponencial de parâmetro δ > 0 se a densidade de probabilidade se representa sob a forma h xi 1 fExponencial (δ) (x) = exp − x≥0 δ δ A função caracterı́stica é ϕExponencial (δ) (t) = δ . δ − it Os momentos são: E[X k ] = δ k k! , V[X] = δ 2 . Estimador pelo método dos momentos [Cruz 02][p. 52] 2 para θ = 0 que coincide com o estimador pelo método da verosimilhança máxima [Pestana 02][p. 515] n 1X δ̂ = Xi = X . n i=1 Observação 6. É uma distribuição de grande importância dado que serve para modelo do tempo de espera entre duas ocorrências de um fenómeno aleatório. A propriedade de ausência de memória representada pela fórmula seguinte P[X > t + s | X > s] = P[X > t] , implica que num modelo regido pela distribuição exponencial é como que de cada vez que ocorre o fenómeno aleatório, por exemplo no instante s tudo se passasse como se tivéssemos iniciado a observação nesse instante. 2 Após correcção da gralha óbvia. MF0910 11 2 de Dezembro de 2009 Capı́tulo VI Risco Operacional Secção: 3 3.4 Weibull X _ Weibull (α, β), a variável tem distribuição Weibull de parâmetros α e β > 0 se a densidade de probabilidade se representa sob a forma α α α−1 x fWeibull (α,β) (x) = α x exp − β β Os momentos são: E[X k ] = β k Γ ( 2 ) 1 1 k 2 2 − 2 Γ . + 1 , V[X] = β 2 Γ α α α α α Estimador pelo método da identificação dos percentis [Cruz 02][p. 53] onde c= ln ln 4 ln ln(4/3) e p.25 (respectivamente p.75 ) é o percentil de ordem 25% (respectivamente, o percentil de ordem 75%) c ln(p.25 ) − ln(p.75 ) ln ln 4 β̂ = α̂ = . c−1 ln(p.75 ) − ln(β̂) Observação 7. Esta distribuição é muito utilizada para a modelização do tempo de vida de objectos com muitas partes constituintes em que a falha do objecto ocorre quando uma das suas partes constituintes falha. 3.5 Pareto X _ Pareto (α, θ), a variável tem distribuição Pareto de parâmetros α > 0 e θ > 0 se a densidade de probabilidade se representa sob a forma αθα fPareto (α,θ) (x) = (x + θ)α+1 Dado que se tem Z Z xfPareto (α,β) (x) dx = e que Z Z xfPareto (α,β) (x)dx = θα (αx + θ) αθα x dx = (x + θ)α+1 (α − 1)(x + θ)α αθα x2 1 θα (−2θ2 − 2αθx − (α − 1)αx2 ) dx = , (x + θ)α+1 α2 − 3α + 2 (x + θ)α os momentos são dados por: (desde que α > 1) E[X] = αθ2 θ , (desde que α > 2) V[X] = . α−1 (α − 1)2 (α − 2) Estimadores pelo método dos momentos [Cruz 02][p. 53] Pn 2 Pn 2 Pn Pn 2 i=1 xi i=1 xi i=1 xi i=1 xi − − n n n n α̂ = 2 Pn 2 Pn 2 , θ̂ = 2 Pn 2 Pn 2 i=1 xi i=1 xi i=1 xi i=1 xi − 2 − 2 n n n n MF0910 12 2 de Dezembro de 2009 Capı́tulo VI Risco Operacional Secção: 4 Observação 8. Em controlo de qualidade usa-se a distribuição de Pareto para modelizar perdas. Entre outros fenómenos que podem ser modelizados com as distribuições de Pareto, para as caudas das distribuições respectivas, podemos referir as flutuações do preço das acções e os rendimentos individuais. 3.6 Gama X _ Gama (α, θ), a variável tem distribuição gama de parâmetros α > 0 e θ > 0 se a densidade de probabilidade se representa sob a forma: x 1 x α fGama (α,θ) (x) = exp − x>0. xΓ(α) θ θ A função caracterı́stica tem por expressão: ϕGama (α,θ) (t) = 1 . (1 − iθt)α Os momentos são dados por: E[X k ] = α(α + 1) . . . (α + k − 1)θk , V[X] = αθ2 . Estimadores pelo método dos momentos ver [Cruz 02][p. 54] ou [Lewis 04][p. 46] Pn Pn 2 2 Pn 2 i=1 xi i=1 xi i=1 xi − n n n Pn α̂ = Pn 2 Pn . 2 , θ̂ = i=1 xi i=1 xi i=1 xi − n n n Observação 9. Um dos usos da distribuição gama é o de representar a distribuição da diferença entre o valor máximo e o valor mı́nimo de uma amostra de uma população normal. Um outro uso é o de modelizar situações fı́sicas tais como tempos de espera. Observação 10. Em [Cruz 02][p. 46] pode encontrar-se uma tabela que descreve a comparação dos comportamentos de cauda para um conjunto de distribuições relevantes e que reproduzimos seguidamente. Distribuição P[X ≥ x] Weibull α > 1 a e−x , A > 1 Exponencial e−x Weibull α < 1 a e−x Lognormal x−a ln x Pareto, DVEG x−a A existência de caudas pesadas numa distribuição leva a problemas de ajustamento que necessitam para ser resolvidos das técnicas associadas à teoria dos valores extremos. 4 Value at Risk Uma das medidas de risco mais correntemente usadas é o Value at Risk (VaR). O VaR pode ser definido como uma estimativa estatı́stica de uma perda com a propriedade que com uma dada probabilidade (pequena) é possı́vel que sobrevenha essa perda ou uma perda superior, num dado perı́odo de tempo (em geral pequeno). Mais concretamente tem-se a definição seguinte. MF0910 13 2 de Dezembro de 2009 Capı́tulo VI Risco Operacional Secção: 5 Definição 3 (Value at Risk (VaR)). Dado um grau de confiança α ∈]0, 1[ o VaRα de uma perda, representada por uma variável aleatória L, ao nı́vel de confiança α é dado pelo mais pequeno número l tal que a a probabilidade que a perda L exceda esse número l é menor ou igual a 1 − α, isto é: VaRα (L) = inf{l ∈ R : P[L > l] ≤ 1 − α} . O VaRα é assim o quantil (qα ) da distribuição da variável aleatória L ou seja qα = F ← (1 − α) . São correntes os valores α = 0.95 ou α = 0.99. Note-se que α = 0.99 corresponde a uma acontecimento que ocorre uma em cada mil vezes. O VaR como medida de risco tem graves inconvenientes. Um dos mais relevantes é o não ser sub-aditiva isto é para duas variáveis aleatórias K e L, representando dois tipos distintos de risco operacional, não se verifica necessariamente VaRα (K + L) ≤ VaRα (K) + VaRα (L) , isto é pode ocorrer que: VaRα (K + L) > VaRα (K) + VaRα (L) . Deste inconveniente resulta que efectuar a análise de uma carteira de riscos calculando os VaR para cada um dos riscos e somando-os para obter um majorante do VaR da carteira é um processo sem justificação salvo em casos muito especiais. Foram propostos dois caminhos para evitar este grave inconveniente. Um primeiro consiste em utilizar a composição de riscos através da teoria das cópulas 3 . Um outro consiste em considerar o expected shortfall (ES) definido como: ESα = E[L | X > VaRα (L)] . O ES é uma medida de risco coerente e em particular já é sub-aditiva. Observação 11. No endereço http://www.math.ethz.ch/riskometer/ poderá encontrar uma funcionalidade na Internet que permite apreciar os resultados permanentemente actualizados de um estudo comparativo de métodos distintos de aplicação do VaR a vários ı́ndices bolsistas. Na secção seguinte veremos como determinar o VaR de uma forma mais robusta para as distribuições que naturalmente ocorrem na análise dos riscos operacionais. 5 Teoria dos Valores Extremos A teoria dos valores extremos é a técnica adequada para a estimação de quantis elevados de uma distribuição de perdas dado que permite ajustar um modelo para a distribuição 3 No endereço http://www.fenews.com/fen39/one time articles/copula/copula-vaR.htm poderá encontrar uma introdução rápida à estimação do VaR multivariado por meio da teoria das cópulas MF0910 14 2 de Dezembro de 2009 Capı́tulo VI Risco Operacional Secção: 5 da cauda de um conjunto de dados usando apenas a informação sobre acontecimentos extremos. No entanto, é imperativo que haja um conjunto de dados suficientes para a calibração dos modelos. Como pressupostos de base importantes supõe-se que as perdas são independentes e identicamente distribuı́das. É frequente observar nos dados reais que as perdas são não estacionárias o que obriga a extensões não triviais dos métodos introduzidos (veja-se [Chavez 04]). Por outro lado, uma estimativa do risco global que se obtêm somando os riscos calculados em cada um dos tipos de conjunto de classes de risco não é coerente. Uma alternativa neste contexto é a de utilizar a agregação de distribuições de risco através da teoria das cópulas. 5.1 Introdução Consideraremos o seguinte problema: determinar um modelo rigoroso para as perdas operacionais X1 , X2 , . . . Xq acima de um dado limiar (threshold) u. Supõe-se que X1 , . . . , Xn são observações independentes e identicamente distribuı́das (iid), de uma lei, para nós desconhecida, tendo F como função distribuição. Uma resposta resumida a este problema pode ser dada usando a teoria dos valores extremos, podendo concretizar-se nos seguintes dois passos. • Realiza-se primeiramente um ajustamento de uma distribuição de Pareto generalizada (DPG) aos excessos das perdas sobre o limiar u, representados por Wj := Xi − u j = 1, . . . , n , i = 1, . . . , n , Xi > u , das perdas operacionais X1 , X2 , . . . Xq . Este tipo de distribuições é dado pela definição seguinte. Definição 4. A distribuição de Pareto generalizada (DPG) com parâmetro ξ é dada por definição por: − 1 ξ ξx 1− 1+ β if ξ 6= 0 Gξ,β (x) = 1 − exp(− x ) if ξ=0 β No caso dos modelos de risco operacional tem-se regra geral que ξ > 0. Tal conduz a que os excessos Wj para j = 1, . . . , n tenham uma distribuição de Pareto com ı́ndice de cauda 1/ξ isto é: P[Wj > x] =x→+∞ 1 L(x) , x1/ξ em que L é uma função regular. Note-se que se toma como hipótese de partida que F pertence ao domı́nio maximal de atracção de uma distribuição de valores extremos generalizada (DVEG) (Fréchet, Weibull or Gumbel) de forma a podermos aplicar o teorema de Fisher Tippett. Uma DVEG é por definição uma distribuição do tipo seguinte. MF0910 15 2 de Dezembro de 2009 Capı́tulo VI Risco Operacional Secção: 5 Definição 5. A distribuição de valores extremos generalizada (DVEG) com parâmetro ξ é dada por definição por: ( −1 exp −(1 + ξx) ξ if ξ 6= 0 Hξ (x) = −x exp (−e ) if ξ=0 Sendo que consoante o valor do parâmetro ξ assim a denominação da distribuição: – Quando ξ > 0 temos a distribuição de Fréchet; – Quando ξ < 0 temos a distribuiçãoWeibull; – Quando ξ = 0 temos a distribuição Gumbel. Defina-se Fu (x) como a probabilidade que a perda exceda o limiar u numa quantidade inferior ou igual a x, isto é, Fu (x) é a função de distribuição dos excessos condicionada pelas perdas serem superiores ao limiar u, ou mais concretamente: Fu (x) := P[X − u ≤ x | X ≥ u] . Em virtude de o teorema de Balkema, de Haan 74 & Pickands 75, distribuição de Pareto generalizada aparece como distribuição limite para a distribuição dos excessos sobre o limiar u quando u cresce, isto é, Fu (x) converge para uma DPG Gξ,β com parâmetro ξ, quando o limiar u converge para o ponto extremo à direita de F que é o ponto dado por: x0 := sup{x ∈ R : F (x) < 1} . Podemos pois aproximar Fu (x) por Gξ,β(u) (x) para um valor de u judiciosamente escolhido. Para referência apresentamos o enunciado do teorema já referido que preside a este passo do método. Teorema 4 (Balkema, de Haan 74 & Pickands 75). A distribuição F está no domı́nio de atracção maximal de uma distribuição DVEG Hξ se e só se para β = β(u) adequado se verificar: lim u↑x0 sup 0≤x<x0 −u | Fu (x) − Gξ,β(u) (x) |= 0 . • Seguidamente efectuamos um ajustamento de uma DPG com três parâmetros à distribuição condicional empı́rica das perdas e uma estimativa dos quantis a 99% and 95% destas perdas para a obtenção do VaR. 5.2 Método de aplicação e problemas na implementação Resumindo, o método de implementação funciona com os seguintes passos: • Aproxima-se a distribuição dos excessos sobre os nı́veis por uma DPG Gξ,σ em que os parâmetros ξ e σ são estimados por exemplo pelo método de estimação da verosimilhança máxima; MF0910 16 2 de Dezembro de 2009 Capı́tulo VI Risco Operacional Secção: 6 • Ajusta-se uma distribuição não condicionada para obter um modelo para as caudas e determinar os quantis para esta distribuição. • Estima-se o parâmetro ξ. • Determina-se o nı́vel u em que u deve ficar muito perto do ponto final da distribuição a aproximação, melhor (teoricamente) mas, se se verificar que os dados acima do nı́vel u são insuficientes pode ficar em causa a estabilidade e fiabilidade nas estimativas dos quantis. Com o fim de determinar um bom valor para u pode usar-se numa primeira aproximação a função excesso médio empı́rica correspondente à função excesso médio e(u) ambas definidas seguidamente. Definição 6. A função excesso médio é dada por definição por: e(u) := E[X − u | X > u] . A função excesso médio empı́rica é dada por: Pn + i=1 (Xi − u) en (u) := P . n i=1 I{Xi >u} O gráfico de en (u) dá indicação sobre a existência (declive positivo), ou não (declive negativo - caso da normal- ou nulo - caso da exponencial), de caudas pesadas na distribuição. 6 Frequência Para a modelização da frequência dos eventos indutores de risco operacional aplicase uma metodologia idêntica à que foi proposta para a modelização da severidade. De atender agora que as variáveis associadas à frequência são discretas. De entre os modelos mais comuns salientamos os seguintes. 6.1 Poisson É de uso comum na modelação da frequência em que um dado evento ocorre durante um intervalo determinado de tempo ou numa dada área ou volume. X(Ω) = {0, 1, 2, } ∀k ∈ X(Ω) P[X = k] = λk e−λ k! E[X] = λ V[X] = λ MF0910 17 2 de Dezembro de 2009 Capı́tulo VI Risco Operacional Secção: 7 6.2 Binomial Negativa Numa sucessão de tiragens de Bernoulli independentes uma variável aleatória que conte o número de fracassos antes do n-ésimo sucesso tem distribuição binomial negativa. Tem-se assim que X(Ω) = {0, 1, 2, } n+k+1 n ∀k ∈ X(Ω) P[X = k] = Cn−1 p (1 − p)k E[X] = n(1 − p) p V[X] = n(1 − p) p2 7 As perdas agregadas O modelo consensualmente aceite para perdas operacionais agregadas é uma adaptação do modelo colectivo das Ciências Actuariais e consiste em supor que Yt a variável aleatória que descreve essas perdas à data t se escreve ! Nt +∞ X n X X Yt = Xi = Xi 1I{Nt =n} i=1 n=0 i=1 em que a variável aleatória Nt é dada pelo modelo da frequência e em que X1 , . . . Xn , . . . é uma sucessão de variáveis aleatórias independentes e com distribuição idêntica ao modelo encontrado para a severidade X. A questão natural agora é a da determinação da distribuição de Yt . 7.1 Solução Analı́tica Esta determinação directa é em geral impossı́vel a não ser em casos particulares especiais. Um método útil usa as transformações funcionais, por exemplo a função caracterı́stica ou a função geradora de momentos. Com efeito, considerando as funções caracterı́sticas, ii h h PNt ψYt (u) := E eiuYt = E E eiu i=1 Xi | Nt Supondo que Nt , X1 , . . . Xi . . . são independentes, por uma propriedade importante da esperança condicional (ver [Resnick 01, p. 350] ou [Hoffmann-Jorgensen 94, p. 452]), " n # h PNt i h Pn i Y iu i=1 Xi iu i=1 Xi iuXi E e | Nt = n = E e =E e = (ψX (u))n , i=1 pelo que, pelas propriedades da esperaça condicional, h PNt i E eiu i=1 Xi | Nt = (ψX (u))Nt MF0910 18 2 de Dezembro de 2009 Capı́tulo VI Risco Operacional Secção: 8 e, finalmente, ψYt (u) = E (ψX (u))Nt . Por exemplo, se (Nt )t≥0 for o processo de Poisson de parâmetro λ ter-se-á que +∞ +∞ X X (λt)k ψYt (u) = E (ψX (u))Nt = . ψX (u))k P[Nt = k] = (ψX (u))k e−λt k! k=0 k=0 Ou seja: ψYt (u) = e−λt eλtψX (u) = e−λt(1−ψX (u)) . Caso seja possı́vel inverter esta função caracterı́stica ter-se-á a distribuição de Yt numa representação analı́tica. Um caso interessante é o de X ter a distribuição gama (veja-se também a secção 3.6) com parâmetro de forma α e parâmetro de escala inverso β cuja densidade e função caracterı́stica são dadas, respectivamente, por fX (x) = β α α−1 −βx 1 x e ψX (u) = k Γ(α) (1 − iu β) Mas até neste caso, aparentemente simples, a determinação da distribuição de Yt necessita o uso de cálculo numérico (veja-se o ficheiro do Mathematica RscOp20091201). 7.2 Solução Simulada ou Aproximada Referiremos dois métodos aproximados com alguma relevância prática. • Se a variável aleatória N tomar valores grandes com grande probabilidade é justificável o teorema limite central que nos permite afirmar Y _ Gaussiana (E[Y ], σ(Y )) No entanto, esta aproximação normal não é considerada fiável em Ciências Actuariais pelo que o seu uso no risco operacional não pode ser recomendado. • Uma solução advogada na prática consiste em simular a distribuição de Y para, dos resultados dessa simulação, extrair as medidas de risco. A metodologia é simples e está descrita e exemplificada completamente em [Cruz 02][p. 105]. Consiste em simular numa coluna a variável N . Para cada linha simular uma amostra da distribuição da severidade com dimensão exactamente igual ao valor que a variável N simulada tem nessa linha. Para cada linha somar os valores correspondentes a cada um dos termos da amostra da distribuição da severidade. Finalmente somar os resultados obtidos nas linhas. Efectuámos assim uma repetição da simulação. Para completar a simulação efectuar-se-á um número suficiente de repetições (entre 10 000 e 100 000) obtendo-se assim uma amostra da distribuição das perdas agregadas de acordo com o modelo. As técnicas de cálculo das medidas de risco, por exemplo o VaR, podem agora ser aplicadas a esta amostra. MF0910 19 2 de Dezembro de 2009 Capı́tulo VI Risco Operacional Secção: 8 8 Bibliografia Comentada Nesta secção apresentamos comentários que pretendem guiar o eventual leitor para na consulta à bibliografia e às referências apresentadas no final. • [Abell 99] Esta obra colectiva é muito completa e permite uma exploração, usando o software Mathematica, das principais técnicas estatı́sticas elementares tais como: a estatı́stica descritiva, alisamento de dados e séries cronológicas, inferência para amostras simples e para pares de amostras, análise de variância, regressões e métodos não paramétricos. Pode revelar-se extremamente útil para quem pretender uma familiarização simultânea com os métodos da estatı́stica e o uso do Mathematica. • [Basel 01] Trata-se de um documento que descreve a aproximação do Comité de Basileia para a avaliação e controlo do risco operacional. É indispensável que os técnicos que se ocupam da implementação das metodologias de avaliação e controlo do risco operacional conheçam precisamente a filosofia dos organismos de supervisão sobre esse assunto. • [Chavez 04] Demonstra-se a extensão da teoria dos extremos aplicada ao risco operacional no caso em que os dados não são estacionários, isto é grosso modo, apresentam uma variabilidade no tempo que sugere que as leis probabilı́sticas que regulam o fenómeno variam no tempo. • [Chavez 05] Uma versão mais elaborada, completa, e detalhada do artigo [Chavez 04]. A leitura é aconselhada dado que os autores não só demonstram a utilidade das técnicas que propõem mas também chamam a atenção dos leitores para as as condições especiais em que as técnicas podem fornecer resultados fiáveis. • [Gomes04] Um texto que recolhe e sistematiza informação útil e actual sobre a teoria dos valores extremos e suas aplicações à análise do risco. • [Pestana 02] Para quem procura uma introdução, um auxiliar de estudo e uma obra de referência de referência nas ciências estatı́sticas recomendo esta obra. Escrita muito cuidadosamente, o leitor poderá nela encontrar a par de muitos exemplos detalhados que permitem uma sensibilização para a arte de aplicar a Estatı́stica a problemas concretos, muitas • [Cruz 02] Uma referência básica que recomendamos para o estudo inicial dos métodos quantitativos aplicáveis ao risco operacional. É um texto detalhado de nı́vel correspondendo a uma iniciação informada que reflecte bem a filosofia subjacente à aplicação dos métodos quantitativos. Alguma precaução é necessária no que toca às fórmulas apresentadas. Estas devem ser objecto de verificação independente antes de serem postas em aplicação. Pode ser lida em conjunto com [Lewis 04]. • [Embrechts 97] Obra fundamental para um estudo detalhado da teoria dos valores extremos. Necessita para um pleno aproveitamento de alguns conhecimentos MF0910 20 2 de Dezembro de 2009 Capı́tulo VI Risco Operacional Secção: 8 iniciais em Estatı́stica mas mesmo sem estes conhecimentos pode ser estudada permitindo uma primeira abordagem bem sucedida à arte de aplicar a teoria aos problemas concretos. • [Embrechts 03] Uma chamada de atenção para as limitações que tem a aplicação da teoria dos valores extremos em situações em que os dados utilizados nas estimações não têm a estrutura e as qualidades adequadas. • [Embrechts 04] Os autores passam em revista as principais ideias subjacentes à aplicação da teoria dos valores extremos ao risco operacional. A referência à teoria da ruı́na deriva do facto de o modelo colectivo das Ciências Actuariais ser utilizado na quantificação do risco operacional na determinação de um modelo das perdas agregadas envolvendo a severidade e a frequência. • [Ivchenko 90] É uma obra de grande qualidade, relativamente exigente sob o ponto de vista técnico, mas muito clara e concisa. Permite um estudo das principais ideias da Estatı́stica Matemática esclarecendo com exemplos escolhidos as noções apresentadas. É complementado com um óptimo livro de exercı́cios. • [Lewis 04] Pode considerar-se uma obra de iniciação que permite uma familiarização progressiva com conceitos úteis a um nı́vel introdutório. É acompanhada de ficheiros Excel que ilustram os noções apresentadas. Recomendamos a leitura desta obra aos leitores que pretendam uma sensibilização introdutória aos métodos da Estatı́stica aplicada ao risco operacional. Ganha em ser lida em conjunto com [Cruz 02]. • [Reiss 01] Para uma exploração aprofundada t̀eoria dos valores extremos e suas aplicações. Uma versão académica do software Xtremes acompanha o livro permitindo tratar completamente variados exemplos. • [Ricci 05] Trata-se de uma abordagem à estimação usando o software R. Detalha alguns procedimentos importantes e explica como efectuar interpretações dos resultados para algumas das técnicas apresentadas no ajustamento de distribuições. • [Rolski 99] É um texto de referência para muitas matérias que não foram aqui abordadas mas que são da maior importância para a análise do risco operacional uma vez que algumas das técnicas utilizadas têm sido exploradas no âmbito das aplicações actuariais. Referências [Abell 99] M. L. Abell, J. P. Braselton, J. A. Rafter, Statistics with Mathematica , Academic Press 1999. [Basel 01] Basel Committee on Banking Supervision, Consultative Document Operational Risk, Bank for International Settlements 2001. MF0910 21 2 de Dezembro de 2009 Capı́tulo VI Risco Operacional Secção: 8 [Chavez 04] V. Chavez-Demoulin, P. Embrechts, Advanced Extremal Models for Operational Risk, preprint (http://www.math.ethz.ch/%7Ebaltes/ftp/papers.html). [Chavez 05] V. Chavez-Demoulin, P. Embrechts, J. Nes̆lehová, Quantitative Models for Operational Risk: Extremes, Dependence and Aggregation, submetido ao Journal of Banking and Finance preprint (http://www.math.ethz.ch/%7Ebaltes/ftp/papers.html). [Gomes04] M. Ivette Gomes, Extremes and Risk Management, in proceedings of Stochastic Finance 2004, Autumn School and International Conference (disponı́vel on-line). [Hoffmann-Jorgensen 94] J. Hoffmann-Jorgensen, Probability with a View Toward Statistics. Volume I, Chapman & Hall , 1994. [Pestana 02] D. D. Pestana, S. F. Velosa Introdução à Probabilidade e à Estatı́stica, Volume I, Fundação Calouste Gulbenkian, Lisboa 2002. [Cruz 02] M. G. Cruz, Modeling measuring and hedging operational risk. John Wiley & Sons, Inc. 2002. [Embrechts 97] P. Embrechts, C Klüppelberg, T. Mikosch, Modelling Extremal Events for insurance and Finance. Springer Verlag, 1997. [Embrechts 03] P. Embrechts, H. Furrer, R. Kaufmann, Quantifying Regulatory Capital for Operational Risk, Derivatives Use, Trading & Regulation. 9(3), 217–233, 2003. [Embrechts 04] P. Embrechts, G. Samorodnitsky, Ruin Theory Revisited: Stochastic Models for Operational Risk, In: Risk Management for Central Bank Foreign Reserves (Eds. C. Bernadell et al.) European Central Bank, Frankfurt a.M., 243-261, 2004. [Ivchenko 90] G. I. Ivchenko, Yu. I. Medvedev, Mathematical Statistics, Mir Publishers Moscow, 1990. [Lewis 04] N. da Costa Lewis, Operational Risk with Excel and VBA. John Wiley & Sons, Inc. 2004. [Reiss 01] R. D. Reiss, M Thomas Statistical Analysis of Extreme values, second edition, Birkhauser Verlag, 2001. [Resnick 01] S. I. Resnick A Probability Path, second printing, Birkhauser Boston, 2001. [Ricci 05] V. Ricci, Fitting Distributions with R, release 0.4, 21 February 2005. [Rolski 99] T. Rolski, H. Schmidli, Volker Schmidt, J. Teugels Stochastic Processes for Insurance and Finance, John Wiley & Sons, 1999. MF0910 22 2 de Dezembro de 2009
Documentos relacionados
Probabilidade para Finanças
de axiomas muito razoaveis. Para presentar estes axiomas precisamos da noção de σ−algebra. Para definir este objeto denotemos por Ω o conjunto de possı́veis eventos de um experimento, por exemplo...
Leia mais