Matemática Financeira - Universidade Nova de Lisboa

Transcrição

Matemática Financeira - Universidade Nova de Lisboa
Distribuiç ã o Estimada:
[email protected], 2.4, 2111.D
0.00002
0.000015
0.00001
5. ´ 10-6
50 000
100 000
150 000
200 000
Colecção Métodos Estocásticos
para a Matemática Financeira III
Matemática Financeira
Notas de Lições
Manuel L. Esquı́vel
Professor Associado
de
Probabilidade e Processos Estocásticos
April 4, 2013
O Modelo Binomial
MF0910
26 de Novembro de 2009
1 Modelo a um Perı́odo
Apresentamos seguidamente o modelo binomial a um perı́odo. A nossa apresentação
segue de perto a de Tomas Björk na obra de consulta obrigatória para uma iniciação
bem sucedida à matemática financeira actual [Björk 98]. No entanto, o leitor beneficiará, certamente, com outras leituras sobre este tema para as quais são indicadas na
bibliografia algumas referências. Para descrevermos o modelo binomial a um perı́odo
consideramos os seguintes pressupostos e notações.
• Designamos o tempo pela variável t. Representar-se-á por t = 0 a data de hoje,
que será o inı́cio do perı́odo e, por t = 1 a data de amanhã, a data final do perı́odo.
• Consideramos que o mercado é constituı́do por dois activos transaccionáveis que
descriminamos a seguir.
– A obrigação (bond1 ), designando-se por Bt o preço da obrigação à data t;
– A acção (stock), designando-se por St o preço da acção à data t.
• Pressupomos também que a dinâmica dos preços dos activos, isto é, a evolução dos
preços está definida do modo a seguir descrito.
– A obrigação tem uma dinâmica determinı́stica dada por:
(
B0 = 1
preço à data t = 0
B1 = 1 + R preço à data t = 1
onde R representa a taxa de juro spot para o perı́odo ou, alternativamente,
R é a taxa de juro paga pelo banco por um depósito numa conta bancária.
– A acção tem uma dinâmica aleatória, isto é, definida por um processo estocástico. Note-se que esta designação deve ser entendida genericamente.


S0 = s (preço à data t = 0
s · u com probabilidade pu

S1 =
s · d com probabilidade pd
1
De modo geral indicaremos as denominações financeiras em lı́ngua Inglesa para mais cómoda referência do leitor à literatura internacional sobre este tema.
1
Capı́tulo I
Modelo Binomial
Secção: 2
Assim sendo, temos que a dinâmica do activo com risco admite a representação
seguinte.
S1 = s · Z
onde Z é uma variável aleatória tal que:
(
u com probabilidade pu
Z=
d com probabilidade pd
• Podemos assim indicar a seguinte representação esquemática para as dinâmicas dos
activos. Supondo que d < u e pu + pd = 1, que é condição para que P = (pu , pd )
represente uma probabilidade, tem-se para o activo sem risco,
Bt : 1 −→ 1 × (1 + R)
e para o activo com risco:
su com probabilidade pu e u ∼ up ∼↑
S0 = s
@
@
@
R
@
sd com probabilidade pd e d ∼ down ∼↓.
Fica deste modo definido o contexto em que se desenrolará o nosso estudo do modelo
binomial a um perı́odo.
2 Carteiras (Portfolios) e Arbitragem
Nesta secção estudar-se-á uma noção fundamental no contexto dos modelos de mercados
financeiros, a noção de carteira. Esta noção, que modela um conjunto de investimentos
com determinada coerência, será determinante na obtenção de um preço adequado para
produtos financeiros derivados.
2.1 A noção de carteira
Comecemos com a definição formal de carteira.
Definição 1. Uma carteira no mercado de activos (B, S) é dada por h = (x, y) em que
se tem
• x é o número (quantidade) de obrigações detidas na carteira;
• y é o número (quantidade) de acções detidas na carteira.
MF0910
2
26 de Novembro de 2009
Capı́tulo I
Modelo Binomial
Secção: 2
Observação 1. Tanto x como y podem ser negativos. O significado desta possibilidade
é o seguinte. Por exemplo, se x = 3 detemos três obrigações o que se denomina por long
position no activo sem risco; se y = −2 vendemos duas acções o que se denomina por
short position no activo sem risco (veja-se [Etheridge 02][p. 2]).
2.2 Hipóteses sobre o modelo binomial a um perı́odo
Convem precisar algumas hipóteses simplificadoras sobre o funcionamento do mercado
deste modelo. Estas hipóteses podem aparecer como irrealistas, no sentido em não se
aplicam aos mercados reais, mas simplificam significativamente o estudo do modelo.
• São permitidas carteiras com posições não inteiras e com sinal arbitrário, isto é,
h = (x, y) ∈ R2
• O bid-ask spread é nulo, isto é, a diferença entre o preço de compra e o preço de
venda dos activos é nula.
• Os custos de transacção são nulos.
• Há liquidez completa do mercado, isto é, a compra e venda de quaisquer quantidades é sempre possı́vel.
Observação 2. Note-se que dada uma carteira h = (x, y), o seu valor de mercado verifica
o seguinte.
Em t = 0 é determinı́stico;
Em t = 1 é estocástico uma vez que depende do valor de B e S e este último é
estocástico.
A cada carteira corresponde um valor determinado de forma natural em função dos
preços dos activos.
Definição 2. O processo valor da carteira h, denominado Vth é definido, para t ∈
{0, 1}, por:
Vth = x · Bt + y · St .
Isto é,
(
V0h = x + y · s
V1h = x · (1 + R) + y · s · Z
Descreve-se seguidamente uma eventualidade que, a ocorrer, significa que o mercado
não é eficiente.
Definição 3. Uma carteira de arbitragem, no modelo binomial a um perı́odo, é toda
a carteira h = (x, y) tal que se verifica:
V0h = 0 e ainda, V1h > 0 com probabilidade um .
MF0910
3
26 de Novembro de 2009
Capı́tulo I
Modelo Binomial
Secção: 2
Observação 3. Uma carteira de arbitragem é, por esta definição, um processo quase certo
de de realizar proveitos sem investimento. Nesse caso, o mercado tem uma deficiência
grave. É sempre possı́vel ganhar arbitrariamente muito. Uma tal possibilidade nos
mercados contraria a noção de funcionamento eficiente em que as leis da oferta e da
procura conduzem, em permanência, o mercado a alcançar equilı́brios.
O resultado seguinte caracteriza, com uma condição simples sobre os parâmetros do
modelo, os mercados em que não existem oportunidades de arbitragem.
Proposição 1. Num mercado satisfazendo as hipóteses descritas acima o mercado é
livre de arbitragem se e só se:
d ≤ (1 + R) ≤ u
(1)
Demonstração. Suponha-se que se verifica
(1 + R) > u isto é s(1 + R) > s · u
Então ter-se-á que
s(1 + R) > s · d
e logo, é sempre mais rentável investir em obrigações do que em acções. Seja, agora,
a carteira h = (s, −1), isto é, vendemos a acção (short position) e investimos tudo na
obrigação (long position). Calcule-se o valor desta carteira. Temos
(
s(1 + R) − su > 0 se Z = u
V0h = 0 e V1h = s(1 + R) − sZ =
s(1 + R) − sd > 0 se Z = d .
Logo, V1h > 0 com probabilidade um. Em consequência, há uma oportunidade de
arbitragem.
Suponha-se agora verificada a condição 1. Considere-se uma carteira h arbitrária tal
que V0h = 0, isto é, tal que x + ys = 0, isto é ainda, x = −ys. Então ter-se-á:
V1h
(
ys(u − (1 + R)) se Z = u
=
ys(d − (1 + R)) se Z = d
Suponha-se que y > 0. Então, h é uma carteira de arbitragem se e só se:
u > (1 + R) d > (1 + R)
o que é impossı́vel tendo em conta a condição 1. Faz-se o mesmo raciocı́nio para y < 0
e a conclusão segue imediatamente.
Observação 4. Impõe-se a seguinte interpretação da cadeia de desigualdades na condição 1.
Num mercado livre de arbitragem, o retorno na acção não pode dominar sempre o retorno na obrigação e o retorno na obrigação não pode dominar sempre o retorno na
acção.
MF0910
4
26 de Novembro de 2009
Capı́tulo I
Modelo Binomial
Secção: 2
2.3 Medidas de Martingala
Para efeito de uma utilização futura relembremos este resultado simples da geometria
elementar dos conjuntos convexos.
Proposição 2. Sejam d, z, u números reais tais que d < u. Tem-se então que:
d ≤ z ≤ u ⇔ ∃λ ∈ [0, 1] tal que z = λu + (1 − λ) · d .
Demonstração. Considere-se a função f (λ) := λu + (1 − λ)d definida para λ ∈ [0, 1].
0
Trata-se de uma função continuamente derivável, com função derivada dada por f (λ) =
u − v > 0. Tem-se que f é estritamente crescente, logo injectiva sobre [0, 1]. Como
se tem f (0) = d e f (1) = u, se se verificar d < 1 + R < u, pelo carácter injectivo de
f , existe necessariamente λ0 ∈]0, 1[ tal que f (λ0 ) = 1 + R. Para determinarmos λ0
podemos observar que a variável λ representa a proporção de proximidade de f (λ) a d.
Com efeito, recorde-se que f (0) = d. Em consequência deveremos ter:
λ0 =
(1 + R) − d
.
u−d
(2)
Como se tem
u − (1 + R)
,
u−d
verifica-se imediatamente, com um cálculo trivial que f (λ0 ) = 1 + R.
1 − λ0 =
(3)
Observação 5. Em consequência do resultado acima sobre os conjuntos convexos tem-se
então que:
∃qu , qd ≥ 0 , qu + qd = 1, 1 + R = qu · u + qd · d .
Com efeito, basta considerar:
qu =
(1 + R) − d
u − (1 + R)
e qd =
.
u−d
u−d
Associemos, agora, ao par (qu , qd ) uma probabilidade Q do modo seguinte.
Q[Z = u] = qu , Q[Z = d] = qd .
Se EQ for a esperança matemática relativamente a Q temos
1
1
1
EQ [S1 ] =
[qu su + qd sd] =
· s · (1 + R) = s
1+R
1+R
1+R
e logo
s=
1
EQ [S1 ] .
1+R
Isto é, o preço (s) hoje, isto é à data t = 0, é o valor esperado (EQ (S1 )) do preço amanhã,
descontado à taxa R, ou seja multiplicado por 1/(1 + R) mas atenção, o valor esperado
é calculado em relação à medida Q. Esta medida foi construı́da supondo ausência de
arbitragem. Uma medida de probabilidade com esta propriedade é denominada medida
neutra face ao risco, medida ajustada ao risco ou ainda medida de martingala
MF0910
5
26 de Novembro de 2009
Capı́tulo I
Modelo Binomial
Secção: 2
Definição 4. A medida Q é uma medida de martingala para o modelo binomial a
um perı́odo, se e só se a seguinte condição se verifica:
S0 =
1
EQ [S1 ]
1+R
(4)
A proposição seguinte mostra que uma caracterização do modelo binomial a um
perı́odo e sem arbitragem é a existência de uma medida de martingala.
Proposição 3. O modelo de mercado é livre de arbitragem se e só se existe uma medida
de martingala.
Demonstração. Suponhamos que com Q = (qu , qd ), sendo qu + qd = 1, se verifica a
condição 4 do enunciado. Temos então que:
S0 =
1
1
1
EQ [S1 ] =
EQ [S0 · Z] =
[qu S0 u + qd S0 d] .
1+R
1+R
1+R
Supondo S0 6= 0 termos então:
1 + R = qu · u + qd · d
(5)
o que mostra que d ≤ 1 + R ≤ u. Tal como como já sabemos, esta relação é equivalente
à ausência de arbitragem. Suponhamos que o mercado é livre de arbitragem, o que é
equivalente à condição d ≤ 1 + R ≤ u pela proposição 1. Pela proposição 2 sabemos
então que:
∃qu , qd ∈ [0, 1], qu + qd = 1 , 1 + R = qu · u + qd · d .
Considerando a probabilidade Q definida pelo par (qu , qd ) virá a partir da fórmula 5 que
S0 =
1
1
[qu S0 u + qd S0 d] =
EQ [S1 ] ,
1+R
1+R
pelo que a probabilidade Q é uma medida de martingala.
Proposição 4. Para o modelo binomial a medida de martingala Q é dada pelo vector
de (qu , qd ) ∈ R2 definido por:
qu =
(1 + R) − d
u − (1 + R)
e qd =
.
u−d
u−d
(6)
Demonstração. As fórmulas definindo o par (qu , qd ) são exactamente as fórmulas 2 e 3.
2.4 Produtos financeiros derivados no modelo binomial
Um produto financeiro derivado derivative tem o seu cash flow definido a partir de um
outro activo denominado o activo subjacente.
Definição 5. Um direito contingente (contingent claim) ou ainda um derivado
financeiro é uma qualquer variável aleatória função do preços da acção à data t = 1.
MF0910
6
26 de Novembro de 2009
Capı́tulo I
Modelo Binomial
Secção: 2
Observação 6. Um direito contingente X = φ(S1 ) é um contrato que paga X unidades
monetárias a quem o possuir à data t = 1. A função φ é a função contrato.
Exemplo 1. Uma call option com strike price K. Consideremos a seguintes hipótese:
s·d<K <s·u.
Se acontecer que S1 > K, então:
• compra-se a acção ao preço K
• vende-se a acção ao preço su com lucro su − K
Na eventualidade alternativa, isto é, se se verificar que S1 < K, então:
• a opção não tem valor.
Logo, podemos concluir que o direito contingente X = φ(S1 ) se pode representar por:
(
su − K se Z = u
X=
0 se Z = d
tendo-se então a função de contrato φ dada por:
(
φ(u) = su − K
φ(d) = 0
Em consequência, com notações já conhecidas tem-se que:
X = (S1 − K)+ .
Podemos agora considerar dois problemas fundamentais.
• Qual é o preço justo para um direito contingente?
• Na eventualidade de sermos parte tomadora ou emissora de um direito contingente como é que cobrimos o risco eventual associado a essa posição tomadora ou
emissora?
Observemos que se Π(t, X) for o preço de X no instante t então Π(1, X) está determinado uma vez que necessariamente, atendendo à definição de X, temos que Π(1, X) = X.
Temos pois que determinar qual o valor de Π(0, X). Para esse efeito vamos considerar a
possibilidade de reproduzir o cash flow gerado pelo direito contingente por meio de uma
carteira adequada.
Definição 6. Um direito contingente é atingı́vel (reachable) se e só se existe uma
carteira h tal que o valor desta carteira à data t = 1 iguala certamente X, isto é:
V1h = X com probabilidade igual a 1.
Quando assim é, h é uma carteira de cobertura (hedging portfolio) ou uma carteira
réplica (replicating portfolio) Um mercado em que todos os direitos contingentes podem
ser replicados ou cobertos diz-se um mercado completo.
MF0910
7
26 de Novembro de 2009
Capı́tulo I
Modelo Binomial
Secção: 3
Observação 7. O conceito de carteira réplica de um direito contingente X, permite-nos
intuir qual deverá ser o preço a pagar por este direito. Com efeito, se X for replicável
então não há qualquer diferença em deter o direito contingente X ou a carteira réplica
visto que, em qualquer caso, à data t = 1 se verifica sempre V1h = X. Em consequência,
o preço justo do direito deverá ser V0h ou seja o valor à data t = 0 da carteira h.
A proposição seguinte confirma esta observação.
Proposição 5. Seja X atingı́vel com carteira réplica h. Se o preço em t = 0 de X for
diferente de V0h , então há oportunidades de arbitragem.
Demonstração. Suponhamos que se tem V0h > Π(0, X). A ideia consiste em, à data
t = 0, vender o mais caro (a carteira que é composta de activos transaccionáveis) comprar
o mais barato (o direito contingente X) e colocar a diferença no activo sem risco. À data
t = 1 os cash flows gerados pelo direito contingente e pela carteira compensam-se mas
continuamos a ter o que investimos no activo sem risco. Esta ideia pode-se representar
na tabela seguinte. Note-se que a uma posição short corresponde uma venda e logo uma
entrada e a uma posição long corresponde uma compra e logo uma saı́da, pelo que por
exemplo, na segunda coluna Π(0, X) está multiplicado por −1.
Posição short na carteira
Posição long no direito
Posição no activo sem risco
Cash flow total (soma nas colunas)
Data t = 0
+V0h
−Π(0, X)
−(V0h − Π(0, X))
0
Data t = 1
−V1h
+Π(0, X)
(V0h − Π(0, X)) · (1 + R)
(V0h − Π(0, X)) · (1 + R)
Pode pois constatar-se que sem investimento inicial foi possı́vel realizar os lucros certos
(V0h − Π(0, X)) · (1 + R) havendo assim uma possibilidade de arbitragem.
Proposição 6. Se o mercado no modelo binomial for livre de arbitragem então, o mercado é completo.
Demonstração. Para X = φ(Z) mostre-se que existe uma carteira h = (x, y) tal que
V1h = X com probabilidade um, isto é:
V1h = φ(u) se (Z = u)
e também,
V1h = φ(d) se (Z = d)
isto é, ainda, solução para o sistema
(
(1 + R)x + suy = φ(u)
(1 + R)X + sdy = φ(d)
Como u < d temos que existe a solução única do sistema com duas equações lineares e
duas incógnitas, que nos define a carteira réplica.
x=
1
uφ(d) − dφ(u)
1 φ(u) − φ(d)
·
ey= ·
.
1+R
u−d
s
u−d
(7)
Em consequência, X é atingı́vel e como X é arbitrário o mercado é completo.
MF0910
8
26 de Novembro de 2009
Capı́tulo I
Modelo Binomial
Secção: 3
3 Apreçamento Neutro Face ao Risco
Em consequência da proposição 6 é possı́vel apreçar qualquer direito contingente X.
Com efeito, pelo princı́pio geral do apreçamento que temos vindo a aplicar e que diz que
é equivalente deter o direito contingente ou a carteira de cobertura desse direito, virá:
Π(0, X) = V0h ,
como pela proposição 6 se tem que:
x=
1
uφ(d) − dφ(u)
1 φ(u) − φ(d)
·
y= ·
1+R
u−d
s
u−d
virá que:
Π(0, X) = V0h = x + sy =
1 uφ(d) − dφ(u) φ(u) − φ(d)
=
+
=
1+R
u−d
u−d
1 ((1 + R) − d)φ(u) (u − (1 + R))
+
φ(d) =
=
1+R
u−d
u−d
1
1
[qu φ(u) + qd φ(d)] =
EQ [X].
=
1+R
1+R
Note-se que a fórmula Π(0, X) = 1/(1 + R) EQ [X] diz-nos que o preço à data t = 0 de X
é o valor esperado de X, relativamente à medida de probabilidade neutra face ao risco,
descontado relativamente à taxa de juro do activo sem risco.
Podemos pois concluir resumindo os resultados até agora obtidos na proposição seguinte.
Proposição 7. Se o modelo binomial for livre de arbitragem então o preço livre de
arbitragem de um activo contingente X é dado por:
Π(0, X) =
1
EQ [X]
1+R
onde a medida de martingala Q é definida univocamente pela relação:
S0 =
1
EQ [S1 ]
1+R
Temos que Q = (qu , qd ) com:
qu =
(1 + R) − d
u − (1 + R)
e qd =
.
u−d
u−d
e a carteira de cobertura h = (x, y) é dada por:
x=
MF0910
1
uφ(d) − dφ(u)
1 φ(u) − φ(d)
·
e y= ·
1+R
u−d
s
u−d
9
26 de Novembro de 2009
Capı́tulo I
Modelo Binomial
Secção: 3
Observação 8. O cálculo do preço livre de arbitragem processa-se como se o mundo fosse
neutro face ao risco (veja-se [Hull 00][p. 205]). Qualquer agente do mercado é indiferente
ao risco e a sua expectativa para o retorno do activo com risco é que este retorno seja
igual a R.
Exemplo 2. Consideremos, neste exemplo demonstrativo os seguintes dados:
• O movimento de subida do preço do activo com risco é caracterizado por:
u = 1.2 e pu = 0.6 .
O movimento de descida do preço do activo com risco é caracterizado por:
d = 0.8
pd = 0.4
A dinâmica dos preços é pois descrita por:
(
120 com probabilidade 0.6
S0 = 100 −→ S1 =
80 com probabilidade 0.4
• A taxa de juro do activo sem risco é dada por:
R=0
Suponhamos que calculávamos o valor esperado descontado segundo a probabilidade
P. Terı́amos então:
1
EP [S1 ] = 1 × [120 × 0.6 + 80 × 0.4] = 104
1+R
Observação 9. Podemos em consequência observar que:
• dado que o preço hoje, que é igual a 100, é inferior a este valor 104, pode concluir-se
que o mercado tem aversão ao risco.
• dado que: 0.8 < 1 < 1.2 sabemos que o mercado é livre de arbitragem.
Considere-se agora uma call option com preço de exercı́cio K = 110. O direito
contingente X é dado por


120 − 110 = 10 se S1 = 120
X = (S1 − K)+ =
ou


0 se S1 = 80
A questão a que temos de responder é pois, qual o preço justo para esta call option?
A primeira resposta possı́vel é a de que o preço é o valor esperado, descontado,
segundo a probabilidade P que dá:
1
× [10 × 0.6 + 0 × 0.4] = 6 .
1+0
MF0910
10
26 de Novembro de 2009
Capı́tulo I
Modelo Binomial
Secção: 4
A segunda resposta possı́vel é a que corresponde a efectuarmos o apreçamento por via
da probabilidade de martingala. Temos deste modo:
qu =
(1 + 0) − 0.8
0, 2
=
= 0.5 logo qd = 0.5
1.2 − 0.8
0, 4
e
1
[10 × 0.5 + 0 × 0.5] = 5 .
1+0
Observe-se que o preço livre de arbitragem é inferior ao preço obtido na primeira resposta.
De acordo com a proposição a carteira de cobertura é a seguinte.
1
1.2 × 0 − 0.8 × 10
1 10 − 0
1
x=
= −20 e y =
·
= .
1+0
0.4
100
0.4
4
A interpretação destes resultados é a seguinte. Para constituir a carteira de cobertura
da call option X:
Π(0, X) =
• contrai-se um empréstimo de 20 unidades monetárias
• e compra-se 25% de uma acção
Tem-se então que o valor desta carteira é dado à data t = 0,
1
V0h = −20 + × 100 = 5
4
e à data t = 1 por,
(
−20 + 41 × 120 = 10 se S1 = 120
V1h =
−20 + 91 × 80 = 0 se S1 = 80
Mostrando-se assim que se trata efectivamente de uma carteira réplica.
Observação 10 (Comentário Fundamental). O preço livre de arbitragem é o preço justo
e adequado. Com efeito, suponhamos que o preço de mercado, à data t = 0, da opção era
seis unidades monetárias. Vendendo uma call option por seis unidades monetárias podese aplicar cinco unidades monetárias na carteira de cobertura e colocar uma unidade
monetária em obrigações no activo sem risco. Em t = 1, com a carteira, cobria-se as
exigências da call option vendida e dispunha-se de uma unidade monetária em obrigações.
Deste modo o mercado ofereceria uma oportunidade de arbitragem.
A existência de um preço justo e adequado para todo o direito contingente num
modelo binomial a um perı́odo e livre de arbitragem decorre da existência de uma carteira
de cobertura;
Tal como foi visto na proposição 6, o carácter completo do modelo binomial decorre
da existência de um sistema de duas equações construı́das a partir de dois activos
descrevendo dois estados do mundo. Há nesta observações como que um meta-teorema:
um modelo será completo se o número de activos for igual ao número de estados do
mundo.
Este último resultado sugere uma das limitações do modelo binomial a mais do que
um perı́odo obtido por sobreposição de modelos binomiais a um perı́odo numa árvore
binária arbitrŕia. Com efeito, se exigirmos uma adequação à distribuição de preços real
deveremos ter um número de perı́odos significativo, isto é por exemplo a 20 perı́odos
teremos de ter 220 ' 106 activos para o mercado ser completo.
MF0910
11
26 de Novembro de 2009
Capı́tulo I
Modelo Binomial
Secção: 4
4 O modelo binomial multi-perı́odo
Nesta secção estudar-se-á um modelo que se obtem pela concatenação de modelo binomiais idênticos a um perı́odo. Trata-se de um modelo simples que já permite aplicações
práticas relevantes. Consideramos um horizonte temporal T ∈ N que corresponde ao
número de perı́odos do modelo. Indicamos por t ∈ {0, · · · , T } as sucessivas datas correspondentes ao inı́cio de cada perı́odo. O mercado é composto por dois activos, nomeadamente, um activo com risco, a acção com o preço à data t dado por St e um activo
sem risco, a obrigação, com o preço à data t dado por Bt . Considera-se no mercado uma
taxa de juro determinı́stica para o activo sem risco que é indicada por R. A evolução
temporal dos preços dos activos é descrita pelas respectivas dinâmicas.
Seja S0 o preço do activo com risco à data t = 0. A evolução do preço do activo com
risco nos primeiros três perı́odos está esquematizada na figura seguinte.
S0 u 3
S0 u 2
@
@
@
@
R
S0 u
S0 u 2 d
@
@
@
@
R
S0
S0 ud
@
@
@
@
@
@
R
@
@
R
S0 v
S0 ud2
@
@
@
@
R
S0 d 2
@
@
@
@
R
MF0910
12
S0 d 2
26 de Novembro de 2009
Capı́tulo I
Modelo Binomial
Secção: 4
Formulemos agora as leis de evolução dos activos. O activo sem risco evolui seguindo
a lei descrita pelas seguintes fórmulas.
(
B0 = 1
Bn+1 = (1 + R)Bn
Trata-se de um retorno aditivo. O activo com risco tem a sua dinâmica descrita pelas
relações seguintes.
(
S0 = s
Sn+1 = Sn · Zn ,
em que Z0 , Z1 , . . . , ZT −1 são variáveis aleatórias independentes e identicamente distribuı́das com Z com a distribuição descrita por:
P[Z = u] := pu = 1 − P[Z = d] := 1 − pd
Tal como no modelo binomial a um perı́odo podemos definir a noção de carteira.
Definição 7. Uma carteira ((portfolio) ou um processo carteira é um processo estocástico tal que:
h ≡ ht = (xt , yt ) para t = 1, · · · , T ,
tal que,
ht = ht (S0 , S1 , · · · , St−1 ) com h0 ≡ h1
O processo valor correspondente à carteira h é definido por:
Vth = xt (1 + R) + yt St t = 1, · · · , T .
A interpretação desta definição é a seguinte.
• xt representa a quantidade de dinheiro (obrigação) investida no banco à data t − 1,
data inicial do perı́odo, e conservada assim até à data t data final do perı́odo.
• yt representa a quantidade do activo com risco compradas à data t−1 e conservada
assim até à data t.
• A carteira, quando é constituı́da usa, apenas, a informação disponı́vel até à data
t − 1.
• Vth é o valor de mercado da carteira h à data t, carteira constituı́da e detida desde
a data t − 1 .
Impõe-se, no modelo binomial multiperı́odo restringir as carteiras úteis. Esta restrição pode ser entendida como limitando o número de activos nos quais existirá investimento. Com efeito, um consumo pode ser entendido como um investimento se o bem
consumido for como tal considerado.
Definição 8. A carteira h é autofinanciada se e só se a seguinte condição é verificada:
∀t = 0, . . . , T − 1
MF0910
xt · (1 + R) + yt · St = xt+1 + yt+1 · St .
13
(8)
26 de Novembro de 2009
Capı́tulo I
Modelo Binomial
Secção: 4
Podemos interpretar esta definição do modo seguinte.
• A condição 8 exprime um equilı́brio de balanço contabilı́stico. Em cada data t o
valor de mercado da carteira definida por (xt , yt ), carteira que foi constituı́da na
data t − 1, é igual ao valor dispendido na compra da nova carteira (xt+1 , yt+1 )
constituı́da na data t (e detida até à data t + 1).
• Assim sendo, a variação no valor do processo carteira fica a dever-se apenas à
variação do valor dos dois activos que nela estão incluı́dos e não à entrada (ou
saı́da) de capital para consumo ou investimento noutros activos.
Tal como no modelo a um perı́odo, temos que impor ao mercado a ausência de
possibilidades de arbitragem o que deverá implicar um funcionamento eficiente deste
mercado.
Definição 9. Uma possibilidade de arbitragem é um processo carteira autofinanciado h tal que se verificam as seguintes propriedades:
1. V0h = 0
2. P[VTh ≥ 0] = 1
3. P[VTh > 0] > 0
O estudo já feito no modelo a um perı́odo pode ser imediatamente utilizado no
modelo multiperı́odo.
Proposição 8 (Condição necessária de não existência de arbitragem). Para um modelo
livre de arbitragem verificam-se as condições expressas na seguinte cadeia de desigualdades.
d ≤ (1 + R) ≤ µ .
Demonstração. A demonstração é idêntica à do caso a um perı́odo considerando uma
sub-árvore qualquer, nomeadamente, a sub-árvore inicial.
Observação 11. Veremos adiante que esta condição é necessária e suficiente para a
ausência de arbitragem.
No que vai seguir-se faremos, pois, a seguinte hipótese. Supomos que d < u e que
d ≤ (1 + R) ≤ u.
Definição 10. A probabilidade de martingala Q = (qu , qd ) é definida pela relação:
1
EQ [St+1 | St = s] .
(9)
1+R
Esta definição é a generalização natural da definição do modelo a um perı́odo uma vez
que no modelo multiperı́odo, que estamos a estudar, todas as árvores são semelhantes.
s=
Proposição 9. A probabilidade de martingala Q, definida acima, é única e é dada, tal
como no modelo binomial a um perı́odo, por:
qu =
MF0910
(1 + R) − d
u − (1 + R)
e qd =
.
u−d
u−d
14
(10)
26 de Novembro de 2009
Capı́tulo I
Modelo Binomial
Secção: 4
Demonstração. A observação da figura acima 4, mostra-nos que podemos considerar
apenas o primeiro perı́odo pelo que a relação 9é equivalente a
s=
1
EQ [S1 | S0 = s]
1+R
e esta fórmula foi demonstrada anteriormente no modelo binomial a um perı́odo.
Definição 11. Um direito contingente é uma variável aleatória X dada por X = φ(ST )
onde
φ : R −→ R
é a função contrato.
Observação 12. Podemos interpretar esta definição desta forma. O detentor de um
direito contingente X recebe o montante X à data t = T . Note-se que os direitos
contingentes considerados são simples, isto é,
X = X(ST ) ,
o que quer dizer que dependem apenas do preço do activo no instante final. Tal como no
modelo a um perı́odo, podem formular-se agora os dois problemas fundamentais relativos
aos direitos contingentes.
• Determinar (Π(t, X))t=0,··· ,T o processo de preços justos para o direito contingente
X.
• Determinar a melhor cobertura possı́vel do risco associado à emissão ou subscrição
um direito contingente.
Vamos utilizar o método das carteiras réplicas. Impõe-se, por isso, definir os direitos
contingentes replicáveis.
Definição 12. Um direito contingente é atingı́vel se e só se existe uma carteira autofinanciada h tal que
VTh = X com probabilidade 1.
Quando assim é h é uma carteira de cobertura ou carteira réplica do activo X. Se
todos os direitos contingentes forem atingı́veis o modelo de mercado é dito completo.
Observação 13 (Princı́pio de apreçamento). Tal como no modelo binomial a um perı́odo,
se X é atingı́vel com carteira réplica h o preço justo para X é dado por:
∀t ∈ {0, · · · , T } Π(t, X) = Vth .
Com efeito, suponhamos X atingı́vel com processo carteira h. A t fixo suponhamos
dispor do montante Vth . Investindo Vth na carteira h, como a carteira é auto-financiada
podemos reconstituı́-la em cada data u > t até que à data t = T a carteira terá o
valor (aleatório) VTh . Como VTh = X com probabilidade um, temos que h e X são
financeiramente equivalentes pelo que devem ter o mesmo preço. Se tal não for o caso
pode mostrar-se que existem oportunidades de arbitragem tal como foi feito no modelo
binomial a um perı́odo.
MF0910
15
26 de Novembro de 2009
Capı́tulo I
Modelo Binomial
Secção: 4
Proposição 10. Seja X atingı́vel com carteira réplica h. Se à data t for possı́vel comprar
X a um preço mais barato que Vth (ou vender a um preço mais caro que Vth )então existe
uma oportunidade de arbitragem.
Demonstração. A ideia da demostração é idêntica à que foi usada no modelo binomial
a um perı́odo. Compra-se X vendendo Vth e espera-se até T realizando proveitos certos.
No modelo binomial multiperı́odo todos os direitos contingentes podem ser apreçados
por meio de carteiras réplica.
Proposição 11. O modelo binomial multiperı́odo é completo.
Demonstração. Esta demonstração deverá ser realizada como exercı́cio. Para o efeito
dever-se-á estudar um exemplo e formalizar seguidamente a demonstração.
Exemplo 3. Propomo-nos agora estudar um exemplo numérico. Os dados são os seguintes
T = 3, S0 = 10, u = 1.2, d = 0.8, pu = 0.6 e pd = 0.4 Consideramos R = 0.
Seja uma call option europeia com data de exercı́cio T = 3 e preço de exercı́cio
K = 10.
Representemos na árvore binomial a evolução dos preços do activo com risco correspondente a estes dados. Na coluna da direita representamos ainda o cash flow correspondente à call option.
X = (ST − K)+ = max(S3 − 10, 0)
MF0910
16
26 de Novembro de 2009
Capı́tulo I
Modelo Binomial
Secção: 4
17.3
7.3
@
R
@
11.5
1.5
14.4
@
@
12
@
@
@
R
@
9.6
10
@
@
@
@
@
R
@
@
R
@
7.7
8
0
@
@
@
R
@
6.4
@
@
@
R
@
5.1
0
Podemos agora determinar, por indução retrógrada, os preços da call option em cada
data, preços que são dados pelos valores nessas datas de uma carteira réplica. Com efeito
ter-se-á para uma dada carteira réplica h que.
V3h = X ,
pelo que as duas coluna mais à direita, na figura seguinte, serão iguais.
MF0910
17
26 de Novembro de 2009
Capı́tulo I
Modelo Binomial
Secção: 4
7.3
7.3
@
R
@
1.5
1.5
4.4
@
@
2.6
@
@
@
R
@
0.8
1.5
@
@
@
@
@
R
@
@
R
@
0.4
0
0
0
0
@
@
@
R
@
0
@
@
@
R
@
Seguidamente, apliquemos a definição da probabilidade de martingala. Deveremos
ter que
1
s=
EQ [S3 | S2 = s]
1+R
Portanto para o nodo superior correspondente a t = 2 deveremos ter
s = qu 7.3 + qd 1.5 = 0.5 × 7.3 + 0.5 × 1.5 = 4.4
onde qu = qd = 0.5 foram obtidas com as fórmulas 10. Procedendo de igual modo para
os outros nodos teremos a árvore preenchida como na figura.
Podemos assim concluir que Π(0, X) = 1.5. Este valor é o preço da call option à
data t = 0.
Implementou-se no programa Excel no ficheiro ArvoreBinAula.xls este processo de
apreçamento permitindo-nos, assim, estudar em detalhe a constituição da carteira e a
verificação de que a carteira permite replicar os cash flows da call option.
4.1 Conclusões
Podemos agora concluir resumindo em duas proposições o estudo do modelo binomial
multiperı́odo.
MF0910
18
26 de Novembro de 2009
Capı́tulo I
Modelo Binomial
Secção: 5
Proposição 12 (Algoritmo Binomial). Seja um direito contingente X = φ(ST ) atingı́vel
com carteira réplica h. Se St (k) = suk dt−k k = 0, · · · , t onde k representa o número de
movimentos ascendentes de amplitude u e, portanto, (t, k) representa o nodo k à data t,
então temos:
Vt (h) =
1
[qu Vt+1 (h + 1) + qd Vt+1 (h)] e VT (h) = φ(suh dT −h ) ,
1+R
com
qu =
u − (1 + R)
(1 + R) − d
e qd =
.
u−d
u−d
(11)
e
xt (h) =
uVt+1 (h) − dVt+1 (h + 1)
1
1
Vt+1 (h + 1) − Vt+1 (h)
, yt (h) =
·
.
1+R
u−d
St−1 (h − 1)
u−d
Sendo que o preço livre de arbitragem para K é dado por V0h (X) no instante zero.
Demonstração. Por indução aplicando os resultados anteriores.
Proposição 13 (Apreçamento). O preço livre de arbitragem em t = 0 do direito contingente X é dado por:
1
Π(0, X) =
EQ [X]
(1 + R)T
Sendo Q = (qu , qd ) a medida de martingala definida por 11 tem-se que:
T X
1
T
Π(0, X) =
quh qdT −h φ(suh dT −h )
T
h
(1 + R)
h−0
Demonstração. Se y for o número de movimentos ascendentes na árvore pode escrever-se:
X = φ(ST ) = φ(suy dT −y ) .
Como y tem distribuição binomial tem-se que se verifica a fórmula acima.
Proposição 14 (Condições para a ausência de arbitragem). No modelo binomial multiperı́odo, a condição d < (1 + R) < u é equivalente à ausência de arbitragem.
Demonstração. Seja h um processo carteira auto-financiado tal que:
h
i
h
i
P VTh ≥ 0 = 1 e P VTh > 0 > 0
É certo que então
V0h =
h i
1
Q
E
VTh > 0.
(1 + R)T
Logo h não é uma carteira livre de arbitragem.
MF0910
19
26 de Novembro de 2009
Capı́tulo I
Modelo Binomial
Secção: 5
5 Sobre as aplicações práticas
O modelo binomial pode ser utilizado tanto para apreçar direitos contingentes como para
constituir carteiras de cobertura para esses activos. Para esse efeito, os parâmetros do
modelo devem ser determinados de acordo com os dados reais relativos aos preços do
activo subjacente. Indicamos sumariamente uma forma de o fazer que pode ser estudada
em detalhe nas obras [Hull 00][p. 338–404] e [Beninga 97][p. 161–178]. Tomemos r a
taxa de juro para o activo sem risco calculada em contı́nuo para um intervalo de tempo
[0, U ]. Temos então que :
1 + R = exp(r∆t)
em que R é a taxa de retorno aditiva do activo sem risco para um perı́odo e ∆t = U/T em
que, relembramos, T é o número de perı́odos. Seja σ a variância de Z. Pode mostrar-se
que se tem então, aproximadamente e considerando u = 1/d uma convenção proposta
por Cox, Ross e Rubinstein, que:
u = eσ
√
∆t
d = e−σ
√
∆t
,
sendo qu e qd dados pelas fórmulas habituais.
Referências
[Bannock & Manser] G. Bannock, W. Manser, The Penguin international dictionary of
finance, Penguin books, 1995.
[Barreto 96] I. Barreto, Manual de Finanças, Abril/ControlJornal, 1996.
[Beninga 97] S. Beninga, Financial Modelling, The MIT Press, 1997.
[Baxter & Rennie96] M. Baxter, A. Rennie, Financial Calculus, Cambridge University
Press, 1996.
[Berck & Sydsaeter 93] P. Berck, K. Sydsaeter, Manual de Matemática para Economistas, McGraw-Hill, 1993.
[Björk 98] T. Björk, Arbitrage Theory in Continuous Time, Oxford University Press,
1998.
[Bouleau 98] N. Bouleau, Martingales et marchés financiers, Éditions Odile Jacob, 1998.
[Dana & Jeanblanc 03] R.-A. Dana, M. Jeanblanc Financial Markets in Continuous
Time, Springer Verlag, 2003.
[Elliot & Kopp 99] R. J. Elliot, P. Ekkehard Kopp, Mathematics of Financial Derivatives, Springer, 1999.
[Etheridge 02] A. Etheridge, A course in financial calculus, CAmbridge University Press,
2002.
MF0910
20
26 de Novembro de 2009
Capı́tulo I
Modelo Binomial
Secção: 5
[Hull 00] J. C Hull, Options Futures and other derivatives, fourth edition, Prentice-Hall
International Inc., 2000.
[Pliska 97] S. R. Pliska, Introduction to Mathematical Finance, Blackwell Publishers,
1997.
[Quintart & Zisswiller 94] A. Quintart, R. Zisswiller, Teoria Financeira, Caminho. 1994.
[Musiela & Rutkowski 97] M. Musiela, M. Rutkowski, Martingale methods in financial
modelling, Springer, 1997.
[Shiryaev 99] A. N. Shiryaev, Essentials of Stochastic Finance, World Scientific, 1999.
MF0910
21
26 de Novembro de 2009
Modelos Discretos de Mercados Financeiros
MF0910
24 de Novembro de 2009
1 Modelos para mercados finitos
1.1 Introdução e motivação
Suponhamos um contrato que nos dá o direito, mas não a obrigação, de comprar a um
dado preço K, denominado preço de exercı́cio e numa determinada data T , denominada
data de exercı́cio, um activo financeiro denominado activo subjacente, cujo preço corrente
S0 é conhecido. Um tal contrato denomina-se uma call option. Suponhamos ainda que
a taxa de juro sem risco, por exemplo, a taxa de juro de uma conta bancária, é constante
e dada por R. Suponhamos ainda que o preço do activo financeiro na data de exercı́cio
poderá tomar apenas dois valores S u e S d , com probabilidades, respectivamente, pu e pd .
O problema fundamental colocado nesta situação é o de determinar um preço justo para
o contrato que acabámos de descrever. Com efeito, uma vez que este contrato dá ao seu
possuidor um direito na data de exercı́cio, ainda que opcional, tem um valor corrente
que procuramos determinar. Para tornarmos concreta a situação, suponhamos que:
S0 = 280 , K = 280 , S u = 320 , S d = 260 .
Vamos adoptar um modelo em que há dois estados do mundo Ω = {ω1 , ω2 }. Seja o preço
do activo financeiro, à data T , dado por:
ST (ω1 ) = S u = 320 e ST (ω2 ) = S u = 260 .
1.1.1
O método das probabilidades naturais ou subjectivas
Vamos supor que um dado investidor encara o mercado como um bear market, isto é,
tal que:
P[{ω1 }] = 0.2 = 1 − P[{ω2 }] .
Observação 1. Note que um urso é considerado um animal pachorrento e que quando
ataca, ataca com uma pata num movimento descendente. Talvez por isto, a denominação
de bear market, para um mercado com fraca probabilidade de fazer subir os preços, está
bem atribuı́da.
Encarando ST como uma variável aleatória temos, obviamente, que:
ST = 320I{ω1 } + 260I{ω2 } .
1
Capı́tulo II
Modelos Discretos
Secção: 1
Determinemos CT , o cashflow gerado pelo contrato, ou seja, o payoff terminal ou à data
de exercı́cio. Se se verificar ST = 320 então, o contrato pode ser exercido, compra-se o
activo pelo preço de exercı́cio 280 e vende-se o activo no mercado com uma receita de
320 − 280 = 40; se se verificar que ST = 320 então, o contrato não deverá ser exercido
sendo o cahhflow nulo. É óbvio, pois, que:
CT = 40I{ω1 } isto é CT (ω1 ) = 40 e CT (ω2 ) = 0 ,
isto é, temos a expresão importante seguinte para o payoff terminal da call option:
CT = max(ST − K, 0) = (ST − K)+ .
Utilizemos, para o apreçamento, o princı́pio do valor esperado actualizado do payoff
terminal. Então, Π(0) o preço corrente da call option virá:
Π(0) = EP [
CT
1
]=
(P[{ω1 }]CT (ω1 ) + P[{ω2 }]CT (ω2 )) = 7.62 .
1+R
1+R
Vamos supor, agora, que um outro investidor encara o mercado como um bull market,
isto é, tal que:
P[{ω1 }] = 0.8 = 1 − P[{ω2 }] .
Observação 2. Note que um touro é considerado um animal agressivo e que quando
ataca, ataca com um movimento ascendente da cabeça e dos chifres. Talvez por isto, a
denominação de bull market, para um mercado com grande probabilidade de fazer subir
os preços, está bem atribuı́da.
Utilizando o princı́pio do valor esperado actualizado do payoff terminal, para apreçar
a call option, virá:
Π(0) = EP [
CT
1
]=
(P[{ω1 }]CT (ω1 ) + P[{ω2 }]CT (ω2 )) = 30.48 .
1+R
1+R
Observação 3. Note-se que o método que empregámos usando as probabilidades naturais
ou subjectivas, (na medida em que estas probabilidades dependem da atitude de cada
investidor), não fornece um preço único para o contrato uma vez que, tal como vimos,
o preço depende destas probabilidades subjectivas. Uma tal solução para o problema
do apreçamento deixa muito a desejar na medida em que escolhendo adequadamente as
probabilidades poderemos obter, praticamente, qualquer valor num dado intervalo para
o preço do contrato.
1.1.2
O método das carteiras réplicas
Segundo [6], o método das carteiras réplicas foi introduzido por Sharpe em 1978 e Rendleman & Barter em 1979, isto é, praticamente, cinco anos após a contibuição fundamental
de Black, Scholes e Merton. Este método consiste em realizar uma carteira com uma
certa quantidade do activo financeiro subjacente e com uma certa quantidade de dinheiro numa conta bancária, de tal forma que o valor da carteira na data de exercı́cio
coincida com o payoff terminal do contrato. Neste sentido, a carteira replica ou reproduz
o contrato. A carteira Φ aparece, pois, definida inicialmente como um par de números
Φ = Φ0 = (α0 , β0 ), em que:
MF0910
2
24 de Novembro de 2009
Capı́tulo II
Modelos Discretos
Secção: 1
• a quantidade α0 representa o número de acções do activo subjacente;
• a quantidade β0 representa o número de unidades monetárias na conta bancária.
Observação 4. Note-se que:
• Consideramos que a taxa de juro activa é igual à taxa de juro passiva.
• Admitimos que (α0 , β0 ) ∈ R2 . Tal significa, para α0 < 0, que constituı́mos uma
posição short (curta) no activo subjacente recebendo dinheiro por uma venda não
concluı́da dado não termos em nossa posse o activo que vendemos. Admitir β0 < 0
significa que contraı́mos um empréstimo em unidades monetárias no montante |β0 |.
• Após constituição da carteira, na data inicial, a composição desta não se altera até
à data terminal. Designemos por 0 a data inicial e, por Vt (Φ), o valor da carteira
Φ nas datas t = 0 e t = T . É óbvio que o valor da carteira numa dada data se
obtem adicionando os termos (um para o activo subjacente e outro para a conta
bancária) que resultam do produto quantidade pelo preço, nessa data, do activo
considerado. Assim sendo:
V0 (Φ) = α0 × S0 + β0 e VT (Φ) = α0 × ST + β0 (1 + R) .
Pela descrição que fizémos acima de carteira réplica deveremos ter que:
CT = VT (Φ) .
Note-se que se trata de uma igualdade entre variáveis aleatórias pelo que se tem de facto:
CT (ωi ) = VT (Φ)(ωi ) i = 1, 2 .
Reescrevendo esta expressão, tomando em conta a definição de VT (Φ), temos o sistema
de equações:
(
VT (Φ)(ω1 ) = α0 × ST (ω1 ) + β0 (1 + R) = CT (ω1 )
VT (Φ)(ω2 ) = α0 × ST (ω2 ) + β0 (1 + R) = CT (ω2 ) .
Com os dados concretos que tomámos este sistema pode escrever-se,
(
α0 × 320 + β0 × 1.05 = 40
α0 × 260 + β0 × 1.05 = 0 ,
tendo este sistema a solução única dada por:
α0 =
2
e β0 = −165.08 .
3
A nossa carteira (α0 , β0 ) constitui-se, pois, da seguinte forma. Por cada call option
em que estamos short temos α0 = 2/3 unidades de activo subjacente e contraı́mos um
empréstimo de β0 = −165.08 unidades monetárias. Por construção, a carteira assim
constituı́da permite reproduzir o payoff terminal do contrato.
MF0910
3
24 de Novembro de 2009
Capı́tulo II
Modelos Discretos
Secção: 1
Na posse desta carteira réplica é possı́vel agora apreçar o contrato usando o princı́pio de não arbitragem que se pode enunciar, neste contexto, na forma seguinte:
se dois produtos têm o mesmo valor à data T então deverão ter o mesmo valor à data
inicial zero. Desta forma, o preço do contrato será o custo inicial de constituição da
carteira réplica ou seja, ainda, o investimento inicial necessário apara adquirir a carteira
réplica. Temos pois:
Π(0) = V0 (Φ) = α0 × S0 + β0 =
2
× 280 − −165.08 = 21.59 .
3
Observação 5. Em consequência do que expusémos podemos observar que:
• O preço do contrato aparece definido univocamente pois depende apenas de α0 e
β0 que ficaram determinados como solução de um sistema de equações algébricas.
• O preço obtido não depende das probabbilidades subjectivas, ou seja, não depende
da forma sob a qual cada agente avalia a evolução mais provável do mercado.
• Na determinação do preço do contrato usámos, apenas, o preço de exercı́cio do
contrato, o preço corrente do activo financeiro subjacente, as variações deste activo
ao longo do tempo e, a taxa de juro de uma conta bancária ou de um activo sem
risco.
1.1.3
O método das medidas martingalas
Suponhamos que é possı́vel encontrar uma medida de probabilidade P∗ sobre o espaço
de probabilidade Ω = (ω1 , ω2 ), munido da álgebra -σ maximal, tal que P∗ coincida
com a probabilidade natural nos conjuntos de probabilidade nula e tal que S ∗ , o preço
actualizado à taxa de juro R seja uma P∗ martingala. Temos, então, que sendo S ∗ o
preço actualizado à taxa de juro R dado por:
S0∗ =
S0
ST
ST
= S0 e ST∗ =
=
,
0
1
(1 + R)
(1 + R)
(1 + R)
a condição de martingala exprime-se por:
∗
S0∗ = EP [ST∗ ] .
(1)
Uma medida verificando a consição (1) é denominada medida de martingala ou ainda, por
razões óbvias, medida neutra face ao risco. Determinemos, com os dados concretos,
a solução do problema de apreçamento que já encontrámos por outros dois métodos.
Podemos dizer que P∗ é determinada por p∗ ∈]0, 1[ tal que, por exemplo p∗ =
∗
P [{ω1 }], uma vez que necessariamente virá: 1 − p∗ = P∗ [{ω2 }]. Podemos reescrever
a fórmula (1) na seguinte forma:
S0∗ =
1
× (p∗ × ST (ω1 ) + (1 − p∗ ) × ST (ω2 )) ,
1+R
o que resolvendo em ordem a p∗ nos dá:
p∗ = P∗ [{ω1 }] =
MF0910
(1 + R) × S0 − ST (ω2 )
ST (ω1 ) − ST (ω2 )
4
24 de Novembro de 2009
Capı́tulo II
Modelos Discretos
Secção: 1
e. por conseguinte,
1 − p∗ = P∗ [{ω2 }] =
ST (ω1 ) − (1 + R) × S0
.
ST (ω1 ) − ST (ω2 )
Para apreçarmos o contrato usamos o princı́pio do valor esperado actualizado do payoff
terminal, mas relativamente à medida neutra face ao risco. Logo para apreçar a call
option virá, para Π∗ (0) o preço, neutro face ao risco, do contrato:
∗
Π∗ (0) = EP [
=
+
CT
∗ (ST − K)
] = EP [
]=
1+R
1+R
1
(p∗ × CT (ω1 ) + (1 − p∗ ) × CT (ω2 )) = 21.59.
1+R
Observação 6. Note-se que o preço obtido com este método coincide com o preço obtido
para o contrato pelo método da carteira réplica. Esta coincidência é um facto geral que
será explorado no que vai seguir-se.
1.2 Pressupostos probabilı́sticos
Consideremos um espaço de probabilidade finito (Ω, F, P). A tı́tulo de interpretação
temos como pressuposto que há k ∈ N estados do mundo podendo então escrever-se que:
Ω = {ω1 , . . . , ωk } .
Consideramos um horizonte temporal N ∈ N∗ , que poderá ser interpretado como
a data maturidade ou de exercı́cio dos contratos relativos a produtos financeiros e o
conjunto de datas ou instantes dado por:
T := {0, 1, . . . , N } .
O fluxo de informação disponı́vel é-nos dado por uma filtração F = (Fn )n∈T sobre
(Ω, F, P), isto é uma sequência
F0 ⊆ F1 , . . . , ⊆ FN ,
de subálgebras σ de F em que, Fn pode ser interpretada como o conjunto da informação
disponı́vel à data n ∈ {0, 1, . . . , N }.
Observação 7. Usualmente e, salvo aviso em contrário, consideramos em vigor as seguintes hipóteses:
• F0 = {∅, Ω}.
• FN = F = P(Ω).
• ∀ω ∈ Ω P[{ω}] > 0 .
MF0910
5
24 de Novembro de 2009
Capı́tulo II
Modelos Discretos
Secção: 1
1.3 O mercado
Consideramos que no mercado existem d + 1 activos com d ∈ N∗ dados pelos respectivos
preços à data n ∈ {0, 1, . . . , N }. Representaremos estes preços pela sequência de variáveis
aleatórias positivas:
Sn0 , Sn1 , . . . , Snd ,
mensuráveis relativamente a Fn , isto é tal que para j ∈ {0, 1, . . . , d} se tenha (Snj )0≤n≤N
processo estocástico adaptado.
Observação 8. Sn := (Sn0 , Sn1 , . . . , Snd ) ∈ Rd+1 é o vector dos preços à data n.
1.3.1
O activo sem risco
Consideramos que um dos activos, o que é representado pelo processo (Sn0 )0≤n≤N , tem
uma dinâmica ou, evolução ao longo do tempo, dada por:
S00 ≡ 1 , ∀n ∈ {1, 2, . . . , N } Sn0 = (1 + r)n ,
em que r é a taxa de juro do activo sem risco.
Observação 9. A quantidade,
1
,
Sn0
é o factor de desconto da data n à data 0 isto é, se βn for investida à data 0 no activo
sem risco então, poderemos recuperar uma unidade monetária à data n.
βn :=
Observação 10. Por oposição ao activo sem risco, os activos representados pelos processos
(Snj )0≤n≤N para 0 < j ≤ (d + 1) são activos com risco. Em geral não especificaremos
a dinâmica dos activos com risco. No caso particular do modelo binomial é especificada
uma dinâmica, binomial, do activo com risco.
1.4 Estratégias ou carteiras
1.4.1
Noção intuitiva de carteira
No passado, a posse de um tı́tulo de participação de uma empresa era formalizada por
um documento impresso, geralmente, numa folha de papel única. Para preservar um
conjunto desses documentos usava-se um portfolio ou carteira.
1.4.2
Descrição de uma carteira no modelo
Consideramos que a quantidade de tı́tulos do activo i detidos à data n depende dos
estados do mundo e é, por isso, representada por uma variável aleatória:
Φin para i = 0, 1, . . . , d e n ∈ {0, 1, . . . , N } .
Definição 1. Ao processo estocástico Φ := (Φ0n , Φ1n , . . . , Φdn )0≤n≤N chamamos carteira
sse Φ for previsı́vel, isto é, se se verificar que:
(
Φ0n ∈ mF0
Φ0n ∈ mFn−1 para n ≥ 1 .
MF0910
6
24 de Novembro de 2009
Capı́tulo II
Modelos Discretos
Secção: 1
Observação 11. Note-se que para n ≥ 1, o conjunto das posições da carteira no instante n, representado pelo vector (Φ0n , Φ1n , . . . , Φdn ), é decidido com base da informação
disponı́vel à data n − 1.
1.4.3
Valor e valor descontado de uma carteira
Para determinar o valor de uma certa carteira numa dada data, é necessário efectuar,
para cada activo, o produto da quantidade detida desse activo pelo preço, à data, do
activo e, em seguida, somar os termos assim obtidos para cada activo. Justifica-se pois
a seguinte definição.
Definição 2. Processo valor e valor descontado de uma carteira.
1. O processo estocástico V (Φ) = (Vn (Φ))0≤n≤N , processo valor da carteira Φ, é
dado, para n = 0, 1, . . . , N , por:
Vn (Φ) = Φn · Sn =
d
X
N
Φin Sni = Φ0n Sn0 + · · · + ΦN
n Sn .
i=0
2. O processo estocástico Ṽ (Φ) = (Ṽn (Φ))0≤n≤N , processo valor descontado da
carteira Φ, é dado, para n = 0, 1, . . . , N , por:
Ṽn (Φ) := βn Vn (Φ) ,
onde βn é o factor de desconto definido acima.
Observação 12. Note-se que,
βn Vn (Φ) = βn (Φn · Sn ) =
d
X
Φin βn Sni = Φn · S̃n ,
i=0
onde se tem que,
S̃n = 1, βn Sn1 , . . . , βn Snd ,
é o preço à data n descontado à data 0.
1.4.4
Carteiras autofinanciadas
Admitimos que o processo de gestão das carteiras é o seguinte. Constituı́mos a carteira à
data zero. Numa data posterior qualquer, vendemos e compramos activos que mantemos
até à data seguinte, altura em que voltamos a vender e a comprar activos; em qualquer
data não é permitida a entrada ou saı́da de capitais que não seja para efeitos de venda ou
compra de activos da carteira. Este processo corresponde no modelo à noção de carteira
autofinanciada.
Definição 3. Uma carteira Φ diz-se autofinanciada sse:
∀n ∈ {0, 1, . . . , N − 1} Φn · Sn = Φn+1 · Sn .
MF0910
7
(2)
24 de Novembro de 2009
Capı́tulo II
Modelos Discretos
Secção: 1
Observação 13. Para melhor se entender o significado desta definição fundamental atentese que:
1. Se suposermos que d = 1, isto é, a existência de, apenas, um activo para além do
activo sem risco a condição (2) acima pode escrever-se:
Φ0n Sn0 + Φ1n Sn1 = Φ0n+1 Sn0 + Φ1n+1 Sn1 .
Como consequência desta igualdade fica claro que, se à data n + 1, decidirmos
aumentar a quantidade do activo sem risco na carteira, teremos que diminuir a
quantidade do activo com risco na carteira uma vez que os preços dos activos
permanecem os mesmos na condição.
2. A condição (2) pode ainda ler-se:
∀n{0, 1, . . . , N − 1} (Φn+1 − Φn ) · Sn = 0 .
(3)
Esta outra forma admite a seguinte leitura: dados os preços à data n, a recomposição da carteira faz-se sem entradas ou saı́das de capital; os cash-flows na recomposição são apenas os que decorrem de compras de activos financiados exclusivamente por vendas de activos.
3. A partir da condição (2) tem-se, ainda, que:
Φn · Sn = Φn+1 · Sn ⇐⇒Φn+1 · Sn+1 − Φn · Sn = Φn+1 · Sn+1 − Φn+1 · Sn ⇐⇒
⇐⇒Vn+1 (Φ) − Vn (Φ) = Φn+1 (Sn+1 − Sn ) .
(4)
Podemos pois afirmar que uma dada carteira é autofinanciada sse a variação de
valor da carteira entre duas datas consecutivas se deve apenas à variação de preço
dos activos entre essas datas.
Apresentamos de seguida uma caracterização fundamental das carteiras autofinanciadas.
Teorema 1. São equivalentes:
1. A carteira Φ é autofinanciada;
2. ∀n ∈ {1, . . . , N } Vn (Φ) = V0 (Φ) +
Pn
j=1 Φj (Sj
− Sj−1 ) ;
3. Sendo S̃j := βj Sj , ∀n ∈ {1, . . . , N } Ṽn (Φ) = V0 (Φ) +
Pn
j=1 Φj (S̃j
− S̃j−1 ) .
Demonstração. Suponhamos que se verifica a condição 2. Tem-se então:
Vn+1 (Φ) − Vn (Φ) =V0 (Φ) +
n+1
X
Φl (Sl − Sl−1 ) −
l=1
V0 (Φ) +
n
X
!
Φl (Sl − Sl−1 )
=
l=1
=Φn+1 (Sn+1 − Sn ) ,
MF0910
8
24 de Novembro de 2009
Capı́tulo II
Modelos Discretos
Secção: 1
pelo que se tem que a carteira Φ é auto-fianciada. Suponhamos, agora, que a carteira Φ
é autofinanciada. Podemos, então, escrever que:
Vn+1 (Φ) − Vn (Φ) = Φn+1 (Sn+1 − Sn ) = Φn+1 ∆Sn+1
Vn (Φ) − Vn−1 (Φ) =
Φn (Sn − Sn−1 )
········· =
·········
= Φn ∆Sn
= ·········
V2 (Φ) − V1 (Φ) =
Φ2 (S2 − S1 )
= Φ2 ∆S2
V1 (Φ) − V0 (Φ) =
Φ1 (S1 − S0 )
= Φ1 ∆S1 ,
pelo que somando membro a membro as igualdades acima se pode obter imediatamente:
Vn+1 (Φ) − Vn (Φ) =
n+1
X
Φl (Sl − Sl−1 ) =
l=1
n+1
X
Φl ∆Sl ,
l=1
e esta é exactamente a condição 2. Para demosntrar a equivalência entre as condições
1 e 3 pode repetir-se a demonstração com S̃l = βl Sl dado que a condição sobre uma
carteira para que esta seja autofinanciada é invariante por desconto ou actualização ou
seja: a carteira Φ é autofinanciada sse:
∀n ∈ {0, 1, . . . , N − 1} Φn S̃n = Φn+1 S̃n .
Observação 14. Note-se que a expressão
Ṽn (Φ) = V0 (Φ) +
n
X
Φj (S̃j − S̃j−1 ) ,
j=1
na condição 2 do teorema, pode interpretar-se da forma seguinte: Ṽn (Φ), o valor descontado de uma carteira autofinanciada Φ, depende da riqueza inicial V0 (Φ) e, da carteira
dada por:
(Φ1n , Φ2n , . . . , Φdn )0≤n≤N ,
isto é, onde não aparece a quantidade referente ao activo sem risco. Com efeito pode
observar-se também que:
0
∆S̃j0 = S̃j0 − S̃j−1
=
1 0
1
Sj −
S0 = 1 − 1 = 0 .
βj
βj−1 j−1
A interpretação dada na observação anterior põe em evidência um facto importante
que é explicitado na proposição seguinte e que pode ser visto como uma proposição
recı́proca da constatação feita na observação.
Proposição 1. Dado o processo (φ1n , . . . , φdn )0≤n≤N , previsı́vel e V0 ∈ mF, existe um
processo previsı́vel (φ0n )0≤n≤N , tal que a carteira Φ := (φ0 , . . . , φd ) é autofinanciada e
V0 (Φ) = V0 .
MF0910
9
24 de Novembro de 2009
Capı́tulo II
Modelos Discretos
Secção: 1
Demonstração. Pela proposição e dado que Φ é autofinanciada:
Ṽn (Φ) =Φ0n + Φ1n S̃n1 + · · · + Φdn S̃nd = (def. valor descontado)
n
X
=V0 +
Φj · ∆S̃j = (proposição 3)
j=1
=V0 +
n X
Φ1j ∆S̃j1 + · · · + Φdj ∆S̃jd = (Φj · ∆S̃j = . . . )
j=1
Logo, verifica-se que:
Φ0n = V0 +
n X
Φ1j ∆S̃j1 + · · · + Φdj ∆S̃jd − Φ1n S̃n1 + · · · + Φdn S̃nd
j=1
= V0 +
n−1
X
Φj · ∆S̃j + Φ1n ∆S̃n1 + · · · + Φdn ∆S̃nd − Φ1n S̃n1 + · · · + Φdn S̃nd
j=1
= V0 +
n−1
X
1
d
Φj · ∆S̃j + Φ1n (−S̃n−1
) + · · · + Φdn (−S̃n−1
)
j=1
pelo que Φ está bem definido e é previsı́vel, tal como foi anunciado.
1.5 Estratégias admissı́veis e arbitragem
Observação 15. Os valores que tomam as componentes Φin de uma dada carteira Φ =
(Φ0 , . . . , Φd ), têm sinal arbitrário. Com efeito:
• Φ0n < 0 : pode ser interpretado como tendo nós tomado emprestado |Φ0n | no activo
sem risco.
• Φin < 0 para i ≥ 1: pode ser interpretado como sendo a carteira curta (short) na
quantidade |Φin | no activo sem risco indexado por i.
• Carteiras curtas em activos com risco e empréstimos são admitidos desde que o
valor da carteira seja não negativo em qualquer data.
Definição 4. Uma estratégia ou carteira Φ é admissı́vel sse se verificar:
1. Φ é autofinanciada.
2. ∀n ∈ {0, 1, . . . , N } Vn (Φ) ≥ 0 .
Observação 16. De acordo com esta definição, com uma dada carteira admissı́vel um
investidor deve poder pagar as suas dı́vidas (nos activos com e sem risco) em qualquer
data.
A noção intuitiva de arbitragem pode ser descrita como a possibilidade de criar uma
proveito certo, sem risco, a partir de um custo inicial nulo.
MF0910
10
24 de Novembro de 2009
Capı́tulo II
Modelos Discretos
Secção: 1
Definição 5. Uma estratégia, ou carteira, Φ é uma carteira de arbitragem sse se
verificar:
1. Φ é admissı́vel;
2. V0 (Φ) = 0 e
VN (Φ) 6≡ 0 isto é, VN (Φ) é uma variável aleatória não nula.
Observação 17. Uma estratégia de arbitragem é pois uma carteira admissı́vel com valor
inicial nulo e com valor terminal não nulo.
1.6 Tranformação de uma martingala por um processo previsı́vel
Relembramos nesta secção alguns resultados releventes da teoria das martingalas, para
os modelos finitos de mercados financeiros.
Seja F := (Fn )0≤n≤N uma filtração sobre o espaço de probabilidade (Ω, F, P).
Definição 6. Um processo H := (Hn )0≤n≤N é um processo F previsı́vel se se verificar:
H0 ∈ mF0 e ∀n ∈ {1, . . . , N } Hn ∈ mFn .
Teorema 2. Seja M := (Mn )0≤n≤N uma F martingala e H := (Hn )0≤n≤N um processo
F previsı́vel (e limitado). Então, o processo X := (Xn )0≤n≤N definido por:
(
X0 := H0 M0
Xn := H0 M0 + H1 ∆M1 + · · · + Hn ∆Mn 1 ≤ n ≤ N ,
onde ∆Mi := Mi − Mi−1 , é uma F martingala.
Observação 18 (Comentário importante). Pela proposição (3) vemos que se os preços
descontados (S̃n )0≤n≤N formarem uma martingala e, sendo Φ a carteira um processo
previsı́vel então o processo valor actualizado (Ṽn (Φ))0≤n≤N é uma martingala. Logo
podemos concluir que:
E[ṼN (Φ)] = E[V0 (Φ)] ,
isto é, o valor esperado final da riqueza gerada por uma estratégia autofinanciada é igual
ao valor esperado da riqueza inicial.
Demonstração. Por construção o processo X é soma de processos adaptados pelo que é
um processo adaptado. Note-se que X0 ∈ mF0 visto que H0 , M0 ∈ mF0 . Como H é
limitado tem-se que:
E[| Xn |] < +∞ .
Para verificarmos a propriedade de martingala observamos, apenas, que:
E[Xn+1 − Xn | Fn ] = E [Hn+1 (Mn+1 − Mn ) | Fn ] (visto que: Hn+1 ∈ mFn )
= Hn+1 E[Mn+1 − Mn | Fn ] (visto que: E[Mn+1 | Fn ] = Mn ) .
Logo, X é uma martingala.
MF0910
11
24 de Novembro de 2009
Capı́tulo II
Modelos Discretos
Secção: 1
Proposição 2. Seja M := (Mn )0≤n≤N um processo F adaptado de variáveis aleatórias
integráveis. São equivalentes:
1. M é uma F martingala;
2. Para qualquer processo previsı́vel e limitado H = (Hn )0≤n≤N , verifica-se:
"
E
N
X
#
Hn ∆Mn = 0 .
n=1
Demonstração. Verifiquemos que a condição é necessária. Seja H0 ≡ 0 e (Hn )0≤n≤N
uma qualquer sequência previsı́vel, relativamente a F, limitada, de variáveis aleatórias.
Pela proposição 2 o processo X definido por:
(
X0 := 0
Pn
Xn :=
i=1 Hi ∆Mi
1≤n≤N ,
é uma F martingala. Dado que uma martingala tem valor médio constante, tem-se que:
"
E
n
X
#
Hi ∆Mi = E[Xn ] = E[X0 ] = 0 .
i=1
Verifiquemos que a condição é suficiente. Seja j ∈ {0, 1, . . . , N − 1} fixo e A ∈ Fj
arbitrário. Seja por definição,
(
IA
Hn =
0
n=j+1
n 6= j + 1
ou seja, tem-se a seguinte definição:
H0
0
H1
0
...
...
Hj−1
0
Hj
IA
Hj+1
0
Hj+2
0
...
...
HN
0
O processo (Hn )0≤n≤N é previsı́vel e obviamente limitado. Em consequência da condição
admitida por hipótese:
"
0=E
N
X
#
Z
Hi ∆Mi = E [IA (Mj+1 − Mj )] =
(Mj+1 − Mj )dP .
A
i=1
Tem-se, pois, pela definição de esperança condicional e atendendo a que A é arbitrário:
E [Mj+1 − Mj | Fj ] = 0 para j = 0, 1, . . . N − 1 ,
isto é, M é uma martingala.
MF0910
12
24 de Novembro de 2009
Capı́tulo II
Modelos Discretos
Secção: 1
1.7 Mercados financeiros viáveis
Podemos formalizar a noção de mercado considerando o processo de preços e o conjunto
de todas as carteiras autofinanciadas.
Definição 7. Um mercado financeiro diz-se viável sse não existirem carteiras de arbitragem isto é sse for impossı́vel gerar lucros certos a partir de um investimento incial
nulo.
Observação 19.
• Para P probabilidade e A ∈ F um qualquer acontecimento, sabemos que P[A] ∈ [0, 1] exprime a confiança que temos na realização do acontecimento
A. P[A] = 0 diz-nos que o acontecimento A é impossı́vel. dadas duas probabilidades P e P∗ , podemos considerar P equivalente a P∗ se e só se P e P∗ coincidem
sobre os acontecimentos de probabilidade nula. A coincidência sobre os acontecimentos de probabilidade nula deve ser um denominador comum a todos os agentes
de mercado.
• Dado que Ω é finito e que F = P(Ω) temos que se A ∈ F então, necessariamente,
A = ∪qi=1 {ωi } onde q é o número de elementos de A. Nestas condições tem-se
que P[A] = 0 se e só se para todo o i = 1, . . . , q se tem P[{ωi }] = 0. Como, por
hipótese, para qualquer ω em Ω se tem que P[{ω}] = 0 temos finalmente que:
P∼
= P∗ ⇔ ∀ω ∈ Ω P∗ [{ω}] = 0 .
Com efeito:
P∼
= P∗ ⇔ ∀A ∈ F (P[A] = 0 ⇔ P∗ [A] = 0) ⇔ (P[A] > 0 ⇔ P∗ [A] > 0) .
É notável que a existência de uma medida de probabilidade relativamente à qual o
processo de preços descontados seja uma martingala caracterize os mercados viáveis.
Teorema 3 (Primeiro teorema fundamental sobre o apreçamento de activos). Um o
mercado é viável sse existir uma medida de probabilidade P∗ , equivalente a P∗ tal que o
processo de preços actualizados seja uma martingala relativamente a P∗ .
Definição 8. Uma medida de probabilidade verificando a condição do teorema diz-se
uma medida neutra face ao risco ou uma medida de martingala.
Demonstração. Suponhamos que existe uma medida P∗ equivalente a P tal que o processo de preços actualizados seja uma martingala relativamente à medida P∗ . Para uma
qualquer carteira Φ autofinanciada e limitada:
∀n ≥ 1 Ṽn (Φ) = V0 +
n
X
Φj ∆S̃j ,
j=1
em consequência do teorema 1. Logo (Ṽn (Φ))0≤n≤N é uma martingala relativamente a P∗
pelo teorema 2. Suponhamos agora Φ admissı́vel tal que V0 (Φ) = 0. Pelas propriedades
das martingalas tem-se que:
E∗ [ṼN (Φ)] = E∗ [V0 (Φ)] = 0 .
MF0910
13
24 de Novembro de 2009
Capı́tulo II
Modelos Discretos
Secção: 1
Como se tem que ṼN (Φ) ≥ 0, dado que Φ é admissı́vel e
E∗ [ṼN (Φ)] =
r
X
ṼN (Φ)(ωi ) P∗ [{ωi }] = 0 ,
i=1
com ṼN (Φ)(ωi ) ≥ 0 e P∗ [{ωi }] > 0, terá que ser ṼN (Φ) ≡ 0. Em consequência, não há
carteiras de arbitragem.
1.8 Mercados completos
Consideramos num modelo de mercado financeiro contratos conferindo direitos com
exercı́cio opcional caracterizados pelo correspondente cashflow ou payoff. Neste contexto um direito contingente pode definir-se da seguinte forma.
Definição 9. Um direito contingente é uma variável aleatória, não negativa, FN mensurável.
Os exemplos seguintes são fundamentais.
Exemplo 1. Call option europeia: o cash-flow deste direito contingente sobre, por
exemplo, o activo com preço S1 = (Sn1 )0≤n≤N , depende de um parâmetro, o preço de
exercı́cio K e é definido por:
(
1 ≥K
1 −K
se SN
SN
1
(5)
h := (SN
− K)+ =
1 ≤K
0
se SN
Exemplo 2. Put option europeia: o cash-flow deste activo contingente é definido por:
1
h := (K − SN
)+
(6)
Observação 20.
1. Um direito contingente h depende apenas do valor do activo subjacente à data de exercı́cio isto é, tem-se que:
h = h(SN ) .
2. Noutro tipo de produtos financeiros derivados pode ter-se:
h = h(S0 , S1 , . . . , SN ) ,
tal como, por exemplo, no caso das opções asiáticas em que o preço de exercı́cio é
um valor médio do preço do subjacente calculado entre a data de exercı́cio e uma
data anterior.
Definição 10. Um direito contingente h é atingı́vel sse existe uma estratégia admissı́vel
cujo valor à data N seja exactamente h.
Teorema 4. Num mercado viável é condição suficiente para que um direito contingente
h seja atingı́vel que exista uma carteira autofinanciada Φ, cujo valor na data de maturidade seja h.
MF0910
14
24 de Novembro de 2009
Capı́tulo II
Modelos Discretos
Secção: 1
Observação 21. Neste teorema substitui-se a hipótese da carteira ser admissı́vel, na
definição acima, pela hipótese mais fraca da carteira ser autofinanciada.
Demonstração. Seja Φ uma carteira autofinanciada tal que VN (Φ) = h e P∗ uma probabilidade de martingala. Uma tal probabilidade existe dado que o mercado é viável.
(Ṽn (Φ))0≤n≤N é uma martingala relativamente a P∗ uma vez que é transformação de
martingala do processo de preços descontados que é uma martingala devido à definição
de P∗ . Tem-se pois que:
∀n ∈ {0, 1, . . . , N } Ṽn (Φ) = E∗ [ṼN (Φ) | Fn ] .
0 ≥ 0 tem-se que Ṽ (Φ) ≥ 0, para 0 ≤ n ≤ N em consequência
Como ṼN (Φ) = h/SN
n
das propriedades da noção de esperança condicional, verificando-se pois que Vn (Φ) ≥ 0,
sendo então a estratégia admissı́vel.
Definição 11. Um mercado financeiro diz-se completo sse todo o direito contingente
é atingı́vel.
Observação 22. Assumir que um mercado é completo é uma hipótese restritiva cuja
motivação económica não é tão óbvia como a hipótese de não arbitragem.
Teorema 5 (Segundo teorema fundamental no apreçamento de activos). Um mercado
viável é completo sse existir uma medida de martingala P∗ única, i.e. se existir uma
única medida de probabilidade equivalente a P, relativamente à qual o processo de preços
descontados seja uma martingala.
Demonstração. Suponhamos o mercado viável e completo. Para h ≥ 0, h ∈ mFN , existe
uma carteira admissı́vel tal que VN (Φ) = h. Como Φ é autofianciada temos que:
N
X
h
VN (Φ)
=
=
Ṽ
(Φ)
=
V
+
Φj · ∆S̃j .
0
N
0
0
SN
SN
j=1
(7)
Suponha-se que F0 = {∅, Ω} e sejam P∗1 e P∗2 duas medidas de martingala tem-se então
que para i = 1, 2:
E∗i [ṼN (Φ)] = E∗i [V0 (Φ)] ( propriedades de martingala)
= V0 (Φ)( dado que F0 = {∅, Ω}) .
Em consequência da fórmula 7 tem-se que:
E∗1 [
h
h
] = E∗2 [ 0 ] .
0
SN
SN
Como h ∈ mFN é arbitrária tem-se que P∗1 ≡ P∗2 sobre FN . Supondo F = FN temos o
resultado anunciado.
MF0910
15
24 de Novembro de 2009
Capı́tulo II
Modelos Discretos
Secção: 2
1.9 Apreçamento e cobertura de direitos contingentes em mercados completos
Consideremos um mercado viável e completo denotando-se por P∗ a única medida de
martingala. Seja h ∈ mFN , h ≥ 0 um direito contingente. Seja Φ uma carteira admissı́vel e réplica de h.
Dado que (Ṽn (Φ))0≤n≤N é P∗ martingala tem-se que:
V0 (Φ) = E∗ [ṼN (Φ) | F0 ] = E∗ [ṼN (Φ)] = E∗ [
h
0 ].
SN
Mais geralmente, para n = 0, 1, . . . , N tem-se que:
Vn (Φ) = Ṽn (Φ) · Sn0 = Sn0 · E∗ [
h
0 | Fn ] ,
SN
isto é:
∀n ∈ {0, . . . , N } Vn (Φ) =
Sn0
∗
·E
h
0 | Fn
SN
.
(8)
Pode pois afirmar-se que o valor de uma carteira réplica de h é completamente determinado por h é pois natural que num mercado viável e completo o preço livre de arbitragem
de um direito contingente h seja dado pela fórmula 8.
Com efeito Vn (Φ) é a riqueza necessária à data n para replicar h à data N seguindo
a estratégia admissı́vel Φ.
0 ] e seguir reSe à data zero o investidor vender o direito contingente por E∗ [h/SN
constituindo a carteira Φ, pode gerar o valor h à data N . Está por isso perfeitamente
coberto (hedged).
Exemplo 3. Considere um mercado com dois activos um com risco e o outro sem risco
e tal que N = 1. Considere um direito contingente h sobre o activo com risco e Φ uma
carteira réplica de h. O quadro seguinte demonstra que se o preço à data zero do direito
contingente não for exactamente V0 (Φ), então existe no mercado uma oportunidade
de arbitragem. Suponha, por exemplo, que Π(0, h) o preço de h à data zero verifica
Π(0, h) < V0 (Φ).
Posição short
Posição long
Total no Activo sem risco
Data 0
V0 (Φ)
−Π(0, h)
V0 (Φ) − Π(0, h)
Data 1
VN (Φ) = h
−Π(0, h) = −h
(V0 (Φ) − Π(0, h))(1 + R) > 0
2 O modelo de Cox Ross Rubinstein
No enquadramento definido até agora consideramos:
• a existência de apenas um activo com risco i.e. d = 1;
• denotamos o preço do activo com risco por (Sn )0≤n≤N .
MF0910
16
24 de Novembro de 2009
Capı́tulo II
Modelos Discretos
Secção: 2
• a dinâmica do activo sem risco é dada por:
∀n ∈ {0, . . . , N } Sn0 = (1 + r)n ,
com r ∈ R∗+ .
• a dinâmica do activo com risco é dada por
S0 ∈ R∗+
e
Sn+1
(
Sn (1 + a)
=
Sn (1 + b)
(9)
para −1 < a < b.
Exercı́cio 1 (Uma concretização). .
1. Represente graficamente (para N = 3) a árvore de evolução dos preços do activo
com risco e mostre que pode identicar Ω o conjunto dos estados do mundo com
{(1 + a), (1 + b)}N .
2. Verifique que:
∀ω = (y1 , . . . yN ) ∈ Ω ∀i ∈ {0, . . . , N − 1} yi+1 =
Si+1
(ω) .
Si
Consideramos ainda como hipóteses:
• F0 = {∅, Ω}
∀n ∈ {1, . . . , N } Fn := σ(S1 , . . . , Sn ).
• F = P(Ω)
• A probabilidade inicial sobre Ω está definida a menos de equivalência, i.e.:
∀ω ∈ Ω P[{ω}] > 0 .
Definição 12. Seja, por definição, para cada n = 1, . . . , N
Tn :=
Sn
Sn−1
Exercı́cio 2.
1. Mostre que L(T1 , . . . , TN ) ≡ P i.e. que a lei do N -uplo de variáveis
aleatórias (T1 , . . . , TN ) é, exactamente, P.
2. Mostre que
∀n ∈ {1, . . . , N } Fn = σ(T1 , . . . , Tn )
Exercı́cio 3. Mostre que se o processo dos preços descontados (S̃n )0≤n≤N é P martingala
então:
∀n ∈ {0, . . . , N − 1} E[Tn+1 | Fn ] = 1 + r .
MF0910
17
24 de Novembro de 2009
Capı́tulo II
Modelos Discretos
Secção: 2
Exercı́cio 4. Mostre que se o mercado for livre de arbitragem então, r ∈]a, b[.
Exercı́cio 5. Mostre que se a condição r ∈]a, b[ não for satisfeita então há oportunidades
de arbitragem.
Exercı́cio 6. Suponha-se que r ∈]a, b[ e seja:
b−r
.
b−a
p :=
1. Mostre são equivalentes
(a) (S̃n )0≤n≤N é P martingala
(b) (Tn )1≤n≤N é uma sucessão iid e
P[T1 = 1 + a] = p = 1 − P[T1 = 1 + b]
2. Conclua que, sob a hipótese feita acima (r ∈]a, b[) o mercado é livre de arbitragem
e completo.
Exercı́cio 7. Seja Cn (respectivamente Pn ) o preço à data n de uma Call (respectivamente Put) Option europeia sobre o activo com risco com preço de exercı́cio K e data
de maturidade N .
1. Mostre a relação de paridade Call-Put:
Cn − Pn = Sn − K(1 + r)−(N −n) .
2. Mostre que Cn = c(n, Sn ) onde:
c(n, x) = (1 + r)−(N −n) ×


N
−n
X
(N − n)!
pj (1 − p)N −n−j x(1 + a)j (1 + b)N −n−j − K +  .
×
(N − n − j)!j!
j=0
2.1 Questão de desenvolvimento
Suponha-se no contexto de um mercado a um perı́odo (N = 1), num espaço de probabilidade com uma infinidade numerável de estados do mundo e com uma infinidade de
activos d = +∞
Seja Ω = {1, 2, . . . , }, F0 = {∅, Ω} e F1 = F a σ-álgebra gerada pelos subconjuntos
finitos de Ω. Seja a probabilidade P definida sobre (Ω, F) por:
∀k ∈ Ω P[{k}] = 2−k .
Seja para cada activo i ∈ {1, 2, . . . , } a sucessão dos preços Sni , para n = 0, 1 definida
pela diferença:


ω=i
1
i
i
(S1 − S0 )(ω) = −1 ω = i + 1


0
i 6= ω 6= i + 1
MF0910
18
24 de Novembro de 2009
Capı́tulo II
Modelos Discretos
Secção: 2
Exercı́cio 8.
1. Suponha que B0 = B1 P
= 1. Mostre que para uma carteira Φ =
(φi )i∈{1,2,...,} que verifique a condição +∞
i=1 | φi |< +∞ o valor da carteira V1 (Φ),
à data 1, pode ser dado por:
V1 (Φ) = φ0 +
+∞
X
φi S1i = V0 (Φ) +
i=1
se for V0 (Φ) = φ0 +
P+∞
i=1
+∞
X
φi (S1i − S0i ) ,
i=1
φi .
2. Suponha que V0 (Φ) = 0 e que V1 (Φ) ≥ 0. Mostre que V1 (Φ) = 0 P quase certamente.
3. Mostre que se existir uma medida de martingala P∗ então:
E∗ S1i − S0i = 0 ,
e conclua que P∗ [{i}] = P∗ [{i + 1}].
4. Mostre que o mercado com as caracterı́sticas que acabou de utilizar é livre de arbitragem e exprima uma conclusão dos resultados obtidos nas alı́neas anteriores.
Referências
[1] S. Beninga Financial Modeling, The MIT press, 1997.
[2] T. Björk An introduction to Arbitrage Theory in Continuous Time, Oxford University
Press, 1998.
[3] R. J. Elliot, P. Ekkehard Kopp Mathematics of Financial Markets, Springer Verlag,
1999.
[4] John C. Hull Options Futures and other Derivatives, fourth edition, Prentice Hall
International, Inc., 2000.
[5] D. Lamberton, & B. Lapeyre, Introduction to Stochastic Calculus Applied to Finance,
Chapman & Hall 1996.
[6] M. Musiela, & M. Rutkowski, Martingale Methods in Financial Modelling, Springer
Verlag, 1997.
[7] S. R. Pliska, Introduction to Mathematical Finance, Blackwell Publishers, 1997.
[8] A. N. Shiryaev, Essentials of Stochastic Finance, World Scientific, 1999.
MF0910
19
24 de Novembro de 2009
As Árvores Trinomiais nos Modelos de Mercados Financeiros
FCT/UNL, Matemática Financeira 07-08
MLE
1 Introdução
Faz-se uma apresentação sumária do modelo trinomial. As questões colocadas poderão,
talvez, vir a ser aprofundadas no âmbito duma dissertação de mestrado.
2 O modelo trinomial
O modelo trinomial é muito semelhante ao modelo binomial, havendo no entanto algumas diferenças. No modelo trinomial consideram-se também dois activos primários. A
obrigação (bond ), activo sem risco cuja lei de evolução do respectivo preço é dada por:
(
B0 = 1
Bn+1 = (1 + R)Bn n ≥ 0 ,
em que R ≥ 0 é a taxa de juro sem risco, determinı́stica, associada a um dado perı́odo
de tempo ∆t que deveremos ter sempre o máximo cuidado em explicitar 1 . A acção
(stock ), activo com risco cuja lei de evolução do respectivo preço é dada por:
(
S0 > 0
Sn+1 = Zn+1 Sn n ≥ 0 ,
em que (Zn )n≥1 é uma amostra de


u com
Z = s com


d com
uma variável aleatória trinomial Z tal que:
probabilidade pu
probabilidade ps
probabilidade pd = 1 − (pu + ps )
e que representa o retorno da acção no perı́odo ∆t 2 . Os parâmetros do modelo, sob a
probabilidade natural, são descritos, evidentemente, por Θ = (R, u, s, d, pu , ps ).
Chamamos a atenção do leitor para o seguinte. A árvore que descreve o modelo
trinomial de acordo com (Hull 00)[p. 405] é a seguinte.
1
2
Por exemplo a taxa pode ser: diária, semanal, mensal, anual, etc.
De facto, por definição, o retorno aditivo é dado por (S1 − S0 )/S0 = Z − 1.
1
MF0708
Árvores Trinomiais
Subsecção: 3.0
S0 u 3
- S u2
0
S0 u 2
@
@
@
S0 u
- S0 u
@
@
@
R
@
@
@
@
S0
-
S0
@
R
S0
@
@
@
@
@
R
@
R
S0
@
@
@
@
@
S0 u
S0 d
@
R
- S0 d
@
R
- S0 d
@
@
@
@
@
@
@
R
@
R
- S d2
0
S0 d 2
@
@
@
@
R
S0 d 3
Pode ver-se que neste caso particular são feitas as seguintes hipóteses.
(
s=1
d = 1/u
3 Questões em aberto
Ficam por elucidar as seguintes questões. O leitor corajoso poderá tentar verificar se as
sugestões propostas respondem ou não às questões.
1. O modelo trinomial é livre de arbitragem? Uma primeira ideia seria copiar a
Primeira versão
2
28 de Novembro de 2007
MF0708
Árvores Trinomiais
Subsecção: 3.0
construção da medida de martingala no caso trinomial. Terı́amos:
S0 =
1
EQ [S1 ] = pu S0 u + ps S0 s + (1 − pu − ps )S0 d
1+R
ou seja, com pu , ps ∈ [0, 1]:
1 + R = pu u + ps s + (1 − pu − ps )d ,
isto é, 1 + R combinação convexa dos três pontos d < s < u. Observe-se que se
ps = 0 então 1 + R ∈ [d, u] por ser combinação convexa de d e u. Em qualquer
caso como d < s < u tem-se que s = αu + (1 − α)d pelo que
1 + R = (pu + αps )u + [(1 − pu − ps ) + (1 − α)ps ]d
com (pu + αps ) + [(1 − pu − ps ) + (1 − α)ps ] = 1 pelo que 1 + R ∈ [d, u].
2. Será que a condição de não arbitragem é, na mesma, 1+R ∈ [d, u]? A demonstração
deve ir pela mesma via que no caso binomial.
3. Como fazer o apreçamento e a cobertura? É de esperar que se tenha para X =
Φ(ST ) a fórmula de apreçamento usual, a saber,
Π(0, X) =
1
1
EQ [X] =
EQ [Φ(ST )] .
(1 + R)T
(1 + R)T
(1)
Sendo que se estivermos a considerar T perı́odos e se Y = (Yu , Ys , Yd ) for uma
variável trinomial de parâmetros T e Q = (qu , qs , qd ) 3 então ter-se-à que:
X = Φ(ST ) = Φ(S0 uYu sYs dYd ) .
(2)
Em consequência das fórmulas 1 e 2 deverá vir:
X
T!
q k q l q m Φ(S0 uk sl dm ) ,
Π(0, X) =
k! l! m! u s d
k+l+m=T
o que justificaria o cálculo de Monte Carlo efectuado na aula prática e descrito no
ficheiro Mathematica da aplicação prática.
4. O modelo trinomial é completo? Queremos uma carteira réplica formada por dois
activos. No caso do modelo binomial sabemos (ver a proposição 6 das notas de
aula) que se o modelo for livre de arbitragem então é completo. No caso do modelo
trinomial temos que resolver o sistema


(1 + R)x + S0 uy = φ(u)
(1 + R)x + S0 sy = φ(s)


(1 + R)x + S0 dy = φ(d)
o que em geral é impossı́vel (três equações e duas incógnitas (x, y)). Uma alternativa é considrar uma carteira réplica com um terceiro activo. Outra aproximação
é investigar o apreçamento em mercados não completos.
3
Q represetará a probabilidade neutra face ao risco.
Primeira versão
3
28 de Novembro de 2007
MF0708
Árvores Trinomiais
Subsecção: 3.1
5. Se o modelo trinomial não for completo, como construir uma carteira de cobertura?
Mais uma vez a ideia seria escolher um activo adicional no mercado.
6. Como efectuar a calibração do modelo? A literatura propõe várias expressões 4 .
Um exemplo comum, para o caso particular que é descrito na figura apresentada,
é:
u = eσ
√
2∆t
, s = 1, d = e−σ
√
2∆t
Su = S · u, Ss = S, Sd = S · d
√
!2
eR∆t/2 − e−σ ∆t/2
√
√
pu =
eσ ∆t/2 − e−σ ∆t/2
√
!2
eσ ∆t/2 − eR∆t/2
√
√
pd =
eσ ∆t/2 − e−σ ∆t/2
ps = 1 − pu − pd ,
sendo σ a volatilidade estimada a partir dos dados. Um outro exemplo de parametrização é apresentado em (Hull 00)[p. 405]. Poder-se-ia tentar uma aproximação
semelhante à que seguimos no modelo binomial para o caso geral?
7. É sabido que o modelo binomial tem boas propriedades de convergência podendose, num dos limites possı́veis, obter os preços de Black-Scholes. Que tipo de preços
com modelos contı́nuos se podem obter num limite do modelo trinomial? Se pudermos obter distribuições limite não Gaussianas a utilização do modelo trinomial
geral poderá encontrar amplas aplicações.
3.1 Aplicação prática
No ficheiro Mathematica distribuı́do estudamos o caso geral descrito acima e o caso
particular com os parâmetros semelhantes aos que foram utilizados para estudar o modelo
binomial no caso das opções sobre o PSI-20.
Referências
[Hull 00] J. C Hull, Options Futures and other derivatives, fourth edition, Prentice-Hall
International Inc., 2000.
[Broadie et al 98] Mark Broadie, Paul Glasserman (editors) , Hedging with Trees, Risk
Books, 1998.
4
Veja-se, por exemplo, (Kamrad et al 91).
Primeira versão
4
28 de Novembro de 2007
MF0708
Árvores Trinomiais
Subsecção: 3.1
[Kamrad et al 91] Kamrad, B. and P. Ritchken, Multinomial Approximating Models
for Options with k-State Variables, Management Science 37, No. 12 (1991), pp.
1640-1652.
Primeira versão
5
28 de Novembro de 2007
Árvores Trinomiais
Estudam-se as árvores trinomiais gerais. O caso tradicional (Hull página 405) é o caso em que s=1 e u=1/d. A ideia de
usar árvores trinomiais é que permitem resultados muito mais variados que o modelo binomial.
<< Statistics`DiscreteDistributions`
<< Statistics`ContinuousDistributions`
<< Graphics`Graphics`
<< Statistics`HypothesisTests`
<< Statistics`ConfidenceIntervals`
Árvore trinomial geral
A um período
pu = .6; ps = .2; pd = 1 - Hpu + psL; u = 1.0223; s = 1.009; d = 0.888581;
S0 = 100; T = 130; K = 105; R = .041 ê 360;
nRep = 10000;
Esta função fTri permite gerar uma variável aleatória trinomial
fTri@u_, s_, d_, pu_, ps_, a_D :=
If@0 § a < pu, u, 0D + If@pu <= a < pu + ps, s, 0D +
If@pu + ps <= a § pu + ps + pd, d, 0D
alea = Table@Random@D, 8k, 1, nRep<D;
TriAlea = Table@S0 * fTri@u, s, d, pu, ps, alea@@kDDD, 8k, 1, nRep<D;
TrinomialTrees.nb
2
Histogram@TriAleaD
6000
5000
4000
3000
2000
1000
90
92
94
96
98
100
102
Ü Graphics Ü
8Mean@TriAleaD, StandardDeviation@TriAleaD<
899.2488, 5.27412<
Árvore trinomial geral multi-período
MulAlea = Table@Random@D, 8k, 1, nRep * T<D;
MulTriAlea =
Table@S0 * Product@fTri@u, s, d, pu, ps, MulAlea@@kDDD,
8k, 1 + Hm - 1L * T, m * T<D, 8m, 1, nRep<D;
TrinomialTrees.nb
3
Histogram@MulTriAleaD
600
500
400
300
200
100
50
100
150
200
Ü Graphics Ü
8Skewness@MulTriAleaD, Kurtosis@MulTriAleaD<
81.75705, 7.85363<
Pode constatar-se que não é aceitável supor que a distribuição limite quando T cresce é normal neste caso.
Direito Contingente ou Derivado
X@S_, K_D := Max@S - K, 0D
PreXis = Table@X@MulTriAlea@@kDD, KD, 8k, 1, Length@MulTriAleaD<D;
PriceCall = H1 ê H1 + RL ^ TL * Mean@PreXisD
0.655796
TrinomialTrees.nb
4
Árvore trinomial particular
A um período
Os dados são quase os mesmos que os que foram usados no modelo binomial no casso da opção sobre o Psi-20. O
objectivo é permitir recuperar o resultado da Call option calculada no modelo binomial quando s=1, ps=0.
pu = 0.499431; ps = .0005; pd = 1 - Hpu + psL; u = 1.01142; s = 1;
d = 1 ê u; S0 = 7307.99; T = 30; K = 7161.83; R = .041 ê 360;
nRep = 10000;
alea2 = Table@Random@D, 8k, 1, nRep<D;
TriAlea2 = Table@S0 * fTri@u, s, d, pu, ps, alea2@@kDDD, 8k, 1, nRep<D;
Histogram@TriAlea2D
5000
4000
3000
2000
1000
7225
7250
7275
7300
7325
7350
Ü Graphics Ü
8Mean@TriAlea2D, StandardDeviation@TriAlea2D<
87308.24, 82.9775<
7375
TrinomialTrees.nb
5
Árvore trinomial particular multi-período
MulAlea2 = Table@Random@D, 8k, 1, nRep * T<D;
MulTriAlea2 =
Table@S0 * Product@fTri@u, s, d, pu, ps, MulAlea2@@kDDD,
8k, 1 + Hm - 1L * T, m * T<D, 8m, 1, nRep<D;
Histogram@MulTriAlea2D
1400
1200
1000
800
600
400
200
6000
6500
7000
7500
8000
8500
9000
Ü Graphics Ü
8Skewness@MulTriAlea2D, Kurtosis@MulTriAlea2D<
80.195504, 2.9831<
Direito Contingente ou Derivado no caso particular
PreXis2 = Table@X@MulTriAlea2@@kDD, KD, 8k, 1, Length@MulTriAlea2D<D;
PriceCall2 = H1 ê H1 + RL ^ TL * Mean@PreXis2D
272.545
O Integral Estocástico
FCT/UNL, Matemática Financeira
MLE
1 Introdução
Consideremos a evolução de bactérias num meio apropriado de cultura. Uma forma
de descrever essa evolução pode consistir em considerar a concentração definida como
o número de bactérias por unidade de volume em função do tempo. Representamos a
concentração por βt . Uma hipótese plausı́vel é a de que havendo condições adequadas em espaço e alimentos - a variação da concentração é proporcional à concentração. Uma
forma de traduzir esta hipótese num modelo matemático simples consiste em escrever:
dβt
= αβt .
dt
(1)
Admitindo que à data t = 0 a concentração de bactérias vale β0 temos que a equação
diferencial acima admite como solução:
βt = β0 exp(αt) .
Esta forma adoptada para traduzir matematicamente o fenómeno da evolução da concentração de bactérias num meio adequado pode ser considerada simplista dado que
pressupõe uma uniformidade na evolução que, raramente, se observa. Uma alternativa
pode ser considerar que as condições em que decorre o fenómeno de evolução admitem uma decomposição numa tendência forte mas que é perturbada por um ruı́do de
fundo com caracterı́sticas aleatórias. Podem considerar-se neste contexto dois tipos de
modelos: modelos a tempo discreto e modelos a tempo contı́nuo.
1.1 Um modelo a tempo discreto
Suponha-se então que à evolução descrita acima na fórmula 1 se sobrepõe um termo
aditivo Θ(t) representando o ruı́do ou a incerteza das condições no instante t. A evolução
passa a ser dada pela fórmula:
dβt
= αβt + Θ(t) .
dt
Esta fórmula admite a representação
βt+∆t − βt
≈ αβt + Θ(t) ,
∆t
1
Capı́tulo IV
Integral Estocástico
Secção: 1
considerando a aproximação usual para a derivada. Supondo que ∆t 6= 0 tem-se ainda,
βt+∆t − βt ≈ αβt ∆t + Θ(t)∆t ,
que é equivalente a:
βt+∆t ≈ (1 + α∆t)βt + Θ(t)∆t .
Supondo ∆t = 1 e que a data inicial é t = 0 tem-se como modelo
∀n ∈ N∗ βn+1 = (1 + α)βn + Θ(n) .
É usual considerar que Θ(n), o termo correspondente ao ruı́do, se pode escrever como:
Θ(n) = θn ,
em que a sucessão (n )n∈N representa uma sucessão de variáveis aleatórias independentes
e identicamente distribuı́das (iid), centradas e com variância comum igual à unidade. O
modelo que assim se obtem pode ser representado por
∀n ∈ N∗ βn+1 = (1 + α)βn + θn
(2)
em que α e θ são parâmetros - a serem objecto de estimação e calibração em caso de
aplicação do modelo - e com
i
E[n ] = 0, V[n ] = 1, L(n ) ≡ L(m ), m 6= n ⇒ n ↔ m ,
(3)
define um processo autoregressivo de ordem um que é bem conhecido e sobre o qual se
dispõe de muita informação (veja-se, por exemplo, [Dacunha-Castelle (I)][p. 132, 158,
176], [Dacunha-Castelle (II)][p. 140, 141]).
Exercı́cio 1 (Existência do ruı́do branco em tempo discreto). Mostre que existe um espaço de probabilidade e um ruı́do branco sobre este espaço; isto é, uma sucessão de variáveis aleatórias - definidas sobre
este espaço de probabilidade - independentes e identicamente distribuı́das - eventualmente com uma dada
distribuição prescrita - centradas e com variância comum igual à unidade.
1.2 Um modelo a tempo contı́nuo
Suponhamos que pretendemos encontrar um modelo a tempo contı́nuo semelhante ao
modelo descrito pela fórmula 2 e pelas hipóteses ou condições 3. Formalmente deverı́amos
ter
dβt = αβt dt + Θ(t)dt
ou ainda, com Θ(t)dt = θt ,
dβt = αβt dt + θt ,
em que se deveriam verificar as seguintes condições,
i
E[t ] = 0, V[t ] = 1, L(s ) ≡ L(t ), s 6= t ⇒ s ↔ t .
MF0910
2
21 de Dezembro de 2009
Capı́tulo IV
Integral Estocástico
Secção: 1
Isto é (t )t≥0 seria um processo estocástico de variáveis iid, centradas e com a variância
igual à unidade. Pode mostrar-se que um processo satisfazendo estas condições não pode
ter funções mensuráveis como trajectórias (veja-se [Øksendal 98][p. 21]). É-se, assim,
levado a procurar uma outra interpretação ou modelo em tempo contı́nuo. Para tal,
recordemos que existe um processo estocástico (Wt )t∈[0,+∞[ , de variáveis gaussianas, com
trajectórias contı́nuas - o processo de Wiener, também denominado processo browniano
- e incrementos independentes. Esta última propriedade permite-nos tentar interpretar
a equação diferencial com ruı́do
dβt
= αβt + Θ(t) ,
dt
ou a fórmula aproximada por discretização
βt+∆t − βt
≈ αβt + Θ(t) ,
∆t
pela expressão seguinte
βt+∆t − βt ≈ αβt ((t + ∆t) − t) + θ(t)(Wt+∆t − Wt ) ,
de uma forma semelhante à que usámos para o modelo a tempo discreto. Considerando
agora,
0 = t0 ≤ t1 = (t0 + ∆t) ≤ t2 ≤ · · · ≤ tn−1 ≤ tn = t = (t0 + n∆t) ,
pode escrever-se por superposição de termos com a forma dada pela expressão anterior
que:
n−1
n−1
n−1
X
X
X
βt − β0 =
(βti+1 − βti ) =
αβti ∆t +
θ(t)(Wti+1 − Wti ) .
i=0
i=0
i=0
Passando ao limite quando ∆t tende para zero virá:
βt = β0 + lim
∆t→0
n−1
X
αβti ∆t +
i=0
n−1
X
!
θ(t)(Wti+1 − Wti )
.
i=0
Pn−1
αβti ∆t) pode ser interpretado - sob hipóteses
Pode observar-se que o termo lim∆t→0 ( i=0
de regularidade adequadas - como umP
integral de Riemann ou de Lebesgue mas o que
n−1
θ(t)(Wti+1 − Wti ) ? Se fosse possı́vel interé que se pode dizer do termo lim∆t→0 i=0
pretá-lo também como um integral poderı́amos ter um modelo, em tempo contı́nuo, para
o crescimento populacional na presença de ruı́do. A evolução dos efectivos da população
seria descrita pela fórmula,
Z t
Z t
βt = β0 + (Lebesgue)
αβ(u)du + (?)
θ(u)dWu ,
0
0
em notação integral ou, na notação diferencial associada naturalmente à notação integral,
dβt = αβt dt + θt dWt .
MF0910
3
21 de Dezembro de 2009
Capı́tulo IV
Integral Estocástico
Secção: 2
No que vai seguir-se estudaremos a noção de integral estocástico introduzida por K.
Ito1 em três artigos datados de 1944, 1946 e 1951 (veja-se [Itô] para uma apresentação
sintética dos trabalhos deste autor). Esta noção permitir-nos-á dar um sentido à expressão
Z t
θ(u)dWu ,
0
de tal modo que muitas aplicações úteis poderão ser estudadas em grande profundidade
com recurso a esta noção.
2 O Integral Estocástico de Ito
Seja (Ω, F, P) um espaço de probabilidade, G = (Gt )t∈R+ uma filtração sobre este espaço
de probabilidade.
Definição 1. Um processo B = (Bt )t∈R+ , com trajectórias contı́nuas, é um G
processo browniano se e só se:
1. B é G adaptado, isto é:
∀t ∈ R+ Bt ∈ mGt ;
2. Os incrementos de B são G independentes, isto é:
i
∀s, t ∈ R+ s ≤ t ⇒ (Bt − Bs ) ↔ Gs ;
3. Os incrementos de B são estacionários, isto é:
∀s, t ∈ R+ s ≤ t ⇒ L(Bt − Bs ) ≡ L(Bt−s − B0 ) .
Exemplo 1. O principal exemplo de processo browniano que devemos ter presente no
que vai seguir-se é o do processo browniano usual relativamente à sua filtração natural.
Definição 2. F = (Ft )t∈R+ , a filtração natural associada ao processo
browniano B é, por definição:
∀t ∈ R+ Ft := σ({Bs : s ≤ t})∼ .
Trata-se da filtração formada pelas σ álgebras Ft , geradas em cada instante t pelas variáveis aleatórias Bs em que s ≤ t, completadas relativamente aos conjuntos de
probabilidade nula. Assim sendo, em cada uma das σ álgebras Ft todos os conjuntos P
desprezáveis pertencem a Ft e têm probabilidade nula.
1
Kiyosi Itô, matemático japonês nascido em 1915.
MF0910
4
21 de Dezembro de 2009
Capı́tulo IV
Integral Estocástico
Secção: 2
Exercı́cio 2. Mostre que se B é um G processo browniano então B é um F processo browniano, isto é,
B é um processo browniano relativamente à sua filtração natural F.
Consideramos seguidamente a definição de um espaço de processos relevante para
o integral estocástico. Trata-se de definir uma classe de processos que podem ser integrados relativamente ao processo browniano tendo o integral estocástico resultante boas
propriedades.
Definição 3. Seja (Ω, F, P) um espaço de probabilidade completo. Para S, T ∈
R+ , S < T e para H filtração sobre (Ω, F, P), o espaço N([S, T ], H) é o espaço dos
processos estocásticos Ψ = (ψt )t∈R+ que verificam as três condições seguintes.
1. Os processos Ψ são mensuráveis relativamente à álgebra σ produto
B([0, +∞) ⊗ F.
2. Os processos Ψ são adaptados relativamente a H = (Ht )t≥0 , isto é, são
tais que
∀t ≥ 0, ψt ∈ mHt .
3. Os processos Ψ verificam a condição de integrabilidade local:
Z T
2
ψt dt < +∞ .
E
S
Definição 4. Por definição temos ainda o espaço de processos localmente integráveis:
\
N(H) :=
N([S, T ], H) .
S,T ∈R+ ,S<T
Numa primeira etapa da definição do integral de Ito consideraremos que as funções
integrandas pertencem ao espaço N(F) em que F é a filtração associada ao processo G
browniano definido acima.
Para futura comodidade na escrita é conveniente precisar a seguinte notação relativa
aos processos mensuráveis localmente de quadrado integrável relativamente à medida
produto natural.
Definição 5. Sejam S, T ∈ R+ tais que S < T e seja L2[S,T ] (λ ⊗ P) o espaço dos
processos estocásticos
Ψi= (ψt )t∈R+ , mensuráveis relativamente a B([0, +∞[) ⊗
hR
T 2
F e tais que E S ψt dt < +∞.
Exercı́cio 3. Mostre que N([S, T ], H) é um subespaço vectorial de L2[S,T ] (λ ⊗ P).
MF0910
5
21 de Dezembro de 2009
Capı́tulo IV
Integral Estocástico
Secção: 2
Observação 1. Note que se definir para Ψ = (ψt )t∈R+ ∈ L2[S,T ] (λ ⊗ P), a norma de Ψ
como
Z T
1/2
2
|| Ψ ||L2 (λ⊗P) := E
ψt dt
,
[S,T ]
S
se tem que
L2[S,T ] (λ ⊗ P), || · ||L2
[S,T ]
(λ⊗P)
,
é um espaço de Banach, isto é um espaço vectorial normado completo (veja-se [Williams][p.
65]).
Definição 6. Seja G = (Gt )t∈R+ uma filtração. Chamamos função Gelementar a toda a função que se possa representar sob a forma:
φn (t, ω) =
+∞
X
ej (ω) I[j2−n ,(j+1)2−n [ (t) ,
j=0
em que n ∈ N∗ , ej (ω) ∈ mGj2−n e ej (ω) ∈ L2 (P).
Uma representação gráfica de uma função elementar mostra-nos que estas funções
são funções em escada cujos degraus são variáveis aleatórias. Com uns segundos de
reflexão esta imagem permite uma justificação intuitiva da propriedade seguinte.
Proposição 1. As funções G-elementares pertencem ao espaço N(G).
Demonstração. Seja S, T ∈ R+ , S < T . É imediato verificar que as funções elementares definem processos estocásticos bastando para esse efeito aplicar as propriedades
das funções mensuráveis e o teorema de Fubini. Para verificar que as funções elementares são processos estocásticos adaptados seja t0 ∈ R+ qualquer. Dado que a famı́lia
([i2−n , (i + 1)2−n [)i∈N forma uma partição de R+ , existe i = i(t0 ) ∈ N, único, tal que
t0 ∈ [i(t0 )2−n , (i(t0 ) + 1)2−n [. Como i(t0 )2−n ≤ t0 e por isso Gi(t0 )2−n ⊂ Gt0 :
φn (t0 , ω) = ei(t0 ) (ω) ∈ mGt0 .
MF0910
6
21 de Dezembro de 2009
Capı́tulo IV
Integral Estocástico
Secção: 2
Para verificar a propriedade de integrabilidade tem-se então que:
Z
E
T
φ2n (t, ω) dt =
S



! 
Z T X
+∞
+∞
X

= E
ej I[j2−n ,(j+1)2−n [ (t)
ei I[i2−n ,(i+1)2−n [ (t) dt =
S

Z
= E
T
j=0

T
=E
S
=
=
+∞
X
i=0
+∞
X
E[e2i ]
=
=
i=0
+∞
X


ej ej I[j2−n ,(j+1)2−n [∩[i2−n ,(i+1)2−n [ (t) dt =
j=0 i=0
+∞
X
!
e2i I[i2−n ,(i+1)2−n [ (t)
#
dt =
i=0
Z
T
(4)
I[i2−n ,(i+1)2−n [ (t) dt =
S
E[e2i ]
Z
E[e2i ]
Z
i=0
+∞
X
+∞ X
+∞
X

S
"Z
i=0
+∞
I[S,T ]∩[i2−n ,(i+1)2−n [ (t) dt =
−∞
+∞
I[sup(S,i2−n ),inf(T,(i+1)2−n [) (t)) dt =
−∞
E[e2i ] sup(inf(T, (i + 1)2−n ), sup(S, i2−n )) − sup(S, i2−n ) .
i=0
=
+∞
X
E[e2i ] (T ∧ (i + 1)2−n ) ∨ (S ∨ i2−n )) − (S ∨ i2−n ) .
i=0
Na última soma acima só não são nulas as parcelas em que [i2−n , (i + 1)2−n [∩[S, T ] 6= ∅
(verificar!). Trata-se pois de uma soma finita de parcelas que são limitadas, logo é uma
quantidade limitada.
O exercı́cio seguinte mostra que a cada processo estocástico adaptado é possı́vel
associar uma sucessão natural de funções elementares. Veremos adiante que esta sucessão
tem boas propriedades de aproximação.
Exercı́cio 4. Seja Y = (Yt )t∈[0,+∞[ um processo estocástico adaptado a uma dada filtração G e tal que,
para cada t ∈ [0, +∞[, a variável aleatória Yt é de quadrado integrável. Mostre que:
Yen (t, ω) :=
+∞
X
Yj 2−n (ω)I[j 2−n ,(j+1) 2−n [ (t)
j=0
é uma função G elementar.
MF0910
7
21 de Dezembro de 2009
Capı́tulo IV
Integral Estocástico
Secção: 2
2.1 O integral de Ito das funções elementares
Seja G = (Gt )t≥0 uma filtração sobre um espaço de probabilidade completo (Ω, F, P).
Considere-se, B = (Bt )t≥0 um G processo browniano. De acordo com o exercı́cio 2, B é
um F processo browniano relativamente à sua filtração natural dada pela definição 2.
Definição 7. Um processo browniano B = (Bt )t≥0 diz-se standard se:
B0 = 0, E[Bt ] = 0, E[Bt2 ] = t .
Salvo aviso em contrário, supomos que os processos brownianos que consideraremos
em seguida, são standard. Vamos procurar dar um sentido à expressão
Z
T
f (t, ω)dBt (ω) ,
S
quando f pertence ao espaço de processos estocásticos N(G). Para tal começamos por
definir o integral de Ito das funções G elementares.
Para se ter uma definição de integral estocástico que seja um operador linear com
propriedades calculatórias naturais pode propor-se que seja válida a cadeia de igualdades
seguinte.
Z
T
Z
+∞
I[j2−n ,(j+1)2−n [ (t)dBt (ω) =
I[S,T ]∩[j2−n ,(j+1)2−n [ (t)dBt (ω) =
−∞
S
Z
+∞
=
I[sup(S,j2−n ),inf(T,(j+1)2−n )[ (t)dBt (ω) =
−∞
(
BT ∧(j+1)2−n − BS∨j2−n
=
0
se [S ∨ j2−n , T ∧ (j + 1)2−n [6= ∅
no caso contrário
= B(T ∧(j+1)2−n )∨(S∨j2−n ) − BS∨j2−n
Observação 2. O leitor é convidado a verificar que se tem:
B(T ∧(j+1)2−n )∨(S∨j2−n ) − BS∨j2−n =


B(j+1)2−n ∨S − Bj2−n = 0





B(j+1)2−n ∨S − BS = B(j+1)2−n − BS
= BT ∨j2−n − Bj2−n = BT − Bj2−n



B(j+1)2−n ∨j2−n − Bj2−n = B(j+1)2−n − Bj2−n




BT ∨j2−n − Bj2−n = 0
se
se
se
se
se
j2−n < (j + 1)2−n ≤ S
j2−n ≤ S ≤< (j + 1)2−n ≤ T
S ≤ j2−n ≤ T ≤< (j + 1)2−n
S ≤ j2−n < (j + 1)2−n ≤ T
T ≤ j2−n < (j + 1)2−n .
Em consequência pode sempre adoptar-se a notação prática seguinte (veja-se [Øksendal 98][p.
23]):

j · 2−n se S ≤ j2−n ≤ T

(n)
t j = tj = S
se j2−n < S


T
se j2−n > S
MF0910
8
21 de Dezembro de 2009
Capı́tulo IV
Integral Estocástico
Secção: 2
tendo-se, com esta notação, que
Z
T
I[j2−n ,(j+1)2−n [ (t)dBt (ω) = Btj+1 − Btj
S
Recomendamos fortemente ao leitor o uso desta notação. Tal faremos, por exemplo, em
algumas das demonstrações seguintes.
Atendendo mais uma vez à linearidade e continuidade que se pretende para o integral
estocástico sai naturalmente a definição seguinte.
Definição 8. Tem-se, por definição que o integral de Ito da função G
elementar φn , relativamente ao processo G browniano B, é:
Z
T
φn (t, ω)dBt (ω) :=
S
+∞
X
ej (ω) B(T ∧(j+1)2−n )∨(S∨j2−n ) − BS∨j2−n =
j=0
=
+∞
X
(5)
ej (ω) Btj+1 − Btj
.
j=0
Observação 3. Note-se que a no membro à direita na definição acima figura uma variável
aleatória bem definida. Com efeito, por um argumento semelhante ao que foi já utilizado
acima a soma interveniente é uma soma finita.
Para obter a extensão do integral de Ito ao espaço de processos N(G) o resultado
seguinte é essencial.
Teorema 1 (Isometria de Ito). Seja φn uma qualquer função elementar limiRT
tada. Então S φn (t, ω)dBt (ω) o integral estocástico de φn relativamente ao
processo browniano é uma variável aleatória que pertence a L2 (P) e verifica-se:
Z T
Z T
2
2
E (
φn (t, ω)dBt (ω)) = E
φn (t, ω)dt ,
(6)
S
S
o que é equivalente, de acordo com as notações introduzidas no exercı́cio 3 e na
observação 1, a
Z
T
||
S
φn dBt ||L2 (P) =|| φn ||L2
[S,T ]
(λ⊗P)
.
(7)
Observação 4. Note-se que de acordo com o que se verificou na fórmula 4 o membro da
direita na igualdade 6 (ou na igualdade 7) é finito.
Demonstração. A demonstração decorre de um cálculo simples que utiliza apenas as
MF0910
9
21 de Dezembro de 2009
Capı́tulo IV
Integral Estocástico
Secção: 2
propriedades essenciais do processo browniano.
" Z
2 #
φn (t, ω)dBt (ω)
=(a)
T
E
S


+∞
X
= E 
ej (ω) (B(T ∧(j+1)2−n )∨(S∨j2−n ) − BS∨j2−n ) ×
j=0
+∞
X
×
!#
ei (ω) (B(T ∧(i+1)2−n )∨(S∨i2−n ) − BS∨i2−n )
=(b)
i=0
=
+∞
X
E
ej (ω)ei (ω) (B(T ∧(i+1)2−n )∨(S∨i2−n ) − BS∨i2−n ) ×
i<j
× B(T ∧(j+1)2−n )∨(S∨j2−n ) − BS∨j2−n
+
+∞
X
E
+
B(T ∧(i+1)2−n )∨(S∨i2−n ) − BS∨i2−n ×
j<i
× ej (ω)ei (ω) (B(T ∧(j+1)2−n )∨(S∨j2−n ) − BS∨j2−n +
+∞ h
X
2 i
+
E e2j (ω) (B(T ∧(i+1)2−n )∨(S∨i2−n ) − BS∨i2−n
=(c)
i=j
=
=
+∞
X
i=0
+∞
X
E e2i (ω) E (B(T ∧(i+1)2−n )∨(S∨i2−n ) − BS∨i2−n )2 =(d)
E e2j (ω) (T ∧ (i + 1)2−n ) ∨ (S ∨ i2−n ) − S ∨ i2−n ) =(e)
i=0
Z
T
=E
φ2n (t, ω)dt
S
As justificações para as igualdades são as seguintes.
(a) Substituição do integral estocástico pela expressão dada por definição em 5 e expressão geral para o quadrado de uma soma.
(b) Associação da soma sobre todos os pares de ı́ndices (i, j) ∈ N × N, segundo os três
casos i < j, j < i e i = j.
(c) Os dois primeiros termos da soma são nulos. Por exemplo, para o primeiro tem-se
que sendo i < j, vem que ti+1 ≤ tj , pelo que
ej (ω)ei (ω) (B(T ∧(i+1)2−n )∨(S∨i2−n ) − BS∨i2−n )
é mensurável relativamente a Gtj ; como B(T ∧(j+1)2−n )∨(S∨j2−n ) − BS∨j2−n é inMF0910
10
21 de Dezembro de 2009
Capı́tulo IV
Integral Estocástico
Secção: 2
dependente de Gtj tem-se que o primeiro termo da soma vale:
+∞
X
E ej (ω)ei (ω) (B(T ∧(i+1)2−n )∨(S∨i2−n ) − BS∨i2−n ) ×
i<j
× E B(T ∧(j+1)2−n )∨(S∨j2−n ) − BS∨j2−n = 0 ,
dado que E[B(T ∧(j+1)2−n )∨(S∨j2−n ) ] = E[BS∨j2−n ]. O mesmo tipo de argumento
pode ser dado para o segundo termo da soma. Por último, tem-se que ei é mensurável relativamente a Gti e B(T ∧(i+1)2−n )∨(S∨i2−n ) − BS∨i2−n é independente de
Gti .
(d) Uma vez que para s ≤ t se tem que E[(Bt − Bs )2 ] = t − s dado que o processo B
é standard.
(e) Pela expressão deduzida na sequência de fórmulas 4.
Observação 5. Considerando o operador linear IST , que a uma dada função elementar
φn associa o respectivo integral estocástico IST (φn ), a fórmula 7 pode interpretar-se da
seguinte forma.
|| IST (φn ) ||L2 (P) =|| φn ||L2 (λ⊗P) .
Isto significa que IST é uma isometria - isto é, um operador linear limitado que preserva
as distâncias - de N([S, T ], F) em L2 (P).
2.2 A extensão de um operador linear limitado
O exercı́cio seguinte que pode ser encarado como revisão de matérias estudadas noutra
disciplina, dá a ideia geral do processo a seguir para a definição do integral de Ito no
caso geral. A leitura é facultativa.
Exercı́cio 5. Sejam (E, || · ||E ) e (F, || · ||F ) dois espaços de Banach, D ⊂ E uma parte densa de E e
I uma aplicação de D em F linear e contı́nua.
1. Mostre que para z ∈ E existe (xn )n∈N sucessão de pontos de E convergente para z em E e que
(I(xn ))n∈N é uma sucessão de Cauchy em F .
˜ := limn→+∞ I(xn ) e que a aplicação I˜ assim definida é uma extensão
2. Mostre que pode definir I(z)
linear e contı́nua de I.
Resolução: Aconselha-se o leitor a tentar trabalhar o exercı́cio antes de estudar
esta resolução.
1. Seja (B(z, 1/n))n∈N∗ uma sucessão de bolas abertas centradas em z e de raio 1/n e,
para cada n, escolha-se um ponto xn ∈ B(z, 1/n) ∩ D que, por ser D denso em E,
existe certamente. A sucessão assim construı́da satisfaz o enunciado do exercı́cio
dado que por ser I linear contı́nua se tem para n e m arbitrários:
|| I(xn ) − I(xm ) ||F ≤||| I ||| · || xn − xm ||E .
MF0910
11
21 de Dezembro de 2009
Capı́tulo IV
Integral Estocástico
Secção: 2
Como a sucessão (xn )n∈N , por ser convergente é de Cauchy, a sucessão (I(xn ))n∈N
também é.
2. Sejam (x1n )n∈N e (x2n )n∈N duas sucessões de pontos de D convergentes para z
e I˜1 (z) := limn→+∞ I(x1n ) e I˜2 (z) := limm→+∞ I(x2m ) os respectivos limites.
Observe-se que:
|| I˜1 (z) − I˜2 (z) ||F =|| I˜1 (z) − I(x1n ) + I(x1n ) − (I˜2 (z) − I(x2n ) + I(x2n )) ||F ≤
≤|| I˜1 (z) − I(x1n ) ||F + || I˜2 (z) − I(x2n ) ||F + || I(x1n ) − I(x2n ) ||F .
Como limn→+∞ || I˜1 (z) − I(x1n ) ||F = 0 e limn→+∞ || I˜2 (z) − I(x2n ) ||F = 0 e se tem
que
|| I(x1n ) − I(x2n ) ||F ≤||| I ||| || x1n − x2n ||E ≤||| I |||
|| x1n − z ||E + || z − x2n ||E ,
e se tem naturalmente que limn→+∞ || x1n − z ||E = 0 e limn→+∞ || z − x2n ||E = 0
fica demonstrado que I˜ está bem definida. Com efeito, a imagem de I˜ num dado
ponto não depende da sucessão escolhida para a construir. Observe-se ainda que:
˜ ||F =|| lim I(xn ) ||F =
|| I(z)
n→+∞
= lim || I(xn ) ||F ≤||| I ||| ·
n→+∞
lim || xn ||E =
n→+∞
=||| I ||| · || z ||E ,
pelo que I˜ sendo limitada é contı́nua.
♦
2.3 O teorema de Ito
Considere-se, mais uma vez, G = (Gt )t≥0 uma filtração sobre um espaço de probabilidade
completo (Ω, F, P). e B = (Bt )t≥0 um G processo browniano standard. Relembremos
que, de acordo com o exercı́cio 2, B é um F processo browniano relativamente à sua
filtração natural que é, por definição, Ft := σ({Bs : s ≤ t})∼ .
MF0910
12
21 de Dezembro de 2009
Capı́tulo IV
Integral Estocástico
Secção: 2
Teorema 2 (Existência do Integral de Ito). Seja f ∈ N(F), e S, T ∈ R+ com
S < T.
1. Existe (φfn )n∈N uma sucessão de funções G elementares tal que:
Z
T
φfn (t, ω))2 dt
(f (t, ω) −
lim E
n→+∞
=0.
S
RT
2. Existe I = IST (f ) = S f (t, ω)dBt (t, ω) uma variável aleatória pertencente
a L2 (P), denominada integral de Ito de f relativamente ao processo
browniano dada por:
IST (f )
T
Z
T
Z
f (t, ω)dBt (ω) =L2 (P) lim
=
n→+∞ S
S
φfn (t, ω)dBt (ω) ,
tendo-se que I não depende da sucessão (φfn )n∈N .
3. Verifica-se ainda o resultado denominado isometria de Ito:
Z T
Z T
2
2
E (
f (t, ω)dBt (ω)) = E
f (t, ω)dt .
S
(8)
S
Demonstração. Suponhamos demonstrada a alı́nea (1) do enunciado. Seja então (φfn )n∈N
uma sucessão de funções G elementares tal que:
lim || f − φfn ||L2
n→+∞
[S,T ]
(λ⊗P) =
0.
Seja, para cada n ∈ N, a variável aleatória em L2 (P) definida por
Z
T
ψn :=
φn dBt .
S
Observe-se que a sucessão (ψn )n∈N é uma sucessão de Cauchy em L2 (P). Com efeito, por
aplicação do resultado relativo à isometria de Ito (fórmula 6) na igualdade assinalada
com o subı́ndice (a), tem-se que para m, n ∈ N:
|| ψn −
ψm ||2L2 (P)
Z
T
(φfn
=||
−
φfm )dBt
S
Z
||2L2 (P) =
T
=E
(φfn
−
φfm )2 dt
S
Z
E (
T
(φfn
−
φfm )dBt )2
=(a)
S
=|| φfn − φfn ||2L2
[S,T ]
(λ⊗P)
.
As hipóteses feitas sobre a sucessão (φfn )n∈N implicam que esta sucessão é de Cauchy em
L2[S,T ] (λ ⊗ P) uma vez que é convergente neste espaço. Em consequência verifica-se que:
lim
m,n→+∞
MF0910
|| ψn − ψm ||2L2 (P) =
lim
m,n→+∞
13
|| φfn − φfn ||2L2
[S,T ]
(λ⊗P) =
0,
21 de Dezembro de 2009
Capı́tulo IV
Integral Estocástico
Secção: 2
pelo que a sucessão (ψn )n∈N é de Cauchy em L2 (P). Como este espaço é completo existe
uma variável aleatória IST (f ) ∈ L2 (P) tal que a sucessão (ψn )n∈N converge para IST (f )
em L2 (P), isto é:
lim || IST (f ) − ψn ||L2 (P) = 0 ,
n→+∞
ou ainda, tal como se anunciou no enunciado,
" Z
T
φfn dt
f dBt −
lim E
n→+∞
T
Z
2 #
=0.
S
S
Para demonstrar a alı́nea 3 do enunciado basta observar que tendo:
|| IST (f ) ||L2 (P) =|| IST (f ) − ψn + ψn ||L2 (P) ≤|| IST (f ) − ψn ||L2 (P) + || ψn ||L2 (P)
e que limn→+∞ || IST (f ) − ψn ||L2 (P) = 0 e,
lim || ψn ||L2 (P) = lim || φn ||L2
n→+∞
n→+∞
f ||L2
(λ⊗P)
,
|≤|| f − φfn ||L2
(λ⊗P)
,
[S,T ]
(λ⊗P) =||
[S,T ]
uma vez que
| || f ||L2
[S,T ]
(λ⊗P)
− || φfn ||L2
[S,T ]
(λ⊗P)
[S,T ]
sai que:
|| IST (f ) ||L2 (P) ≤|| f ||L2
[S,T ]
(λ⊗P)
.
Para a desigualdade em sentido contrário observe-se do mesmo modo que,
|| IST (f ) ||L2 (P) =|| IST (f ) − ψn + ψn ||L2 (P) ≥| || IST (f ) − ψn ||L2 (P) − || ψn ||L2 (P) |
pelo que passando ao limite, com uma argumentação idêntica à já usada acima, se tem,
|| IST (f ) ||L2 (P) ≥|| f ||L2
[S,T ]
(λ⊗P)
.
Exercı́cio 6. Inspirando-se no exercı́cio 5, mostre que a definição do integral estocástico de f na demonstração acima não depende da sucessão aproximante (φfn )n∈N de funções elementares.
As propriedades do processo browniano utilizadas nas demonstrações acima mostram
que é possı́vel uma primeira extensão da noção de integral estocástico a um espaço de
processos ligeiramente mais geral.
MF0910
14
21 de Dezembro de 2009
Capı́tulo IV
Integral Estocástico
Secção: 3
Definição 9. Seja (Ω, F, P) um espaço de probabilidade completo e seja B =
(Bt )t≥0 um processo browniano standard sobre este espaço. Para S, T ∈ R+ ,
S < T e para H filtração sobre (Ω, F, P), o espaço O([S, T ], B, H) é o espaço dos
processos estocásticos Ψ = (ψt )t∈R+ que verificam as quatro condições seguintes.
1. O processo browniano standard B é uma H martingala.
2. Os processos Ψ são mensuráveis relativamente à álgebra σ produto
B([0, +∞) ⊗ F.
3. Os processos Ψ são adaptados relativamente a H = (Ht )t≥0 , isto é, são
tais que
∀t ≥ 0, ψt ∈ mHt .
4. Os processos Ψ verificam a condição de integrabilidade local:
Z T
2
E
ψt dt < +∞ .
(9)
S
Exercı́cio 7. Mostre que a construção do integral de Ito, que acabou de efectuar se mantem válida para
o espaço O([S, T ], B, H) de processos estocásticos definido acima.
Exercı́cio 8. Com as notações usadas no exercı́cio 4, supunha que Y = (Yt )t∈[0,+∞[ é um processo do
espaço N(F). Mostre que ((Yen )t )t≥0 é uma sucessão aproximante de Y = (Yt )t∈[0,+∞[ .
3 Propriedades do Integral de Ito
Uma primeira propriedade importante do integral de Ito verificada para processos suficientemente gerais é a de que o integral estocástico tem valor médio constante e nulo.
Teorema 3. Seja F a filtração natural associado ao processo browniano usual.
Seja N(F) o espaço dos processos localmente integráveis a relativamente à filtração F. Para f ∈ N(F) fixo, seja o processo (It )t≥0 dado para T > 0 por
Z
∀t ∈ [0, T ] It :=
t
fs dBs
0
Então E[It ] = 0.
a
MF0910
Segundo a definição 4.
15
21 de Dezembro de 2009
Capı́tulo IV
Integral Estocástico
Secção: 3
Demonstração. A prova decorre das propriedades do processo browniano. Consideremos
primeiramente uma função elementar φn (t, ω) qualquer.
T
Z
E


+∞
X
φn (t, ω)dBt (ω) = E 
ej (ω) (B(T ∧(j+1)2−n )∨(S∨j2−n ) − BS∨j2−n ) =(a)
S
=
+∞
X
j=0
E ej (ω) (B(T ∧(j+1)2−n )∨(S∨j2−n ) − BS∨j2−n ) =(b)
j=0
=
+∞
X
E E ej (ω) (B(T ∧(j+1)2−n )∨(S∨j2−n ) − BS∨j2−n ) | FS∨j2−n =(c)
j=0
=
+∞
X
E ej (ω)E (B(T ∧(j+1)2−n )∨(S∨j2−n ) − BS∨j2−n ) | FS∨j2−n =(d)
j=0
=
+∞
X
E ej (ω)E (B(T ∧(j+1)2−n )∨(S∨j2−n ) − BS∨j2−n ) =(e) 0 .
j=0
Com as justificações seguintes.
(a) Apesar da indexação indicar o contrário, trata-se de uma soma finita pelo que a
esperança da soma é a soma das esperanças sem necessidade de qualquer hipótese
adicional.
(b) Pela propriedade da tower law das esperanças condicionais.
(c) Pelas propriedades da esperança condicional e dado que ej ∈ mFj2−n e, naturalmente, Fj2−n ⊆ FS∨j2−n
(d) Uma vez que B(T ∧(j+1)2−n )∨(S∨j2−n ) − BS∨j2−n é independente de FS∨j2−n , pelas
propriedades da esperança condicional.
(e) Dado que consideramos um processo browniano os incrementos têm média nula.
Para um processo f ∈ N(F) arbitrário, seja então (φfn )n∈N uma sucessão de funções G
elementares tal que:
lim || f − φfn ||L2 (λ⊗P) = 0 .
n→+∞
[S,T ]
o que implica de acordo com o teorema 2 que
" Z
2 #
Z t
t
lim E
f dBs −
φfn ds
=0.
n→+∞
0
0
No caso de f ser um processo limitado o resultado segue imediatamente em consequência
do teorema da convergência dominada de Lebesgue. No caso geral procede-se por truncatura.
MF0910
16
21 de Dezembro de 2009
Capı́tulo IV
Integral Estocástico
Secção: 4
Uma das propriedades mais importantes do integral de Ito é a que assegura que um
processo definido por um integral de Ito é modificável num processo com trajectórias
contı́nuas. Esta propriedade é muito semelhante à propriedade de continuidade do integral de Riemann função do limite superior de integração.
Teorema 4. Com as mesmas notações do teorema 3, (It )t≥0 é um processo
que admite uma versão com trajectórias contı́nuas, isto é, existe (Jt )t≥0 tal que
quase certamente em ω ∈ Ω, J· (ω)é uma função contı́nua (na variável t ∈ [0, T ])
e tal que:
∀t ∈ [0, T ] P [Jt = It ] = 1 .
Demonstração. A demonstração deste teorema não é muito complicada embora seja
tecnicamente exigente numa primeira aproximação.
Uma segunda propriedade importantes do integral de Ito é a que descreve o carácter
de martingala de um processo definido por um integral de Ito.
Teorema 5. Com as mesmas notações do teorema anterior tem-se que (It )t≥0
é uma F-martingala e verifica-se por isso a desigualdade de Doob:
"
#
Z T
1
2
fs ds .
∀λ > 0 ∀t ∈ [0, T ] P sup |It | ≥ λ ≤ 2 P
λ
0≤t≤T
0
Demonstração. A demonstração deste resultado que reproduzimos seguidamente é simples e esclarecedora (veja-se [Itô][p. 186]). Seja T fixo qualquer. Seja (φfn )n∈N uma
sucessão de funções elementares, de acordo com a alı́nea 1 do teorema 2, aproximante
de f isto é tal que:
lim f − φfn 2
=0.
(10)
n→+∞
L[0,T ] (λ⊗P)
Rt
Definindo os integrais estocásticos das funções aproximantes I(n)t := 0 (φfn )s dBs , temse pelo teorema da construção do integral de Ito 2.3 que para cada t fixo se verifica
limn→+∞ kIt − I(n)t kL2 = 0. Pelas propriedades da esperança condicional tem-se, para
P
s > t fixos e para todo o n ≥ 1, que:
E[Is | Ft ] = E[Is − I(n)s + I(n)s | Ft ] = E[Is − I(n)s | Ft ] + E[I(n)s | Ft ] =
= E[Is − I(n)s | Ft ] + I(n)t .
Uma vez que pelos teoremas de convergência da esperança condicional se verifica que
limn→+∞ E[Is − I(n)s | Ft ] =L2 0 e que limn→+∞ I(n)t =L2 It , o resultado anunciado no
P
P
teorema sai verificado.
MF0910
17
21 de Dezembro de 2009
Capı́tulo IV
Integral Estocástico
Secção: 4
4 A fórmula de Ito
Definição 10. Um processo estocástico (Xt )t≥0 é um processo de Ito se e só
se admite uma representação na forma
Z t
Z t
Xt = X0 +
us ds +
vs dBs
0
0
ou na representação diferencial usual:
dXt = ut dt + vt dBt
em que se tem que (vt )t≥0 ∈ N(F) e (ut )t≥0 é tal que para cada t se tem
Z t
P
|us | ds < +∞ ∀t ≥ 0 = 1 .
0
Observação 6. Podem considerar-se como processos de Ito os processos em que se verifica
apenas que:
Z t
P
vs2 ds < +∞ ∀t ≥ 0 = 1 .
0
em vez da condição de integrabilidade local mais forte dada pela fórmula 9.
O teorema seguinte mostra-nos como aplicar as regras do cálculo diferencial próprias
à aproximação de Ito.
Teorema 6 (Fórmula de Ito I). Seja (Xt )t≥0 um processo de Ito admitindo a
representação
dXt = ut dt + vt dBt
Seja g ∈ C 2 ([0, +∞[×R) e para cada t ≥ 0,
Yt := g(t, Xt ) .
Então, para (Yt )t≥0 tem-se a denominada fórmula de Ito:
dYt =
∂g
∂g
1 ∂2g
(t, Xt )dt +
(t, Xt )dXt +
(t, Xt )(dXt )2
∂t
∂x
2 ∂x2
(11)
em que (dXt )2 = (ut dt + vt dBt )2 = vt2 dt com a tabela de multiplicação dada por
dt · dt = dt · dBt = dBt · dt = 0 dBt · dBt = dt .
(12)
Observação 7. Pode observar-se que os primeiros dois termos da fórmula 11 correspondem à diferencial usual. Para além destes dois termos surge um termo inesperado de
segunda ordem que resulta das propriedades especiais do processo browniano.
MF0910
18
21 de Dezembro de 2009
Capı́tulo IV
Integral Estocástico
Secção: 5
Demonstração. Um esquema geral da demonstração da fórmula de Ito pode ser estudado
na obra [Øksendal 98][p. 47]. As demonstrações rigorosas requerem o uso de técnicas de
processos estocásticos maia avançadas.
Corolário 1 (Fórmula de Ito II). Sob as hipóteses do teorema 6 tem-se ainda que (Yt )t≥0
admite a representação:
2
∂g
∂g
∂g
21 ∂ g
dYt =
(t, Xt ) dt + vt (t, Xt )dBt
(t, Xt ) + ut (t, Xt ) + vt
(13)
2
∂t
∂x
2 ∂x
∂x
sendo por isso também um processo de Ito.
Demonstração. A fórmula 13 resulta da fórmula 11 aplicando a tabela de multiplicação 12.
Observação 8. Para aplicar a fórmula de Ito, quer na diferenciação quer na integração,
deverá ter-se presente a seguinte metodologia geral.
1. Identificar exactamente o processo correspondente a (Xt )t≥0 através da sua representação diferencial, isto é, indicar os processos (ut )t≥0 e (vt )t≥0 .
2. Identificar a função g que verifica Yt = g(t, Xt ).
3. Procure que as escolhas do processo (Xt )t≥0 e da função g não compliquem muito
os cálculos das derivadas parciais.
Rt
Exemplo 2. Determine-se 0 Bs dBs . Uma escolha natural é pôr: Xt = Bt e logo dXt =
dBt e g(t, x) = (1/2)x2 . Ter-se-á Yt = (1/2)Bt2 donde resulta por aplicação da fórmula
de Ito:
Z t
1
1 2
1
dYt = Bt dBt + dt ⇔ Bt =
Bs dBs + t .
2
2
2
0
Exemplo 3. Supondo que para t ≥ 0 se tem Yt = exp(σBt + µt) com µ ∈ R e σ ∈]o, +∞[,
diferenciando o processo pode mostrar-se que se trata de um processo de Ito. Com efeito
se for Xt = σBt + µt e logo dXt = σdBt + µdt e se g(t, x) = exp(x), tem-se pela fórmula
de Ito que:
1 2
dYt = Yt σdBt + µ + σ dt
2
5 Outras aplicações da fórmula de Ito
Nesta secção detalhamos algumas aplicações importantes da fórmula de Ito.
5.1 Cálculo de Esperanças Matemáticas
A fórmula de Ito tem uma aplicação natural em Matemática Financeira quando se
utiliza para o cálculo de valores esperados envolvendo o processo browniano (vejase [Björk 98][p. 40]). O método geral para determinar E[Y ] pode ser assim descrito.
MF0910
19
21 de Dezembro de 2009
Capı́tulo IV
Integral Estocástico
Secção: 5
1. Representar Y sob a forma Y = Zt0 em que Z é um processo estocástico de Ito,
segundo a definição 10.
2. Pela fórmula de Ito determinar os processos (µt )t≥0 e (σt )t≥0 tais que:
t
Z
Z
t
σs dBs
µs ds +
Zt = z0 +
0
0
Rt
3. Pelo teorema 3 uma vez que E[ 0 σs dBs ] tem-se que
Z
E[Y ] = E[Zt0 ] = z0 + E
t
t
Z
µs ds = z0 +
0
E [µs ] ds
0
se o processo (µt )t≥0 for suficientemente regular.
4. Sob reserva de ser possı́vel calcular E[µs ] ter-se-á a resposta ao problema da determinação do valor esperado desejado.
Alguns exercı́cios das aulas práticas tiram partido desta metodologia.
5.2 Difusões e Operadores
Seja um processo de Ito (Xt )t≥0 dado na sua forma diferencial por:
dXt = µ(Xt )dt + σ(Xt )dBt ,
sendo µ e σ funções reais de variável real regulares tais que o operador diferencial
Lµ,σ = µ(x)
d
1
d2
+ σ 2 (x) 2
dx 2
dx
está bem definido num espaço de funções não trivial
2
que denominaremos H.
Definição 11. Uma função φ ∈ H é uma função própria do operador Lµ,σ
se e só se
∃λ 6= 0 Lµ,σ (φ) = λφ
(14)
sendo λ o valor próprio associado à função própria φ.
2
Tipicamente será um subespaço do espaço das funções de quadrado integrável.
MF0910
20
21 de Dezembro de 2009
Capı́tulo IV
Integral Estocástico
Secção: 6
Proposição 2. Seja o processo Yt := e−λt φ(Xt ), definido para t ≥ 0 em que φ
é uma função própria de Lµ,σ .
1. Então (Yt )t>0 é um processo de Ito, mais concretamente,
dYt = e−λt φ0 (Xt )σ(Xt )dBt .
(15)
2. Sob a condição
Z
T
∀S, T ∈ [0, +∞[ E
2 φ (Xt )σ(Xt ) dt < +∞ ,
−λt 0
e
S
o processo (Yt )t>0 é uma martingala.
Demonstração. A demonstração da fórmula 15 faz-se por aplicação imediata da fórmula
de Ito usando a relação dada pela fórmula 14 .
Observação 9. O problema da determinação das funções e valores próprios do operador
Lµ,σ (φ) pode fazer-se usando a teoria de Sturm-Liouville. Com efeito, uma estratégia
geral para colocar a equação diferencial
1
µ(x)y 0 (x) + σ 2 (x)y 00 = λy
2
na forma de um operador de Sturm-Liouville consiste
em dividir a equação por σ 2 (x)/2,
Rx
2 (t)dt
2µ(t)/σ
multiplicando pelo factor integrante p(x) := e
e efectuar as operações de
forma a colocar a equação na forma:
d
d
p(x) y(x) + (q(x) − λρ(x))y(x) = 0 ,
dx
dx
(com q(x) = 0) e ρ(x) = (2/σ 2 (x))p(x)) forma esta que pode ser tratada usando a teoria
geral dos operadores de Sturm-Liouville (veja-se por exemplo, [Zettl 05]).
6 Sobre as referências bibliográficas
O leitor poderá tirar enorme proveito da consulta das referências bibliográficas clássicas
sobre o integral estocástico. O estudo do cálculo estocástico em toda a profundidade
requer algum domı́nio da teoria moderna dos processos estocásticos, em particular, do
processo browniano. Apresentamos seguidamente alguns comentários sobre a bibliografia
referida com vista a encorajar leituras adicionais.
1. [Björk 98] mostra o que é preciso saber de cálculo estocástico para entender a
matemática financeira moderna.
2. [Øksendal 98] é a leitura recomendada para uma primeira aproximação.
MF0910
21
21 de Dezembro de 2009
Capı́tulo IV
Integral Estocástico
Secção: 7
3. [Karatzas 91] é recomendado para um estudo completo e profundo.
4. [Lamberton 96] é uma aproximação expedita e eficaz para quem pretende utilizar o cálculo estocástico na matemática financeira. a secção sobre as equações
diferenciais estocásticas é particularmente recomendada.
5. [Chung et al 90] e [Protter 90] são adequados para quem deseje uma aproximação
mais geral à integração estocástica.
6. [Durrett 96] estabelece a ligação às equações nas derivadas parciais.
7. [Klebaner 98] tem aplicações do cálculo estocástico à Biologia e à Engenharia e à
Fı́sica.
7 Exercı́cios
7.1 Generalidades
Exercı́cio 9. Sendo W = (Wt )t≥0 o processo de Wiener, mostre que:
ˆ
˜
1. E [Wt ] = 0, E Wt2 = t, ∀t ≥ 0.
2. E [Wt Ws ] = min(t, s), ∀t, s ≥ 0.
ˆ
˜
3. E (Wt − Ws )2 = t − s, t ≥ s.
ft = Wt0 +t − Wt0
Exercı́cio 10. Sejam W = (Wt )t≥0 o processo de Wiener e t0 ≥ 0 fixo. Prove que W
é um processo de Wiener.
Exercı́cio 11. Seja Bt um processo de Wiener em R tal que B0 = 0
1. Mostre, usando propriedades conhecidas, que:
1
∀u ∈ R E[eiuBt ] = exp(− u2 t) .
2
2. Usando o desenvolvimento de Taylor da função exponencial nos dois membros da igualdade acima,
compare os termos com a mesma potência em u e deduza que:
E[Bt4 ] = 3t2
e, mais geralmente que:
∀k ∈ N E[Bt2k ] =
(2k)! k
t .
2k k!
3. Uma outra justificação do resultado anterior é a seguinte. Mostre que:
Z
1
x2
E[f (Bt )] = √
f (x) exp(− )dx ,
2t
2πt R
para todas as funções f tais que o integral à direita converge. Aplique então este resultado à
função f (x) = x2k e use integração por partes e indução em k.
MF0910
22
21 de Dezembro de 2009
Capı́tulo IV
Integral Estocástico
Secção: 7
7.2 Integral de Ito, Tempos de Paragem e Martingalas
Exercı́cio 12. Mostre que com Bt o processo browniano e considerando B0 = 0. Então
Z t
1
1
Bs dBs = Bt2 − t.
2
2
0
Exercı́cio 13. Mostre directamente usando a definição do integral de Ito que:
Z t
Z t
sdBs = tBt −
Bs ds .
0
0
Indicação: Considere que B0 = 0 e que:
X
X
X
∆(sj Bj ) =
sj ∆(Bj ) +
Bj+1 ∆(sj ) .
j
j
j
Exercı́cio 14. Mostre directamente usando a definição do integral de Ito que:
Z t
Z t
1
Bs2 dBs = Bt3 −
Bs ds .
3
0
0
Indicação: Considere que B0 = 0.
Exercı́cio 15. Seja X = (Xt )t∈[0,+∞[ um processo estocástico e seja HtX = Ht para t ∈ [0, +∞[, a
σ-álgebra gerada pela famı́lia de variáveis aleatórias {Xt : 0 ≤ s ≤ t}. Isto é, HX = (Ht )t∈[0,+∞[ é a
filtração associada ao processo estocástico X.
1. Mostre que se X é uma martingala relativamente a uma dada filtração N = (Nt )t∈[0,+∞[ então X
é também uma martingala relativamente à filtração que lhe está associada HX .
2. Mostre que se X é uma martingala relativamente a HX então:
∀t ∈ [0, +∞[ E[Xt ] = E[X0 ] .
Exercı́cio 16. Mostre que o processo de Wiener W = (Wt )t≥0 é uma martingala com respeito à filtração
Ft = σ ({Ws ; s ≤ t}) .
Exercı́cio 17. Verifique quais os processos seguintes são ou não martingalas:
1.
Xt = Bt + 4t ,
2.
Xt = Bt2 ,
3.
Xt = t2 Bt − 2
Z
t
sBs ds ,
0
4.
Xt = Bti × Btii ,
onde Bti e Btii são processos brownianos independentes.
Exercı́cio 18. Mostre directamente que:
Mt = Bt2 − t ,
é uma martingala relativamente à filtração do processo browniano.
MF0910
23
21 de Dezembro de 2009
Capı́tulo IV
Integral Estocástico
Secção: 7
Exercı́cio 19. Mostre que:
Mt = Bt3 − 3tBt ,
é uma martingala relativamente à filtração do processo browniano.
Exercı́cio 20. Seja ∆ = {s(1), s(2), . . . s(n)} uma subdivisão do intervalo [t, u] em R+ isto é, tal que:
t = s(1) < s(2) < · · · < s(n) = u. Seja δ(∆) o passo da subdivisão ∆ definido por:
δ(∆) =
|s(i + 1) − s(i)| .
sup
1≤i≤n−1
Seja r2 (∆) a variação quadrática do processo browniano em ∆ dada por:
r2 (∆) =
n−1
X
(Bs(i+1) − Bs(i) )2 .
i=1
Seja r1 (∆) a variação (simples) do processo browniano em ∆ dada por:
r1 (∆) =
n−1
X
|Bs(i+1) − Bs(i) | .
i=1
1. Mostre que E[r2 (∆)] = u − t .
P
2
2
2. Mostre que E[(r2 (∆))2 ] = 2 n−1
i=1 (s(i + 1) − s(i)) + (u − t) .
Indicações: Poderá usar que:
• E[(Bs(i+1) − Bs(i) )4 ] = 3(s(i + 1) − s(i))2 .
• Os incrementos do processo browniano são independentes.
3. Mostre que E[(r2 (∆) − (u − t))2 ] = E[(r2 (∆))2 ] − (u − t)2 e conclua que em L2 (P):
lim r2 (∆) = u − t .
δ(∆)→0
4. Mostre que existe uma sucessão de partições (∆n )n∈N tal que, salvo talvez num conjunnto de
probabilidade nula:
lim r2 (∆n ) = u − t .
n→+∞
2
Indicação: A convergência em L (P) implica a existência de uma sucessão convergente salvo talvez
num conjunnto de probabilidade nula.
5. Mostre que se ∆n = {s(1, n), s(2, n), . . . s(k(n), n)} com u = s(1, n) < · · · < s(k(n), n) = t então:
k(n)
sup r1 (∆) ≥
∆
X
Pk(n)
|Bs(i+1,n) − Bs(i,n) | ≥
i=1
|Bs(i+1,n) − Bs(i,n) |2
.
sup1≤i≤k(n) |Bs(i+1,n) − Bs(i,n) |
i=1
6. Conclua que salvo talvez num conjunto de probabilidade nula:
sup r1 (∆) = sup
∆
∆
n−1
X
|Bs(i+1) − Bs(i) | = +∞ .
i=1
Exercı́cio 21. Mostre que qualquer função constante não negativa é um stopping time.
Exercı́cio 22. Mostre que se T é um stopping time de (Ft )t≥0 então para
∀t ≥ 0{T < t} ∈ Ft .
MF0910
24
21 de Dezembro de 2009
Capı́tulo IV
Integral Estocástico
Secção: 7
Exercı́cio 23. Se T é um stopping time e a > 0 uma constante então T + a é um stopping time.
Exercı́cio 24. Mostre que se T e S são stopping times então também o são
T ∧ S e T ∨ S.
Exercı́cio 25. Prove que FT é uma σ−álgebra e que T é FT −mensurável. Mostre que se ∀ω ∈
Ω T (ω) = a para a ≥ 0 constante, então FT = Fa
Exercı́cio 26. Mostre que para quaisquer dois stopping times T e S e para qualquer A ∈ FS , temos
A ∩ {S ≤ T } ∈ FT . Em particular, se S ≤ T em Ω então FS ⊆ FT .
Exercı́cio 27. Dados S e T stopping times. Mostre que FT ∧S = FT ∩ FS .
Exercı́cio 28. Sejam Bt o processo browniano, ∆tk = tk+1 − tk e ∆Bk = Btk+1 − Btk com 0 = t0 <
t1 < . . . < tn = t. Mostre que
!2 #
" n
n
X
X
E
(∆Bk )2 − t
=2
(∆tk )2
k=1
k=1
e conclua que
n
X
(∆Bk )2 → t quando ∆tk → 0 (n → ∞)
k=1
em L .
2
7.3 Fórmula de Ito
Exercı́cio 29. Use a fórmula de Ito para escrever os seguintes processos estocásticos na forma diferencial
habitual:
dXt = u(t, ω)dt + v(t, ω)dBt .
1. Xt = (Bt )2 .
2. Xt = 2 + t + exp(Bt ).
Exercı́cio 30. Use a fórmula de Ito para demonstrar que:
Z t
Z t
1
Bs2 dBs = Bt3 −
Bt ds, B0 = 0.
3
0
0
Exercı́cio 31. Sejam Xt e Yt dois processos de Ito dados na forma diferencial habitual por:
dXt = σ(t, ω)dt + µ(t, ω)dBt , dYt = ρ(t, ω)dt + ν(t, ω)dBt .
Mostre usando a fórmula de Ito e o facto
Xt Yt =
1
((Xt + Yt )2 − Xt2 − Yt2 ) ,
2
que:
d(Xt Yt ) = Xt dYt + Yt dXt + µ(t, ω)ν(t, ω)dt .
MF0910
25
21 de Dezembro de 2009
Capı́tulo IV
Integral Estocástico
Secção: 7
Exercı́cio 32. Sejam Xt e Yt dois processos de Ito. Mostre que
d(Xt Yt ) = Xt dYt + Yt dXt + dXt dYt
e conclua com a seguinte fórmula de integração por partes:
Z t
Z t
Z
Xs dYs = Xt Yt − X0 Y0 −
Ys dXs −
0
0
t
dXs dYs .
0
Exercı́cio 33. Seja θ(t, ω) ∈ N([0, T ]) onde N([0, T ]) é o espaço das funções integrandas para as quais
o integral de Ito foi definido inicialmente. Seja para t ∈ [0, T ]:
Z t
Z
1 t 2
θ(s, ω)dBs −
Zt = exp(
θ (s, ω)ds) .
2 0
0
1. Use a fórmula de Ito para mostrar que dZt = Zt θ(t, ω)dBt .
2. Conclua que Zt é uma martingala para t ∈ [0, T ] se se verificar que Zt θ(t, ω) ∈ N([0, T ]).
Exercı́cio 34.
1. Para c e α constantes seja Xt = exp(ct + αBt ). Mostre que:
dXt = (c +
1 2
α )Xt dt + αXt dBt .
2
2. Para c e α1 , . . . , αn constantes e (Bti )i∈{1,...,n} famı́lia de n processos brownianos independentes
seja:
n
X
Xt = exp(ct +
αi Bti )
i=1
Mostre que:
dXt = (c +
n
n
X
1X 2
αi )Xt dt + Xt (
αi dBti ) .
2 i=1
i=1
Exercı́cio 35. Seja Xt um integral de Ito dXt = v(t, ω)dBt .
1. Dê um exemplo que mostre que Xt2 não é em geral uma martingala.
2. Mostre que
Mt = Xt2 −
Z
t
|v(s, ω)|2 ds ,
0
é uma martingala.
Exercı́cio 36. Sejam Bt1 e Bt2 dois processos brownianos independentes. Escreva na forma diferencial
o processo bidimensional definido por:
`
´ `
´
Zt = Zt1 , Zt2 = Bt1 Bt2 , exp(Bt1 )Bt2 .
Exercı́cio 37. Suponha-se que Xt satisfaz a equação
dXt = αXt dt + σXt dWt
e que Yt satisfaz a equação
dYt = γYt dt + δYt dVt ,
onde V é um processo de Wiener independente de W . Defina-se Z por Z = XY e obtenha o desenvolvimento diferencial de Z.
Nota: Se X descreve o processo do preço de uma acção da IBM em dólares e Y a taxa de conversão
escudos/dólares então Z descreve a dinamica do preço da acção da IBM em escudos.
MF0910
26
21 de Dezembro de 2009
Capı́tulo IV
Integral Estocástico
Secção: 7
Exercı́cio 38. Seja Xt o processo solução da equação:

dXt = (αXt + β) dt + (σXt + ρ) dWt
X0
=0
`
´
Façamos St = exp( α − σ 2 /2 t + σWt ).
1. Escreva a equação diferencial que St−1 satisfaz.
`
´
2. Prove que d Xt St−1 = St−1 ((β − σρ)dt + ρdWt ).
3. Obtenha a representação explicita de Xt .
Exercı́cio 39. O processo de Ornstein-Ulhenbeck é a solução da equação:

dXt = −cXt dt + σdBt
X0
= x0
1. Mostre que Xt = x0 e−ct + σe−ct
Rt
0
ecs dBs .
2. Calcule E [Xt ] e V [Xt ].
Indicação: Aplique a fórmula de Ito à função f (t, Xt ) = Xt exp(ct).
Exercı́cio 40. O movimento browniano geométrico é a solução da equação:

dXt = αXt dt + σXt dWt
X0
= x0
“
”
2
1. Mostre que Xt = x0 exp( α − σ2 t + σWt ).
2. Mostre que E [Xt ] = x0 exp(αt).
Indicação: Aplique a fórmula de Ito à função f (t, Xt ) = ln(Xt ).
Exercı́cio 41. Mostre que o processo exp(Wt − (1/2)t) é a solução da equação:

dXt = Xt dWt
X0
=1
Indicação: Aplique a fórmula de Ito à função f (t, x) = exp(x − (1/2)t).
Exercı́cio 42. Mostre que o processo exp(2Wt − t) é a solução da equação:

dXt = Xt dt + 2Xt dWt
X0
=1
Indicação: Aplique a fórmula de Ito a uma função f (t, x) escolhida adequadamente.
Exercı́cio 43. Suponha que o processo Xt é a solução da equação:

dXt = αXt dt + σXt dWt
X0
=1
Considere o processo Yt = Xtβ . Determine a equação diferencial estocástica satisfeita por Yt .
MF0910
27
21 de Dezembro de 2009
Capı́tulo IV
Integral Estocástico
Secção: 7
7.4 O Modelo de Black-Scholes
Exercı́cio 44 (Paridade put-call). Considere uma carteira contendo três posições relativas ao mesmo
activo, nomeadamente uma acção com o preço S, uma opção put com valor Vp e uma posição curta
numa opção call com valor Vc .
1. Admitindo que ambas as opções têm a mesma data de exercı́cio T , que não há dividendos, que o
mercado é livre de arbitragem e que não há custos de transacção mostre directamente que:
∀t ∈ [0, T ] S + Vp − Vc = KE −r(T −t)
em que K é o preço de exercı́cio (strike price) e r é a taxa de juro sem risco.
2. Mostre usando as fórmulas de Black-Scholes para as opções put e call que a fórmula da paridade
put-call é satisfeita.
Exercı́cio 45 (Volatilidade implı́cita). Considere a fórmula de apreçamento de Black-Scholes para um
derivado X representada na forma Π(t, X) = f (St , t, T, K, r, σ) com as notações habituais. Suponha que
para uma certa escolha St , t, T, K, r conhece Π(t, X).
1. Mostre que é possı́vel determinar σ = σ((St , t, T, K, r) de forma a que se verifique a fórmula de
Black-Scholes.
2. Considere t, T, r fixos. Usando dados reais para, pelo menos, dois activos distintos do mesmo
mercado, para pelo menos cinco valores distintos de K e para os correspondentes preços dos
activos determine as volatilidades σ = σ((St , t, T, K, r) de forma a que se verifique a fórmula de
Black-Scholes.
3. Represente graficamente, para cada activo, σ em função de K e compare os gráficos entre si e
com as hipóteses que assumiu no modelo dede Black-Scholes.
Exercı́cio 46. Considere que no modelo de Black-Scholes a evolução dos preços dos activos é dada pelas
equações:
dSt = µSt dt + σSt dBt ,
dβt = rβt dt
onde (Bt )t∈R+ é um processo browniano usual.
1- Mostre que:
(2.1)
St+∆t = St exp(σ(Bt+∆t − Bt ) + (µ − 12 σ 2 )∆t)
e conclua que os retornos logarı́tmicos do activo em questão são normais com média e variância definidas.
2- Usando a fórmula (2.1) mostre que:
µ−
E[ln(St+∆t /St )]
1 2
σ =
,
2
∆t
σ2 =
V[ln(St+∆t /St )]
∆t
onde E[X] e V[X] representam a média e a variância da variável aleatória X.
3- Considere os seguintes dados para a evolução dos preços (St )t∈{0,...,11} em que os preços são dados
mensalmente.
t
St
t
St
0
6 900
6
6 021
1
6 710
7
5 536
2
6 535
8
5 419
3
6 281
9
5 641
4
6 232
10
5 380
5
6 098
11
5 216
Determine µ e σ.
4- Determine o preço de uma call option europeia, no instante t = 11 sobre o activo representado por St ,
com taxa nominal de 3,6% ao ano, maturidade de 3 meses e preço de Execı́cio de 5 500.
MF0910
28
21 de Dezembro de 2009
Capı́tulo IV
Integral Estocástico
Secção: 7
Exercı́cio 47. Para c e α constantes, seja Xt = exp (ct + αBt ). Use a fórmula de Ito para mostrar que
«
„
1
dXt = c + α2 Xt dt + αXt dBt
2
Exercı́cio 48. Considere que no modelo de Black-Scholes a evolução dos preços dos activos é dada pelas
equações:
dSt = µSt dt + σSt dBt ,
dβt = rβt dt
onde (Bt )t∈R+ é um processo browniano usual.
1- Mostre que:
(2.1)
St+∆t = St exp(σ(Bt+∆t − Bt ) + (µ − 12 σ 2 )∆t)
e conclua que os retornos logarı́tmicos do activo em questão são normais com média e variância definidas.
2- Usando a fórmula (2.1) mostre que:
µ−
E[ln(St+∆t /St )]
1 2
σ =
,
2
∆t
σ2 =
V[ln(St+∆t /St )]
∆t
onde E[X] e V[X] representam a média e a variância da variável aleatória X.
3- Considere os seguintes dados para a evolução dos preços (St )t∈{0,...,13} em que os preços são dados
mensalmente.
t
St
t
St
0
3 478
6
4 065
1
3 587
7
4 154
2
3 760
8
4 187
3
3 613
9
4 357
4
3 690
10
4 473
5
4 014
11
4 600
Determine µ e σ.
4- Determine o preço de uma put option europeia, no instante t = 11 sobre o activo representado por St ,
com taxa nominal de 3,6% ao ano, maturidade de 4 meses e preço de Execı́cio de 4 500.
Exercı́cio 49. Considere que no modelo de Black-Scholes a evolução dos preços dos activos é dada pelas
equações:
dSt = µSt dt + σSt dBt ,
dβt = rβt dt
onde (Bt )t∈R+ é um processo browniano usual.
1- Mostre que:
(2.1)
St+∆t = St exp(σ(Bt+∆t − Bt ) + (µ − 12 σ 2 )∆t)
e conclua que os retornos logarı́tmicos do activo em questão são normais com média e variância definidas.
2- Usando a fórmula (2.1) mostre que:
µ−
E[ln(St+∆t /St )]
1 2
σ =
,
2
∆t
σ2 =
V[ln(St+∆t /St )]
∆t
onde E[X] e V[X] representam a média e a variância da variável aleatória X.
3- Considere os seguintes dados para a evolução dos preços (St )t∈{0,...,13} em que os preços são dados
mensalmente.
t
St
t
St
MF0910
0
6 900
6
6 021
1
6 710
7
5 536
2
6 535
8
5 419
29
3
6 281
9
5 641
4
6 232
10
5 380
5
6 098
11
5 216
21 de Dezembro de 2009
Capı́tulo IV
Integral Estocástico
Secção: 7
Determine µ e σ.
4- Usando a fórmula de Black-Scholes determine uma volatilidade implı́cita para a qual a fórmula de
apreçamento de uma Call Option europeia dá um preço de 4, dado que o preço do activo subjacente
é 45, o preço de Execı́cio é 50, a taxa de juro sem risco mensal é 0.4% e que a maturidade é 3 meses.
Sugestão: Poderá usar uma interpolação linear.
Referências
[Bass 1995] Bass, R. F. (1995 )Probabilistic Techniques in Analysis. Springer Verlag.
[Bass 1998] Bass, R. F. (1998) Diffusions and Elliptic Operators. Springer Verlag.
[Bertoin] Bertoin, J. (1996) Lévy Processes. Cambridge University Press.
[Björk 98] Björk, T. (1998), Arbitrage Theory in Continuous Time, Oxford University
Press.
[Brzeźniak] Brzeźniak, Z.; Zastawniak, T. (1999) Basic Stochastic Processes. Springer
Verlag.
[Chung et al 90] Chung, K. L.; Williams R. J. (1990) Introduction to Stochastic Integration. Second Edition, Birkhäuser.
[Dacunha-Castelle (I)] Dacunha-Castelle, D.; Duflo, M. (1983) Probabilités et Statistiques. Volume I, Masson.
[Dacunha-Castelle (II)] Dacunha-Castelle, D.; Duflo, M. (1983) Probabilités et Statistiques. Volume II, Masson.
[Durrett 96] Durrett, R. (1996) Stochastic Calculus. CRC Press.
[Itô] Itô, K. (1961) Lectures on Stochastic Processes. Tata Institute of Fundamental
Research Bombay.
[Karatzas 91] Karatzas, I.; Shreve, S. E. (1991) Brownian Motion and Stochastic Calculus. Second Edition, Springer Verlag.
[Klebaner 98] Klebaner, F. C. (1998) Introduction to Stochastic Calculus with Applications. Imperial College Press.
[Lamberton 96] Lamberton, D.; Lapeyre, B. (1996) Introduction to Stochastic Calculus
Applied to Finance. Chapman & Hall.
[Øksendal 98] Øksendal, B. (1998) Stochastic Differential Equations. Fifth edition,
Springer.
[Protter 90] Protter, P. (1990) Stochastic Integration and Differential Equations. Springer Verlag.
[Shiryaev] Shiryaev, A. N. (1999) Essentials of Stochastic Finance, World Scientific.
MF0910
30
21 de Dezembro de 2009
Capı́tulo IV
Integral Estocástico
Secção: 7
[Williams] Williams, D. (1991) Probability with Martingales. Cambridge University
Press.
[Zettl 05] Zettl, A. (2005) Sturm-Liouville Theory, American Mathematical Society.
MF0910
31
21 de Dezembro de 2009
NOTAS DE LIÇÕES PARA TEORIA DO INVESTIMENTO
MODELO DE BLACK-SCHOLES E APREÇAMENTO
1. Notações
Seja (Ω, F, P) um espaço de probabilidade, G = (Gt )t∈R+ uma filtração sobre este espaço
de probabilidade.
Definição 1. O processo B = (Bt )t∈R+ é um G processo browniano se e só se:
(1) B é G adaptado, isto é:
∀t ∈ R+ Bt ∈ mGt ;
(2) Os incrementos de B são G independentes, isto é:
i
∀s, t ∈ R+ s ≤ t ⇐ (Bt − Bs ) ↔ Gs ;
(3) Os incrementos de B são estacionários (têm a mesma lei), isto é:
∀s, t ∈ R+ s ≤ t ⇐ L(Bt − Bs ) ≡ L(Bt+s − B0 ) .
Definição 2. F = (Ft )t∈R+ , a filtração natural associada ao processo browniano B
é, por definição:
∀t ∈ R+ Ft := σ({Bs : s ≤ t})∼ .
Exercı́cio 1. Mostre que se B é um G processo browniano então B é um F processo browniano, isto é, B é um processo browniano relativamente à sua filtração natural F.
Relembramos seguidamente as definições de dois espaços de processos relevantes para o
integral estocástico
Definição 3. Para T ∈ R+ e para H filtração, o espaço N([0, T ], H) é o espaço dos processos
estocásticos (φt )t∈R+ que são H adaptados tais que:
Z T
2
E
φt dt < +∞ .
0
Por definição temos ainda :
N(H) :=
\
N([0, T ], H) .
T ∈R∗+
Observação 1. É sabido que o integral estocástico relativamente ao processo B de um processo no espaço N(G) é uma martingala contı́nua1.
Se as hipóteses forem enfraquecidas temos um outro espaço útil.
1Veja-se, por exemplo [7][p. 33], [4][p. 38].
1
2
MODELO DE BLACK-SCHOLES E APREÇAMENTO
Definição 4. Para T ∈ R+ e para H filtração, o espaço M([0, T ], H) é o espaço dos processos
estocásticos (ψt )t∈R+ que são H adaptados tais que:
Z T
2
P
ψt dt < +∞ = 1 .
0
Por definição temos ainda :
\
M(H) :=
M([0, T ], H) .
T ∈R∗+
Observação 2. Em contraste com o que se afirmou na observação 1, o integral estocástico
relativamente ao processo B, considerado como G processo browniano, de um processo
no espaço M(G) não é, em geral, uma martingala, mas apenas uma martingala local
contı́nua2. Por razões que se prendem com o carácter técnico das definições não estudaremos
a noção de martingala local.
2. O modelo de mercado segundo Black-Scholes
Supomos dado um activo sem risco cujo preço se encontra especificado pela dinâmica
dβt = rβt dt , β0 = 1
e um activo com risco cujo preço é a solução da seguinte EDE:
dSt = µSt dt + σSt dBt , S0 ∈ R+ ,
em que r, µ e σ são parâmetros do modelo.
3. Carteiras
Definição 5. Uma carteira Φ = (φ1 , φ2 ) é um processo estocástico com valores em R2 tal
que φ1 = (φ1t )t∈R+ ∈ W(F) e tal que o processo φ2 = (φ2t )t∈R+ é F adaptado e verifica ainda:
Z T
∗
1 2
∀T ∈ R+ P
(φt ) dt < +∞ = 1 .
0
Definição 6. Sendo Φ uma carteira, V (Φ), o processo valor desta carteira é dado por:
∀t ∈ R+ Vt (Φ) = φ1 St + φ2 βt .
Definição 7. A carteira Φ é autofinanciada se e só se se verificar:
∀t ∈ R+ dVt (Φ) = φ1 dSt + φ2 dβt .
4. Medidas de Martingala
Definição 8. Uma medida de probabilidade Q sobre (Ω, F) diz-se equivalente à medida
de probabilidade P (o que se representa por P ∼ Q) se e só se:
∀F ∈ F P[F ] = 0 ⇔ Q[F ] = 0
Exercı́cio 2. Seja g ∈ mF tal que g > 0 e Qg definida por:
Z
∀F ∈ F Qg [F ] :=
g(ω)dP(ω) .
F
Mostre que P ∼ Qg .
2Veja-se, por exemplo [5][p. 116].
NOTAS DE LIÇÕES PARA TEORIA DO INVESTIMENTO
3
Exercı́cio 3. Mostre, utilizando o teorema de Radon-Nicodym que duas probabilidades P e
Q são equivalentes se e só se existe g ∈ mF tal que g > 0, verificando, por exemplo:
Z
g(ω)dP(ω) .
∀F ∈ F Q[F ] :=
F
O processo de preços descontados
S∗
= (St∗ )t∈R+ é definido por:
St
.
βt
O processo valor descontado, V ∗ (Φ) = (Vt∗ (Φ))t∈R+ , de uma dada carteira Φ, é
definido por:
Vt (Φ)
∀t ∈ R+ Vt∗ (Φ) :=
.
βt
∀t ∈ R+ St∗ :=
Definição 9. Uma medida de probabilidade Q, equivalente a P diz-se uma medida de
martingala para o processo de preços (MMP) se e só se o processo S ∗ é uma F
martingala para a probabilidade Q.
Exercı́cio 4. Mostre, utilizando o teorema de representação de martingalas3 que Q é MMP
se e só se existir B Q = (BtQ )t∈R+ um processo browniano relativamente à probabilidade Q e
um processo (ht )t∈R+ ∈ N(Ω, F, Q) tal que:
Z t
∗
∗
∀t ∈ R+ St = S0 +
hu dBuQ .
0
Definição 10. Uma medida de probabilidade Q, equivalente a P diz-se uma medida de
martingala generalizada para o processo de preços (MMgP)4 se e só se existir
B Q = (BtQ )t∈R+ um processo browniano relativamente à probabilidade Q e um processo
(ht )t∈R+ ∈ W(Ω, F, Q) tal que:
Z t
∗
∗
∀t ∈ R+ St = S0 +
hu dBuQ .
0
Definição 11. Uma medida de probabilidade Q, equivalente a P diz-se uma medida de
martingala para o mercado spot (MMM) se e só se, para qualquer carteira autofinanciada, o processo V ∗ (Φ) é uma F martingala para a probabilidade Q.
Exercı́cio 5. Mostre, utilizando o teorema de representação de martingalas 5 que Q é MMM
se e só se existir B Q = (BtQ )t∈R+ um processo browniano relativamente à probabilidade Q e
um processo (gt )t∈R+ ∈ N(Ω, F, Q) tal que:
Z t
∀t ∈ R+ Vt∗ (Φ) = V0∗ (Φ) +
gu dBuQ .
0
Definição 12. Uma medida de probabilidade Q, equivalente a P diz-se uma medida de
martingala generalizada para o mercado spot (MMgM) se e só se, para qualquer
carteira autofinanciada, existir B Q = (BtQ )t∈R+ um processo browniano relativamente à
probabilidade Q e um processo (gt )t∈R+ ∈ W(Ω, F, Q) tal que:
Z t
∗
∗
∀t ∈ R+ Vt (Φ) = V0 (Φ) +
gu dBuQ .
0
3Veja-se, por exemplo, [3][p. 187].
4Veja-se como justificação [2][p. 303], [3][p. 188] ou [8][p. 200].
5Veja-se para este teorema, por exemplo, [5][pgs. 171 e 177]
4
MODELO DE BLACK-SCHOLES E APREÇAMENTO
Teorema 1. Mostre que uma medida de probabilidade Q, equivalente a P é MMP (respectivamente MMgP) se e só se for MMM (respectivamente MMgM).
Demonstração. Mostre-se primeiramente, usando a fórmula de Ito, que:
dVt∗ (Φ) = φ1t dSt∗ .
(1)
A conclusão segue a partir das definições.
Com efeito, uma aplicação do exercı́cio 6 mostra-nos que:
1
1
1
1
∗
dVt (Φ) = d Vt (Φ) ×
=
× dVt (Φ) + Vt (Φ) × d( ) + d( ) × dVt (Φ) .
βt
βt
βt
βt
Pela fórmula de Ito, observamos que com g(t, x) = 1/x e Yt = g(t, βt ) se tem que:
dYt = d(
1
∂g
−1
−r
∂g
1 ∂2g
)=
(t, βt )(dβt )2 = 2 rβt dt =
dt ,
(t, βt )dt +
(t, βt )dβt +
2
βt
∂t
∂x
2 ∂x
βt
βt
uma vez que
∂g
(t, βt ) = 0 = (dβt )2 .
∂t
Por outro lado como a carteira é autofinanciada temos que:
1
1
1
−r
φ1t dSt + φ2t dβt e d( ) × dVt (Φ) = ( dt) × φ1t dSt + φ2t dβt = 0 .
× dVt (Φ) =
βt
βt
βt
βt
Em consequência temos que:
1
−r
dVt∗ (Φ) =
φ1t dSt + φ2t dβt + φ1t St + φ2t βt × ( dt) =
βt
βt
−rS
dS
t
t
+(
dt) = φ1t dSt∗ ,
= φ1t
βt
βt
observando que pelo exercı́cio já referido acima se tem que:
1
dSt
−rSt
∗
dSt = d St ×
=
+(
dt) .
βt
βt
βt
Exercı́cio 6 (Fórmula de integração por partes). Sejam Xt e Yt dois processos de Ito
admitindo as representações dXt = ut dt + vt dBt e dYt = rt dt + st dBt . Mostre, por aplicação
da fórmula de Ito a (Xt + Yt )2 Xt2 e a Yt2 , que:
d (Xt Yt ) = Xt dYt + Yt dXt + dhXY it ,
onde por convenção:
dhXY it = vt st dt .
Exercı́cio 7. Mostre que se for St∗ = St /βt e se dSt = µSt dt+σSt dBt , com µ ∈ R e σ ∈ R∗+
então:
∗
∗ µ−r
(2)
dSt = σSt
dt + dBt
σ
Teorema 2 (Girsanov). Seja (Ω, F, P) um espaço de probabilidade e (Bt )t∈R+ um processo
browniano neste espaço. Seja F = (Ft )t∈R+ a filtração naturalmente associada ao processo
browniano. Seja (γt )t∈[0,T ] um processo estocástico adaptado verificando:
Z
1 T 2
P exp(
γ dt) < +∞ = 1
2 0 t
NOTAS DE LIÇÕES PARA TEORIA DO INVESTIMENTO
e tal que o processo (Lt )t∈[0,T ] dado por:
Z
Lt = exp −
T
0
1
γt dBt −
2
Z
T
γt2
5
dt
0
seja uma martingala. Existe então uma medida de probabilidade única Q tal que:
(1) Q ∼ P
(2) A medida Q admite a seguinte representação:
Z T
Z
1 T 2
γ dt dP
dQ = Lt dP = exp −
γt dBt −
2 0 t
0
(3) O processo definido por dBtQ = γt dt + dBt é um processo browniano em relação ao
espaço (Ω, F, Q).
Observação 3. Uma condição suficiente para que o processo (Lt )t∈[0,T ] definido acima seja
uma martingala é a chamada condição de Novikov:
Z
1 T 2
EP exp(
γt dt) < +∞
2 0
Os exercı́cios seguintes retirados de [4][p. 76], têm por objectivo demonstrar o teorema
de Girsanov no caso de uma mudança para um drift (γt )t∈[0,T ] constante.
Exercı́cio 8 (Questão preliminar). Seja X uma variável aleatória real. Mostre que que X
é independente de uma dada σ álgebra B se e só se:
∀u ∈ R E eiuX | B = E eiuX q. c.
Exercı́cio 9 (Teorema de Girsanov: caso particular). Considere as notações do teorema 2.
Seja µ um número real e seja o processo (Lt )t∈[0,T ] definido por (Lt = exp −µBt − (µ2 /2)t .
(1) Mostre que (Lt )t∈[0,T ] é uma martingala relativamente à filtração F e que:
∀t ∈ [0, T ] EP [Lt ] = 1
(2) Seja, por definição e para t ∈ [0, T ], Pt := Lt P. Mostre que Pt e PT coincidem na σ
álgebra Ft .
(3) Seja Z uma variável aleatória limitada e mensurável relativamente à σ álgebra FT .
Mostre que:
EP [ZLT | Ft ]
t
EP [Z | Ft ] =
.
Lt
(4) Seja o Bµ = (Bµt )t∈R+ o processo estocástico construı́do a partir do processo browniano dado pela seguinte fórmula Btµ = µt + Bt . Mostre que:
t
∀u ∈ R ∀s, t ∈ [0, T ], s ≤ t EP [exp (iu(Btµ − Bsµ )) | Ft ] = e
−u2 (t−s)
2
.
Conclua usando o resultado obtido na questão preliminar anterior.
O teorema de Girsanov permite agora construir a medida de martingala única para os
preços descontados.
Proposição 1. A medida de martingala única para o processo dos preços descontados é
dada por:
r−µ
1 r−µ 2
(3)
dQ = exp
BT − (
) T dP .
σ
2 σ
6
MODELO DE BLACK-SCHOLES E APREÇAMENTO
Demonstração. Pondo, por definição,
µ−r
σ
e aplicando o teorema de Girsanov tem-se que a probabilidade Q definida na fórmula 3, que
é equivalente a P, torna o processo
µ−r
dt + dBt
dBtQ =
σ
um processo browniano relativamente a Q. Atendendo agora à fórmula 2, que se pode
escrever,
γt :=
dSt∗ = σSt∗ dBtQ
(4)
e, atendendo à regularidade St∗ temos que, pela definição, St∗ é uma martingala (local). Exercı́cio 10. Mostre que, no contexto da proposição anterior,
(1) o processo de preços admite a representação:
dSt = rSt dt + σSt dBtQ
e após comparar esta representação com a representação inicial comente as diferenças;
(2) as filtrações geradas pelos processos (Bt )t∈R , (St )t∈R , (St∗ )t∈R e (BtQ )t∈R coincidem.
Definição 13. Uma carteira Φ é admissı́vel se e só se:
(1) Φ é autofinanciada;
(2) (Vt∗ (Φ))t∈R é um processo estocástico de variáveis aleatórias não negativas e tal que:
sup Vt∗ (Φ) ∈ L2 (Q) .
(5)
t∈[0,T ]
O exercı́cio seguinte dá-nos uma forma de mostrar que uma dado integral estocástico define de facto uma martingala e fornecerá uma aplicação possı́vel para a condição 5, enunciada
na definição anterior.
Exercı́cio 11. Seja (ht )t∈[0,T ] um processo estocástico adaptado tal que:
Z T
2
P
ht dt < +∞ = 1 .
0
Seja por definição:
Z
∀t ∈ [0, T ] Mt :=
t
hs ds
0
e suponha que:
"
E
#
sup
Mt2
< +∞
t∈[0,T ]
Rt
(1) Considere a sucesssão τn := inf{t ≥ 0 : 0 h2s ds = n}. Mostre que τn é um tempo de
paragem e que
Z T ∧τn
2 2
E MT ∧τn = E
ht dt .
0
(2) Conclua que:
Z
E
0
T
h2t dt
< +∞ .
NOTAS DE LIÇÕES PARA TEORIA DO INVESTIMENTO
7
Definição 14. Um direito contingente com data de exercı́cio T é dado por h ∈ mFT que
representa o cashflow à data T .
Exemplo 1. Uma call option com strike price K é representada por h = f (ST ) em que
f (x) = (x − K)+ .
Definição 15. Um direito contingente h é replicável se e só se existir uma carteira admissı́vel tal que:
VT (Φ) = h .
Uma tal carteira é denominada carteira réplica do direito contingente h.
Exercı́cio 12. Mostre que se h é replicável então necessariamente h ∈ L2 (Q). Mostre que
esta última propriedade é verificada no caso de uma call option.
Teorema 3. Qualquer que seja o direito contingente h ≥ 0, h ∈ mFT , h ∈ L2 (P), h é
replicável e para qualquer carteira réplica Φ:
h
i
(6)
∀t ∈ [0, T ] Vt (Φ) = EQ e−r(T −t) h | Ft .
Demonstração. Pela fórmulas fundamentais 1 e 4 já demonstradas acima:
dVt∗ (Φ) = φ1t dSt∗ = σφ1t S ∗ dBtQ .
Temos pois, daod que a carteira é admissı́vel e em consequência do exercı́cio 11, que (Vt∗ )t∈R+
é uma martingala logo:
Vt∗ = EQ [VT∗ | Ft ]
isto é pelas definições,
h
i
Vt = EQ e−r(T −t) h | Ft .
Resta mostrar que h é replicável, isto é que que existe uma carteira Φ = (φ1 , φ2 ) tal que:
h
i
φ1t St + φ2t βt = EQ e−r(T −t) h | Ft .
Observando que o processo
Mt := EQ e−rT h | Ft ,
é uma martingala de quadrado integrável, que F = (Ft )t∈R+ é a filtração gerada pelo processos browniano (Bt )t∈R+ e também por (BtQ )t∈R+ , logo existe um processo adaptado (gt )t∈R+
tal que
Z 0
Q
2
E
(gt ) dt < +∞ e Mt = gt dBtQ .
T
Seja agora, por definição:
φ1t :=
gt
σSt∗
e φ2t := Mt − φ1 St∗ .
Então o processo Φ = (φ1 , φ2 ) é uma carteira autofinanciado e o processo valor desta carteira
é dado por:
h
i
Vt (Φ) = βt Mt = EQ e−r(T −t) h | Ft ,
logo (Vt (Φ))t∈R+ é um processo não negativo e VT (Φ) = h.
8
MODELO DE BLACK-SCHOLES E APREÇAMENTO
5. A fórmula de Black-Scholes
Um argumento semelhante ao que foi utilizado nos modelos a tempo discreto mostra que
num mercado livre de arbitragem o preço de um direito contingente replicável é determinado
pelo valor de uma carteira réplica qualquer. Com efeito assuma-se um mercado livre de
arbitragem e h um direito contingente replicável, denotando-se por Πt o preço de h à data
t. Seja Φ uma carteira réplica de h e seja (Vt (Φ))t∈R+ o processo valor de Φ.
O quadro seguinte demonstra que se o preço à data zero do direito contingente não for
exactamente V0 (Φ), então existe no mercado uma oportunidade de arbitragem. Suponha,
por exemplo, que se verifica Π(0, h) < V0 (Φ).
Data t = 0
Data t = T
Posição short na carteira
+V0 (Φ)
−VT (Φ)
Posição long no direito
−Π(0)
+Π(0, h)
Posição no activo sem risco
V0 (Φ) − Π(0) (V0 (Φ) − Π(0, h))erT
Cash flow total (soma nas colunas)
0
(V0 (Φ) − Π(0, h))erT
Observação 4. Este argumento para além de fazer uso da noção de oportunidade de arbitragem, noção que até agora ainda não foi definida, pressupõe que é possı́vel transaccionar
a carteira e o direito contingente.
Exercı́cio 13. O objectivo deste exercı́cio é demonstrar a fórmula de Black e Scholes para
o preço de uma opção de compra europeia.
(1) Mostre que Π0 , o preço à data zero de uma call option com data de exercı́cio T e
com preço de exercı́cio K é dado por:
Π0 = e−rT E (ST − K)+
√
(2) Mostre que se Z ∈ N(−1/2σ 2 T, σ 2 T ) então ST tem a lei da variável aleatória
S0 exp(Z + rT ) e que portanto, Π0 é dado por:
Π0 = e−rT E (S0 exp(Z + rT ))+
(3) Mostre que se for:
1
ϕ(x) := √
2π
(7)
Z
x
2
− v2
e
−∞
(ln( SK0 ) + (r − 12 σ 2 )T )
√
dv e vc :=
,
σ T
então temos para o preço da call option a fórmula denominada fórmula de BlackScholes:
√
Π0 = S0 ϕ(vc + σ T ) − Ke−rT ϕ(vc ) .
6. Estimação
Para aplicar o modelo de Black-Scholes torna-se necessário estimar os parâmetros do
modelo com especial relevo para a volatilidade σ. Um dos métodos utilizados consiste em
utilizar a informação contida no registo dos preços tal como mostra o exercı́cio seguinte.
Exercı́cio 14. Considere-se no modelo de Black-Scholes sendo a evolução dos preços dos
activos é dada pelas equações:
dSt = µSt dt + σSt dBt ,
onde (Bt )t∈R+ é um processo browniano usual.
dβt = rβt dt
NOTAS DE LIÇÕES PARA TEORIA DO INVESTIMENTO
9
(1) Mostre que:
1 2
(8)
St+∆t = St exp σ(Bt+∆t − Bt ) + (µ − σ )∆t ,
2
e conclua que os retornos logarı́tmicos do activo em questão são normais com média
e variância definidas.
(2) Usando a fórmula 8 mostre que:
1
E[ln(St+∆t /St )]
V[ln(St+∆t /St )]
µ − σ2 =
, σ2 =
2
∆t
∆t
onde E[X] e V[X] representam a média e a variância da variável aleatória X.
(3) Dê intervalos de confiança para os parâmetros que estimou.
7. A equação às derivadas parciais de Black-Scholes
Seja o modelo de Black-Scholes usual em que a dinâmica do activo com risco é regida
pela equação diferencial estocástica:
dSt = µSt dt + σSt dBt , S0 ∈ R+
e em que o activo sem risco (ou conta bancária) tem como dinâmica segue a equação diferencial ordinária:
dβt = rβt dt , β0 = 1 .
Seja uma carteira autofinanciada (at , bt )t≥0 cujo processo valor é dado por:
∀t ≥ 0 Vt = at St + bt βt .
Relembre que sendo a carteira autofinanciada se verifica: dVt = at dSt + bt dβt . Suponha que
a estratégia permite replicar o direito contingente C(St , t), isto é que:
∀t ≥ 0 Vt = C(St , t) .
Exercı́cio 15. O objectivo deste exercı́cio é obter a equação às derivadas parciais cuja
solução permite apreçar um direito contingente no modelo de Black-Scholes.
(1) Mostre, usando a fórmula de Ito que:
1 (2)
(1)
(1)
2 2
∀t ≥ 0 dC(St , t) = Ct (St , t) + Cx (St , t)St µ + Cxx (St , t)σ St dt
2
(9)
(1)
+ Cx (St , t)σSt dBt ,
onde se tem para a função de duas variáveis C(x, t):
∂C
∂C
∂2C
(2)
(x, t) , Cx(1) (x, t) =
(x, t) , Cxx
(x, t) =
(x, t) .
∂t
∂x
∂x2
(2) Mostre que sendo a estratégia auto-financiada e permitindo replicar C(St , t), se tem:
(1)
Ct (x, t) =
∀t ≥ 0 dC(St , t) = (bt rβt + at St µ) dt + at St σdBt .
(3) Mostre que se a decomposição de um processo estocástico de Ito na soma de um
integral em dt com um integral em dBt fôr única, virá então:
(1)
C(St , t) − St Cx (St , t)
β−t
e conclua que C(x, t) é solução da equação com derivadas parciais de Black-Scholes:
at = Cx(1) (St , t) , bt =
(10)
∂C
∂C
1 ∂2C
(x, t) − rC(x, t) +
(x, t)St r +
(x, t)σ 2 St2 = 0 .
∂t
∂x
2 ∂x2
10
MODELO DE BLACK-SCHOLES E APREÇAMENTO
Observação 5. No caso de uma opção de compra (call option) europeia com preço de exercı́cio
K tem-se que o valor do contrato é C(ST , T ) = (ST − K)+ onde C(x, t) é solução da
equação 10.
Resolução:[Exercı́cio 15]
(1) Pela fórmula de Ito vem que:
1 (2)
(1)
dC(St , t) = Ct (St , t) dt + Cx(1) (St , t) dSt + Cxx
(St , t)(dSt )2 .
2
Como dSt = (µdt + σdBt )St vem que (dSt )2 = σ 2 (St )2 dt e logo:
1 (2)
(1)
dC(St , t) = Ct (St , t) dt + Cx(1) (St , t)St µdt + Cx(1) (St , t)St σdBt + Cxx
(St , t)σ 2 St2 dt =
2
1 (2)
(1)
(St , t)σ 2 St2 dt + Cx(1) (St , t)St σdBt ,
= Ct (St , t) + Cx(1) (St , t)St µ + Cxx
2
tal como se pretendia.
(2) Seja agora Φ = (at , bt )t∈R+ uma carteira réplica do direito contingente C(St , t).
Tem-se então que:
dC(St , t) = dVt (Φ) = at dSt + bt dβt = (bt rβt + at St µ)dt + at St σdBt .
(3) Obserando que a representação de um processo de Ito como soma de um integral
usual e de um integral estocástico é única 6 tem-se que a carteira φ satisfaz necessa(1)
riamente a equação at St σ = Cx (St , t)St σ de onde se tira que:
at = Cx(1) (St , t) ,
uma vez que, por hipótese σ 6= 0 e que por construção St 6= 0. Dado que C(St , t) =
(1)
at St + bt βt = Cx (St , t)St + bt βt , vem que
(1)
C(St , t) − Cx (St , t)St
bt =
.
βt
Podemos usar mais uma vez o argumento da unicidade da decomposição de um
integral de Ito desta vez relativamente ao integral usual para concluir que:
1 (2)
(1)
bt rβt + at St µ = Ct (St , t) + Cx(1) (St , t)St µ + Cxx
(St , t)σ 2 St2 .
2
Se reportarmos nesta fórmula os valores encontrados para os processos da carteira
tem-se,
(1)
C(St , t) − Cx (St , t)St
βt + Cx(1) (St , t)St µ =
βt
1 (2)
(1)
Ct (St , t) + Cx(1) (St , t)St µ + Cxx
(St , t)σ 2 St2 ,
2
ou seja, tal como querı́amos:
1 (2)
(1)
Ct (St , t) − rC(St , t) + Cx(1) (St , t)St r + Cxx
(St , t)σ 2 St2 = 0 .
2
♦
6Veja-se [4][p. 43].
NOTAS DE LIÇÕES PARA TEORIA DO INVESTIMENTO
11
Referências
1. [Bjrk98] T. Björk, Arbitrage Theory in Continuous Time, Oxford University Press, 1998.
2. [Kllbr97] O. Kallenberg, Foundations of Modern Probability, Springer Verlag, 1997.
3. [Kleb98] F. C. Klebaner, Introduction to Stochastic Calculus with Applications, Imperial College Press,
1998.
4. [LmbLp96] D. Lamberton, B. Lapeyre, Introduction to Stochastic Calculus Applied to Finance, Chapman
& Hall, 1996.
5. [LptShr01] R. S. Lipster, A. N. Shiryaev Statistics of Random Processes, Vol. I, Second Edition, Springer
Verlag, 2001.
6. [MuRu97] M. Musiela, M. Rutkowski, Martingale Methods in Financial Modelling, Springer, 1997.
7. [Oksen98] B. Øksendal, Stochastic Differential Equations, fifth edition, Springer, 1998.
8. [RvYor99] D. Revuz , M. Yor, Continuous Martingales and Brownian Motion, Springer, 1999.
Estimação e Clibração de Modelos de Mercados Financeiros
FCT/UNL, Matemática Financeira 07-08
MLE
1 Introdução
Para aplicar um dado um modelo para os mercados financeiros há, pelo menos, duas
formas de proceder: a estimação e a calibração. Um modelo é caracterizado pelas leis
de evolução dos activos financeiros considerados como subjacentes ou primitivos. As leis
de evolução dependem de um vector de parâmetros Θ = (θ1 , . . . , θN ). Essas leis são,
geralmente, formuladas sob uma probabilidade natural que é a probabilidade observada.
Os resultados do modelo são, fundamentalmente, fórmulas para apreçamento livre de
arbitragem para activos financeiros secundários ou derivados e para as correspondentes
carteiras de cobertura. Estas fórmulas são, regra geral, calculadas por meio de uma
probabilidade de martingala, ou probabilidade neutra face ao risco, associada de forma
canónica ao modelo. O modelo formulado sob a probabilidade neutra face ao risco
0 ). De notar que, em geral,
depende de um outro vector de parâmetros Θ0 = (θ10 , . . . , θN
os preços calculados com a probabilidade natural não são preços livres de arbitragem.
Suponhamos conhecidos os dados relativos à evolução dos activos primários ou subjacentes, por exemplo, séries cronológicas de preços. Se aplicarmos os procedimentos
estatı́sticos usuais aos dados relativos à evolução dos activos para estimar Θ, sob a probabilidade natural ou observada, estamos a estimar o modelo. A estimação é, em regra,
um método de tipo histórico.
Suponhamos conhecidos os dados relativos a certos activos financeiros derivados, por
exemplo um conjunto de preços para um conjunto de activos. Se for possı́vel inverter,
(ainda que numericamente) as fórmulas dos preços desses activos derivados de modo a
obter Θ0 , o vector de parâmetros do modelo sob a probabilidade martingala ou neutra
face ao risco, estamos a calibrar o modelo. Com os resultados da calibração é possı́vel
apreçar, no quadro do modelo em estudo, outros activos financeiros derivados que não
os inicialmente considerados. A calibração é, em geral, um método de tipo implı́cito.
2 O modelo binomial
Nesta secção estudaremos o caso particular do modelo binomial. O leitor é fortemente
aconselhado a rever as suas notas de trabalho sobre este assunto.
1
MF0708
Estimação e Calibração
Subsecção: 2.1
No modelo binomial consideram-se dois activos primários. A obrigação (bond ), activo
sem risco cuja lei de evolução do respectivo preço é dada por:
(
B0 = 1
Bn+1 = (1 + R)Bn n ≥ 0 ,
em que R ≥ 0 é a taxa de juro sem risco, determinı́stica, associada a um dado perı́odo
de tempo ∆t que deveremos ter sempre o máximo cuidado em explicitar 1 . A acção
(stock ), activo com risco cuja lei de evolução do respectivo preço é dada por:
(
S0 > 0
Sn+1 = Zn+1 Sn n ≥ 0 ,
em que (Zn )n≥1 é uma amostra de uma variável aleatório de Bernoulli Z tal que:
(
u com probabilidade pu
Z=
d com probabilidade pd = 1 − pu
e que representa o retorno da acção no perı́odo ∆t 2 . Os parâmetros do modelo, sob a
probabilidade natural, são descritos, evidentemente, por Θ = (R, u, d, pu ).
2.1 Estimação
Seja P = (pu , pd ) a probabilidade natural que, relembramos, é a probabilidade observada
no modelo. Suponhamos conhecida (sn )n≥1 uma série de preços do activo primário
com risco num perı́odo fundamental τ determinado (suponhamos mensal para fixar as
ideias). Sabemos
grande
P pela lei forte dos grandes números que para N suficientemente
P [Z τ ] em
s
/s
pode
ser
tomado
como
boa
aproximação
para
E
mN = (1/N ) N
n=1 n+1 n
que Z τ é o retorno mensal. Podemos, pois, tomar EP [Z τ ] como a taxa de retorno
(média)
Da mesma forma poderemos considerar sN = (1/(N −
P mensal observada.
2 como boa aproximação para VP [Z τ ] a variância de Z τ . VP [Z τ ]
(s
/s
−m
1)) N
)
N
n=1 n+1 n
representará, pois, a volatilidade (média) mensal observada.
Tal como já referimos acima, supomos que se está a estudar o modelo binomial
tomando como perı́odo de referência uma fracção ∆t do perı́odo fundamental τ 3 Sabendo
que
(
uS0 com probabilidade pu
S1 =
dS0 com probabilidade pd = 1 − pu
tem-se, uma vez que o retorno médio no perı́odo ∆t deverá ser EP [Z] = EP [Z τ ]∆t que;
EP [S1 ] = EP [ZS0 ] = S0 EP [Z] = S0 (pu u + (1 − pu )d) = S0 EP [Z τ ]∆t
1
Por exemplo a taxa pode ser: diária, semanal, mensal, anual, etc.
De facto, por definição, o retorno aditivo é dado por (S1 − S0 )/S0 = Z − 1.
3
Se por exemplo estivermos interessados num perı́odo de referência diário teremos ∆t = τ /30 em que,
relembramos, τ é o perı́do fundamental que acima escolhemos, por exemplo, ser mensal.
2
Primeira versão
2
6 de Novembro de 2007
MF0708
Estimação e Calibração
Subsecção: 2.2
ou seja EP [Z τ ]∆t = pu u + (1 − pu )d o que implica que, necessariamente,
pu =
(1 + EP [Z τ ]∆t) − d
.
u−d
(1)
Da mesma forma virá relativamente à volatilidade no perı́odo ∆t, uma vez que se tem
pelas regras habituais VP [Z] = VP [Z τ ]∆t, que:
VP [S1 ] = VP [ZS0 ] = S02 VP [Z] = S02 ((pu u2 +(1−pu )d2 −(pu u+(1−pu )d)2 ) = S02 VP [Z τ ]∆t
ou seja:
VP [Z τ ]∆t = pu u2 + (1 − pu )d2 − (pu u + (1 − pu )d)2 .
(2)
Seja agora para maior comodidade no que vai seguir-se, µ = EP [Z τ ]∆t e σ 2 = VP [Z τ ]∆t.
Observe-se primeiramente que por substituição da fórmula 1:
pu u2 +(1−pu )d2 = d2 +(u2 −d2 )pu = d2 +(u2 −d2 )
(1 + µ) − d
= d2 = (u+d)(1+µ)−ud .
u−d
De novo, substituindo a fórmula 1 na fórmula 2 vem, desenvolvendo o quadrado e efectuando as contas, que:
(1 + µ) − d
u − (1 + µ) 2
2
(pu u + (1 − pu )d) =
u+
d = (1 + µ)2
u−d
u−d
Em consequência tem-se que
(u + d)(1 + µ) − ud − (1 + µ)2 = σ 2
ou seja, revertendo para as notações iniciais que:
(u + d)(1 + EP [Z τ ]∆t) − ud − (1 + EP [Z τ ]∆t)2 = VP [Z τ ]∆t
(3)
O problema da estimação ficará resolvido se encontrarmos uma solução para a equação 3
nas duas incógnitas u e d. Uma forma usual de proceder (Hull 00)[p. 214] consiste em
desenvolver o quadrado e desprezar as potências de ∆t de ordem superior a um, obtendose uma equação aproximada ou seja:
(u + d)(1 + EP [Z τ ]∆t) − ud − (1 + 2EP [Z τ ]∆t) ≈ VP [Z τ ]∆t
observando-se imediatamente que:
(
p
u = 1 + VP [Z τ ]∆t
p
d = 1 − VP [Z τ ]∆t
(4)
(5)
é uma solução possı́vel para a equação aproximada 4. Deste modo é possı́vel estimar os
valores de u e d que são compatı́veis com os dados observados.
Observe-se que no modelo binomial esta estimação não nos permite, em princı́pio,
determinar o preço livre de arbitragem de um derivado. Para esclarecermos este assunto
necessitamos estudar a calibração.
Primeira versão
3
6 de Novembro de 2007
MF0708
Estimação e Calibração
Subsecção: 2.2
2.2 Calibração
Seja Q = (qu0 , qd0 ) a probabilidade martingala ou neutra face ao risco associada ao
modelo binomial. Note-se que o modelo de evolução da acção sob esta probabilidade
neutra face ao risco é dado por:
(
u0 S0 com probabilidade qu0
S1 =
d0 S0 com probabilidade qd0 = 1 − qu0
em que u0 e v 0 representam as taxas de apreciação e depreciação da acção sob a probabilidade neutra face ao risco. Os parâmetros do modelo, sob a probabilidade neutra face
ao risco, são descritospor Θ0 = (R, u0 , d0 , qu0 ). Tal como na secção sobre a estimação,
supomos que Rτ é a taxa de juro sem risco num perı́odo de referência τ . No perı́odo de
tempo em que estudamos o modelo binomial denotado por ∆t, sabemos que Q é tal que:
S0 =
1
1
1
EQ [S1 ] =
EQ [S0 Z] =
S0 (qu0 u0 + (1 − qu0 )d0 )
τ
τ
1 + R ∆t
1 + R ∆t
1 + Rτ ∆t
o que implica necessariamente que:
q u0 =
(1 + Rτ ∆t) − d0
.
u0 − d0
(6)
Tal como anteriormente, substituindo 6 na fórmula da variância do retorno sob a probabilidade martingala, correspondente à fórmula 2, tem-se uma fórmula semelhante a 3,
ou seja:
qu0 (u0 )2 +(1−qu0 )(d0 )2 −(qu0 u0 +(1−qu0 )d0 )2 = (u0 +d0 )(1+Rτ ∆t)−u0 d0 −(1+Rτ ∆t)2 (7)
Observa-se agora imediatamente que os valores obtidos na fórmula 5 para solução da
equação aproximada 4 são tais que se for
(
p
u0 = 1 + VP [Z τ ]∆t
p
d0 = 1 − VP [Z τ ]∆t
então desprezando os termos em ∆t de ordem superior a um no lado esquerdo da
fórmula 7 virá que
qu0 (u0 )2 + (1 − qu0 )(d0 )2 − (qu0 u0 + (1 − qu0 )d0 )2 ≈ VP [Z τ ]∆t
Podemos pois concluir que no modelo binomial debaixo da probabilidade neutra face ao
risco:
1. u0 e v 0 , as taxas de apreciação e depreciação da acção sob a probabilidade neutra
face ao risco, podem ser consideradas idênticas a u e v, as taxas de apreciação e
depreciação da acção sob a probabilidade natural;
2. a variância do retorno da acção sob a probabilidade martingala coincide com a
variância do retorno da acção sob a probabilidade natural.
Primeira versão
4
6 de Novembro de 2007
MF0708
Estimação e Calibração
Subsecção: 4.0
Em consequência, ficou demonstrado que é possı́vel resolver o problema da calibração do
modelo binomial a partir dos dados históricos sendo, em seguida, possı́vel a determinação
do preço de qualquer activo financeiro derivado no modelo binomial desde que seja
possı́vel estimar a variância dos retornos do activo subjacente.
2.3 Aplicação prática
No ficheiro Mathematica em anexo aplicam-se os resultados estudados ao apreçamento
de uma call option sobre o ı́ndice Psi-20.
3 O modelo de Black-Scholes
(A completar)
4 Modelos de produtos de rendimento fixo
(A completar)
Referências
[Hull 00] J. C Hull, Options Futures and other derivatives, fourth edition, Prentice-Hall
International Inc., 2000.
Primeira versão
5
6 de Novembro de 2007
Métodos das Probabilidades e da Estatı́stica para a
avaliação e cobertura do risco operacional
Manuel L. Esquı́vel
2 de Dezembro de 2009
Resumo
No que vai seguir-se propõe-se uma primeira aproximação sobre as técnicas de
probabilidades e estatı́stica relevantes para o risco operacional. Procurou-se aflorar
sucinta mas rigorosamente alguns dos aspectos fundamentais destas técnicas: as
noções básicas subjacentes, o ajustamento dos modelos à severidade e à frequência,
a teoria dos valores extremos no ajustamento de caudas pesadas e na determinação
do Value at Risk. A tı́tulo de ilustração tratou-se um exemplo com auxı́lio do
software R e do software Mathematica que será apresentado na aula.
1 Introdução
De acordo com o documento [Basel 01][p. 2] o risco operacional é definido como o
risco de perdas directas ou indirectas resultando de falhas ou desadequações nos processos
internos e nas pessoas ou resultando de acontecimentos externos.
Uma equipa técnica que seja incumbida, por uma administração, de quantificar o
risco operacional deverá adoptar uma metodologia que produza resultados fiáveis e que
seja aceite pelos organismos de regulação externos à companhia. Actualmente, as metodologia mais praticadas admitem uma esquematização nos seguintes passos.
• Ajustar, testar e validar um modelo para a severidade dos eventos de risco operacional. Para a severidade dos eventos importa realçar que o ajustamento de uma
distribuição Gaussiana aos dados não faz sentido, na maior parte dos casos, devido
à existência de caudas pesadas na amostra. Tal pode, em geral, ser inferido pelo
cálculo da kurtosis da amostra. Embora muitas vezes se procure um ajustamento
com outras distribuições com caudas pesadas (Weibull ou Pareto, por exemplo)
nem sempre este tipo de ajustamentos tem em conta os dados extremais que de
facto são os mais relevantes para uma correcta previsão das medidas de risco. Nesse
contexto, pode ser muito importante a aplicação das técnicas da teoria dos valores
extremos.
• Ajustar, testar e, finalmente, validar um modelo para a frequência dos eventos.
• Determinar a distribuição das perdas agregadas usando os modelos da severidade
e da frequência de forma a poder projectar a curto e médio prazo as medidas de
1
Capı́tulo VI
Risco Operacional
Secção: 2
risco requeridas pela administração como, por exemplo, o VaR. Se se dispuser de
distribuições manejáveis para a severidade e para a frequência pode ser possı́vel a
determinação explı́cita da distribuição das perdas agregadas. Regra geral tal não
irá acontecer pelo que se terá de recorrer a métodos aproximados de entre os quais
se destaca a simulação.
Pressupõe-se que a base de dados sobre a qual se vai praticar a análise tem as
caracterı́sticas mais adequadas às técnicas a aplicar. Após a realização da análise, é indispensável uma apreciação muito crı́tica dos resultados obtidos com estes modelos para
garantir resultados sensatos e, sobretudo, explicáveis a não especialistas. As análises ganharão em ser feitas com o auxı́lio de software adequado por exemplo o R 1 . Se possı́vel, a
análise deveria ser efectuada independentemente em, pelo menos, dois softwares distintos
e os resultados obtidos comparados.
2 Probabilidades e Estatı́stica
Começamos por evocar algumas noções que são imprescindı́veis para o estudo das técnicas
quantitativas de análise e cobertura do risco operacional. Muitas destas noções são estudadas em disciplinas apropriadas nos cursos universitários de Matemática, Ciências
Actuariais, Economia, Finanças e Engenharias, entre outros.
2.1 Variáveis aleatórias
De forma intuitiva uma variável aleatória é apenas o resultado quantitativo da observação, numa dada população, de um fenómeno regido pelo acaso. Exemplos de
variáveis aleatórias são a idade ou o peso da população de uma cidade. Convencionamos representar uma variável aleatória pelas letras maiúsculas X, Y, Z, . . . . Habitualmente distinguem-se duas classes de variáveis aleatórias consoante o tipo de valores
que tomam. Assim, uma variável aleatória que tome como valores os números (reais)
a1 , a2 , . . . , an , . . . diz-se discreta enquanto que uma variável aleatória que possa tomar
todos os valores entre dois números a e b se diz contı́nua. O comportamento de uma
variável discreta X tomando como valores os números a1 , a2 , . . . , an , . . . é descrito pela
sucessão
P[X = ak ] ∈ [0, 1], k = 1, 2, . . . , n . . .
isto é a sucessão das probabilidades dos acontecimentos definidos por: X toma exactamente o valor ak . Por outro lado, o comportamento, a lei, ou a distribuição, de uma
variável contı́nua Y , é descrito pela função de distribuição de X definida por:
FY (y) := P[Y ≤ y] ∈ [0, 1], y ∈ R ,
isto é, tal que para cada número real y, FY (y) é dado pela probabilidade da variável Y
tomar valores inferiores ou iguais a y. En certos casos, muito importantes na prática, a
1
Veja-se a página http://cran.r-project.org/ .
MF0910
2
2 de Dezembro de 2009
Capı́tulo VI
Risco Operacional
Secção: 2
função distribuição pode escrever-se como integral de uma função regular fY , a que se
dá o nome de densidade de probabilidade de Y , sob a forma:
Z y
FY (y) =
fY (u) du .
−∞
Neste caso, define-se para cada inteiro positivo r = 1, 2, . . . o momento de ordem r
da variável Y , quando existe, por:
E[Y r ] :=
Z
+∞
ur fY (u) du .
−∞
O valor esperado (ou valor médio) da variável Y , representado por E[Y ] é, quando
existe, o momento de ordem 1 e a variância de Y é dada, quando existe, por
p V[Y ] =
E[Y 2 ] − E[Y ]2 ; tanto a variância como o desvio padrão, definido por σ(Y ) = V[Y ] são
medidas clássicas de dispersão de uma variável aleatória em torno do correspondente
valor esperado.
2.2 Amostras, a kurtosis e caudas pesadas
Para uma amostra de dimensão n inteiro positivo X1 , X2 , . . . , Xn , composta de observações independentes e identicamente distribuı́das usamos a notação
Xn = (X1 , X2 , . . . , Xn ) ,
ou X = (X1 , X2 , . . . , Xn ), sem o ı́ndice n que identifica a dimensão da amostra, sempre
que não haja risco de confusão. Para o valor médio da amostra X usamos a notação:
n
1X
X=
Xi .
n
i=1
A partir do valor esperado amostral e da variância amostral pode definir-se um
indicador importante para o diagnóstico de dados no risco amostral.
Definição 1. A kurtosis da amostra X1 , X2 , . . . , Xn é definida por:
N
1
1 X
κ :=
(Xi − X)4
σ(X)4 N
i=1
em que σ(X) é o desvio padrão amostral.
A kurtosis pode ser encarada como uma medida do peso das caudas numa distribuição
de probabilidade. É frequente que uma amostra com um valor alto de kurtosis apresente
uma densidade com um pico pronunciado perto da média, decrescendo rapidamente e
apresentando caudas pesadas. Um valor de referência para a kurtosis é κ = 3 que
corresponde ao valor teórico para a distribuição normal.
MF0910
3
2 de Dezembro de 2009
Capı́tulo VI
Risco Operacional
Secção: 2
O comportamento da cauda de uma definição de uma variável aleatória X é dado
pelo comportamento assimptótico de P[X ≥ x], isto é, pelo comportamento desta probabilidade quando x toma valores arbitrariamente grandes. No caso em que a distribuição
admite uma densidade tem-se que
Z +∞
P[X ≥ x] =
f (u) du
x
pelo que se procura caracterizar o comportamento da área delimitada por f e pelo
eixo das abcissas. Quando se compara o comportamento das caudas a referência é a
2
distribuição normal cuja cauda se comporta para x grande como e−γx (veja-se adiante
na secção 3 a observação 10).
2.3 As leis dos grandes números
Uma lei dos grandes números diz, grosso modo, que a média aritmética dos valores
de um dado número de observações independentes de uma variável aleatória é tão mais
próximo do valor esperado da variável aleatória quanto maior for o número de observações
considerado. O significado que se atribui à locução mais próximo determina se se trata
de uma lei dos grandes números forte ou fraca.
As leis dos grandes números são de uso constante em Probabilidades e Estatı́stica.
Exemplos desses usos serão apresentados seguidamente.
O enunciado seguinte da lei forte dos grandes números é de formulação simples mas
necessita a noção de acontecimento quase certo ou acontecimento com probabilidade um
que por ser intuitivamente acessı́vel não detalharemos mais.
Teorema 1 (Lei forte de Kolmogorov). Seja X1 , X2 , . . . Xn , . . . uma sucessão de variáveis aleatórias integráveis, independentes e com a mesma distribuição comum. Então,
com probabilidade um:
N
1X
lim
Xn = E[X1 ] .
N →+∞ n
n=1
Podem enfraquecer-se as hipóteses formuladas para a lei forte dos grandes números
no sentido de não exigir a mesma distribuição mas tão somente um valor esperado
comum e que as variâncias sejam uniformemente limitadas. Com essas hipóteses mais
fracas obtem-se um resultado semelhante ao da lei forte mas com uma outra noção de
convergência. Com efeito, a formulação rigorosa da lei fraca dos grandes números requer
a noção de convergência em probabilidade que é uma noção mais fraca que a noção de
convergência quase certa ou com probabilidade um. Esta noção de convergência consiste
em considerar que a probabilidade dos acontecimentos
{| Xn − X |> } = {ω ∈ Ω :| Xn (ω) − X(ω) |> } ,
em que > 0 é uma quantidade arbitrariamente pequena, tende para zero quando
a ordem n cresce indefinidamente. Note-se que os acontecimentos acima são também
dados por:
{| Xn − X |> } = {ω ∈ Ω : Xn (ω) < X(ω) − ou X(ω) + < Xn (ω)} ,
MF0910
4
2 de Dezembro de 2009
Capı́tulo VI
Risco Operacional
Secção: 2
o que mostra que quando há convergência em probabilidade, a probabilidade de uma
dada observação Xn (ω) se encontrar fora do intervalo ]X(ω) − , X(ω) + [ é tão mais
pequena quanto n for grande e isto para qualquer > 0, arbitrariamente pequeno.
Definição 2. Uma sucessão X1 , X2 , . . . Xn , . . . de variáveis aleatórias converge em
probabilidade para uma variável aleatória X se e só se se verifica a seguinte condição:
∀ > 0
lim P [| Xn − X |> ] = 0
n→+∞
(1)
O enunciado seguinte tem um conjunto de hipóteses de fácil verificação mas suficientemente geral para poder ser aplicado a uma classe alargada de situações
Teorema 2 (Lei fraca). Seja X1 , X2 , . . . Xn , . . . uma sucessão de variáveis aleatórias
independentes e com o mesmo valor médio e tais que exista uma constante M > 0 tal
que as variâncias das variáveis da sucessão são majoradas por essa constante, isto é,
∀n ∈ N V[Xn ] ≤ M .
Então, entendendo-se o limite como limite em probabilidade:
N
1 X
lim
Xn = E[X1 ] .
N →+∞ N
n=1
Demonstração. A demonstração é uma consequência da desigualdade de Chebychev
dado que, por esta desigualdade,
"
#
"N
#
N
1 X
X
1
M
P (Xn − E[X1 ]) ≤
Xn − E[X1 ] > ≤ 2 V
−−−−−→ 0 ,
N
N N N →+∞
n=1
n=1
em consequência da hipótese feita sobre o comportamento assimptótico da sucessão de
variáveis aleatórias.
2.4 O teorema do limite central
Em traços largos, o teorema do limite central diz-nos que uma soma, convenientemente
normalizada, de variáveis aleatórias tem uma lei ou distribuição que é tão mais próxima
da lei normal quanto mais termos forem tomados na soma. É imediatamente perceptı́vel
o interesse de um tal resultado. Com efeito, a distribuição de uma soma de variáveis
aleatórias quaisquer, por exemplo um valor médio amostral, não é, em geral, conhecida;
se a distribuição limite ou assimptótica for reconhecidamente a distribuição normal,
por aplicação do teorema do limite central, muitos cálculos antes impossı́veis passam a
fazer-se com simplicidade. O conceito de mais próximo exigido neste contexto é o da
convergência em lei ou em distribuição.
Teorema 3 (Lévy-Lindbergh). Seja X1 , X2 , . . . Xn , . . . uma sucessão de variáveis aleatórias
independentes e com a mesma distribuição comum. Então, considerando a soma normalizada definida para cada N ≥ 1 por:
N
1 X Xn − E[X1 ]
p
SN := √
N n=1
V[X1 ]
MF0910
5
2 de Dezembro de 2009
Capı́tulo VI
Risco Operacional
Secção: 2
com função de repartição FSN tem-se que
Z x
2
1
− u2
=0.
√
e
lim
sup
F
(x)
−
du
S
N
N →+∞ −∞<x<+∞ 2π −∞
Observação 1. Outras formulações do teorema limite central são possı́veis relaxando as
hipóteses feitas sobre a sucessão (veja-se, por exemplo, [Pestana 02][p. 987]).
2.5 Estimação de parâmetros pelo método dos momentos
Em linhas gerais, a estimação dos parâmetros de uma distribuição pelo método dos
momentos faz-se resolvendo, em ordem aos parâmetros, o sistema de equações que se
obtem igualando a a expressão teórica dos momentos, que deve envolver os parâmetros,
aos correspondentes momentos empı́ricos calculados a partir da amostra. Em princı́pio
haverá tantas equações como parâmetros. Um exemplo simples, o da distribuição exponencial (veja-se a subsecção 3.3 abaixo)é dado pela estimação do parâmetro δ da distribuição pelo método dos momentos. Se X tiver distribuição exponencial com parâmetro
δ então o primeiro momento é E[X] = δ e o primeiro momento amostral, dada a amostra
X = (X1 , X2 , . . . , Xn ), é a média X, pelo que δ̂, o estimador pelo método dos momentos
do parâmetro δ, é δ̂ = X.
No caso geral, consideremos que pretendemos estimar o parâmetro θ = (θ1 , θ2 , . . . , θk ) ∈
Θ de X _ G(θ), uma variável aleatória com distribuição G(θ) a partir de uma amostra
Xn = (X1 , X2 , . . . , Xn ). Observe-se que para r = 1, 2, . . . k se fθ representar a densidade
da distribuição G(θ) que o momento teórico de ordem r
r
Z
+∞
xr fθ (x)dx
Eθ [X ] =
−∞
é uma função de θ (e também de r). O algoritmo para obter o estimador de θ pelo
método dos momentos consiste em obter a solução θ̂ = (θ̂1 , θ̂2 , . . . , θ̂k ) ∈ Θ do sistema
de k equações:
n
1X r
(2)
Eθ [X r ] =
Xi r = 1, 2, . . . , k .
n
i=1
A justificação deste método resulta, por exemplo, da lei forte dos grandes números de
Kolmogorov. Com efeito, considerando X1 , X2 , . . . , Xm , . . . uma sucessão de variáveis
aleatórias independentes e identicamente distribuı́das com X, tem-se que:
m
1 X r com probabilidade 1
Xi −−−−−−−−−−−−−−−−−→ Eθ [X r ]
m→+∞
m
i=1
P
pelo que para uma dada amostra Xn = (X1 , X2 , . . . , Xn ) faz sentido identificar n1 ni=1 Xir
com Eθ [X r ] desde que n, a dimensão da amostra, seja significativamente grande. Pode
mostrar-se numa classe numerosa de modelos que o estimadores assim obtidos são (fortemente) consistentes (veja-se, por exemplo, [Ivchenko 90][p. 97]). Tal resulta da aplicação
do teorema das funções implı́citas, sob reserva de regularidade.
MF0910
6
2 de Dezembro de 2009
Capı́tulo VI
Risco Operacional
Secção: 2
Observação 2. Naturalmente que este método só pode ser aplicado quando a distribuição
da variável do modelo admite os momentos necessários para o algoritmo descrito acima.
As estimativas dos parâmetros obtidas por este meio são pouco eficientes e são geralmente
utilizadas como valores iniciais para outros métodos mais eficientes.
2.6 Estimação de parâmetros pelo método da verosimilhança máxima
Em traços largos, este método para estimação de um parâmetro de uma lei admitindo
densidade baseia-se na ideia de que a densidade toma, num dado ponto, valores tanto
maiores quanto maior for a probabilidade de se observar esse ponto. Com efeito, para
X _ G(θ), uma variável aleatória com distribuição G(θ) admitindo fθ como densidade
tem-se que para qualquer > 0:
Z
x+
P[x − ≤ X ≤ x + ] =
fθ (u) du
x−
pelo que é natural admitir que para θ fixo, quanto maior for a probabilidade de X tomar
valores na vizinhança do ponto x maior serão os valores que fθ tomará nessa vizinhança.
Suponhamos que pretendemos estimar o parâmetro θ = (θ1 , θ2 , . . . , θk ) ∈ Θ a partir
de uma amostra Xn = (X1 , X2 , . . . , Xn ). Consideramos a verosimilhança Lθ definida
para uma qualquer realização da amostra (x1 , x2 , . . . , xn ) por:
Lθ (x1 , x2 , . . . , xn ) := fθ (x1 ) · fθ (x2 ) · · · · · fθ (xn ) =
n
Y
fθ (xi ) .
i=1
A verosimilhança Lθ não é mais que a densidade da lei da amostra Xn , isto é, a lei conjunta do vector aleatório (X1 , X2 , . . . , Xn ). Aplicando a ideia descrita acima, é razoável
supor que para uma dada realização da amostra (x1 , x2 , . . . , xn ), Lθ (x1 , x2 , . . . , xn ) será
tanto maior quanto mais perto estiver θ do verdadeiro valor do parâmetro da lei que regeu a obtenção daquela realização da amostra. O algoritmo para o método de estimação
dos parâmetros pelo método da verosimilhança máxima consiste assim em determinar θ̂
tal que quando (x1 , x2 , . . . , xn ) estão fixos, Lθ̂ (x1 , x2 , . . . , xn ) tome o valor máximo, isto
é:
θ̂ := Argmáxθ∈Θ Lθ (x1 , x2 , . . . , xn ) .
Para aplicar este algoritmo temos então de maximizar uma função de várias variáveis
reais (θ1 , θ2 , . . . , θk ) usando para o efeito os princı́pios do cálculo diferencial. Sob reserva
da regularidade, um ponto de verosimilhança máxima é um ponto estacionário, isto é,
verifica o sistema de equações:
∂
Lθ (x1 , x2 , . . . , xn ) = 0, r = 1, 2, . . . , k .
∂θr
sendo necessário verificar em seguida se o ponto estacionário assim obtido maximiza de
facto a função. Para um estudo das propriedades assimptóticas dos estimadores obtidos
com este método recomendamos [Ivchenko 90][p. 82–97] ou [Pestana 02][p. 510–520].
MF0910
7
2 de Dezembro de 2009
Capı́tulo VI
Risco Operacional
Secção: 2
2.7 Testes de hipóteses
A metodologia estabelecida em Estatı́stica para testar uma hipótese a partir da observação de uma amostra de um fenómeno aleatório pode ser reduzida, nas suas linhas
gerais, aos seguintes passos (veja-se, por exemplo, [Pestana 02][p. 489] ou [Lewis 04][pp.
61–63]).
• A fixação da hipótese nula, geralmente representada por H0 . Esta hipótese é
o postulado que efectuamos sobre a distribuição da nossa amostra. O objectivo
do teste é rejeitar esta hipótese (note-se que quando não conseguimos rejeitar a
hipótese nula não a estamos a aceitar; a metodologia dos testes de hipótese em
Estatı́stica é assim baseada numa atitude de grande prudência).
• A escolha da estatı́stica do teste que é dada por nova variável aleatória T :=
g(X1 , . . . , XN ) construı́da a partir da amostra por imagem por uma função g, que
pode depender da dimensão N da amostra. Para poder efectuar o teste é imperativo ter informações sobre a distribuição da estatı́stica do teste: ou se conhece
a distribuição exacta ou se conhece uma distribuição limite da estatı́stica do teste
quando a dimensão da amostra N cresce indefinidamente.
• Convencionar um nı́vel de significância aceitável para o teste, geralmente representado por α e tomando na prática um dos dois valores α = 0.05 ou α = 0.01. O
nı́vel de significância corresponde à probabilidade de cometer um erro de primeira
espécie, isto é corresponde à probabilidade de rejeitar a hipótese nula no caso em
que esta é verdadeira. Naturalmente pretendemos esta probabilidade tão pequena
quanto possı́vel.
• A determinação da região crı́tica do teste usando para o efeito as informações
de que dispomos sobre a distribuição da estatı́stica do teste e o valor do nı́vel de
significância. Esta região crı́tica é tal que, quando se observa uma dada concretização da amostra x = (x1 , . . . , xn ) e o correspondente valor da estatı́stica do
teste T (x) = g(x1 , . . . , xn ) se T (x) pertencer à região crı́tica rejeita-se a hipótese
nula. No caso de uma hipótese nula simples e em que T toma valores reais, a cada
nı́vel de significância α corresponde uma região crı́tica definida por um valor crı́tico
Tα = FT← (1 − α); neste caso, a região crı́tica pode corresponder, por exemplo a
T (x) > Tα .
• O valor-p, que representa a probabilidade, condicional à hipótese nula considerada de observar na estatı́stica do teste um valor maior ou igual àquele que foi
efectivamente observado. Na maioria dos softwares para a estatı́stica este valor-p
é um dos resultados dos programas. Regra geral a tomada de decisão quanto à
eventual rejeição da hipótese nula efectua-se quando se observa um valor-p inferior
ao nı́vel de significância.
Exemplo 1 (Teste de Ajustamento de Kolmogorov-Smirnov). Trata-se de um teste que
se pode usar para testar a qualidade de um ajustamento permitindo decidir se uma dada
amostra provêm ou não de uma população com uma distribuição especı́fica. A ideia subjacente é a de comparar a distribuição empı́rica com a distribuição teórica. A justificação
MF0910
8
2 de Dezembro de 2009
Capı́tulo VI
Risco Operacional
Secção: 3
teórica repousa sobre o facto da função de distribuição empı́rica ser assimptóticamente
gaussiana. Em consequência pode verificar-se que os valores crı́ticos não dependem da
distribuição que está a ser tomada em consideração na hipótese nula. Neste teste, a
hipótese nula é de que a amostra provêm de uma dada distribuição (Kolmogorov) ou
que duas amostras provêm da mesma distribuição (Smirnov). Representando por F a
distribuição teórica tomada na hipótese nula e tendo-se que a função de distribuição
empı́rica é dada, a partir da amostra X1 , . . . , XN , por:
F̂ (X1 , . . . , XN )(x) =
Número de elementos{i : Xi ≤ x}
.
N
A estatı́stica do teste é dada por:
DN (X1 , . . . , XN ) = sup | F̂ (X1 , . . . , XN )(x) − F (x) |
x∈R
Como DN converge para zero quando N cresce indefinidamente o princı́pio do teste é
o de decidir pela rejeição da hipótese nula se para uma dada concretização da amostra
(x1 , . . . xN ), a estatı́stica do teste DN (x1 , . . . xN ) é suficientemente pequena. Na tabela
seguinte figuram os valores crı́ticos correspondentes a três valores correntes do nı́vel de
significância, para o teste de Kolmogorov-Smirnov.
α
Valor crı́tico
10%
√
1.224/ N
5%
√
1.358/ N
1%
√
1.628/ N
Observação 3. Um teste relevante para o ajustamento de distribuições discretas (ou para
distribuições contı́nuas após transformação adequada) é o conhecido teste do χ2 . Outros
testes usados para aferir a qualidade de um ajustamento de distribuições contı́nuas são os
testes de Anderson-Darling e o de Cramer-Von Mises (veja-se, por exemplo, [Lewis 04][p.
86] ou [Ricci 05][p. 22]).
3 Severidade
A análise estatı́stica da severidade tira proveito das técnicas que foram abordadas acima.
Assim, muito sucintamente, referimos as etapas principais de uma modelização inicial
da severidade.
• Efectuar uma análise preliminar dos dados para determinar as principais caracterı́sticas destes incluindo a kurtosis.
• Após escolha reflectida de uma dada distribuição, efectuar a estimação dos parâmetros e procurar validar essa escolha por meio de testes adequados. Uma primeira
verificação de adequação passa pelos testes gráficos a que se poderão seguir os
testes de ajustamento referidos na subsecção 2.7.
• Na eventualidade dos resultados dos testes não serem favoráveis poder-se-á efectuar um ajustamento de uma distribuição de Pareto generalizada à cauda da distribuição observada utilizando as técnicas da teoria dos extremos. Poder-se-á ajustar
MF0910
9
2 de Dezembro de 2009
Capı́tulo VI
Risco Operacional
Secção: 3
uma distribuição de tipo lognormal à parte da distribuição complementar à cauda.
Para a aplicação da teoria dos valores extremos existem já pacotes como o EVIR
para uso com o software R ou o Xtremes referido na bibliografia (veja-se [Reiss 01]).
Seguidamente resumiremos alguns factos notáveis relativos a algumas das distribuições mais utilizadas na modelização inicial da severidade. Muitas outras distribuições
podem ser usadas para esse efeito. Encorajamos o leito a consultar um qualquer texto
clássico de Estatı́stica ou, por exemplo, [Abell 99][pp. 231–273], se estiver interessado
numa exploração destas distribuições usando o software Mathematica. Para cada um
destes modelos clássicos indicamos os momentos e alguns dos estimadores que se podem
utilizar para os parâmetros dessas distribuições.
3.1 Gaussiana
X _ Gaussiana (µ, σ), a variável tem distribuição Gaussiana de parâmetros µ número
real, σ > 0 se a densidade de probabilidade se representa sob a forma
"
#
1
1 x−µ 2
fGaussiana (µ,σ) (x) = √
exp −
2
σ
2σπ
A função caracterı́stica é:
t2 σ 2
ϕGaussiana (µ,σ) (t) = exp iµt −
2
.
Os momentos são dados por:
E[X] = µ , V[X] = σ 2 .
Os estimadores dos parâmetros obtidos pelo método dos momentos (veja-se [Cruz 02][p.
50]), são para uma amostra X = (X1 , X2 , . . . Xn ):
v
u n
n
X
1 u
1X
µ̂ = X =
Xi , σ̂ = √ t (Xi − X)2
n
n
i=1
i=1
Observação 4. Devido à sua omnipresença na modelização Estatı́stica é uma primeira
escolha natural para distribuição modelo da severidade. Tal como já foi dito a propósito
do teorema limite central é o modelo natural de um fenómeno cujo resultado deriva da
soma dos resultados de um grande número de variáveis aleatórias independentes com
dispersões controladas.
3.2 Lognormal
X _ Lognormal(µ, σ), a variável tem distribuição lognormal ou logaritmicamente normal
de parâmetros µ número real, e σ > 0 se a densidade de probabilidade se representa sob
a forma
"
#
1
1 ln x − µ 2
fLognormal (µ,σ) (x) = √
exp −
, x>0.
2
σ
x 2σπ
MF0910
10
2 de Dezembro de 2009
Capı́tulo VI
Risco Operacional
Secção: 3
Os momentos
k
E[X ] = exp
1 2 4
k σ + kµ , V[X] = exp(σ 4 + µ) exp(σ 4 ) − 1 .
2
Se Y _ Gaussiana (0, 1) então X := exp(σ 2 Y + µ é tal que X _ Lognormal (µ, σ). Em
consequência, o estimador pelo método dos momentos considerando-se Zi = ln Xi − µ é
(veja-se [Cruz 02][p. 51]):
v
u n
n
X
1X
1 u
µ̂ =
Zi = Z , σ̂ = √ t (Zi − Z)2 .
n
n
i=1
i=1
Observação 5. Dado que se obtém esta distribuição tomando a exponencial de uma
variável gaussiana é uma distribuição para variáveis aleatórias tomando valores positivos
que se justifica em modelos em que o resultado deriva do produto dos resultados de um
grande número de variáveis aleatórias independentes, não negativas e com dispersões
controladas.
3.3 Exponencial
X _ Exponencial (δ), a variável tem distribuição exponencial de parâmetro δ > 0 se a
densidade de probabilidade se representa sob a forma
h xi
1
fExponencial (δ) (x) = exp −
x≥0
δ
δ
A função caracterı́stica é
ϕExponencial (δ) (t) =
δ
.
δ − it
Os momentos são:
E[X k ] = δ k k! , V[X] = δ 2 .
Estimador pelo método dos momentos [Cruz 02][p. 52] 2 para θ = 0 que coincide com o
estimador pelo método da verosimilhança máxima [Pestana 02][p. 515]
n
1X
δ̂ =
Xi = X .
n
i=1
Observação 6. É uma distribuição de grande importância dado que serve para modelo
do tempo de espera entre duas ocorrências de um fenómeno aleatório. A propriedade de
ausência de memória representada pela fórmula seguinte
P[X > t + s | X > s] = P[X > t] ,
implica que num modelo regido pela distribuição exponencial é como que de cada vez
que ocorre o fenómeno aleatório, por exemplo no instante s tudo se passasse como se
tivéssemos iniciado a observação nesse instante.
2
Após correcção da gralha óbvia.
MF0910
11
2 de Dezembro de 2009
Capı́tulo VI
Risco Operacional
Secção: 3
3.4 Weibull
X _ Weibull (α, β), a variável tem distribuição Weibull de parâmetros α e β > 0 se a
densidade de probabilidade se representa sob a forma
α α α−1
x
fWeibull (α,β) (x) = α x
exp −
β
β
Os momentos são:
E[X k ] = β k Γ
(
2 )
1
1
k
2
2
− 2 Γ
.
+ 1 , V[X] = β 2
Γ
α
α
α
α
α
Estimador pelo método da identificação dos percentis [Cruz 02][p. 53] onde
c=
ln ln 4
ln ln(4/3)
e p.25 (respectivamente p.75 ) é o percentil de ordem 25% (respectivamente, o percentil
de ordem 75%)
c ln(p.25 ) − ln(p.75 )
ln ln 4
β̂ =
α̂ =
.
c−1
ln(p.75 ) − ln(β̂)
Observação 7. Esta distribuição é muito utilizada para a modelização do tempo de vida
de objectos com muitas partes constituintes em que a falha do objecto ocorre quando
uma das suas partes constituintes falha.
3.5 Pareto
X _ Pareto (α, θ), a variável tem distribuição Pareto de parâmetros α > 0 e θ > 0 se a
densidade de probabilidade se representa sob a forma
αθα
fPareto (α,θ) (x) =
(x + θ)α+1
Dado que se tem
Z
Z
xfPareto (α,β) (x) dx =
e que
Z
Z
xfPareto (α,β) (x)dx =
θα (αx + θ)
αθα x
dx
=
(x + θ)α+1
(α − 1)(x + θ)α
αθα x2
1
θα (−2θ2 − 2αθx − (α − 1)αx2 )
dx
=
,
(x + θ)α+1
α2 − 3α + 2
(x + θ)α
os momentos são dados por:
(desde que α > 1) E[X] =
αθ2
θ
, (desde que α > 2) V[X] =
.
α−1
(α − 1)2 (α − 2)
Estimadores pelo método dos momentos [Cruz 02][p. 53]
Pn
2
Pn
2
Pn
Pn
2
i=1 xi
i=1 xi
i=1 xi
i=1 xi
−
−
n
n
n
n
α̂ = 2 Pn 2
Pn
2 , θ̂ = 2 Pn 2
Pn
2
i=1 xi
i=1 xi
i=1 xi
i=1 xi
−
2
−
2
n
n
n
n
MF0910
12
2 de Dezembro de 2009
Capı́tulo VI
Risco Operacional
Secção: 4
Observação 8. Em controlo de qualidade usa-se a distribuição de Pareto para modelizar
perdas. Entre outros fenómenos que podem ser modelizados com as distribuições de
Pareto, para as caudas das distribuições respectivas, podemos referir as flutuações do
preço das acções e os rendimentos individuais.
3.6 Gama
X _ Gama (α, θ), a variável tem distribuição gama de parâmetros α > 0 e θ > 0 se a
densidade de probabilidade se representa sob a forma:
x
1 x α
fGama (α,θ) (x) =
exp −
x>0.
xΓ(α) θ
θ
A função caracterı́stica tem por expressão:
ϕGama (α,θ) (t) =
1
.
(1 − iθt)α
Os momentos são dados por:
E[X k ] = α(α + 1) . . . (α + k − 1)θk , V[X] = αθ2 .
Estimadores pelo método dos momentos ver [Cruz 02][p. 54] ou [Lewis 04][p. 46]
Pn
Pn
2
2
Pn
2
i=1 xi
i=1 xi
i=1 xi
−
n
n
n
Pn
α̂ = Pn 2 Pn
.
2 , θ̂ =
i=1 xi
i=1 xi
i=1 xi
−
n
n
n
Observação 9. Um dos usos da distribuição gama é o de representar a distribuição da
diferença entre o valor máximo e o valor mı́nimo de uma amostra de uma população
normal. Um outro uso é o de modelizar situações fı́sicas tais como tempos de espera.
Observação 10. Em [Cruz 02][p. 46] pode encontrar-se uma tabela que descreve a comparação dos comportamentos de cauda para um conjunto de distribuições relevantes e
que reproduzimos seguidamente.
Distribuição
P[X ≥ x]
Weibull α > 1
a
e−x , A > 1
Exponencial
e−x
Weibull α < 1
a
e−x
Lognormal
x−a ln x
Pareto, DVEG
x−a
A existência de caudas pesadas numa distribuição leva a problemas de ajustamento que
necessitam para ser resolvidos das técnicas associadas à teoria dos valores extremos.
4 Value at Risk
Uma das medidas de risco mais correntemente usadas é o Value at Risk (VaR). O VaR
pode ser definido como uma estimativa estatı́stica de uma perda com a propriedade que
com uma dada probabilidade (pequena) é possı́vel que sobrevenha essa perda ou uma
perda superior, num dado perı́odo de tempo (em geral pequeno). Mais concretamente
tem-se a definição seguinte.
MF0910
13
2 de Dezembro de 2009
Capı́tulo VI
Risco Operacional
Secção: 5
Definição 3 (Value at Risk (VaR)). Dado um grau de confiança α ∈]0, 1[ o VaRα de
uma perda, representada por uma variável aleatória L, ao nı́vel de confiança α é dado
pelo mais pequeno número l tal que a a probabilidade que a perda L exceda esse número
l é menor ou igual a 1 − α, isto é:
VaRα (L) = inf{l ∈ R : P[L > l] ≤ 1 − α} .
O VaRα é assim o quantil (qα ) da distribuição da variável aleatória L ou seja
qα = F ← (1 − α) .
São correntes os valores α = 0.95 ou α = 0.99. Note-se que α = 0.99 corresponde a
uma acontecimento que ocorre uma em cada mil vezes. O VaR como medida de risco
tem graves inconvenientes. Um dos mais relevantes é o não ser sub-aditiva isto é para
duas variáveis aleatórias K e L, representando dois tipos distintos de risco operacional,
não se verifica necessariamente
VaRα (K + L) ≤ VaRα (K) + VaRα (L) ,
isto é pode ocorrer que:
VaRα (K + L) > VaRα (K) + VaRα (L) .
Deste inconveniente resulta que efectuar a análise de uma carteira de riscos calculando
os VaR para cada um dos riscos e somando-os para obter um majorante do VaR da
carteira é um processo sem justificação salvo em casos muito especiais. Foram propostos
dois caminhos para evitar este grave inconveniente. Um primeiro consiste em utilizar a
composição de riscos através da teoria das cópulas 3 . Um outro consiste em considerar
o expected shortfall (ES) definido como:
ESα = E[L | X > VaRα (L)] .
O ES é uma medida de risco coerente e em particular já é sub-aditiva.
Observação 11. No endereço http://www.math.ethz.ch/riskometer/ poderá encontrar
uma funcionalidade na Internet que permite apreciar os resultados permanentemente
actualizados de um estudo comparativo de métodos distintos de aplicação do VaR a
vários ı́ndices bolsistas.
Na secção seguinte veremos como determinar o VaR de uma forma mais robusta para
as distribuições que naturalmente ocorrem na análise dos riscos operacionais.
5 Teoria dos Valores Extremos
A teoria dos valores extremos é a técnica adequada para a estimação de quantis elevados
de uma distribuição de perdas dado que permite ajustar um modelo para a distribuição
3
No endereço http://www.fenews.com/fen39/one time articles/copula/copula-vaR.htm poderá encontrar uma introdução rápida à estimação do VaR multivariado por meio da teoria das cópulas
MF0910
14
2 de Dezembro de 2009
Capı́tulo VI
Risco Operacional
Secção: 5
da cauda de um conjunto de dados usando apenas a informação sobre acontecimentos
extremos. No entanto, é imperativo que haja um conjunto de dados suficientes para a
calibração dos modelos. Como pressupostos de base importantes supõe-se que as perdas
são independentes e identicamente distribuı́das. É frequente observar nos dados reais
que as perdas são não estacionárias o que obriga a extensões não triviais dos métodos
introduzidos (veja-se [Chavez 04]). Por outro lado, uma estimativa do risco global que
se obtêm somando os riscos calculados em cada um dos tipos de conjunto de classes
de risco não é coerente. Uma alternativa neste contexto é a de utilizar a agregação de
distribuições de risco através da teoria das cópulas.
5.1 Introdução
Consideraremos o seguinte problema: determinar um modelo rigoroso para as perdas operacionais X1 , X2 , . . . Xq acima de um dado limiar (threshold) u. Supõe-se que
X1 , . . . , Xn são observações independentes e identicamente distribuı́das (iid), de uma lei,
para nós desconhecida, tendo F como função distribuição.
Uma resposta resumida a este problema pode ser dada usando a teoria dos valores
extremos, podendo concretizar-se nos seguintes dois passos.
• Realiza-se primeiramente um ajustamento de uma distribuição de Pareto generalizada (DPG) aos excessos das perdas sobre o limiar u, representados por
Wj := Xi − u j = 1, . . . , n , i = 1, . . . , n , Xi > u ,
das perdas operacionais X1 , X2 , . . . Xq . Este tipo de distribuições é dado pela
definição seguinte.
Definição 4. A distribuição de Pareto generalizada (DPG) com parâmetro
ξ é dada por definição por:

− 1
ξ

ξx
1− 1+ β
if
ξ 6= 0
Gξ,β (x) =
1 − exp(− x )
if
ξ=0
β
No caso dos modelos de risco operacional tem-se regra geral que ξ > 0. Tal conduz
a que os excessos Wj para j = 1, . . . , n tenham uma distribuição de Pareto com
ı́ndice de cauda 1/ξ isto é:
P[Wj > x] =x→+∞
1
L(x) ,
x1/ξ
em que L é uma função regular.
Note-se que se toma como hipótese de partida que F pertence ao domı́nio maximal de atracção de uma distribuição de valores extremos generalizada (DVEG)
(Fréchet, Weibull or Gumbel) de forma a podermos aplicar o teorema de Fisher
Tippett. Uma DVEG é por definição uma distribuição do tipo seguinte.
MF0910
15
2 de Dezembro de 2009
Capı́tulo VI
Risco Operacional
Secção: 5
Definição 5. A distribuição de valores extremos generalizada (DVEG) com
parâmetro ξ é dada por definição por:
(
−1
exp −(1 + ξx) ξ
if
ξ 6= 0
Hξ (x) =
−x
exp (−e )
if
ξ=0
Sendo que consoante o valor do parâmetro ξ assim a denominação da distribuição:
– Quando ξ > 0 temos a distribuição de Fréchet;
– Quando ξ < 0 temos a distribuiçãoWeibull;
– Quando ξ = 0 temos a distribuição Gumbel.
Defina-se Fu (x) como a probabilidade que a perda exceda o limiar u numa quantidade inferior ou igual a x, isto é, Fu (x) é a função de distribuição dos excessos
condicionada pelas perdas serem superiores ao limiar u, ou mais concretamente:
Fu (x) := P[X − u ≤ x | X ≥ u] .
Em virtude de o teorema de Balkema, de Haan 74 & Pickands 75, distribuição
de Pareto generalizada aparece como distribuição limite para a distribuição dos
excessos sobre o limiar u quando u cresce, isto é, Fu (x) converge para uma DPG
Gξ,β com parâmetro ξ, quando o limiar u converge para o ponto extremo à direita
de F que é o ponto dado por:
x0 := sup{x ∈ R : F (x) < 1} .
Podemos pois aproximar Fu (x) por Gξ,β(u) (x) para um valor de u judiciosamente
escolhido. Para referência apresentamos o enunciado do teorema já referido que
preside a este passo do método.
Teorema 4 (Balkema, de Haan 74 & Pickands 75). A distribuição F está no
domı́nio de atracção maximal de uma distribuição DVEG Hξ se e só se para β =
β(u) adequado se verificar:
lim
u↑x0
sup
0≤x<x0 −u
| Fu (x) − Gξ,β(u) (x) |= 0 .
• Seguidamente efectuamos um ajustamento de uma DPG com três parâmetros à
distribuição condicional empı́rica das perdas e uma estimativa dos quantis a 99%
and 95% destas perdas para a obtenção do VaR.
5.2
Método de aplicação e problemas na implementação
Resumindo, o método de implementação funciona com os seguintes passos:
• Aproxima-se a distribuição dos excessos sobre os nı́veis por uma DPG Gξ,σ em
que os parâmetros ξ e σ são estimados por exemplo pelo método de estimação da
verosimilhança máxima;
MF0910
16
2 de Dezembro de 2009
Capı́tulo VI
Risco Operacional
Secção: 6
• Ajusta-se uma distribuição não condicionada para obter um modelo para as caudas
e determinar os quantis para esta distribuição.
• Estima-se o parâmetro ξ.
• Determina-se o nı́vel u em que u deve ficar muito perto do ponto final da distribuição a aproximação, melhor (teoricamente) mas, se se verificar que os dados
acima do nı́vel u são insuficientes pode ficar em causa a estabilidade e fiabilidade
nas estimativas dos quantis.
Com o fim de determinar um bom valor para u pode usar-se numa primeira aproximação a função excesso médio empı́rica correspondente à função excesso médio e(u)
ambas definidas seguidamente.
Definição 6. A função excesso médio é dada por definição por:
e(u) := E[X − u | X > u] .
A função excesso médio empı́rica é dada por:
Pn
+
i=1 (Xi − u)
en (u) := P
.
n
i=1 I{Xi >u}
O gráfico de en (u) dá indicação sobre a existência (declive positivo), ou não (declive negativo - caso da normal- ou nulo - caso da exponencial), de caudas pesadas na
distribuição.
6 Frequência
Para a modelização da frequência dos eventos indutores de risco operacional aplicase uma metodologia idêntica à que foi proposta para a modelização da severidade. De
atender agora que as variáveis associadas à frequência são discretas. De entre os modelos
mais comuns salientamos os seguintes.
6.1 Poisson
É de uso comum na modelação da frequência em que um dado evento ocorre durante
um intervalo determinado de tempo ou numa dada área ou volume.
X(Ω) = {0, 1, 2, }
∀k ∈ X(Ω) P[X = k] =
λk e−λ
k!
E[X] = λ
V[X] = λ
MF0910
17
2 de Dezembro de 2009
Capı́tulo VI
Risco Operacional
Secção: 7
6.2 Binomial Negativa
Numa sucessão de tiragens de Bernoulli independentes uma variável aleatória que conte
o número de fracassos antes do n-ésimo sucesso tem distribuição binomial negativa.
Tem-se assim que
X(Ω) = {0, 1, 2, }
n+k+1 n
∀k ∈ X(Ω) P[X = k] = Cn−1
p (1 − p)k
E[X] =
n(1 − p)
p
V[X] =
n(1 − p)
p2
7 As perdas agregadas
O modelo consensualmente aceite para perdas operacionais agregadas é uma adaptação
do modelo colectivo das Ciências Actuariais e consiste em supor que Yt a variável
aleatória que descreve essas perdas à data t se escreve
!
Nt
+∞ X
n
X
X
Yt =
Xi =
Xi 1I{Nt =n}
i=1
n=0
i=1
em que a variável aleatória Nt é dada pelo modelo da frequência e em que X1 , . . . Xn , . . .
é uma sucessão de variáveis aleatórias independentes e com distribuição idêntica ao
modelo encontrado para a severidade X. A questão natural agora é a da determinação
da distribuição de Yt .
7.1 Solução Analı́tica
Esta determinação directa é em geral impossı́vel a não ser em casos particulares especiais.
Um método útil usa as transformações funcionais, por exemplo a função caracterı́stica
ou a função geradora de momentos. Com efeito, considerando as funções caracterı́sticas,
ii
h h PNt
ψYt (u) := E eiuYt = E E eiu i=1 Xi | Nt
Supondo que Nt , X1 , . . . Xi . . . são independentes, por uma propriedade importante da
esperança condicional (ver [Resnick 01, p. 350] ou [Hoffmann-Jorgensen 94, p. 452]),
" n
#
h PNt
i
h Pn
i
Y
iu i=1 Xi
iu i=1 Xi
iuXi
E e
| Nt = n = E e
=E
e
= (ψX (u))n ,
i=1
pelo que, pelas propriedades da esperaça condicional,
h PNt
i
E eiu i=1 Xi | Nt = (ψX (u))Nt
MF0910
18
2 de Dezembro de 2009
Capı́tulo VI
Risco Operacional
Secção: 8
e, finalmente,
ψYt (u) = E (ψX (u))Nt .
Por exemplo, se (Nt )t≥0 for o processo de Poisson de parâmetro λ ter-se-á que
+∞
+∞
X
X
(λt)k
ψYt (u) = E (ψX (u))Nt =
.
ψX (u))k P[Nt = k] =
(ψX (u))k e−λt
k!
k=0
k=0
Ou seja:
ψYt (u) = e−λt eλtψX (u) = e−λt(1−ψX (u)) .
Caso seja possı́vel inverter esta função caracterı́stica ter-se-á a distribuição de Yt numa
representação analı́tica. Um caso interessante é o de X ter a distribuição gama (veja-se
também a secção 3.6) com parâmetro de forma α e parâmetro de escala inverso β cuja
densidade e função caracterı́stica são dadas, respectivamente, por
fX (x) =
β α α−1 −βx
1
x
e
ψX (u) =
k
Γ(α)
(1 − iu
β)
Mas até neste caso, aparentemente simples, a determinação da distribuição de Yt necessita o uso de cálculo numérico (veja-se o ficheiro do Mathematica RscOp20091201).
7.2 Solução Simulada ou Aproximada
Referiremos dois métodos aproximados com alguma relevância prática.
• Se a variável aleatória N tomar valores grandes com grande probabilidade é justificável o teorema limite central que nos permite afirmar
Y _ Gaussiana (E[Y ], σ(Y ))
No entanto, esta aproximação normal não é considerada fiável em Ciências Actuariais pelo que o seu uso no risco operacional não pode ser recomendado.
• Uma solução advogada na prática consiste em simular a distribuição de Y para, dos
resultados dessa simulação, extrair as medidas de risco. A metodologia é simples
e está descrita e exemplificada completamente em [Cruz 02][p. 105]. Consiste
em simular numa coluna a variável N . Para cada linha simular uma amostra da
distribuição da severidade com dimensão exactamente igual ao valor que a variável
N simulada tem nessa linha. Para cada linha somar os valores correspondentes a
cada um dos termos da amostra da distribuição da severidade. Finalmente somar os
resultados obtidos nas linhas. Efectuámos assim uma repetição da simulação. Para
completar a simulação efectuar-se-á um número suficiente de repetições (entre 10
000 e 100 000) obtendo-se assim uma amostra da distribuição das perdas agregadas
de acordo com o modelo. As técnicas de cálculo das medidas de risco, por exemplo
o VaR, podem agora ser aplicadas a esta amostra.
MF0910
19
2 de Dezembro de 2009
Capı́tulo VI
Risco Operacional
Secção: 8
8 Bibliografia Comentada
Nesta secção apresentamos comentários que pretendem guiar o eventual leitor para na
consulta à bibliografia e às referências apresentadas no final.
• [Abell 99] Esta obra colectiva é muito completa e permite uma exploração, usando
o software Mathematica, das principais técnicas estatı́sticas elementares tais como:
a estatı́stica descritiva, alisamento de dados e séries cronológicas, inferência para
amostras simples e para pares de amostras, análise de variância, regressões e
métodos não paramétricos. Pode revelar-se extremamente útil para quem pretender uma familiarização simultânea com os métodos da estatı́stica e o uso do
Mathematica.
• [Basel 01] Trata-se de um documento que descreve a aproximação do Comité
de Basileia para a avaliação e controlo do risco operacional. É indispensável que
os técnicos que se ocupam da implementação das metodologias de avaliação e
controlo do risco operacional conheçam precisamente a filosofia dos organismos de
supervisão sobre esse assunto.
• [Chavez 04] Demonstra-se a extensão da teoria dos extremos aplicada ao risco
operacional no caso em que os dados não são estacionários, isto é grosso modo,
apresentam uma variabilidade no tempo que sugere que as leis probabilı́sticas que
regulam o fenómeno variam no tempo.
• [Chavez 05] Uma versão mais elaborada, completa, e detalhada do artigo [Chavez 04].
A leitura é aconselhada dado que os autores não só demonstram a utilidade das
técnicas que propõem mas também chamam a atenção dos leitores para as as
condições especiais em que as técnicas podem fornecer resultados fiáveis.
• [Gomes04] Um texto que recolhe e sistematiza informação útil e actual sobre a
teoria dos valores extremos e suas aplicações à análise do risco.
• [Pestana 02] Para quem procura uma introdução, um auxiliar de estudo e uma
obra de referência de referência nas ciências estatı́sticas recomendo esta obra.
Escrita muito cuidadosamente, o leitor poderá nela encontrar a par de muitos
exemplos detalhados que permitem uma sensibilização para a arte de aplicar a
Estatı́stica a problemas concretos, muitas
• [Cruz 02] Uma referência básica que recomendamos para o estudo inicial dos
métodos quantitativos aplicáveis ao risco operacional. É um texto detalhado de
nı́vel correspondendo a uma iniciação informada que reflecte bem a filosofia subjacente à aplicação dos métodos quantitativos. Alguma precaução é necessária
no que toca às fórmulas apresentadas. Estas devem ser objecto de verificação
independente antes de serem postas em aplicação. Pode ser lida em conjunto
com [Lewis 04].
• [Embrechts 97] Obra fundamental para um estudo detalhado da teoria dos valores extremos. Necessita para um pleno aproveitamento de alguns conhecimentos
MF0910
20
2 de Dezembro de 2009
Capı́tulo VI
Risco Operacional
Secção: 8
iniciais em Estatı́stica mas mesmo sem estes conhecimentos pode ser estudada
permitindo uma primeira abordagem bem sucedida à arte de aplicar a teoria aos
problemas concretos.
• [Embrechts 03] Uma chamada de atenção para as limitações que tem a aplicação
da teoria dos valores extremos em situações em que os dados utilizados nas estimações não têm a estrutura e as qualidades adequadas.
• [Embrechts 04] Os autores passam em revista as principais ideias subjacentes à
aplicação da teoria dos valores extremos ao risco operacional. A referência à teoria
da ruı́na deriva do facto de o modelo colectivo das Ciências Actuariais ser utilizado
na quantificação do risco operacional na determinação de um modelo das perdas
agregadas envolvendo a severidade e a frequência.
• [Ivchenko 90] É uma obra de grande qualidade, relativamente exigente sob o
ponto de vista técnico, mas muito clara e concisa. Permite um estudo das principais
ideias da Estatı́stica Matemática esclarecendo com exemplos escolhidos as noções
apresentadas. É complementado com um óptimo livro de exercı́cios.
• [Lewis 04] Pode considerar-se uma obra de iniciação que permite uma familiarização progressiva com conceitos úteis a um nı́vel introdutório. É acompanhada
de ficheiros Excel que ilustram os noções apresentadas. Recomendamos a leitura
desta obra aos leitores que pretendam uma sensibilização introdutória aos métodos
da Estatı́stica aplicada ao risco operacional. Ganha em ser lida em conjunto
com [Cruz 02].
• [Reiss 01] Para uma exploração aprofundada t̀eoria dos valores extremos e suas
aplicações. Uma versão académica do software Xtremes acompanha o livro permitindo tratar completamente variados exemplos.
• [Ricci 05] Trata-se de uma abordagem à estimação usando o software R. Detalha
alguns procedimentos importantes e explica como efectuar interpretações dos resultados para algumas das técnicas apresentadas no ajustamento de distribuições.
• [Rolski 99] É um texto de referência para muitas matérias que não foram aqui
abordadas mas que são da maior importância para a análise do risco operacional
uma vez que algumas das técnicas utilizadas têm sido exploradas no âmbito das
aplicações actuariais.
Referências
[Abell 99] M. L. Abell, J. P. Braselton, J. A. Rafter, Statistics with Mathematica ,
Academic Press 1999.
[Basel 01] Basel Committee on Banking Supervision, Consultative Document Operational Risk, Bank for International Settlements 2001.
MF0910
21
2 de Dezembro de 2009
Capı́tulo VI
Risco Operacional
Secção: 8
[Chavez 04] V. Chavez-Demoulin, P. Embrechts, Advanced Extremal Models for Operational Risk, preprint (http://www.math.ethz.ch/%7Ebaltes/ftp/papers.html).
[Chavez 05] V. Chavez-Demoulin, P. Embrechts, J. Nes̆lehová, Quantitative Models for Operational Risk:
Extremes, Dependence and Aggregation,
submetido ao Journal of Banking and Finance preprint
(http://www.math.ethz.ch/%7Ebaltes/ftp/papers.html).
[Gomes04] M. Ivette Gomes, Extremes and Risk Management, in proceedings of Stochastic Finance 2004, Autumn School and International Conference (disponı́vel on-line).
[Hoffmann-Jorgensen 94] J. Hoffmann-Jorgensen, Probability with a View Toward Statistics. Volume I, Chapman & Hall , 1994.
[Pestana 02] D. D. Pestana, S. F. Velosa Introdução à Probabilidade e à Estatı́stica,
Volume I, Fundação Calouste Gulbenkian, Lisboa 2002.
[Cruz 02] M. G. Cruz, Modeling measuring and hedging operational risk. John Wiley &
Sons, Inc. 2002.
[Embrechts 97] P. Embrechts, C Klüppelberg, T. Mikosch, Modelling Extremal Events
for insurance and Finance. Springer Verlag, 1997.
[Embrechts 03] P. Embrechts, H. Furrer, R. Kaufmann, Quantifying Regulatory Capital
for Operational Risk, Derivatives Use, Trading & Regulation. 9(3), 217–233, 2003.
[Embrechts 04] P. Embrechts, G. Samorodnitsky, Ruin Theory Revisited: Stochastic
Models for Operational Risk, In: Risk Management for Central Bank Foreign Reserves (Eds. C. Bernadell et al.) European Central Bank, Frankfurt a.M., 243-261,
2004.
[Ivchenko 90] G. I. Ivchenko, Yu. I. Medvedev, Mathematical Statistics, Mir Publishers
Moscow, 1990.
[Lewis 04] N. da Costa Lewis, Operational Risk with Excel and VBA. John Wiley &
Sons, Inc. 2004.
[Reiss 01] R. D. Reiss, M Thomas Statistical Analysis of Extreme values, second edition,
Birkhauser Verlag, 2001.
[Resnick 01] S. I. Resnick A Probability Path, second printing, Birkhauser Boston, 2001.
[Ricci 05] V. Ricci, Fitting Distributions with R, release 0.4, 21 February 2005.
[Rolski 99] T. Rolski, H. Schmidli, Volker Schmidt, J. Teugels Stochastic Processes for
Insurance and Finance, John Wiley & Sons, 1999.
MF0910
22
2 de Dezembro de 2009