Difusão de Itō

Em matemática, especificamente em análise estocástica, uma difusão de Itō é uma solução para um tipo específico de equação diferencial estocástica. Esta equação é semelhante à equação de Langevin usada em física para descrever o movimento browniano de uma partícula sujeita a um potencial em um fluido viscoso. As difusões de Itō recebem este nome em homenagem ao matemático japonês Kiyoshi Itō.[1]

Visão geral

Este processo de Wiener (movimento browniano) em um espaço tridimensional (com um caminho amostral exibido) é um exemplo de difusão de Itō.

Uma difusão de Itō homogênea em tempo em um espaço euclidiano de n {\displaystyle n} dimensões R n {\displaystyle \mathbb {R} ^{n}} é um processo X : [ 0 , + ) × Ω R n {\displaystyle X:[0,+\infty )\times \Omega \to \mathbb {R} ^{n}} definido em um espaço de probabilidade ( Ω , Σ , P ) {\displaystyle (\Omega ,\Sigma ,P)} e que satisfaz uma equação diferencial estocástica da forma:

d X t = b ( X t ) d t + σ ( X t ) d B t , {\displaystyle \mathrm {d} X_{t}=b(X_{t})\mathrm {d} t+\sigma (X_{t})\mathrm {d} B_{t},}

em que B {\displaystyle B} é um movimento browniano de m {\displaystyle m} dimensões e b : R n R n {\displaystyle b:\mathbb {R} ^{n}\to \mathbb {R} ^{n}} e σ : R n R n × m {\displaystyle \sigma :\mathbb {R} ^{n}\to \mathbb {R} ^{n\times m}} satisfazem a condição de continuidade de Lipschitz usual:

| b ( x ) b ( y ) | + | σ ( x ) σ ( y ) | C | x y | {\displaystyle |b(x)-b(y)|+|\sigma (x)-\sigma (y)|\leq C|x-y|}

para alguma constante C {\displaystyle C} e todo x , y R n {\displaystyle x,y\in \mathbb {R} ^{n}} .[2] Esta condição garante a existência de uma única solução forte X {\displaystyle X} à equação diferencial estocástica dada acima. O campo vetorial b {\displaystyle b} é conhecido como coeficiente de deriva de X {\displaystyle X} . O campo tensorial σ {\displaystyle \sigma } é conhecido como o coeficiente de difusão de X {\displaystyle X} . É importante notar que b {\displaystyle b} e σ {\displaystyle \sigma } não dependem do tempo. Se dependessem do tempo, X {\displaystyle X} seria apenas considerado um processo de Itō, não uma difusão. Difusões de Itō têm uma série de propriedades importantes, que incluem:

  • a continuidade amostral e a continuidade de Feller;
  • a propriedade de Markov;
  • a propriedade forte de Markov;
  • a existência de um gerador infinitesimal;
  • a existência de um operador característico;
  • a fórmula de Dynkin.

Em particular, uma difusão de Itō é um processo contínuo e fortemente markoviano de tal modo que o domínio de seu operador característico inclui todas as funções dupla e continuamente diferenciáveis, sendo uma difusão no sentido definido pelo matemático soviético-americano Eugene Dynkin.

Continuidade

Continuidade amostral

Um difusão de Itō X {\displaystyle X} é um processo contínuo amostral, isto é, para quase todas as realizações B t ( ω ) {\displaystyle B_{t}(\omega )} do ruído, X t ( ω ) {\displaystyle X_{t}(\omega )} é uma função contínua do parâmetro de tempo t {\displaystyle t} . Mais precisamente, há uma "versão contínua" de X {\displaystyle X} , um processo contínuo Y {\displaystyle Y} tal que:

P [ X t = Y t ] = 1  para todo  t . {\displaystyle \mathbf {P} [X_{t}=Y_{t}]=1{\mbox{ para todo }}t.}

Isto se segue da existência padrão e da teoria da unicidade para soluções fortes de equações diferenciais estocásticas.[3]

Continuidade de Feller

Além de ser contínua e amostral, uma difusão de Itō X {\displaystyle X} satisfaz o requisito mais forte da continuidade de Feller.

Para um ponto x R n {\displaystyle x\in \mathbb {R} ^{n}} , considere que P x {\displaystyle ^{x}} denota a lei de X {\displaystyle X} , sendo o dado inicial X 0 = x {\displaystyle X_{0}=x} , e considere que E x {\displaystyle \mathbf {E} ^{x}} denota o valor esperado em relação a P x {\displaystyle ^{x}} .

Considere que f : R n R {\displaystyle f:\mathbb {R} ^{n}\to \mathbb {R} } é uma função mensurável de Borel limitada abaixo e defina, para t 0 {\displaystyle t\geq 0} fixo, u : R n R {\displaystyle u:\mathbb {R} ^{n}\to \mathbb {R} } por:

u ( x ) = E x [ f ( X t ) ] . {\displaystyle u(x)=\mathbf {E} ^{x}[f(X_{t})].}

  • Semicontinuidade inferior: se f {\displaystyle f} for semicontínua inferior, então, u {\displaystyle u} é semicontínua inferior.
  • Continuidade de Feller: se f {\displaystyle f} for limitada e contínua, então, u {\displaystyle u} é contínua.

O comportamento da função u {\displaystyle u} acima quando o tempo t {\displaystyle t} é variado foi abordado pela equação regressiva de Kolmogorov, pela equação de Fokker–Planck, entre outras.[4]

Propriedade de Markov

Propriedade de Markov

Uma difusão de Itō tem a importante propriedade de ser markoviana: o futuro comportamento de X {\displaystyle X} , dado o que aconteceu até o tempo t {\displaystyle t} , é o mesmo como se o processo tivesse sido iniciado na posição X t {\displaystyle X_{t}} no tempo 0. A formulação matemática precisa desta afirmação exige alguma notação adicional.

Considere que Σ {\displaystyle \Sigma _{*}} denota a filtração natural de ( Ω , Σ ) {\displaystyle (\Omega ,\Sigma )} gerada pela movimento browniano B {\displaystyle B} . Para t 0 {\displaystyle t\geq 0} ,

Σ t = Σ t B = σ { B s 1 ( A ) Ω : 0 s t , A R n Borel } . {\displaystyle \Sigma _{t}=\Sigma _{t}^{B}=\sigma \left\{B_{s}^{-1}(A)\subseteq \Omega :0\leq s\leq t,A\subseteq \mathbf {R} ^{n}{\mbox{Borel}}\right\}.}

É fácil mostrar que X {\displaystyle X} é adaptada a Σ {\displaystyle \Sigma _{*}} (isto é, que cada X t {\displaystyle X_{t}} é Σ t {\displaystyle \Sigma _{t}} -mensurável), de modo que a filtração natural F = F X {\displaystyle F_{*}=F_{*}^{X}} de ( Ω , Σ ) {\displaystyle (\Omega ,\Sigma )} gerada por X {\displaystyle X} tem F t Σ t {\displaystyle F_{t}\subseteq \Sigma _{t}} para cada t 0 {\displaystyle t\geq 0} . Considere que f : R n R {\displaystyle f:\mathbb {R} ^{n}\to \mathbb {R} } é uma função limitada e mensurável de Borel. Então, para todo t {\displaystyle t} e h 0 {\displaystyle h\geq 0} , o valor esperado condicional condicionado na σ-álgebra Σ t {\displaystyle \Sigma _{t}} e o valor esperado do processo "reiniciado" a partir de X t {\displaystyle X_{t}} satisfazem a propriedade de Markov:

E x [ f ( X t + h ) | Σ t ] ( ω ) = E X t ( ω ) [ f ( X h ) ] . {\displaystyle \mathbf {E} ^{x}{\big [}f(X_{t+h}){\big |}\Sigma _{t}{\big ]}(\omega )=\mathbf {E} ^{X_{t}(\omega )}[f(X_{h})].}

De fato, X {\displaystyle X} é também um processo de Markov no que se refere à filtração F {\displaystyle F_{*}} , como mostra o que segue:

E x [ f ( X t + h ) | F t ] = E x [ E x [ f ( X t + h ) | Σ t ] | F t ] = E x [ E X t [ f ( X h ) ] | F t ] = E X t [ f ( X h ) ] . {\displaystyle {\begin{aligned}\mathbf {E} ^{x}\left[f(X_{t+h}){\big |}F_{t}\right]&=\mathbf {E} ^{x}\left[\mathbf {E} ^{x}\left[f(X_{t+h}){\big |}\Sigma _{t}\right]{\big |}F_{t}\right]\\&=\mathbf {E} ^{x}\left[\mathbf {E} ^{X_{t}}\left[f(X_{h})\right]{\big |}F_{t}\right]\\&=\mathbf {E} ^{X_{t}}\left[f(X_{h})\right].\end{aligned}}} [5]

Propriedade forte de Markov

A propriedade forte de Markov é uma generalização da propriedade de Markov acima em que t {\displaystyle t} é substituído por um tempo aleatório adequado T : Ω [ 0 , + ] {\displaystyle T:\Omega \to [0,+\infty ]} conhecido como tempo de parada. Então, por exemplo, em vez de "reiniciar" o processo X {\displaystyle X} no tempo t = 1 {\displaystyle t=1} , pode-se "reiniciar" quando quer que X {\displaystyle X} alcance pela primeira vez algum ponto especificado p {\displaystyle p} de R n {\displaystyle \mathbb {R} ^{n}} .

Como antes, considere f : R n R {\displaystyle f:\mathbb {R} ^{n}\to \mathbb {R} } uma função limitada e mensurável de Borel. Considere τ {\displaystyle \tau } um tempo de parada no que se refere à filtração Σ {\displaystyle \Sigma _{*}} com τ < + {\displaystyle \tau <+\infty } quase certamente. Então, para todo h 0 {\displaystyle h\geq 0} ,

E x [ f ( X τ + h ) | Σ τ ] = E X τ [ f ( X h ) ] . {\displaystyle \mathbf {E} ^{x}{\big [}f(X_{\tau +h}){\big |}\Sigma _{\tau }{\big ]}=\mathbf {E} ^{X_{\tau }}{\big [}f(X_{h}){\big ]}.} [4]

Gerador

Definição

Associado a cada difusão de Itō, há um operador diferencial parcial de segunda ordem conhecido como o gerador de difusão. O gerador é muito útil em muitas aplicações e codifica uma grande quantidade de informação sobre o processo X {\displaystyle X} . Formalmente, o gerador infinitesimal de uma difusão de Itō X {\displaystyle X} é o operador A {\displaystyle A} , que é definido como agindo em funções adequadas f : R n R {\displaystyle f:\mathbb {R} ^{n}\to \mathbb {R} } por:

A f ( x ) = lim t 0 E x [ f ( X t ) ] f ( x ) t . {\displaystyle Af(x)=\lim _{t\downarrow 0}{\frac {\mathbf {E} ^{x}[f(X_{t})]-f(x)}{t}}.}

O conjunto de todas as funções f {\displaystyle f} para as quais este limite existe em um ponto x {\displaystyle x} é denotado como D A ( x ) {\displaystyle D_{A}(x)} , enquanto D A {\displaystyle D_{A}} denota o conjunto de todas as f {\displaystyle f} para as quaIS o limite existe para todo x R n {\displaystyle x\in \mathbb {R} ^{n}} . Pode-se mostrar que qualquer função f {\displaystyle f} compactamente suportada C 2 {\displaystyle C^{2}} (duplamente diferenciável com segunda derivada contínua) repousa em D A {\displaystyle D_{A}} e que:

A f ( x ) = i b i ( x ) f x i ( x ) + 1 2 i , j ( σ ( x ) σ ( x ) ) i , j 2 f x i x j ( x ) , {\displaystyle Af(x)=\sum _{i}b_{i}(x){\frac {\partial f}{\partial x_{i}}}(x)+{\tfrac {1}{2}}\sum _{i,j}\left(\sigma (x)\sigma (x)^{\top }\right)_{i,j}{\frac {\partial ^{2}f}{\partial x_{i}\partial x_{j}}}(x),}

ou, em termos de gradiente, escalar e produto interno de Frobenius,

A f ( x ) = b ( x ) x f ( x ) + 1 2 ( σ ( x ) σ ( x ) ) : x x f ( x ) . {\displaystyle Af(x)=b(x)\cdot \nabla _{x}f(x)+{\tfrac {1}{2}}\left(\sigma (x)\sigma (x)^{\top }\right):\nabla _{x}\nabla _{x}f(x).} [3]

Exemplo

O gerador A {\displaystyle A} para o movimento browniano B {\displaystyle B} padrão de n {\displaystyle n} dimensões, que satisfaz a equação diferencial estocástica d X t = d B t {\displaystyle \operatorname {d} X_{t}=\operatorname {d} B_{t}} , é dado por

A f ( x ) = 1 2 i , j δ i j 2 f x i x j ( x ) = 1 2 i 2 f x i 2 ( x ) , {\displaystyle Af(x)={\tfrac {1}{2}}\sum _{i,j}\delta _{ij}{\frac {\partial ^{2}f}{\partial x_{i}\partial x_{j}}}(x)={\tfrac {1}{2}}\sum _{i}{\frac {\partial ^{2}f}{\partial x_{i}^{2}}}(x),}

isto é, A = Δ / 2 {\displaystyle A=\Delta /2} , em que Δ {\displaystyle \Delta } denota o operador de Laplace.

Equações de Kolmogorov e de Fokker–Planck

Ver artigos principais: Equações regressivas de Kolmogorov (difusão) e Equação de Fokker–Planck

O gerador é usado na formulação da equação regressiva de Kolmogorov. Intuitivamente, esta equação diz como o valor esperado de qualquer estatística adequadamente suave de X {\displaystyle X} evolui no tempo: ele deve resolver uma certa equação diferencial parcial em que o tempo t {\displaystyle t} e a posição inicial x {\displaystyle x} são variáveis independentes. Mais precisamente, se f C 2 ( R n ; R ) {\displaystyle f\in C^{2}(\mathbb {R} ^{n};\mathbb {R} )} tiver suporte compacto e u : [ 0 ; + ) × R n R {\displaystyle u:[0;+\infty )\times \mathbb {R} ^{n}\rightarrow \mathbb {R} } for definida por:

u ( t , x ) = E x [ f ( X t ) ] , {\displaystyle u(t,x)=\mathbf {E} ^{x}[f(X_{t})],}

então, u ( t , x ) {\displaystyle u(t,x)} é diferenciável no que diz respeito a t , u ( t , ) D A {\displaystyle t,u(t,\cdot )\in D_{A}} para todo t {\displaystyle t} e u {\displaystyle u} satisfaz a seguinte equação diferencial parcial, conhecida como equação regressiva de Kolmogorov:

{ u t ( t , x ) = A u ( t , x ) , t > 0 , x R n ; u ( 0 , x ) = f ( x ) , x R n . {\displaystyle {\begin{cases}{\dfrac {\partial u}{\partial t}}(t,x)=Au(t,x),&t>0,x\in \mathbb {R} ^{n};\\u(0,x)=f(x),&x\in \mathbb {R} ^{n}.\end{cases}}}

A equação de Fokker–Planck (também conhecida como equação progressiva de Kolmogorov) é, em algum sentido, a "adjunta" da equação regressiva e diz como as funções densidade de probabilidade de X t {\displaystyle X_{t}} evoluem com o tempo t {\displaystyle t} . Considere que ρ ( t , ) {\displaystyle \rho (t,\cdot )} é a densidade de X t {\displaystyle X_{t}} no que diz respeito à medida de Lebesgue em R n {\displaystyle \mathbb {R} ^{n}} , isto é, para qualquer conjunto mensurável de Borel S R n {\displaystyle S\subseteq \mathbb {R} ^{n}} :

P [ X t S ] = S ρ ( t , x ) d x . {\displaystyle \mathbf {P} \left[X_{t}\in S\right]=\int _{S}\rho (t,x)\mathrm {d} x.}

Considere que A {\displaystyle A^{*}} denota o adjunto hermitiano de A {\displaystyle A} (no que diz respeito ao produto interno L2). Então, dado que a posição inicial X 0 {\displaystyle X_{0}} tem a densidade prescrita ρ 0 {\displaystyle \rho _{0}} , ρ ( t , x ) {\displaystyle \rho (t,x)} é diferenciável no que diz respeito a t {\displaystyle t} , ρ ( t , ) D A {\displaystyle \rho (t,\cdot )\in D_{A^{*}}} para todo t {\displaystyle t} e ρ {\displaystyle \rho } satisfaz a seguinte equação diferencial parcial, conhecida como a equação de Fokker–Planck:

{ ρ t ( t , x ) = A ρ ( t , x ) , t > 0 , x R n ; ρ ( 0 , x ) = ρ 0 ( x ) , x R n . {\displaystyle {\begin{cases}{\dfrac {\partial \rho }{\partial t}}(t,x)=A^{*}\rho (t,x),&t>0,x\in \mathbb {R} ^{n};\\\rho (0,x)=\rho _{0}(x),&x\in \mathbb {R} ^{n}.\end{cases}}} [6]

Fórmula de Feynman–Kac

Ver artigo principal: Fórmula de Feynman–Kac

A fórmula de Feynman–Kac é uma generalização útil da equação regressiva de Kolmogorov. Novamente, f {\displaystyle f} está em C 2 ( R n ; R ) {\displaystyle C^{2}(\mathbb {R} ^{n};\mathbb {R} )} e tem suporte compacto e assume-se que q : R n R {\displaystyle q:\mathbb {R} ^{n}\rightarrow \mathbb {R} } é uma função contínua que é limitada abaixo. Define-se uma função v : [ 0 , + ) × R n R {\displaystyle v:[0,+\infty )\times \mathbb {R} ^{n}\rightarrow \mathbb {R} } por:

v ( t , x ) = E x [ exp ( 0 t q ( X s ) d s ) f ( X t ) ] . {\displaystyle v(t,x)=\mathbf {E} ^{x}\left[\exp \left(-\int _{0}^{t}q(X_{s})\,\mathrm {d} s\right)f(X_{t})\right].}

A fórmula de Feynman–Kac afirma que v {\displaystyle v} satisfaz a equação diferencial parcial:

{ v t ( t , x ) = A v ( t , x ) q ( x ) v ( t , x ) , t > 0 , x R n ; v ( 0 , x ) = f ( x ) , x R n . {\displaystyle {\begin{cases}{\dfrac {\partial v}{\partial t}}(t,x)=Av(t,x)-q(x)v(t,x),&t>0,x\in \mathbb {R} ^{n};\\v(0,x)=f(x),&x\in \mathbb {R} ^{n}.\end{cases}}}

Além disso, se w : [ 0 , + ) × R n R {\displaystyle w:[0,+\infty )\times \mathbb {R} ^{n}\rightarrow \mathbb {R} } for C 1 {\displaystyle C^{1}} em tempo, C 2 {\displaystyle C^{2}} em espaço, limitada como K × R n {\displaystyle K\times \mathbb {R} ^{n}} para todo K {\displaystyle K} compacto e satisfizer a equação diferencial parcial acima, então, w {\displaystyle w} deve ser v {\displaystyle v} como definida acima.

A equação regressiva de Kolmogorov é o caso especial da fórmula de Feynman–Kac em que q ( x ) = 0 {\displaystyle q(x)=0} para todo x R n {\displaystyle x\in \mathbb {R} ^{n}} .[3]

Operador característico

Definição

O operador característico de uma difusão de Itō X {\displaystyle X} é um operador diferencial parcial intimamente relacionado com o gerador, mas de certa forma mais geral. É mais adequado para certos problemas, por exemplo na solução do problema de Dirichlet.

O operador característico A {\displaystyle {\mathcal {A}}} de uma difusão de Itō X {\displaystyle X} é definido por:

A f ( x ) = lim U x E x [ f ( X τ U ) ] f ( x ) E x [ τ U ] , {\displaystyle {\mathcal {A}}f(x)=\lim _{U\downarrow x}{\frac {\mathbf {E} ^{x}\left[f(X_{\tau _{U}})\right]-f(x)}{\mathbf {E} ^{x}[\tau _{U}]}},}

em que os conjuntos U {\displaystyle U} formam uma sequência de conjuntos abertos U k {\displaystyle U_{k}} que decrescem ao ponto x {\displaystyle x} no sentido em que:

U k + 1 U k  e  k = 1 U k = { x } {\displaystyle U_{k+1}\subseteq U_{k}{\mbox{ e }}\bigcap _{k=1}^{\infty }U_{k}=\{x\}}

e

τ U = inf { t 0   :   X t U } {\displaystyle \tau _{U}=\inf\{t\geq 0\ :\ X_{t}\not \in U\}}

é o primeiro tempo de saída a partir de U {\displaystyle U} para X {\displaystyle X} . D A {\displaystyle D_{\mathcal {A}}} denota o conjunto de todas as f {\displaystyle f} para as quais este limite existe para todo x R n {\displaystyle x\in \mathbb {R} ^{n}} e todas as sequências { U k } {\displaystyle \{U_{k}\}} . Se E x [ τ u ] = + {\displaystyle \mathbf {E} ^{x}[\tau _{u}]=+\infty } para todos os conjuntos abertos U {\displaystyle U} contendo x {\displaystyle x} , define-se:

A f ( x ) = 0. {\displaystyle {\mathcal {A}}f(x)=0.} [4]

Relação com o gerador

O operador característico e o gerador infinitesimal estão muito intimamente relacionados e até mesmo concordam para uma grande classe de funções. Pode-se mostrar que:

D A D A {\displaystyle D_{A}\subseteq D_{\mathcal {A}}}

e que

A f = A f  para todo  f D A . {\displaystyle Af={\mathcal {A}}f{\mbox{ para todo }}f\in D_{A}.}

Em particular, o gerador e o operador característico concordam para todas as funções f {\displaystyle f} C 2 {\displaystyle C^{2}} e nesse caso:

A f ( x ) = i b i ( x ) f x i ( x ) + 1 2 i , j ( σ ( x ) σ ( x ) ) i , j 2 f x i x j ( x ) . {\displaystyle {\mathcal {A}}f(x)=\sum _{i}b_{i}(x){\frac {\partial f}{\partial x_{i}}}(x)+{\tfrac {1}{2}}\sum _{i,j}\left(\sigma (x)\sigma (x)^{\top }\right)_{i,j}{\frac {\partial ^{2}f}{\partial x_{i}\,\partial x_{j}}}(x).}

Aplicação do movimento browniano em uma variedade de Riemann

O operador característico de um movimento browniano é uma vez e meia o operador de Laplace-Beltrami. Aqui está o operador de Laplace-Beltrami em uma esfera bimensional.

Acima, o gerador (e assim o operador característico) do movimento browniano em R n {\displaystyle \mathbb {R} ^{n}} foi calculado como sendo Δ / 2 {\displaystyle \Delta /2} , em que Δ {\displaystyle \Delta } denota o operador de Laplace. O operador característico é útil ao definir o movimento browniano em uma variedade de Riemann ( M , g ) {\displaystyle (M,g)} de m {\displaystyle m} dimensões: um movimento browniano em M {\displaystyle M} é definido como sendo uma difusão em M {\displaystyle M} cujo operador característico A {\displaystyle {\mathcal {A}}} em coordenadas locais x i {\displaystyle x_{i}} , 1 i m {\displaystyle 1\leq i\leq m} , é dado por Δ L B / 2 {\displaystyle \Delta _{LB}/2} , em que Δ L B {\displaystyle \Delta _{LB}} é operador de Laplace–Beltrami dado em coordenadas locais por:

Δ L B = 1 det ( g ) i = 1 m x i ( det ( g ) j = 1 m g i j x j ) , {\displaystyle \Delta _{\mathrm {LB} }={\frac {1}{\sqrt {\det(g)}}}\sum _{i=1}^{m}{\frac {\partial }{\partial x_{i}}}\left({\sqrt {\det(g)}}\sum _{j=1}^{m}g^{ij}{\frac {\partial }{\partial x_{j}}}\right),}

em que [ g i j ] = [ g i j ] 1 {\displaystyle [g^{ij}]=[g_{ij}]^{-1}} no sentido do inverso da matriz quadrada.[7]

Operador resolvente

Em geral, o gerador A {\displaystyle A} de uma difusão de Itō X {\displaystyle X} não é um operador limitado. Entretanto, se um múltiplo positivo do operador identidade I {\displaystyle \mathbf {I} } for subtraído a partir de A {\displaystyle A} , então, o operador resultante é invertível. O inverso deste operador pode ser expresso em termos do próprio X {\displaystyle X} usando o operador resolvente.

Para α > 0 {\displaystyle \alpha >0} , o operador resolvente R α {\displaystyle R_{\alpha }} , agindo em funções limitadas, contínuas g : R n R {\displaystyle g:\mathbb {R} ^{n}\rightarrow \mathbb {R} } , é definido como:

R α g ( x ) = E x [ 0 e α t g ( X t ) d t ] . {\displaystyle R_{\alpha }g(x)=\mathbf {E} ^{x}\left[\int _{0}^{\infty }e^{-\alpha t}g(X_{t})\,\mathrm {d} t\right].}

Pode-se mostrar, usando a continuidade de Feller da difusão X {\displaystyle X} , que R α g {\displaystyle R_{\alpha }g} é ele mesmo uma função limitada, contínua. Também, R α {\displaystyle R_{\alpha }} e α I A {\displaystyle \alpha \mathbf {I} -A} são operadores mutuamente inversos:

  • Se f : R n R {\displaystyle f:\mathbb {R} ^{n}\rightarrow \mathbb {R} } for C 2 {\displaystyle C^{2}} com suporte compacto, então, para todo α > 0 {\displaystyle \alpha >0} ,

R α ( α I A ) f = f ; {\displaystyle R_{\alpha }(\alpha \mathbf {I} -A)f=f;}

  • Se g : R n R {\displaystyle g:\mathbb {R} ^{n}\rightarrow \mathbb {R} } for limitada e contínua, então, R α g {\displaystyle R_{\alpha }g} repousa em D A {\displaystyle D_{A}} , para todo α > 0 {\displaystyle \alpha >0} ,

( α I A ) R α g = g . {\displaystyle (\alpha \mathbf {I} -A)R_{\alpha }g=g.} [3]

Medidas invariantes

Algumas vezes, é necessário encontrar uma medida invariante para uma difusão de Itō X {\displaystyle X} , isto é, uma medida em R n {\displaystyle \mathbb {R} ^{n}} que não muda sob o "fluxo" de X {\displaystyle X} , ou seja, se X 0 {\displaystyle X_{0}} for distribuída de acordo com tal medida invariante μ {\displaystyle \mu _{\infty }} , então, X t {\displaystyle X_{t}} é também distribuída de acordo com μ {\displaystyle \mu _{\infty }} para qualquer t 0 {\displaystyle t\geq 0} . A equação de Fokker–Planck oferece uma maneira de encontrar tal medida, pelo menos se tiver uma função densidade de probabilidade ρ {\displaystyle \rho _{\infty }} : se X 0 {\displaystyle X_{0}} for de fato distribuída de acordo com uma medida invariante μ {\displaystyle \mu _{\infty }} com densidade ρ {\displaystyle \rho _{\infty }} , então, a densidade ρ ( t , ) {\displaystyle \rho (t,\cdot )} de X t {\displaystyle X_{t}} não muda com t {\displaystyle t} , de modo que ρ ( t , ) = ρ {\displaystyle \rho (t,\cdot )=\rho _{\infty }} , e então ρ {\displaystyle \rho _{\infty }} deve resolver a equação diferencial parcial (independente de tempo):

A ρ ( x ) = 0 , x R n . {\displaystyle A^{*}\rho _{\infty }(x)=0,\quad x\in \mathbb {R} ^{n}.}

Isto ilustra uma das conexões entre a análise estocástica e o estudo das equações diferenciais parciais. Reciprocamente, uma dada equação diferencial parcial linear de segunda ordem da forma Λ f = 0 {\displaystyle \Lambda f=0} pode ser difícil de resolver diretamente, mas se Λ = A {\displaystyle \Lambda =A^{*}} para alguma difusão de Itō X {\displaystyle X} e uma medida invariante para X {\displaystyle X} for fácil de computar, então, a densidade daquela medida oferece uma solução para a equação diferencial parcial.

Medidas invariantes para fluxos de gradiente

Uma medida invariante é comparativamente fácil de computar quando o processo X {\displaystyle X} é um fluxo de gradiente estocástico de forma:

d X t = Ψ ( X t ) d t + 2 β 1 d B t , {\displaystyle \mathrm {d} X_{t}=-\nabla \Psi (X_{t})\,\mathrm {d} t+{\sqrt {2\beta ^{-1}}}\,\mathrm {d} B_{t},}

em que β > 0 {\displaystyle \beta >0} desempenha o papel de uma temperatura inversa e Ψ : R n R {\displaystyle \Psi :\mathbb {R} ^{n}\rightarrow \mathbb {R} } é um potencial escalar que satisfaz a suavidade adequada e as condições de crescimento. Neste caso, a equação de Fokker–Planck tem uma única solução estacionária ρ {\displaystyle \rho _{\infty }} (isto é, X {\displaystyle X} tem uma única medida invariante μ {\displaystyle \mu _{\infty }} com densidade ρ {\displaystyle \rho _{\infty }} ) e é dada pela distribuição de Gibbs:

ρ ( x ) = Z 1 exp ( β Ψ ( x ) ) , {\displaystyle \rho _{\infty }(x)=Z^{-1}\exp(-\beta \Psi (x)),}

em que a função de partição Z {\displaystyle Z} é dada por:

Z = R n exp ( β Ψ ( x ) ) d x . {\displaystyle Z=\int _{\mathbb {R} ^{n}}\exp(-\beta \Psi (x))\,\mathrm {d} x.}

Além disso, a densidade ρ {\displaystyle \rho _{\infty }} satisfaz um princípio variacional: isto minimiza sobre todas as densidades de probabilidade ρ {\displaystyle \rho } em R n {\displaystyle \mathbb {R} ^{n}} a energia livre funcional F {\displaystyle F} dada por:

F [ ρ ] = E [ ρ ] + 1 β S [ ρ ] , {\displaystyle F[\rho ]=E[\rho ]+{\frac {1}{\beta }}S[\rho ],}

em que

E [ ρ ] = R n Ψ ( x ) ρ ( x ) d x {\displaystyle E[\rho ]=\int _{\mathbf {R} ^{n}}\Psi (x)\rho (x)\,\mathrm {d} x}

desempenha o papel de uma energia funcional e

S [ ρ ] = R n ρ ( x ) log ρ ( x ) d x {\displaystyle S[\rho ]=\int _{\mathbf {R} ^{n}}\rho (x)\log \rho (x)\,\mathrm {d} x}

é a negativa da funcional de entropia de Gibbs–Boltzmann. Mesmo quando o potencial Ψ {\displaystyle \Psi } não é bem comportado o bastante para a função de partição Z {\displaystyle Z} e a medida de Gibbs μ {\displaystyle \mu _{\infty }} a serem definidas, a energia livre F [ ρ ( t , ) ] {\displaystyle F[\rho (t,\cdot )]} ainda faz sentido para cada tempo t 0 {\displaystyle t\geq 0} , desde que a condição inicial tenha F [ ρ ( 0 , ) ] < + {\displaystyle F[\rho (0,\cdot )]<+\infty } . A energia livre funcional F {\displaystyle F} é, na verdade, uma função de Lyapunov para a equação de Fokker–Planck: F [ ρ ( t , ) ] {\displaystyle F[\rho (t,\cdot )]} pode decrescer conforme t {\displaystyle t} aumenta. Assim, F {\displaystyle F} é uma função H para a dinâmica X.[8]

Exemplo

Considere o processo Ornstein–Uhlenbeck X {\displaystyle X} em R n {\displaystyle \mathbb {R} ^{n}} que satisfaz a equação diferencial estocástica:

d X t = κ ( X t m ) d t + 2 β 1 d B t , {\displaystyle \mathrm {d} X_{t}=-\kappa (X_{t}-m)\,\mathrm {d} t+{\sqrt {2\beta ^{-1}}}\,\mathrm {d} B_{t},}

em que m R n {\displaystyle m\in \mathbb {R} ^{n}} e β , κ > 0 {\displaystyle \beta ,\kappa >0} são constantes dadas. Neste caso, o potencial Ψ {\displaystyle \Psi } é dado por:

Ψ ( x ) = 1 2 κ | x m | 2 , {\displaystyle \Psi (x)={\tfrac {1}{2}}\kappa |x-m|^{2},}

e, então, a medida invariante para X {\displaystyle X} é uma medida gaussiana com densidade ρ {\displaystyle \rho _{\infty }} dada por:

ρ ( x ) = ( β κ 2 π ) n 2 exp ( β κ | x m | 2 2 ) . {\displaystyle \rho _{\infty }(x)=\left({\frac {\beta \kappa }{2\pi }}\right)^{\frac {n}{2}}\exp \left(-{\frac {\beta \kappa |x-m|^{2}}{2}}\right).}

Heuristicamente, para um t {\displaystyle t} grande, X t {\displaystyle X_{t}} é aproximadamente normalmente distribuída com média m {\displaystyle m} e variância ( β κ ) 1 {\displaystyle (\beta \kappa )^{-1}} . A expressão para a variância pode ser interpretada como se segue: grandes valores de κ {\displaystyle \kappa } significam que o poço de potencial Ψ {\displaystyle \Psi } tem "lados muito íngremes", de modo que é improvável que X t {\displaystyle X_{t}} se mova para longe do mínimo de Ψ {\displaystyle \Psi } em m {\displaystyle m} ; de forma semelhante, grandes valores de β {\displaystyle \beta } significam que o sistema é muito "frio" com pouco ruído, de modo que, novamente, é improvável que X t {\displaystyle X_{t}} se mova para longe de m {\displaystyle m} .

Propriedade martingale

Em geral, uma difusão de Itō não é um martingale. Entretanto, para qualquer f C 2 ( R 2 ; R ) {\displaystyle f\in C^{2}(\mathbb {R} ^{2};\mathbb {R} )} com suporte compacto, o processo M : [ 0 , + ) × Ω R {\displaystyle M:[0,+\infty )\times \Omega \rightarrow \mathbb {R} } definido por:

M t = f ( X t ) 0 t A f ( X s ) d s , {\displaystyle M_{t}=f(X_{t})-\int _{0}^{t}Af(X_{s})\,\mathrm {d} s,}

em que A {\displaystyle A} é o gerador de X {\displaystyle X} , é um martingale no que diz respeito à filtração natural F {\displaystyle F_{*}} de ( Ω , Σ ) {\displaystyle (\Omega ,\Sigma )} por X {\displaystyle X} . A prova é simples: segue-se da expressão usual da ação do gerador em funções f {\displaystyle f} suficientemente suaves e do lema de Itō (a regra da cadeia estocástica) que:

f ( X t ) = f ( x ) + 0 t A f ( X s ) d s + 0 t f ( X s ) σ ( X s ) d B s . {\displaystyle f(X_{t})=f(x)+\int _{0}^{t}Af(X_{s})\,\mathrm {d} s+\int _{0}^{t}\nabla f(X_{s})^{\top }\sigma (X_{s})\,\mathrm {d} B_{s}.}

Já que as integrais de Itō são martingales no que diz respeito à filtração natural F {\displaystyle F_{*}} de ( Ω , Σ ) {\displaystyle (\Omega ,\Sigma )} por B {\displaystyle B} , para t > s {\displaystyle t>s} ,

E x [ M t | Σ s ] = M s . {\displaystyle \mathbf {E} ^{x}{\big [}M_{t}{\big |}\Sigma _{s}{\big ]}=M_{s}.}

Assim, como exigido,

E x [ M t | F s ] = E x [ E x [ M t | Σ s ] | F s ] = E x [ M s | F s ] = M s , {\displaystyle \mathbf {E} ^{x}[M_{t}|F_{s}]=\mathbf {E} ^{x}\left[\mathbf {E} ^{x}{\big [}M_{t}{\big |}\Sigma _{s}{\big ]}{\big |}F_{s}\right]=\mathbf {E} ^{x}{\big [}M_{s}{\big |}F_{s}{\big ]}=M_{s},}

já que M s {\displaystyle M_{s}} é F s {\displaystyle F_{s}} -mensurável.

Fórmula de Dynkin

Ver artigo principal: Fórmula de Dynkin

A fórmula de Dynkin, que recebe este nome em homenagem ao matemático russo-americano Eugene Dynkin, dá o valor esperado de qualquer estatística adequadamente suave de uma difusão de Itō X {\displaystyle X} (com gerador A {\displaystyle A} ) em um tempo de parada. Precisamente, se τ {\displaystyle \tau } for um tempo de parada com E [ τ ] < + {\displaystyle \mathbf {E} [\tau ]<+\infty } e se f : R n R {\displaystyle f:\mathbb {R} ^{n}\rightarrow \mathbb {R} } for C 2 {\displaystyle C^{2}} com suporte compacto, então:

E x [ f ( X τ ) ] = f ( x ) + E x [ 0 τ A f ( X s ) d s ] . {\displaystyle \mathbf {E} ^{x}[f(X_{\tau })]=f(x)+\mathbf {E} ^{x}\left[\int _{0}^{\tau }Af(X_{s})\,\mathrm {d} s\right].}

A fórmula de Dynkin pode ser usada para calcular muitas estatísticas úteis de tempos de parada. Por exemplo, o movimento browniano canônico na reta real começando em 0 sai do intervalo ( R , + R ) {\displaystyle (-R,+R)} em um tempo aleatório τ R {\displaystyle \tau _{R}} com valor esperado:

E 0 [ τ R ] = R 2 . {\displaystyle \mathbf {E} ^{0}[\tau _{R}]=R^{2}.}

A fórmula de Dynkin oferece informação sobre o comportamento de X {\displaystyle X} em um tempo de parada razoavelmente geral. Para mais informações sobre a distribuição de X {\displaystyle X} em um tempo de chegada, pode-se estudar a medida harmônica do processo.[9]

Medidas associadas

Medida harmônica

Em muitas situações, é suficiente saber quando uma difusão de Itō X {\displaystyle X} deixará pela primeira vez um conjunto mensurável H R n {\displaystyle H\subseteq \mathbb {R} ^{n}} , isto é, estudar o primeiro tempo de saída:

τ H ( ω ) = inf { t 0 | X t H } . {\displaystyle \tau _{H}(\omega )=\inf\{t\geq 0|X_{t}\not \in H\}.}

Algumas vezes, entretanto, pode-se querer saber a distribuição dos pontos nos quais X {\displaystyle X} deixa o conjunto. Por exemplo, o movimento browniano canônico B {\displaystyle B} na reta real começando em 0 deixa o intervalo ( 1 , 1 ) {\displaystyle (-1,1)} em -1 com probabilidade 1 / 2 {\displaystyle 1/2} e em 1 com probabilidade 1 / 2 {\displaystyle 1/2} , de modo que B τ ( 1 , 1 ) {\displaystyle B_{\tau _{(-1,1)}}} é uniformemente distribuído no conjunto { 1 , 1 } {\displaystyle \{-1,1\}} Em geral, se G {\displaystyle G} for compactamente encaixado em R n {\displaystyle \mathbb {R} ^{n}} , então, a medida harmônica (ou distribuição de chegada) de X {\displaystyle X} na fronteira G {\displaystyle \partial G} de G {\displaystyle G} é a medida μ G x {\displaystyle \mu _{G}^{x}} definida por:

μ G x ( F ) = P x [ X τ G F ] {\displaystyle \mu _{G}^{x}(F)=\mathbf {P} ^{x}\left[X_{\tau _{G}}\in F\right]}

para x G {\displaystyle x\in G} e F G {\displaystyle F\subseteq \partial G} .

Retornando ao exemplo anterior do movimento browniano, pode-se mostrar que, se B {\displaystyle B} for um movimento browniano em R n {\displaystyle \mathbb {R} ^{n}} começando em x R n {\displaystyle x\in \mathbb {R} ^{n}} e D R n {\displaystyle D\subset \mathbb {R} ^{n}} for uma bola aberta centrada em x {\displaystyle x} , então, a medida harmônica de B {\displaystyle B} em D {\displaystyle \partial D} é invariante sob todas as rotações de D {\displaystyle D} sobre x {\displaystyle x} e coincide com a medida de superfície normalizada em D {\displaystyle \partial D} .

A medida harmônica satisfaz uma interessante propriedade de valor médio: se f : R 2 R {\displaystyle f:\mathbb {R} ^{2}\rightarrow \mathbb {R} } for qualquer função limitada e mensurável de Borel e φ {\displaystyle \varphi } for dado por:

φ ( x ) = E x [ f ( X τ H ) ] , {\displaystyle \varphi (x)=\mathbf {E} ^{x}\left[f(X_{\tau _{H}})\right],}

então, para todos os conjuntos de Borel G ⊂⊂ H {\displaystyle G\subset \subset H} e todo x G {\displaystyle x\in G} ,

φ ( x ) = G φ ( y ) d μ G x ( y ) . {\displaystyle \varphi (x)=\int _{\partial G}\varphi (y)\,\mathrm {d} \mu _{G}^{x}(y).}

A propriedade de valor médio é muito útil na solução de equações diferenciais parciais usando processos estocásticos.[10]

Medida de Green e fórmula de Green

Considere A {\displaystyle A} um operador diferencial parcial em um domínio D R n {\displaystyle D\subseteq \mathbb {R} ^{n}} e considere X {\displaystyle X} uma difusão de Itō com A {\displaystyle A} como seu gerador. Intuitivamente, a medida de Green de um conjunto de Borel H {\displaystyle H} é o comprimento esperado do tempo em que X {\displaystyle X} permanece em H {\displaystyle H} antes de deixar o domínio D {\displaystyle D} . Em outras palavras, a medida de Green de X {\displaystyle X} no que diz respeito a D {\displaystyle D} em x {\displaystyle x} , denotada G ( x , ) {\displaystyle G(x,\cdot )} , é definida para conjuntos de Borel H R n {\displaystyle H\subseteq \mathbb {R} ^{n}} por:

G ( x , H ) = E x [ 0 τ D χ H ( X s ) d s ] , {\displaystyle G(x,H)=\mathbf {E} ^{x}\left[\int _{0}^{\tau _{D}}\chi _{H}(X_{s})\,\mathrm {d} s\right],}

ou para funções limitadas, contínuas f : D R {\displaystyle f:D\rightarrow \mathbb {R} } , por:

D f ( y ) G ( x , d y ) = E x [ 0 τ D f ( X s ) d s ] . {\displaystyle \int _{D}f(y)\,G(x,\mathrm {d} y)=\mathbf {E} ^{x}\left[\int _{0}^{\tau _{D}}f(X_{s})\,\mathrm {d} s\right].}

A nome "medida de Green" vem do fato de que, se X {\displaystyle X} for um movimento browniano, então:

G ( x , H ) = H G ( x , y ) d y , {\displaystyle G(x,H)=\int _{H}G(x,y)\,\mathrm {d} y,}

em que G ( x , y ) {\displaystyle G(x,y)} é a função de Green para o operador Δ / 2 {\displaystyle \Delta /2} no domínio D {\displaystyle D} . Suponha que E x [ τ D ] < + {\displaystyle \mathbf {E} ^{x}[\tau _{D}]<+\infty } para todo x D {\displaystyle x\in D} . Então, a fórmula de Green se aplica para toda f C 2 ( R 2 ; R ) {\displaystyle f\in C^{2}(\mathbb {R} ^{2};\mathbb {R} )} com suporte compacto:

f ( x ) = E x [ f ( X τ D ) ] D A f ( y ) G ( x , d y ) . {\displaystyle f(x)=\mathbf {E} ^{x}\left[f\left(X_{\tau _{D}}\right)\right]-\int _{D}Af(y)\,G(x,\mathrm {d} y).}

Em particular, se o suporte de f {\displaystyle f} for compactamente encaixado em D {\displaystyle D} ,

f ( x ) = D A f ( y ) G ( x , d y ) . {\displaystyle f(x)=-\int _{D}Af(y)\,G(x,\mathrm {d} y).} [1][4]

Referências

  1. a b Itô, Kiyosi; McKean, Henry P. Jr (5 de janeiro de 1996). Diffusion Processes and their Sample Paths: Reprint of the 1974 Edition (em inglês). [S.l.]: Springer Science & Business Media. ISBN 9783540606291 
  2. Øksendal, Bernt (1 de abril de 1990). «When is a stochastic integral a time change of a diffusion?». Journal of Theoretical Probability (em inglês). 3 (2): 207–226. ISSN 0894-9840. doi:10.1007/BF01045159 
  3. a b c d Kannan, D.; Lakshmikantham, V. (23 de outubro de 2001). Handbook of Stochastic Analysis and Applications (em inglês). [S.l.]: CRC Press. ISBN 9780824706609 
  4. a b c d Oksendal, Bernt (9 de março de 2013). Stochastic Differential Equations: An Introduction with Applications (em inglês). [S.l.]: Springer Science & Business Media. ISBN 9783662130506 
  5. Hirsa, Ali; Neftci, Salih N. (18 de dezembro de 2013). An Introduction to the Mathematics of Financial Derivatives (em inglês). [S.l.]: Academic Press. ISBN 9780123846839 
  6. Fuchs, Christiane (18 de janeiro de 2013). Inference for Diffusion Processes: With Applications in Life Sciences (em inglês). [S.l.]: Springer Science & Business Media. ISBN 9783642259692 
  7. Sakai, Takashi (1 de janeiro de 1996). Riemannian Geometry (em inglês). [S.l.]: American Mathematical Soc. ISBN 9780821889565 
  8. Klebaner, Fima C. (21 de março de 2012). Introduction to Stochastic Calculus with Applications (em inglês). [S.l.]: World Scientific Publishing Company. ISBN 9781911298670 
  9. Dynkin, Evgenij Borisovic (6 de dezembro de 2012). Markov Processes (em inglês). [S.l.]: Springer Science & Business Media. ISBN 9783662000311 
  10. Kisielewicz, Michał (12 de junho de 2013). Stochastic Differential Inclusions and Applications (em inglês). [S.l.]: Springer Science & Business Media. ISBN 9781461467564 
  • v
  • d
  • e
Tempo discreto
Tempo contínuo
Ambos
Campos e outros
Modelos de série temporal
Modelos financeiros
  • Black–Derman–Toy
  • Black–Karasinski
  • Chen
  • Cox–Ingersoll–Ross (CIR)
  • Garman–Kohlhagen
  • Heath–Jarrow–Morton (HJM)
  • Heston
  • Ho–Lee
  • Hull–White
  • LIBOR market
  • Rendleman–Bartter
  • SABR volatility
  • Vašíček
  • Wilkie
Modelos atuariais
  • Bühlmann
  • Cramér–Lundberg
  • Sparre–Anderson
Modelos de filas
Propriedades
Teoremas limites
Desigualdades
Ferramentas
Disciplinas
  • Categoria:Processos estocásticos