Lagrangen kertoimet

Lagrangen menetelmä on ranskalaisen matemaatikon Joseph-Louis Lagrangen mukaan nimetty menetelmä yhtälörajoitetun optimointitehtävän ratkaisemiseksi.

Määritelmä

Olkoon f {\displaystyle f\,} minimointitehtävän kohdefunktio ja g {\displaystyle g\,} rajoite-ehtofunktio. Tarkastellaan näiden määrittämää rajoiteoptimointititehtävää

min f ( x 0 , x 1 , ) {\displaystyle \min f(x_{0},x_{1},\dots )}
ehdolla g i ( x 0 , x 1 , ) = 0 ,   i { 1 , , N } {\displaystyle {\text{ehdolla}}\quad g_{i}(x_{0},x_{1},\dots )=0,~i\in \{1,\dots ,N\}}

Tehtävä voidaan kirjoittaa muodossa, jota kutsutaan Lagrangen funktioksi L , {\displaystyle L,}

L ( x 0 , x 1 , , λ ) = f ( x 0 , x 1 , ) + i = 0 N λ i g i ( x 0 , x 1 , ) {\displaystyle L(x_{0},x_{1},\dots ,\lambda )=f(x_{0},x_{1},\dots )+\sum _{i=0}^{N}\lambda _{i}g_{i}(x_{0},x_{1},\dots )}

Kertoimia λ i R {\displaystyle \lambda _{i}\in \mathbb {R} } kutsutaan Lagrangen kertoimiksi. Esitetyn optimointitehtävän käypä eli rajoite-ehdot täyttävä ratkaisu löydetään Lagrangen funktion L , {\displaystyle L,} ääriarvopisteessä ( x 0 , x 1 , , x n ) {\displaystyle (x_{0}^{*},x_{1}^{*},\dots ,x_{n}^{*})} , jossa siis L ( x 0 , x 1 , , x n ) = 0 {\displaystyle \nabla L(x_{0}^{*},x_{1}^{*},\dots ,x_{n}^{*})=0} . Voidaan tulkita, että kertoimet ohjaavat ratkaisun rajoite-ehtojen määräämään käypään joukkoon.

Esimerkki

Minimointitehtävä min f ( x , y ) , g ( x , y ) = 0 {\displaystyle \min f(x,y),\quad g(x,y)=0} ratkaistaan seuraavasti:

  • kirjoita tehtävä funktiona L ( x , y , λ ) {\displaystyle L(x,y,\lambda )}
  • etsi osittaisderivaatat muuttujien x , y {\displaystyle x,y} ja λ {\displaystyle \lambda } suhteen
  • ratkaise derivaattojen nollakohdat yhtälöryhmästä

Langrangen funktio esimerkille

L ( x , y ) = f ( x , y ) λ g ( x , y ) {\displaystyle L(x,y)=f(x,y)-\lambda g(x,y)}

Etsitään osittaisderivaatat ja niiden muodostama yhtälöryhmä

L ( x , y , λ ) = { x L = x f ( x , y ) + λ x g ( x , y ) y L = y f ( x , y ) + λ y g ( x , y ) λ L = g ( x , y ) {\displaystyle \nabla L(x,y,\lambda )={\begin{cases}{\frac {\partial }{\partial x}}L={\frac {\partial }{\partial x}}f(x,y)+\lambda {\frac {\partial }{\partial x}}g(x,y)\\{\frac {\partial }{\partial y}}L={\frac {\partial }{\partial y}}f(x,y)+\lambda {\frac {\partial }{\partial y}}g(x,y)\\{\frac {\partial }{\partial \lambda }}L=g(x,y)\end{cases}}}

Ratkaistaan saadusta yhtälöryhmästä ääriarvopisteet ( x {\displaystyle x^{*}} , y {\displaystyle y^{*}} , λ {\displaystyle \lambda ^{*}} ) algebran menetelmin (ratkaisemalla derivaattojen nollakohdat yhtälöryhmästä).

Menetelmä

Olkoon f {\displaystyle f\,} minimointitehtävän kohdefunktio ja g {\displaystyle g\,} rajoite-ehtofunktio. Kutsutaan ehdon g ( x , y ) = 0 {\displaystyle g(x,y)=0\,} määräämien pisteiden joukkoa käyräksi C {\displaystyle C\,} . Olkoot funktiot derivoituvia kaikkien muuttujiensa suhteen käyrän C {\displaystyle C\,} pisteissä. Oletetaan myös, että kohdefunktio f {\displaystyle f\,} on derivoituva tehtävän ratkaisupisteen ( x 0 , y 0 ) {\displaystyle (x_{0},y_{0})\,} ympäristössä. Kun lisäksi oletetaan, että piste ( x 0 , y 0 ) {\displaystyle (x_{0},y_{0})\,} ei ole käyrän C {\displaystyle C\,} päätepiste, ja gradientti g ( x 0 , y 0 ) 0 {\displaystyle \nabla g(x_{0},y_{0})\neq 0\,} , on olemassa sellainen luku λ 0 {\displaystyle \lambda _{0}\,} niin, että piste ( x 0 , y 0 , λ 0 ) {\displaystyle (x_{0},y_{0},\lambda _{0})\,} on ns. Lagrangen funktion L {\displaystyle L\,}

L ( x 0 , x 1 , , λ ) = f ( x 0 , x 1 , ) + λ g ( x 0 , x 1 , ) {\displaystyle L(x_{0},x_{1},\dots ,\lambda )=f(x_{0},x_{1},\dots )+\lambda g(x_{0},x_{1},\dots )}

kriittinen piste. Toisin sanoen funktion f {\displaystyle f\,} käyrällä g ( x , y ) = 0 {\displaystyle g(x,y)=0\,} sijaitsevat ääriarvot voidaan löytää etsimällä Lagrangen funktion ääriarvot. Ääriarvot löydetään ratkaisemalla funktion L {\displaystyle L} osittaisderivaatojen nollakohta

0 = L x = f 1 ( x , y ) + λ g ( x , y ) {\displaystyle 0={\frac {\partial L}{\partial x}}=f_{1}(x,y)+\lambda g(x,y)}
0 = L y = f 1 ( x , y ) + λ g ( x , y ) {\displaystyle 0={\frac {\partial L}{\partial y}}=f_{1}(x,y)+\lambda g(x,y)}
0 = L λ = g ( x , y ) {\displaystyle 0={\frac {\partial L}{\partial \lambda }}=g(x,y)}

eli

L ( x 0 , x 1 , , x n , λ ) = 0 {\displaystyle \nabla L(x_{0},x_{1},\dots ,x_{n},\lambda )=\mathbf {0} }

Geometrinen tulkinta

Kohdefunktion a = f ( x ) {\displaystyle \mathbf {a} =\nabla f(x)} ja rajoitusehdon b = g ( x ) {\displaystyle \mathbf {b} =\nabla g(x)} gradientit Lagrangen funktion ratkaisupisteessä.

Lagrangen kerroin λ {\displaystyle \lambda \,} voidaan nähdä skaalaustekijänä, jolla rajoitusehdon gradienttivektoria g ( x ) {\displaystyle \nabla g(x)\,} tulee kertoa, että siitä tulee yhtä pitkä kuin kohdefunktion gradienttivektorista f ( x ) {\displaystyle \nabla f(x)\,} optimointitehtävän ratkaisupisteessä. Tulkinta yleistyy useamman rajoitusehdon tapaukseen, jolloin aktiivisia rajoitusehtoja vastaavat kertoimet λ i {\displaystyle \lambda _{i}\,} valitaan niin, että niiden lineaarikombinaatio vastaavien gradienttien kanssa kumoaa kohdefunktion gradientin.

Herkkyystulkinta

Herkkyystulkinnassa tarkastellaan, miten kohdefunktion arvo muuttuu, kun yhtälörajoitetta muutetaan. Tarkastellaan min f ( x ) ,   h ( x ) = c {\displaystyle \min f(x),~h(x)=c} muotoista tehtävää, missä c {\displaystyle c} . Lagrangen kerroin ilmaisee kunka paljon kohdefunktion arvo muuttuu yhtälörajoituksen muuttuessa eli

c f ( x ) = λ {\displaystyle \nabla _{c}f(x)=-\lambda \,}

missä c {\displaystyle \nabla _{c}} tarkoittaa gradienttia rajoitusehdon muutoksen suhteen.

Esimerkki: pisteen etäisyys suorasta

Pisteen p {\displaystyle p} etäisyys suoralta.

Esitetään tehtävä matemaattisessa muodossa ja ratkaistaan se Lagrangen menetelmällä. Olkoon piste p = ( x 0 , y 0 ) {\displaystyle p=(x_{0},y_{0})} ja suora a x + b y + c = 0 {\displaystyle ax+by+c=0} , missä a , b , c R {\displaystyle a,b,c\in \mathbb {R} } ovat mielivaltaisia vakioita.

Minimoidaan etäisyyden funktio

min d ( x , y ) = ( x x 0 ) 2 + ( y y 0 ) 2 {\displaystyle \min d(x,y)=(x-x_{0})^{2}+(y-y_{0})^{2}\,}

ehdolla

a x + b y + c = 0 {\displaystyle ax+by+c=0}

Suoran yhtälö on siis optimointitehtävän ehto.

Muodostetaan etäisyysfunktiosta ja ehdosta Lagrangen funktio

L ( x , y , λ ) = d ( x , y ) + λ g ( x , y ) = ( x x 0 ) 2 + ( y y 0 ) 2 + λ ( a x + b y + c ) {\displaystyle {\begin{aligned}L(x,y,\lambda )&=d(x,y)+\lambda g(x,y)\\&=(x-x_{0})^{2}+(y-y_{0})^{2}+\lambda (ax+by+c)\end{aligned}}}

Ratkaistaan funktion L {\displaystyle L} ääriarvot muuttujien x {\displaystyle x} , y {\displaystyle y} ja λ {\displaystyle \lambda } suhteen etsimällä osittaisderivaattojen nollakohdat:

{ x L = 2 ( x x 0 ) + λ a = 0 y L = 2 ( y y 0 ) + λ b = 0 λ L = a x + b y + c = 0 {\displaystyle {\begin{cases}{\frac {\partial }{\partial x}}L=2(x-x_{0})+\lambda a&=0\\{\frac {\partial }{\partial y}}L=2(y-y_{0})+\lambda b&=0\\{\frac {\partial }{\partial \lambda }}L=ax+by+c&=0\\\end{cases}}}

Katso myös

  • Matemaattinen optimointi

Lähteet

  • Robert A. Adams (1999), Calculus: A Complete Course 5. painos, Addison Wesley Longman, ISBN 0-201-79131-5.
Tämä matematiikkaan liittyvä artikkeli on tynkä. Voit auttaa Wikipediaa laajentamalla artikkelia.