Matemaattinen optimointi
Wikipedia
Matemaattinen optimointi on sellaisen pisteen etsimistä jossa funktio saa pienimmän arvonsa. Pistettä x * kutsutaan minimipisteeksi. Minimipisteen etsimistä kutsutaan minimoinniksi tai optimoinniksi. Rajoitetussa optimointitehtävässä lähtöavaruudessa A on pisteitä, joita ei voida hyväksyä ratkaisuiksi.
Vastaavasti maksimointi on sellaisen pisteen etsimistä, jossa funktio saa suurimman arvonsa g(y * ).
Jokaista maksimointiongelmaa vastaa tietty minimointiongelma, joka ratkaisee maksimointiongelman. Funktion g maksimointi on sama tehtävä kuin funktion f = - g minimointi. Näin ollen matemaattisen optimointiteorian riittää tarkastella pelkästään minimointiongelmia. Funktiolla voi olla lokaaleja sekä globaaleja minimejä. Globaali minimi määritellään pisteeksi , jolle pätee kaikilla , jotka kuuluvat käypään alueeseen, eli sitä pienempää funktion arvoa ei voida saavuttaa käyvässä joukossa. Lokaali minimi määritellään pisteeksi , jolle on olemassa ε > 0 siten, että ja kuuluu käypään joukkoon. Ts. on olemassa jokin alue eli ympäristö, jossa piste antaa pienempiä funktion arvoja kun muut pisteet.
Optimointiongelma P esitetään matemaattisesti yleensä muodossa missä on kohdefunktio ja S käypä joukko. Käyvällä joukolla tarkoitetaan sitä joukko johon x:n on kuuluttava.
Optimointiteoria perustuu suurelta osin funktion derivaatan nollakohtaan. Myös konveksin joukon ja konveksin funktion käsitteet ovat osoittautuneet hyödylliseksi etenkin kun on etsitty funktion globaalia optimia.
Sisällysluettelo |
[muokkaa] Esimerkkejä
- Funktio f(x) = ax2 + bx + c, kun a > 0, saavuttaa miniminsä pisteessä .
- Funktiolla f(x) = x, kun , ei ole minimipistettä, sillä jokaista pistettä x kohden on aina olemassa pienempi piste y < x.
- Funktiolla f(x) = (x + 1)2(x − 1)2on kaksi nollakohtaa x1 = − 1 ja x1 = 1. Se on aina ei-negatiivinen, joten funktion minimiarvo on nolla. Huomaa, että kaksi eri x:n arvoa antavat saman optimin, eli optimi ei ole yksikäsitteinen. Jos optimointi tehdään rajoitetussa joukossa , niin optimi on yksikäsitteinen.
[muokkaa] Lineaarinen optimointi
Lineaarinen optimointi tarkoittaa optimointia kun kohdefunktio ja käypää aluetta rajoittavat ehdot ovat lineaarisia. Lineaarista optimointi kutsutaan myös lineaariseksi ohjelmoinniksi. Yleinen linearinen tehtävä voidaan esittää muodossa
Tässä ja merkeillä tarkoitetaan, että jokaista alkiota verrataan riveittäin toisiinsa. Voidaan osoittaa, että kaikki lineaariset optimointitehtävät voidaan esittään ali- ja ylijäämämuuttujien (engl. slack variable) avulla ns. standardimuodossa
missä , ja . Ts. aina kun tarkastellan yleistä lineaarista tehtävää, voidaan tarkastella pelkästään standarditehtävää menettämättä tuloksien yleispätevyyttä. Huomaa, että myös vektorit ja muuttuvat tehtävätyypin muunnoksessa.
[muokkaa] Tuloksia
- Lineaarisen optimointitehtävän käypä alue on n dimensioisen avaruuden monitahokas (engl. polyhedra).
- Oletetaan, että tehtävänä on minimoida lineaarista kohdefunktiota epätyhjän monitahokkaan sisällä (ts. kyseessä on lineaarinen optimointitehtävä). Tällöin kohdefunktion optimaalinen arvo on tai on olemassa optimaalinen ratkaisu . Huomaa, että optimipisteen yksikäsitteisyyttä ei ole taattu.
- Jos lineaarisen optimointitehtävän ratkaisu on äärellinen, tulee yksi ratkaisu löytymään jostain rajoittavan monitahokkaan S kulmasta. Jos kaksi pistettä ja ovat optimaalisia ovat myös pisteet muotoa optimaalisia. Tämän voi tulkita siten, että kahden kulman välillä oleva särmä on optimaalinen, jos kummatkin kulmat ovat optimaalisia. Todistus: Oletetaan, että annetut pisteet minimoivat kohdefunktion f. Voidaan osoittaa, että monitahokas on konveksi joukko, eli kaikilla pätee . Koska annetut pisteet ovat optimaalisia, eli niitä pienempiä arvoja funktio ei voi monitahokkaassa saada, pätee. Toisaalta , mikä voidaan kirjoittaa . Helposti voidaan huomata, että tapaus voidaan yleistää koskemaan n:ää pistettä, eli jos pisteet ovat optimaalisia, niin ovat myös niiden ns. konveksikombinaatiot myös optimaalisia. Todistus on analoginen kahden pisteen tapauksen kanssa.
[muokkaa] Esimerkkejä
Lineaarinen optimointitehtävä
voidaan esittää standardimuodossa muunnoksella , missä ja . Kun lisätään vielä ali- ja ylijäämämuuttujat s1 ja s2 saadaan tehtäväksi
Jos siis valitaan , , ja
on tehtävä saatu standardimuotoon. Huomaa, että optimipisteessä vain toinen muuttujista ja on nollasta poikkeava, joten ylimääräiset muuttujat eivät vaikuta rajoitusehtoihin.
[muokkaa] Epälineaarinen optimointi
Epälineaarisella optimoinnilla tarkoitetaan sellaisen optimointitehtävän ratkaisemista, joka on muotoa
missä , f on kohdefunktio, funktiot gi epäyhtälörajoitukset, hi yhtälörajoitukset ja X käypä joukko. Huomaa, että vaikka yhtälörajoitukset voidaan esittää pelkästään epäyhtälörajoitusten avulla (), ei näin kuitenkaan kannata tehdä: Monet johdetut tulokset olettavat rajoitusten lineaarista riippumattomuutta, jolloin kätevin tapa ratkaista on erotella yhtälö- ja epäyhtälörajoitukset.
Epälineaarinen ja lineaarinen tehtävä (LP) eroavat toisistaan monissa kohdissa. Ensinnäkin käyvän alueen muoto voi olla mielivaltainen epälineaarisessa tehtävässä, kun taas LP-tehtävän käypä joukko on aina monitahokas (joka on aina konveksi joukko). Toiseksi LP-tehtävän kohdefunktio on aina konveksi, joten etsittäessä funktion globaalia optimia voidaan hyödyntää konveksioptimoinnin tuloksia. Lisäksi huomataan, että epälineaarisen tehtävän optimi ei aina ole rajoittavan joukon reunoilla, vaan se voi sijaita muualla. Voidaan todistaa, että optimi sijaitsee tällöin kohdefunktion derivaatan nollakohdassa.
Epälineaarinen tehtävä on siis yleisempi muoto kuin lineaarinen tehtävä. Näin ollen kaikki tulokset, jotka on johdettu epälineaariselle tehtävälle, pätevät myös lineaariselle tehtävällä.
[muokkaa] Välttämättömät optimaalisuusehdot
Kaikkille epälineaarisille optimintitehtäville voidaan johtaa ns. välttämättömät optimaalisuusehdot. Niiden avulla voi tarkistaa voiko jokin piste olla optimi vai ei. Ts. jos jokin piste on optimaalinen, täyttää se optimaalisuusehdot. Matemaattisesti esitettynä: piste x on optimaalinen välttämättömät ehdot toteutuvat.
Epälineaariselle tehtävällä voidaan johtaa Karush-Kuhn-Tuckerin välttämättömät optimaalisuusehdot (välttämättömät KKT-ehdot), ja hieman yleisemmät Fritz-Johnin välttämättömät optimaalisuus ehdot (välttämättömät FJ ehdot). Näistä KKT-ehdot ovat hyödyllisempiä, sillä ne todella karsivat pois optimikandidaatteja. FJ-ehdot saadaan toteutumaan mielivaltaiselle käyvälle pisteelle lisäämällä sopivia merkityksettömiä rajoituksia.
[muokkaa] Fritz-Johnin välttämättömät optimaalisuusehdot
Olkoon käypä joukko epätyhjä ja avoin sekä jonkin epälineaarisen tehtävän lokaali optimi. Tällöin on olemassa vektori siten, että
missä ja ovat m ja l vektorita joiden i:nnet komponintit ovat ui ja vi. Luonnollisesti on oletettava, että gradientit ovat olemassa.
[muokkaa] Karush-Kuhn-Tuckerin välttämättömät optimaalisuusehdot
Fritz-Johnin ehdot redusoituvat tietyin ehdoin KKT-ehdoiksi. Käytännössä näiden ehtojen on taattava, että FJ-ehtojen u0 on nollasta poikkeava, jolloin jakamalla sillä puolittain saadaan ns. KKT-ehdot.
Olkoon jonkin epälineaarisen tehtävän lokaali optimi, jolla on sopivat rajoitusehdot. Tällöin on olemassa vektori siten, että
missä ja ovat m ja l vektorita joiden i:nnet komponintit ovat ui ja vi.