Jensen-egyenlőtlenség
A Wikipédiából, a szabad enciklopédiából.
A Jensen-egyenlőtlenség elegáns közös kiterjesztését adja számos matematikai egyenlőtlenségnek.
Ha egy (véges vagy végtelen) I intervallumon az f függvény konvex, , pozitív számok, amikre teljesül , akkor
Ha f szigorúan konvex, akkor egyenlőség csak az esetben teljesül.
Ha f konkáv, akkor az állítás fordított irányú egyenlőtlenséggel teljesül.
Például az f(x) = x2 függvény konvex a nemnegatív valós számok intervallumán, így ha tetszőleges, akkor
ami a számtani és négyzetes közép közötti egyenlőtlenség.
Hasonlóképpen a konkáv x log x függvényt használva azt kapjuk, hogy pozitív számokra
Mivel a jobboldal logaritmusa, a számtani és mértani közép közötti egyenlőtlenséget kapjuk.
Tartalomjegyzék |
[szerkesztés] Jensen egyenlőtlensége
A matematikában Jensen egyenlőtlensége, amit a dán matematikusról, Johan Jensenről, neveztek el, összefüggésbe hozza egy integrál egy konvex függvény értékét a konvex függvény integráljával. Azt 1906-ban bizonyította Jensen. Az általánosságára tekintettel az egyenlőtlenség megjelenik sok alakban, ami a kontextustól függ, és aminek egy része az alábbiakban kerül bemutatásra.
Az egyenlet véges képlete volt a logója a Matematikai Tudományok Intézetének a Koppenhágai Egyetemen 2006-ig.
[szerkesztés] Állítások
Jensen egyenlőtlenségének a klasszikus képlete magába foglal különféle számokat és súlyokat. Az egyenlőtlenséget ki lehet fejezni eléggé általánosságban használva a mértékelméletet vagy egyenértékű valószínűségszerű jelölést. Ebben a valószínűség szerinti felállításban az egyenlőtlenséget tovább lehet általánosítani a teljes érvényességéig.
[szerkesztés] A véges képlet
Ha egy konvex φ függvény egy I=R valós intervallumon, ahol xi –k az intervallum és elemi ai -k a súlyok, Jensen egyenlőtlenségét ki lehet fejezni:
és az egyenlőtlenség nyilvánvalóan megfordított, ha φ konkáv.
Konkrét eset, ha az ai súlyok mind egyenlőek az eggyel, akkor:
Konkáv log(x) függvény (megjegyzés: használhatjuk Jensen egyenlőtlenséget a függvény konvexitásának vagy konkávitásának bizonyítására, valós intervallumon.) Behelyettesítve -t az előző képletbe a számtani és mértani közép közötti egyenlőtlenséget kapjuk:
Ha a változó x egy másik t változó függvénye xi = g(ti). Általánosan a következőt kapjuk: ai–ket felváltja egy nem negatív integrálható f(x)függvény, mint például egy valószínűségi eloszlás, a szummákat pedig integrálok.
[szerkesztés] Az elméleti mértéktér és a valószínűség szerinti képlet
Legyen (Ω,A,μ) egy mértéktér μ(Ω) = 1. Ha g egy valós értékű függvény, ami μ szerint integrált φ pedig egy mérhető konvex függvény, akkor:
Valószínűségelméletben legyen egy valószínűségtér , X egy integrált valós értékű változó és φ egy mérhető konvex függvény. Akkor:
Ekkor a valószínűségelméletben, a mértéknek (μ) megfeleltethető egy valószínűség , μ-nek egy várható érték , és g a függvénynek egy véletlen változó X.
[szerkesztés] Általánosan az egyenlőtlenség egy valószínűség szerint
Általánosan legyen T egy valós vektortér, X egy T értékű integrálható véletlen változó. Az integrálhatóság azt jelenti, hogy bármely T elem számára T: , z eleme T létezik egy T elem, úgy hogy . Ekkor minden mérhető konvex φ függvényre és minden σ-algebra-rára :
Ez a kijelentés általánosítja az előzőt, amikor a T vektortér a tengely és a triviális σ-algebra .
[szerkesztés] Bizonyítások
A Jensen egyenlőtlenség grafikus bizonyítása egy lehetséges esetben. A szaggatott görbe az X tengely mentén X feltételezett eloszlása, míg a szaggatott görbe az Y tengely mentén a megfelelő eloszlású Y értékek. Vegyük észre, hogy X egyre növekedő értékei mellett Y(X) egyre jobban növeli az eloszlást.
Jensen egyenlőtlenségének bizonyítása különféle módon történhet, és három különböző fent említett, különböző állításoknak megfelelő bizonyítás ajánlott. Ám mielőtt megkezdenénk ezeket a matematikai bizonyításokat, érdemes elemezni a grafikus bizonyítást a valószínűség szerinti eset alapján, ahol X egy valós szám, (lásd az ábrát). Elfogadva az X értékeknek egy feltételezett eloszlását, azonnal azonosíthatjuk az és a képe értéket a grafikonon. Észrevehetjük a megfelelő értékek eloszlása egyre inkább nő az X növekedő értékeik mellett, és az Y eloszlása szélesebb, az X > X0 intervallumban, és keskenyebb X <X0 intervallumban bármilyen X0 számára; különösen igaz ez esetére. Következésképpen beláttuk, hogy Y mindig el fog mozdulni felfelé, tekintettel pozíciójára. Ezzel bebizonyítottuk az egyenlőtlenséget, azaz:
Egyenlőség akkor áll fenn, amikor nem szigorúan konvex, pl. amikor ez egy egyenes. A bizonyításokat ez az intuitív elképzelés a következőkben fogalmazza meg:
[szerkesztés] Bizonyítás 1 (véges képlet)
Ha λ1 és λ2 két tetszőleges pozitív valós számok, melyekre λ1 + λ2 = 1, akkor konvexitása miatt:
- -re.
Általánosan: ha λ1 , λ2 , ..., λn pozitív valós számok, melyekre λ1 + ... + λn = 1, akkor
bármennyi x1 , ..., xn számára. A Jensen egyenlőtlenségének ezt a véges képletét teljes indukcióval bizonyíthatjuk be. Ha n = 2 az állítás igaz. Tegyük fel, hogy n-re igaz az állítás, és bizonyítsuk n + 1-re. Ha legalább egy λi λ>0 pl. λ> 1 ; akkor konvexitás miatt:
Mivel , felhasználva feltevésünket a képlet utolsó kifejezésében megkapjuk az eredményt, név szerint a Jensen-féle véges képletű egyenlőtlenséget.
Azért, hogy megkapjuk az általános egyenlőtlenséget ebből a véges képletből, használjunk egy sűrűségérvet. A véges képletet újra fel lehet írni úgy, mint:
ahol μn egy mérték, amit a Dirac delták egy tetszőleges kombinációja ad:
Mivel a konvex függvények folytonosak, és mivel a Dirac delták kombinációi gyengén sűrűek az általános állítást egyszerűen megkapjuk.
[szerkesztés] Bizonyítás 2 (elméleti-határ képlet)
Legyen g egy valós értékű μ-integrálható függvény egy Ω mértéktérben, és legyen φ, egy konvex függvény a valós számok halmazán. Határozzuk meg φ jobboldali deriváltját:
Mivel φ konvex, a jobb oldali hányados ahogy a t közelíti a 0-át jobbról, egyre csökken és alulról korlátos.
Ha t < 0, a határértéke mindig létezik.
Legyen:
Akkor minden x -re ax + b ≤ φ(x). Ha x > x0 , és t = x − x0 > 0. Akkor,
Tehát,
ahogyan azt bizonyítani akartuk. x < x0 esetében hasonlóan bizonyíthatjuk. Ha ax + b = φ(x0).
φ(x 0 ) akkor átírhatjuk a képletet
- - alakúra.
De mivel μ(Ω) = 1, tehát minden valós k számra
Így:
[szerkesztés] Bizonyítás 3 (általános egyenlőtlenség egy valószínűség szerint)
Legyen X egy integrálható valószínűségi változó, az értéket egy valós T vektortérből veszi. Mivel konvex, minden -re
ahogy θ megközelíti a 0+ -t, ez az érték csökken. φ deriváltja X szerint az Y irányába:
Látható, a differenciál lineáris y-ban van és mivel korábban beláttuk, hogy a jobboldal infimuma kisebb mint az értéke a θ = 1 –nél.
Egy tetszőleges sub-σ-algebrára az utolsó egyenlőtlenség szerint, ha fennáll, akkor
Ebből következve megkapjuk az eredményt, mivel:
[szerkesztés] Alkalmazások és speciális esetek
[szerkesztés] Képlet, amely magában foglal egy valószínűség szerinti sűrűség függvényt
Tételezzük fel, hogy Ω egy valós sorozat mérhető alhalmaza és f(x) egy nem negatív függvény, melyre:
Probabilisztikus nyelvben, f egy valószínűségi sűrűség-függvény.
Jensen egyenlőtlensége a következő állítássá válik:
Bármilyen g valós értékű függvény és φ konvex a g tartománya fölött, akkor
Ha g(x) = x, akkor az egyenlőtlenségnek ez a formája redukálódik egy általában használt speciális esetre:
[szerkesztés] Alternatív véges képlet
Ha Ω véges halmaz , és ha μ egy megszámlálható mérték az Ω-án, akkor az általános alak redukálódik egy összegekről szóló állításra:
feltéve ha
Van egy képlet Ω –re is.
[szerkesztés] Statisztikal fizika
Jensen egyenlőtlensége a statisztikai fizikában különös fontosságú akkor, amikor a konvex függvény exponenciális. Adva van:
ahol a zárójel a várható értékekre utal tekintettel néhány valószínűségi eloszlásra a véletlenszerű X változóban.
A bizonyítás ebben az esetben nagyon egyszerű (cf. Chandler, Sec. 5.5). A következő egyenlőtlenséget alkalmazva:
Kapjuk a végső exponenciális egyenlőtlenséget:
[szerkesztés] Információ elmélet
Ha p(x) x valószínűségi változó valódi eloszlás, és q(x) másik eloszlás, akkor Jensen egyenlőtlenségét alkalmazva Y(x) = q(x)/p(x)-re a véletlen változóra, a függvény legyen φ(y) = −log(y) így a Gibbs egyenlőtlenséget kapjuk.
Ez megmutatja, hogy az átlagos üzenethossz minimalizált, amikor kódokat jelölnek ki valódi valószínűségek alapján. Az a nemnegatív mennyiség, (q-nak távolsága p-től) a Kullback-Leibler távolság.
[szerkesztés] Rao-Blackwell tétel
Ha L egy konvex függvény, akkor Jensen egyenlőtlenségéből, megkapjuk, hogy:
Tehát ha δ(X) torzítatlan becslés θ paraméterre T(X) egy elégséges statisztika θ-ra, egy kisebb várt veszteség birtokában L, számolás útján elérhető. Megadható olyan L becslés, mely hatásosabb mint δ(X).
torzítatlan θ-ra, és X függvénye.
Ezt az eredményt a Rao-Blackwell tételként ismerik.
[szerkesztés] Lásd még
Az átlagok törvénye
[szerkesztés] Források
Walter Rudin (1987). Valós és komplext elemzés. McGraw-Hill. ISBN 0-07-054234-1.
David Chandler (1987). Bevezetés a modern statisztikai mechanikába. Oxford. ISBN 0-19-504277-8.
Jensen, Johan Ludwig William Valdemar (1906). " Sur les fonctions* convexes* et les inégalités* entre* les valeurs* moyennes* ". Acta Mathematica 30: 175-193.
[szerkesztés] Elérhetőségek
Eric W Weisstein , Jensen egyenlőtlenség A matematika világa.
Jensen egyenlőtlensége logóként szolgált a Koppenhágai Egyetem Matematikai Szakosztálya számára.