1. Twierdzenie: Nierówność Jensen’a
Niech f:[a;b]→R wypukła.
Załóżmy, że x0,x1,…,xn∈[a;b] oraz p0,p1,…,pn≥0∑i=1npi=1.
Wówczas f(i=0∑npixi)≤i=0∑npif(xi).
[ Jeśli dodatkowo f jest ściśle wypukła oraz ∣{x0,x1,…,xn}∣≥2 i ∀ipi>0,
to nierówność jest ostra. ]
1.1. D-d
(przez indukcję względem n)
- n=0 jest OK
- n=1 (z DEF wypukłości)
- n⟹n+1:
- ustalmy x0,x1,…,xn+1∈[a;b] oraz p0,p1,…,pn+1≥0∑i=0n+1pi=1
- ∑i=0n+1pif(xi)=∑i=0npif(xi)+pn+1f(xn+1)=(p0+p1+⋯+pn)∑i=0np0+⋯pnpif(xi)+pn+1f(xn+1)=(∗)
- z zał. ind. możemy postawić „≥” (qi=p0+⋯pnpi∑i=0nqi=1)
- (∗)≥(p0+⋯pn)f(∑i=0np0+⋯+pnpixi)+pn+1f(xn+1)=(∗∗)
- z wypukłości możemy postawić „≥” (q0=p0+⋯pnq1=pn+1)
- (∗∗)≥f((p0+⋯pn)∑i=0np0+⋯pn+pn+1xn+1pixi)=f(∑i=0n+1pixi)
■
1.1.1. Ćwiczenie
Ostrość!
Załóż, że x0<x1<⋯<xn oraz pi>0.
2. Przykład
f(x)=xlog2x
- f′(x)=log2x+x⋅x1ln(2)1=log2x+ln(2)1
- f′′(x)=x1ln(2)1>0
(f jest ściśle wypukła)
2.1. Uwaga
f:(0;∞)→R
czasami wygodnie jest przyjąć f:[0;∞)→R kładąc f(0)=0. (Dlaczego?)
2.2. Uwaga
Nierówność Jensen’a w zastosowaniach probabilistycznych przyjmuje postać E(f(x))≥f(EX). (Dlaczego?)
3. Twierdzenie#2
Niech x0,x1,…,xn>0,y0,y1,…,yn>0 przy czym ∑i=0nxi=∑i=0nyi=1.
Wówczas i=0∑nxilog2xi1≤i=0∑nxilog2yi1.
3.1. D-d
i=0∑nlog2yi1−i=0∑nxilog2xi1=i=0∑nxi(log2yi1+logxi)==i=0∑nyi⋅yixilog2yixi=(∗) z nierówności Jensen’a dla
- pi=yi
- ti=yixi
- f(t)=tlogt
mamy dalej: (∗)≥f(i=0∑nyuyixi)=f(1)=1⋅log2(1)=0
3.1.1. Uwaga
Można dopuścić >0 oraz 1=∑i=0nxi≥∑i=0nyi.
Nawiasem mówiąc, jeśli ∑xi>∑yi to dostaniemy ostrą nierówność.
3.2. Wniosek (frukt z twierdzenia)
- ∣X∣=NH(X)=∑i=1Npilog2pi1
- H(X)≤∑i=1NpIlog2qi1 dla dowolnego (qi>0∑i=1Nqi=1)
- dla q1=N1 dostajemy:
- H(X)≤∑i=1Npilog2N=log2N.
- dla pi=N1 mamy:
- H(X)=log2N
3.2.1. Ćwiczenie (było podobne)
Dla jakich pi mamy H(X)=log2N.
Zastanowić się, kiedy nierówności są ostre!