Nierówność Jensen’a

by Jerry Sky

2020-10-22



1. Twierdzenie: Nierówność Jensen’a

Niech f:[a;b]Rf: [a;b] \to \mathbb{R} wypukła.

Załóżmy, że x0,x1,,xn[a;b]x_0, x_1, \dots, x_n \in [a;b] oraz p0,p1,,pn0i=1npi=1p_0, p_1, \dots, p_n \ge 0 \quad \sum_{i=1}^{n} p_i = 1.

Wówczas f(i=0npixi)i=0npif(xi). f\left(\sum_{i=0}^n p_ix_i\right) \le \sum_{i=0}^n p_i f(x_i).

[ Jeśli dodatkowo ff jest ściśle wypukła oraz {x0,x1,,xn}2|\{ x_0, x_1, \dots, x_n \}| \ge 2 i ipi>0\forall i \enspace p_i > 0,
to nierówność jest ostra. ]

1.1. D-d

(przez indukcję względem nn)

  1. n=0n = 0 jest OK
  2. n=1n = 1 (z DEF wypukłości)
  3. n    n+1n \implies n+1:
    1. ustalmy x0,x1,,xn+1[a;b]x_0, x_1, \dots, x_{n+1} \in [a;b] oraz p0,p1,,pn+10i=0n+1pi=1p_0, p_1, \dots, p_{n+1} \ge 0 \quad \sum_{i=0}^{n+1} p_i = 1
    2. i=0n+1pif(xi)=i=0npif(xi)+pn+1f(xn+1)=(p0+p1++pn)i=0npip0+pnf(xi)+pn+1f(xn+1)=()\sum_{i=0}^{n+1} p_i f(x_i) = \sum_{i=0}^{n} p_i f(x_i) + p_{n+1} f(x_{n+1}) = (p_0 + p_1 + \dotsb + p_n) \sum_{i=0}^{n} \frac{p_i}{p_0 + \dotsb p_n} f(x_i) + p_{n+1} f(x_{n+1}) = (*)
    3. z zał. ind. możemy postawić „\ge” (qi=pip0+pni=0nqi=1q_i = \frac{p_i}{p_0 + \dotsb p_n} \sum_{i=0}^n q_i = 1)
    4. ()(p0+pn)f(i=0npixip0++pn)+pn+1f(xn+1)=()(*) \ge (p_0 + \dotsb p_n) f\left( \sum_{i=0}^n \frac{p_i x_i}{p_0 + \dotsb + p_n} \right) + p_{n+1} f(x_{n+1}) = (**)
    5. z wypukłości możemy postawić „\ge” (q0=p0+pnq1=pn+1q_0 = p_0 + \dotsb p_n \qquad q_1 = p_{n+1})
    6. ()f((p0+pn)i=0npixip0+pn+pn+1xn+1)=f(i=0n+1pixi)(**) \ge f\left( (p_0 + \dotsb p_n) \sum_{i=0}^{n} \frac{p_i x_i}{p_0 + \dotsb p_n + p_{n+1} x_{n+1}} \right) = f\left( \sum_{i=0}^{n+1} p_i x_i \right)

\blacksquare

1.1.1. Ćwiczenie

Ostrość!
Załóż, że x0<x1<<xnx_0 < x_1 < \dots < x_n oraz pi>0p_i > 0.


2. Przykład

f(x)=xlog2xf(x) = x \log_2 x

(ff jest ściśle wypukła)

2.1. Uwaga

f:(0;)Rf: (0;\infty) \to \mathbb{R}
czasami wygodnie jest przyjąć f:[0;)Rf: [0; \infty) \to \mathbb{R} kładąc f(0)=0f(0) = 0. (Dlaczego?)

2.2. Uwaga

Nierówność Jensen’a w zastosowaniach probabilistycznych przyjmuje postać E(f(x))f(EX)\operatorname{E}(f(x)) \ge f(\operatorname{E}X). (Dlaczego?)


3. Twierdzenie#2

Niech x0,x1,,xn>0,y0,y1,,yn>0x_0, x_1, \dots, x_n > 0, \quad y_0, y_1, \dots, y_n > 0 przy czym i=0nxi=i=0nyi=1\sum_{i=0}^n x_i = \sum_{i=0}^n y_i = 1.
Wówczas i=0nxilog21xii=0nxilog21yi. \sum_{i=0}^n x_i \log_2 \frac{1}{x_i} \le \sum_{i=0}^n x_i \log_2 \frac{1}{y_i}.

3.1. D-d

i=0nlog21yii=0nxilog21xi=i=0nxi(log21yi+logxi)==i=0nyixiyilog2xiyi=() \sum_{i=0}^n \log_2 \frac{1}{y_i} - \sum_{i=0}^n x_i \log_2 \frac{1}{x_i} = \sum_{i=0}^n x_i \left( \log_2 \frac{1}{y_i} + \log x_i \right) =\\ = \sum_{i=0}^n y_i \cdot \frac{x_i}{y_i} \log_2 \frac{x_i}{y_i} = (*) z nierówności Jensen’a dla

mamy dalej: ()f(i=0nyuxiyi)=f(1)=1log2(1)=0 (*) \ge f\left( \sum_{i=0}^{n} y_u \frac{x_i}{y_i} \right) = f(1) = 1 \cdot \log_2(1) = 0

3.1.1. Uwaga

Można dopuścić >0>0 oraz 1=i=0nxii=0nyi1 = \sum_{i=0}^n x_i \ge \sum_{i=0}^n y_i.
Nawiasem mówiąc, jeśli xi>yi\sum x_i > \sum y_i to dostaniemy ostrą nierówność.


3.2. Wniosek (frukt z twierdzenia)

3.2.1. Ćwiczenie (było podobne)

Dla jakich pip_i mamy H(X)=log2NH(X) = \log_2 N.
Zastanowić się, kiedy nierówności są ostre!