17. Le funzioni W e V

Prerequisiti:

Nell’articolo precedente abbiamo visto che l’unica differenza tra l’enunciato della versione forte del Teorema di Chebyshev e quello del Teorema dei Numeri Primi, è che il primo non stabilisce l’esistenza del limite

\lim_{x \to \infty} \pi(x) / \frac{x}{\log x} \tag{1}

mentre il secondo sì. Non a caso, infatti, l’idea generale della dimostrazione del Teorema dei Numeri Primi consiste nel partire dalla dimostrazione del Teorema di Chebyshev (versione forte), riutilizzandone le parti salienti al fine di dimostrare la parte mancante, ossia l’esistenza del limite (1). Possiamo quindi vedere il Teorema di Chebyshev come una tappa intermedia, una fonte di ispirazione per arrivare al Teorema dei Numeri Primi.

Rileggendo l’articolo sulla versione forte del Teorema di Chebyshev, possiamo osservare che il passaggio chiave — quello che ci ha permesso di dire che il limite (1), se esiste, è 1 — è la seguente equazione:

\int_1^x \frac{\overline{\psi}(t)}{t^2} dt = \log x + O(1) \tag{2}

Questo sarà il nostro punto di partenza. Il nostro obiettivo sarà capire qualcosa in più sulla funzione \psi (e sulla sua estensione semplice \overline{\psi}), fino a dimostrare che

\psi(x) \sim x \tag{3}

Infatti, se dimostrassimo che \psi(x) è asintoticamente equivalente a x, potremmo arrivare al Teorema dei Numeri Primi in un solo passaggio, dato che, per il Corollario del Teorema N.5 (Equivalenza asintotica tra \pi(x) e \frac{\psi(x)}{\log x}), \pi(x) \sim \frac{\psi(x)}{\log x}, e dunque per transitività avremmo:

\pi(x) \sim \frac{\psi(x)}{\log x} \sim \frac{x}{\log x}

In realtà invece di dimostrare la (3) ne dimostreremo una versione più forte, in cui sia la funzione \psi(x) che la funzione x sono estese ai numeri reali:

\overline{\psi}(t) \sim t \tag{3'}

dove la funzione t rappresenta per i reali ciò che la funzione x rappresenta per gli interi, ossia la funzione identica.
La (3′) implica la (3), per cui, dimostrando la prima, risulta automaticamente dimostrata anche la seconda. Nel seguito dimostreremo la (3′), usando gli strumenti dell’analisi reale.

La (3′) implica la (3) per via di un principio generale: se due funzioni reali sono asintoticamente equivalenti, anche le rispettive restrizioni su un qualsiasi sottoinsieme di \mathbb{R} illimitato a destra sono asintoticamente equivalenti. In questo caso le due funzioni sono \overline{\psi}: [1, +\infty] \rightarrow \mathbb{R} e la funzione identica di \mathbb{R}; se esse sono asintoticamente equivalenti, allora lo sono anche le loro restrizioni su \mathbb{N}^{\star}, che è un sottoinsieme di \mathbb{R} illimitato a destra. Queste restrizioni sono rispettivamente \psi: \mathbb{N}^{\star} \rightarrow \mathbb{R} e la funzione identica di \mathbb{N}^{\star}. Il fatto che \mathbb{N}^{\star} sia un sottoinsieme di \mathbb{R} illimitato a destra, è un requisito indispensabile per poter calcolare il limite per x \to \infty, implicito nelle relazioni asintotiche (3) e (3′). In buona sostanza, quindi, nelle relazioni asintotiche non è importante quali punti x (interi) o t (reali) si considerano nel calcolo del limite; l’importante è che l’insieme di questi punti sia illimitato a destra, per consentire il calcolo del limite quando il valore della variabile (x o t che sia) tende a infinito.

Ora che abbiamo chiari il punto di partenza e l’obiettivo, possiamo cominciare con la dimostrazione vera e propria. Sarà lunga e complessa, ma cercheremo di evidenziare i passaggi chiave, per non perdere il filo del discorso. Per ora dobbiamo ricordare le formule (2) e (3′) che sono rispettivamente quella iniziale e quella finale; nei prossimi articoli vedremo quali altre formule importanti ci sono nel mezzo.

Il primo passaggio della dimostrazione, oggetto di questo articolo, è un artificio tecnico: si tratta di riscrivere la (2) in una forma più semplice, eliminando il quadrato al denominatore ed il logaritmo. Mediante opportuni passaggi si può infatti arrivare alla forma seguente:

\int_0^{\log x} \frac{\overline{\psi}(e^u) - e^u}{e^u} du = O(1) \tag{4}

Partendo dalla formula (2), per prima cosa osserviamo che \log x = \int_1^x \frac{1}{t} dt; infatti, svolgendo questo integrale, si ottiene che \int_1^x \frac{1}{t} dt = [\log t]_1^x = \log x - \log 1 = \log x - 0 = \log x. Riscrivendo il logaritmo in questo modo ed utilizzando le proprietà della somma algebrica degli integrali, si ottiene:

\begin{aligned} \int_1^x \frac{\overline{\psi}(t)}{t^2} dt = \log x + O(1) & \Rightarrow \\ \int_1^x \frac{\overline{\psi}(t)}{t^2} dt = \int_1^x \frac{1}{t} dt + O(1) & \Rightarrow \\ \int_1^x \frac{\overline{\psi}(t)}{t^2} - \frac{1}{t} dt = O(1) & \Rightarrow \\ \int_1^x \left ( \frac{\overline{\psi}(t) - t}{t} \right ) \frac{1}{t} dt = O(1) & \end{aligned}

A questo punto, per eliminare il fattore \frac{1}{t} all’interno dell’integrale, è possibile utilizzare la sostituzione t := e^u, da cui dt = e^u du. Per effetto di questa sostituzione, gli estremi di integrazione cambiano, in quanto, se t = 1, allora e^u = 1, e quindi u = 0, che diventa così il nuovo estremo inferiore; analogamente, se t = x allora e^u = x e quindi u = \log x, che diventa il nuovo estremo superiore. Con queste sostituzioni, si ottiene la formula (4):

\begin{aligned} \int_1^x \left ( \frac{\overline{\psi}(t) - t}{t} \right ) \frac{1}{t} dt = O(1) & \Rightarrow \\ \int_0^{\log x} \left ( \frac{\overline{\psi}(e^u) - e^u}{e^u} \right ) \frac{1}{e^u} e^u du = O(1) & \Rightarrow \\ \int_0^{\log x} \frac{\overline{\psi}(e^u) - e^u}{e^u} = O(1) & \end{aligned}

La funzione integranda ha una struttura molto semplice, essendo esprimibile come composizione della funzione \frac{\overline{\psi}(t) - t}{t}, con la funzione esponenziale t = e^u. D’ora in poi chiameremo la funzione integranda V(u) e la sua prima funzione componente W(t):

Funzioni W e V

Si definiscono le seguenti funzioni da (0, +\infty) in \mathbb{R}:

\begin{aligned} W(t) := & \frac{\overline{\psi}(t) - t}{t} \\ V(u) := & W(t) \circ e^u = \frac{\overline{\psi}(e^u) - e^u}{e^u} \end{aligned}

I grafici delle funzioni W e V sono mostrati rispettivamente nelle Figure 1 e 2.

Figura 1: Grafico della funzione W. I punti rossi rappresentano i valori della funzione per valori interi della variabile t
Figura 2: Grafico della funzione V. I punti rossi rappresentano i valori della funzione per valori interi della variabile u

Nella parte finale della dimostrazione studieremo questi grafici in modo approfondito; per il momento invece ci limitiamo ad osservare due semplici cose:

  • Il grafico della funzione W presenta delle discontinuità in corrispondenza degli interi per i quali la funzione \overline{\psi}(t) cambia valore. Ad esempio, per t=1, \ldots, 6 si ha che \overline{\psi}(t) = \psi(t) = \log 1, \log 2, \log 6, \log 12, \log 60, \log 60, dunque \overline{\psi}(t) cambia valore nel passaggio da 1 a 2, da 2 a 3, da 3 a 4, da 4 a 5, ma resta costante passando da 5 a 6. Nel grafico (Figura 1), questo è evidenziato dal fatto che vi sono discontinuità nei punti 2, 3, 4, e 5, ma non nel punto 6. Infatti i punti 5 e 6 si trovano graficamente su uno stesso tratto di linea continua.
  • Il grafico della funzione V tra due interi n ed n + 1 riproduce il grafico della funzione W tra e^n ed e^{n + 1}. La Figura 3 fa vedere questo per n = 1.
Figura 3: Confronto tra i grafici delle funzioni W e V. La porzione del grafico di V compresa tra u = 1 ed u = 2 corrisponde alla porzione di grafico della funzione W compresa tra t = e e t = e2.

La Definizione N.13 consente di riscrivere la (4) come:

\int_0^{\log x} V(u) \ du = O(1) \tag{4'}

Ora analizziamo più a fondo le funzioni W e V.

La funzione W calcola un errore relativo. Infatti il numeratore \overline{\psi}(t) - t esprime la differenza tra la quantità \overline{\psi}(t) che dobbiamo stimare e la stima asintotica t che vogliamo ottenere, per la (3′). La funzione W esprime questa differenza non in assoluto, ma relativamente al valore della t. Questo è un principio generale di quando si calcola un errore relativo: ad esempio, una cosa è sbagliare di un’unità su un migliaio, un’altra cosa è sbagliare di un’unità su un milione, dato che l’errore relativo è di un millesimo nel primo caso, mentre è di un milionesimo nel secondo.
L’errore relativo è quindi una funzione che indica in modo abbastanza intuitivo la somiglianza tra due valori, in questo caso \overline{\psi}(t) e t. Per la (3′), dobbiamo dimostrare che c’è una certa somiglianza tra queste due funzioni (ossia che c’è equivalenza asintotica) e quindi, intuitivamente, possiamo aspettarci che l’errore relativo W(t) = \frac{\overline{\psi}(t) - t}{t} tenda a zero. In effetti, le due cose sono equivalenti:

\begin{aligned} \overline{\psi}(t) \sim t & \Leftrightarrow \\ \lim_{t \to \infty} \frac{\overline{\psi}(t)}{t} = 1 & \Leftrightarrow \\ \lim_{t \to \infty} \frac{\overline{\psi}(t)}{t} - 1 = 0 & \Leftrightarrow \\ \lim_{t \to \infty} \frac{\overline{\psi}(t) - t}{t} = 0 & \Leftrightarrow \\ \lim_{t \to \infty} W(t) = 0 \end{aligned}

Quindi abbiamo ulteriormente riformulato il nostro obiettivo, che dalla formula (3′) può essere riscritto equivalentemente come:

\lim_{t \to \infty} W(t) = 0 \tag{3''}

Ma possiamo fare ancora un passo ulteriore, considerando la funzione V ed osservando che:

\lim_{t \to \infty} W(t) = 0 \Leftrightarrow \lim_{u \to \infty} V(u) = 0

Se W(t) tende a zero per t che tende a infinito, come valori di t possiamo considerare in particolare quelli del tipo t = e^u con u che tende a sua volta ad infinito. Infatti, se t \to \infty allora anche u = \log t \to \infty, perché la funzione \log t è crescente rispetto a t. Quindi, dato che il limite di una funzione non dipende dai particolari valori scelti per la variabile (purché essi tendano ad infinito), essendo V(u) = W(e^u) = W(t) ed avendo dimostrato che t ed u tendono entrambi ad infinito, se \lim_{t \to \infty} W(t) = 0 deve essere anche \lim_{u \to \infty} V(u) = 0.
Viceversa, se V(u) \to 0 per u \to \infty, possiamo porre t := e^u, da cui u = \log t e quindi V(u) = W(e^{\log t}) = W(t). Ora, se u \to \infty, anche t = e^u \to \infty, perché la funzione e^t è crescente rispetto a t. Quindi, ragionando come prima, essendo W(t) = V(u) e poiché t ed u tendono entrambi ad infinito, se \lim_{u \to \infty} V(u) = 0 deve essere anche \lim_{t \to \infty} W(t) = 0.

Otteniamo così un’ulteriore riformulazione del nostro obiettivo:

\lim_{u \to \infty} V(u) = 0 \tag{3'''}

Ricapitolando, abbiamo la seguente catena di implicazioni (che sono in realtà delle doppie implicazioni) che ci portano verso il Teorema dei Numeri Primi:

\lim_{u \to \infty} V(u) = 0 \Rightarrow \lim_{t \to \infty} W(t) = 0 \Rightarrow \overline{\psi}(t) \sim t \Rightarrow \psi(x) \sim x

Abbiamo così ricondotto la dimostrazione del Teorema dei Numeri Primi al problema di dimostrare che \lim_{u \to \infty} V(u) = 0. Attenzione, perché in questa scrittura è sottinteso che il limite esiste, oltre a essere 0; l’esistenza del limite è sempre parte della tesi da dimostrare. Come dimostrare dunque che il limite di una funzione esiste ed è 0?
Il metodo più immediato è applicare la Proposizione A.2 (Ogni successione reale avente \lim \inf e \lim \sup uguali ammette limite), applicabile anche alle funzioni. Nel nostro caso:

\lim \sup V(u) = \lim \inf V(u) = 0 \Rightarrow \lim_{u \to \infty} V(u) = 0 \tag{5}

Cioè, per dimostrare che il limite di V esiste ed è 0, bisognerebbe dimostrare che il limite superiore ed il limite inferiore della funzione sono anch’essi pari a zero. Il vantaggio di questa tecnica è che il limite superiore ed il limite inferiore, a differenza del limite, per definizione esistono sempre; vanno solo calcolati. Quindi la (5) permette di stabilire il valore numerico e l’esistenza di un solo oggetto (il limite della funzione V) sulla base del valore numerico di due oggetti distinti (il suo limite superiore ed inferiore), dei quali però non dobbiamo preoccuparci dell’esistenza. Tutto sommato è una buona semplificazione. Lo svantaggio è che ora abbiamo due equazioni che bisognerebbe dimostrare separatamente: \lim \sup V(u) = 0 e \lim \inf V(u) = 0. In linea di principio, dimostrata una delle due, bisognerebbe ricominciare tutta la dimostrazione da capo per dimostrare anche l’altra. Anche qui, però, è possibile semplificare, riunendo le due equazioni in una sola. Infatti, si dimostra che:

\lim \sup V(u) = \lim \inf V(u) = 0 \Leftrightarrow \lim \sup |V(u)| = 0 \tag{6}

Cominciamo a dimostrare l’implicazione verso destra: \lim \sup V(u) = \lim \inf V(u) = 0 \Rightarrow \lim \sup |V(u)| = 0.
Riprendendo la formula (5), abbiamo che, se \lim \sup V(u) = \lim \inf V(u) = 0, allora la funzione V tende a zero. Ma se V tende a zero, anche la sua opposta -V tende a zero (per definizione di limite, oppure perché \lim -V = -\lim V = -0 = 0), quindi anche il suo valore assoluto tende a zero, per il cosiddetto “Teorema dei carabinieri“, essendo sempre -V(u) \leq |V(u)| \leq V(u). In sintesi, 0 = \lim V(u) = \lim -V(u) = \lim |V(u)|. Ma se \lim |V(u)| = 0, allora, per la già citata Proposizione A.2, \lim \sup |V(u)| = \lim \inf |V(u)| = 0; in particolare \lim \sup |V(u)| = 0, che è ciò che volevamo dimostrare.

Viceversa, se \lim \sup |V(u)| = 0, essendo sempre V(u) \leq |V(u)|, per definizione di limite superiore (e come è anche facile intuire), si ha che \lim \sup V(u) \leq \lim \sup |V(u)|, per cui:

\lim \sup V(u) \leq 0 \tag{7}

Possiamo osservare che, essendo |V(u)| = |-V(u)|, possiamo sostituire -V al posto di V in tutti i passaggi precedenti, fino alla fomula (7), ottenendo:

\lim \sup -V(u) \leq 0 \tag{7'}

Ora possiamo sfruttare una proprietà generale che lega il limite superiore e quello inferiore, che nel nostro caso si traduce nell’uguaglianza \lim \sup -V(u) = -\lim \inf V(u), da cui, per la (7′), -\lim \inf V(u) \leq 0, ossia:

\lim \inf V(u) \geq 0 \tag{8}

Mettendo insieme la (7) e la (8), si ottiene che \lim \sup V(u) \leq 0 \leq \lim \inf V(u), dunque \lim \sup V(u) \leq \lim \inf V(u). Ma sappiamo che in generale vale sempre la relazione inversa, ossia che \lim \inf V(u) \leq \lim \sup V(u); per cui in questo caso, essendo vere entrambe le relazioni, si deve avere che \lim \inf V(u) = \lim \sup V(u). Inoltre, sempre per la (7) e per la (8), possiamo estendere questa disuguaglianza, ottenendo 0 \leq \lim \inf V(u) = \lim \sup V(u) \leq 0, e quindi \lim \inf V(u) = \lim \sup V(u) = 0, che è quello che dovevamo dimostrare.

Quindi, a patto di introdurre il valore assoluto, è possibile tornare ad una sola equazione, come quando avevamo il limite, mantenendo tuttavia il vantaggio del \lim \sup, che è quello di esistere sempre. Certo, il valore assoluto non è un oggetto così facile da trattare, ma potremo sviluppare gran parte della dimostrazione senza di esso, per poi aggiungerlo solo quando necessario.

A questo punto, dato che abbiamo fatto vari passi all’indietro per ottenere formule via via più semplici, è utile fermarsi un attimo per ricapitolare il tutto, ripercorrendo in avanti i passaggi. Per quanto riguarda il nostro obiettivo, per arrivare alla formula del Teorema dei Numeri Primi abbiamo percorso la seguente catena di implicazioni (alcune delle quali sono doppie implicazioni, ma ciò non ha importanza ai fini della dimostrazione):

\begin{aligned} \lim \sup |V(u)| = 0 & \Rightarrow \text{[per la (6)]} \\ \lim \sup V(u) = \lim \inf V(u) = 0 & \Rightarrow \text{[per la \href{/liminf-limsup-successione/#prop-liminf-limsup-uguali}{Proposizione A.2}]} \\ \lim_{u \to \infty} V(u) = 0 & \Rightarrow \text{[per la Definizione N.13]} \\ \lim_{t \to \infty} W(t) = 0 & \Rightarrow \text{[per la Definizione N.13]} \\ \lim_{t \to \infty} \frac{\overline{\psi}(t) - t}{t} = 0 & \Rightarrow \text{[facendo i calcoli]} \\ \overline{\psi}(t) \sim t & \Rightarrow \text{[dimostrazione vista nel dettaglio]} \\ \psi(x) \sim x & \Rightarrow \text{[per il \href{/teorema-chebyshev/#equivalenza-asintotica-pi-e-psi}{Corollario del Teorema N.5}]} \\ \pi(x) \sim \frac{x}{\log x} & \text{[Teorema dei Numeri Primi]} \end{aligned}

Questa catena di implicazioni dimostra il seguente Lemma, in base al quale nei prossimi articoli potremo dimenticarci dei passaggi di cui sopra e concentrarci sulla dimostrazione della formula \lim \sup |V(u)| = 0:

Condizione sufficiente per la validità del Teorema dei Numeri Primi

Una condizione sufficiente per la validità del Teorema dei Numeri Primi è la seguente:

\lim \sup |V(u)| = 0

dove la funzione V è definita nella Definizione N.13.

Anche il nostro punto di partenza è stato oggetto di alcuni passaggi a ritroso, che ci hanno permesso di introdurre la funzione V e si possono riassumere come segue:

\begin{aligned}\int_0^{\log x} V(u) du = O(1) & \Rightarrow \text{[per la Definizione N.13]} \\ \int_0^{\log x} \frac{\overline{\psi}(e^u) - e^u}{e^u} du = O(1) & \Rightarrow \text{[dettaglio visto prima]} \\ \int_1^x \frac{\overline{\psi}(t)}{t^2} dt = \log x + O(1) \end{aligned}

Quindi, sostanzialmente, se dimostrassimo l’implicazione:

\int_0^{\log x} V(u) du = O(1) \Rightarrow \lim \sup |V(u)| = 0 \tag{9}

avremmo dimostrato il Teorema dei Numeri Primi. Infatti, i passaggi precedenti e la formula (2) dimostrano la parte sinistra, mentre il Lemma N.7 garantisce la sufficienza della parte destra; ciò che manca è dimostrare l’implicazione.
Nel prossimo articolo vedremo come, partendo dalla (9), sia possibile impostare il seguito della dimostrazione.

Lascia un commento

Il tuo indirizzo email non sarà pubblicato.