Perché gli approcci algoritmici non funzionano bene nella teoria dei crivelli? (parte II)

Prerequisiti:

Nell’articolo precedente abbiamo calcolato la funzione di crivello del crivello di Eratostene partendo dall’algoritmo, ottenendo una formula con un numero di termini che cresce in modo esponenziale rispetto al numero di primi utilizzati, perciò troppo complessa per poter essere utilizzata in pratica. Però in fin dei conti non è necessario calcolare esattamente una funzione di crivello: per poterla studiare (ad esempio per capirne l’andamento asintotico) sarebbe sufficiente trovare una buona approssimazione. Se quindi ci accontentassimo di approssimare la funzione di crivello, nel caso del crivello di Eratostene, otterremmo una formula meno complicata? Quanto sarebbe buona l’approssimazione? In questo articolo risponderemo a queste domande.

Dall’algoritmo del crivello di Eratostene al calcolo della corrispondente funzione di crivello: un approccio euristico

Come nell’articolo precedente, dato un intero N \gt 1, partiamo dall’insieme A := \{1, 2, 3, \ldots, N\} e supponiamo di eseguire l’algoritmo del crivello di Eratostene, nella versione che cancella tutti i multipli di un primo p, compreso p stesso.
Abbiamo visto che nel primo passaggio, cioè quando l’algoritmo elimina i multipli di 2, nell’insieme A restano esattamente N - \left\lfloor \frac{N}{2} \right\rfloor elementi. Per approssimare questa funzione ottenendone una più semplice, l’idea potrebbe essere quella di eliminare la parte intera, ottenendo la formula N - \frac{N}{2}. Così facendo, commetteremmo un errore di \frac{1}{2} al massimo, essendo \frac{1}{2} la massima differenza possibile tra \left\lfloor \frac{N}{2} \right\rfloor e \frac{N}{2}, che si ottiene nel caso di N dispari (se N è pari non c’è alcuna differenza).
Continuando l’algoritmo, cioè eliminando anche i multipli di 3, abbiamo visto che la formula esatta si complica, perché bisogna tener conto del fatto che alcuni multipli di 3 sono già stati eliminati in precedenza perché sono multipli anche di 2. In particolare, abbiamo visto che il numero di elementi rimasti in A dopo l’eliminazione dei multipli di 2 e di 3 è N - \left\lfloor \frac{N}{2} \right\rfloor - \left\lfloor \frac{N}{3} \right\rfloor + \left\lfloor \frac{N}{6} \right\rfloor. Rimuovendo le parti intere anche in questo caso, otteniamo la formula N - \frac{N}{2} - \frac{N}{3} + \frac{N}{6}. Proviamo a semplificare:

N - \frac{N}{2} - \frac{N}{3} + \frac{N}{6} = \frac{6N - 3N - 2N + N}{6} = \frac{2N}{6} = \frac{N}{3}

Ora eliminiamo anche i multipli di 5. La formula esatta che calcola quanti numeri rimangono è:

N - \left\lfloor \frac{N}{2} \right\rfloor - \left\lfloor \frac{N}{3} \right\rfloor - \left\lfloor \frac{N}{5} \right\rfloor + \left\lfloor \frac{N}{6} \right\rfloor + \left\lfloor \frac{N}{10} \right\rfloor + \left\lfloor \frac{N}{15} \right\rfloor - \left\lfloor \frac{N}{30} \right\rfloor

Con la stessa tecnica di prima, otteniamo la seguente formula approssimata:

\begin{aligned} N - \frac{N}{2} - \frac{N}{3} - \frac{N}{5} + \frac{N}{6} + \frac{N}{10} + \frac{N}{15} - \frac{N}{30} &= \\ \frac{30N - 15N - 10N - 6N + 5N + 3N + 2N - N}{30} &= \\ \frac{8N}{30} &= \\ \frac{4N}{15} \end{aligned} \tag{1}

Che cosa accomuna le formule approssimate \frac{N}{2}, \frac{N}{3} e \frac{4N}{15}? La questione diventa più chiara se le scriviamo diversamente:

\begin{aligned} N - \frac{N}{2} &= \\ N \left( 1 - \frac{1}{2} \right) \end{aligned} \tag{2}
\begin{aligned} N - \frac{N}{2} - \frac{N}{3} + \frac{N}{6} &= \\ N \left( 1 - \frac{1}{2} \right) - \frac{N}{3} \left( 1 - \frac{1}{2} \right) &= \\ N \left( 1 - \frac{1}{2} \right)\left( 1 - \frac{1}{3} \right) \end{aligned} \tag{3}
\begin{aligned} N - \frac{N}{2} - \frac{N}{3} - \frac{N}{5} + \frac{N}{6} + \frac{N}{10} + \frac{N}{15} - \frac{N}{30} &= \\ \left(N - \frac{N}{2} - \frac{N}{3} + \frac{N}{6}\right) - \frac{1}{5} \left(N - \frac{N}{2} - \frac{N}{3} + \frac{N}{6}\right) &= \text{[per la (3)]} \\ N \left( 1 - \frac{1}{2} \right)\left( 1 - \frac{1}{3} \right) - \frac{1}{5} N \left( 1 - \frac{1}{2} \right)\left( 1 - \frac{1}{3} \right) &= \\ N \left( 1 - \frac{1}{2} \right)\left( 1 - \frac{1}{3} \right)\left( 1 - \frac{1}{5} \right) \end{aligned} \tag{4}

Quindi, per esempio, la frazione \frac{4}{15} della (1) è data da \left( 1 - \frac{1}{2} \right)\left( 1 - \frac{1}{3} \right)\left( 1 - \frac{1}{5} \right) = \frac{1}{2}\frac{2}{3}\frac{4}{5} = \frac{4}{15}.

Possiamo interpretare le formule (2), (3) e (4) come segue:

  • Nel primo passo, per la formula (2), eliminiamo dall’insieme all’incirca \frac{1}{2} degli elementi (i multipli di 2).
  • Nel secondo passo, per la formula (3), eliminiamo dall’insieme all’incirca \frac{1}{3} degli elementi rimasti dopo il primo passo. Infatti la formula (3) si ottiene dalla (2) moltiplicando per 1 - \frac{1}{3}, che significa togliere \frac{1}{3} rispetto alla quantità precedente.
  • Nel terzo passo, per la formula (4), eliminiamo dall’insieme all’incirca \frac{1}{5} degli elementi rimasti dopo il secondo passo (che corrisponde a moltiplicare per 1 - \frac{1}{5}).

Ma \frac{1}{2}, \frac{1}{3} e \frac{1}{5} non sono altro che le frequenze approssimate rispettivamente dei multipli di 2, dei multipli di 3 e dei multipli di 5 nell’insieme A iniziale. Infatti, se da A togliessimo i multipli di 3 senza aver prima tolto i multipli di 2, toglieremmo \left\lfloor \frac{N}{3} \right\rfloor elementi, quindi circa \frac{1}{3} del totale N. Analogamente, se da A togliessimo i multipli di 5 senza aver prima tolto i multipli di 2 e di 3, toglieremmo \left\lfloor \frac{N}{5} \right\rfloor elementi, quindi circa \frac{1}{5} del totale. Quindi, se le formule (2), (3) e (4) fossero delle buone approssimazioni delle corrispondenti formule esatte, significherebbe che: la frazione di elementi eliminati in ciascun passaggio del crivello di Eratostene, quando si eliminano i multipli di p, è circa uguale alla frazione di multipli di p calcolata sull’insieme iniziale. In altri termini, i multipli di 3 eliminati sarebbero all’incirca \frac{1}{3} dei numeri non divisibili per 2; i multipli di 5 eliminati sarebbero all’incirca \frac{1}{5} dei numeri non divisibili né per 2 né per 3, e così via.

Ora immaginiamo di applicare quest’approssimazione in tutti i passi del crivello di Eratostene, ossia per tutti i numeri primi da 2 al più grande numero primo minore o uguale di \sqrt{N}. Otterremmo la seguente approssimazione della funzione di crivello:

S(A, \mathbb{P}, \sqrt{N}) \approxeq N \prod_{p \leq \sqrt{N}} \left( 1 - \frac{1}{p} \right) \tag{5}

Ma quanto è buona quest’approssimazione?
Possiamo capirlo partendo dai dati numerici. La seguente Figura mostra il grafico di S(A, \mathbb{P}, \sqrt{N}) sovrapposto a quello di N \prod_{p \leq \sqrt{N}} \left( 1 - \frac{1}{p} \right) fino a N = 10.000 (i due grafici sembrano linee continue ma in realtà sono costituiti da una successione di punti, uno per ogni N). La sovrapposizione è evidente:

Confronto tra la funzione di crivello di Eratostene e una sua semplice approssimazione

Quindi, almeno fino a 10000, l’approssimazione (5) è quasi perfetta. In realtà, però, la formula (5) ha due grossi problemi:

  • È difficile stimare l’errore;
  • Dal punto di vista asintotico, la stima non è corretta.

Analizziamo i due punti nel dettaglio.

Stima dell’errore

Per l’identità di Legendre, sappiamo che il numero di elementi rimasti in A dopo aver applicato il crivello di Eratostene è dato dalla formula:

S(A, \mathbb{P}, \sqrt{N}) = \sum_{d \mid P(\sqrt{N+1})} \mu(d) \left\lfloor \frac{N}{d} \right\rfloor \tag{6}

A seconda del valore di N (più precisamente, a seconda di quanti sono i primi minori o uguali di \sqrt{N}), sappiamo che da questa formula generale si ottengono quelle specifiche che abbiamo utilizzato come esempi nel paragrafo precedente: N - \left\lfloor \frac{N}{2} \right\rfloor, N - \left\lfloor \frac{N}{2} \right\rfloor - \left\lfloor \frac{N}{3} \right\rfloor + \left\lfloor \frac{N}{6} \right\rfloor, e così via. La nostra approssimazione consisteva nel togliere le parti intere, quindi, in termini generali, la formula approssimata è la seguente:

S(A, \mathbb{P}, \sqrt{N}) \approxeq \sum_{d \mid P(\sqrt{N+1})} \mu(d) \frac{N}{d} \tag{6'}

Infatti l’espressione a destra di questa formula è la generalizzazione del primo rigo delle formule (2), (3) e (4), ossia la semplice somma dei termini della formula generale del crivello di Eratostene senza le parti intere. Nelle formule (2), (3) e (4) però non ci siamo fermati qui ma, dopo aver opportunamente raggruppato i termini e messo in evidenza, nell’ultimo rigo abbiamo troviamo dei prodotti di termini, che abbiamo poi generalizzato con l’espressione a destra della formula (5). Le formule (6′) e (5) sono quindi equivalenti: l’uguaglianza delle loro espressioni a destra è una generalizzazione dei passaggi presenti nelle formule (2), (3) e (4).
Equivalenze di questo tipo, tra formule con sommatorie e formule con produttorie, sono abbastanza frequenti in teoria dei numeri, per cui riteniamo utile proporre una dimostrazione più formale dell’equivalenza tra la (6′) e la (5), impiegando una tecnica utilizzabile in generale:

Due modi per esprimere la formula generale del crivello di Eratostene senza le parti intere

Per ogni intero N \gt 1:

\sum_{d \mid P(\sqrt{N+1})} \mu(d) \frac{N}{d} = N \prod_{p \leq \sqrt{N}} \left( 1 - \frac{1}{p} \right) \tag{7}

dove P(\sqrt{N+1}) indica il prodotto dei numeri primi minori di \sqrt{N+1}.

Questa proprietà si può dimostrare per induzione, ma preferiamo proporre una dimostrazione più intuitiva. Dimostreremo che tutti i termini che compaiono a destra dell’uguaglianza compaiono anche a sinistra, e viceversa; questo approccio è corretto perché il numero di termini è finito da entrambe le parti.

Consideriamo un termine dell’espressione di sinistra. Esso sarà del tipo \mu(d) \frac{N}{d}, dove d è il prodotto di zero o più numeri primi distinti, tutti minori di \sqrt{N+1}, quindi minori o uguali di \sqrt{N}.
Se d è il prodotto di zero numeri primi, cioè se d = 1, allora \mu(d) \frac{N}{d} = \mu(1) \cdot N = N. Questo termine lo troviamo anche a destra, essendo N = N \prod_{p \leq \sqrt{N}} 1 (abbiamo moltiplicato tra loro i primi termini, pari a 1, di ciascun binomio della produttoria).
Supponiamo ora che d sia il prodotto di h \geq 1 numeri primi, ossia d = \prod_{i=1}^h q_i. Ora confrontiamo gli h numeri primi che costituiscono la fattorizzazione di d con l’insieme di tutti i numeri primi minori o uguali di \sqrt{N}. Sia P l’insieme dei numeri primi minori o uguali di \sqrt{N} che non coincidono con nessun q_i:

P := \{p \mid p \leq \sqrt{N}\} \setminus \{q_1, \ldots, q_k\}

Allora chiaramente:

d = \prod_{i=1}^h q_i \cdot \prod_{p \in P} 1

Infatti rispetto alla precedente formula per d stiamo solamente moltiplicando varie volte per 1, una volta per ogni fattore primo mancante nella fattorizzazione di d. Ora però il numero di fattori è uguale al numero di primi minori o uguali di \sqrt{N}, perché ciascuno di essi o coincide con un q_i, quindi è considerato nella prima produttoria, o appartiene a P, quindi è considerato nella seconda.
Facendo il reciproco, abbiamo:

\frac{1}{d} = \prod_{i=1}^h \frac{1}{q_i} \cdot \prod_{p \in P} 1

Ora consideriamo il prodotto \mu(d) \frac{1}{d}. Essendo h il numero di fattori primi di d, \mu(d) è uguale a 1 se h è pari e a -1 se h è dispari. Un altro modo per calcolare questo numero è moltiplicare -1 per se stesso h volte; infatti così facendo otterremo 1 ogni due moltiplicazioni e alla fine avanzerà un -1 se h è dispari (ad esempio, se h = 5: \prod_{i=1}^5 (-1) = (-1) \cdot (-1) \cdot (-1) \cdot (-1) \cdot (-1) = \left((-1) \cdot (-1)\right) \cdot \left((-1) \cdot (-1)\right) \cdot (-1) = 1 \cdot 1 \cdot -1 = -1). Quindi \mu(d) = \prod_{i=1}^h (-1). Sostituendo nella formula precedente, si ottiene:

\begin{aligned} \mu(d) \frac{1}{d} & = \\ \mu(d) \prod_{i=1}^h \frac{1}{q_i} \cdot \prod_{p \in P} 1 & = \\ \prod_{i=1}^h (-1) \prod_{i=1}^h \frac{1}{q_i} \cdot \prod_{p \in P} 1 & = \\ \prod_{i=1}^h \left(- \frac{1}{q_i}\right) \cdot \prod_{p \in P} 1 \end{aligned}

Quindi:

\mu(d) \frac{N}{d} = N \cdot \prod_{i=1}^h \left(- \frac{1}{q_i}\right) \cdot \prod_{p \in P} 1 \tag{a}

Ma questo, a meno dell’ordine dei fattori, non è altro che un termine dell’espressione di destra. Infatti, dopo aver sviluppato la produttoria \prod_{p \leq \sqrt{N}} \left( 1 - \frac{1}{p} \right), si otterrà una somma di termini dove ciascuno di essi è un prodotto di fattori, uno per ogni primo p \leq \sqrt{N}, ciascuno uguale o a 1 oppure a - \frac{1}{p}. Ad esempio, per N = 9:

\begin{aligned} \prod_{p \leq \sqrt{9}} \left( 1 - \frac{1}{p} \right) &= \\ \left( 1 - \frac{1}{2} \right)\left( 1 - \frac{1}{3} \right) &= \\ 1 \cdot 1 + 1 \cdot \left(- \frac{1}{3} \right) + \left(- \frac{1}{2} \right) \cdot 1 + \left(- \frac{1}{2} \right) \cdot \left(- \frac{1}{3} \right) \end{aligned} \tag{b}

Tornando alla formula (a), essendo ogni primo p \leq \sqrt{N} per costruzione o coincidente con un q_i o appartenente a P, l’espressione \prod_{i=1}^h \left(- \frac{1}{q_i}\right) \cdot \prod_{p \in P} 1 rappresenta un prodotto di fattori, uno per ogni primo p \leq \sqrt{N}, ciascuno pari a 1 oppure - \frac{1}{p}. Ciò che cambia rispetto allo sviluppo della parte destra della (7) è l’ordine dei fattori, perché nella (a) abbiamo scritto prima tutti i termini coi reciproci dei fattori di d, mentre ciascun termine della parte destra della (7) utilizza l’ordine della produttoria, che è l’ordine crescente dei numeri primi. Ad esempio, se N = 9 e d = 3, essendo 3 = q_1 l’unico fattore primo di d, nella parte sinistra della (7) avremo il termine: \prod_{i=1}^h \left(- \frac{1}{q_i}\right) \cdot \prod_{p \in P} 1 = \left(- \frac{1}{3}\right) \cdot 1, mentre il corrispondente termine di destra sarà 1 \cdot \left(- \frac{1}{3} \right), il secondo della (b). Naturalmente per la proprietà commutativa questo non è un problema.
Infine, è evidente che il fattore N compare, nella (7), sia da una parte che dall’altra, quindi tutti i termini di sinistra contengono il fattore N così come tutti quelli di destra. Questo completa la prima parte della dimostrazione.

Resta da dimostrare che ciascun termine della parte destra della (7) compare anche a sinistra. Il ragionamento potrebbe essere l’opposto del precedente, però possiamo evitarlo partendo dalle seguenti considerazioni:

  1. La parte sinistra ha 2^k termini, dove k è il numero di primi minori o uguali di \sqrt{N}, per la Proprietà C.3.
  2. Per ogni d della sommatoria di sinistra, il corrispondente termine \mu(d) \frac{N}{d} è diverso da quelli ottenuti con gli altri d, per cui i termini a sinistra sono tutti diversi tra loro. Questo è abbastanza evidente: essendo N costante, ogni d diverso genera un valore di \frac{N}{d} diverso. Inoltre, se d e d^{\prime} sono due divisori diversi di P(\sqrt{N + 1}), essendo \frac{N}{d} e \frac{N}{d^{\prime}} diversi, lo sono anche \mu(d) \frac{N}{d} e \mu(d^{\prime}) \frac{N}{d^{\prime}}, perché la moltiplicazione per un valore della funzione \mu altera il segno ma non il valore assoluto, e i valori assoluti di \frac{N}{d} e \frac{N}{d^{\prime}} sono diversi.
  3. Anche la parte destra ha 2^k termini, perché si ha il prodotto di k binomi per una costante.

Per i primi due punti, nella sommatoria di sinistra abbiamo 2^k termini tutti diversi tra loro, ciascuno dei quali, come abbiamo dimostrato prima, si trova anche nella parte destra (nel senso che il valore numerico è lo stesso, anche se il termine risulterebbe scritto diversamente se si espandesse la produttoria). Quindi anche la parte destra ha 2^k termini tutti diversi tra loro. Ma, per il terzo punto, la parte destra ha 2^k termini in totale, quindi non è possibile che essa contenga un termine ulteriore che non è presente nella parte sinistra. Ciò completa la dimostrazione.

L’equivalenza tra la (6′) e la (5) è importante perché ciascuna delle due formule dà informazioni diverse. La (5) è importante perché, come abbiamo visto nel paragrafo precedente, si presta a un’interpretazione intuitiva; d’altra parte la (6′) si presta meglio alla stima dell’errore, in quanto è strutturalmente identica alla (6), che per l’identità di Legendre fornisce il valore esatto da approssimare.

Ora proviamo a rispondere a un’ulteriore domanda: quale errore assoluto si può commettere al massimo con la formula (6′), rispetto alla (6)?
Ricordiamo che la formula (6), per la Proprietà C.3, ha 2^k termini, dove k è il numero di primi minori o uguali di \sqrt{N}. È facile dimostrare che, di questi 2^k termini, la metà (quindi 2^{k-1}) sono positivi e l’altra metà sono negativi. Chiaramente la stessa proprietà vale per la formula (6′), che ha la stessa struttura della (6).

Perché i termini della (6) sono per metà positivi e per metà negativi?

Questa semplice proprietà può essere dimostrata in diversi modi elementari, ad esempio col principio di induzione o costruendo una corrispondenza biunivoca tra i termini positivi e quelli negativi. A scopo didattico proponiamo però una dimostrazione basata sulle proprietà della funzione \mu.
Si tratta di dimostrare che, tra i divisori d di P(\sqrt{N+1}), metà hanno \mu(d) positivo (quindi pari a 1, che è l’unico valore positivo della funzione \mu) e metà hanno \mu(d) negativo (quindi pari a -1). Ricordiamo che in questo caso \mu(d) è sempre diverso da zero perché P(\sqrt{N+1}) è il prodotto di fattori primi distinti, quindi lo è anche d.
Per la Proprietà N.8 (seconda forma), abbiamo che \sum_{d \mid P(\sqrt{N+1})} \mu(d) = 0. Ma nel nostro caso \mu(d) può assumere solo i valori 1 e -1, dunque se la somma di tutti i \mu(d) è zero vuol dire che il numero di 1 e il numero di -1 è lo stesso (se fossero di più gli 1, la somma sarebbe positiva; se fossero di più i -1 sarebbe negativa). Dunque il numero di termini positivi è uguale al numero di termini negativi, ossia entrambi sono uguali alla metà del totale.

Osserviamo infine, per chi ha seguito il nostro percorso sul Teorema dei numeri primi, che la proprietà che abbiamo dimostrato è una diretta conseguenza della Proprietà N.8, secondo cui, dato un numero naturale positivo, tra i suoi divisori interi privi di quadrati, la quantità di quelli che sono prodotto di un numero dispari di numeri primi è uguale alla quantità di quelli che sono il prodotto di un numero pari di numeri primi.

Vediamo quale errore commettiamo per ciascun termine passando dalla (6) alla (6′):

  • se \mu(d) = 1, stiamo sostituendo \left\lfloor \frac{N}{d} \right\rfloor con \frac{N}{d}. Quindi, essendo \left\lfloor \frac{N}{d} \right\rfloor \leq \frac{N}{d} \lt \left\lfloor \frac{N}{d} \right\rfloor + 1, stiamo aggiungendo una quantità compresa tra 0 (incluso) e 1 (escluso).
  • se \mu(d) = -1, stiamo sostituendo - \left\lfloor \frac{N}{d} \right\rfloor con - \frac{N}{d}. Quindi, essendo - \left\lfloor \frac{N}{d} \right\rfloor - 1 \lt - \frac{N}{d} \leq - \left\lfloor \frac{N}{d} \right\rfloor, stiamo sottraendo una quantità compresa tra 0 (incluso) e 1 (escluso).

Nel complesso, se applicassimo questo ragionamento per tutti i termini separatamente, considerando il caso peggiore sia in eccesso che in difetto, avremmo che:

  • La massima differenza positiva possibile tra il valore della (6′) e quello della (6) è inferiore a 2^{k-1}: ciò accadrebbe se si commettesse un errore minore di 1 per tutti i termini positivi e un errore nullo per tutti i termini negativi.
  • La massima differenza negativa possibile tra il valore della (6′) e quello della (6) è inferiore in valore assoluto a 2^{k-1}: ciò accadrebbe se si commettesse un errore minore di 1 in valore assoluto per tutti i termini negativi e un errore nullo per tutti i termini positivi.

In sintesi:

(6) - 2^{k - 1} \lt (6') \lt (6) + 2^{k-1}

Per cui il massimo errore in valore assoluto è pari a:

|(6') - (6)| \lt 2^{k - 1}

Quindi l’errore assoluto aumenta esponenzialmente rispetto a k.
Dato che ben presto 2^{k - 1} diventa maggiore di N, che è il numero iniziale di elementi dell’insieme A, una tale stima dell’errore è chiaramente inaccettabile. Ricordiamo infatti che l’espressione (6) calcola il numero di elementi che rimangono in A dopo il crivello di Eratostene, per cui essa restituirà ovviamente un numero compreso tra 0 e |A| = N; quindi qualunque stima dell’errore che dia un valore maggiore di N è inutilizzabile.
D’altra parte, è anche vero che nella nostra stima dell’errore abbiamo considerato i casi peggiori, che potrebbero non verificarsi. Infatti, tipicamente gli errori sui singoli termini saranno in parte negativi (per i termini negativi) e in parte positivi (per i termini positivi), per cui tenderanno a compensarsi, abbassando in valore assoluto l’errore totale. Il problema è che, sebbene ciò sia vero, i termini della (6′) sono fortemente dipendenti gli uni dagli altri, rendendo difficile ottenere una stima dell’errore che tenga conto di queste dipendenze.

Non correttezza asintotica

Nel paragrafo precedente abbiamo parlato dell’errore assoluto che commette la nostra formula approssimata, (5) o equivalentemente (6′), rispetto alla (6). Analizziamo ora l’errore relativo, ossia la quantità:

\frac{|(6') - (6)|}{(6)}

Idealmente questo errore dovrebbe tendere a un limite al crescere di N, e questo limite dovrebbe essere zero. Infatti, se non esistesse un limite, vorrebbe dire che il nostro errore non ha un andamento stabile al crescere di N, mentre, se il limite esistesse ma fosse diverso da zero, vorrebbe dire che la nostra stima ha la tendenza a sottostimare o a sovrastimare il valore esatto. Vorremmo quindi che:

\lim_{N \to \infty} \frac{|(6') - (6)|}{(6)} = 0 \tag{8}

che è equivalente a:

\lim_{N \to \infty} \frac{(6')}{(6)} = 1 \tag{8'}

Essendo la (6) positiva, abbiamo che \frac{|(6') - (6)|}{(6)} = \left|\frac{(6')}{(6)} - \frac{(6)}{(6)}\right| = \left|\frac{(6')}{(6)} - 1\right|. Per la (8), questa quantità tende a zero, quindi diventa definitivamente più piccola di un \epsilon \gt 0 prefissato:

\left|\frac{(6')}{(6)} - 1\right| \lt \epsilon \text{ (per $N$ sufficientemente grande)}

Ma questa relazione, per definizione di limite, è equivalente alla (8′).

Quindi stiamo richiedendo che le formule (6) e (6′) siano asintoticamente equivalenti, come accade ad esempio per le funzioni \pi(x) e \frac{x}{\log x}, che sono asintoticamente equivalenti in base al Teorema dei numeri primi.
La buona notizia è che possiamo verificare come stanno le cose, perché, come vedremo tra poco, conosciamo gli equivalenti asintotici di entrambe le funzioni; sappiamo cioè che la (6) è asintoticamente equivalente a una certa funzione h e che la (6′) è asintoticamente equivalente a un’altra funzione k. In base a ciò, per la transitività dell’equivalenza asintotica, possiamo affermare che la (6) e la (6′) sono asintoticamente equivalenti se e solo se lo sono tali funzioni h e k.

Vediamo qual è una funzione asintoticamente equivalente alla (6).
Per l’uguaglianza (6) e per definizione di funzione di crivello, sappiamo che essa calcola il numero di primi maggiori di \sqrt{N} e minori o uguali di N. Questo numero si può ottenere sottraendo il numero di primi minori o uguali di \sqrt{N} dal numero di quelli minori o uguali di N:

\begin{aligned} (6) &= \\ \left|\left\{p \mid \sqrt{N} \lt p \leq N \right\}\right| &= \\ \left|\left\{p \mid p \leq N \right\}\right| - \left|\left\{p \mid p \leq \sqrt{N} \right\}\right| &= \\ \pi(N) - \pi(\sqrt{N}) \end{aligned} \tag{9}

Dal Teorema dei numeri primi sappiamo che \pi(N) \sim \frac{N}{\log N} e \pi(\sqrt{N}) \sim \frac{\sqrt{N}}{\log \sqrt{N}}. Tuttavia, non è ammesso concludere automaticamente, da ciò e dalla (9), che (6) \sim \frac{N}{\log N} - \frac{\sqrt{N}}{\log \sqrt{N}}, come se l’equivalenza asintotica fosse un’uguaglianza. Tale passaggio richiederebbe una dimostrazione non banale (invitiamo gli interessati a provarci) e, tra l’altro, esistono molti casi di funzioni f, F, g e G tali che f \sim F, g \sim G ma f - g \nsim F - G (ad esempio: x^2 - 2x \sim x^2, x^2 - x \sim x^2 ma x^2 - 2x - (x^2 - x) = -x \nsim x^2 - x^2 = 0). Procederemo quindi in modo diverso, mettendo in evidenza \pi(N):

\pi(N) - \pi(\sqrt{N}) = \pi(N)\left( 1 - \frac{\pi(\sqrt{N})}{\pi(N)} \right) \tag{10}

Trattandosi in questo caso di un rapporto di funzioni anziché di una differenza, la definizione di equivalenza asintotica rende lecito applicare il Teorema dei numeri primi al numeratore e al denominatore:

\frac{\pi(\sqrt{N})}{\pi(N)} \sim \frac{\frac{\sqrt{N}}{\log \sqrt{N}}}{\frac{N}{\log N}} = \frac{\sqrt{N} \log N}{N \log \sqrt{N}} = \frac{\log N}{\sqrt{N} \frac{1}{2} \log N} = \frac{2}{\sqrt{N}} \to 0

Dunque, sostituendo nella (10):

\frac{\pi(N) - \pi(\sqrt{N})}{\pi(N)} = 1 - \frac{\pi(\sqrt{N})}{\pi(N)} \to 1

Per cui, per definizione di equivalenza asintotica:

\pi(N) - \pi(\sqrt{N}) \sim \pi(N)

Quindi, riprendendo la (9) e applicando il Teorema dei numeri primi, otteniamo infine:

(6) \sim \pi(N) - \pi(\sqrt{N}) \sim \pi(N) \sim \frac{N}{\log N} \tag{11}

Vediamo ora cosa possiamo dire riguardo alla (6′).
Per studiarne l’ordine asintotico ci conviene questa volta tornare alla forma equivalente che abbiamo visto all’inizio, ossia la (5). In questo modo infatti possiamo applicare il seguente Teorema, di cui in questo contesto ci interessa solo l’enunciato:

Terzo Teorema di Mertens

\lim_{n \to \infty} \prod_{p \leq n} \left(1 - \frac{1}{p} \right) = \frac{e^{-\gamma}}{\log n}

dove \gamma è la costante di Eulero.

In base a questo Teorema e alla Proprietà C.5:

(6') = N \prod_{p \leq \sqrt{N}} \left( 1 - \frac{1}{p} \right) \to N \frac{e^{-\gamma}}{\log \sqrt{N}} = 2 e^{-\gamma} \frac{N}{\log N} \tag{12}

Allora possiamo concludere che:

\begin{aligned} \lim_{N \to \infty} \frac{(6')}{(6)} &= \\ \lim_{N \to \infty} \frac{(6')}{\frac{N}{\log N}} \frac{\frac{N}{\log N}}{(6)} &= \text{[per la (11)]} \\ \lim_{N \to \infty} \frac{(6')}{\frac{N}{\log N}} &= \text{[per la (12)]} \\ \lim_{N \to \infty} \frac{2 e^{-\gamma} \frac{N}{\log N}}{\frac{N}{\log N}} &= \\ 2 e^{-\gamma} \end{aligned}

Quindi la (6) e la (6′) non sono asintoticamente equivalenti, perché il limite del loro rapporto non è 1, ma 2 e^{-\gamma} \approx1,1229. Ciò significa che, per numeri sufficientemente grandi, la (6′) e la (5) tendono a sovrastimare, di circa il 12%, il numero di primi rimasti in A dopo aver applicato il crivello di Eratostene.

Conclusioni

Nel tentativo di approssimare il numero di elementi rimasti in A dopo aver applicato il crivello di Eratostene, abbiamo ottenuto la formula (5), che inizialmente sembrava una buona approssimazione, perché supportata dai dati sperimentali e da una buona giustificazione intuitiva. Tuttavia, abbiamo visto che in realtà essa è lungi dall’esserlo, perché presenta grossi problemi sia dal punto di vista teorico, perché è difficile stimarne l’errore assoluto, sia dal punto di vista pratico, perché tende a sovrastimare il valore reale di circa il 12%.
L’insegnamento che possiamo trarre da questo studio è che è meglio non fidarsi troppo né delle proprie intuizioni né dei dati sperimentali: le intuizioni possono essere errate e i dati sperimentali possono confermarle solo in apparenza. Affinché i dati abbiano un reale valore, bisognerebbe essere certi di aver considerato numeri sufficientemente grandi per il problema che si sta esaminando, ma il problema è che spesso è difficile capire quali sono tali numeri sufficientemente grandi. Quindi, finché le dimostrazioni che cerchiamo non sono complete, è sempre meglio considerare intuizioni e dati come delle semplici guide per la comprensione del problema che stiamo studiando, lasciando sempre un certo margine di dubbio.

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *