Prerequisiti:
- Il crivello di Selberg: generalizzazione e fine della dimostrazione
- Il crivello di Eratostene e la definizione formale di crivello
- Funzioni aritmetiche: definizioni e alcune proprietà
- Proprietà degli ordini asintotici
- Elementi di analisi asintotica
Dato un numero pari N \gt 2, chiameremo coppie di Goldbach per N le coppie di numeri primi la cui somma è N; se la Congettura di Goldbach fosse vera, il numero di queste coppie sarebbe almeno 1, qualunque sia N. In questo articolo ragioneremo nel senso opposto: troveremo una stima per eccesso del numero di coppie di Goldbach, ossia stabiliremo quante possono essere al massimo. Lo faremo utilizzando la teoria dei crivelli sviluppata finora, in particolare il crivello di Selberg.
Il problema di trovare una stima per eccesso del numero di coppie di Goldbach potrebbe sembrare banale. Per esempio, si può osservare che le coppie di primi la cui somma è N vanno sicuramente cercate all’interno dell’insieme \{(2, N-2), (3, N-3), (4, N-4), \ldots, (N-4, 4), (N-3, 3), (N-2, 2)\} (mentre 1 + (N - 1) non è una coppia valida, dato che 1 non è primo); questo insieme contiene N - 3 elementi, quindi le coppie di Goldbach per N possono essere al massimo N - 3.
In realtà non è il problema a essere banale, ma lo è solo la soluzione specifica che abbiamo descritto. Infatti la stima per eccesso N - 3, oltre a essere molto lontana dal numero effettivo di coppie di Goldbach per N, non fornisce alcuna informazione utile, dato che per ottenerla abbiamo semplicemente contato tutte le possibili coppie di interi maggiori di 1 che hanno come somma N. In questo articolo vedremo che, mediante tecniche più sofisticate, è possibile ottenere una stima più bassa, quindi migliore, anche come ordine asintotico. Escluderemo quindi un numero significativo di queste N - 3 coppie, che sicuramente non sono coppie di Goldbach.
Potremmo fare un ragionamento simile anche per la stima per difetto: anche in questo caso esiste infatti una stima banale, che è 0, perché nel peggiore dei casi può non esserci nessuna coppia. Questa stima, oltre a essere lontana dalla realtà, è banale come la precedente stima per eccesso, perché non fornisce nessuna informazione utile, essendo basata su un principio ovvio (il conteggio di qualsiasi cosa è almeno 0). La Congettura di Goldbach dice invece che una stima per difetto è 1: anche questa stima è lontana dal valore reale, ma non è banale in quanto asserisce qualcosa di qualitativamente molto diverso, ossia che almeno una coppia esiste sempre: dal punto di vista matematico, questa può essere un’informazione preziosa.
Il risultato finale a cui arriveremo è il seguente:
Stima per eccesso del numero di coppie di Goldbach
Sia N un numero pari maggiore di 2 e sia \mathfrak{R}(N) il numero di scritture di N come somma di due numeri primi (numero di coppie di Goldbach). Allora:
Ricordiamo che la notazione \ll è equivalente alla notazione O-grande.
Bisogna chiarire che, quando si parla di “scritture di N come somma”, si intende il numero di coppie ordinate di numeri primi la cui somma è N. Ad esempio, se N = 12, le scritture 12 = 5 + 7 e 12 = 7 + 5 sono considerate diverse, per cui rientrano entrambe nel conteggio di \mathfrak{R}(12). Questo però non è un problema, perché, se si vuole conoscere il numero di coppie non ordinate, è possibile calcolarlo a partire da quello delle coppie ordinate.
Come si può calcolare il numero di coppie non ordinate partendo dal numero di coppie ordinate?
Se N non è della forma p + p, tutte le coppie hanno addendi distinti, dunque il numero di quelle non ordinate è esattamente la metà di quelle ordinate, quindi è \frac{\mathfrak{R}(N)}{2}.
Se invece N = p + p, bisogna osservare che la coppia ordinata p + p resta identica cambiando l’ordine degli addendi, quindi non viene contata due volte come le altre coppie ordinate. Allora, per ottenere il numero di coppie non ordinate, conviene calcolare prima la metà del numero delle altre coppie ordinate, ossia \frac{\mathfrak{R}(N) - 1}{2}, poi aggiungere 1 per considerare la coppia p + p (vista questa volta come coppia non ordinata) che era stata esclusa. In questo caso il numero di coppie non ordinate è quindi \frac{\mathfrak{R}(N) - 1}{2} + 1, che a sua volta è uguale a \frac{\mathfrak{R}(N) + 1}{2}.
La formula del Teorema C.6 presenta due fattori molto significativi:
- Il fattore \prod_{p \mid N} \left(1 + \frac{1}{p}\right) cresce al crescere del numero di fattori primi di N; questo è in accordo con l’osservazione empirica che, confrontando il numero di coppie di Goldbach di numeri pari di grandezza simile, quelli con più fattori primi hanno generalmente più coppie di Goldbach (i lettori interessati possono fare qualche esperimento col nostro visualizzatore di coppie di Goldbach).
- Il fattore \frac{N}{\log^2 N} può essere visto come il prodotto \frac{N}{\log N} \cdot \frac{1}{\log N}. Analizziamo entrambi questi fattori:
- per il Teorema dei Numeri Primi, \frac{N}{\log N} è una stima del numero dei primi minori o uguali di N. Quindi questo fattore conta approssimativamente il numero di coppie del tipo (p, N - p), con p primo.
- Il fattore \frac{1}{\log N}, per lo stesso Teorema, è la probabilità approssimata che un numero minore o uguale di N sia primo; infatti possiamo riscrivere \frac{1}{\log N} come \frac{N / \log N}{N}, dove N / \log N è il numero di casi favorevoli (numeri primi minori o uguali di N) e N è il numero di casi possibili (numeri interi positivi minori o uguali di N).
Se ora supponessimo che la probabilità che N - p sia primo sia uguale alla probabilità che un generico numero intero positivo minore o uguale di N sia primo, ossia \frac{1}{\log N}, allora il prodotto \frac{N}{\log N} \cdot \frac{1}{\log N} = \frac{N}{\log^2 N} sarebbe una stima del numero delle coppie del tipo (p, N - p) in cui N - p è primo, cioè una stima del numero di coppie di Goldbach. Chiaramente in questo ragionamento l’assunzione forte, non dimostrata, è che la probabilità che N - p sia primo non dipenda né da N e né da p.
È bene aver presente tuttavia che entrambe queste osservazioni sono basate sulla formula del Teorema C.6, che non pretende di calcolare il numero di coppie di Goldbach, nemmeno in modo approssimato, ma ne presenta solo una maggiorazione asintotica; in linea di principio, quindi, il numero reale di coppie di Goldbach potrebbe avere un comportamento diverso. D’altra parte, sembra esserci effettivamente una forte somiglianza tra la maggiorazione asintotica del Teorema C.6 e il vero valore di \mathfrak{R}(N), per quanto le prove empiriche e la nostra intuizione ci permettono di capire. A tal proposito, si può anche osservare la forte somiglianza della formula a destra della (1) con quella della Congettura A di Hardy-Littlewood, che secondo i loro ideatori stimerebbe \mathfrak{R}(N) in modo asintoticamente corretto.
Il crivello di Goldbach
Nei precedenti articoli abbiamo visto che un crivello consiste in una funzione che conta quanti elementi restano in un insieme di numeri naturali A dopo aver eliminato tutti i multipli dei numeri primi minori di un numero reale z, dove z è un parametro stabilito dal crivello stesso. Sappiamo che, scegliendo opportunamente A e z, come nel crivello di Eratostene, è possibile far restare nell’insieme solo numeri primi.
Nel caso della Congettura di Goldbach, la situazione sembra essere diversa, perché l’insieme di partenza A dovrebbe essere un insieme di coppie e non di numeri. Si potrebbe definire ad esempio A := \{(1, N-1), (2, N-2), (3, N-3), \ldots, (N-3,3), (N-2,2), (N-1,1)\} ed eliminare, mediante il crivello, tutte le coppie dove almeno uno dei due elementi è multiplo di uno dei numeri primi considerati. In realtà, però, non è necessario introdurre le coppie in modo esplicito, perché per ogni numero primo p vale la seguente proprietà, che è una conseguenza della definizione di numero primo (Proprietà N.1B):
Dunque possiamo sostituire le coppie con il prodotto dei loro elementi, ottenendo così un insieme numerico al quale possiamo applicare il meccanismo del crivello che già conosciamo, basato sulla relazione di divisibilità. Per la proprietà citata, il crivello applicato alle coppie darà lo stesso risultato (ossia lo stesso numero di elementi rimanenti) del crivello applicato ai prodotti dei loro elementi, come si vede nel seguente esempio:
Poniamo N = 12 e supponiamo di voler contare, mediante un crivello, il numero di coppie di numeri naturali non divisibili né per 2 né per 3, la cui somma è N. Partiamo dall’insieme delle coppie di tutti i numeri naturali che sommati danno N:
Eliminando tutte le coppie dove almeno uno degli elementi è divisibile per 2 o per 3, rimangono le seguenti:
Ora sostituiamo, nell’insieme iniziale, ciascuna coppia con il prodotto dei suoi elementi:
Eliminando tutti gli elementi divisibili per 2 o per 3, rimangono i seguenti:
che sono proprio i prodotti degli elementi delle coppie dell’insieme (1); in particolare anche la loro cardinalità è la stessa.
In realtà, però, c’è un aspetto che non torna. Mentre le coppie, considerate come ordinete, sono tutte distinte, quando si passa ai prodotti si ottengono elementi ripetuti, come si può vedere nell’insieme (2) dell’esempio, che più correttamente dovrebbe essere scritto come \{11, 20, 27, 32, 35, 36\}. Tuttavia, per non cambiare la natura del problema, vogliamo mantenere una corrispondenza biunivoca tra prodotti e coppie; per fare ciò, consideriamo l’insieme dei prodotti come una collezione ordinata di elementi che ammette elementi duplicati, diversamente dagli insiemi “normali” che sono non ordinati e non ammettono duplicati. In matematica una collezione ordinata di elementi, eventualmente duplicati, viene chiamata famiglia. Alle famiglie si applicano le stesse notazioni degli insiemi (le parentesi graffe, il simbolo di appartenenza, eccetera) e la teoria dei crivelli si applica tanto agli insiemi quanto alle famiglie. Nella definizione di crivello potremmo quindi sostituire il termine “insieme” con “famiglia” e nessun teorema di teoria dei crivelli cambierebbe; tuttavia, per maggiore correttezza, specificheremo sempre quando avremo a che fare con una famiglia piuttosto che un insieme.
La nostra funzione di crivello sarà quindi la seguente:
crivello di Goldbach
Siano:
- N un numero pari maggiore di 2
- z \gt 1 un numero reale
- A la famiglia, di N elementi, \set{n(N - n) | 1 \leq n \leq N}
Chiameremo crivello di Goldbach, con parametri N e z, la funzione di crivello S(A, \mathbb{P}, z).
Per il momento non fissiamo il parametro z, perché alla fine dell’articolo capiremo qual è il valore più opportuno da assegnargli; l’importante è tener presente che si tratta di un numero reale che possiamo fissare a piacimento, a patto che sia maggiore di 1.
Dato che nei calcoli è comodo che la famiglia A abbia N elementi, di solito tra i possibili valori di n si ammette che n = N, anche se questa scelta genera l’elemento N(N - N) = 0 che certamente sarà eliminato dal crivello, perché qualsiasi numero primo è divisore di 0.
Il crivello di Goldbach è legato al numero di coppie di Goldbach come segue:
legame tra il crivello di Goldbach e il numero di coppie di Goldbach
Siano N un numero pari maggiore di 2 e z \gt 1 un numero reale. Sia S(A, \mathbb{P}, z) il crivello di Goldbach con parametri N e z. Allora:
Sia G := \{(p, q) \mid p + q = N\} l’insieme delle coppie di Goldbach per N (come sempre indichiamo con p e q dei numeri primi). Possiamo partizionare questo insieme in tre sottoinsiemi:
- G_1 := \{(p, q) \mid p + q = N, p \leq z\}
- G_2 := \{(p, q) \mid p + q = N, z \lt p \lt N - z\}
- G_3 := \{(p, q) \mid p + q = N, p \geq N - z\}
Sicuramente |G_1| \leq z, perché gli elementi di G_1 sono al massimo quanti i numeri primi p \leq z, che a loro volta sono al massimo z (sarebbero z se tutti gli interi compresi tra 1 e z fossero primi, che non è vero, ma come maggiorazione va bene; per essere più precisi potremmo dire che |G_1| \leq \pi(z), ma ciò non migliorerebbe l’enunciato finale in modo significativo).
Analogamente possiamo dire che |G_3| \leq z, perché gli elementi di G_3 sono al massimo quanti i numeri primi p compresi tra N - z e N - 1, che a loro volta sono al massimo z (sarebbero z se tutti gli interi compresi tra N - z e N - 1 fossero primi).
Per quanto riguarda G_2, dalla condizione z \lt p \lt N - z otteniamo immediatamente che p \gt z, ma possiamo anche ottenere che q = N - p \gt N - (N - z) = z, cioè q \gt z. Essendo sia p che q maggiori di z e primi, certamente non sono divisibili per nessun primo minore di z; lo stesso potrà dirsi quindi del loro prodotto pq. Ricordiamo che la funzione di crivello S(A, \mathbb{P}, z) conta gli elementi della famiglia A che non sono divisibili per nessun numero primo minore di z: uno di questi elementi sarà quindi pq. Dato che questo vale per ogni p e q che rientrano nella definizione dell’insieme G_2, possiamo concludere che tutti gli elementi di G_2 rientrano nel conteggio del crivello, quindi |G_2| \leq S(A, \mathbb{P}, z).
Concludendo, abbiamo che:
Nel seguito useremo la (3) per trovare una maggiorazione di \mathfrak{R}(N). Per maggiorare la funzione di crivello S(A, \mathbb{P}, z) useremo il crivello di Selberg nella sua forma più generale.
La funzione f del crivello di Selberg applicato alle coppie di Goldbach
Sappiamo che, nella forma più specifica del crivello di Selberg, la funzione f utilizzata è f(d) = \frac{1}{d}. Come abbiamo visto nell’articolo precedente, questa funzione f racchiude il significato di tutto il crivello, perché deve essere scelta in modo che |A| f(d) approssimi il più possibile il numero di multipli di d presenti nell’insieme A. Se A = \set{1, \ldots, N}, la funzione f(d) = \frac{1}{d} va bene, perché in tal caso |A| f(d) = \frac{|A|}{d} = \frac{N}{d} è una buona stima del numero di multipli di d nell’insieme A. Se invece poniamo A uguale alla famiglia della Definizione C.3, la funzione \frac{1}{d} non va più bene, come si può vedere dal seguente esempio.
Sia N = 20 e d = 3. Calcoliamo la famiglia A:
I multipli di 3 sono i seguenti: 36, 51, 75, 84, 96, 99, 99, 96, 84, 75, 51, 36 e 0, per un totale di 12. Può sembrare strano vedere dei duplicati, ma dobbiamo ricordare che abbiamo a che fare con una famiglia, non con un insieme. Per chiarire il significato di questi numeri è utile ricostruire le coppie di fattori associate a ciascun elemento; così facendo, possiamo dire che i numeri da eliminare sono quelli corrispondenti alle coppie: (2, 18), (3, 17), (5, 15), (6, 14), (8, 12), (9, 11), (11, 9), (12, 8), (14, 6), (15, 5), (17, 3), (18, 2), (20, 0). Possiamo partizionare queste coppie in due sottoinsiemi:
- quelle in cui il primo elemento è multiplo di 3, e non il secondo: (3, 17), (6, 14), (9, 11), (12, 8), (15, 5), (18, 2), per un totale di 6;
- quelle in cui il secondo elemento è multiplo di 3, e non il primo: (17, 3), (14, 6), (11, 9), (8, 12), (5, 15), (2, 18) e (20, 0), per un totale di 7;
Non ci sono coppie in cui entrambi gli elementi sono multipli di 3. Infatti, se così fosse, anche la loro somma sarebbe un multiplo di 3, ma questa somma è N = 20, che non è un multiplo di 3, quindi la situazione ipotetica in cui entrambi gli elementi della coppia sono multipli di 3 non può presentarsi.
Ora, se proviamo a calcolare |A| f(d) con f(d) = \frac{1}{d}, abbiamo |A| f(d) = \frac{|A|}{d} = \frac{20}{3} \approx 6, mentre il risultato corretto sarebbe 13. Ciò accade perché la frazione \frac{20}{3} approssima il numero di multipli di d in un’intervallo formato da 20 interi consecutivi; ciò equivale a contare in quante coppie solo il primo elemento (che è compreso tra 1 e 20) è un multiplo di 3, o equivalentemente solo il secondo (che è compreso tra 0 e 19), ma non uno qualunque dei due. Una funzione che ci fornisce il risultato corretto in questo caso è \frac{2}{d}, perché |A| \frac{2}{d} = \frac{2|A|}{d} = \frac{40}{3} \approx 13.
Ci sono però altri casi in cui la funzione \frac{1}{d} va bene, come mostra il seguente esempio:
Sia N = 20 e d = 5. Nella famiglia A, che è la stessa dell’esempio precedente, i multipli di 5 sono 75, 100, 75 e 0, per un totale di 4. Essi corrispondono alle coppie (5, 15), (10, 10), (15, 5) e (20, 0), che sono le uniche coppie dove entrambi gli elementi sono multipli di 5. Questo caso è l’opposto del precedente, nel senso che non esistono coppie dove uno solo dei due elementi è multiplo di 5; se così fosse, infatti, la loro somma non sarebbe un multiplo di 5, ma la somma è 20 che è un multiplo di 5, dunque il caso ipotizzato non può presentarsi.
Per d = 5 la funzione \frac{1}{d} restituisce il risultato corretto, perché |A| \frac{1}{d} = \frac{|A|}{d} = \frac{20}{5} = 4, che è proprio il numero di coppie che volevamo. Infatti, la frazione \frac{20}{5} rappresenta il numero di multipli di 5 in un insieme di 20 interi consecutivi, che può essere per esempio l’insieme dei primi elementi delle coppie. Questa volta però, a differenza dell’esempio precedente, se il primo elemento è multiplo di 5 lo è anche il secondo; quindi le coppie dove uno dei due elementi è multiplo di 5 sono le stesse dove solo il primo elemento è multiplo di 5, la cui cardinalità è data dalla formula \frac{20}{5}.
I due esempi precedenti sono riassunti nella seguente figura:

In generale, se d è un numero primo, possono presentarsi i seguenti due casi:
- Se d \nmid N, il numero di elementi di A che sono multipli di d, che è uguale al numero delle corrispondenti coppie dove uno dei due elementi è multiplo di d, è all’incirca \frac{2|A|}{d}, quindi f(d) = \frac{2}{d};
- Se d \mid N, la stesso conteggio di multipli (o di corrispondenti coppie), è all’incirca \frac{|A|}{d}, quindi f(d) = \frac{1}{d}.
In modo più compatto, utilizzando come sempre la lettera p per indicare un numero primo:
Per ottenere il valore di questa nuova funzione f sui numeri composti e su 1, basta ricordare, dall’enunciato del crivello di Selberg, che f deve essere completamente moltiplicativa, e come tale basta definirla sui numeri primi, perché tutti gli altri valori della funzione per gli interi maggiori di 1 si ottengono applicando la Proprietà N.26, inoltre f(1) = 1 sempre per definizione di funzione completamente moltiplicativa.
Come si comporta la funzione f nel crivello, quando si contano nell’insieme A i multipli di un numero che non è privo di quadrati?
Si può osservare che, se d non è privo di quadrati, applicando nel crivello la funzione f che abbiamo definito si ottiene un risultato errato.
Ad esempio, se N = 20 e d = 9, gli elementi della famiglia A che sono multipli di 9 sono 36, 99, 99 e 36, per un totale di 4 (le coppie corrispondenti sono (2, 18), (9, 11), (11, 9) e (18, 2)), mentre applicando la formula |A| f(d) otteniamo più del doppio: |A| f(d) = 20 f(9) = 20 f(3) f(3) = 20 \cdot \frac{2}{3} \cdot \frac{2}{3} = \frac{80}{9} \geq 8.
Questo però non rappresenta un problema, perché in realtà non è il valore della funzione a essere errato, ma la domanda iniziale. Infatti, tutto il ragionamento che sta alla base del crivello di Selberg, sviluppato nei precedenti articoli, considera solo numeri d privi di quadrati; infatti, come si può vedere in molte formule della dimostrazione, d è sempre un divisore di P(z), che è privo di quadrati, sia nella stima del crivello che nel termine d’errore.
L’unica parte del Teorema dove serve che f sia definita su tutti gli interi è quella finale, che avviene dopo aver già trovato la seguente maggiorazione (formula (7) dell’articolo Il crivello di Selberg: generalizzazione e fine della dimostrazione):
per ottenere la quale, durante la dimostrazione, è stato sufficiente applicare f a numeri privi di quadrati (per approfondire, v. ultimo dettaglio dell’articolo citato).
L’esigenza che f sia definita su tutti i numeri interi (e che sia completamente moltiplicativa) nasce quindi a posteriori rispetto al crivello, quando per semplificare la disuguaglianza precedente si dimostra che (formula (8) dell’articolo citato):
dove, come sappiamo, \frac{1}{n} viene generalizzato come f(n) nella forma più generale del Teorema (quindi serve che f sia definita almeno su tutti gli interi positivi minori di z). La maggiorazione precedente, tuttavia, è un passaggio di natura puramente numerica che non ha nulla a che fare con il meccanismo del crivello, per cui non importa se f(n), per numeri non privi di quadrati, assume valori che, se fossero utilizzati nel crivello, sarebbero errati. Ciò che conta, in questa fase “numerica” della dimostrazione del Teorema, è solo che la funzione sia completamente moltiplicativa, non i particolari valori che essa assume.
L’applicazione del crivello di Selberg
Per maggiorare la funzione di crivello di Goldbach S(A, \mathbb{P}, z) presente nella (3), applichiamo il crivello di Selberg (Teorema C.5), ricordando che nel nostro caso |A| = N:
Vediamo cosa succede quando come funzione f consideriamo quella definita dalla (4).
Per quanto riguarda il primo termine della (5), si può applicare il seguente lemma:
Maggiorazione asintotica della stima del crivello di Selberg applicato alle coppie di Goldbach
Sia f la funzione data dalla (4). Allora:
Consideriamo un intero positivo n \lt z. Fattorizziamo n distinguendo tra i fattori primi che dividono N, che chiameremo p_1, \ldots, p_k, e quelli che non lo dividono, che chiameremo q_1, \ldots, q_r:
con a_1, \ldots, a_k, b_1, \ldots, b_r \gt 0.
Calcoliamo f(n), ricordando che è completamente moltiplicativa:
Consideriamo ora il numero di divisori di n coprimi con N e indichiamo con d(n, N) la loro cardinalità:
Possiamo calcolare esattamente quali sono questi divisori; infatti, se d è un divisore di n coprimo con N, nella sua fattorizzazione possono comparire come fattori primi solo q_1, \ldots, q_r, ciascuno con un esponente non superiore a quello che ha nella fattorizzazione di n. Quindi d deve essere del tipo:
con 0 \leq c_1 \leq b_1, \ldots, 0 \leq c_r \leq b_r (se l’esponente è zero, il numero primo è assente nella fattorizzazione di d).
Considerando tutte le possibili combinazioni di esponenti, abbiamo (1 + b_1)\cdot\ldots\cdot(1 + b_r) possibilità per d, per cui
Possiamo osservare che, se b_1 = \ldots = b_r = 1, cioè se n è privo di quadrati, questo numero è uguale a \underbrace{2 \cdot \ldots \cdot 2}_{r \textrm{ volte}} = 2^r = 2^{b_1 + \ldots + b_r}, quindi coinciderebbe col numeratore di f(n) dato dalla (a). In generale, senza fare ipotesi aggiuntive su b_1, \ldots, b_r, possiamo dire che:
Infatti, per ogni b_i \in \set{b_1, \ldots, b_r}, se b_i = 1 allora 1 + b_i = 2 = 2^{b_1}, mentre se b_i \gt 1, è facile vedere che la funzione esponenziale genera valori più grandi dell’altra (per 1 + b_i = 3, 4, 5, \ldots, mentre 2^{b_i} = 4, 8, 16, \ldots, rispettivamente); lo si può dimostrare ad esempio con il principio di induzione.
Quindi dalla (a) e dalla (b) possiamo concludere che:
Ora consideriamo il prodotto \prod_{p \mid N}\left( 1 - \frac{1}{p} \right)^{-1}. Per la Proprietà A.26 abbiamo che:
dove
Dalla (c) e dalla (d) abbiamo:
Poniamo s := na.
La sommatoria più interna contiene tutte le frazioni del tipo \frac{1}{s} con 1 \leq s \lt z, perché, dato un tale s, possiamo porre n := s e a := 1 (tali scelte sono lecite perché per ipotesi n = s soddisfa la condizione 1 \leq n \lt z della prima sommatoria, mentre, come richiesto dalla seconda sommatoria, a = 1 \in A, perché 1 non ha fattori primi). Una frazione del tipo \frac{1}{s} può però comparire anche più volte, perché possono esistere varie scelte di n e di a il cui prodotto è s. In particolare, possiamo scegliere n tra i divisori di s e verificare poi se a = \frac{s}{n} \in A: la frazione \frac{1}{s} comparirà tutte le volte in cui la verifica ha esito positivo, e ogni volta sarà moltiplicata per lo stesso termine d(n, N) della sommatoria esterna. Possiamo quindi invertire le sommatorie in questo modo:
dove il \geq è dovuto al fatto che la sommatoria interna della (e) contiene anche frazioni aventi s \geq z che non abbiamo considerato, mentre la (f) comprende solo le frazioni del tipo \frac{1}{s}, con 1 \leq s \lt z, che però compaiono anche nella (e). Quindi, se espandessimo le doppie sommatorie, i termini della (f) sarebbero un sottoinsieme dei termini della (e).
Poniamo N := 20 e z := 11. I fattori primi di N sono 2 e 5, quindi l’insieme A contiene tutti i numeri interi positivi nella cui fattorizzazione compaiono solo 2 e 5, ossia:
In questo caso la (e) si può espandere come segue:
Possiamo osservare che nelle sommatorie compaiono tutte le frazioni del tipo \frac{1}{s} con 1 \leq s \lt 11, più molte altre che non considereremo, che sono il motivo del \geq nella (f). Il numero 1 = \frac{1}{1} compare una sola volta perché ha come unico divisore se stesso. Anche le frazioni \frac{1}{3}, \frac{1}{7} e \frac{1}{9} compaiono una volta sola perché, anche se i loro denominatori hanno più di un divisore, in tutti e tre i casi solo il divisore 1 appartiene ad A, mentre gli altri (3, 9 e 7) non vi appartengono. Anche per quanto riguarda la frazione \frac{1}{6}, solo alcuni dei divisori del denominatore appartengono ad A: 6 ha come divisori 1, 2, 3 e 6 ma solo i primi due appartengono ad A, per cui la frazione compare due volte. Infine, nelle altre frazioni (\frac{1}{2}, \frac{1}{4}, \frac{1}{8} e \frac{1}{10}) tutti i divisori del denominatore appartengono ad A, per cui, in questi casi, il numero di occorrenze è uguale al numero di divisori. Ad esempio, tutti e tre i divisori di 4 (1, 2 e 4) appartengono ad A, per cui la frazione \frac{1}{4} compare tre volte.
Ora mettiamo in evidenza le frazioni del tipo \frac{1}{s} con 1 \leq s \lt 11:
Possiamo osservare che ciascuna frazione \frac{1}{s} è moltiplicata per una somma di elementi del tipo d(n, 20); come abbiamo osservato prima, il numero degli elementi della somma (che corrisponde al numero di occorrenze della frazione \frac{1}{s} nell’espressione precedente) è pari al numero di divisori di s che appartengono ad A. Per vedere questi divisori dobbiamo però scrivere gli n ottenuti come una frazione che ha per numeratore s:
I denominatori evidenziati, riga per riga, sono i divisori di s che appartengono ad A. Dato che le frazioni valgono n e avendo esse numeratore s, i loro denominatori sono \frac{s}{n}, perché n = \frac{s}{\colorbox{aqua}{s/n}}. Quindi possiamo esprimere in modo compatto la (h) come segue:
che è in accordo col secondo membro della (f).
Ora semplifichiamo la sommatoria \sum_{\substack{n \mid s \\ \frac{s}{n} \in A}} d(n, N).
Nel seguito useremo la funzione d che restituisce il numero di divisori di un numero naturale; useremo anche la notazione d(s, N) per indicare il numero di divisori di s coprimi con N.
Fattorizziamo s distinguendo tra i fattori primi che dividono N, che chiameremo p_1, \ldots, p_k, e quelli che non lo dividono, che chiameremo q_1, \ldots, q_r (stiamo usando gli stessi simboli dell’inizio della dimostrazione, ma le due parti della dimostrazione sono da intendersi come separate, quindi questi p_1, \ldots, p_k, q_1, \ldots, q_r non sono gli stessi di prima). Inoltre, chiameremo a il prodotto dei fattori che dividono N e b il prodotto degli altri:
con a_1, \ldots, a_k, b_1, \ldots, b_r \gt 0.
Ora dimostriamo che:
- d(a) \cdot d(b) = d(s)
- d(s, N) = d(b)
- Se n \mid s e \frac{s}{n} \in A, allora d(n, N) = d(s, N)
- Il numero di interi positivi n tali che n \mid s e \frac{s}{n} \in A è d(a)
Dimostrazione:
-
Se n \mid s, allora possiamo scrivere n come:
n = \underbrace{p_1^{a_1^{\prime}} \ldots p_k^{a_k^{\prime}}}_{a^{\prime}} \cdot \underbrace{q_1^{b_1^{\prime}} \ldots q_r^{b_r^{\prime}}}_{b^{\prime}} \tag{j}con 0 \leq a_1^{\prime} \leq a_1, \ldots, 0 \leq a_k^{\prime} \leq a_k, 0 \leq b_1^{\prime} \leq b_1, \ldots, 0 \leq b_r^{\prime} \leq b_r.
In particolare, a^{\prime} \mid a e b^{\prime} \mid b, per cui a ogni divisore di s possiamo associare una coppia (a^{\prime}, b^{\prime}) dove a^{\prime} \mid a e b^{\prime} \mid b. Vale però anche il viceversa: se a^{\prime} \mid a, allora a^{\prime} è del tipo p_1^{a_1^{\prime}} \ldots p_k^{a_k^{\prime}} con 0 \leq a_1^{\prime} \leq a_1, \ldots, 0 \leq a_k^{\prime} \leq a_k e se b^{\prime} \mid b, allora b^{\prime} è del tipo q_1^{b_1^{\prime}} \ldots q_k^{b_k^{\prime}} con 0 \leq b_1^{\prime} \leq b_1, \ldots, 0 \leq b_k^{\prime} \leq b_k; quindi il loro prodotto, dato dalla (j), è un divisore di s. In sintesi, esiste una corrispondenza biunivoca tra i divisori di s, la cui cardinalità è d(s), e le coppie (a^{\prime}, b^{\prime}) con a^{\prime} \mid a e b^{\prime} \mid b, la cui cardinalità è d(a) \cdot d(b). Quindi d(a) \cdot d(b) = d(s).
-
Partendo dalla (i), possiamo osservare che i divisori di s coprimi con N sono i divisori di b. Infatti, se un divisore è coprimo con N può avere come fattori primi solo q_1, \ldots, q_r, quindi divide b; viceversa, un divisore di b è anche un divisore di s, ed è coprimo con N perché ha solo fattori primi che non dividono N. Quindi, passando alle cardinalità, d(s, N) = d(b).
-
Dalla (i) e dalla (j) abbiamo:
\frac{s}{n} = p_1^{a_1 - a_1^{\prime}} \ldots p_k^{a_k - a_k^{\prime}} \cdot q_1^{b_1 - b_1^{\prime}} \ldots q_r^{b_r - b_r^{\prime}}ma per ipotesi \frac{s}{n} \in A, cioè deve avere solo fattori primi di N, quindi i fattori q_1, \ldots, q_r devono avere esponente nullo. Quindi:
\begin{aligned} n \mid s, \frac{s}{n} \in A & \Rightarrow \\ b_1 = b_1^{\prime}, \ldots, b_r = b_r^{\prime} & \Rightarrow \\ q_1^{b_1^{\prime}} \ldots q_r^{b_r^{\prime}} = q_1^{b_1} \ldots q_r^{b_r} & \Rightarrow \\ b^{\prime} = b & \Rightarrow \\ d(b^{\prime}) = d(b) \end{aligned} \tag{k}Partendo dalla (i) abbiamo dimostrato che d(s, N) = d(b); allo stesso modo, partendo dalla (j), possiamo dimostrare che d(n, N) = d(b^{\prime}). Quindi, per la (k), d(n, N) = d(s, N).
Consideriamo l’ultima riga della (g):
\frac{1}{10} \cdot \left( d(\colorbox{aqua}{1}, 20) + d(\colorbox{aqua}{2}, 20) + d(\colorbox{aqua}{5}, 20) + d(\colorbox{aqua}{10}, 20) \right)I numeri evidenziati sono gli n dell’ipotesi, ossia i divisori di s = 10 tali che \frac{s}{n} \in A. Questo terzo punto ci sta dicendo, per tutti questi numeri, il numero di divisori coprimi con N = 20 è uguale al numero di divisori di s = 10 coprimi con N = 20.
In effetti, l’unico divisore di 10 coprimo con 20 è 1, e lo stesso si può dire per 1, 2, 5 e 10: l’unico divisore coprimo con 20 di ciascuno di essi è 1, perché sono tutti divisori di 20.Analizziamo ora quest’altra riga:
\frac{1}{6} \cdot \left( d(\colorbox{aqua}{3}, 20) + d(\colorbox{aqua}{6}, 20) \right)In questo caso i divisori di s = 6 coprimi con 20 sono 1 e 3, per un totale di 2, quindi d(s, 20) = d(6, 20) = 2. Possiamo osservare che anche per i due n evidenziati si ha che d(n, 20) = d(s, 20): per n = 6 ciò è ovvio perché n = s, ma la formula vale anche per l’altro n che è 3; infatti, entrambi i divisori di 3 sono coprimi con 20.
-
Dalla (j) e dalla (k) abbiamo che:
\begin{aligned} n \mid s, \frac{s}{n} \in A & \Rightarrow \\ b^{\prime} = b & \Rightarrow \\ n = \underbrace{p_1^{a_1^{\prime}} \ldots p_k^{a_k^{\prime}}}_{a^{\prime}} \cdot \underbrace{q_1^{b_1} \ldots q_r^{b_r}}_{b} \end{aligned}Ma b è fisso, perché dipende solo da s che è stato fissato inizialmente, quindi il numero di possibili n è pari al numero di possibili a^{\prime}. Questi ultimi, per come è stato definito n, sono i possibili divisori di a; quindi, per transitività, possiamo concludere che il numero di possibili n è d(a).
Questo quarto punto ci dice quanti addendi ci sono dentro le parentesi in ogni riga della (g), perché ogni addendo è associato a un diverso valore di n. Ad esempio, analizziamo di nuovo questa riga:
\frac{1}{10} \cdot \left( d(1, 20) + d(2, 20) + d(5, 20) + d(10, 20) \right)Osserviamo che ci sono 4 termini tra parentesi: secondo quanto abbiamo dimostrato, anche i divisori di a dovrebbero essere 4, dove a è quella parte della fattorizzazione di s = 10 che comprende solo i fattori primi di N = 20. In questo caso a = 10 perché tutti i fattori primi di s sono anche fattori primi di N, ed effettivamente 10 ha 4 divisori.
Ora analizziamo quest’altra riga:
\frac{1}{6} \cdot \left( d(3, 20) + d(6, 20) \right)In questo caso s = 6. Per capire il valore di a, fattorizziamo 6 come nella (i), separando i fattori che dividono N = 20 da quelli che non lo dividono:
6 = \underbrace{2}_{a} \cdot \underbrace{3}_{b}Quindi a = 2, che ha 2 divisori. Ciò è in accordo col quarto punto, perché effettivamente nella riga abbiamo trovato 2 termini dentro le parentesi.
In base ai quattro punti dimostrati, possiamo concludere che:
Riprendendo la (e) e la (f), abbiamo quindi:
La sommatoria \sum_{s \lt z} \frac{d(s)}{s} ha un ordine asintotico noto; in particolare, per la Proposizione N.31, \sum_{s \lt z} \frac{d(s)}{s} \gg \log^2 z. Quindi:
da cui:
Applicando la Proprietà A.27, abbiamo:
Il termine della produttoria può essere riscritto come segue:
Sostituendo nella (l), abbiamo:
Ora, in analogia con la formula (d), utilizzando la stessa logica della dimostrazione della Proprietà A.26, si può dimostrare che:
dove:
Ma i numeri che nella loro fattorizzazione hanno solo fattori primi con esponente pari sono i quadrati, per cui:
In particolare, questo insieme Q è un sottoinsieme dell’insieme di tutti i numeri che sono quadrati, per cui sicuramente la serie \sum_{q \in Q} \frac{1}{q} è minore o uguale della serie dei reciproci di tutti i quadrati, ossia \sum_{n \geq 1} \frac{1}{n^2}. Quindi, partendo dalla (n), abbiamo:
Ma quest’ultima serie, com’è possibile dimostrare, è convergente, perché l’esponente di n è strettamente maggiore di 1. Essa ha quindi una somma finita L \in \mathbb{R}. Quindi, per la (o), anche la produttoria è limitata dallo stesso L:
Ciò rende la produttoria irrilevante dal punto di vista asintotico; essa può quindi essere eliminata dalla (m), ottenendo:
Abbiamo così completato la dimostrazione.
Per quanto riguarda il termine d’errore, per effettuare una maggiorazione asintotica dobbiamo calcolare l’ordine di grandezza di r(d). Esso è dato dal seguente Lemma:
Ordine asintotico dell’errore del crivello di Selberg applicato alle coppie di Goldbach
Siano (le ipotesi indicate con (*) sono aggiuntive o modificate rispetto all’enunciato del crivello di Selberg):
- (*) N un numero pari positivo
- (*) A la famiglia, di N elementi, \{n(N - n)\ \mid\ n \leq N\}
- z \gt 1 un numero reale
- P(z) il prodotto di tutti i numeri primi minori di z
- A_d l’insieme dei multipli di un numero naturale d presenti in A
- (*) f la funzione completamente moltiplicativa definita dalla (4)
- r(d) := |A_d| - |A| f(d)
- \omega(d) il numero di fattori primi distinti di d
Allora, per ogni numero naturale d che divide P(z):
Dato che d \mid P(z), la fattorizzazione di d è un prodotto di primi distinti, che possiamo suddividere tra quelli che dividono N e quelli che non dividono N. Poniamo quindi d := q_1 \ldots q_k p_1 \ldots p_r, dove q_1, \ldots, q_k sono divisori di N; p_1, \ldots, p_r non dividono N; k, r \geq 0.
Consideriamo l’insieme A_d. Per ipotesi, esso è l’insieme dei multipli di d presenti nella famiglia A, ossia l’insieme di tutti gli interi n \leq N tali che d \mid n(N - n). Sotto forma di congruenza, l’ultima relazione può essere scritta come n(N - n) \equiv 0\ \textrm{(mod }d\textrm{)}. Essendo d = q_1 \ldots q_k p_1 \ldots p_r, questa congruenza equivale al sistema di congruenze:
Per quanto riguarda le prime k congruenze, per ogni q_i \in \{q_1, \ldots, q_k\}, essendo q_i primo, si ha che n(N - n) \equiv 0 \textrm{ (mod }q_i\textrm{)} se e solo se n \equiv 0 \textrm{ (mod }q_1\textrm{)} oppure (N - n) \equiv 0 \textrm{ (mod }q_i\textrm{)}. Possiamo osservare però che queste due congruenze sono equivalenti. Infatti, dato che q_i \mid N, la seconda congruenza è equivalente a - n \equiv 0 \textrm{ (mod }q_i\textrm{)} che a sua volta è equivalente a n \equiv 0 \textrm{ (mod }q_i\textrm{)}, che corrisponde alla prima congruenza. Quindi possiamo concludere che:
Per quanto riguarda le ultime r congruenze, per ogni p_j \in \{p_1, \ldots, p_r\}, essendo esso primo, si ha che n(N - n) \equiv 0 \textrm{ (mod }p_j\textrm{)} se e solo se n \equiv 0 \textrm{ (mod }p_j\textrm{)} oppure (N - n) \equiv 0 \textrm{ (mod }p_j\textrm{)}; questa volta le due congruenze ottenute non sono equivalenti, perché dalla seconda si ottiene n - N \equiv 0 \textrm{ (mod }p_j\textrm{)} che a sua volta equivale a n \equiv N \textrm{ (mod }p_j\textrm{)}, che non è equivalente alla prima congruenza perché per ipotesi N \not \equiv 0 \textrm{ (mod }p_j\textrm{)}. Quindi in questo caso abbiamo due soluzioni distinte modulo p_j:
Sostituendo nella (a), abbiamo:
A seconda se scegliamo 0 oppure N in ciascuna delle ultime r congruenze, otteniamo un sistema di congruenze del tipo:
dove a_1, \ldots, a_r \in \{0, N\}. Le soluzioni del sistema (a) saranno quindi date dall’unione delle soluzioni di ciascun sistema (b), al variare di a_1, \ldots, a_r \in \{0, N\}. Essendoci due possibili scelte per ogni a_i \in \set{a_1, \ldots, a_r}, i sistemi del tipo (b) sono in totale 2^r. Ciascuno di essi, per il Teorema cinese del resto, individua un’unica soluzione modulo d (essendo d = q_1 \ldots q_k p_1 \ldots p_r). Possiamo concludere quindi che il sistema (a) ammette 2^r soluzioni modulo d, che possiamo indicare, utilizzando la notazione delle classi di equivalenza, come [\alpha_1], \ldots, [\alpha_{2^r}], con 0 \leq \alpha_1, \ldots, \alpha_{2^r} \lt d. In altri termini, possiamo dire che d \mid n(N - n) per tutti gli interi n che divisi per d hanno un resto appartenente all’insieme \set{\alpha_1, \ldots, \alpha_{2^r}}. Quindi possiamo calcolare |A_d| come segue:
dove nell’ultimo passaggio si è osservato che gli insiemi dell’unione sono tutti disgiunti, perché gli \alpha_i rappresentano classi di resto distinte.
L’insieme \set{n \leq N \textrm{\ tale che\ } n \equiv \alpha_i \textrm{ (mod }d\textrm{)}} contiene tutti gli interi compresi tra 1 ed N che sono congrui a \alpha_i modulo d. Per calcolarne la cardinalità, dividiamo N per d, ottenendo N = \left\lfloor \frac{N}{d} \right\rfloor d + h, dove abbiamo indicato con \left\lfloor \frac{N}{d} \right\rfloor la parte intera della divisione e con h il resto. Possiamo dire che certamente, qualunque sia \alpha_i, solo uno degli interi compresi tra 1 e d sarà congruo ad esso modulo d; lo stesso si può dire per gli interi compresi tra d + 1 e 2d, tra 2d + 1 e 3d, eccetera, fino agli interi compresi tra \left( \left\lfloor \frac{N}{d} \right\rfloor - 1\right) d + 1 e \left\lfloor \frac{N}{d} \right\rfloor d. Quindi ci sono esattamente \left\lfloor \frac{N}{d} \right\rfloor interi congrui a \alpha_i compresi tra 1 e \left\lfloor \frac{N}{d} \right\rfloor d. Ma N = \left\lfloor \frac{N}{d} \right\rfloor d + h, quindi restano da analizzare gli interi compresi tra \left\lfloor \frac{N}{d} \right\rfloor d + 1 e \left\lfloor \frac{N}{d} \right\rfloor d + h. Non possiamo dire esattamente quanti di questi interi sono congrui ad \alpha_i, però possiamo dire che ce ne potrà essere al massimo uno solo, perché, per lo stesso principio di prima, ce n’è esattamente uno compreso tra \left\lfloor \frac{N}{d} \right\rfloor d + 1 e \left\lfloor \frac{N}{d} \right\rfloor d + d \gt \left\lfloor \frac{N}{d} \right\rfloor d + h. Quindi il massimo numero di interi compresi tra 1 ed N che sono congrui a \alpha_i modulo d è \left\lfloor \frac{N}{d} \right\rfloor + 1. Allora:
dove nell’ultimo passaggio abbiamo applicato il Corollario 1 della Proprietà A.8 (osserviamo che 2^r va trattato come una funzione non costante, in quanto r dipende da N).
Ma \frac{2^r}{d} è proprio il valore di f(d), infatti:
Infatti, come abbiamo già osservato in precedenza, la f utilizzata nel crivello di Goldbach è stata definita proprio in modo tale da stimare con più precisione possibile le cardinalità degli insiemi A_d.
Dalle formule (c), (d) ed (e) possiamo concludere che:
Utilizzando questa disuguaglianza possiamo calcolare r(d), concludendo la dimostrazione:
dove nell’ultimo passaggio si è osservato che r \leq r + k = \omega(d).
Applicando quest’ultimo Lemma e la Proprietà A.6, abbiamo che:
Applicando le proprietà dei logaritmi, possiamo riscrivere l’espressione 6^{\omega(d)} cambiando la base da 6 a 2, come segue:
A questo punto dobbiamo ricordare che \omega(d) è il numero di fattori primi distinti di d, per cui la fattorizzazione di d sarà del tipo p_1^{i_1} \cdot \ldots \cdot p_{\omega(d)}^{i_{\omega(d)}}, con p_1, \ldots, p_{\omega(d)} distinti e i_1, \ldots, i_{\omega(d)} \gt 0. Allora, dato che tutti i numeri primi sono maggiori o uguali di 2:
Quindi, per ogni d \lt z^2:
Dalle formule (6), (7) e (8) possiamo concludere che:
dove la disuguaglianza è dovuta al fatto che la sommatoria \sum_{d \lt z^2} z^{2 \log_2 6} ripete lo stesso termine z^{2 \log_2 6} tante volte quanti sono gli interi positivi minori di z^2, quindi esattamente z^2 - 1 volte, cioè meno di z^2 volte.
Sostituendo nella (5) ed applicando il Lemma C.1 si ottiene:
Sostituiamo ora nella (3):
A questo punto non resta che cercare un valore di z che renda il primo e il terzo termine di un ordine asintotico inferiore rispetto al secondo; in tal modo il primo e il terzo termine della (9) potranno essere trascurati nella maggiorazione asintotica, ottenendo la (1).
Per semplicità di calcolo, cercheremo il valore di z tra le potenze di N con esponente razionale, quindi poniamo z := N^{\frac{a}{b}}, con \frac{a}{b} \in \mathbb{Q}. Sostituendo nella (9), abbiamo:
La nostra strategia sarà ora scegliere \frac{a}{b} in modo tale che, per qualche numero reale \alpha \lt 1, si verifichino entrambe le condizioni:
Con pochi calcoli si può verificare che due possibili valori sono \frac{a}{b} := \frac{1}{8} e \alpha := 0,9.
Come si trovano i valori \frac{a}{b} := \frac{1}{8} e \alpha := 0,9?
Cominciando dalla seconda relazione, si può osservare che 2 + 2 \log_2 6 = 7,169\ldots, per cui ad esempio moltiplicando questo numero per \frac{1}{8} si ottiene un numero minore di 1; in particolare \frac{1}{8} \left(2 + 2 \log_2 6\right) \lt 0,9. Quindi possiamo porre \frac{a}{b} := \frac{1}{8} e \alpha := 0,9, ottenendo che \frac{a}{b} \left(2 + 2 \log_2 6\right) \lt \alpha e quindi N^{\frac{a}{b} \left(2 + 2 \log_2 6\right)} \ll N^{\alpha}.
Infine, i valori trovati per \frac{a}{b} e \alpha soddisfano anche la prima relazione; infatti, essendo \frac{a}{b} \lt \alpha, si ha che N^{\frac{a}{b}} \ll N^{\alpha} e quindi, per il Corollario 2 della Proprietà A.8, 2 N^{\frac{a}{b}} \ll N^{\alpha}.
Sostituendo i valori trovati nella (9′), ricordando che soddisfano la (10), avremo che:
Ma, come è noto dall’analisi, essendo 0,9 \lt 1, si ha N^{0,9} \ll \frac{N}{\left(\frac{1}{8}\right)^2 \log^2 N}, e a sua volta \frac{N}{\left(\frac{1}{8}\right)^2 \log^2 N} \ll \prod_{p \mid N} \left(1 + \frac{1}{p}\right) \frac{N}{\left(\frac{1}{8}\right)^2 \log^2 N}, perché il fattore \prod_{p \mid N} \left(1 + \frac{1}{p}\right) è maggiore di 1 per ogni N. Quindi il termine dominante nella (11) è quello centrale, e si può concludere che:
Infine, per il Corollario della Proprietà A.8A, la costante \left(\frac{1}{8}\right)^2 non modifica l’ordine asintotico, da cui otteniamo la (1); la dimostrazione è così conclusa.