Prerequisiti:
- Il crivello di Selberg: studio del termine di errore
- Serie numeriche e numeri primi
- Funzioni aritmetiche: definizioni e alcune proprietà
- La formula di inversione di Möbius
- La somma degli inversi dei primi numeri interi positivi
- La funzione di Möbius e la sua connessione con la funzione Λ
Questo articolo conclude la parte “tecnica” della dimostrazione del crivello di Selberg e pone le basi per le applicazioni che vedremo in seguito. Le parti della dimostrazione che abbiamo visto negli articoli precedenti ci porteranno, in pochi passaggi, all’enunciato da cui siamo partiti, il Teorema C.4, che però è solo una versione semplificata del teorema. In questo articolo ne enunceremo anche la forma ordinaria e vedremo che la sua dimostrazione differisce solo in pochi punti da quella della versione semplificata.
Una versione più forte dell’enunciato semplificato
Nei precedenti articoli abbiamo visto alcune parti della dimostrazione del crivello di Selberg nella versione semplificata; ne ricostruiremo ora un quadro unitario.
Al termine dell’articolo Il crivello di Selberg: enunciato e inizio della dimostrazione abbiamo maggiorato la funzione di crivello S(A, \mathbb{P}, z) in questo modo:
Nell’articolo successivo, formula (9), abbiamo espresso T nella forma:
dove la funzione \phi è stata definita come:
Abbiamo poi ottenuto i valori dei parametri w_d che minimizzano l’espressione di T, giungendo alla conclusione che (formula 11):
dove V(z) è una funzione ausiliaria che inizialmente abbiamo definito come segue:
Alla luce dell’articolo precedente, tuttavia, in tutte le sommatorie su d possiamo introdurre la condizione d \lt z, cosa che facciamo per limitare il termine di errore. La definizioni di T e di V(z) diventano quindi:
Sostituendo w_d nell’espressione di T, otteniamo:
dove il passaggio centrale è motivato dall’osservazione che, per com’è definita la funzione di Möbius, \mu(d) può essere solamente 1 o -1 essendo d privo di quadrati, dunque abbiamo \mu^2(d) = 1 in ogni caso.
Nella (3), il termine \frac{1}{V^2(z)} può essere portato fuori dalla sommatoria, perché non dipende dalla sua variabile, ossia d. Abbiamo quindi:
dove nel secondo passaggio abbiamo sostituito la (2), ossia la definizione di V(z).
Unendo la (3) e la (4), possiamo esprimere T nella semplice forma:
Tornando alla (1), per quanto riguarda il termine di errore R, nell’articolo precedente siamo giunti alla seguente maggiorazione:
dove ricordiamo che \omega(d) è il numero di fattori primi distinti che compaiono nella fattorizzazione di d, mentre r(d) è la funzione definita nell’enunciato iniziale del Teorema, pari alla differenza tra il numero di multipli di d presenti nell’insieme A e il rapporto |A|/d.
Unendo le formule (1), (5) e (6) si ottiene:
Questa maggiorazione è molto simile a quella del Teorema C.4: l’unica differenza è che in quest’ultimo c’è \sum_{1 \leq n \lt z} \frac{1}{n} al posto di V(z); tuttavia anche la (7) è una maggiorazione valida, e volendo potrebbe essere un enunciato alternativo del Teorema. Non solo, ma la (7) è anche una maggiorazione migliore di quella del Teorema C.4. Si può infatti dimostrare che:
da cui:
da cui infine si ottiene, per transitività, la tesi del Teorema C.4:
Dunque il Teorema C.4 è più debole della (7), perché ne rappresenta una conseguenza. Nonostante ciò, la formula ufficiale del crivello di Selberg, nella forma semplificata, resta la (7′). Potremmo ipotizzare che tale formula sia preferita per la maggiore semplicità, dato che utilizza la ben nota serie armonica al posto della funzione V(z), e probabilmente la differenza asintotica rispetto all’altra formula non è rilevante. Su quest’ultimo punto proponiamo il seguente esempio, ma se qualche lettore ha approfondito la questione saremmo lieti di ricevere ulteriori informazioni in merito:
Ora che abbiamo concluso la dimostrazione, è interessante confrontare la stima fornita dall’enunciato con il valore effettivo della funzione di crivello, ossia S(A, \mathbb{P}, z), e anche con la stima migliore che abbiamo trovato nel corso della dimostrazione. Per effettuare questo confronto sceglieremo, come già fatto negli articoli precedenti, A := \{1, 2, \ldots, N\}, dove N è un numero intero positivo fissato, e z := \sqrt{N+1}; elimineremo cioè da A tutti i multipli dei numeri primi minori di \sqrt{N+1}, cioè minori o uguali a \sqrt{N}. Con queste scelte, la stima (7′), quella dell’enunciato ordinario del teorema, diventa:
mentre la formula dell’altra stima diventa la seguente:
Per valori crescenti di N fino a 10.000, si ottiene la Figura seguente:

Apparentemente le due stime non sono eccessivamente diverse tra loro e l’ordine asintotico non è molto diverso da quello della funzione effettivo; tuttavia non è possibile averne certezza senza una dimostrazione, dato che le differenze tra gli ordini asintotici potrebbero iniziare a mostrarsi per numeri più grandi di quelli mostrati nel grafico.
Conclusione della dimostrazione della forma semplificata
Per quanto visto nel paragrafo precedente, l’unica relazione ancora da dimostrare, per completare la dimostrazione del Teorema C.4, è la (8), ossia:
Il primo passo per dimostrarla è scrivere diversamente la funzione \phi:
Abbiamo definito (Il crivello di Selberg: studio dei parametri λ, passo 2) la funzione \phi come:
Ricordiamo che questa formula è stata ottenuta applicando la formula di inversione di Möbius alla funzione identità; ora dimostreremo che questa formula è equivalente alla (9), pur avendo una forma completamente diversa.
Procederemo per induzione sul numero di fattori primi che compaiono nella fattorizzazione di d (ricordando che essi sono tutti distinti, con esponente pari a 1).
Dimostriamo per primo il caso base. Se nella fattorizzazione di d compare un solo numero primo, cioè se d = q per qualche primo q, la (a) diventa:
Con la formula (9) si ottiene lo stesso risultato:
Abbiamo quindi dimostrato che, con un solo numero primo, (a) e (9) danno lo stesso valore. Passiamo ora alla parte induttiva vera e propria: supponiamo cioè che l’uguaglianza vale per k numeri primi, e dimostriamo che vale anche per k + 1 numeri primi. Supponiamo quindi che valga la seguente uguaglianza:
Sulla base di quest’ipotesi di induzione, dimostriamo che le due formule danno lo stesso risultato anche quando il numero di fattori primi è k + 1:
Confrontiamo le parti sinistre della (b) e della (c). Nella (b) gli indici della sommatoria sono tutte le possibili coppie (d, d^{\prime}) il cui prodotto è p_1 \cdot \ldots \cdot p_k, mentre nella (c) il prodotto della coppia è p_1 \cdot \ldots \cdot p_k \cdot p_{k+1}. Che relazione c’è tra le coppie della (b) e quelle della (c)? Supponiamo di partire da una coppia della (c), ossia da due numeri d, d^{\prime} tali che:
Essendo p_{k+1} primo, deve verificarsi uno e uno solo di questi due casi:
- p_{k+1} \mid d^{\prime}. In questo caso, dividendo ambo i membri della (d) per p_{k+1}, si ottiene che \frac{d^{\prime}}{p_{k+1}} d^{\prime \prime} = p_1 \cdot \ldots \cdot p_k, cioè \left(\frac{d^{\prime}}{p_{k+1}}, d^{\prime \prime} \right) è una coppia della (b)
- p_{k+1} \mid d^{\prime \prime}. In questo caso, procedendo come prima, si ottiene che d^{\prime} \frac{d^{\prime \prime}}{p_{k+1}} = p_1 \cdot \ldots \cdot p_k, cioè \left(d^{\prime}, \frac{d^{\prime \prime}}{p_{k+1}}\right) è una coppia della (b)
Possiamo quindi riscrivere la sommatoria della (c) come segue:
Ora un aspetto importante da osservare è che in ciascuno dei due casi l’insieme delle coppie ottenute (del tipo \left(\frac{d^{\prime}}{p_{k+1}}, d^{\prime \prime} \right) nel primo caso e \left(d^{\prime}, \frac{d^{\prime \prime}}{p_{k+1}}\right) nel secondo) comprende tutte le possibili coppie della (b). Per capire perché, proviamo a ragionare nel verso opposto. Se (d^{\prime}, d^{\prime \prime}) è una coppia di indici della sommatoria della (b), allora d^{\prime} d^{\prime \prime} = p_1 \cdot \ldots \cdot p_k, per cui si possono verificare due casi:
- Moltiplicando d^{\prime} per p_{k+1}, si ottiene la coppia (d^{\prime} p_{k+1}, d^{\prime \prime}) il cui prodotto è p_1 \cdot \ldots \cdot p_k \cdot p_{k+1}, dunque questa coppia di indici appartiene alla sommatoria (c) ed il primo indice è multiplo di p_{k+1}
- Moltiplicando d^{\prime \prime} per p_{k+1}, si ottiene la coppia (d^{\prime}, d^{\prime \prime} p_{k+1}) che, come per il caso precedente, appartiene alla sommatoria (c), ma questa volta il secondo indice è multiplo di p_{k+1}
Abbiamo quindi suddiviso gli indici della sommatoria (c) in due sottoinsiemi: quelli per cui il primo indice è multiplo di p_{k+1} e quelli per cui il secondo indice lo è, ed entrambi questi sottoinsiemi sono in corrispondenza biunivoca con gli indici della sommatoria (b).
Supponiamo che k = 2 e (p_1, p_2, p_3) = (2, 3, 5). La seguente tabella confronta gli indici della (b), ossia le coppie di interi il cui prodotto è p_1 \cdot \ldots \cdot p_k = p_1 \cdot p_2 = 2 \cdot 3, con quelli della (c), ossia con le coppie di interi il cui prodotto è p_1 \cdot \ldots \cdot p_k \cdot p_{k+1} = p_1 \cdot p_2 \cdot p_3 = 2 \cdot 3 \cdot 5:
Coppie di interi il cui prodotto è 2 \cdot 3 = 6 | Coppie di interi il cui prodotto è 2 \cdot 3 \cdot 5 = 30 |
---|---|
(1, 2 \cdot 3) (2, 3) (3, 2) (2 \cdot 3, 1) |
(1 \cdot \mathbf{5}, 2 \cdot 3) (2 \cdot \mathbf{5}, 3) (3 \cdot \mathbf{5}, 2) (2 \cdot 3 \cdot \mathbf{5}, 1) |
(1, 2 \cdot 3 \cdot \mathbf{5}) (2, 3 \cdot \mathbf{5}) (3, 2 \cdot \mathbf{5}) (2 \cdot 3, 1 \cdot \mathbf{5}) |
Possiamo osservare che nella colonna di destra abbiamo tutte le 8 possibili coppie di indici della sommatoria (c), suddivise in due sottoinsiemi ottenuti moltiplicando per p_{k+1} = p_3 = 5 rispettivamente il primo e il secondo elemento delle coppie della prima colonna, che sono gli indici della sommatoria (b).
Possiamo quindi riscrivere la prima sommatoria della (e) come segue:
dove l’uguaglianza è motivata dalla corrispondenza biunivoca che abbiamo visto: il d^{\prime} p_{k+1} della sommatoria di destra, dove d^{\prime} moltiplicato per d^{\prime \prime} dà p_1 \cdot \ldots \cdot p_k, coincide numericamente col d^{\prime} della sommatoria di sinistra, dove d^{\prime} moltiplicato per d^{\prime \prime} dà p_1 \cdot \ldots \cdot p_k \cdot p_{k+1} ed è multiplo di p_{k+1} (non bisogna lasciarsi confondere dall’uso dello stesso simbolo d^{\prime} con due significati diversi nelle due sommatorie; questa pratica è abbastanza comune).
Ragionando in modo simile, si ottiene che:
Unendo (e), (f) e (g) si ottiene:
Ora possiamo osservare che p_{k+1} può essere portato fuori dalla seconda sommatoria, mentre nella prima sommatoria \mu(d^{\prime} p_{k+1}) = - \mu(d^{\prime}), perché se d^{\prime} è il prodotto di un numero pari di fattori primi (quindi \mu(d^{\prime}) = 1), d^{\prime} p_{k+1} è il prodotto di un numero dispari di fattori primi (quindi \mu(d^{\prime}) = -1), mentre se d^{\prime} è il prodotto di un numero dispari di fattori primi (quindi \mu(d^{\prime}) = -1), d^{\prime} p_{k+1} è il prodotto di un numero pari di fattori primi (quindi \mu(d^{\prime}) = 1): in entrambi i casi cambia il segno. Quindi:
A questo punto è sufficiente applicare l’ipotesi di induzione (b) e svolgere i calcoli:
Abbiamo ottenuto la (c), che era ciò che volevamo dimostrare.
Originariamente abbiamo definito la funzione \phi come una sommatoria (\phi(d) := \sum_{d^{\prime} d^{\prime \prime} = d} \mu(d^{\prime}) d^{\prime \prime}), mentre nella (9) abbiamo dei prodotti. Effettivamente la sommatoria della definizione che conoscevamo non è altro che il risultato che si ottiene dopo aver svolto tutti i prodotti della (9), come mostra questo esempio per d = 2 \cdot 3 \cdot 5 = 30:
dove l’ultima formula è proprio \phi(30) secondo la definizione che avevamo dato nell’articolo Il crivello di Selberg: studio dei parametri λ, passo 2.
Nel precedente articolo abbiamo accennato alla proprietà che \phi è moltiplicativa, cioè:
- \phi(1) = 1
- se a e b sono due numeri privi di quadrati e coprimi, allora \phi(a) \phi(b) = \phi(ab)
Osserviamo che entrambi i punti sono un’immediata conseguenza della (9).
Per quanto riguarda il primo punto, basta sostituire d = 1 nella formula: \phi(1) = 1 \cdot \prod_{p \mid 1} \left( 1 - \frac{1}{p} \right). Dato che nessun numero primo è divisore di 1, la produttoria è vuota, quindi vale 1; perciò \phi(1) = 1 \cdot 1 = 1.
Per quanto riguarda il secondo punto, supponiamo che a = p_1 \cdot \ldots \cdot p_k e b = q_1 \cdot \ldots \cdot q_h, ciascuno dei quali è un prodotto di fattori primi distinti, con k \gt 0 e h \gt 0 (se fosse k = 0 o h = 0 si avrebbe rispettivamente che a = 1 o b = 1 e si potrebbe applicare il caso precedente). Allora, per la (9):
dove nella penultima uguaglianza abbiamo considerato che tutti e soli i primi che dividono ab sono proprio p_1, \ldots, p_k, q_1, \ldots, q_h. Infatti, essendo per ipotesi a e b coprimi, gli insiemi \{p_1, \ldots, p_k\} e \{q_1, \ldots, q_h\} non possono avere elementi in comune.
Dalla (9) abbiamo che:
Ma \frac{1}{1 - \frac{1}{p}} = \frac{1}{\frac{p - 1}{p}} = \frac{p}{p - 1}, per la Proprietà A.19, è la somma della serie
Quindi la (10) si può scrivere come:
A sua volta, per la Proprietà A.26, questa formula si può riscrivere come segue:
Possiamo osservare che l’affermazione “nella fattorizzazione di a ci sono solo fattori primi di d” è equivalente a “a è il prodotto di tutti e soli i fattori primi di d, con esponente maggiore o uguale di 0″; infatti gli eventuali fattori primi di d mancanti in a possono essere inseriti nella fattorizzazione con esponente nullo, come in 2 = 2^1 \cdot 3^0 dove ci sono tutti i fattori primi di d = 6, compreso il 3 (certamente, questa non è una fattorizzazione in senso stretto, ma è uno strumento utile per alcune dimostrazioni come la presente).
Quindi, se moltiplichiamo ciascuno di questi a per d, che essendo privo di quadrati è il prodotto di tutti e soli i suoi fattori primi, stiamo aggiungendo 1 a tutti gli esponenti dei fattori primi della scrittura di a (per esempio, se d = 6, da 2 = 2^1 \cdot 3^0 si passa a 6 \cdot 2 = 2^2 \cdot 3^1 = 2^{1+1} \cdot 3^{0+1}), dunque il minimo esponente possibile diventa 1 invece di 0 (perciò, diversamente da prima, ora abbiamo una vera fattorizzazione). Di conseguenza, dopo aver moltiplicato per d, nella fattorizzazione di a devono esserci tutti i fattori primi di d. Possiamo quindi concludere che:
Per d = 6, abbiamo che:
Possiamo sostituire questa espressione nella (8); così la relazione da dimostrare diventa:
Per dimostrare questa disuguaglianza, dimostreremo che tutti i termini della sommatoria di destra compaiono anche nella doppia sommatoria di sinistra. Questa tecnica è giustificata dal Teorema A.1: essendo tutti i termini della serie di sinistra positivi, ed essendo essa convergente perché per la (11) ha come somma \frac{1}{\phi(d)}, l’ordine dei termini non conta, quindi se ha almeno gli stessi termini della serie di destra (a prescindere dall’ordine), allora vale la relazione di \geq.
Verifichiamo quindi che, dato n tale che 1 \leq n \lt z, nella doppia sommatoria di sinistra troviamo il termine \frac{1}{n}. Per prima cosa osserviamo che n può avere solo fattori primi non superiori a z, perché è esso stesso minore di z. Ma i fattori primi non superiori a z sono precisamente quelli il cui prodotto è P(z), che possiamo chiamare p_1, p_2, \ldots, p_m. Dunque possiamo scrivere la fattorizzazione di n nella forma:
dove h_1, h_2, \ldots, h_k \gt 0, \{q_1, q_2, \ldots, q_k\} \subseteq \{p_1, p_2, \ldots, p_m\}, p_1 \cdot p_2 \cdot \ldots \cdot p_m = P(z).
Consideriamo ora il prodotto q_1 q_2 \ldots q_k. Ciascuno dei fattori è uno dei fattori primi di P(z), quindi l’intero prodotto divide P(z); inoltre il prodotto è minore di z perché q_1 q_2 \ldots q_k \leq q_1^{h_1} q_2^{h_2} \ldots q_k^{h_k} = n \lt z. In definitiva possiamo porre d := q_1 q_2 \ldots q_k, perché tale d soddisfa entrambe le condizioni della sommatoria esterna della (8′). Verifichiamo ora che la frazione \frac{1}{n} compare all’interno della sommatoria interna ottenuta in corrispondenza del valore di d che abbiamo costruito, ossia:
La verifica è immediata, perché la fattorizzazione di n, data dalla (a), contiene appunto tutti (e soli) i fattori primi di q_1 q_2 \ldots q_k, quindi n è uno degli “a” di quest’ultima sommatoria.
In conclusione sicuramente, nella doppia sommatoria a sinistra nella (8′), uno dei termini è pari a \frac{1}{n}. Per arbitrarietà di n, questo accade per tutte le frazioni \frac{1}{n} con 1 \leq n \lt z. La maggiorazione (8′) è quindi dimostrata.
Forma generale del crivello di Selberg
Come accennato inizialmente, l’enunciato più noto del crivello di Selberg è un po’ più generale della forma che abbiamo dimostrato finora. La forma più generale è la seguente:
crivello di Selberg
Siano:
- A un insieme finito di numeri naturali
- \mathbb{P} l’insieme dei numeri primi
- z \gt 1 un numero reale
- P(z) il prodotto di tutti i numeri primi minori di z
- A_d l’insieme dei multipli di un numero naturale d presenti in A
- f una funzione aritmetica completamente moltiplicativa, tale che 0 \lt f(p) \lt 1 per ogni numero primo p
- r(d) := |A_d| - |A| f(d)
- \omega(d) il numero di fattori primi distinti di d
Allora:
Confrontando questo enunciato con la sua versione semplificata (Teorema C.4), possiamo notare che l’unica differenza è l’introduzione della funzione f; infatti, come è semplice verificare per sostituzione, la versione semplificata si ottiene ponendo:
Questa funzione f è la chiave di tutto il crivello. Essa deve essere scelta in modo che il prodotto |A| f(d), per ogni d, sia il più possibile vicino al numero di multipli di d presenti nell’insieme A, che con le notazioni del Teorema si indica con |A_d|. Infatti, la quantità r(d) = |A_d| - |A| f(d) compare nel termine di errore, ed è ciò che vogliamo minimizzare; l’ideale quindi è che, per ogni d, r(d) sia più piccolo possibile, cioè |A| f(d) sia il più vicino possibile ad |A_d|. Se f(d) = \frac{1}{d} e A = \{1, \ldots, N\} si verifica proprio questo, perché effettivamente il numero di multipli di d presenti nell’insieme A è molto vicino, se non uguale, ad |A| f(d) = \frac{|A|}{d} = \frac{N}{d}. Variando l’insieme A, tuttavia, potrebbero esistere delle funzioni f che riescono meglio a minimizzare l’errore r(d). La generalizzazione del Teorema è importante proprio perché permette di scegliere caso per caso la funzione più opportuna: vedremo un esempio nel prossimo articolo.
Ora che abbiamo quasi concluso la nostra trattazione del crivello di Selberg, vale la pena di osservare che, diversamente dal concetto intuitivo di crivello, basato sul crivello di Eratostene, nel crivello di Selberg non vi è nessun processo di eliminazione esplicito. Il pregio del crivello di Selberg è però quello di separare il termine che fornisce la stima della funzione di crivello – il cui significato è difficile da cogliere senza rivedere i dettagli della dimostrazione – dal termine di errore, che a differenza del precedente ha un significato molto più intuitivo. Infatti in esso compare il termine |r(d)|, che potremmo pensare come la differenza tra il numero di multipli di d “eliminati” dal crivello (A f(d)) ed il numero effettivo di multipli di d presenti in A (|A_d|). Le somiglianze col concetto intuitivo di crivello però si fermano qui, perché nel termine di errore questi termini |r(d)| vengono valutati indipendentemente l’uno dall’altro e non in passaggi successivi: come se, dopo aver eliminato i multipli di un certo numero, si ripartisse di nuovo dall’insieme iniziale quando si eliminano i multipli di un altro numero. Questo è un grosso vantaggio: una delle maggiori difficoltà di calcolare un crivello è infatti quella di tener conto dei numeri già eliminati in precedenza (v. Perché gli approcci algoritmici non funzionano bene nella teoria dei crivelli? (parte I)), mentre il crivello di Selberg riesce a ricondurre il calcolo a un funzione che esprime l’effetto dell’eliminazione dei multipli di un solo numero per volta.
Il motivo per cui finora abbiamo dimostrato la versione semplificata del crivello di Selberg è che la dimostrazione della versione generale è più pesante a livello di simboli, ma concettualmente identica: basta sostituire \frac{1}{n} con f(n) nei punti opportuni. Infatti, se si prova a effettuare questa sostituzione all’interno della dimostrazione della versione semplificata, ci si accorge che le uniche due proprietà della funzione f che si utilizzano sono quelle richieste dall’enunciato, non serve che f sia proprio la funzione \frac{1}{n}.
In quali punti della dimostrazione generale si usano le due proprietà della funzione f?
A titolo di esempio, vediamo un punto della dimostrazione generale in cui si usano entrambe le proprietà di f.
Partiamo dalla funzione \phi (di solito indicata con F nella dimostrazione generale, perché la somiglianza con la \phi di Eulero vale solo nella versione semplificata). La definizione che conosciamo:
diventa:
Mentre la definizione di V(z), essendo basata su quella di \phi, resta la stessa:
Tuttavia questa definizione presuppone che \phi(d) \neq 0, che nella dimostrazione semplificata è una conseguenza della (9), mentre nella dimostrazione generale va dimostrato a parte. In particolare, se p è un numero primo, abbiamo che:
dove nell’uguaglianza centrale abbiamo utilizzato la proprietà che f(1) = 1 (parte della definizione che f è completamente moltiplicativa), mentre la disuguaglianza finale è una conseguenza della la proprietà che 0 \lt f(p) \lt 1 (se f(p) fosse 0 la scrittura \frac{1}{f(p)} non avrebbe senso, mentre se f(p) fosse minore di 0 o maggiore o uguale a 1, l’espressione \frac{1}{f(p)} - 1 sarebbe un numero negativo).
Per quanto riguarda \phi(d), dove d è un prodotto di fattori primi distinti che possiamo indicare con p_1 \cdot \ldots \cdot p_k, si può dimostrare che:
che è la generalizzazione della (9), e che analogamente si può dimostrare per induzione. In particolare, come osservato per la precedente funzione \phi, anche questa nuova \phi è moltiplicativa (proprietà che viene utilizzata nella dimostrazione, come abbiamo visto nell’articolo precedente).
In definitiva, dalla (c) e dalla (d) segue che \phi(d) \gt 0; in particolare \phi(d) è diverso da zero, per cui la definizione di V(z), in cui \phi(d) compare al denominatore, è ben posta.
C’è però un altro punto importante della dimostrazione in cui non basta che \phi(d) \neq 0, ma serve che \phi(d) \gt 0. Nell’articolo Il crivello di Selberg: studio dei parametri \lambda abbiamo trovato i valori dei parametri \lambda_d che minimizzano la nostra stima della funzione di crivello, data da (formula (9) dell’articolo citato):
e abbiamo dimostrato che, per tali valori di \lambda_d (parametri non visibili direttamente nella formula, ma insiti nella definizione di w_d), il valore assunto da T è \frac{1}{V(z)}. È importante che questo valore sia positivo, perché deve esserlo anche la nostra stima. In entrambe le dimostrazioni \frac{1}{V(z)} è positivo perché lo è V(z), che a sua volta, per la (b), è positivo perché lo è \phi(d) per ogni d.
Un altro punto importante della dimostrazione in cui si utilizza la prima proprietà di f, ossia che 0 \lt f(p) \lt 1 per ogni primo p, è la dimostrazione della (8). Infatti, come abbiamo visto, in essa si utilizza la somma di una serie geometrica di ragione \frac{1}{p}, che nella dimostrazione generale diventa f(p); l’ipotesi 0 \lt f(p) \lt 1 ci assicura la convergenza di tale serie geometrica, in quanto implica che |f(p)| \lt 1, che è appunto la condizione necessaria e sufficiente perché una serie geometrica di ragione f(p) converga.