Prerequisiti:
- Strategia dimostrativa basata sugli spazi
- Strategia dimostrativa basata sugli spazi: metodo basato sul calcolo approssimato degli spazi
Nell’articolo precedente abbiamo ricondotto la strategia dimostrativa basata sugli spazi al problema di trovare una maggiorazione del numero di spazi nelle prime m colonne di un tratteggio lineare. Abbiamo visto che un modo per risolvere questo problema consiste nel minimizzare complesse espressioni modulari, il cui numero di termini aumenta in modo esponenziale con l’ordine del tratteggio (se l’ordine del tratteggio è k, l’espressione modulare corrispondente ha 2^{k-1} termini). Ad esempio, questa è l’espressione da minimizzare per il quarto ordine:
Abbiamo visto che, al crescere dell’ordine del tratteggio, il valore minimo che può assumere quest’espressione al variare di m è negativo e sembra crescere esponenzialmente in valore assoluto.
Tuttavia, per ottenere questo valore minimo, che abbiamo chiamato \mathrm{min\_err\_s}, abbiamo fatto variare m considerando tutti i possibili valori che può assumere nel tratteggio, ossia da 1 fino alla lunghezza del periodo (andare oltre non avrebbe senso perché, per via della presenza dei moduli, i valori della funzione si ripetono ad intervalli pari alla lunghezza del periodo). Abbiamo cercato il valore minimo in questo modo perché inizialmente volevamo studiare la funzione \mathrm{err\_s} di per sé, a prescindere dell’uso che vogliamo farne nella nostra strategia dimostrativa, ma come abbiamo visto i risultati non sono stati soddisfacenti. Vale la pena quindi studiare la funzione \mathrm{err\_s} in relazione all’uso che vogliamo farne, che si può riassumere in due punti:
- I tratteggi in cui ci interessa maggiormente cercare spazi sono quelli di tipo T_k, le cui componenti sono numeri primi consecutivi da 2 in poi (per poi passare ai doppi tratteggi);
- In questi tratteggi, ci serve cercare gli spazi solamente all’interno dell’intervallo di validità; infatti, trovare uno spazio al di fuori non sarebbe di alcuna utilità per la dimostrazione della Congettura di Goldbach, dato che non potremmo sapere se lo spazio trovato è un numero primo.
Per i nostri scopi è quindi sufficiente definire una funzione simile a \mathrm{min\_err\_s}, che invece di cercare il minimo di \mathrm{err\_s} in un intero periodo del tratteggio, lo cerca solo all’interno dell’intervallo di validità. Come sappiamo, tale intervallo si estende dall’ultima componente del tratteggio, esclusa, al quadrato del numero primo successivo alla stessa, anch’esso escluso. Per semplificare, tuttavia, fermeremo la ricerca del minimo al quadrato dell’ultima componente del tratteggio (escluso), dato che è complicato calcolare con esattezza il numero primo successivo. In questo modo consideriamo un intervallo incluso in quello di validità, per cui è sufficiente trovare uno spazio in tale intervallo per poter affermare di averlo trovato anche nell’intervallo di validità. Chiameremo la nuova funzione di ricerca del minimo \mathrm{min\_err\_s\_q}, dove la “q” sta per “quadratico”, per ricordare che l’ampiezza dell’intervallo di ricerca cresce quadraticamente rispetto all’ultima componente del tratteggio.
Questa è la definizione di \mathrm{min\_err\_s\_q} per un generico tratteggio T:
Un aspetto interessante di questa funzione, poco evidente dalla definizione, è che alcuni termini di \mathrm{err\_s} si semplificano, per via dell’intervallo ristretto su cui è calcolato il minimo. Possiamo vedere questo effetto nel quarto ordine, dove la funzione \mathrm{err\_s} è definita in generale dall’espressione (1). Se poniamo T := T_4 = (2, 3, 5, 7), da cui (n_1, n_2, n_3, n_4) = (2, 3, 5, 7), abbiamo che:
L’intervallo in cui vogliamo cercare il minimo della funzione, per la (2), va da n_4 = 7 a n_4^2 = 7^2 = 49 esclusi:
Possiamo osservare che nella (3) alcuni moduli sono più grandi di 49: in questi casi le operazioni di modulo si possono cancellare. Ad esempio, nell’espressione m \mathrm{\ mod\ } 70, essendo 7 \lt m \lt 49, m è sicuramente più piccolo di 70, quindi m \mathrm{\ mod\ } 70 = m. La stessa cosa vale per m \mathrm{\ mod\ } 105 e m \mathrm{\ mod\ } 210, per cui la (3) diventa:
da cui
Siamo passati quindi da un’espressione che conteneva 15 moduli a un’espressione che ne contiene 12. Questa può non sembrare una grande semplificazione, ma il suo effetto diventa sempre più marcato al crescere dell’ordine, perché i moduli maggiori di n_k^2 (e quindi sicuramente maggiori di m) diventano man mano sempre più numerosi, per cui se ne eliminano sempre di più. Infatti, dobbiamo ricordare che i moduli sono dati da tutti i possibili prodotti di componenti del tratteggio non ripetute (nel quarto ordine: n_1, n_2, n_3, n_4, n_1 n_2, n_1 n_3, n_1 n_4, n_2 n_3, n_2 n_4, n_3, n_4, n_1 n_2 n_3, n_1, n_2 n_4, \ldots), per cui, più componenti ha il tratteggio, più è facile trovare un prodotto di componenti che superi il quadrato di quella più grande. Per rendersene conto, basta considerare il tratteggio T_9 = (2, 3, 5, 7, 11, 13, 17, 19, 23): il quadrato dell’ultima componente è 529, che è già abbondantemente superato dal prodotto delle prime cinque componenti (2 \cdot 3 \cdot 5 \cdot 7 \cdot 11 = 2310), che è il più piccolo prodotto che si può formare con cinque componenti; quindi tutti i prodotti di almeno 5 componenti sono maggiori di 529, e lo sono anche molti prodotti di meno componenti, ma più grandi (ad esempio 7 \cdot 11 \cdot 13 = 1001).
Non solo i moduli maggiori di n_k^2 diventano sempre più numerosi, ma diventano man mano la quasi totalità dei moduli. Per rendersene conto, basta fare delle semplici considerazioni:
- il numero totale dei moduli per l’ordine k è 2^k - 1;
- i moduli minori di n_k^2 sicuramente non possono essere più di n_k^2 (più precisamente, la loro cardinalità è pari a quella degli interi privi di quadrati minori di n_k^2);
- dunque, la frazione di moduli minori di n_k^2 sul totale non può essere più grande di \frac{n_k^2}{2^k - 1};
- come è noto dall’analisi, il rapporto \frac{n_k^2}{2^k - 1} tende a zero al crescere di k;
- quindi, i moduli minori di n_k^2 sono una porzione infinitesima del totale dei moduli (equivalentemente, quelli maggiori di n_k^2 tendono ad essere la totalità dei moduli).
Quindi, al crescere dell’ordine, l’espressione di \mathrm{err\_s}(T, m) contiene relativamente pochi moduli (non più del quadrato dell’ultima componente), più, dopo le semplificazioni, un termine dato da m per una costante, come nella (4).
- Il numero di moduli minori di n_k^2 è in realtà molto minore di n_k^2; per esempio nella (4) abbiamo solo 12 moduli a fronte di n_k^2 = 49. Si potrebbe indagare sull’ordine di grandezza del numero di moduli.
- Il coefficiente di m, generato dalle semplificazioni, è ottenuto attraverso una somma di termini sia positivi che negativi: si potrebbe studiare ad esempio come varia il numero ottenuto al variare dell’ordine del tratteggio, per tratteggi di tipo T_k.
Il fatto di aver limitato la ricerca del minimo, comunque, di per sé non garantisce di aver risolto il problema di partenza, cioè non garantisce che non si possano ottenere valori di \mathrm{err\_s}(T, m) negativi molto grandi in valore assoluto, nonostante la limitazione su m. Infatti, come abbiamo visto nell’articolo precedente, in cui non avevamo introdotto limitazioni su m, sappiamo che esistono degli m che generano valori di \mathrm{err\_s}(T, m) molto grandi in valore assoluto; se tali m fossero minori di n_k^2, la limitazione che abbiamo introdotto sarebbe ininfluente e non avremmo risolto il problema di partenza. Per approfondire questo aspetto, abbiamo fatto alcune verifiche sperimentali.
Siamo partiti dal generalizzare la formula dell’articolo precedente in cui compare \mathrm{err\_s}, in questo modo:
dove T = (n_1, \ldots, n_k) è un tratteggio lineare di ordine k.
Per il nomento ci siamo limitati allo studio del caso T = T_k, per il quale si ottiene:
da cui:
Ora, a noi interessa il minimo valore che può assumere questa formula quando m varia tra p_k e il suo quadrato esclusi, dato dalla (2). Per la (5), esso si può esprimere come:
Essendo \mathrm{min\_err\_s\_q}(T_k) troppo grande in valore assoluto per ordini grandi, conviene rapportarlo alla lunghezza del periodo, studiando il rapporto:
Questo rapporto è importante per stimare quanti spazi possono esserci nell’intervallo di validità: vediamo perché.
Tenendo conto che l’intervallo di validità si estende da p_k a p_k^2 esclusi, per calcolare il numero di spazi al suo interno, possiamo sottrarre il numero di spazi nelle prime p_k colonne dal numero di spazi fino alla colonna p_k^2 esclusa:
Il termine S(T_k, p_k) è pari a 1 perché sappiamo che nei tratteggi T_k, dove le componenti sono numeri primi consecutivi partendo da 2, l’unico spazio più piccolo dell’ultima componente è la prima colonna.
Il termine S(T_k, p_k^2 - 1) può essere minorato utilizzando la (5) e la definizione di \mathrm{min\_err\_s\_q}(T_k):
da cui, per la (6):
Abbiamo calcolato il rapporto \frac{\mathrm{min\_err\_s\_q}(T_k, m)}{p_1 \cdot \ldots \cdot p_k} da k = 2 a k = 100 e abbiamo osservato che:
- Il rapporto inizialmente decresce lentamente, per poi aumentare bruscamente il ritmo di discesa dopo l’ordine 45 (Figura 1);
- Nonostante il rapporto decresca sempre più velocemente, la somma tra esso e la funzione (p_k^2 - 1) \left( 1 - \frac{1}{p_1} \right) \cdot \ldots \cdot \left( 1 - \frac{1}{p_k} \right) - 1 resta positiva, segno che quest’ultima funzione cresce più velocemente (Figure 2 e 3).
Dimostrando il secondo punto, per la (7) si avrebbe che il numero di spazi nell’intervallo di validità è positivo, che è proprio lo scopo della strategia dimostrativa. Per i tratteggi del tipo T_k questa proprietà è già nota, perché per il Postulato di Bertand esiste un numero primo, e quindi uno spazio, tra p_k + 1 e 2 p_k, che si troverà all’interno dell’intervallo di validità, essendo 2 p_k \lt p_k^2 per k \geq 2. Tuttavia, se si dimostrasse la (7) studiando la funzione \mathrm{min\_err\_s\_q}(T_k, m), le tecniche impiegate potrebbero magari essere applicate anche ai doppi tratteggi (oltre che a tratteggi lineari non di tipo T_k), portando alla dimostrazione dell’Ipotesi H.3.



Approfondendo questo studio, ci siamo chiesti anche qual è il punto di minimo della funzione di errore, ossia qual è il valore m_{\textrm{min}}, compreso nell’intervallo di validità, tale che \mathrm{min\_err\_s\_q}(T_k) = \mathrm{err\_s}(T_k, m_{\textrm{min}}). Abbiamo scoperto che questo valore tende a posizionarsi vicino agli estremi dell’intervallo di validità; in particolare:
- Fino all’ordine 40, m_{\textrm{min}} è vicino a p_k;
- Dall’ordine 41 all’ordine 46, m_{\textrm{min}} è vicino a p_k per alcuni ordini, vicino a p_k^2 per altri;
- Dall’ordine 47 in poi, m_{\textrm{min}} è molto vicino a p_k^2.
Al momento non abbiamo ipotesi che possano spiegare questo comportamento.

Come si vede, in molti punti il grafico di m_{\textrm{min}} risulta indistinguibile da quello di p_k^2, ma in realtà ci sono lievi differenze numeriche, che i lettori interessati possono visualizzare nel dettaglio seguente.
Dai seguenti dati si può vedere bene quanto m_{\mathrm{min}} si avvicini, a seconda dei casi, a p_k o a p_k^2. Un’altra cosa interessante è che, quando è vicino a p_k, è sempre della forma p - 1 dove p è un numero primo poco più grande di p_k.
ordine | p_k | m_{\mathrm{min}} | p_k^2 |
---|---|---|---|
2 | 3 | 4 | 9 |
3 | 5 | 10 | 25 |
4 | 7 | 10 | 49 |
5 | 11 | 12 | 121 |
6 | 13 | 16 | 169 |
7 | 17 | 18 | 289 |
8 | 19 | 28 | 361 |
9 | 23 | 28 | 529 |
10 | 29 | 30 | 841 |
11 | 31 | 36 | 961 |
12 | 37 | 40 | 1369 |
13 | 41 | 42 | 1681 |
14 | 43 | 46 | 1849 |
15 | 47 | 52 | 2209 |
16 | 53 | 58 | 2809 |
17 | 59 | 60 | 3481 |
18 | 61 | 66 | 3721 |
19 | 67 | 70 | 4489 |
20 | 71 | 72 | 5041 |
21 | 73 | 78 | 5329 |
22 | 79 | 82 | 6241 |
23 | 83 | 88 | 6889 |
24 | 89 | 96 | 7921 |
25 | 97 | 100 | 9409 |
26 | 101 | 102 | 10201 |
27 | 103 | 106 | 10609 |
28 | 107 | 126 | 11449 |
29 | 109 | 126 | 11881 |
30 | 113 | 126 | 12769 |
31 | 127 | 130 | 16129 |
32 | 131 | 136 | 17161 |
33 | 137 | 148 | 18769 |
34 | 139 | 148 | 19321 |
35 | 149 | 150 | 22201 |
36 | 151 | 156 | 22801 |
37 | 157 | 162 | 24649 |
38 | 163 | 166 | 26569 |
39 | 167 | 172 | 27889 |
40 | 173 | 178 | 29929 |
41 | 179 | 32026 | 32041 |
42 | 181 | 190 | 32761 |
43 | 191 | 36450 | 36481 |
44 | 193 | 196 | 37249 |
45 | 197 | 222 | 38809 |
46 | 199 | 222 | 39601 |
47 | 211 | 44482 | 44521 |
48 | 223 | 49726 | 49729 |
49 | 227 | 51406 | 51529 |
50 | 229 | 52432 | 52441 |
51 | 233 | 54268 | 54289 |
52 | 239 | 56430 | 57121 |
53 | 241 | 58026 | 58081 |
54 | 251 | 62968 | 63001 |
55 | 257 | 65518 | 66049 |
56 | 263 | 69142 | 69169 |
57 | 269 | 72210 | 72361 |
58 | 271 | 73416 | 73441 |
59 | 277 | 76729 | 76729 |
60 | 281 | 78778 | 78961 |
61 | 283 | 79800 | 80089 |
62 | 293 | 85816 | 85849 |
63 | 307 | 94249 | 94249 |
64 | 311 | 96721 | 96721 |
65 | 313 | 97840 | 97969 |
66 | 317 | 100482 | 100489 |
67 | 331 | 108862 | 109561 |
68 | 337 | 112900 | 113569 |
69 | 347 | 120382 | 120409 |
70 | 349 | 121786 | 121801 |
71 | 353 | 124600 | 124609 |
72 | 359 | 128812 | 128881 |
73 | 367 | 134668 | 134689 |
74 | 373 | 139120 | 139129 |
75 | 379 | 143460 | 143641 |
76 | 383 | 146668 | 146689 |
77 | 389 | 151152 | 151321 |
78 | 397 | 157176 | 157609 |
79 | 401 | 160578 | 160801 |
80 | 409 | 166596 | 167281 |
81 | 419 | 175561 | 175561 |
82 | 421 | 177208 | 177241 |
83 | 431 | 185518 | 185761 |
84 | 433 | 187066 | 187489 |
85 | 439 | 192528 | 192721 |
86 | 443 | 196246 | 196249 |
87 | 449 | 201490 | 201601 |
88 | 457 | 208836 | 208849 |
89 | 461 | 212410 | 212521 |
90 | 463 | 214362 | 214369 |
91 | 467 | 218068 | 218089 |
92 | 479 | 229122 | 229441 |
93 | 487 | 237136 | 237169 |
94 | 491 | 241026 | 241081 |
95 | 499 | 247990 | 249001 |
96 | 503 | 252868 | 253009 |
97 | 509 | 259081 | 259081 |
98 | 521 | 271441 | 271441 |
99 | 523 | 273516 | 273529 |
100 | 541 | 292660 | 292681 |
- Al crescere di k, la funzione \frac{\mathrm{min\_err\_s\_q}(T_k, m)}{p_1 \cdot \ldots \cdot p_k} decresce meno velocemente di quanto cresce la funzione (p_k^2 - 1) \left( 1 - \frac{1}{p_1} \right) \cdot \ldots \cdot \left( 1 - \frac{1}{p_k} \right) - 1, e la loro somma, data dalla (7), è positiva. Questa dimostrazione dovrebbe essere fatta in modo da potersi adattare ad altri tratteggi, compresi i doppi tratteggi.
- Al crescere di k, il valore di m_{\textrm{min}} tende a essere vicino a p_k^2.
- In generale, sia i valori vicini a p_k che quelli vicini a p_k^2 sono dei buoni candidati per m_{\textrm{min}} (ossia generano errori negativi particolarmente grandi in valore assoluto).