Định nghĩa hình thức
- Kết hợp: $(a + b) + c = a + (b + c)$ với mọi $a, b, c \in G$;
- Phần tử đơn vị: Tồn tại phần tử $0 \in G$ sao cho $a + 0 = 0 + a = a$ với mọi $a \in G$;
- Phần tử nghịch đảo: Với mỗi $a \in G$, tồn tại $-a \in G$ sao cho $a + (-a) = 0$;
- Giao hoán: $a + b = b + a$ với mọi $a, b \in G$.
Ví dụ
- $(\mathbb{Z}, +)$: Tập các số nguyên với phép cộng thông thường. Phần tử đơn vị là $0$, phần tử nghịch đảo của $n$ là $-n$.
- $(\mathbb{Q}, +)$ và $(\mathbb{R}, +)$: Tập các số hữu tỉ và số thực, với phép cộng.
- $(\mathbb{Q}^*, \times)$: Tập các số hữu tỉ khác $0$ với phép nhân. Phần tử đơn vị là $1$, nghịch đảo của $a$ là $1/a$.
- $(\mathbb{Z}/n\mathbb{Z}, +)$: Nhóm các số nguyên modulo $n$. Ví dụ, $\mathbb{Z}/6\mathbb{Z} = \{0, 1, 2, 3, 4, 5\}$ với phép cộng modulo $6$.
- Nhóm điểm trên đường cong elliptic $E(\mathbb{Q})$: Đây chính là ví dụ quan trọng nhất trong sách --- tập hợp các điểm hữu tỉ trên đường cong elliptic $E$, cùng với luật cộng hình học, tạo thành một nhóm Abel.
Ý nghĩa hình học
Hãy tưởng tượng bạn dịch chuyển một điểm trên mặt phẳng: dịch sang phải 3 đơn vị rồi lên 2 đơn vị cho kết quả giống như lên 2 rồi sang phải 3. Nhóm các phép tịnh tiến $(\mathbb{R}^2, +)$ là Abel.
Ngược lại, xoay một vật thể 3 chiều: xoay quanh trục $x$ rồi trục $y$ thường cho kết quả khác với xoay quanh trục $y$ rồi trục $x$. Nhóm xoay $\mathrm{SO}(3)$ không Abel.
Trên đường cong elliptic, phép cộng hai điểm $P + Q$ luôn bằng $Q + P$ --- đây là tính chất đặc biệt bắt nguồn từ hình học đại số của đường cong.
Liên hệ với giả thuyết Birch--Dyer
- Tập các điểm hữu tỉ $E(\mathbb{Q})$ trên đường cong elliptic là một nhóm Abel.
- Định lý Mordell--Weil [mordell1922] khẳng định $E(\mathbb{Q})$ là nhóm Abel hữu hạn sinh (xem Khái niệm 2).
- Giả thuyết BSD liên hệ cấu trúc của nhóm Abel $E(\mathbb{Q})$ (cụ thể là hạng của nó) với tính chất giải tích của hàm $L(E,s)$.
- Nhóm Selmer và nhóm Tate--Shafarevich cũng là các nhóm Abel, đóng vai trò “trung gian” trong việc hiểu $E(\mathbb{Q})$.
Định nghĩa hình thức
Ví dụ
- $G = \mathbb{Z}$: Hạng $r = 1$, không có phần xoắn. Tập sinh $\{1\}$.
- $G = \mathbb{Z}^3$: Hạng $r = 3$. Ví dụ: các véctơ nguyên trong không gian 3 chiều.
- $G = \mathbb{Z}/6\mathbb{Z}$: Hạng $r = 0$, nhóm hữu hạn cấp $6$. Mỗi phần tử $g$ thỏa $6g = 0$.
- $G = \mathbb{Z}^2 \oplus \mathbb{Z}/2\mathbb{Z}$: Hạng $r = 2$ với phần xoắn $\mathbb{Z}/2\mathbb{Z}$. Điều này có nghĩa nhóm có hai phần tử sinh “tự do” và một phần tử cấp $2$.
- Đường cong elliptic: Với $E: y^2 = x^3 - x$ trên $\mathbb{Q}$, ta có $E(\mathbb{Q}) \cong \mathbb{Z}/2\mathbb{Z} \oplus \mathbb{Z}/2\mathbb{Z}$ (hạng $r = 0$). Với $E: y^2 = x^3 - x + 1$ trên $\mathbb{Q}$, ta có $E(\mathbb{Q}) \cong \mathbb{Z}$ (hạng $r = 1$) [silverman2009].
Ý nghĩa hình học
- Phần tự do $\mathbb{Z}^r$: Giống như một lưới $r$ chiều trong không gian. Các phần tử sinh tự do cho phép ta “đi” vô hạn xa theo $r$ hướng độc lập. Số $r$ (hạng) đo “số bậc tự do” của nhóm.
- Phần xoắn $\mathbb{Z}/n_1\mathbb{Z} \oplus \cdots \oplus \mathbb{Z}/n_k\mathbb{Z}$: Các phần tử “quay vòng” --- cộng chúng đủ nhiều lần sẽ quay về $0$. Giống như kim đồng hồ: xoay $12$ lần thì về vị trí cũ.
Liên hệ với giả thuyết Birch--Dyer
- Định lý Mordell--Weil [mordell1922]: Nếu $E$ là đường cong elliptic trên $\mathbb{Q}$, thì $E(\mathbb{Q})$ là nhóm Abel hữu hạn sinh. Do đó:
\[ E(\mathbb{Q}) \cong \mathbb{Z}^r \oplus E(\mathbb{Q})_{\mathrm{tors}}, \]trong đó $r$ là hạng và $E(\mathbb{Q})_{\mathrm{tors}}$ là phần xoắn hữu hạn.
- Giả thuyết BSD yếu nói rằng hạng $r$ (số bậc tự do) bằng bậc triệt tiêu của hàm $L(E,s)$ tại $s = 1$.
- Giả thuyết BSD mạnh cho công thức chính xác chứa cả $|E(\mathbb{Q})_{\mathrm{tors}}|^2$ ở mẫu số.
Định nghĩa hình thức
Nhóm con xoắn của $G$ là tập hợp tất cả các phần tử xoắn:
Trong ngữ cảnh đường cong elliptic, ta viết $E(\mathbb{Q})_{\mathrm{tors}}$ cho nhóm con xoắn của $E(\mathbb{Q})$.
Nếu $E$ là đường cong elliptic trên $\mathbb{Q}$, thì $E(\mathbb{Q})_{\mathrm{tors}}$ đẳng cấu với đúng một trong 15 nhóm sau:
- Nhóm cyclic: $\mathbb{Z}/n\mathbb{Z}$ với $1 \leq n \leq 10$ hoặc $n = 12$.
- Nhóm không cyclic: $\mathbb{Z}/2\mathbb{Z} \oplus \mathbb{Z}/2n\mathbb{Z}$ với $1 \leq n \leq 4$.
Ví dụ
- $E: y^2 = x^3 + 1$ trên $\mathbb{Q}$: $E(\mathbb{Q})_{\mathrm{tors}} \cong \mathbb{Z}/6\mathbb{Z}$. Điểm $(2, 3)$ có cấp $6$: cộng nó $6$ lần cho điểm ở vô cực $\mathcal{O}$.
- $E: y^2 = x^3 - x$ trên $\mathbb{Q}$: $E(\mathbb{Q})_{\mathrm{tors}} \cong \mathbb{Z}/2\mathbb{Z} \oplus \mathbb{Z}/2\mathbb{Z}$. Ba điểm xoắn bậc $2$ là $(0,0)$, $(1,0)$, $(-1,0)$ --- đây là các điểm có $y = 0$, tức tiếp tuyến đứng, nên $2P = \mathcal{O}$.
- $E: y^2 = x^3 - 2$ trên $\mathbb{Q}$: $E(\mathbb{Q})_{\mathrm{tors}} = \{{\mathcal{O}}\}$ --- không có phần tử xoắn nào ngoài phần tử đơn vị.
Ý nghĩa hình học
Hình dung đường cong elliptic như một vòng dây cao su méo. Các điểm xoắn bậc $2$ (với $2P = \mathcal{O}$) chính là các điểm trên trục $x$ (có $y = 0$): từ điểm đó, đường thẳng “tiếp tuyến” đi thẳng đứng lên vô cực.
Các điểm xoắn bậc $3$ (với $3P = \mathcal{O}$) là các điểm uốn (inflection point) của đường cong --- nơi tiếp tuyến cắt đường cong tại chính điểm đó (với bội $3$).
Định lý Mazur nói rằng trên $\mathbb{Q}$, số lượng “kiểu quay vòng” có thể xảy ra rất hạn chế --- chỉ có 15 khả năng.
Liên hệ với giả thuyết Birch--Dyer
Hơn nữa, nhờ Định lý Mazur, phần xoắn hoàn toàn xác định được --- đây là thành phần “dễ tính nhất” trong công thức BSD [mazur1977].
Định nghĩa hình thức
Tương đương, hạng bằng số phần tử trong một tập sinh cực đại gồm các phần tử độc lập tuyến tính trên $\mathbb{Z}$ modulo phần xoắn [silverman2009].
Trong ngữ cảnh đường cong elliptic, hạng đại số (algebraic rank) $r = \mathrm{rk}(E(\mathbb{Q}))$ là hạng của nhóm Mordell--Weil $E(\mathbb{Q})$.
Ví dụ
- Hạng $0$: $E: y^2 = x^3 + 1$. Ta có $E(\mathbb{Q}) \cong \mathbb{Z}/6\mathbb{Z}$: mọi điểm hữu tỉ đều là xoắn. Không có “hướng tự do” nào.
- Hạng $1$: $E: y^2 = x^3 - x + 1$. Ở đây $E(\mathbb{Q}) \cong \mathbb{Z}$, sinh bởi một điểm $P$. Mọi điểm hữu tỉ đều có dạng $nP$ với $n \in \mathbb{Z}$.
- Hạng $2$: $E: y^2 = x^3 - 5x + 4$. Ta có $E(\mathbb{Q}) \cong \mathbb{Z}^2$: có hai điểm sinh độc lập $P_1, P_2$, mọi điểm có dạng $n_1 P_1 + n_2 P_2$.
- Hạng lớn: Kỷ lục hiện tại (tính đến 2024) là các đường cong có hạng $\geq 28$, do Elkies phát hiện [elkies2006]. Câu hỏi “hạng có bị chặn hay không?” vẫn chưa có lời giải.
Ý nghĩa hình học
- $r = 0$: Chỉ có hữu hạn điểm hữu tỉ (các điểm xoắn). Tập nghiệm “rời rạc”.
- $r = 1$: Điểm hữu tỉ nằm trên một “dãy” --- từ một điểm sinh $P$, ta tạo ra $2P$, $3P$, $\ldots$ Về mặt hình học, các điểm này trải dài trên đường cong, ngày càng phức tạp (tọa độ có tử/mẫu rất lớn).
- $r = 2$: Hai “dãy” độc lập. Điểm hữu tỉ “phủ dày” đường cong hơn.
Liên hệ với giả thuyết Birch--Dyer
Giả thuyết BSD yếu: $\mathrm{rk}(E(\mathbb{Q})) = \mathrm{ord}_{s=1} L(E,s)$.
Tức là, hạng đại số (đo bằng cấu trúc nhóm) bằng hạng giải tích (đo bằng bậc triệt tiêu của hàm $L$). Đây là cầu nối giữa đại số và giải tích --- hai thế giới hoàn toàn khác nhau trong toán học.
Các kết quả đã biết [coates-wiles1977, gross-zagier1986, kolyvagin1990]:
- Nếu $\mathrm{ord}_{s=1} L(E,s) = 0$ thì $\mathrm{rk}(E(\mathbb{Q})) = 0$ (Kolyvagin, dựa trên Gross--Zagier).
- Nếu $\mathrm{ord}_{s=1} L(E,s) = 1$ thì $\mathrm{rk}(E(\mathbb{Q})) = 1$ (Gross--Zagier + Kolyvagin).
- Trường hợp $\mathrm{ord}_{s=1} L(E,s) \geq 2$ vẫn hoàn toàn mở.
Định nghĩa hình thức
- $(R, +)$ là nhóm Abel (với phần tử đơn vị $0$);
- Phép nhân kết hợp: $(a \cdot b) \cdot c = a \cdot (b \cdot c)$ với mọi $a, b, c \in R$;
- Phân phối: $a \cdot (b + c) = a \cdot b + a \cdot c$ và $(a + b) \cdot c = a \cdot c + b \cdot c$.
Ví dụ
- $\mathbb{Z}$: Vành các số nguyên --- vành giao hoán có đơn vị đơn giản nhất.
- $\mathbb{Z}[i] = \{a + bi : a, b \in \mathbb{Z}\}$: Vành các số nguyên Gauss. Đây là một vành các số nguyên đại số trong trường $\mathbb{Q}(i)$.
- $\mathbb{Z}/n\mathbb{Z}$: Vành các số nguyên modulo $n$. Ví dụ $\mathbb{Z}/6\mathbb{Z}$ có ước của không ($2 \cdot 3 = 0$ trong $\mathbb{Z}/6\mathbb{Z}$), nên không phải miền nguyên.
- $M_2(\mathbb{Z})$: Vành ma trận $2 \times 2$ với hệ số nguyên --- đây là vành không giao hoán.
- $\mathrm{End}(E)$: Vành tự đồng cấu của đường cong elliptic $E$. Thông thường $\mathrm{End}(E) \cong \mathbb{Z}$ (phép nhân vô hướng), nhưng với đường cong có nhân phức (CM), $\mathrm{End}(E)$ lớn hơn --- chẳng hạn $\mathrm{End}(E) \cong \mathbb{Z}[i]$ cho $E: y^2 = x^3 - x$ [silverman2009, cox2013].
Ý nghĩa hình học
- $\mathbb{Z}$ luôn đóng vai trò vành hệ số cơ bản: ta có thể nhân phần tử $g \in G$ với $n \in \mathbb{Z}$ bằng cách cộng $g$ với chính nó $n$ lần.
- Nếu $G = E(\overline{\mathbb{Q}})$ (các điểm trên bao đóng đại số), thì $\mathrm{End}(E)$ mô tả mọi “phép biến đổi nội tại” của đường cong --- đây là cấu trúc phong phú hơn nhiều so với chỉ nhân vô hướng.
Liên hệ với giả thuyết Birch--Dyer
- $\mathrm{End}(E)$: Xác định đường cong có nhân phức (CM) hay không. Trường hợp CM là trường hợp “dễ nhất” mà BSD đã được chứng minh (Coates--Wiles [coates-wiles1977], Rubin [rubin1987]).
- $\mathbb{Z}_p$ (vành các số nguyên $p$-adic): Nền tảng cho hàm $L$ $p$-adic và lý thuyết Iwasawa.
- Vành Hecke $\mathbb{T}$: Đóng vai trò then chốt trong chứng minh Wiles ($R = \mathbb{T}$) [wiles1995].
- Vành biến dạng $R$: Tham số hóa các biểu diễn Galois --- trung tâm của phương pháp Taylor--Wiles [taylor-wiles1995].
Định nghĩa hình thức
- $(K, +)$ là nhóm Abel (phần tử đơn vị $0$);
- $(K \setminus \{0\}, \cdot)$ là nhóm Abel (phần tử đơn vị $1$);
- Phân phối: $a \cdot (b + c) = a \cdot b + a \cdot c$ với mọi $a, b, c \in K$.
Ví dụ
- $\mathbb{Q}$ (số hữu tỉ): Trường nhỏ nhất chứa $\mathbb{Z}$. Đường cong elliptic được nghiên cứu chủ yếu trên $\mathbb{Q}$ trong bối cảnh BSD.
- $\mathbb{R}$ (số thực): Trên $\mathbb{R}$, đường cong elliptic $y^2 = x^3 + ax + b$ có dạng hình học quen thuộc --- một hoặc hai “nhánh” liên thông.
- $\mathbb{C}$ (số phức): Trên $\mathbb{C}$, mọi đường cong elliptic đẳng cấu với một torus (bánh donut) $\mathbb{C}/\Lambda$, nhờ hàm $\wp$ của Weierstrass.
- $\mathbb{F}_p = \mathbb{Z}/p\mathbb{Z}$ (trường hữu hạn): Với $p$ nguyên tố, ta đếm số điểm $\#E(\mathbb{F}_p) = p + 1 - a_p$, trong đó $a_p$ là vết Frobenius --- dữ liệu đầu vào để xây dựng hàm $L(E,s)$.
- $\mathbb{Q}_p$ (số $p$-adic): Hoàn thành $\mathbb{Q}$ theo trị tuyệt đối $p$-adic. Đường cong trên $\mathbb{Q}_p$ cung cấp thông tin “cục bộ” --- điều kiện cục bộ xác định nhóm Selmer.
- $\mathbb{Q}(\sqrt{-D})$ (trường phức bậc hai ảo): Nơi sinh sống của điểm Heegner --- công cụ chính trong chứng minh Gross--Zagier.
Ý nghĩa hình học
- Cùng một phương trình $y^2 = x^3 - x$, nhưng trên các trường khác nhau cho các “thế giới” hoàn toàn khác:
- Trên $\mathbb{R}$: đường cong trơn trong mặt phẳng thực, có hai nhánh.
- Trên $\mathbb{C}$: torus phức (bánh donut), có cấu trúc phong phú.
- Trên $\mathbb{F}_5$: chỉ có hữu hạn điểm: $(0,0), (1,0), (4,0)$ cùng $\mathcal{O}$.
- Trên $\mathbb{Q}$: bốn điểm hữu tỉ.
Liên hệ với giả thuyết Birch--Dyer
- $\mathbb{Q}$: BSD cổ điển nghiên cứu $E(\mathbb{Q})$ và $L(E,s)$.
- $\mathbb{F}_p$: Số điểm $\#E(\mathbb{F}_p)$ cho dữ liệu $a_p$ để xây dựng $L(E,s) = \prod_p L_p(E,s)$.
- $\mathbb{Q}_p$: Điều kiện cục bộ trong nhóm Selmer; hàm $L$ $p$-adic; lý thuyết Iwasawa.
- $\mathbb{C}$: Thác triển giải tích của $L(E,s)$; đường cong modular; dạng modular.
- Trường số $K/\mathbb{Q}$: BSD tổng quát hóa cho $E(K)$ --- ví dụ, BSD đẳng biến.
- Trường phức bậc hai ảo $\mathbb{Q}(\sqrt{-D})$: Xây dựng điểm Heegner [gross-zagier1986], bước then chốt trong chứng minh BSD cho hạng $1$.
Định nghĩa hình thức
Tương đương, $K = \mathbb{Q}(\alpha)$ cho một số đại số $\alpha$ nào đó --- tức $\alpha$ là nghiệm của một đa thức $f(x) \in \mathbb{Q}[x]$ bất khả quy.
Ví dụ
- $\mathbb{Q}$ chính nó: Trường số đơn giản nhất, bậc $[\mathbb{Q} : \mathbb{Q}] = 1$.
- $\mathbb{Q}(\sqrt{2})$: Trường bậc $2$ gồm các số dạng $a + b\sqrt{2}$ với $a, b \in \mathbb{Q}$. Vành số nguyên $\mathcal{O}_{\mathbb{Q}(\sqrt{2})} = \mathbb{Z}[\sqrt{2}] = \{a + b\sqrt{2} : a, b \in \mathbb{Z}\}$.
- $\mathbb{Q}(i) = \mathbb{Q}(\sqrt{-1})$: Trường Gauss, bậc $2$. Vành số nguyên $\mathcal{O}_{\mathbb{Q}(i)} = \mathbb{Z}[i]$ (số nguyên Gauss).
- $\mathbb{Q}(\sqrt{-D})$ với $D > 0$: Trường phức bậc hai ảo --- đặc biệt quan trọng cho điểm Heegner (xem Khái niệm 9).
- $\mathbb{Q}(\zeta_n)$ với $\zeta_n = e^{2\pi i/n}$: Trường cyclotomic bậc $\phi(n)$. Đóng vai trò trong lý thuyết Iwasawa qua tháp cyclotomic $\mathbb{Q}(\zeta_{p^n})$.
Ý nghĩa hình học
Với trường số $K$ bậc $n = [K:\mathbb{Q}]$, vành số nguyên $\mathcal{O}_K$ có thể nhúng vào $\mathbb{R}^n$ như một lưới (lattice) --- tập rời rạc các điểm phân bố đều đặn.
Ví dụ: $\mathbb{Z}[i] \subset \mathbb{C} \cong \mathbb{R}^2$ tạo thành lưới vuông trên mặt phẳng --- mỗi số nguyên Gauss $a + bi$ tương ứng với điểm $(a, b)$. Hình học của lưới này (thể tích ô cơ sở, v.v.) mã hóa các bất biến số học (biệt thức, regulator) của trường số.
Triết lý “hình học của số” (geometry of numbers) --- do Minkowski phát triển --- sử dụng hình dạng của các lưới này để chứng minh các kết quả số học. Bhargava đã mở rộng ý tưởng này một cách sáng tạo để nghiên cứu nhóm Selmer [bhargava-shankar2015].
Liên hệ với giả thuyết Birch--Dyer
- BSD trên trường số: Giả thuyết BSD tổng quát hóa cho $E(K)$ với trường số $K$ bất kỳ, dự đoán $\mathrm{rk}(E(K)) = \mathrm{ord}_{s=1} L(E/K, s)$.
- Điểm Heegner: Xây dựng trên trường phức bậc hai ảo $K = \mathbb{Q}(\sqrt{-D})$, sau đó “kéo xuống” $\mathbb{Q}$ qua trace map --- trung tâm của chứng minh Gross--Zagier [gross-zagier1986].
- Hệ thống Euler: Sử dụng tháp trường số $K \subset K_1 \subset K_2 \subset \cdots$ để xây dựng các lớp đối đồng điều tương thích [kolyvagin1990, rubin2000].
- Lý thuyết trường lớp: Liên hệ nhóm Galois $\mathrm{Gal}(K^{\mathrm{ab}}/K)$ với nhóm idèle --- nền tảng cho việc hiểu biểu diễn Galois.
Định nghĩa hình thức
Trường hợp quan trọng nhất: $\mathbb{F}_p = \mathbb{Z}/p\mathbb{Z}$ --- trường các số nguyên modulo $p$ [silverman2009].
Ví dụ
| $x$ | $x^3 + 1 \pmod{7}$ | QR? | Điểm $(x,y)$ |
|---|---|---|---|
| $0$ | $1$ | $1 = 1^2$ | $(0, 1), (0, 6)$ |
| $1$ | $2$ | Không | --- |
| $2$ | $2$ | Không | --- |
| $3$ | $0$ | $0 = 0^2$ | $(3, 0)$ |
| $4$ | $2$ | Không | --- |
| $5$ | $0$ | $0 = 0^2$ | $(5, 0)$ |
| $6$ | $0$ | $0 = 0^2$ | $(6, 0)$ |
Vậy $\#E(\mathbb{F}_7) = 5 + 1 = 6$ (5 điểm affine cộng điểm vô cực $\mathcal{O}$).
Vết Frobenius: $a_7 = 7 + 1 - 6 = 2$. Kiểm tra cận Hasse: $|a_7| = 2 \leq 2\sqrt{7} \approx 5{,}29$ --- thỏa mãn.
Ý nghĩa hình học
Hình dung: thay vì mặt phẳng thực vô hạn, ta làm việc trên “bàn cờ” $p \times p$ ô. Đường cong chỉ “chạy qua” một số ô nhất định. Nhưng đáng kinh ngạc là: phép cộng hình học (kẻ đường thẳng qua hai điểm, tìm giao điểm thứ ba) vẫn có nghĩa trên bàn cờ rời rạc này!
Số điểm $\#E(\mathbb{F}_p)$ dao động quanh $p + 1$ theo cận Hasse: $|p + 1 - \#E(\mathbb{F}_p)| \leq 2\sqrt{p}$ [hasse1933]. Sự dao động này, khi $p$ chạy qua tất cả các nguyên tố, chính là “nhịp đập” mà hàm $L$ ghi nhận.
Liên hệ với giả thuyết Birch--Dyer
- Số điểm $\#E(\mathbb{F}_p)$ xác định vết Frobenius $a_p = p + 1 - \#E(\mathbb{F}_p)$.
- Hàm $L$ được xây dựng từ tích Euler:
\[ L(E,s) = \prod_{p \text{ tốt}} \frac{1}{1 - a_p p^{-s} + p^{1-2s}} \cdot \prod_{p \text{ xấu}} (\text{nhân tử đơn giản hơn}). \]
- Ý tưởng ban đầu của Birch--Swinnerton-Dyer [birch-sd1963]: Nếu $E(\mathbb{Q})$ có nhiều điểm hữu tỉ (hạng lớn), thì $E(\mathbb{F}_p)$ “xu hướng” có nhiều điểm hơn trung bình cho mỗi $p$, khiến tích $\prod_{p \leq X} \frac{\#E(\mathbb{F}_p)}{p}$ tăng nhanh. Đây chính là quan sát thực nghiệm dẫn đến giả thuyết BSD.
- Thuật toán Schoof [schoof1985] cho phép tính $a_p$ hiệu quả, từ đó kiểm nghiệm BSD bằng máy tính.
Định nghĩa hình thức
Ví dụ
- $\mathbb{Q}(i) = \mathbb{Q}(\sqrt{-1})$: $\mathcal{O}_K = \mathbb{Z}[i]$, biệt thức $d_K = -4$. Số lớp $h_K = 1$ (phân tích duy nhất). Liên quan đến đường cong CM $y^2 = x^3 - x$.
- $\mathbb{Q}(\sqrt{-3})$: $\mathcal{O}_K = \mathbb{Z}\left[\frac{1+\sqrt{-3}}{2}\right] = \mathbb{Z}[\omega]$ (số nguyên Eisenstein, $\omega = e^{2\pi i/3}$). Số lớp $h_K = 1$. Liên quan đến đường cong CM $y^2 = x^3 + 1$.
- $\mathbb{Q}(\sqrt{-5})$: $\mathcal{O}_K = \mathbb{Z}[\sqrt{-5}]$, số lớp $h_K = 2$. Không có phân tích duy nhất: $6 = 2 \cdot 3 = (1+\sqrt{-5})(1-\sqrt{-5})$.
- $\mathbb{Q}(\sqrt{-163})$: Số lớp $h_K = 1$. Liên quan đến hằng số Ramanujan: $e^{\pi\sqrt{163}} \approx 262537412640768744$ (gần nguyên đáng kinh ngạc!).
Ý nghĩa hình học
- $\mathbb{Z}[i]$: lưới vuông (mỗi ô cơ sở là hình vuông đơn vị).
- $\mathbb{Z}[\omega]$: lưới tam giác đều (mỗi ô cơ sở là hình bình hành với góc $60°$).
- $\mathbb{Z}[\sqrt{-5}]$: lưới hình chữ nhật (chiều $1 \times \sqrt{5}$).
Liên hệ với giả thuyết Birch--Dyer
- Nhân phức (CM): Đường cong elliptic có $\mathrm{End}(E) \cong \mathcal{O}_K$ (cho trường phức bậc hai ảo $K$) được gọi là đường cong CM. Định lý Coates--Wiles [coates-wiles1977]: Nếu $E$ có CM và $L(E,1) \neq 0$ thì $E(\mathbb{Q})$ hữu hạn --- đây là kết quả đầu tiên theo hướng BSD.
- Điểm Heegner: Cho $K = \mathbb{Q}(\sqrt{-D})$ thỏa điều kiện Heegner ($D$ tách hoàn toàn trong $\mathbb{Z}/N\mathbb{Z}$). Khi đó ta xây dựng được điểm Heegner $P_K \in E(K)$, rồi chiếu xuống $E(\mathbb{Q})$ qua trace map. Công thức Gross--Zagier [gross-zagier1986]:
\[ L'(E,1) = c \cdot \hat{h}(P_K), \]với $c > 0$ tường minh. Nếu $L'(E,1) \neq 0$ thì $P_K$ là điểm có chiều cao dương --- tức có bậc vô hạn, suy ra $\mathrm{rk}(E(\mathbb{Q})) \geq 1$.
- Kolyvagin [kolyvagin1990]: Kết hợp với Gross--Zagier, chứng minh $L'(E,1) \neq 0 \Rightarrow \mathrm{rk}(E(\mathbb{Q})) = 1$ và $|\mathrm{Sha}| < \infty$.
Định nghĩa hình thức
- $(\mathbb{Z}, +)$ là nhóm Abel (phần tử đơn vị $0$);
- $(\mathbb{Z}, +, \cdot)$ là miền nguyên (không có ước của không);
- $\mathbb{Z}$ là vành chính (mọi ideal đều chính: $I = (n)$ cho $n \in \mathbb{Z}$);
- $\mathbb{Z}$ là vành phân tích duy nhất (mọi số nguyên $n \neq 0, \pm 1$ phân tích duy nhất thành tích các nguyên tố) [lang1983].
Ví dụ
- Bộ ba Pythagoras: $x^2 + y^2 = z^2$ với $x, y, z \in \mathbb{Z}$. Nghiệm: $(3, 4, 5)$, $(5, 12, 13)$, $\ldots$ --- có vô hạn nghiệm, tham số hóa hoàn toàn.
- Định lý cuối Fermat: $x^n + y^n = z^n$ không có nghiệm nguyên dương với $n \geq 3$ [wiles1995].
- Đường cong elliptic: Tìm điểm $(x, y) \in \mathbb{Q}^2$ trên $y^2 = x^3 + ax + b$ (với $a, b \in \mathbb{Z}$). Đây là bài toán Diophantus “bậc hai” mà BSD nghiên cứu.
Ý nghĩa hình học
- $\mathbb{Z}^2 = \mathbb{Z} \times \mathbb{Z}$: lưới vuông trên mặt phẳng.
- $\mathbb{Z}[i]$, $\mathbb{Z}[\omega]$: lưới trong mặt phẳng phức (số nguyên đại số).
- $\mathbb{Z}_p$ (số nguyên $p$-adic): hoàn thành $\mathbb{Z}$ theo chuẩn $p$-adic.
Liên hệ với giả thuyết Birch--Dyer
- Hệ số $a, b$ trong phương trình Weierstrass $y^2 = x^3 + ax + b$ thuộc $\mathbb{Z}$ (sau khi đưa về mô hình tối thiểu).
- Hạng $r = \mathrm{rk}(E(\mathbb{Q}))$ là một số nguyên --- và BSD dự đoán $r = \mathrm{ord}_{s=1} L(E,s)$.
- Conductor $N_E$, số Tamagawa $c_p$, và $|\mathrm{Sha}|$ đều là các số nguyên dương.
- Công thức BSD mạnh dự đoán đẳng thức giữa các đại lượng hữu tỉ --- cuối cùng quy về quan hệ giữa các số nguyên.
Định nghĩa hình thức
Ví dụ
Bắt đầu từ $P = (1,1)$, phép nhân đôi cho:
Ý nghĩa hình học
Với đường cong elliptic, tình huống tương tự: $E(\mathbb{Q})$ là tập “rời rạc” (dù vô hạn nếu $r > 0$) bên trong $E(\mathbb{R})$ liên tục. Giả thuyết BSD nói về “mật độ” của $E(\mathbb{Q})$ bên trong $E(\mathbb{R})$ --- mật độ này được mã hóa bởi hàm $L(E,s)$.
Triết lý “cục bộ--toàn cục”: $\mathbb{Q}$ nhúng vào mọi hoàn thành $\mathbb{Q}_p$ và $\mathbb{R}$. Một điểm hữu tỉ tồn tại trên $E(\mathbb{Q})$ khi và chỉ khi nó tồn tại “cục bộ” trên mọi $E(\mathbb{Q}_p)$ và vượt qua “chướng ngại” $\mathrm{Sha}$ (nhóm Tate--Shafarevich).
Liên hệ với giả thuyết Birch--Dyer
- Câu hỏi cốt lõi: Tập $E(\mathbb{Q})$ “lớn” cỡ nào? (Hạng bằng bao nhiêu?)
- Trả lời dự đoán: Hạng bằng bậc triệt tiêu $\mathrm{ord}_{s=1} L(E,s)$.
- Mọi thành phần trong công thức BSD (hạng, phần xoắn, regulator, Sha, Tamagawa, chu kỳ thực) đều liên quan đến tập $E(\mathbb{Q})$ hoặc thông tin “cục bộ” trên $\mathbb{Q}_p$.
- Sự mở rộng sang trường số $K \supset \mathbb{Q}$ cho BSD tổng quát hơn, nhưng phiên bản trên $\mathbb{Q}$ vẫn là phiên bản được nghiên cứu sâu nhất và có nhiều kết quả nhất.
Định nghĩa hình thức
- $(I, +)$ là nhóm con của $(R, +)$ (đặc biệt $0 \in I$);
- Với mọi $r \in R$ và $a \in I$, ta có $ra \in I$ (đóng kín khi nhân với phần tử bất kỳ của $R$).
Ideal $\mathfrak{p}$ được gọi là nguyên tố (prime ideal) nếu $ab \in \mathfrak{p} \Rightarrow a \in \mathfrak{p}$ hoặc $b \in \mathfrak{p}$ [lang1983].
Ví dụ
- Trong $\mathbb{Z}$: Mọi ideal đều chính --- $I = (n)$ cho $n \in \mathbb{Z}$. Ví dụ $(6) = \{0, \pm 6, \pm 12, \ldots\}$. Ideal nguyên tố là $(p)$ với $p$ nguyên tố, và $(0)$.
- Trong $\mathbb{Z}[\sqrt{-5}]$: Ideal $(6) = (2)(3)$, nhưng cũng $(6) = (1+\sqrt{-5})(1-\sqrt{-5})$. Vấn đề: $2$ và $3$ không phải phần tử nguyên tố trong $\mathbb{Z}[\sqrt{-5}]$! Tuy nhiên, ở mức ideal:
\[ (2) = \mathfrak{p}_2^2, \quad (3) = \mathfrak{p}_3 \overline{\mathfrak{p}}_3 \]với $\mathfrak{p}_2 = (2, 1+\sqrt{-5})$ và $\mathfrak{p}_3 = (3, 1+\sqrt{-5})$. Phân tích ideal luôn duy nhất --- đây là kết quả nền tảng của Dedekind.
- Trong $\mathcal{O}_K$ (vành số nguyên của trường số $K$): Mọi ideal phân tích duy nhất thành tích các ideal nguyên tố. Số lớp $h_K$ đo “mức độ thất bại” của phân tích duy nhất ở mức phần tử: $h_K = 1$ khi và chỉ khi mọi ideal đều chính.
Ý nghĩa hình học
Ví dụ: trong $\mathbb{Z}[i]$, ideal $(2+i)$ tương ứng với lưới con gồm tất cả bội số Gauss của $2+i$. Lưới này “thưa hơn” lưới ban đầu --- chuẩn (norm) $N(2+i) = 5$ cho biết chỉ số: $[\mathbb{Z}[i] : (2+i)] = 5$.
Nhóm lớp $\mathrm{Cl}(K) = \{\text{ideal phân số}\}/\{\text{ideal chính}\}$ đo “sự khác biệt” giữa ideal và phần tử --- nó là nhóm Abel hữu hạn với $|\mathrm{Cl}(K)| = h_K$.
Liên hệ với giả thuyết Birch--Dyer
- Conductor: $N_E = \prod_p p^{f_p}$ là ideal trong $\mathbb{Z}$ (hay số nguyên dương) đo “mức độ rút gọn xấu” của $E$. Conductor xuất hiện trong phương trình hàm của $L(E,s)$ và xác định đường cong modular $X_0(N_E)$ liên kết với $E$ [silverman2009].
- Nhóm lớp và $\mathrm{Sha}$: Nhóm Tate--Shafarevich $\mathrm{Sha}(E/\mathbb{Q})$ là tương tự của nhóm lớp $\mathrm{Cl}(K)$. Cả hai đo “chướng ngại cục bộ--toàn cục”:
- $\mathrm{Cl}(K) = 1 \iff$ phân tích duy nhất trong $\mathcal{O}_K$.
- $\mathrm{Sha}(E/\mathbb{Q}) = 0 \iff$ nguyên lý Hasse đúng cho mọi torsor của $E$.
• Lý thuyết Iwasawa: Module Iwasawa có chuỗi đặc trưng (characteristic ideal) trong đại số Iwasawa $\Lambda$ --- phỏng đoán chính Iwasawa liên hệ ideal này với hàm $L$ $p$-adic.
Định nghĩa hình thức
- $\mathcal{O}$ là $\mathbb{Z}$-module tự do hạng $n$ (tức $\mathcal{O} \cong \mathbb{Z}^n$ như nhóm Abel);
- $\mathcal{O}$ chứa $1$ (có đơn vị);
- $\mathcal{O} \otimes_\mathbb{Z} \mathbb{Q} = K$ (sinh ra $K$ trên $\mathbb{Q}$).
Ví dụ
- Order cực đại: $\mathcal{O}_K$. Ví dụ $K = \mathbb{Q}(i)$, $\mathcal{O}_K = \mathbb{Z}[i]$.
- Order conductor $f$: $\mathcal{O}_f = \mathbb{Z} + f\mathcal{O}_K$. Ví dụ:
- $K = \mathbb{Q}(i)$, $f = 2$: $\mathcal{O}_2 = \mathbb{Z} + 2\mathbb{Z}[i] = \mathbb{Z}[2i] = \{a + 2bi : a, b \in \mathbb{Z}\}$.
- $K = \mathbb{Q}(\sqrt{-3})$, $f = 1$: $\mathcal{O}_1 = \mathcal{O}_K = \mathbb{Z}\left[\frac{1+\sqrt{-3}}{2}\right]$.
- $K = \mathbb{Q}(\sqrt{-3})$, $f = 2$: $\mathcal{O}_2 = \mathbb{Z}[{\sqrt{-3}}]$ (nhỏ hơn $\mathcal{O}_K$).
- Biệt thức: Order $\mathcal{O}_f$ có biệt thức $d_f = f^2 d_K$.
Ý nghĩa hình học
Ví dụ: $\mathbb{Z}[i]$ tạo lưới vuông cạnh $1$. Order $\mathbb{Z}[2i]$ tạo lưới hình chữ nhật $1 \times 2$ --- thưa gấp đôi theo phương ảo.
Trong ngôn ngữ torus phức: $\mathbb{C}/\mathcal{O}_K$ và $\mathbb{C}/\mathcal{O}_f$ là hai đường cong elliptic khác nhau (nhưng liên quan bởi isogeny bậc $f$).
Liên hệ với giả thuyết Birch--Dyer
- Đường cong elliptic $E$ có nhân phức bởi order $\mathcal{O}$ khi $\mathrm{End}(E) \cong \mathcal{O}$. Thông thường $\mathcal{O} = \mathcal{O}_K$ (order cực đại), nhưng cũng có thể là order nhỏ hơn.
- Lý thuyết trường lớp liên hệ các order với trường lớp vòng (ring class field): trường $H_f$ sao cho $\mathrm{Gal}(H_f/K) \cong \mathrm{Cl}(\mathcal{O}_f)$ --- nhóm lớp của order [cox2013].
- Điểm Heegner trên $X_0(N)$ được xây dựng từ các order $\mathcal{O}_f$ thỏa điều kiện Heegner. Conductor $f$ xác định “tầng” nào của tháp trường lớp mà điểm Heegner sống.
- Công thức Gross--Zagier [gross-zagier1986] sử dụng điểm Heegner ứng với $f = 1$ (order cực đại), nhưng các tổng quát hóa (Yuan--Zhang--Zhang [yuan-zhang-zhang2013]) cho phép $f > 1$.
Định nghĩa hình thức
Tương đương, $E$ có thể biểu diễn bằng phương trình Weierstrass:
- Phần tử đơn vị: điểm ở vô cực $\mathcal{O}$;
- Phần tử nghịch đảo: $-P = (x, -y - a_1 x - a_3)$ nếu $P = (x,y)$;
- Phép cộng: xác định bởi luật “ba điểm thẳng hàng có tổng bằng $\mathcal{O}$” [silverman-tate2015].
Ví dụ
- $E: y^2 = x^3 - x$ --- Đường cong có nhân phức bởi $\mathbb{Z}[i]$. Trên $\mathbb{Q}$: $E(\mathbb{Q}) \cong \mathbb{Z}/2\mathbb{Z} \oplus \mathbb{Z}/2\mathbb{Z}$ (hạng $0$). Đây là đường cong trong định lý Coates--Wiles [coates-wiles1977].
- $E: y^2 = x^3 - x + 1$ --- Hạng $1$, $E(\mathbb{Q}) \cong \mathbb{Z}$.
- $E: y^2 = x^3 - 43x + 166$ --- Conductor $N = 37$, đường cong elliptic đầu tiên (theo conductor). Hạng $1$, điểm sinh $P = (0, \sqrt{166})$... thực ra $(0, \pm\sqrt{166}) \notin \mathbb{Q}$, nhưng $(-2, 12) \in E(\mathbb{Q})$, và $E(\mathbb{Q}) \cong \mathbb{Z}$ sinh bởi $(-2, 12)$.
- $E: y^2 + y = x^3 - x$ --- Conductor $N = 37$ (một đường cong khác). Hạng $0$, $E(\mathbb{Q}) \cong \mathbb{Z}/3\mathbb{Z}$.
- Đường cong Frey: $E_{a,b}: y^2 = x(x-a^p)(x+b^p)$ --- đường cong liên kết phản chứng với Fermat, dẫn đến chứng minh Wiles [wiles1995].
Ý nghĩa hình học
Trên $\mathbb{R}$: Đường cong trơn trong mặt phẳng, có một hoặc hai thành phần liên thông. Khi $\Delta > 0$: hai nhánh (một “ốc đảo” và một “dải” vô hạn). Khi $\Delta < 0$: một nhánh liên thông.
Trên $\mathbb{C}$: Đường cong đẳng cấu với torus phức $\mathbb{C}/\Lambda$ --- hình bánh donut! Phép đẳng cấu qua hàm $\wp$ Weierstrass:
Trên $\mathbb{F}_p$: Tập hữu hạn $\sim p$ điểm, nhưng vẫn mang cấu trúc nhóm. Hình dung: “bàn cờ” $p \times p$ với một số ô được đánh dấu.
Đặc biệt: Đường cong elliptic là đường cong đại số duy nhất (genus $1$) mà tập điểm tự nó mang cấu trúc nhóm. Đường cong genus $0$ (đường thẳng, conic) quá đơn giản; đường cong genus $\geq 2$ (theo định lý Faltings) chỉ có hữu hạn điểm hữu tỉ. Genus $1$ là “điểm ngọt” (sweet spot) --- đủ phức tạp để thú vị, đủ đơn giản để nghiên cứu được.
Liên hệ với giả thuyết Birch--Dyer
- BSD yếu: $\mathrm{rk}(E(\mathbb{Q})) = \mathrm{ord}_{s=1} L(E,s)$.
- BSD mạnh: Công thức chính xác cho $\lim_{s \to 1} \frac{L(E,s)}{(s-1)^r}$ qua các bất biến của $E$.
- Mọi khái niệm khác trong sách (hàm $L$, nhóm Selmer, dạng modular, hệ thống Euler, ...) đều là “công cụ” để hiểu đường cong elliptic.
- Giải thưởng Clay $1.000.000 [clay2000] dành cho ai chứng minh (hoặc bác bỏ) BSD cho mọi đường cong elliptic trên $\mathbb{Q}$.
Định nghĩa hình thức
Đường cong trơn khi và chỉ khi $\Delta \neq 0$ [silverman2009].
Ví dụ
- Đặc số $2$: Trên $\mathbb{F}_2$, không thể “hoàn thành bình phương” để loại bỏ $a_1 xy$ và $a_3 y$ (vì $2 = 0$). Dạng tổng quát là bắt buộc.
- Mô hình tối thiểu: Khi làm việc trên $\mathbb{Z}$ (hoặc $\mathbb{Z}_p$), dạng tổng quát cho phép hệ số nguyên với $|\Delta|$ nhỏ nhất. Ví dụ: $E: y^2 + y = x^3 - x$ có $\Delta = -37$ (tối thiểu!), trong khi dạng rút gọn $y^2 = x^3 - x + 1/4$ có hệ số không nguyên.
- $E: y^2 + xy + y = x^3 + x^2$ --- Conductor $N = 11$. Đây là đường cong elliptic với conductor nhỏ nhất có thể.
Ý nghĩa hình học
Thực tế, mọi đường cong elliptic đều có thể đưa về dạng Weierstrass bằng phép đổi biến hữu tỉ. Đây là kết quả cổ điển: genus $1$ + có điểm hữu tỉ $\Rightarrow$ tồn tại nhúng vào $\mathbb{P}^2$ dưới dạng đường cong bậc $3$ (cubic), và từ cubic luôn biến đổi được về Weierstrass.
Năm hệ số $(a_1, a_2, a_3, a_4, a_6)$ là “thừa” --- đường cong chỉ có $1$ tham số thực sự ($j$-bất biến). Nhưng sự “thừa” này cho phép linh hoạt: chọn hệ số tốt cho mỗi mục đích (tối thiểu trên $\mathbb{Z}$, rút gọn trên $\mathbb{Q}$, v.v.).
Liên hệ với giả thuyết Birch--Dyer
- Từ các hệ số $(a_1, \ldots, a_6)$, ta tính: biệt thức $\Delta$, $j$-bất biến, conductor $N_E$, rút gọn modulo $p$, vết Frobenius $a_p$, và hàm $L(E,s)$.
- Mô hình tối thiểu: Để tính chính xác các thành phần BSD mạnh (số Tamagawa $c_p$, chu kỳ thực $\Omega_E$), cần phương trình ở dạng tối thiểu trên $\mathbb{Z}$.
- Cơ sở dữ liệu Cremona [cremona1997] và LMFDB lưu trữ đường cong dưới dạng Weierstrass tối thiểu, cho phép kiểm nghiệm BSD một cách hệ thống.
Định nghĩa hình thức
Ví dụ
- Thay $y \leftarrow y - \frac{1}{2}(x + 1)$:
\[ y^2 = x^3 + \frac{5}{4}x^2 + x + \frac{1}{4}. \]
- Thay $x \leftarrow x - \frac{5}{12}$ (loại $x^2$):
\[ y^2 = x^3 - \frac{1}{48}x - \frac{53}{864}. \]
- Nhân tỉ lệ $x \leftarrow u^2 x$, $y \leftarrow u^3 y$ với $u$ thích hợp để có hệ số nguyên.
| Đường cong | Dạng tổng quát tối thiểu | Dạng rút gọn |
|---|---|---|
| $N = 11$ | $y^2 + y = x^3 - x^2 - 10x - 20$ | $y^2 = x^3 - \frac{1}{48}x - \frac{53}{864}$ |
| $N = 37$ | $y^2 + y = x^3 - x$ | $y^2 = x^3 - x + 1/4$ |
Nhận xét: dạng tổng quát tối thiểu có hệ số nguyên “đẹp” hơn, nhưng dạng rút gọn đơn giản hơn về lý thuyết (chỉ có $2$ tham số $a, b$).
Ý nghĩa hình học
- Đường cong đối xứng qua trục $x$ (vì $y^2 = \cdots$ nên $(x,y) \in E \iff (x,-y) \in E$).
- Bên phải $y^2 = f(x)$: đường cong chỉ tồn tại khi $f(x) \geq 0$ (trên $\mathbb{R}$). Nghiệm thực của $f(x) = x^3 + ax + b$ xác định hình dạng:
- Ba nghiệm thực phân biệt ($\Delta > 0$): hai thành phần --- một “ốc đảo” (vòng khép kín) và một nhánh vô hạn.
- Một nghiệm thực ($\Delta < 0$): một thành phần liên thông.
Liên hệ với giả thuyết Birch--Dyer
- Công thức luật cộng đơn giản nhất (không có $a_1, a_2, a_3$).
- Đếm điểm $\#E(\mathbb{F}_p)$: chạy $x = 0, \ldots, p-1$, kiểm tra $x^3 + ax + b$ có phải thặng dư bậc hai modulo $p$ hay không.
- Chu kỳ thực $\Omega_E = \int_{E(\mathbb{R})} \left|\frac{dx}{2y}\right|$ --- tích phân trên đường cong thực dễ tính nhất ở dạng rút gọn.
- Tuy nhiên, để tính chính xác các thành phần BSD mạnh (số Tamagawa, mô hình Néron), thường cần quay lại dạng tổng quát tối thiểu.
Định nghĩa hình thức
Biệt thức tối thiểu $\Delta_{\min}$: biệt thức của mô hình Weierstrass tối thiểu trên $\mathbb{Z}$ --- giá trị $|\Delta|$ nhỏ nhất qua mọi phép đổi biến nguyên. Conductor $N_E$ liên hệ với $\Delta_{\min}$: $N_E \mid \Delta_{\min}$ [silverman2009].
Ví dụ
- $E: y^2 = x^3 - x$ ($a = -1$, $b = 0$): $\Delta = -16(4(-1)^3 + 0) = 64$. Vì $\Delta > 0$: hai thành phần trên $\mathbb{R}$.
- $E: y^2 = x^3 + 1$ ($a = 0$, $b = 1$): $\Delta = -16(0 + 27) = -432$. Vì $\Delta < 0$: một thành phần trên $\mathbb{R}$.
- $E: y^2 = x^3$ ($a = 0$, $b = 0$): $\Delta = 0$ --- không phải đường cong elliptic! Đây là đường cong kỳ dị (có cusp tại gốc tọa độ).
- $E: y^2 = x^3 - x^2$ (sau đổi biến): $\Delta = 0$ --- cũng kỳ dị (có nút tại gốc).
Ý nghĩa hình học
- $\Delta \neq 0$: Đường cong trơn --- mọi điểm đều có tiếp tuyến xác định duy nhất. Đây là đường cong elliptic “thật sự”.
- $\Delta = 0$: Đường cong có điểm kỳ dị --- nơi tiếp tuyến không xác định (hoặc có nhiều tiếp tuyến):
- Nút (node): hai nhánh cắt nhau. Nhóm phần trơn $\cong \mathbb{G}_m$ (nhóm nhân).
- Cusp: một nhánh “nhọn”. Nhóm phần trơn $\cong \mathbb{G}_a$ (nhóm cộng).
Hình dung: $\Delta$ là “nhiệt kế” đo sức khỏe hình học --- $\Delta \neq 0$ nghĩa là đường cong “khỏe mạnh” (trơn), $\Delta = 0$ nghĩa là “bệnh” (kỳ dị).
Liên hệ với giả thuyết Birch--Dyer
- Conductor: $N_E = \prod_{p \mid \Delta} p^{f_p}$ --- conductor chỉ chia bởi các nguyên tố chia $\Delta$ (nơi đường cong rút gọn xấu).
- Rút gọn modulo $p$: Khi $p \nmid \Delta$, rút gọn $\tilde{E}/\mathbb{F}_p$ vẫn trơn (rút gọn tốt). Khi $p \mid \Delta$, rút gọn kỳ dị (nút hoặc cusp) --- loại kỳ dị xác định nhân tử cục bộ trong tích Euler của $L(E,s)$.
- Phương trình hàm: $N_E$ xuất hiện trực tiếp trong phương trình hàm $\Lambda(E,s) = N_E^{s/2} (2\pi)^{-s} \Gamma(s) L(E,s)$.
- Biệt thức tối thiểu: $\Delta_{\min}$ xác định mô hình Néron, từ đó tính số Tamagawa $c_p$ --- thành phần trong công thức BSD mạnh.
Định nghĩa hình thức
Tính chất cơ bản: Hai đường cong elliptic trên bao đóng đại số $\overline{K}$ đẳng cấu khi và chỉ khi chúng có cùng $j$-bất biến. Ngược lại, với mỗi $j_0 \in K$, tồn tại đường cong elliptic $E/K$ có $j(E) = j_0$ [silverman2009].
Ví dụ
- $j = 0$: $E: y^2 = x^3 + b$ (tức $a = 0$). Nhóm tự đẳng cấu $\mathrm{Aut}(E) \cong \mathbb{Z}/6\mathbb{Z}$ --- đối xứng bậc $6$. Ví dụ $y^2 = x^3 + 1$: CM bởi $\mathbb{Z}[\omega]$ ($\omega = e^{2\pi i/3}$).
- $j = 1728$: $E: y^2 = x^3 + ax$ (tức $b = 0$). Nhóm $\mathrm{Aut}(E) \cong \mathbb{Z}/4\mathbb{Z}$ --- đối xứng bậc $4$. Ví dụ $y^2 = x^3 - x$: CM bởi $\mathbb{Z}[i]$.
- $j \neq 0, 1728$: Nhóm $\mathrm{Aut}(E) = \{\pm 1\} \cong \mathbb{Z}/2\mathbb{Z}$ --- đường cong “tổng quát” chỉ có đối xứng $P \mapsto -P$.
- $j = -3375 = -15^3$: Đường cong CM bởi $\mathcal{O}_{\mathbb{Q}(\sqrt{-7})}$.
- $j = -262537412640768000$: Liên quan đến $\mathbb{Q}(\sqrt{-163})$ và hằng số Ramanujan. Giá trị “khổng lồ” này giải thích tại sao $e^{\pi\sqrt{163}}$ gần nguyên.
Ý nghĩa hình học
Trên $\mathbb{C}$: mỗi đường cong elliptic $\cong \mathbb{C}/\Lambda$ cho lưới $\Lambda$. Nếu $\Lambda = \mathbb{Z} + \mathbb{Z}\tau$ ($\tau \in \mathcal{H}$ nửa mặt phẳng trên), thì:
Không gian moduli: tập tất cả đường cong elliptic (trên $\overline{K}$) tham số hóa bởi $j \in K$ --- “đường thẳng affine” $\mathbb{A}^1$. Mỗi điểm trên đường thẳng này là một “lớp tương đương” đường cong.
Liên hệ với giả thuyết Birch--Dyer
- Đường cong CM: $j(E)$ là số nguyên đại số khi $E$ có CM. Cụ thể, $j(E) \in H$ (trường lớp Hilbert của trường phức bậc hai ảo). Chỉ có hữu hạn giá trị $j$ nguyên tương ứng CM --- điều này liên quan đến bài toán số lớp (Heegner, Stark, Baker).
- Twist: Các đường cong cùng $j$ (nhưng khác nhau trên $\mathbb{Q}$, gọi là twist) có hàm $L$ liên quan nhau bởi đặc trưng Dirichlet. BSD cho twist $E^{(d)}$ liên hệ chặt với BSD cho $E$.
- Đường cong modular: Hàm $j(\tau)$ liên kết đường cong elliptic với đường cong modular $X(1) = \mathrm{SL}_2(\mathbb{Z}) \backslash \mathcal{H}^*$ --- nền tảng của Định lý modularity [wiles1995, bcdt2001].
- Giá trị $j = 0$ và $1728$: Có “đối xứng bổ sung” (extra automorphisms), nên công thức BSD có điều chỉnh nhỏ ở mẫu ($|\mathrm{Aut}(E)|$ thay vì $2$).
Định nghĩa
Với đường cong elliptic dạng Weierstrass rút gọn $y^2 = x^3 + ax + b$ trên trường có đặc số khác $2, 3$, điều kiện trơn tương đương với biệt thức khác không:
Ví dụ
- Đường cong trơn: $E: y^2 = x^3 - x + 1$. Ta có $a = -1$, $b = 1$, nên
\[ \Delta = -16\bigl(4(-1)^3 + 27(1)^2\bigr) = -16(23) = -368 \neq 0. \]Vậy $E$ trơn --- đây là đường cong elliptic.
- Đường cong không trơn: $C: y^2 = x^3$. Ta có $a = 0$, $b = 0$, nên
\[ \Delta = -16(0 + 0) = 0. \]Tại gốc tọa độ $(0, 0)$: đạo hàm riêng $\partial F/\partial x = -3x^2 = 0$ và $\partial F/\partial y = 2y = 0$. Vậy $(0,0)$ là điểm kỳ dị --- $C$ không phải đường cong elliptic.
Ý nghĩa trực giác
Về mặt đại số, tính trơn đảm bảo rằng phép cộng điểm trên đường cong elliptic (luật nhóm) hoạt động mọi lúc mọi nơi --- không có điểm nào “phá vỡ” cấu trúc nhóm.
Tương tự vật lý: đường cong trơn giống bề mặt nhẵn mà ta có thể trượt qua mọi điểm không vấp. Điểm kỳ dị giống “chỗ gãy” --- mọi phép tính vi phân đều hỏng tại đó.
Liên hệ với giả thuyết Birch--Dyer
- Nếu $\widetilde{E}$ trơn: $p$ là số nguyên tố có rút gọn tốt (good reduction).
- Nếu $\widetilde{E}$ kỳ dị: $p$ là số nguyên tố có rút gọn xấu (bad reduction). Tập các $p$ này xác định conductor (conductor) $N_E$ --- số mũ trong công thức BSD mạnh.
Định nghĩa
- Nút (node (node)): $f(x)$ có nghiệm bội đôi (nghiệm kép). Tại điểm nút, đường cong “tự cắt” --- có hai tiếp tuyến phân biệt. Ví dụ: $y^2 = x^2(x+1)$ tại $(0,0)$.
- Cusp (điểm nhọn (cusp)): $f(x)$ có nghiệm bội ba. Tại cusp, đường cong “chụm lại thành mũi nhọn” --- chỉ có một tiếp tuyến. Ví dụ: $y^2 = x^3$ tại $(0,0)$.
Phân biệt hai loại qua khai triển Taylor: nếu $f(x) = x^2(x - \alpha)$ với $\alpha \neq 0$ thì là nút; nếu $f(x) = x^3$ thì là cusp.
Ví dụ
- Nút: $C_1: y^2 = x^2(x + 1)$. Đa thức $x^2(x+1)$ có nghiệm $x = 0$ (bội 2) và $x = -1$ (bội 1). Tại $(0,0)$: đường cong tự cắt, hai nhánh có tiếp tuyến $y = \pm x$. Nhóm phần trơn $C_1^{\mathrm{ns}}(\mathbb{Q})$ đẳng cấu với nhóm nhân $\mathbb{Q}^{\times}$ (rút gọn nhân tách) hoặc $K^{\times}$ cho mở rộng bậc hai $K/\mathbb{Q}$ (rút gọn nhân không tách).
- Cusp: $C_2: y^2 = x^3$. Đa thức $x^3$ có nghiệm $x = 0$ bội 3. Tại $(0,0)$: đường cong có mũi nhọn, chỉ một tiếp tuyến $y = 0$. Nhóm phần trơn $C_2^{\mathrm{ns}}(\mathbb{Q})$ đẳng cấu với nhóm cộng $\mathbb{Q}^{+}$ (rút gọn cộng).
Ý nghĩa trực giác
- Đường cong trơn: Nét vẽ mượt mà, không tự cắt, không có góc nhọn. Giống hình số $8$ kéo dãn --- nhưng hai vòng không giao nhau.
- Nút: Đường cong tự cắt tại một điểm, tạo thành hình chữ $\times$. Giống nút dây thừng --- hai sợi dây đi qua cùng một điểm.
- Cusp: Đường cong chạy đến một điểm rồi quay lại --- giống đầu nhọn của giọt nước. Không tự cắt nhưng “bẹp” lại.
Sự khác biệt quan trọng: tại nút, có 2 hướng (tiếp tuyến) để “đi tiếp”; tại cusp, chỉ có 1 hướng.
Liên hệ với giả thuyết Birch--Dyer
- Rút gọn nhân (nút) --- có hai loại:
- Nhân tách (split multiplicative): Hai tiếp tuyến tại nút xác định trên $\mathbb{F}_p$. Nhân tử Euler tại $p$: $(1 - p^{-s})^{-1}$.
- Nhân không tách (non-split multiplicative): Tiếp tuyến xác định trên $\mathbb{F}_{p^2}$. Nhân tử Euler: $(1 + p^{-s})^{-1}$.
Định nghĩa
Ví dụ
Ta có thể hình dung $\mathcal{O}$ bằng cách nhìn theo phương $y$: khi $|y| \to \infty$, đường cong “chạy đi xa” theo chiều dọc. Hai “nhánh” (ứng với $y > 0$ và $y < 0$) gặp nhau tại $\mathcal{O}$ --- giống hai đường song song “gặp nhau ở vô cực” trong hình học xạ ảnh.
Cụ thể: cho $P = (0, 0)$ trên $E$ (đây là điểm trên đường cong vì $0^2 = 0^3 - 0$). Đường thẳng đứng $x = 0$ cắt $E$ tại $P = (0,0)$ và “điểm thứ hai” ở vô cực. Luật nhóm: $P + \mathcal{O} = P$ cho mọi $P$, xác nhận $\mathcal{O}$ là phần tử đơn vị.
Ý nghĩa trực giác
Cho đường cong elliptic, điểm ở vô cực $\mathcal{O}$ có hai vai trò:
- Phần tử đơn vị: Giống số $0$ trong phép cộng số nguyên. $P + \mathcal{O} = P$ cho mọi $P$.
- Phần tử nghịch đảo: $P + (-P) = \mathcal{O}$, trong đó $-P$ là đối xứng của $P$ qua trục $x$.
Không có $\mathcal{O}$, tập các điểm trên đường cong elliptic chỉ là “tập hợp” --- không có cấu trúc nhóm.
Liên hệ với giả thuyết Birch--Dyer
- Hạng = 0: Nếu giả thuyết BSD đúng, $L(E, 1) \neq 0$ khi và chỉ khi $E(\mathbb{Q}) = \{\mathcal{O}\}$ hữu hạn (chỉ gồm các điểm xoắn). Nghĩa là “phần tử đơn vị là tất cả những gì có” --- không có điểm hữu tỉ bậc vô hạn.
- Vi phân bất biến: Chu kỳ thực $\Omega_E = \int_{E(\mathbb{R})} |\omega|$ (xuất hiện trong BSD mạnh) được tính bằng tích phân vi phân $\omega = dx/(2y)$, chuẩn hóa theo mô hình Néron --- mà mô hình Néron được xây dựng từ không gian xạ ảnh, nơi $\mathcal{O}$ sống.
- Chiều cao Néron--Tate: $\hat{h}(P) = 0$ khi và chỉ khi $P$ là điểm xoắn --- liên hệ với $\mathcal{O}$ qua phần tử đơn vị. Regulator $R_E$ được tính từ chiều cao, xuất hiện trong tử số BSD mạnh.
Định nghĩa
Ví dụ
- Thử $x = 0$: $y^2 = 0$, nên $(0, 0) \in E(\mathbb{Q})$.
- Thử $x = 1$: $y^2 = 0$, nên $(1, 0) \in E(\mathbb{Q})$.
- Thử $x = -1$: $y^2 = -2 < 0$ --- không có nghiệm thực, nên không có điểm hữu tỉ.
- Thử $x = 2$: $y^2 = 6$ --- $\sqrt{6} \notin \mathbb{Q}$, không có điểm hữu tỉ.
- Cùng với $\mathcal{O}$, ta được $E(\mathbb{Q}) = \{(0,0), (1,0), (-1,0), \mathcal{O}\}$ --- đường cong này chỉ có 4 điểm hữu tỉ, tất cả là điểm xoắn bậc 2. Hạng $r = 0$.
Nhận xét: $(0, 0)$, $(1, 0)$, $(-1, 0)$ đều có $y = 0$, nghĩa là $P = -P$, nên đều có bậc 2.
Ý nghĩa trực giác
Cho đường cong elliptic, câu trả lời phức tạp hơn nhiều:
- $E(\mathbb{Q})$ luôn là nhóm Abel hữu hạn sinh (Định lý Mordell--Weil).
- Phần xoắn $E(\mathbb{Q})_{\mathrm{tors}}$ luôn hữu hạn --- Mazur phân loại đầy đủ 15 trường hợp.
- Phần tự do có hạng $r$: $E(\mathbb{Q}) \cong E(\mathbb{Q})_{\mathrm{tors}} \oplus \mathbb{Z}^r$.
- Giả thuyết BSD: $r = \mathrm{ord}_{s=1} L(E, s)$ --- hạng bằng bậc triệt tiêu hàm $L$ tại $s = 1$.
Liên hệ với giả thuyết Birch--Dyer
- BSD yếu: $r = \mathrm{ord}_{s=1} L(E, s)$.
- BSD mạnh: Ngoài hạng, còn tiên đoán giá trị chính xác của đạo hàm bậc $r$ qua công thức:
\[ \frac{L^{(r)}(E, 1)}{r!} = \frac{|\mathrm{Sha}(E/\mathbb{Q})| \cdot \Omega_E \cdot R_E \cdot \prod_p c_p}{|E(\mathbb{Q})_{\mathrm{tors}}|^2}. \]
Định nghĩa
Phép cộng $P + Q$ (với $P \neq Q$, $P \neq \mathcal{O}$, $Q \neq \mathcal{O}$):
- Kẻ đường thẳng $\ell$ qua $P$ và $Q$.
- $\ell$ cắt $E$ tại điểm thứ ba $R'$ (theo Định lý Bézout, đường thẳng cắt đường cong bậc 3 tại đúng 3 điểm, tính cả bội).
- Lấy đối xứng $R'$ qua trục $x$: $P + Q = -R' = (x_{R'}, -y_{R'})$.
Nhân đôi $P + P = 2P$ (khi $P = Q$):
- Kẻ đường tiếp tuyến với $E$ tại $P$.
- Tiếp tuyến cắt $E$ tại điểm thứ hai $R'$.
- $2P = -R'$.
Phần tử đơn vị: $\mathcal{O}$ (điểm ở vô cực). $P + \mathcal{O} = P$ cho mọi $P$.
Phần tử nghịch đảo: $-P = (x, -y)$ nếu $P = (x, y)$.
Công thức đại số. Cho $P = (x_1, y_1)$ và $Q = (x_2, y_2)$ với $P \neq \pm Q$:
Ví dụ
Kiểm tra: $2^2 = 1 - 7 + 10 = 4$ ✓ và $4^2 = 27 - 21 + 10 = 16$ ✓.
Tính $P + Q$:
Tính $2P$:
Ý nghĩa trực giác
Đường thẳng cắt đường cong bậc 3 tại 3 điểm. Nếu biết 2 điểm, ta “buộc” phải tìm được điểm thứ 3. Phép lấy đối xứng qua trục $x$ biến “3 điểm trên đường thẳng” thành “phép cộng nhóm”.
Tính chất đáng kinh ngạc: phép toán hình học đơn giản này thỏa mãn tất cả tiên đề nhóm --- kết hợp, giao hoán, đơn vị, nghịch đảo. Chứng minh tính kết hợp ($P + (Q + R) = (P + Q) + R$) là phần khó nhất, đòi hỏi kỹ thuật đại số hoặc lý thuyết ước Cartier [silverman2009].
Liên hệ với giả thuyết Birch--Dyer
- Hạng: Số lần bạn cần áp dụng luật nhóm (cộng các điểm sinh) để tạo ra mọi điểm hữu tỉ. Hạng $r$ là số điểm sinh tối thiểu.
- Descent: Phương pháp chính để ước lượng hạng (2-descent, $n$-descent) dựa trên phân tích luật nhóm modulo bình phương.
- Chiều cao: Chiều cao Néron--Tate $\hat{h}$ là “norm” trên nhóm $E(\mathbb{Q})/E(\mathbb{Q})_{\mathrm{tors}}$ --- biến phép cộng nhóm thành hình học (không gian Euclid).
- Regulator: $R_E = \det(\langle P_i, P_j \rangle)$ --- thể tích song song diện trong không gian chiều cao, đo “mức phân tán” của các điểm sinh dưới luật nhóm.
Định nghĩa
Ánh xạ nhân $n$: $[n]: E \to E$, $P \mapsto nP$ là một đồng cấu nhóm (group homomorphism), và cũng là isogeny bậc $n^2$ (khi $n \neq 0$) với hạt nhân:
Ví dụ
- $2P$: Tiếp tuyến tại $P = (0,1)$: $\lambda = \frac{3 \cdot 0^2}{2 \cdot 1} = 0$. $x_3 = 0 - 0 = 0$, $y_3 = 0 - 1 = -1$. Vậy $2P = (0, -1)$.
- $3P = 2P + P = (0,-1) + (0,1)$: Vì $y_1 = -y_2$ và $x_1 = x_2$, ta có $3P = \mathcal{O}$.
Nhận xét: $P$ có bậc 3 (tức $3P = \mathcal{O}$), nên $6P = 2 \cdot (3P) = 2\mathcal{O} = \mathcal{O}$ và $4P = 3P + P = P$, v.v. Toàn bộ nhóm sinh bởi $P$: $\{P, 2P, \mathcal{O}\} \cong \mathbb{Z}/3\mathbb{Z}$.
Thuật toán double-and-add tính $nP$ hiệu quả: viết $n$ dưới dạng nhị phân, lần lượt double và add. Số phép tính: $O(\log n)$ thay vì $O(n)$.
Ý nghĩa trực giác
- $1P = P$: một bước.
- $2P = P + P$: hai bước (dùng tiếp tuyến).
- $nP$: $n$ bước (dùng lặp lại phép cộng).
- Nếu bạn quay lại $\mathcal{O}$ sau $n$ bước ($nP = \mathcal{O}$) thì $P$ có “bậc $n$” --- đường cong “khép kín” sau $n$ bước.
Bài toán logarit rời rạc trên EC (ECDLP): cho $P$ và $Q = nP$, tìm $n$. Bài toán này “dễ theo chiều thuận” (tính $nP$ nhanh bằng double-and-add) nhưng “cực khó theo chiều ngược” --- nền tảng của mật mã đường cong elliptic (ECC) [lenstra1987].
Liên hệ với giả thuyết Birch--Dyer
- Điểm $n$-xoắn $E[n]$: Hạt nhân của $[n]$. Dãy chính xác ngắn
\[ 0 \to E[n] \to E \xrightarrow{[n]} E \to 0 \]là điểm khởi đầu của dãy Kummer, dẫn đến nhóm Selmer $\mathrm{Sel}_n(E/\mathbb{Q})$ và nhóm Tate--Shafarevich $\mathrm{Sha}(E/\mathbb{Q})$.
- Descent: Phương pháp $n$-descent phân tích ánh xạ $[n]$ để ước lượng hạng. Cụ thể, $n$-Selmer rank cung cấp cận trên cho hạng thực sự.
- Điểm Heegner: Điểm Heegner $P_K$ trên $E$ được chứng minh có bậc vô hạn (không có $n$ nào cho $nP_K = \mathcal{O}$) khi $L'(E, 1) \neq 0$ --- đây là nội dung chính của Gross--Zagier + Kolyvagin [gross-zagier1986, kolyvagin1990].
- Phần tử xoắn: $|E(\mathbb{Q})_{\mathrm{tors}}|^2$ xuất hiện ở mẫu số công thức BSD mạnh --- phần xoắn “giảm” giá trị đặc biệt của hàm $L$.
Định nghĩa
Khi $\mathrm{char}(K) = 0$ hoặc $\mathrm{char}(K) \nmid n$:
Khi $\mathrm{char}(K) = p > 0$ và $n = p^k$: $E[p^k] \cong (\mathbb{Z}/p^k\mathbb{Z})$ (đường cong thường --- ordinary) hoặc $E[p^k] = \{0\}$ (đường cong siêu kỳ dị --- supersingular).
Ví dụ
- Điểm 2-xoắn trên $E: y^2 = x^3 - x = x(x-1)(x+1)$:
\[ E[2] = \{\mathcal{O},\, (0,0),\, (1,0),\, (-1,0)\} \cong (\mathbb{Z}/2\mathbb{Z})^2. \]Các điểm 2-xoắn có $y = 0$ (vì $2P = \mathcal{O} \Leftrightarrow P = -P \Leftrightarrow y = -y$), tức là nghiệm của $x^3 - x = 0$. Cùng $\mathcal{O}$, ta được $|E[2]| = 2^2 = 4$ phần tử.
- Điểm 3-xoắn trên $E: y^2 = x^3 + 1$. Điểm $P = (0, 1)$ có $3P = \mathcal{O}$ (đã tính ở mục trước). Trên $\overline{\mathbb{Q}}$, $E[3]$ có $3^2 = 9$ phần tử --- nhưng phần lớn có tọa độ trong $\mathbb{Q}(\zeta_3)$ (trường chứa căn bậc ba của đơn vị).
- Biểu diễn Galois: Nhóm Galois tuyệt đối $\mathrm{Gal}(\overline{\mathbb{Q}}/\mathbb{Q})$ tác động lên $E[n]$ (hoán vị các điểm $n$-xoắn). Vì $E[n] \cong (\mathbb{Z}/n\mathbb{Z})^2$, ta được biểu diễn:
\[ \rho_{E,n}: \mathrm{Gal}(\overline{\mathbb{Q}}/\mathbb{Q}) \to \mathrm{GL}_2(\mathbb{Z}/n\mathbb{Z}). \]Đây là biểu diễn Galois modulo $n$ (mod-$n$ Galois representation) --- công cụ cốt lõi trong lý thuyết số hiện đại.
Ý nghĩa trực giác
Trên đường cong elliptic, $E[n]$ giống “lưới chia đều” --- nhưng vì $E$ có “2 chiều” (là torus phức $\mathbb{C}/\Lambda$), nên $E[n]$ là lưới $(\mathbb{Z}/n\mathbb{Z})^2$ với $n^2$ điểm. Cụ thể, nếu $\Lambda = \mathbb{Z}\omega_1 + \mathbb{Z}\omega_2$, thì:
Biểu diễn Galois $\rho_{E,n}$ mã hóa cách “đối xứng số học” (Galois) xáo trộn lưới này --- mỗi phần tử Galois “xoay và biến đổi” lưới $n^2$ điểm bằng một ma trận $2 \times 2$.
Liên hệ với giả thuyết Birch--Dyer
- Dãy Kummer: Dãy chính xác ngắn $0 \to E[n] \to E \xrightarrow{[n]} E \to 0$ dẫn đến dãy dài đối đồng điều Galois:
\[ 0 \to E(K)/nE(K) \to H^1(\mathrm{Gal}(\overline{K}/K),\, E[n]) \to H^1(\mathrm{Gal}(\overline{K}/K),\, E)[n] \to 0. \]Từ đây ta xây dựng $\mathrm{Sel}_n(E/K)$ và $\mathrm{Sha}(E/K)[n]$.
- Biểu diễn Galois $p$-adic: Lấy giới hạn ngược $T_p(E) = \varprojlim E[p^k]$ ta được module Tate (Tate module) $T_p(E) \cong \mathbb{Z}_p^2$, cho biểu diễn $\rho_{E,p}: \mathrm{Gal}(\overline{\mathbb{Q}}/\mathbb{Q}) \to \mathrm{GL}_2(\mathbb{Z}_p)$. Hàm $L$ được xây dựng từ biểu diễn này [serre1970].
- Phỏng đoán Serre: Với “hầu hết” $E/\mathbb{Q}$ không CM, $\rho_{E,p}$ là toàn ánh cho mọi $p$ đủ lớn. Điều này liên quan đến tính “đơn giản” của nhóm Selmer [khare-wintenberger2009].
Định nghĩa
Ví dụ
- $E^{(-1)}: y^2 = x^3 + x$ --- twist theo $d = -1$. Đường cong $E$ có hạng $r = 0$, nhưng $E^{(-1)}$ cũng có hạng $r = 0$.
- $E^{(5)}: y^2 = x^3 - 25x$ --- twist theo $d = 5$. Đường cong này có hạng $r = 1$ (điểm $(5, 10)$ là điểm sinh bậc vô hạn), liên quan đến việc $5$ là số đồng dư.
- $E^{(6)}: y^2 = x^3 - 36x$ --- twist theo $d = 6$. Hạng $r = 1$ ($6$ cũng là số đồng dư).
Ý nghĩa trực giác
- Trên $\overline{\mathbb{Q}}$ (hay $\mathbb{C}$): $E$ và $E^{(d)}$ giống hệt nhau (đẳng cấu).
- Trên $\mathbb{Q}$: chúng khác nhau --- có thể có số điểm hữu tỉ khác nhau, hạng khác nhau, thậm chí nhóm Sha khác nhau.
Phép tương tự: hai bức ảnh chụp cùng vật thể từ hai góc khác nhau. “Hình dạng” (= $j$-bất biến) giống nhau, nhưng “chi tiết” (= tính chất số học trên $\mathbb{Q}$) khác nhau.
Mỗi đường cong elliptic trên $\mathbb{Q}$ có vô hạn twist (ứng với mỗi $d$ squarefree). Họ twist tạo thành “gia đình” chia sẻ nhiều tính chất chung.
Liên hệ với giả thuyết Birch--Dyer
- Hàm $L$ twist: $L(E^{(d)}, s) = L(E, \chi_d, s)$, trong đó $\chi_d = \left(\frac{d}{\cdot}\right)$ là đặc trưng Dirichlet bậc hai. BSD cho $E^{(d)}$ liên hệ với giá trị $L(E, \chi_d, 1)$.
- Phân bố hạng: Phỏng đoán Goldfeld: trong họ twist $\{E^{(d)}\}$, “hầu hết” có hạng $0$ hoặc $1$ (50% mỗi loại). Smith (2022) chứng minh phỏng đoán này cho đường cong có nhóm 2-Selmer trung bình nhỏ.
- Bhargava--Shankar--Zhang: Chứng minh $\geq 66.48\%$ đường cong elliptic thỏa mãn BSD yếu, bằng cách nghiên cứu twist và Selmer trung bình [bhargava-skinner-zhang2014].
- Bài toán số đồng dư: $n$ là số đồng dư $\Leftrightarrow$ $E^{(n)}: y^2 = x^3 - n^2x$ có hạng $\geq 1$. Tunnell cho điều kiện đủ (và cần nếu BSD đúng) bằng công thức đếm biểu diễn [tunnell1983].
Định nghĩa
Cụ thể, với đường cong Weierstrass rút gọn trên trường có $\mathrm{char}(K) \neq 2, 3$, đẳng cấu $E_1 \to E_2$ có dạng:
Ví dụ
- $E_1: y^2 = x^3 - x$ và $E_2: y^2 = x^3 - 4x$. Phép đổi biến $u = \sqrt{2}$ (không thuộc $\mathbb{Q}$!):
\[ (x, y) \mapsto (2x,\, 2\sqrt{2}\, y). \]Kiểm tra: $a' = u^4 a = 4 \cdot (-1) = -4$ ✓. Vậy $E_1 \cong_{\mathbb{Q}(\sqrt{2})} E_2$ nhưng $E_1 \not\cong_{\mathbb{Q}} E_2$.
Thực tế: $E_2 = E_1^{(2)}$ là twist bậc hai của $E_1$ theo $d = 2$.
- $E_1: y^2 = x^3 + 1$ có $j = 0$. Mọi đường cong có $j = 0$ đều đẳng cấu với $E_1$ trên $\overline{\mathbb{Q}}$, nhưng trên $\mathbb{Q}$ chúng phân thành nhiều lớp twist: $y^2 = x^3 + d$ cho $d$ squarefree.
- Nhóm tự đẳng cấu: $\mathrm{Aut}(E_1) = \{(x,y) \mapsto (\zeta^2 x, \zeta^3 y) : \zeta^6 = 1\}$ khi $j = 0$ --- có 6 phần tử (trên $\overline{\mathbb{Q}}$). Với $j \neq 0, 1728$: $|\mathrm{Aut}(E)| = 2$ (chỉ có $\pm \mathrm{id}$).
Ý nghĩa trực giác
- Cùng $j$-bất biến (“DNA” của đường cong).
- Cùng nhóm điểm (trên trường đẳng cấu).
- Cùng hàm $L$ (nếu đẳng cấu trên $\mathbb{Q}$).
Nhưng “đẳng cấu trên trường nào” rất quan trọng: hai đường cong giống hệt trên $\mathbb{C}$ có thể rất khác nhau trên $\mathbb{Q}$ --- hạng, nhóm xoắn, thậm chí Sha đều có thể khác!
Liên hệ với giả thuyết Birch--Dyer
- Bất biến: Nếu $E_1 \cong_\mathbb{Q} E_2$ thì BSD cho $E_1$ tương đương BSD cho $E_2$ --- mọi đại lượng (hạng, $L$, Sha, regulator, ...) giống nhau.
- Phân loại: Để chứng minh BSD cho “tất cả” đường cong, ta chỉ cần xét mỗi lớp đẳng cấu một đại diện. LMFDB (cơ sở dữ liệu) tổ chức theo lớp đẳng cấu.
- Tự đẳng cấu: $|\mathrm{Aut}(E)|$ xuất hiện trong công thức BSD mạnh (ở mẫu, thay cho $2$ khi $j = 0$ hoặc $1728$). Cụ thể, chu kỳ thực $\Omega_E$ phải chia cho $|\mathrm{Aut}(E)|/2$ để chuẩn hóa.
Định nghĩa
Bậc của isogeny là bậc của $\phi$ như ánh xạ hữu tỉ: $\deg(\phi) = [K(E_1) : \phi^* K(E_2)]$ (bậc mở rộng trường hàm). Isogeny bậc $n$ có hạt nhân $\ker(\phi)$ là nhóm hữu hạn cỡ $n$ (khi khả ly).
Ánh xạ nhân $[n]: E \to E$ là isogeny bậc $n^2$ với $\ker([n]) = E[n]$ [silverman2009].
Ví dụ
Ánh xạ Vélu: Tồn tại isogeny $\phi: E_1 \to E_2$ bậc 2 với $\ker(\phi) = \{\mathcal{O}, T\}$, cho bởi công thức:
Kiểm tra: $\phi(0, 0)$ không xác định (cực) --- đây là hạt nhân, nên $\phi(T) = \mathcal{O}_2$ ✓. Bậc: $\deg(\phi) = 2$ (tử bậc 2 chia mẫu bậc 1 trong thành phần $x$).
Ý nghĩa trực giác
- Mỗi điểm trên $E_2$ có đúng $\deg(\phi)$ “tiền ảnh” trên $E_1$ (tính cả bội).
- Isogeny “nén” nhóm $E_1$ bằng cách “chia” cho hạt nhân: $E_2 \cong E_1/\ker(\phi)$.
- Giống ánh xạ $\mathbb{Z} \twoheadrightarrow \mathbb{Z}/n\mathbb{Z}$: “cuộn” đường thẳng số thành vòng tròn.
Hai đường cong isogenous (có isogeny giữa chúng) chia sẻ nhiều tính chất số học --- cùng conductor, cùng hàm $L$ (up to nhân tử), cùng thỏa BSD (hoặc không).
Liên hệ với giả thuyết Birch--Dyer
- Bất biến isogeny: Nếu $\phi: E_1 \to E_2$ là isogeny thì $L(E_1, s) = L(E_2, s)$ --- hàm $L$ chỉ phụ thuộc vào lớp isogeny. Do đó, bậc triệt tiêu $\mathrm{ord}_{s=1} L(E, s)$ là bất biến isogeny.
- Hạng bất biến: $\mathrm{rk}(E_1(\mathbb{Q})) = \mathrm{rk}(E_2(\mathbb{Q}))$ --- isogeny bảo toàn hạng (vì $\phi$ và $\hat{\phi}$ đối ngẫu cho ra cặp đồng cấu nhóm).
- Lớp isogeny trong LMFDB: Mỗi lớp isogeny (ví dụ “37a”) chứa tất cả đường cong isogenous --- chúng chia sẻ cùng hàm $L$, conductor, hạng. BSD yếu đúng cho một $\Leftrightarrow$ đúng cho tất cả trong lớp.
- BSD mạnh: Các hằng số trong BSD mạnh (Sha, regulator, Tamagawa) thay đổi qua isogeny, nhưng thay đổi theo cách “bù trừ” nhau --- gọi là isogeny invariance của công thức BSD [cassels1962].
Định nghĩa
Các tính chất:
- $\widehat{\phi \circ \psi} = \hat{\psi} \circ \hat{\phi}$ (đảo thứ tự).
- $\hat{\hat{\phi}} = \phi$ (đối ngẫu của đối ngẫu là chính nó).
- $\widehat{[n]} = [n]$ (đối ngẫu của nhân $n$ là chính nó).
- $\widehat{\phi + \psi} = \hat{\phi} + \hat{\psi}$ (tuyến tính).
Ví dụ
Isogeny đối ngẫu $\hat{\phi}: E_2 \to E_1$ cũng có bậc 2, với $\ker(\hat{\phi}) = \{\mathcal{O}_2, (0,0)_2\}$ --- điểm 2-xoắn trên $E_2$.
Kiểm tra: $\hat{\phi} \circ \phi = [2]_{E_1}$. Với $P \in E_1$: $\hat{\phi}(\phi(P)) = 2P$. Đặc biệt, nếu $P \in E_1[2]$: $\hat{\phi}(\phi(P)) = \mathcal{O}$, tức $\phi(P) \in \ker(\hat{\phi})$ --- phù hợp vì $\phi$ gửi $E_1[2]$ vào $E_2[2]$.
Ý nghĩa trực giác
Phép tương tự: nghĩ $\phi$ như “rút gọn modulo $n$” ($\mathbb{Z} \to \mathbb{Z}/n\mathbb{Z}$) và $\hat{\phi}$ như “nhân lại $n$” ($\mathbb{Z}/n\mathbb{Z} \hookrightarrow \mathbb{Z}$). Thành phần “đi rồi về” cho $n$ lần bản gốc.
Đối ngẫu biến “quan hệ isogeny” thành quan hệ đối xứng: nếu $E_1$ isogenous với $E_2$ thì $E_2$ cũng isogenous ngược lại với $E_1$.
Liên hệ với giả thuyết Birch--Dyer
- Bảo toàn hạng: Từ $\hat{\phi} \circ \phi = [n]$, suy ra $\phi$ đơn ánh trên phần tự do: nếu $\phi(P) = \mathcal{O}$ với $P$ bậc vô hạn, thì $nP = \hat{\phi}(\mathcal{O}) = \mathcal{O}$, vô lý. Vậy $\mathrm{rk}(E_1) \leq \mathrm{rk}(E_2)$; đối xứng cho $\leq$ ngược.
- Cassels--Tate pairing: Ghép đôi $\mathrm{Sha}(E_1) \times \mathrm{Sha}(E_2) \to \mathbb{Q}/\mathbb{Z}$ được xây dựng qua $\phi$ và $\hat{\phi}$ --- “kiểm tra chéo” giữa Sha của hai đường cong isogenous.
- Isogeny invariance BSD: Công thức BSD mạnh cho $E_1$ và $E_2$ tương thích qua $\phi, \hat{\phi}$: tích $|\mathrm{Sha}| \cdot R \cdot \prod c_p / |E_{\mathrm{tors}}|^2$ bất biến dưới isogeny --- chứng minh bởi Cassels [cassels1962].
Định nghĩa
Mọi đường cong elliptic đều có $\mathbb{Z} \hookrightarrow \mathrm{End}(E)$ qua $n \mapsto [n]$ (ánh xạ nhân $n$). Có hai trường hợp chính [silverman2009]:
- Không CM: $\mathrm{End}(E) \cong \mathbb{Z}$ --- chỉ có nhân vô hướng. Đây là trường hợp “tổng quát”.
- CM (nhân phức): $\mathrm{End}(E) \cong \mathcal{O}_K$, order trong trường phức bậc hai ảo $K = \mathbb{Q}(\sqrt{-d})$. Đường cong có “đối xứng bổ sung” ngoài nhân vô hướng.
Ví dụ
- Nhân vô hướng: Trên mọi $E$, $[n]: P \mapsto nP$ là tự đồng cấu bậc $n^2$. Ví dụ $[2]: E \to E$ có $\ker = E[2]$, 4 phần tử.
- Tự đồng cấu CM: $E: y^2 = x^3 - x$ có tự đồng cấu:
\[ \iota: (x, y) \mapsto (-x, iy), \]trong đó $i = \sqrt{-1}$. Kiểm tra: $(-x)^3 - (-x) = -x^3 + x = -(x^3 - x)$ và $(iy)^2 = -y^2 = -(x^3 - x)$ ✓. Ánh xạ $\iota$ có $\iota^2 = [-1]$ (vì $\iota(\iota(x,y)) = \iota(-x, iy) = (x, i \cdot iy) = (x, -y) = -P$). Vậy $\mathrm{End}(E) \cong \mathbb{Z}[i]$ --- vành số nguyên Gauss, order trong $\mathbb{Q}(i) = \mathbb{Q}(\sqrt{-1})$.
- Frobenius: Trên $\mathbb{F}_p$, ánh xạ Frobenius $\pi_p: (x,y) \mapsto (x^p, y^p)$ là tự đồng cấu bậc $p$. Đa thức đặc trưng: $T^2 - a_p T + p = 0$ với $a_p = p + 1 - |E(\mathbb{F}_p)|$.
Ý nghĩa trực giác
- Không CM ($\mathrm{End}(E) \cong \mathbb{Z}$): Đường cong “tổng quát” --- đối xứng tối thiểu, chỉ có phép nhân vô hướng. Giống hình tròn chỉ có phép quay (nhưng không có phép lật).
- CM ($\mathrm{End}(E) \cong \mathcal{O}_K$): Đường cong có “đối xứng bổ sung” --- giống hình vuông (có cả quay lẫn lật). Phép đối xứng bổ sung $\iota$ liên quan đến trường phức bậc hai ảo $K$.
Trên $\mathbb{C}$: $E \cong \mathbb{C}/\Lambda$. Tự đồng cấu = nhân $\alpha$ với $\alpha\Lambda \subseteq \Lambda$. Nếu $\Lambda = \mathbb{Z} + \mathbb{Z}\tau$:
- Không CM: chỉ $\alpha \in \mathbb{Z}$ thỏa mãn $\alpha\Lambda \subseteq \Lambda$.
- CM: nếu $\tau = \sqrt{-d}$, thì $\alpha = a + b\sqrt{-d}$ cũng thỏa mãn.
Liên hệ với giả thuyết Birch--Dyer
- CM và kết quả sớm nhất: Định lý Coates--Wiles (1977) --- kết quả đầu tiên hướng BSD --- chỉ áp dụng cho đường cong CM. Lý do: khi $E$ có CM bởi $K$, hàm $L(E, s)$ phân tích thành tích hai hàm $L$ Hecke trên $K$ --- dễ nghiên cứu hơn [coates-wiles1977].
- Frobenius và hàm $L$: Hàm $L(E, s) = \prod_p L_p(E, p^{-s})^{-1}$, trong đó nhân tử Euler tại $p$ (rút gọn tốt) xác định bởi đa thức đặc trưng của Frobenius: $1 - a_p p^{-s} + p^{1-2s}$.
- CM vs.non-CM: Đường cong CM có mật độ “đặc biệt”: chỉ có hữu hạn $j$-bất biến CM (13 giá trị trên $\mathbb{Q}$). Nhưng lại là “phòng thí nghiệm” lý tưởng: Rubin (1991) chứng minh BSD cho CM + hạng 0 đầy đủ (cả phần Sha) [rubin1991].
- Module Tate: $\mathrm{End}(E) \otimes \mathbb{Z}_p \hookrightarrow \mathrm{End}_{\mathbb{Z}_p}(T_p(E)) \cong M_2(\mathbb{Z}_p)$. Khi CM: $\mathrm{End}(E) \otimes \mathbb{Q}_p$ chứa trường bậc 2 --- hàm $L$ “phân tích” tương ứng.
Định nghĩa
- Cộng: $(\phi + \psi)(P) = \phi(P) + \psi(P)$.
- Nhân: $(\phi \circ \psi)(P) = \phi(\psi(P))$ (hợp thành).
Có ba khả năng cho $\mathrm{End}(E)$ trên $\overline{K}$ [silverman2009]:
- $\mathrm{End}(E) \cong \mathbb{Z}$ --- trường hợp “tổng quát” (không CM).
- $\mathrm{End}(E) \cong \mathcal{O}$ --- order trong trường phức bậc hai ảo $K = \mathbb{Q}(\sqrt{-d})$ (có CM).
- $\mathrm{End}(E)$ là order trong đại số quaternion --- chỉ xảy ra khi $\mathrm{char}(K) = p > 0$ (siêu kỳ dị).
Ví dụ
- Không CM: $E: y^2 = x^3 - x + 1$ trên $\mathbb{Q}$. Đường cong “tổng quát” --- $\mathrm{End}(E) \cong \mathbb{Z}$. Tự đồng cấu duy nhất là $[n]: P \mapsto nP$ cho $n \in \mathbb{Z}$.
- CM bởi $\mathbb{Z}[i]$: $E: y^2 = x^3 - x$. Tự đồng cấu $\iota: (x,y) \mapsto (-x, iy)$ thỏa $\iota^2 = [-1]$. Vậy $\mathrm{End}(E) \cong \mathbb{Z}[i] = \{a + bi : a, b \in \mathbb{Z}\}$ --- vành số nguyên Gauss, order cực đại trong $\mathbb{Q}(i)$.
- CM bởi $\mathbb{Z}[\omega]$: $E: y^2 = x^3 + 1$. Tự đồng cấu $\zeta: (x,y) \mapsto (\omega x, y)$ với $\omega = e^{2\pi i/3}$ thỏa $\zeta^3 = [\mathrm{id}]$. Vậy $\mathrm{End}(E) \cong \mathbb{Z}[\omega]$ --- vành số nguyên Eisenstein, order cực đại trong $\mathbb{Q}(\sqrt{-3})$.
- Siêu kỳ dị: $E: y^2 = x^3 + x$ trên $\mathbb{F}_3$. Ta có $|E(\mathbb{F}_3)| = 4 = 3 + 1$, nên $a_3 = 0$. $\mathrm{End}(E)$ là order trong đại số quaternion $B_{3,\infty}$.
Ý nghĩa trực giác
- Lưới tổng quát ($\tau$ “ngẫu nhiên”): Chỉ $\alpha \in \mathbb{Z}$ thỏa mãn. $\mathrm{End}(E) \cong \mathbb{Z}$.
- Lưới đặc biệt ($\tau = i$ hoặc $\tau = e^{2\pi i/3}$): Lưới có đối xứng bổ sung (quay $90°$ hoặc $60°$) --- cho tự đồng cấu mới.
Phép tương tự: $\mathrm{End}(E) \cong \mathbb{Z}$ giống hình chữ nhật (chỉ có quay $180°$). $\mathrm{End}(E) \cong \mathbb{Z}[i]$ giống hình vuông (thêm quay $90°$). $\mathrm{End}(E) \cong \mathbb{Z}[\omega]$ giống lục giác đều (thêm quay $60°$).
Liên hệ với giả thuyết Birch--Dyer
- CM $\Rightarrow$ phân tích hàm $L$: Khi $\mathrm{End}(E) \cong \mathcal{O}_K$, hàm $L(E, s)$ phân tích thành tích hai hàm $L$ Hecke của $K$. Điều này cho phép chứng minh thác triển giải tích trực tiếp (không cần Định lý modularity) [deuring1953].
- Kết quả BSD mạnh nhất: Rubin (1991) chứng minh BSD đầy đủ (cả phần Sha) cho $E$ có CM với $L(E,1) \neq 0$ [rubin1991].
- 13 giá trị $j$ CM trên $\mathbb{Q}$: Chỉ có $j = 0, 1728, -3375, 8000, \ldots$ (13 giá trị). Mỗi giá trị ứng với order $\mathcal{O}_K$ có số lớp $h(\mathcal{O}_K) = 1$.
- Không CM: “Hầu hết” đường cong. Kết quả BSD yếu hơn --- cần Định lý modularity + Kolyvagin.
Định nghĩa
Trên $\mathbb{C}$: $E \cong \mathbb{C}/\Lambda$, và $E$ có CM khi và chỉ khi $\Lambda$ tương đương lưới $\mathbb{Z} + \mathbb{Z}\tau$ với $\tau$ thuộc trường phức bậc hai ảo: $[\mathbb{Q}(\tau):\mathbb{Q}] = 2$ và $\tau \notin \mathbb{R}$ [silverman2009, cox2013].
Ví dụ
- CM bởi $\mathbb{Q}(i)$: $E: y^2 = x^3 - x$, $j = 1728$.
- Lưới: $\Lambda = \mathbb{Z} + \mathbb{Z} i$ (lưới vuông).
- Tự đồng cấu: $\iota(x,y) = (-x, iy)$, tương ứng nhân $i$ trên $\mathbb{C}/\Lambda$.
- $\mathrm{End}(E) \cong \mathbb{Z}[i]$, discriminant $-4$.
- CM bởi $\mathbb{Q}(\sqrt{-3})$: $E: y^2 = x^3 + 1$, $j = 0$.
- Lưới: $\Lambda = \mathbb{Z} + \mathbb{Z}\omega$ với $\omega = e^{2\pi i/3}$ (lưới lục giác).
- $\mathrm{End}(E) \cong \mathbb{Z}[\omega]$, discriminant $-3$.
- CM bởi $\mathbb{Q}(\sqrt{-7})$: $E: y^2 = x^3 - 35x - 98$, $j = -3375$.
- $\mathrm{End}(E) \cong \mathbb{Z}\left[\frac{1+\sqrt{-7}}{2}\right]$, discriminant $-7$.
- Đường cong lịch sử: Coates--Wiles (1977) dùng nó để chứng minh kết quả đầu tiên hướng BSD [coates-wiles1977].
Ý nghĩa trực giác
- Lưới vuông $\mathbb{Z} + \mathbb{Z} i$: quay $90°$ ($\times i$) bảo toàn lưới $\Rightarrow$ CM bởi $\mathbb{Q}(i)$.
- Lưới lục giác $\mathbb{Z} + \mathbb{Z}\omega$: quay $60°$ ($\times \omega$) bảo toàn lưới $\Rightarrow$ CM bởi $\mathbb{Q}(\sqrt{-3})$.
Tên “nhân phức” xuất phát từ: tự đồng cấu tương ứng nhân với số phức (không phải số nguyên) trên $\mathbb{C}/\Lambda$. Thuật ngữ có từ thế kỷ 19, khi Abel và Jacobi nghiên cứu tích phân elliptic có “phép nhân phức tạp”.
Liên hệ với giả thuyết Birch--Dyer
- Coates--Wiles (1977): Nếu $E/\mathbb{Q}$ có CM và $L(E, 1) \neq 0$, thì $E(\mathbb{Q})$ hữu hạn. Đây là kết quả đầu tiên hướng BSD [coates-wiles1977].
- Rubin (1991): Nếu $E/\mathbb{Q}$ có CM và $L(E, 1) \neq 0$, thì $\mathrm{Sha}(E/\mathbb{Q})$ hữu hạn và công thức BSD mạnh đúng cho phần $p$-adic (“hầu hết” $p$) [rubin1991].
- Lý do CM dễ hơn: Hàm $L$ phân tích $L(E, s) = L(\psi, s) \cdot L(\bar{\psi}, s)$ với $\psi$ là Hecke character --- kỹ thuật giải tích mạnh áp dụng trực tiếp.
- Lý thuyết trường lớp: $j(E)$ sinh trường lớp Hilbert $H_K$ khi $\mathcal{O} = \mathcal{O}_K$. Điểm Heegner xây dựng “tự nhiên” qua lý thuyết trường lớp [gross-zagier1986, heegner1952].
Định nghĩa
Điểm bất động của $\pi_q$ chính là $E(\mathbb{F}_q)$: $E(\mathbb{F}_q) = \ker(\pi_q - \mathrm{id})$.
Ví dụ
Đếm $|E(\mathbb{F}_5)|$: thử tất cả $x \in \mathbb{F}_5$:
| $x$ | $x^3 + x$ | Phần dư bình phương? | Điểm |
|---|---|---|---|
| $0$ | $0$ | Có ($0^2$) | $(0, 0)$ |
| $1$ | $2$ | Không | --- |
| $2$ | $10 \equiv 0$ | Có ($0^2$) | $(2, 0)$ |
| $3$ | $30 \equiv 0$ | Có ($0^2$) | $(3, 0)$ |
| $4$ | $68 \equiv 3$ | Không | --- |
Cùng $\mathcal{O}$: $|E(\mathbb{F}_5)| = 4$. Vết: $a_5 = 5 + 1 - 4 = 2$.
Đa thức đặc trưng: $T^2 - 2T + 5 = 0$, nghiệm $\pi_5 = 1 \pm 2i$. Vì $|1 + 2i|^2 = 5 = q$ ✓.
Nhận xét: $E$ có CM bởi $\mathbb{Z}[i]$ (vì $j = 1728$), và $\pi_5 = 1 + 2i \in \mathbb{Z}[i]$.
Ý nghĩa trực giác
Nếu $E(\overline{\mathbb{F}}_q)$ là “torus rời rạc vô hạn”, thì $\pi_q$ quay torus này --- những điểm “đứng yên” tạo thành $E(\mathbb{F}_q)$.
Đa thức đặc trưng $T^2 - a_q T + q$ mã hóa “tốc độ quay”. Cận Hasse $|a_q| \leq 2\sqrt{q}$ (Giả thuyết Riemann cho $E/\mathbb{F}_q$) nói rằng phép quay “không quá nhanh cũng không quá chậm” --- $|E(\mathbb{F}_q)|$ gần $q + 1$ [hasse1933, deligne1974].
Liên hệ với giả thuyết Birch--Dyer
- Nhân tử Euler: Tại mỗi $p$ rút gọn tốt:
\[ L_p(E, s) = \frac{1}{1 - a_p p^{-s} + p^{1-2s}} = \frac{1}{\det(1 - \pi_p \cdot p^{-s} \mid T_\ell(E))}, \]trực tiếp từ đa thức đặc trưng Frobenius.
- Hàm $L$ toàn cục: $L(E, s) = \prod_p L_p(E, s)$ --- tích vô hạn trên mọi $p$. BSD nói $\mathrm{ord}_{s=1} L(E,s) = \mathrm{rk}(E(\mathbb{Q}))$ --- thông tin “cục bộ” quyết định tính chất “toàn cục”.
- Birch--Swinnerton-Dyer gốc: Dữ liệu EDSAC (1963) trực tiếp tính $a_p$ cho hàng nghìn $p$ --- tức đếm $|E(\mathbb{F}_p)|$, hay tính vết Frobenius [birch-sd1963, birch1968].
Định nghĩa
Cận Hasse (1933): $|a_p| \leq 2\sqrt{p}$, tương đương [hasse1933]:
Ví dụ
| $p$ | $|E(\mathbb{F}_p)|$ | $a_p = p + 1 - |E(\mathbb{F}_p)|$ | $2\sqrt{p}$ |
|---|---|---|---|
| $2$ | $5$ | $-2$ | $2.83$ |
| $3$ | $5$ | $-1$ | $3.46$ |
| $5$ | $5$ | $1$ | $4.47$ |
| $7$ | $4$ | $4$ | $5.29$ |
| $11$ | $11$ | $1$ | $6.63$ |
| $13$ | $9$ | $5$ | $7.21$ |
Dãy $\{a_p\}$ xác định hoàn toàn hàm $L(E, s)$. Đường cong này có hạng $r = 1$ (điểm sinh $(0, 0)$).
Ý nghĩa trực giác
- $a_p > 0$: ít điểm hơn kỳ vọng (“thưa”).
- $a_p < 0$: nhiều điểm hơn kỳ vọng (“dày”).
- $a_p = 0$: “đúng kỳ vọng” --- đường cong siêu kỳ dị tại $p$.
Phỏng đoán Sato--Tate (đã chứng minh, 2008): Dãy chuẩn hóa $a_p / (2\sqrt{p})$ phân bố theo luật bán tròn $\frac{2}{\pi}\sqrt{1 - t^2}\, dt$ khi $E$ không CM [taylor2008].
Liên hệ với giả thuyết Birch--Dyer
- Hàm $L$: $L(E, s) = \prod_{p \nmid N} (1 - a_p p^{-s} + p^{1-2s})^{-1} \cdot \prod_{p \mid N} L_p(E, s)$.
- Tích BSD gốc: Birch--Swinnerton-Dyer (1963) nghiên cứu $\Pi_E(X) = \prod_{p \leq X} \frac{p + 1 - a_p}{p}$ và phát hiện $\Pi_E(X) \sim C \cdot (\log X)^r$ [birch-sd1963].
- Modularity: $\{a_p\}$ cũng là hệ số Fourier của newform $f_E(\tau) = \sum a_n q^n$ bậc 2 level $N$ [wiles1995, bcdt2001]. Đây là cầu nối giải tích $\leftrightarrow$ số học.
Định nghĩa
Loại rút gọn phụ thuộc biệt thức $\widetilde{\Delta} = \Delta \bmod p$ [silverman2009]:
- Rút gọn tốt (good reduction): $p \nmid \Delta$ $\Rightarrow$ $\widetilde{E}$ trơn.
- Rút gọn xấu (bad reduction): $p \mid \Delta$ $\Rightarrow$ $\widetilde{E}$ kỳ dị. Chỉ xảy ra tại hữu hạn $p$.
Ví dụ
- $p = 3$: $\widetilde{\Delta} = 64 \equiv 1 \pmod{3} \neq 0$. Rút gọn tốt. $|E(\mathbb{F}_3)| = 4$, $a_3 = 0$ (siêu kỳ dị).
- $p = 5$: $\widetilde{\Delta} = 64 \equiv 4 \pmod{5} \neq 0$. Rút gọn tốt. $|E(\mathbb{F}_5)| = 4$, $a_5 = 2$.
- $p = 2$: $\widetilde{\Delta} = 0$. Rút gọn xấu. Trên $\mathbb{F}_2$: $x^3 + x = x(x^2+1) = x(x+1)^2$ --- nghiệm $x=1$ bội 2. Đường cong có nút tại $(1, 0)$.
Ý nghĩa trực giác
- Rút gọn tốt: Bức ảnh “sắc nét” --- $\widetilde{E}$ giữ nguyên cấu trúc.
- Rút gọn xấu: Bức ảnh “bị nhiễu” --- $\widetilde{E}$ có điểm kỳ dị.
Triết lý local-global: ghép tất cả bức ảnh $\widetilde{E}/\mathbb{F}_p$ (cho mọi $p$), ta phục hồi thông tin toàn cục về $E/\mathbb{Q}$. Hàm $L$ chính là cách “ghép” này.
Liên hệ với giả thuyết Birch--Dyer
- Tại $p$ rút gọn tốt: $L_p(E, s) = (1 - a_p p^{-s} + p^{1-2s})^{-1}$ --- nhân tử Euler bậc 2.
- Tại $p$ rút gọn xấu: $L_p$ đơn giản hơn (bậc 0 hoặc 1), phụ thuộc loại kỳ dị.
- Conductor: $N_E = \prod_{p \text{ xấu}} p^{f_p}$ --- tích trên các $p$ rút gọn xấu. Xuất hiện trong phương trình hàm và level dạng modular [tate1975].
- Triết lý BSD: Thông tin cục bộ ($a_p$ tại mỗi $p$) $\Rightarrow$ hàm $L$ $\Rightarrow$ bậc triệt tiêu $\Rightarrow$ hạng toàn cục $E(\mathbb{Q})$.
Định nghĩa
Rút gọn tốt chia thành hai loại [silverman2009]:
- Thường (ordinary): $p \nmid a_p$ (tức $a_p \not\equiv 0 \pmod{p}$). Phần lớn $p$ thuộc loại này.
- Siêu kỳ dị (supersingular): $p \mid a_p$. Xảy ra cho tập $p$ mật độ $0$ khi $E$ không CM. Khi $E$ có CM bởi $K = \mathbb{Q}(\sqrt{-d})$: $p$ siêu kỳ dị $\Leftrightarrow$ $p$ trơ (inert) hoặc phân nhánh (ramified) trong $K$.
Tại $p$ rút gọn tốt, nhóm $E(\mathbb{F}_p)$ là nhóm elliptic đầy đủ. Nhân tử Euler:
Ví dụ
| $p$ | $|E(\mathbb{F}_p)|$ | $a_p$ | $p \mid a_p$? | Loại |
|---|---|---|---|---|
| $3$ | $4$ | $0$ | Có | Siêu kỳ dị |
| $5$ | $4$ | $2$ | Không | Ordinary |
| $7$ | $8$ | $0$ | Có | Siêu kỳ dị |
| $11$ | $12$ | $0$ | Có | Siêu kỳ dị |
| $13$ | $8$ | $6$ | Không | Ordinary |
| $17$ | $16$ | $2$ | Không | Ordinary |
Nhận xét: $p = 3, 7, 11$ siêu kỳ dị --- đây là các $p \equiv 3 \pmod{4}$ (trơ trong $\mathbb{Q}(i)$). Các $p \equiv 1 \pmod{4}$ (tách trong $\mathbb{Q}(i)$) luôn ordinary.
Ý nghĩa trực giác
- Ordinary: Đường cong “bình thường” tại $p$ --- module Tate $p$-adic $T_p(E)$ có “phần thường” (unit root). Frobenius $\pi_p$ tác động “bán đơn giản” --- dễ phân tích.
- Supersingular: Đường cong “đặc biệt” tại $p$ --- $E[p] = \{0\}$ trên $\overline{\mathbb{F}}_p$ (không có điểm $p$-xoắn!). Frobenius “phức tạp hơn” --- lý thuyết Iwasawa khác biệt.
Phép tương tự: ordinary giống số nguyên có ước nguyên tố $p$ “đơn giản” ($p$ tách); supersingular giống $p$ “đặc biệt” ($p$ trơ hoặc phân nhánh).
Liên hệ với giả thuyết Birch--Dyer
- Hầu hết $p$ rút gọn tốt: Chỉ hữu hạn $p$ rút gọn xấu (chính xác: $p \mid N_E$). “Hầu hết” nhân tử Euler đến từ rút gọn tốt.
- Ordinary vs.supersingular trong Iwasawa: Phỏng đoán chính Iwasawa (Mazur, 1972) ban đầu chỉ phát biểu cho $p$ ordinary. Trường hợp supersingular phức tạp hơn --- cần lý thuyết “plus/minus Selmer groups” (Kobayashi, Sprung) [mazur-swinnerton-dyer1974].
- BSD $p$-adic: Với $p$ ordinary, BSD $p$-adic dạng Mazur--Tate--Teitelbaum “đơn giản”. Với $p$ supersingular, cần hiệu chỉnh logarit $p$-adic [mazur-tate-teitelbaum1986].
- Đếm điểm: Thuật toán Schoof--Elkies--Atkin tính $a_p$ trong $O((\log p)^5)$ --- cho phép tính hàm $L$ hiệu quả, kiểm nghiệm BSD bằng máy tính [schoof1985].
Định nghĩa
- Rút gọn nhân tách (split multiplicative): Nút với hai tiếp tuyến xác định trên $\mathbb{F}_p$. Nhóm phần trơn $\widetilde{E}^{\mathrm{ns}}(\mathbb{F}_p) \cong \mathbb{F}_p^{\times}$. Ký hiệu: $a_p = 1$.
- Rút gọn nhân không tách (non-split multiplicative): Nút với tiếp tuyến xác định trên $\mathbb{F}_{p^2} \setminus \mathbb{F}_p$. Nhóm phần trơn $\widetilde{E}^{\mathrm{ns}}(\mathbb{F}_p) \cong \ker(N: \mathbb{F}_{p^2}^{\times} \to \mathbb{F}_p^{\times})$. Ký hiệu: $a_p = -1$.
- Rút gọn cộng (additive reduction): Cusp. Nhóm phần trơn $\widetilde{E}^{\mathrm{ns}}(\mathbb{F}_p) \cong \mathbb{F}_p^{+}$. Ký hiệu: $a_p = 0$.
Tập các $p$ rút gọn xấu luôn hữu hạn: $\{p : p \mid \Delta_{\min}\}$.
Ví dụ
- Nhân tách: $E: y^2 + y = x^3 - x$ (conductor 37). Tại $p = 37$: nút, tiếp tuyến tách trên $\mathbb{F}_{37}$. $a_{37} = 1$. Nhóm phần trơn $\cong \mathbb{F}_{37}^{\times} \cong \mathbb{Z}/36\mathbb{Z}$.
- Nhân không tách: $E: y^2 = x^3 + x^2 - 2x$ tại $p = 2$. Trên $\mathbb{F}_2$: $y^2 = x^2(x+1)$ --- nút tại $(0,0)$, nhưng tiếp tuyến $y = \pm x\sqrt{x+1}$ không tách trên $\mathbb{F}_2$. $a_2 = -1$.
- Cộng: $E: y^2 = x^3 - x$ tại $p = 2$. Trên $\mathbb{F}_2$: $y^2 = x^3 + x = x(x+1)^2$ --- cusp tại $(1,0)$. $a_2 = 0$. Nhóm phần trơn $\cong \mathbb{F}_2^{+} \cong \mathbb{Z}/2\mathbb{Z}$.
Ý nghĩa trực giác
- Nhân (tách/không tách): Đường cong tự cắt $\Rightarrow$ nhóm nhân $\mathbb{F}_p^{\times}$ hoặc biến thể. Cấu trúc “giàu” nhất trong ba loại xấu.
- Cộng: Đường cong có cusp $\Rightarrow$ nhóm cộng $\mathbb{F}_p^{+}$. Cấu trúc “nghèo” nhất --- thông tin bị mất nhiều nhất.
Phân biệt nhanh: nhìn $a_p$ tại $p$ xấu --- $+1$ (nhân tách), $-1$ (nhân không tách), $0$ (cộng). Ba con số này xuất hiện trực tiếp trong nhân tử Euler.
Liên hệ với giả thuyết Birch--Dyer
- Nhân tử Euler tại $p$ xấu:
- Nhân tách: $L_p(E, s) = (1 - p^{-s})^{-1}$. Tại $s = 1$: $L_p(E, 1) = p/(p-1)$.
- Nhân không tách: $L_p(E, s) = (1 + p^{-s})^{-1}$. Tại $s = 1$: $L_p(E, 1) = p/(p+1)$.
- Cộng: $L_p(E, s) = 1$. “Vô hình” --- không đóng góp.
• Số Tamagawa $c_p$: Chỉ $c_p \neq 1$ khi $p$ rút gọn xấu. $c_p = [E(\mathbb{Q}_p) : E^0(\mathbb{Q}_p)]$ --- số thành phần nhóm đặc biệt. Xuất hiện trong tử số BSD mạnh: $\prod_p c_p$ [tate1975].
• Nghiệm ngoại lai: Khi $p$ nhân tách, BSD $p$-adic có “exceptional zero” --- nhân tử Euler triệt tiêu tại $s = 1$, cần hiệu chỉnh $\mathcal{L}$-invariant [mazur-tate-teitelbaum1986].
Định nghĩa
Tương đương: đường cong có mô hình Tate tại $p$ --- tồn tại $q_E \in p\mathbb{Z}_p$ ($|q_E|_p < 1$) sao cho [silverman1994]:
Nhân tử Euler: $L_p(E, s) = (1 - p^{-s})^{-1}$, ký hiệu $a_p = 1$.
Ví dụ
Tại $p = 11$: rút gọn nhân tách. Tham số Tate $q_{11} = 11^{-5} \cdot (1 + O(11))$ (chuỗi $q$-expansion).
Phỏng đoán Mazur--Tate--Teitelbaum: $L_{11\text{-adic}}(E, 1) = \mathcal{L}_{11} \cdot \frac{L^{\mathrm{alg}}(E, 1)}{\Omega_E}$, trong đó $\mathcal{L}_{11} = \frac{\log_{11}(q_{11})}{\mathrm{ord}_{11}(q_{11})}$ là $\mathcal{L}$-invariant --- hệ số hiệu chỉnh cho exceptional zero.
Ý nghĩa trực giác
Hình ảnh: torus phức $\mathbb{C}/\Lambda$ “mở ra” thành $\mathbb{C}^{\times}/q^{\mathbb{Z}}$. Tương tự, torus $p$-adic “mở ra” thành “vòng xuyến $p$-adic”. Nhóm nhân $\mathbb{Q}_p^{\times}$ “quấn quanh” bởi lũy thừa $q_E$ --- mỗi vòng quấn cho một “lớp” tương đương.
Liên hệ với giả thuyết Birch--Dyer
- Vấn đề: Nhân tử Euler $L_p = (1 - p^{-s})^{-1}$ có $(1 - p^{-1}) \neq 0$ tại $s = 1$, nhưng phiên bản $p$-adic: $(1 - \alpha_p^{-1})$ với $\alpha_p$ là nghiệm đơn vị --- triệt tiêu!
- Phỏng đoán MTT (1986): $L_p(E, 1) = 0$ (zero “ngoại lai”, không liên quan hạng), và đạo hàm $L_p'(E, 1) = \mathcal{L}_p \cdot L^{\mathrm{alg}}(E, 1)$ [mazur-tate-teitelbaum1986].
- Đã chứng minh: Greenberg--Stevens (1993) chứng minh MTT cho $E$ hạng 0.
- Dấu gốc: Tại $p$ nhân tách, dấu gốc cục bộ $w_p = -1$ --- ảnh hưởng parity conjecture.
Định nghĩa
Nhóm phần trơn: $\widetilde{E}^{\mathrm{ns}}(\mathbb{F}_p) \cong \ker\bigl(N: \mathbb{F}_{p^2}^{\times} \to \mathbb{F}_p^{\times}\bigr)$ --- nhóm “norm 1” trong $\mathbb{F}_{p^2}^{\times}$.
Nhân tử Euler: $L_p(E, s) = (1 + p^{-s})^{-1}$, ký hiệu $a_p = -1$ [silverman2009].
Liên hệ với nhân tách: twist bậc hai $E^{(d)}$ của $E$ (với $d$ thích hợp) biến nhân tách thành nhân không tách và ngược lại.
Ví dụ
- Tại $p = 3$: rút gọn nhân không tách. $a_3 = -1$. Nhân tử: $L_3(E, s) = (1 + 3^{-s})^{-1}$.
- Twist $E^{(-1)}: y^2 = x^3 - x^2 - 2x$: tại $p = 3$ trở thành nhân tách. $a_3 = 1$.
Ý nghĩa trực giác
- Tách: Hai tiếp tuyến “nhìn thấy” trong $\mathbb{F}_p$ --- giống hai đường thẳng cắt nhau trên mặt phẳng.
- Không tách: Tiếp tuyến “ẩn” --- cần mở rộng sang $\mathbb{F}_{p^2}$ mới thấy. Giống hai đường thẳng “liên hợp” --- chỉ nhìn thấy khi “đeo kính $\mathbb{F}_{p^2}$”.
Phép tương tự: phương trình $x^2 + 1 = 0$ “không tách” trên $\mathbb{R}$ (không có nghiệm thực) nhưng “tách” trên $\mathbb{C}$ (nghiệm $\pm i$).
Liên hệ với giả thuyết Birch--Dyer
- Nhân tử Euler: $L_p(E, 1) = (1 + 1/p)^{-1} = p/(p+1)$. Khác nhân tách: không có exceptional zero $p$-adic.
- Dấu gốc: $w_p = +1$ (khác nhân tách: $w_p = -1$). Ảnh hưởng dấu phương trình hàm: $w(E) = (-1)^{r_{\mathrm{an}}} = \prod_v w_v$.
- Số Tamagawa: Tại $p$ nhân (tách hoặc không): $c_p = \mathrm{ord}_p(\Delta_{\min})$ nếu $p$ nhân tách, $c_p = 1$ hoặc $2$ nếu không tách (phụ thuộc $\mathrm{ord}_p(\Delta_{\min})$ chẵn/lẻ).
- Twist và BSD: BSD cho $E$ và twist $E^{(d)}$ liên hệ qua đổi chỗ nhân tách/không tách --- cho phép “chuyển” kết quả BSD giữa hai đường cong.
Định nghĩa
Nhóm phần trơn: $\widetilde{E}^{\mathrm{ns}}(\mathbb{F}_p) \cong \mathbb{F}_p^{+}$ (nhóm cộng trường hữu hạn).
Nhân tử Euler: $L_p(E, s) = 1$ --- “vô hình” (bậc 0). Ký hiệu: $a_p = 0$.
Conductor tại $p$ cộng: $f_p \geq 2$ (thay vì $f_p = 1$ cho nhân). Với $p \geq 5$: $f_p = 2$. Với $p = 2, 3$: $f_p$ có thể lên đến $2 + 3\delta$ (“wild part”) [silverman2009, tate1975].
Ví dụ
- $E: y^2 = x^3 + p^2$ tại $p$: trên $\mathbb{F}_p$: $y^2 = x^3$ --- cusp tại $(0,0)$. Rút gọn cộng. $f_p = 2$ (tame).
- $E: y^2 = x^3 - x$ (conductor $N = 32 = 2^5$) tại $p = 2$: $f_2 = 5$ (wild!). Lý do: $p = 2$ nhỏ, có “wild ramification” --- conductor lớn hơn nhiều so với tame case.
- Mọi đường cong có rút gọn cộng tại $p$ có thể “sửa” thành rút gọn tốt hoặc nhân bằng cách mở rộng trường cơ sở. Cụ thể: tồn tại mở rộng hữu hạn $K/\mathbb{Q}_p$ sao cho $E/K$ có rút gọn tốt hoặc nhân (định lý “semistable reduction” --- bất kỳ EC nào cũng trở thành semistable sau mở rộng hữu hạn).
Ý nghĩa trực giác
- Nhân (tách/không tách): Nhóm phần trơn $\cong \mathbb{F}_p^{\times}$ --- cấu trúc “tương tự” elliptic (nhóm nhân, bậc $p - 1$). Mất ít thông tin.
- Cộng: Nhóm phần trơn $\cong \mathbb{F}_p^{+}$ --- cấu trúc “phẳng” (nhóm cộng, bậc $p$). Mất nhiều thông tin --- $L_p = 1$ nghĩa là “không đóng góp” vào hàm $L$.
Phép tương tự: nhân giống “tấm gương mờ” (vẫn phản chiếu, dù méo). Cộng giống “tấm gương vỡ” (không phản chiếu gì).
Liên hệ với giả thuyết Birch--Dyer
- Conductor: $p$ cộng đóng góp $p^{f_p}$ với $f_p \geq 2$ --- “nặng” hơn nhân ($f_p = 1$). Điều này ảnh hưởng phương trình hàm: $N^{s/2} (2\pi)^{-s} \Gamma(s) L(E, s)$ đối xứng qua $s \leftrightarrow 2-s$.
- Semistable: Đường cong semistable ($=$ không có rút gọn cộng tại mọi $p$) là trường hợp Wiles chứng minh modularity đầu tiên (1995) [wiles1995]. BCDT (2001) mở rộng cho mọi đường cong [bcdt2001].
- Số Tamagawa: Tại $p$ cộng, $c_p$ phức tạp hơn --- phụ thuộc loại fiber Kodaira (thuật toán Tate phân loại). $c_p$ có thể lên đến $4$ (type $I_0^*$) hoặc lớn hơn.
- BSD mạnh tại $p$ cộng: Thành phần $c_p$ và phần “wild” của conductor gây khó khăn kỹ thuật. Kết quả BSD mạnh thường giả thiết $E$ semistable hoặc loại trừ $p = 2, 3$.
Định nghĩa
Mô hình tối thiểu luôn tồn tại và duy nhất (lên đến đẳng cấu trên $\mathbb{Z}_p$) cho mỗi $p$ [silverman2009].
Biệt thức tối thiểu $\Delta_{\min, p}$: $\mathrm{ord}_p(\Delta_{\min, p}) < 12$ (vì phép đổi biến $u$ nhân $\Delta$ với $u^{12}$).
Phân loại: Nếu $\mathrm{ord}_p(\Delta_{\min}) = 0$: rút gọn tốt. Nếu $> 0$: rút gọn xấu.
Ví dụ
- $E: y^2 = x^3 + 16$. Biệt thức $\Delta = -27 \cdot 16^2 \cdot 4 = -27648 = -2^{10} \cdot 27$. Tại $p = 2$: $\mathrm{ord}_2(\Delta) = 10$. Phép đổi biến $x = 4X$, $y = 8Y$: $Y^2 = X^3 + 1$. Biệt thức mới $\Delta' = -27$. $\mathrm{ord}_2(\Delta') = 0$ --- mô hình tối thiểu tại $2$.
- $E: y^2 = x^3 - 432$ (đường cong với $j = 0$). $\Delta = -2^{12} \cdot 3^9$. Tại $p = 2$: $\mathrm{ord}_2 = 12$. Đổi biến $u = 2$: $\Delta' = \Delta/u^{12} = -3^9$. $\mathrm{ord}_2(\Delta') = 0$. Mô hình tối thiểu: $y^2 = x^3 - 27$.
- Thuật toán Tate xác định loại fiber tối thiểu --- phân loại Kodaira--Néron (types $I_n$, $II$, $III$, $IV$, $I_n^*$, $II^*$, $III^*$, $IV^*$) [tate1975].
Ý nghĩa trực giác
- Biệt thức nhỏ nhất $\Rightarrow$ phương trình “ít phức tạp nhất”.
- Giống “rút gọn phân số”: $6/4$ và $3/2$ biểu diễn cùng số, nhưng $3/2$ “tối thiểu”.
Mô hình tối thiểu quan trọng vì: rút gọn modulo $p$ chỉ “có nghĩa” khi dùng mô hình tối thiểu --- nếu dùng mô hình không tối thiểu, loại rút gọn có thể “sai” (ví dụ: rút gọn tốt bị biến thành cộng bởi hệ số lớn).
Liên hệ với giả thuyết Birch--Dyer
- Vi phân Néron: Vi phân bất biến $\omega = \frac{dx}{2y + a_1 x + a_3}$ trên mô hình tối thiểu là vi phân Néron (Néron differential). Chu kỳ thực $\Omega_E = \int_{E(\mathbb{R})} |\omega|$ trong BSD mạnh phải dùng vi phân Néron --- sai mô hình $\Rightarrow$ sai $\Omega_E$ bởi hệ số $u$ [silverman1994].
- Số Tamagawa: $c_p$ được tính từ mô hình tối thiểu tại $p$ (qua thuật toán Tate).
- Hằng số Manin: Nếu $\phi: X_0(N) \to E$ là parametrization modular, thì $\phi^*(\omega_E) = c_{\mathrm{Manin}} \cdot 2\pi i f_E(\tau) d\tau$, trong đó $c_{\mathrm{Manin}} \in \mathbb{Z}$ (phỏng đoán Manin: $c_{\mathrm{Manin}} = \pm 1$). Hằng số này phụ thuộc việc chọn mô hình tối thiểu [manin1972].
Định nghĩa
Tồn tại: Trên $\mathbb{Q}$, phương trình tối thiểu toàn cục luôn tồn tại (nhờ $\mathbb{Q}$ có số lớp $h(\mathbb{Q}) = 1$). Trên trường số tổng quát $K$, nó tồn tại khi và chỉ khi lớp ước $\delta_{E/K}$ trong nhóm lớp $\mathrm{Cl}(K)$ tầm thường [silverman2009].
Biệt thức tối thiểu toàn cục: $\Delta_{\min} = \Delta_{\min}(E/\mathbb{Q})$ --- nhỏ nhất tuyệt đối.
Ví dụ
- $E: y^2 + y = x^3 - x$ (37.a1 trong LMFDB [lmfdb]). Đây đã là phương trình tối thiểu toàn cục: $a_1 = 0$, $a_2 = 0$, $a_3 = 1$, $a_4 = -1$, $a_6 = 0$. $\Delta_{\min} = -37$.
- $E: y^2 = x^3 - 432$. $\Delta = -2^{12} \cdot 3^9$. Đổi biến $x = 4X + 0$, $y = 8Y + 0$: $Y^2 = X^3 - \frac{432}{64} = X^3 - 6.75$. Không nguyên! Cần dùng phương trình Weierstrass tổng quát (với $a_1, a_3$) để đạt hệ số nguyên tối thiểu.
- Phần mềm SageMath/PARI tự động tính mô hình tối thiểu toàn cục [sagemath, pari, cremona1997]. Ví dụ:
E = EllipticCurve([0,0,1,-1,0]); E.minimal\_model().
Ý nghĩa trực giác
Trên $\mathbb{Q}$: CÓ --- vì $\mathbb{Q}$ “đơn giản” (nhóm lớp tầm thường). Trên trường số $K$ phức tạp: có thể KHÔNG --- “xung đột” giữa các $p$ khác nhau (tương tự: không thể tối ưu mọi mặt cùng lúc).
Phép tương tự: mô hình tối thiểu toàn cục giống “bản vẽ kỹ thuật chuẩn” --- ai nhìn vào cũng thấy cùng đường cong, không bị “biến dạng” bởi phép đổi biến.
Liên hệ với giả thuyết Birch--Dyer
- Conductor: $N_E = \prod_p p^{f_p}$ tính từ mô hình tối thiểu.
- Chu kỳ thực: $\Omega_E = \int_{E(\mathbb{R})} |\omega_{\min}|$ dùng vi phân Néron từ mô hình tối thiểu toàn cục.
- LMFDB/Cremona: Cơ sở dữ liệu lưu mỗi đường cong ở dạng tối thiểu toàn cục. Label Cremona (ví dụ 37a1) dùng conductor + ký tự isogeny class + số thứ tự trong class [cremona1997, lmfdb].
- Kiểm nghiệm BSD: Mọi tính toán kiểm nghiệm BSD (Cremona, Stein, ...) đều bắt đầu từ mô hình tối thiểu toàn cục --- đảm bảo $\Omega_E$, $c_p$, $R_E$, $|\mathrm{Sha}|$ nhất quán.
Định nghĩa
Cụ thể, cho đường cong elliptic $E$ với phương trình Weierstrass tối thiểu tại $p$:
- Nếu $p \nmid \Delta$ (biệt thức): rút gọn tốt, $f_p = 0$, $c_p = 1$. Dừng.
- Nếu $p \mid \Delta$ nhưng phần kỳ dị là nút: rút gọn nhân (tách hoặc không tách), $f_p = 1$.
- Nếu phần kỳ dị là cusp: rút gọn cộng, $f_p \geq 2$. Thuật toán tiếp tục phân loại chi tiết theo ký hiệu Kodaira ($\mathrm{I}_n$, $\mathrm{I}_n^*$, $\mathrm{II}$, $\mathrm{III}$, $\mathrm{IV}$, $\mathrm{II}^*$, $\mathrm{III}^*$, $\mathrm{IV}^*$).
Ví dụ
Bước 1: $2 \mid \Delta$, nên rút gọn không tốt tại $p = 2$.
Bước 2: Rút gọn modulo 2: $\tilde{E}: y^2 = x^3 + x^2$ trên $\mathbb{F}_2$. Điểm kỳ dị $(0,0)$: đạo hàm riêng $\partial F/\partial x = 3x^2 + 2x \equiv x^2$, $\partial F/\partial y = 2y \equiv 0$. Tại $(0,0)$: cả hai bằng $0$, xác nhận kỳ dị. Ma trận Hessian cho thấy đây là nút, nên rút gọn nhân.
Bước 3: Kiểm tra tách/không tách trên $\mathbb{F}_2$: tiếp tuyến tại nút cho hai hướng trong $\mathbb{F}_2$ $\Rightarrow$ rút gọn nhân tách, ký hiệu Kodaira $\mathrm{I}_1$, $c_2 = 1$, $f_2 = 1$.
Áp dụng thuật toán Tate tại $p = 11$: $\Delta = -11^5$, rút gọn nhân tách, ký hiệu Kodaira $\mathrm{I}_5$, số Tamagawa $c_{11} = 5$.
Tại mọi $p \neq 11$: $p \nmid 11$ nên rút gọn tốt, $c_p = 1$.
Ý nghĩa trực giác
- Khỏe mạnh (rút gọn tốt): không có vấn đề gì.
- Bệnh nhẹ (rút gọn nhân): nút --- đường cong vẫn “gần” trơn, chỉ tự cắt. Ký hiệu Kodaira $\mathrm{I}_n$ cho biết “mức độ” nút.
- Bệnh nặng (rút gọn cộng): cusp --- đường cong suy biến nghiêm trọng. Các ký hiệu $\mathrm{II}, \mathrm{III}, \mathrm{IV}, \mathrm{I}_n^*, \mathrm{II}^*, \mathrm{III}^*, \mathrm{IV}^*$ là “phân loại bệnh” chi tiết.
Liên hệ với giả thuyết Birch--Dyer
- Số Tamagawa $c_p$: xuất hiện trực tiếp trong công thức BSD mạnh $\frac{L^{(r)}(E,1)}{r!} = \frac{|\mathrm{Sha}| \cdot \Omega_E \cdot R_E \cdot \prod_p c_p}{|E(\mathbb{Q})_{\mathrm{tors}}|^2}$. Thuật toán Tate tính chính xác mỗi $c_p$.
- Conductor: $N_E = \prod_p p^{f_p}$ với $f_p$ từ thuật toán Tate. Conductor xác định phương trình hàm của $L(E,s)$.
- Thực thi: Phần mềm Cremona, SageMath [sagemath], PARI/GP [pari] đều cài đặt thuật toán Tate là bước đầu tiên khi phân tích đường cong elliptic.
Định nghĩa
Tích trên hữu hạn vì chỉ có hữu hạn số nguyên tố $p$ mà $E$ có rút gọn xấu (chính xác là các ước của biệt thức tối thiểu).
Ví dụ
- $E: y^2 + y = x^3 - x^2 - 10x - 20$: conductor $N_E = 11$. Rút gọn xấu chỉ tại $p = 11$ (nhân tách, $f_{11} = 1$). Đây là đường cong elliptic có conductor nhỏ nhất trên $\mathbb{Q}$.
- $E: y^2 = x^3 - x$: conductor $N_E = 32 = 2^5$. Rút gọn xấu chỉ tại $p = 2$ (cộng, $f_2 = 2 + 3 = 5$ do phần hoang dã $\delta_2 = 3$). Đường cong CM bởi $\mathbb{Z}[i]$.
- $E: y^2 + y = x^3 - x^2$: conductor $N_E = 11$, hạng $r = 0$.
- $E: y^2 + xy = x^3 - x^2 - 4x + 4$ (37a1): conductor $N_E = 37$. Rút gọn nhân tách tại $p = 37$, $f_{37} = 1$. Hạng $r = 1$.
Ý nghĩa trực giác
- Nó mã hóa tất cả vị trí mà đường cong “gặp rắc rối” (rút gọn xấu) và mức độ nghiêm trọng tại mỗi vị trí.
- Conductor càng nhỏ $\Rightarrow$ đường cong “đơn giản” hơn (ít số nguyên tố xấu).
- Hai đường cong có cùng conductor thường có “tính cách” gần nhau --- chúng cùng “sống” trong không gian modular $X_0(N)$.
Phép tương tự: nếu đường cong elliptic là “con người”, conductor là “lý lịch” ghi nhận mọi “sai phạm” (rút gọn xấu) tại mỗi “địa phương” (số nguyên tố).
Liên hệ với giả thuyết Birch--Dyer
- Định lý modularity [wiles1995, taylor-wiles1995, breuil2001]: mỗi $E/\mathbb{Q}$ ứng với dạng modular newform $f \in S_2(\Gamma_0(N_E))$ cùng conductor. Do đó $L(E,s) = L(f,s)$ thỏa mãn phương trình hàm với conductor $N_E$.
- Phương trình hàm: $\Lambda(E,s) = w \cdot \Lambda(E, 2-s)$ với $\Lambda(E,s) = N_E^{s/2} (2\pi)^{-s} \Gamma(s) L(E,s)$ và $w = \pm 1$ là dấu gốc (root number).
- Dấu gốc: $w = (-1)^r$ theo BSD yếu, với $r = \mathrm{ord}_{s=1} L(E,s)$. Dấu gốc tính từ conductor: $w = -\mu(N_E) \cdot \prod_{p \mid N_E} w_p$.
- LMFDB: Đường cong được tổ chức theo conductor --- ví dụ 11a1, 37a1 --- conductor là “khóa chính” của cơ sở dữ liệu [lmfdb].
Định nghĩa
Với mọi lược đồ trơn $\mathcal{X}/\mathbb{Z}$ và ánh xạ hữu tỉ $\mathcal{X}_\mathbb{Q} \to E$ trên $\mathbb{Q}$, tồn tại duy nhất mở rộng $\mathcal{X} \to \mathcal{E}$ trên $\mathbb{Z}$.
Nói đơn giản: mô hình Néron là “cách tốt nhất” để mở rộng đường cong elliptic $E$ (sống trên $\mathbb{Q}$) thành một đối tượng (sống trên $\mathbb{Z}$) sao cho mọi phép biến đổi hợp lệ trên $\mathbb{Q}$ đều “mở rộng được” xuống $\mathbb{Z}$ [neron1965, silverman2009].
Ví dụ
- Rút gọn tốt tại $p$: Mô hình Néron $\mathcal{E}_p$ liên thông, $\Phi_p = 0$, $c_p = 1$. Thớ đặc biệt là đường cong elliptic trên $\mathbb{F}_p$.
- Rút gọn nhân tách $\mathrm{I}_n$: Thớ đặc biệt gồm $n$ bản sao $\mathbb{P}^1$ sắp xếp thành “vòng tròn” (cycle). Nhóm thành phần $\Phi_p \cong \mathbb{Z}/n\mathbb{Z}$, $c_p = n$.
- Ví dụ cụ thể: Đường cong 11a1 tại $p = 11$: ký hiệu Kodaira $\mathrm{I}_5$, thớ đặc biệt có 5 thành phần sắp thành vòng, $c_{11} = 5$.
Ý nghĩa trực giác
- Mô hình Weierstrass tối thiểu có thể “kỳ dị” tại các thớ xấu.
- Mô hình Néron “giải kỳ dị” (desingularize) thớ đặc biệt, trả giá bằng việc thớ có thể không liên thông --- tách thành nhiều thành phần.
- Số thành phần (= số Tamagawa $c_p$) đo “đường cong bị vỡ thành bao nhiêu mảnh” tại $p$.
Phép tương tự: đường cong elliptic là chiếc bình gốm. Tại các số nguyên tố “xấu”, chiếc bình bị “rạn”. Mô hình Néron là cách “phục chế” --- bình trơn nhưng có thể bị “vỡ” thành nhiều mảnh ($c_p$ mảnh).
Liên hệ với giả thuyết Birch--Dyer
- Vi phân Néron: $\omega_{\mathrm{Néron}} \in H^0(\mathcal{E}, \Omega^1)$ là vi phân “chuẩn” trên mô hình Néron. Chu kỳ thực $\Omega_E = \int_{E(\mathbb{R})} |\omega_{\mathrm{Néron}}|$ trong công thức BSD dùng chính vi phân này.
- Số Tamagawa: $c_p = |\Phi_p(\mathbb{F}_p)|$ từ nhóm thành phần --- xuất hiện trực tiếp trong công thức BSD.
- Hằng số Manin: $c_{\mathrm{Manin}} = [\omega_{\min} : \omega_f]$ liên hệ vi phân Néron $\omega_{\min}$ với vi phân dạng modular $\omega_f$. Phỏng đoán Manin: $c_{\mathrm{Manin}} = 1$ [manin1972].
- Dãy chính xác Néron: cho phép liên hệ $\mathrm{Sha}(E/\mathbb{Q})$ với đối đồng điều của mô hình Néron, nền tảng cho chứng minh hữu hạn $\mathrm{Sha}$ trong nhiều trường hợp.
Định nghĩa
- $|E(\mathbb{F}_p)| \equiv 1 \pmod{p}$, tức $a_p = p + 1 - |E(\mathbb{F}_p)| \equiv 0 \pmod{p}$.
- $\mathrm{End}(E) \otimes \mathbb{Q}$ là đại số quaternion (bậc 4 trên $\mathbb{Q}$), thay vì trường bậc 2 như trường hợp thông thường.
- $E[p] = 0$ (không có điểm $p$-xoắn trên bao đóng đại số $\overline{\mathbb{F}}_p$).
- Nếu $p \geq 5$: $j(E) \in \mathbb{F}_{p^2}$ (j-bất biến nằm trong $\mathbb{F}_{p^2}$).
Đường cong không siêu kỳ dị gọi là thông thường (ordinary). Với đường cong thông thường, $p \nmid a_p$ và $\mathrm{End}(E) \otimes \mathbb{Q}$ là trường bậc 2 (CM field) [silverman2009].
Ví dụ
- Siêu kỳ dị: $E: y^2 = x^3 + 1$ trên $\mathbb{F}_5$. Ta đếm: $|E(\mathbb{F}_5)| = 6 = 5 + 1$, nên $a_5 = 0 \equiv 0 \pmod{5}$. Đường cong siêu kỳ dị.
- Thông thường: $E: y^2 = x^3 + x + 1$ trên $\mathbb{F}_5$. Đếm điểm: $(0, \pm 1), (2, \pm 1), (3, 0), \mathcal{O}$ $\Rightarrow$ $|E(\mathbb{F}_5)| = 6$, $a_5 = 0$ --- cũng siêu kỳ dị!
Thử $E: y^2 = x^3 + 2$ trên $\mathbb{F}_5$: đếm $|E(\mathbb{F}_5)| = 4$, $a_5 = 2 \not\equiv 0 \pmod{5}$. Đường cong thông thường.
- Thống kê: Với $p$ cho trước, chỉ có hữu hạn j-bất biến siêu kỳ dị: khoảng $\lfloor p/12 \rfloor$ giá trị. Ví dụ $p = 2$: chỉ $j = 0$; $p = 3$: chỉ $j = 0$; $p = 5$: $j = 0$; $p = 11$: $j = 0, 1$.
Ý nghĩa trực giác
- “Quá nhiều đối xứng”: vành tự đồng cấu $\mathrm{End}(E)$ lớn bất thường (bậc 4 thay vì bậc 2 hoặc 1). Giống viên kim cương cắt hoàn hảo --- quá đối xứng so với đá thông thường.
- “Không có điểm $p$-xoắn”: $E[p] = 0$ nghĩa là phép nhân $[p]$ “giết chết” tất cả. Ở đường cong thông thường, $E[p] \cong \mathbb{Z}/p\mathbb{Z}$ --- vẫn còn “sống sót” một phần.
- Hiếm nhưng quan trọng: Tỷ lệ j-bất biến siêu kỳ dị là $\sim 1/12$ --- nhỏ nhưng khác không, và chúng có vai trò đặc biệt trong lý thuyết.
Liên hệ với giả thuyết Birch--Dyer
- Lý thuyết Iwasawa: Hành vi của nhóm Selmer trong tháp $\mathbb{Z}_p$-mở rộng phụ thuộc mạnh vào $E$ thông thường hay siêu kỳ dị tại $p$.
- Thông thường: lý thuyết Iwasawa “cổ điển” (Mazur, Greenberg) áp dụng trực tiếp.
- Siêu kỳ dị: cần lý thuyết phức tạp hơn (Kobayashi plus/minus Selmer, Pollack, Sprung) [kobayashi2003].
Định nghĩa
Ba dạng chuẩn Legendre là:
Khi $\varphi = \pi/2$, ta được tích phân elliptic đầy đủ: $K(k) = F(\pi/2, k)$, $E(k) = E(\pi/2, k)$.
Tên “elliptic” bắt nguồn từ bài toán tính chu vi đường ellipse: $L = 4a \cdot E(e)$ với $e$ là tâm sai, $a$ là bán trục lớn [silverman2009].
Ví dụ
- Đường tròn ($a = b$, $e = 0$): $L = 4a \cdot \pi/2 = 2\pi a$ --- tích phân sơ cấp.
- Ellipse ($e > 0$): không biểu diễn được bằng hàm sơ cấp --- đây là tích phân elliptic đích thực.
- Ví dụ: $a = 2, b = 1$, $e = \sqrt{3}/2$. $L = 8 \cdot E(\sqrt{3}/2) \approx 8 \times 1.2111 = 9.689$.
Ý nghĩa trực giác
- Thế kỷ 17--18: Euler, Fagnano nghiên cứu chu vi ellipse $\Rightarrow$ phát hiện tích phân “không sơ cấp”.
- Abel--Jacobi (1820s--1830s): Bước đột phá --- thay vì tính tích phân $u = \int_0^x \frac{dt}{\sqrt{P(t)}}$, hãy đảo ngược: xét $x = x(u)$ là hàm của $u$. Hàm ngược này tuần hoàn kép trên $\mathbb{C}$ --- dẫn đến hàm elliptic!
- Từ tích phân đến đường cong: Đồng nhất thức cộng của tích phân elliptic phản ánh luật nhóm trên đường cong elliptic $y^2 = P(x)$.
Liên hệ với giả thuyết Birch--Dyer
- Chu kỳ thực: $\Omega_E = \int_{E(\mathbb{R})} \omega$ (tích phân vi phân Néron trên phần thực) --- đây chính là tích phân elliptic! Đại lượng này xuất hiện trực tiếp trong công thức BSD.
- Chu kỳ phức: $\omega_1, \omega_2$ (hai chu kỳ của tích phân elliptic liên kết) tạo thành lưới $\Lambda = \mathbb{Z}\omega_1 + \mathbb{Z}\omega_2$, và $E(\mathbb{C}) \cong \mathbb{C}/\Lambda$.
- Chiều cao chính tắc Néron--Tate: $\hat{h}(P) = -\frac{1}{2}\log|\sigma(z_P)|^2 + \ldots$ liên quan đến hàm sigma Weierstrass --- bản thân là “tích phân elliptic biến đổi”.
- Lịch sử: Birch và Swinnerton-Dyer phát biểu giả thuyết ban đầu (1965) bằng ngôn ngữ chu kỳ thực $\Omega_E$ --- tức tích phân elliptic [birch1965].
Định nghĩa
Các tính chất cơ bản:
- $\wp$ là hàm chẵn: $\wp(-z) = \wp(z)$.
- $\wp$ là hàm tuần hoàn kép: $\wp(z + \omega) = \wp(z)$ với mọi $\omega \in \Lambda$.
- $\wp$ có cực bậc 2 tại mọi điểm lưới $z \in \Lambda$ và giải tích trên $\mathbb{C} \setminus \Lambda$.
- $\wp$ thỏa mãn phương trình vi phân:
\[ (\wp')^2 = 4\wp^3 - g_2 \wp - g_3, \]với các bất biến lưới $g_2 = 60 \sum_{\omega \neq 0} \omega^{-4}$, $g_3 = 140 \sum_{\omega \neq 0} \omega^{-6}$ [silverman2009].
Ví dụ
- Đối xứng: $\Lambda$ bất biến khi nhân $i$ (xoay 90°), nên $\wp(iz) = -\wp(z)$. Suy ra $g_3 = 0$ (vì $g_3$ phải đổi dấu dưới phép nhân $i$, nhưng cũng phải bất biến).
- Phương trình: $(\wp')^2 = 4\wp^3 - g_2 \wp$, hay (chuẩn hóa) $y^2 = x^3 - x$. Đây là đường cong elliptic $E: y^2 = x^3 - x$ với CM bởi $\mathbb{Z}[i]$.
- Giá trị: $g_2 = 4\pi^4 \cdot \frac{E_4(i)}{(2\pi)^4} \approx 189.07$ (dùng chuỗi Eisenstein $E_4$).
- Đối xứng bậc 3: $\zeta_3 \Lambda = \Lambda$, nên $\wp(\zeta_3 z) = \zeta_3^{-2}\wp(z)$. Suy ra $g_2 = 0$.
- Phương trình: $(\wp')^2 = 4\wp^3 - g_3$, hay $y^2 = x^3 + 1$. CM bởi $\mathbb{Z}[\zeta_3]$.
Ý nghĩa trực giác
- Torus = hình xuyến: $\mathbb{C}/\Lambda$ là mặt phẳng phức “cuộn” thành hình xuyến (donut).
- $\wp$ = “bản đồ”: Hàm $\wp$ là cách “trải phẳng” hình xuyến thành đường cong trong $\mathbb{C}^2$ --- cụ thể, đường cong elliptic $y^2 = 4x^3 - g_2 x - g_3$.
- Uniformization: Mọi đường cong elliptic trên $\mathbb{C}$ đều “thực chất” là torus. $\wp$ cho phép đi qua lại giữa hai cách nhìn.
Phép tương tự: hàm $e^{i\theta}$ “cuộn” đường thẳng $\mathbb{R}$ thành đường tròn $S^1$. Tương tự, hàm $(\wp, \wp')$ “cuộn” mặt phẳng $\mathbb{C}$ thành “đường tròn bậc cao” (torus/đường cong elliptic).
Liên hệ với giả thuyết Birch--Dyer
- Chu kỳ: Hai chu kỳ $\omega_1, \omega_2$ của $\wp$ chính là tích phân $\omega_i = \int_{\gamma_i} \frac{dx}{2y}$ trên hai vòng sinh của $E(\mathbb{C})$. Chu kỳ thực $\Omega_E$ trong BSD là tổ hợp tuyến tính của $\omega_1, \omega_2$.
- Hàm sigma: $\sigma(z; \Lambda)$ --- “nguyên hàm” của $-\wp$ --- liên quan đến chiều cao Néron--Tate: $\hat{h}(P) = -\log|\sigma(z_P)/\sigma_0|$ (chuẩn hóa thích hợp).
- Modular parametrization: Theo định lý modularity [wiles1995], tồn tại $\phi: X_0(N) \to E$. Trên $\mathbb{C}$, $\phi$ kết hợp uniformization $\mathbb{H}/\Gamma_0(N) \to X_0(N)(\mathbb{C})$ với uniformization $\mathbb{C}/\Lambda \to E(\mathbb{C})$.
- Điểm Heegner: Xây dựng điểm Heegner $P_K \in E(\mathbb{Q})$ bắt đầu từ CM points trên $X_0(N)$, rồi đẩy qua $\phi$ và dùng uniformization $\mathbb{C}/\Lambda \cong E(\mathbb{C})$ để tính tọa độ hữu tỉ [gross-zagier1986].
Định nghĩa
Điều kiện $\omega_2/\omega_1 \notin \mathbb{R}$ đảm bảo rằng hai hướng $\omega_1$ và $\omega_2$ “bao phủ” toàn bộ mặt phẳng $\mathbb{C}$ --- nếu chúng cùng nằm trên một đường thẳng qua gốc, ta chỉ được mạng một chiều (không đủ để tạo torus).
Ví dụ
- Lưới Gauss: $\Lambda = \mathbb{Z} + \mathbb{Z} i = \{m + ni \mid m, n \in \mathbb{Z}\}$. Đây là lưới vuông, cơ sở $\omega_1 = 1$, $\omega_2 = i$. Miền cơ bản là hình vuông đơn vị $[0,1) \times [0,1)$.
- Lưới lục giác: $\Lambda = \mathbb{Z} + \mathbb{Z}\zeta_3$ với $\zeta_3 = e^{2\pi i/3} = \frac{-1 + i\sqrt{3}}{2}$. Miền cơ bản có dạng hình thoi với góc $60°$. Lưới này có đối xứng bậc 6, tương ứng với đường cong $y^2 = x^3 + 1$ (có $j = 0$).
- Lưới tổng quát: $\Lambda = \mathbb{Z} + \mathbb{Z}\tau$ với $\tau = 1 + 2i$. Miền cơ bản là hình bình hành có các đỉnh $0, 1, \tau, 1+\tau$.
Ý nghĩa trực giác
- Các điểm lưới $\omega = m\omega_1 + n\omega_2$ là các “nút giao” của lưới.
- Miền cơ bản (fundamental domain) là một hình bình hành $\{s\omega_1 + t\omega_2 \mid 0 \le s, t < 1\}$ --- mỗi điểm trong $\mathbb{C}$ nằm trong đúng một “ô” (modulo tịnh tiến theo lưới).
- Hình dạng lưới hoàn toàn được xác định bởi tỉ số $\tau = \omega_2/\omega_1$ (ta có thể chuẩn hóa $\omega_1 = 1$, khi đó $\Lambda = \mathbb{Z} + \mathbb{Z}\tau$).
Phép tương tự đời thường: lưới giống như hoa văn lặp trên giấy dán tường. Mỗi ô lặp lại vô hạn lần, phủ kín toàn bộ bức tường.
Liên hệ với giả thuyết Birch--Dyer
- Uniformization: Mỗi đường cong elliptic $E/\mathbb{C}$ đẳng cấu với torus phức $\mathbb{C}/\Lambda$ cho một lưới $\Lambda$ duy nhất (xem khái niệm 50).
- Chu kỳ thực: $\Omega_E = \int_{E(\mathbb{R})} |\omega|$ trong công thức BSD mạnh chính là tích phân trên thành phần thực của $\mathbb{C}/\Lambda$.
- Phân loại: Hai đường cong elliptic $E \cong E'$ trên $\mathbb{C}$ khi và chỉ khi $\Lambda' = c\Lambda$ cho hằng số $c \in \mathbb{C}^*$. Do đó không gian moduli được tham số hóa bởi $\tau \in \mathcal{H}/\mathrm{SL}_2(\mathbb{Z})$.
Định nghĩa
$T$ có cấu trúc:
- Nhóm Abel: phép cộng $(z_1 + \Lambda) + (z_2 + \Lambda) = (z_1 + z_2) + \Lambda$.
- Đa tạp phức compact: $T$ là mặt Riemann compact giống 1 (genus 1).
- Nhóm Lie phức: vừa là nhóm, vừa là đa tạp, các phép toán đều giải tích.
Ví dụ
- Lưới Gauss: $\mathbb{C}/(\mathbb{Z} + \mathbb{Z} i)$ là torus “vuông”. Về mặt tô-pô, ta lấy hình vuông $[0,1] \times [0,1]$, dán cạnh trên với cạnh dưới, dán cạnh trái với cạnh phải $\Rightarrow$ hình xuyến (donut).
- Lưới lục giác: $\mathbb{C}/(\mathbb{Z} + \mathbb{Z} e^{2\pi i/3})$ là torus “tam giác đều”. Torus này tương ứng với đường cong $y^2 = x^3 + 1$ ($j = 0$), có nhóm tự đồng cấu lớn hơn bình thường (CM bởi $\mathbb{Z}[\zeta_3]$).
- Lưới tổng quát: $\mathbb{C}/(\mathbb{Z} + \mathbb{Z}\tau)$ với $\tau = i\sqrt{2}$. Torus này tương ứng với một đường cong elliptic có CM bởi $\mathbb{Z}[\sqrt{-2}]$.
Ý nghĩa trực giác
- Bước 1: Lấy miền cơ bản --- hình bình hành có các cạnh $\omega_1$ và $\omega_2$.
- Bước 2: Dán hai cạnh đối diện theo hướng $\omega_1$ $\Rightarrow$ được ống trụ.
- Bước 3: Dán hai đầu ống trụ lại $\Rightarrow$ được hình xuyến (donut/torus).
Phép tương tự: giống như trò chơi Pac-Man --- khi nhân vật đi ra cạnh phải thì xuất hiện ở cạnh trái, đi ra cạnh trên thì xuất hiện ở cạnh dưới. Mặt phẳng trò chơi chính là torus!
Sự kỳ diệu nằm ở chỗ: phép cộng trên đường cong elliptic (luật cộng phức tạp qua hình học) tương ứng với phép cộng vectơ đơn giản trên $\mathbb{C}/\Lambda$:
Liên hệ với giả thuyết Birch--Dyer
- Định lý uniformization: Mọi đường cong elliptic $E/\mathbb{C}$ đều đẳng cấu (như nhóm Lie phức) với $\mathbb{C}/\Lambda_E$ cho một lưới $\Lambda_E$ duy nhất (đến hằng số tỉ lệ) [silverman2009]. Đây là cầu nối giữa hình học đại số và giải tích phức.
- Hàm L qua lưới: Các hệ số $a_p$ trong hàm $L(E, s)$ xác định lưới $\Lambda_E$. Định lý modularity [wiles1995] nói rằng lưới này cũng đến từ dạng modular $f_E$.
- Chu kỳ: Diện tích miền cơ bản $|\omega_1\bar{\omega}_2 - \omega_2\bar{\omega}_1|$ của $\Lambda_E$ liên quan trực tiếp đến chu kỳ thực $\Omega_E$ trong công thức BSD mạnh.
- Điểm Heegner: Điểm CM $\tau \in \mathcal{H}$ cho ta $\mathbb{C}/(\mathbb{Z} + \mathbb{Z}\tau)$, từ đó xây dựng điểm hữu tỉ trên $E$ qua tham số hóa modular [gross-zagier1986].
Định nghĩa
Một hàm tuần hoàn kép phân hình (tức giải tích trừ tại hữu hạn cực) được gọi là hàm elliptic (elliptic function). Tập tất cả hàm elliptic đối với lưới $\Lambda$ tạo thành một trường, ký hiệu $\mathbb{C}(\Lambda)$.
Ví dụ
- Hàm Weierstrass $\wp$: Đây là hàm elliptic “đơn giản nhất” có cực bậc 2 tại mỗi điểm lưới:
\[ \wp(z; \Lambda) = \frac{1}{z^2} + \sum_{\substack{\omega \in \Lambda \\ \omega \neq 0}} \left( \frac{1}{(z-\omega)^2} - \frac{1}{\omega^2} \right). \]$\wp$ tuần hoàn kép vì mỗi số hạng $\frac{1}{(z-\omega)^2}$ có tính đối xứng với lưới.
- Đạo hàm $\wp'$: $\wp'(z) = -2\sum_{\omega \in \Lambda} \frac{1}{(z-\omega)^3}$ cũng là hàm elliptic, có cực bậc 3 tại mỗi điểm lưới.
- Hằng số: Mọi hàm hằng đều tuần hoàn kép (nhưng tầm thường).
Kết quả quan trọng: Mọi hàm elliptic đối với $\Lambda$ đều là hàm hữu tỉ của $\wp$ và $\wp'$:
Ý nghĩa trực giác
- Tuần hoàn đơn (một hướng): $\sin(z + 2\pi) = \sin(z)$. Hàm $\sin$ lặp lại theo một chu kỳ $2\pi$. Đồ thị “cuộn” quanh đường tròn $\mathbb{R}/(2\pi\mathbb{Z}) \cong S^1$.
- Tuần hoàn kép (hai hướng): $\wp(z + \omega_1) = \wp(z)$ và $\wp(z + \omega_2) = \wp(z)$. Hàm $\wp$ lặp lại theo hai chu kỳ độc lập. Đồ thị “sống” trên torus $\mathbb{C}/\Lambda \cong T^2$.
Phép tương tự: hàm tuần hoàn đơn giống hoa văn sọc (lặp theo một hướng), còn hàm tuần hoàn kép giống hoa văn giấy dán tường (lặp theo hai hướng), tạo ra mẫu phủ kín mặt phẳng.
Tại sao gọi là “hàm elliptic”? Vì các hàm này lần đầu xuất hiện khi nghiên cứu tích phân elliptic (tính chu vi elip). Abel và Jacobi phát hiện rằng nghịch đảo của tích phân elliptic cho hàm tuần hoàn kép --- giống như $\sin$ là nghịch đảo của $\int \frac{dt}{\sqrt{1-t^2}}$ [silverman2009].
Liên hệ với giả thuyết Birch--Dyer
- Cầu nối: Hàm $\wp$ và $\wp'$ cho phép đồng nhất $\mathbb{C}/\Lambda \xrightarrow{\sim} E(\mathbb{C})$ qua $z \mapsto (\wp(z), \wp'(z))$. Nhờ đó, mọi tính toán trên $E(\mathbb{C})$ có thể chuyển về tính toán với hàm tuần hoàn kép.
- Chuỗi L: Hệ số $a_n$ của chuỗi $L(E, s) = \sum a_n n^{-s}$ liên quan đến hệ số Fourier của dạng modular $f_E(\tau)$, mà $f_E$ chính là hàm trên $\mathcal{H}$ thỏa tính chất tuần hoàn (modular).
- Chiều cao: Chiều cao Néron--Tate $\hat{h}(P)$ có thể biểu diễn qua hàm sigma $\sigma(z; \Lambda)$ (liên quan đến $\wp$): $\hat{h}(P) \sim -\log|\sigma(z_P)|$.
Định nghĩa
Biệt thức: $\Delta(\Lambda) = g_2^3 - 27g_3^2 \neq 0$ (đảm bảo đường cong trơn).
$j$-bất biến: $j(\Lambda) = 1728\, \frac{g_2^3}{g_2^3 - 27g_3^2} = 1728\, \frac{g_2^3}{\Delta}$, phân loại đường cong đến đẳng cấu.
Ví dụ
- Lưới Gauss $\Lambda = \mathbb{Z} + \mathbb{Z} i$: Do đối xứng bậc 4 ($i \cdot \Lambda = \Lambda$), ta có $g_3(\Lambda) = 0$ (các số hạng bậc 6 triệt tiêu do đối xứng). Nên phương trình trở thành $y^2 = 4x^3 - g_2 x$, tức dạng $y^2 = x^3 + ax$. Tính số: $g_2 \approx 189.07$, $j = 1728$.
- Lưới lục giác $\Lambda = \mathbb{Z} + \mathbb{Z}\zeta_3$ ($\zeta_3 = e^{2\pi i/3}$): Do đối xứng bậc 6 ($\zeta_3 \cdot \Lambda = \Lambda$), ta có $g_2(\Lambda) = 0$. Phương trình: $y^2 = 4x^3 - g_3$, tức dạng $y^2 = x^3 + b$. Ở đây $j = 0$.
- Lưới tổng quát: Với $\Lambda = \mathbb{Z} + \mathbb{Z}\tau$, cả $g_2$ và $g_3$ đều khác 0. Chúng phụ thuộc giải tích vào $\tau$ và liên hệ với chuỗi Eisenstein modular $E_4(\tau)$, $E_6(\tau)$:
\[ g_2 = \frac{4\pi^4}{3} E_4(\tau), \quad g_3 = \frac{8\pi^6}{27} E_6(\tau). \]
Ý nghĩa trực giác
- $g_2$ bắt thông tin “bậc 4” --- liên quan đến tính đối xứng vuông.
- $g_3$ bắt thông tin “bậc 6” --- liên quan đến tính đối xứng lục giác.
- Cùng nhau, $(g_2, g_3)$ xác định duy nhất lưới $\Lambda$ (đến hằng số tỉ lệ), tức xác định duy nhất đường cong elliptic.
Phép tương tự: giống như chiều dài cạnh $a$ và góc $\theta$ xác định hình bình hành, $g_2$ và $g_3$ xác định “hình bình hành cơ bản” của lưới.
Hệ số 60 và 140: Tại sao không dùng $\sum \omega^{-4}$ trực tiếp? Các hệ số 60 và 140 được chọn để phương trình vi phân $(\wp')^2 = 4\wp^3 - g_2\wp - g_3$ có dạng gọn nhất. Chúng đến từ khai triển Laurent: $\wp(z) = z^{-2} + \frac{g_2}{20}z^2 + \frac{g_3}{28}z^4 + \cdots$
Liên hệ với giả thuyết Birch--Dyer
- Xác định đường cong: Cho đường cong $E/\mathbb{Q}$ với conductor $N$, định lý modularity [wiles1995] cho dạng modular $f_E(\tau) = \sum a_n q^n$. Từ $f_E$ xây dựng lưới $\Lambda_E$, rồi $g_2(\Lambda_E), g_3(\Lambda_E)$ cho phương trình Weierstrass.
- Chuỗi Eisenstein modular: $E_4(\tau)$ và $E_6(\tau)$ là dạng modular “cơ bản”. Mọi dạng modular (kể cả $f_E$ liên kết với đường cong elliptic) nằm trong không gian sinh bởi tích các $E_4, E_6$. Hàm $L(E, s)$ đến từ $f_E$, tức gián tiếp liên quan đến $g_2, g_3$.
- Biệt thức và conductor: $\Delta = g_2^3 - 27g_3^2$ liên hệ (nhưng khác) biệt thức tối thiểu $\Delta_{\min}$. Conductor $N_E$ đo “mức độ xấu” của rút gọn, quyết định level của $f_E$ trong $S_2(\Gamma_0(N))$.
Định nghĩa
Cụ thể hơn:
- Nếu $\Delta_E < 0$: $E(\mathbb{R})$ có một thành phần liên thông, $\Omega_E = \omega_1$ (chu kỳ thực cơ bản).
- Nếu $\Delta_E > 0$: $E(\mathbb{R})$ có hai thành phần liên thông (một nhánh “ngoài” và một “vòng trong”), $\Omega_E = 2\omega_1$.
Ví dụ
- $E: y^2 = x^3 - x$ (conductor $N = 32$): $\Delta = -64 < 0$, một thành phần. $\Omega_E = \int_{1}^{\infty} \frac{dx}{\sqrt{x^3 - x}} \approx 2.6221$.
- $E: y^2 = x^3 - x + 1$ (conductor $N = 37$): $\Delta \approx -1323 < 0$, một thành phần. $\Omega_E \approx 5.9869$.
- $E: y^2 + y = x^3 - x$ (conductor $N = 37$, nhãn 37a1): $\Delta < 0$, một thành phần. $\Omega_E \approx 5.9869$.
- $E: y^2 = x^3 + x^2 - 2x$: $\Delta > 0$, hai thành phần. $\Omega_E = 2\omega_1$ (gấp đôi so với khi chỉ tính một nhánh).
Ý nghĩa trực giác
- Trong mô hình torus $\mathbb{C}/\Lambda$, phần thực $E(\mathbb{R})$ tương ứng với các đường thẳng ngang (hoặc ngang + dọc) trong miền cơ bản. $\Omega_E$ là tổng “chiều dài” của các đường này.
- Phép tương tự: giống như $2\pi r$ là chu vi đường tròn bán kính $r$, $\Omega_E$ là “chu vi” của đường cong elliptic nhìn trên trường số thực.
- Đường cong “to” (tọa độ lớn) có $\Omega_E$ lớn; đường cong “nhỏ” có $\Omega_E$ nhỏ.
$\Omega_E$ phụ thuộc vào lựa chọn phương trình (phương trình tối thiểu $\Leftrightarrow$ vi phân Néron), nên trong BSD ta luôn dùng phương trình tối thiểu toàn cục.
Liên hệ với giả thuyết Birch--Dyer
- BSD mạnh (hạng 0): $L(E, 1) = \dfrac{|\mathrm{Sha}(E/\mathbb{Q})| \cdot \Omega_E \cdot \prod_p c_p}{|E(\mathbb{Q})_{\mathrm{tors}}|^2}$.
- BSD mạnh (hạng 1): $L'(E, 1) = \dfrac{|\mathrm{Sha}(E/\mathbb{Q})| \cdot \hat{h}(P) \cdot \Omega_E \cdot \prod_p c_p}{|E(\mathbb{Q})_{\mathrm{tors}}|^2}$.
- Kiểm nghiệm: Với $E = 37a1$: $L(E,1) = 0$ (hạng 1), $L'(E,1) \approx 0.3059$, $\Omega_E \approx 5.9869$. Thay vào công thức BSD mạnh và kiểm tra: tất cả khớp với $|\mathrm{Sha}| = 1$ [cremona1997].
- Vai trò “chuẩn hóa”: $\Omega_E$ đóng vai trò thừa số chuẩn hóa --- nó chuyển đổi giữa “thể tích giải tích” (từ hàm $L$) và “thể tích số học” (từ các bất biến đại số của $E$).
Định nghĩa
Nếu dùng phương trình Weierstrass rút gọn $y^2 = x^3 + Ax + B$, thì:
Vi phân Néron là duy nhất đến hằng số $\pm 1$ (tương ứng với phép đổi $y \mapsto -y$). Tính duy nhất này rất quan trọng: nó đảm bảo $\Omega_E$ được xác định rõ ràng.
Ví dụ
- $E: y^2 = x^3 - x$: Vi phân Néron $\omega = \frac{dx}{2y}$. Đây là phương trình tối thiểu toàn cục (các $a_i \in \mathbb{Z}$, biệt thức $\Delta = -64$ có $|v_p(\Delta)|$ tối thiểu).
- $E: y^2 + y = x^3 - x$ (37a1): Vi phân Néron $\omega = \frac{dx}{2y + 1}$ (chú ý mẫu số có thêm $a_3 = 1$). Đây là phương trình tối thiểu với $\Delta = -37$ (nguyên tố!).
- Phương trình không tối thiểu: Nếu ta viết $E': Y^2 = X^3 - 16X$ (đổi biến $x = X/4, y = Y/8$ từ $y^2 = x^3 - x$), thì $\frac{dX}{2Y}$ không phải vi phân Néron vì phương trình không tối thiểu. Vi phân Néron thực sự là $\omega = \frac{dx}{2y} = \frac{1}{4}\cdot\frac{dX}{2Y}$ (có thừa số $1/4$).
Ý nghĩa trực giác
- Thước đo trên đường tròn: Trên đường tròn $x^2 + y^2 = 1$, thước đo tự nhiên là $d\theta = \frac{dx}{y} = \frac{dx}{\sqrt{1-x^2}}$. Tích phân $\int_0^{2\pi} d\theta = 2\pi$ cho chu vi.
- Thước đo trên EC: Tương tự, trên $E: y^2 = f(x)$, thước đo tự nhiên là $\frac{dx}{2y} = \frac{dx}{2\sqrt{f(x)}}$. Tích phân $\int_{E(\mathbb{R})} |\omega_E| = \Omega_E$ cho “chu vi” của $E$.
- Tại sao “Néron”? Néron [neron1965] chỉ ra rằng trong tất cả các phép đổi biến có thể, có đúng một vi phân (đến $\pm 1$) mà “mở rộng tốt” đến mô hình trên $\mathbb{Z}$ --- tức “smooth” tại mọi số nguyên tố. Đây là vi phân Néron.
Liên hệ với giả thuyết Birch--Dyer
- Chu kỳ thực: $\Omega_E = \int_{E(\mathbb{R})} |\omega_E|$ --- tích phân vi phân Néron trên phần thực. Thay đổi phương trình (không tối thiểu) sẽ thay đổi $\Omega_E$ bằng lũy thừa, làm sai công thức BSD.
- Hằng số Manin: Tham số hóa modular $\phi\colon X_0(N) \to E$ kéo vi phân Néron về: $\phi^*(\omega_E) = c_\infty \cdot 2\pi i f_E(\tau) d\tau$, trong đó $c_\infty \in \mathbb{Z} \setminus \{0\}$ là hằng số Manin. Phỏng đoán Manin: $c_\infty = \pm 1$ cho phương trình tối thiểu tối ưu [cremona1997].
- Số Tamagawa: Số Tamagawa $c_p = [E(\mathbb{Q}_p) : E^0(\mathbb{Q}_p)]$ cũng liên quan đến vi phân Néron tại $p$: chúng đo “thể tích” của thành phần đơn vị $E^0(\mathbb{Q}_p)$ so với toàn bộ $E(\mathbb{Q}_p)$ dưới vi phân Néron.
- Công thức BSD mạnh đầy đủ: Mỗi thừa số trong
\[ \frac{L^{(r)}(E, 1)}{r!} = \frac{|\mathrm{Sha}| \cdot \mathrm{Reg}_E \cdot \Omega_E \cdot \prod_p c_p}{|E(\mathbb{Q})_{\mathrm{tors}}|^2} \]đều phụ thuộc (trực tiếp hoặc gián tiếp) vào lựa chọn vi phân Néron. Đây là lý do ta bắt buộc dùng phương trình tối thiểu.
Định nghĩa
Cụ thể, chọn hai vòng sinh $\gamma_1, \gamma_2$ trên $E(\mathbb{C}) \cong T^2$:
Ví dụ
- $E: y^2 = x^3 - x$ (conductor 32, CM bởi $\mathbb{Z}[i]$):
\[ \omega_1 = \int_1^{\infty} \frac{dx}{\sqrt{x^3 - x}} \approx 2.6221, \quad \omega_2 = i\omega_1 \approx 2.6221i. \]Lưới $\Lambda_E = \mathbb{Z}\omega_1 + \mathbb{Z}(i\omega_1)$ là lưới vuông --- phản ánh nhân phức $\mathrm{End}(E) \cong \mathbb{Z}[i]$.
- $E: y^2 + y = x^3 - x$ (37a1): $\omega_1 \approx 5.9869$, $\omega_2 \approx 0.9294 + 0.9816i$. Lưới $\Lambda_E$ không có đối xứng đặc biệt ($\mathrm{End}(E) = \mathbb{Z}$, không CM).
- $E: y^2 = x^3 + 1$ (conductor 36, CM bởi $\mathbb{Z}[\zeta_3]$): Lưới $\Lambda_E$ là lưới lục giác --- phản ánh nhân phức $\mathrm{End}(E) \cong \mathbb{Z}[\zeta_3]$.
Ý nghĩa trực giác
- Uniformization: Định lý uniformization khẳng định $E(\mathbb{C}) \cong \mathbb{C}/\Lambda_E$. Lưới chu kỳ chính là “cầu nối” giữa phương trình đại số $y^2 = x^3 + Ax + B$ và hình xuyến $\mathbb{C}/\Lambda_E$.
- Tại sao gọi “chu kỳ”? Giống như $\sin(x)$ có chu kỳ $2\pi = \int_0^{2\pi} d\theta$, hàm $\wp(z; \Lambda_E)$ có hai chu kỳ $\omega_1, \omega_2$, mỗi chu kỳ là tích phân vi phân Néron trên một vòng của torus.
- Hình dạng lưới $\Leftrightarrow$ hình dạng đường cong: Lưới vuông $\Leftrightarrow$ CM bởi $\mathbb{Z}[i]$, lưới lục giác $\Leftrightarrow$ CM bởi $\mathbb{Z}[\zeta_3]$, lưới “lệch” $\Leftrightarrow$ không CM (trường hợp phổ biến).
Liên hệ với giả thuyết Birch--Dyer
- Chu kỳ thực: $\Omega_E$ trong công thức BSD chính là tích phân trên thành phần thực của $\mathbb{C}/\Lambda_E$. Nếu $\Delta < 0$: $\Omega_E = \omega_1$; nếu $\Delta > 0$: $\Omega_E = 2\omega_1$.
- Modularity $\Leftrightarrow$ lưới: Định lý modularity [wiles1995] nói rằng $\Lambda_E$ “đến từ” dạng modular: $\omega_i = c \cdot \int_{\tau_0}^{\tau_i} f_E(\tau) d\tau$ với $f_E \in S_2(\Gamma_0(N))$.
- Regulator: Ma trận chiều cao Néron--Tate $\mathrm{Reg}_E = \det(\langle P_i, P_j \rangle)$ đo “thể tích” lưới Mordell--Weil. Cùng với $\Omega_E$ (đo “thể tích” lưới chu kỳ), chúng tạo thành hai thừa số “thể tích” trong BSD mạnh.
Định nghĩa
$\mathcal{H}$ có nhiều cấu trúc quan trọng:
- Nhóm $\mathrm{SL}_2(\mathbb{Z})$ tác động: Nhóm modular $\mathrm{SL}_2(\mathbb{Z})$ tác động lên $\mathcal{H}$ qua phép biến đổi Möbius:
\[ \begin{pmatrix} a & b \\ c & d \end{pmatrix} \cdot \tau = \frac{a\tau + b}{c\tau + d}, \quad \begin{pmatrix} a & b \\ c & d \end{pmatrix} \in \mathrm{SL}_2(\mathbb{Z}). \]
- Metric Poincaré: $ds^2 = \frac{dx^2 + dy^2}{y^2}$ (với $\tau = x + iy$), biến $\mathcal{H}$ thành mô hình hình học hyperbolic.
- Miền cơ bản: $\mathcal{F} = \{\tau \in \mathcal{H} : |\tau| \geq 1, \, |\Re(\tau)| \leq 1/2\}$ là miền cơ bản cho tác động $\mathrm{SL}_2(\mathbb{Z}) \curvearrowright \mathcal{H}$.
Ví dụ
- $\tau = i$: Lưới $\Lambda = \mathbb{Z} + \mathbb{Z} i$ (vuông). Đường cong $E: y^2 = x^3 - x$ với $j = 1728$. Đây là điểm bất động của $\tau \mapsto -1/\tau$, có stabilizer $\mathbb{Z}/4\mathbb{Z}$.
- $\tau = e^{2\pi i/3} = \frac{-1 + i\sqrt{3}}{2}$: Lưới lục giác. Đường cong $E: y^2 = x^3 + 1$ với $j = 0$. Có stabilizer $\mathbb{Z}/6\mathbb{Z}$ --- đây là điểm có đối xứng cao nhất.
- $\tau = 2i$: Lưới $\mathbb{Z} + 2i\mathbb{Z}$ (hình chữ nhật). Đường cong CM bởi $\mathbb{Z}[\sqrt{-4}] = \mathbb{Z}[2i]$.
- $\tau = \frac{-1 + i\sqrt{163}}{2}$: Liên hệ đến “số gần nguyên” nổi tiếng $e^{\pi\sqrt{163}} \approx 640320^3 + 744$. Đường cong CM bởi $\mathbb{Z}[\frac{-1 + i\sqrt{163}}{2}]$ có vai trò trong lý thuyết trường lớp.
Ý nghĩa trực giác
- Mỗi $\tau \in \mathcal{H}$ cho một lưới $\Lambda_\tau = \mathbb{Z} + \mathbb{Z}\tau$, tức một đường cong elliptic.
- Hai điểm $\tau, \tau'$ cho cùng đường cong $\Leftrightarrow$ $\tau' = \frac{a\tau + b}{c\tau + d}$ cho $\begin{pmatrix} a & b \\ c & d \end{pmatrix} \in \mathrm{SL}_2(\mathbb{Z})$.
- Do đó: không gian moduli $\mathcal{H}/\mathrm{SL}_2(\mathbb{Z})$ phân loại tất cả đường cong elliptic trên $\mathbb{C}$ (đến đẳng cấu), và $j$-bất biến cho đồng cấu $\mathcal{H}/\mathrm{SL}_2(\mathbb{Z}) \xrightarrow{\sim} \mathbb{C}$.
Phép tương tự: giống như mỗi góc $\theta \in (0°, 180°)$ xác định “hình dạng” của một tam giác cân, mỗi $\tau \in \mathcal{H}$ xác định “hình dạng” của một lưới (tức một đường cong elliptic).
Liên hệ với giả thuyết Birch--Dyer
- Dạng modular sống trên $\mathcal{H}$: Dạng modular $f_E(\tau) = \sum a_n q^n$ ($q = e^{2\pi i \tau}$) liên kết với $E$ qua modularity [wiles1995] là hàm trên $\mathcal{H}$. Hàm $L(E, s)$ chính là biến đổi Mellin của $f_E$.
- Đường cong modular: $X_0(N) = \mathcal{H}^*/\Gamma_0(N)$ (với $\Gamma_0(N) \subset \mathrm{SL}_2(\mathbb{Z})$) là đường cong đại số. Tham số hóa modular $\phi: X_0(N) \to E$ kết nối hình học của $\mathcal{H}$ với đường cong elliptic.
- Điểm Heegner: Điểm CM $\tau_K \in \mathcal{H}$ (thỏa $a\tau_K^2 + b\tau_K + c = 0$ với $b^2 - 4ac = D_K < 0$) cho điểm trên $X_0(N)$, từ đó cho điểm hữu tỉ $P_K \in E(K)$ qua $\phi$. Đây là công cụ chính trong chứng minh Gross--Zagier [gross-zagier1986].
- BSD $p$-adic: Dạng modular quá tải $p$-adic (overconvergent $p$-adic modular form) sống trên phiên bản $p$-adic của $\mathcal{H}$, liên quan đến hàm $L$ $p$-adic trong BSD $p$-adic.
Định nghĩa
- $r = \mathrm{rk}(E/\mathbb{Q}) \geq 0$ là hạng (rank) của $E$.
- $E(\mathbb{Q})_{\mathrm{tors}}$ là nhóm con xoắn (torsion subgroup), gồm các điểm $P$ với $nP = \mathcal{O}$ cho $n > 0$ nào đó.
Tổng quát hơn, cho $K$ là trường số và $A/K$ là đa tạp Abel chiều $g$, thì $A(K)$ là nhóm Abel hữu hạn sinh [mordell1922, weil1928].
Lịch sử
1928: André Weil, mới 22 tuổi, trong luận văn tiến sĩ viết dưới sự hướng dẫn của Hadamard, mở rộng cho mọi trường số $K$ và mọi đa tạp Abel [weil1928]. Luận văn này được coi là một trong những luận văn vĩ đại nhất lịch sử toán học.
Phương pháp hiện đại: xem [silverman2009, silverman-tate2015].
Ví dụ
- Hạng 0: $E: y^2 = x^3 + 1$. $E(\mathbb{Q}) \cong \mathbb{Z}/6\mathbb{Z}$ (chỉ có 6 điểm hữu tỉ: $\mathcal{O}$, $(-1, 0)$, $(0, \pm 1)$, $(2, \pm 3)$). $r = 0$, $E(\mathbb{Q})_{\mathrm{tors}} \cong \mathbb{Z}/6\mathbb{Z}$.
- Hạng 1: $E: y^2 + y = x^3 - x$ (37a1). $E(\mathbb{Q}) \cong \mathbb{Z}$ với điểm sinh $P = (0, 0)$. Các bội: $2P = (1, -1)$, $3P = (-1, -1)$, $4P = (2, -3)$, \ldots\ Mọi điểm hữu tỉ trên $E$ đều là bội của $P$.
- Hạng 2: $E: y^2 = x^3 - 4x + 4$. $E(\mathbb{Q}) \cong \mathbb{Z}^2$ với hai điểm sinh độc lập.
- Hạng cao: Đường cong do Elkies tìm (2006) có $r \geq 28$ --- kỷ lục hiện tại [elkies2006].
Ý nghĩa trực giác
- Phép tương tự: giống như mọi số nguyên đều là tổ hợp tuyến tính của $\{1\}$ (nhóm $\mathbb{Z}$ có 1 phần tử sinh), nhóm $E(\mathbb{Q})$ có $r + \text{(vài phần tử xoắn)}$ phần tử sinh.
- Hạng $r$ đo “độ phong phú”: $r = 0$ nghĩa là $E(\mathbb{Q})$ hữu hạn (“nghèo”); $r = 1$ nghĩa là $E(\mathbb{Q})$ có một dãy vô hạn điểm trên một “hướng”; $r = 2$ có hai “hướng” độc lập, v.v.
Cấu trúc chứng minh
Bước 2 --- Descent bằng chiều cao: Cho $P \in E(\mathbb{Q})$, viết $P = mP_1 + Q_i$ ($Q_i$ đại diện lớp). Chiều cao $h(P_1) < h(P)/m^2 + C$, nên lặp lại sẽ giảm chiều cao. Vì chỉ có hữu hạn điểm dưới mỗi mức chiều cao, quá trình dừng.
Kết luận: Tập sinh = các đại diện $\{Q_i\}$ $\cup$ điểm có chiều cao nhỏ.
Liên hệ với giả thuyết Birch--Dyer
- BSD yếu: $\mathrm{ord}_{s=1} L(E, s) = \mathrm{rk}(E/\mathbb{Q}) = r$. Hạng $r$ trong Mordell--Weil chính là đại lượng mà BSD dự đoán bằng bậc triệt tiêu hàm $L$.
- BSD mạnh: Regulator $\mathrm{Reg}_E = \det(\langle P_i, P_j \rangle)$ tính từ $r$ điểm sinh $P_1, \ldots, P_r$ của phần tự do $\mathbb{Z}^r$.
- Hạn chế: Chứng minh Mordell--Weil không cho biết $r$ là bao nhiêu! Nó chỉ nói $r$ hữu hạn. BSD là “câu trả lời” cho câu hỏi “$r$ bằng bao nhiêu?” --- thông qua hàm $L$.
- Kết quả đã biết: Nếu $\mathrm{ord}_{s=1} L(E, s) \leq 1$, thì $r = \mathrm{ord}_{s=1} L(E, s)$ (Gross--Zagier, Kolyvagin [gross-zagier1986, kolyvagin1990]).
Định nghĩa
- Cyclic: $\mathbb{Z}/n\mathbb{Z}$ với $n \in \{1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 12\}$ (11 nhóm);
- Không cyclic: $\mathbb{Z}/2\mathbb{Z} \oplus \mathbb{Z}/2m\mathbb{Z}$ với $m \in \{1, 2, 3, 4\}$ (4 nhóm).
Đặc biệt: $n = 11$ không xuất hiện! Không tồn tại đường cong $E/\mathbb{Q}$ nào có điểm xoắn bậc 11.
Ví dụ
- Tầm thường ($E(\mathbb{Q})_{\mathrm{tors}} = \{0\}$): $y^2 = x^3 - 2$. Không có điểm hữu tỉ nào ngoài $\mathcal{O}$.
- $\mathbb{Z}/2\mathbb{Z}$: $y^2 = x^3 + 8$. Điểm xoắn bậc 2: $(-2, 0)$ (vì $y = 0$).
- $\mathbb{Z}/5\mathbb{Z}$: $y^2 + y = x^3 - x$ (37a1). Điểm xoắn bậc 5: $(0, 0)$ với $5 \cdot (0,0) = \mathcal{O}$. (Thực ra đường cong này có $E(\mathbb{Q})_{\mathrm{tors}} = \{0\}$, nhưng trên $\mathbb{Q}(\sqrt{5})$ có điểm xoắn bậc 5.)
- $\mathbb{Z}/6\mathbb{Z}$: $y^2 = x^3 + 1$. Có 6 điểm hữu tỉ, tất cả đều xoắn.
- $\mathbb{Z}/2\mathbb{Z} \oplus \mathbb{Z}/2\mathbb{Z}$: $y^2 = x^3 - x = x(x-1)(x+1)$. Ba điểm bậc 2: $(0,0)$, $(1,0)$, $(-1,0)$.
Ý nghĩa trực giác
- Điểm xoắn bậc $n$ trên $E$ tương ứng với điểm hữu tỉ trên đường cong modular $X_1(n)$.
- Đường cong $X_1(n)$ có genus tăng theo $n$. Khi genus $g \geq 2$, định lý Faltings nói rằng $X_1(n)(\mathbb{Q})$ hữu hạn.
- Cụ thể: $X_1(n)$ có genus $\geq 2$ khi $n \geq 13$ ($n$ nguyên tố) hoặc $n$ đủ lớn nói chung. Với $n = 11$, $X_1(11)$ có genus 1 nhưng $X_1(11)(\mathbb{Q})$ chỉ có các điểm cusp --- không cho đường cong elliptic thực sự.
Nói đơn giản: “tìm điểm xoắn bậc $n$ lớn” trở nên “khó” theo nghĩa hình học đại số --- không gian tham số quá “phức tạp” để chứa điểm hữu tỉ.
Liên hệ với giả thuyết Birch--Dyer
- Mẫu số BSD: Trong công thức BSD mạnh, $|E(\mathbb{Q})_{\mathrm{tors}}|^2$ xuất hiện ở mẫu số:
\[ \frac{L^{(r)}(E, 1)}{r!} = \frac{|\mathrm{Sha}| \cdot \mathrm{Reg}_E \cdot \Omega_E \cdot \prod_p c_p}{|E(\mathbb{Q})_{\mathrm{tors}}|^2}. \]Nhờ Mazur, ta biết chính xác $|E(\mathbb{Q})_{\mathrm{tors}}|$ là bao nhiêu (có thể tính bằng thuật toán).
- Tính toán được: Không giống hạng $r$ (rất khó tính), phần xoắn có thể tính chính xác bằng thuật toán Lutz--Nagell hoặc modular symbols. Đây là thành phần “dễ” nhất trong BSD mạnh.
- Liên hệ Mazur--modularity: Chứng minh của Mazur sử dụng mô hình Néron trên $X_0(N)$ --- cùng đối tượng mà Wiles sau này dùng để chứng minh modularity. Mazur (1977) mở đường cho Ribet (1990) và Wiles (1995).
Định nghĩa
Tổng quát hơn, danh sách đầy đủ 15 nhóm xoắn khả thi là danh sách trong Định lý Mazur. Phỏng đoán đã được chứng minh bởi Mazur (1977) [mazur1977].
Lịch sử
Năm 1971, Andrew Ogg nhận thấy sự trùng hợp bí ẩn: các số nguyên tố $p$ sao cho $X_0(p)$ có genus 0 là $\{2, 3, 5, 7, 13\}$. Trong đó, các $p \leq 7$ chính xác là các số nguyên tố có điểm xoắn bậc $p$ trên đường cong elliptic trên $\mathbb{Q}$. Ogg phỏng đoán rằng “không còn gì nữa” --- tức 15 nhóm trong danh sách là tất cả.
Vào thập niên 1960--70, nhiều trường hợp được xử lý lẻ tẻ: Billing, Mahler, Cassels, và đặc biệt Kubert loại trừ được một số nhóm. Nhưng chứng minh đầy đủ phải đợi đến công trình 153 trang của Mazur (1977), sử dụng hình học đại số tinh vi trên đường cong modular $X_0(N)$ [mazur1977].
Ý nghĩa trực giác
- Hình ảnh hoàn chỉnh: Phỏng đoán Ogg (nay là Định lý Mazur) cho ta bức tranh hoàn toàn về phần xoắn --- không còn bất kỳ sự bất định nào. Đây là điều hiếm có trong lý thuyết số.
- Kết nối hai thế giới: Ogg nhận ra mối liên hệ giữa điểm xoắn trên $E$ (đại số) và genus của $X_0(p)$ (hình học). Đây là một trong những manh mối sớm nhất cho chương trình Langlands --- rằng các đối tượng số học và đối tượng automorphic liên hệ chặt chẽ.
- Mồi cho modularity: Chứng minh Mazur sử dụng lược đồ Néron và đường cong modular --- đây chính là “hộp công cụ” mà Ribet (1990) dùng để chứng minh “Shimura--Taniyama $\Rightarrow$ Fermat cuối”, và Wiles (1995) dùng để chứng minh modularity.
Liên hệ với giả thuyết Birch--Dyer
- Thành phần tính được: Nhờ Mazur giải quyết phỏng đoán Ogg, ta biết $|E(\mathbb{Q})_{\mathrm{tors}}|$ luôn nằm trong tập $\{1, 2, \ldots, 10, 12, 16\}$. Điều này giúp kiểm nghiệm số học BSD mạnh: thay vì đối mặt với $|E(\mathbb{Q})_{\mathrm{tors}}|$ bất kỳ, ta chỉ cần xử lý 15 trường hợp.
- Phương pháp Mazur $\to$ phương pháp BSD: Kỹ thuật Mazur (phân tích đường cong modular, mô hình Néron, Eisenstein ideal) được phát triển thêm bởi Skinner--Urban để chứng minh các trường hợp đặc biệt của BSD mạnh.
- Analog BSD cho đa tạp Abel: Phiên bản tổng quát hóa phỏng đoán Ogg cho trường số (uniform boundedness, Merel 1996) liên quan đến BSD cho đa tạp Abel chiều cao.
Định nghĩa
Nói cách khác:
Trường hợp đặc biệt:
- $d = 1$ ($K = \mathbb{Q}$): Đây chính là Định lý Mazur với $B(1) = 16$ (nhóm $\mathbb{Z}/2\mathbb{Z} \oplus \mathbb{Z}/8\mathbb{Z}$ có 16 phần tử).
- $d = 2$: Kamienny (1992) và Kenku--Momose (1988) phân loại đầy đủ --- có 26 nhóm xoắn khả thi.
- $d$ lớn: Cận $B(d)$ tốt nhất hiện biết rất lớn so với thực tế.
Lịch sử
1992: Sheldon Kamienny mở rộng phương pháp Mazur cho trường bậc 2.
1988--1992: Kenku--Momose hoàn thành phân loại cho bậc 2.
1996: Loïc Merel (Université Paris 7), khi mới 31 tuổi, chứng minh kết quả cho mọi bậc $d$ [merel1996]. Đây là đột phá lớn vì phương pháp Mazur dựa trên tính chất cụ thể của $X_0(N)/\mathbb{Q}$, trong khi Merel cần kỹ thuật hoàn toàn mới cho trường tổng quát.
Ý tưởng chính: Merel sử dụng “winding quotient” và phương pháp đại số giao hoán trên Jacobian của đường cong modular, kết hợp kết quả của Kolyvagin--Logachev.
Ví dụ
- Bậc 2: Trên $\mathbb{Q}(\sqrt{-1})$, đường cong $y^2 = x^3 + 1$ có điểm xoắn bậc 6 (như trên $\mathbb{Q}$). Nhưng trên $\mathbb{Q}(\sqrt{-3})$, cùng đường cong có $E(\mathbb{Q}(\sqrt{-3}))_{\mathrm{tors}} \cong \mathbb{Z}/6\mathbb{Z} \oplus \mathbb{Z}/2\mathbb{Z}$ (12 điểm!).
- Bậc 3: Tồn tại đường cong trên trường bậc 3 với xoắn bậc 13 hoặc 18 --- vượt xa giới hạn Mazur cho $\mathbb{Q}$.
- Tổng quát: Khi bậc $d$ tăng, nhóm xoắn có thể lớn hơn, nhưng luôn bị chặn. Phỏng đoán (chưa chứng minh): $B(d)$ tăng theo lũy thừa bậc nhỏ của $d$.
Ý nghĩa trực giác
- Mazur: Cố định $K = \mathbb{Q}$. Chỉ cần phân tích một $X_0(N)/\mathbb{Q}$. Hữu hạn trường hợp cần kiểm tra.
- Merel: Cho mọi $K$ bậc $d$. Có vô hạn trường số bậc $d$ khác nhau, mỗi trường cho phép nhóm xoắn khác. Cần đối số “đồng nhất” không phụ thuộc vào trường cụ thể.
- Phép tương tự: Mazur chứng minh “không tồn tại tòa nhà cao hơn 100 tầng ở Hà Nội”. Merel chứng minh “ở mọi thành phố trên thế giới, tòa nhà luôn có giới hạn tầng --- dù giới hạn phụ thuộc vào thành phố”.
Liên hệ với giả thuyết Birch--Dyer
- BSD trên trường số: BSD tổng quát cho $E/K$ (trường số bất kỳ) có cùng dạng công thức, trong đó $|E(K)_{\mathrm{tors}}|$ ở mẫu số. Merel đảm bảo mẫu số luôn bị chặn --- nên nếu tử số tăng, $L^{(r)}(E, 1)/r!$ cũng phải tăng.
- Bhargava--Shankar: Kết quả thống kê “trung bình hạng bị chặn” [bhargava-shankar2015a] kết hợp với Merel (xoắn bị chặn) cho thông tin chính xác hơn về phân bố Mordell--Weil: phần lớn đường cong có nhóm Mordell--Weil “nhỏ” (hạng $\leq 1$, xoắn nhỏ).
- Bài toán mở: Tìm cận tối ưu $B(d)$ --- đặc biệt, liệu $B(d)$ có tăng theo $d$ không? Phỏng đoán: bậc nguyên tố $p$ lớn nhất của điểm xoắn bị chặn bởi $Cd^{\log\log d}$ (cận Merel gốc: $(1 + 3^{d/2})^2$, rất lớn).
Định nghĩa
- 50% đường cong có hạng $r = 0$ (hữu hạn điểm hữu tỉ),
- 50% đường cong có hạng $r = 1$ (vô hạn điểm, nhưng chỉ 1 “hướng”),
- 0% đường cong có hạng $r \geq 2$ (mật độ bằng 0, dù có vô hạn đường cong như vậy).
Chính xác hơn, gọi $N(H)$ là số đường cong $E_{A,B}: y^2 = x^3 + Ax + B$ với $|A| \leq H^2$, $|B| \leq H^3$ (và $4A^3 + 27B^2 \neq 0$). Phỏng đoán nói:
Bằng chứng hỗ trợ
- Bhargava--Shankar (2015): Hạng trung bình $\leq 0.885$ [bhargava-shankar2015a]. Đây là bằng chứng mạnh rằng “hầu hết” đường cong có hạng nhỏ. Nếu Goldfeld đúng, hạng trung bình = $0 \cdot 1/2 + 1 \cdot 1/2 = 0.5$.
- Bhargava--Skinner--Zhang (2014): Ít nhất 66.48% đường cong elliptic thỏa BSD yếu (hạng đại số = hạng giải tích) [bhargava-skinner-zhang2014].
- Smith (2022): Chứng minh phỏng đoán Goldfeld cho họ đường cong bậc hai $y^2 = x^3 - dx$ (twist bậc hai), sử dụng kỹ thuật 2-Selmer tinh vi.
Ý nghĩa trực giác
- Nửa chỉ có hữu hạn điểm (hạng 0).
- Nửa còn lại có vô hạn điểm, nhưng tất cả nằm trên một “đường” (hạng 1).
- Đường cong có $\geq 2$ “hướng” độc lập (hạng $\geq 2$) là cực kỳ hiếm --- mật độ $0\%$.
Phép tương tự: giống như trong một rừng cây, “hầu hết” cây thấp dưới 5m, một số cây cao 5--10m, và cây khổng lồ $> 30$m cực kỳ hiếm. Tương tự, “hầu hết” đường cong có hạng $\leq 1$, hạng lớn cực kỳ hiếm.
Sự phân chia 50/50: Dấu gốc $w(E) = \pm 1$ trong phương trình hàm $L(E, s)$ xác định tính chẵn/lẻ của $\mathrm{ord}_{s=1} L(E, s)$. Khoảng 50% đường cong có $w = +1$ (nên $r$ chẵn, dự đoán $r = 0$) và 50% có $w = -1$ (nên $r$ lẻ, dự đoán $r = 1$).
Liên hệ với giả thuyết Birch--Dyer
- Hệ quả của BSD: Nếu BSD yếu đúng (hạng đại số = hạng giải tích), Goldfeld tương đương với dự đoán phân bố bậc triệt tiêu hàm $L(E, s)$ tại $s = 1$.
- Kết hợp Bhargava--Shankar + BSD: Bhargava--Skinner--Zhang chứng minh 66.48% đường cong thỏa BSD bằng cách kết hợp: (a) cận Selmer (Bhargava--Shankar), (b) chứng minh BSD cho hạng 0 (Skinner), (c) chứng minh BSD cho hạng 1 (Gross--Zagier--Kolyvagin + Zhang).
- Smith và Goldfeld cho twists: Kết quả Smith (2022) cho twist bậc hai sử dụng phân bố Selmer $\mathrm{Sha}[2]$ --- trực tiếp liên quan đến BSD vì $|\mathrm{Sha}|$ xuất hiện trong công thức BSD mạnh.
Định nghĩa
Đây là một trong những bài toán mở quan trọng nhất trong lý thuyết đường cong elliptic [silverman2009].
Ví dụ
| Năm | Hạng $\geq$ | Tác giả |
|---|---|---|
| 1938 | 4 | Billing |
| 1945 | 6 | Wiman |
| 1974 | 7 | Penney--Pomerance |
| 1977 | 9 | Brumer--Kramer |
| 1982 | 12 | Mestre |
| 1986 | 14 | Mestre |
| 1992 | 21 | Nagao |
| 1993 | 22 | Fermigier |
| 1997 | 24 | Martin--McMillen |
| 2006 | 28 | Elkies |
Kỷ lục hiện tại (đến 2025): Noam Elkies (2006) tìm được đường cong $E/\mathbb{Q}$ có $r \geq 28$ [elkies2006]. Phương trình Weierstrass có hệ số rất lớn (hàng chục chữ số). Kỷ lục này đã đứng vững gần 20 năm!
Ý nghĩa trực giác
- Phương pháp tìm kiếm: Elkies sử dụng mặt phẳng hữu tỉ (rational surface) trên không gian tham số đường cong, kết hợp sàng đại số. Ý tưởng: xây dựng họ đường cong mà “tự nhiên” có nhiều điểm hữu tỉ, rồi sàng lọc trong họ đó.
- Tại sao khó tìm hạng lớn hơn? Phỏng đoán Goldfeld nói $0\%$ đường cong có hạng $\geq 2$. Hạng $\geq 28$ cực kỳ hiếm --- giống tìm viên kim cương trong sa mạc. Càng lên cao, mỗi bước tiến đều tốn hàng năm tính toán.
- Câu hỏi triệu đô: Hạng có bị chặn (ví dụ $r \leq 28$?) hay tùy ý lớn? Không ai biết chắc!
Liên hệ với giả thuyết Birch--Dyer
- Kiểm nghiệm BSD: Mỗi kỷ lục hạng mới là cơ hội kiểm nghiệm BSD. Với đường cong hạng $r$ của Elkies, ta kiểm tra: $L(E, s)$ có triệt tiêu đến bậc $\geq 28$ tại $s = 1$ không? Câu trả lời: có, phù hợp với BSD yếu.
- BSD mạnh cho hạng cao: Kiểm nghiệm BSD mạnh (tính $|\mathrm{Sha}|$, Reg, $\Omega_E$, \ldots) cho đường cong hạng $\geq 4$ rất khó vì regulator $\mathrm{Reg}_E$ là định thức ma trận $r \times r$, và tìm đủ $r$ điểm sinh độc lập tốn rất nhiều công sức.
- Nếu hạng không bị chặn: Đường cong hạng tùy ý lớn sẽ cho $L(E, s)$ triệt tiêu bậc tùy ý cao --- một hiện tượng rất bất thường cho hàm $L$.
Định nghĩa
- Chỉ có hữu hạn đường cong elliptic trên $\mathbb{Q}$ có hạng $> 21$.
- Nói cách khác, hạng “thực tế” bị chặn bởi $21$ (ngoại trừ hữu hạn ngoại lệ).
Lưu ý quan trọng: Đây là heuristic (dự đoán dựa trên mô hình xác suất), không phải định lý hay phỏng đoán chính thức. Tuy nhiên, nó được cộng đồng coi trọng vì dựa trên nền tảng toán học chặt chẽ.
Ý tưởng chính
- Mô hình cho $\mathrm{Sha}$: Giả sử $\mathrm{Sha}(E/\mathbb{Q})$ “hành xử” như nhóm hữu hạn ngẫu nhiên (kiểu Cohen--Lenstra). Cụ thể: xác suất $|\mathrm{Sha}| = k^2$ giảm theo $k$, nhưng có thể tùy ý lớn.
- Ràng buộc BSD mạnh: Công thức BSD mạnh liên hệ $L^{(r)}(E,1)/r!$ với $|\mathrm{Sha}| \cdot \mathrm{Reg}_E \cdot \Omega_E \cdot \prod c_p / |E_{\mathrm{tors}}|^2$. Khi hạng $r$ tăng, $\mathrm{Reg}_E$ tăng “chậm” (bậc $r^r$), nhưng $L^{(r)}(E,1)/r!$ giảm “nhanh” --- buộc $|\mathrm{Sha}|$ phải bù đắp.
- Mâu thuẫn xác suất: Khi $r > 21$, xác suất để $|\mathrm{Sha}|$ đủ lớn bù đắp trở nên cực nhỏ --- tổng xác suất hội tụ, nên chỉ có hữu hạn đường cong thỏa mãn.
Ý nghĩa trực giác
- Phép tương tự: Hãy nghĩ về hạng như “số phòng” trong khách sạn, còn $|\mathrm{Sha}|$ như “khoản phí bảo hiểm”. BSD mạnh nói: “doanh thu (hàm $L$) = phí bảo hiểm $\times$ số phòng $\times$ tiện ích”. Khi muốn quá nhiều phòng ($r$ lớn), phí bảo hiểm ($|\mathrm{Sha}|$) phải tăng bất hợp lý --- và PPVW nói rằng điều đó “hầu như không bao giờ xảy ra” khi $r > 21$.
- Con số 21: Tại sao là 21? Đây đến từ cân bằng giữa tốc độ tăng của $\mathrm{Reg}_E$ (bậc $r \log r$) và tốc độ giảm của mật độ đường cong. $21$ không “đặc biệt” theo nghĩa toán học sâu --- nó là điểm cân bằng trong mô hình xác suất.
- Kỷ lục Elkies $r \geq 28$: Mâu thuẫn? Không hẳn --- PPVW nói “hữu hạn ngoại lệ”, và 28 có thể là một trong số đó. Tuy nhiên, nếu ai tìm được họ vô hạn đường cong hạng $> 21$, PPVW sẽ bị bác bỏ.
Liên hệ với giả thuyết Birch--Dyer
- Dựa trên BSD: PPVW giả sử BSD mạnh đúng, rồi dùng nó để ước lượng xác suất. Nếu BSD sai, mô hình PPVW mất cơ sở.
- Phân bố $\mathrm{Sha}$: Mô hình PPVW dự đoán phân bố chi tiết của $|\mathrm{Sha}|$ --- quan trọng cho BSD vì $|\mathrm{Sha}|$ là thành phần “bí ẩn nhất” trong công thức BSD mạnh.
- Hạng và hàm $L$: Nếu hạng bị chặn bởi 21, thì $L(E, s)$ triệt tiêu tối đa bậc 21 tại $s = 1$ cho “hầu hết” đường cong --- một ràng buộc rất mạnh về hàm $L$.
- Bài toán mở: Chứng minh (hoặc bác bỏ) rằng hạng bị chặn vẫn là một trong những thách thức lớn nhất. Ngay cả chứng minh rằng có vô hạn đường cong hạng $\geq 2$ cũng chưa có (dù ai cũng tin là đúng).
Định nghĩa
$m$-descent cho đường cong elliptic $E/\mathbb{Q}$ (với $m \geq 2$) gồm hai bước:
- Bước hữu hạn: Chứng minh $E(\mathbb{Q})/mE(\mathbb{Q})$ hữu hạn (Mordell--Weil yếu).
- Bước chiều cao: Sử dụng hàm chiều cao $h: E(\mathbb{Q}) \to \mathbb{R}_{\geq 0}$ với tính chất $h(mP) \geq m^2 h(P) - C$ để “hạ xuống”: mỗi $P$ viết được thành $P = mP_1 + Q_i$ ($Q_i$ là đại diện), và $h(P_1) < h(P)$. Lặp lại cho đến khi chiều cao đủ nhỏ.
Lịch sử
1922: Mordell áp dụng ý tưởng tương tự cho $E(\mathbb{Q})$: thay vì “tìm mâu thuẫn”, ông dùng descent để tìm tập sinh. Sự khác biệt: $E(\mathbb{Q})$ có thể vô hạn, nên ta không tìm mâu thuẫn, mà tìm tập sinh hữu hạn.
Hiện đại: Descent trở thành phương pháp chính để tính toán hạng (không chỉ chứng minh hữu hạn) [silverman2009, cassels1962].
Ví dụ
Descent: Giả sử $(x, y, z)$ là nghiệm dương tối tiểu ($z$ nhỏ nhất). Viết $x^4 + y^4 = z^2$ thành $(x^2)^2 + (y^2)^2 = z^2$ (bộ ba Pythagoras). Suy ra $x^2 = m^2 - n^2$, $y^2 = 2mn$, $z = m^2 + n^2$ (hoặc hoán vị). Phân tích tiếp cho thấy tồn tại nghiệm $(x', y', z')$ với $z' < z$ --- mâu thuẫn tính tối tiểu.
Đây chính là tinh thần “hạ xuống”: mỗi bước giảm “độ lớn”, vô hạn bước $\Rightarrow$ mâu thuẫn.
Ý nghĩa trực giác
- Hãy tưởng tượng các điểm hữu tỉ trên $E$ như các tầng của tòa nhà, “chiều cao” $h(P)$ cho biết tầng.
- Bước 1 nói: mỗi tầng chỉ có hữu hạn “kiểu phòng” (lớp modulo $mE(\mathbb{Q})$).
- Bước 2 nói: biết kiểu phòng, ta “leo xuống” (chia $m$) để đến tầng thấp hơn.
- Lặp lại: cuối cùng đến tầng trệt --- chỉ có hữu hạn điểm ở đó.
- Kết luận: mọi điểm đều “đến được” từ hữu hạn điểm gốc qua phép nhân $m$ và cộng đại diện.
Phép tương tự: giống như mọi số nguyên dương $n$ đều đến được từ 1 bằng cách nhân/cộng, mọi điểm $P \in E(\mathbb{Q})$ đến được từ tập sinh hữu hạn.
Liên hệ với giả thuyết Birch--Dyer
- Tính hạng: Descent (cụ thể: 2-descent) là phương pháp chính hiện nay để tính hạng đường cong elliptic. Nó cho cận trên cho hạng thông qua nhóm Selmer.
- Rào cản $\mathrm{Sha}$: Cận trên từ descent có thể lớn hơn hạng thực sự --- sai lệch chính xác là $\dim \mathrm{Sha}[m]$. Đây là lý do $\mathrm{Sha}$ “cản trở” việc tính hạng chính xác.
- BSD giải quyết rào cản: Nếu BSD yếu đúng, ta tính hạng qua $\mathrm{ord}_{s=1} L(E, s)$ --- không cần descent. Nếu BSD mạnh đúng, ta biết chính xác $|\mathrm{Sha}|$, tức biết sai lệch descent.
- Descent là công cụ chứng minh BSD: Kết quả Kolyvagin (hệ thống Euler) bản chất là “descent mở rộng” --- chặn Selmer từ phía trên, suy ra $\mathrm{Sha}$ hữu hạn và BSD cho hạng $\leq 1$.
Định nghĩa
Nếu $|E(\mathbb{Q})/2E(\mathbb{Q})| = 2^s$, thì:
Thực tế, $2$-descent tính $|\mathrm{Sel}_2(E/\mathbb{Q})|$ (nhóm Selmer bậc 2), cho cận trên $s \leq \dim_{\mathbb{F}_2} \mathrm{Sel}_2(E/\mathbb{Q})$.
Ví dụ
- $E: y^2 = x^3 - x = x(x-1)(x+1)$:
Ba điểm bậc 2: $(0,0)$, $(1,0)$, $(-1,0)$, nên $E(\mathbb{Q})[2] \cong (\mathbb{Z}/2\mathbb{Z})^2$.
2-descent phân tích: viết $y^2 = x(x-1)(x+1)$. Ba thừa số đôi một nguyên tố cùng nhau (mod 2). Phân tích tại các số nguyên tố cho thấy $E(\mathbb{Q})/2E(\mathbb{Q}) \cong (\mathbb{Z}/2\mathbb{Z})^2$, tức $s = 2$.
Suy ra: $r = s - 2 = 0$. Vậy $E(\mathbb{Q}) = E(\mathbb{Q})_{\mathrm{tors}} \cong \mathbb{Z}/2\mathbb{Z} \oplus \mathbb{Z}/2\mathbb{Z}$.
- $E_5: y^2 = x^3 - 25x$ (số đồng dư $n = 5$):
$E_5(\mathbb{Q})[2] \cong (\mathbb{Z}/2\mathbb{Z})^2$ (điểm $(0,0)$, $(5,0)$, $(-5,0)$).
2-descent cho $E_5(\mathbb{Q})/2E_5(\mathbb{Q}) \cong (\mathbb{Z}/2\mathbb{Z})^3$, tức $s = 3$, nên $r = 3 - 2 = 1$.
Điểm sinh: $P = (-4, 6)$ có bậc vô hạn. Kiểm tra: $2P = (1681/144, -62279/1728)$.
- $E: y^2 + y = x^3 - x$ (37a1):
$E(\mathbb{Q})[2] = \{0\}$ (không có điểm bậc 2 hữu tỉ vì $x^3 - x + 1/4$ không có nghiệm hữu tỉ).
2-descent (phức tạp hơn, dùng trường số $\mathbb{Q}(\sqrt{-3})$) cho $\mathrm{Sel}_2 \cong \mathbb{Z}/2\mathbb{Z}$, nên $s = 1$, $r = 1 - 0 = 1$.
Ý nghĩa trực giác
- Câu hỏi cốt lõi: Cho $P \in E(\mathbb{Q})$, có điểm $Q \in E(\mathbb{Q})$ nào mà $2Q = P$ không? Nói cách khác: $P$ có phải “bội đôi” của điểm hữu tỉ nào không?
- Ý tưởng: Viết phương trình $2Q = P$ ra tọa độ, phân tích ước nguyên tố, kiểm tra “solvability cục bộ” (tại mỗi $p$ và tại $\mathbb{R}$). Nếu cục bộ giải được ở mọi nơi nhưng toàn cục không $\Rightarrow$ đó là phần tử $\mathrm{Sha}[2]$.
- Thuật toán: Trong thực hành, 2-descent cho đường cong $y^2 = x(x-e_1)(x-e_2)$ quy về tìm các bộ $(d_1, d_2, d_3)$ với $d_1 d_2 d_3 = 1$ sao cho hệ phương trình bậc 2 có nghiệm cục bộ. Đếm số bộ $\Rightarrow$ cỡ Selmer.
Liên hệ với giả thuyết Birch--Dyer
- Bhargava--Shankar dùng $2$-descent: Kết quả “hạng trung bình $\leq 0.885$” đến từ việc chứng minh $|\mathrm{Sel}_2(E/\mathbb{Q})|$ trung bình $= 3$ [bhargava-shankar2015a]. Vì $|E(\mathbb{Q})/2E(\mathbb{Q})| \leq |\mathrm{Sel}_2|$, suy ra cận trên cho hạng trung bình.
- Sai lệch = $\mathrm{Sha}[2]$: $|\mathrm{Sel}_2| = |E(\mathbb{Q})/2E(\mathbb{Q})| \cdot |\mathrm{Sha}[2]|$. Cận trên từ $2$-descent lớn hơn hạng thực sự đúng bằng $\dim \mathrm{Sha}[2]$ --- liên quan trực tiếp đến BSD mạnh (vì $|\mathrm{Sha}|$ xuất hiện).
- Phần mềm: Cremona's
mwrank, Sage, Magma đều implement $2$-descent. Đây là bước đầu tiên để tính hạng trên máy tính --- và kết quả được dùng để kiểm nghiệm BSD cho hàng triệu đường cong trong LMFDB [cremona1997].
Định nghĩa
- $n$-Selmer group: $\mathrm{Sel}_n(E/\mathbb{Q}) \subset H^1(\mathrm{Gal}(\overline{\mathbb{Q}}/\mathbb{Q}), E[n])$, gồm các lớp cohomology “giải được cục bộ”.
- Dãy chính xác: $0 \to E(\mathbb{Q})/nE(\mathbb{Q}) \to \mathrm{Sel}_n(E/\mathbb{Q}) \to \mathrm{Sha}(E/\mathbb{Q})[n] \to 0$.
- Cận trên: $\mathrm{rk}(E/\mathbb{Q}) \leq \frac{\log_n |\mathrm{Sel}_n(E/\mathbb{Q})|}{1} - \dim_{\mathbb{F}_n} E(\mathbb{Q})[n]$.
Các trường hợp quan trọng:
- $4$-descent: Phân tích $\mathrm{Sel}_4$, cho cận trên tốt hơn $2$-descent.
- $3$-descent: Dùng cho đường cong không có điểm bậc 2 hữu tỉ (khi $2$-descent khó thực hiện trực tiếp).
- $8$-descent, $12$-descent: Tinh chỉnh thêm, phát hiện $\mathrm{Sha}$ ẩn.
Ví dụ
- Đường cong 571a1: $E: y^2 + y = x^3 - x^2 - 929x - 10595$.
$2$-descent: $|\mathrm{Sel}_2| = 4$, $|E(\mathbb{Q})[2]| = 1$, nên cận trên $r \leq 2$.
$4$-descent: $|\mathrm{Sel}_4| = 4$, nên cận trên $r \leq 1$. Thực tế $r = 0$ và $|\mathrm{Sha}[2]| = 4$ (có phần tử $\mathrm{Sha}$ bậc 2!) [fisher2008].
- Ý nghĩa: $2$-descent cho “$r \leq 2$” nhưng thực tế $r = 0$ --- sai lệch do $\mathrm{Sha}$. $4$-descent “phát hiện” phần tử $\mathrm{Sha}$ này và thu hẹp cận trên.
Ý nghĩa trực giác
- $2$-descent giống “nhìn bằng mắt thường”: thấy được “hình dạng lớn” nhưng nhầm $\mathrm{Sha}$ với điểm thực.
- $4$-descent giống “kính lúp”: phân biệt được $\mathrm{Sha}[2]$ với điểm thực.
- $8$-descent, $12$-descent giống “kính hiển vi”: phát hiện $\mathrm{Sha}[4]$, $\mathrm{Sha}[8]$, \ldots
Mỗi bậc descent cao hơn “zoom in” thêm, loại bỏ thêm “nhiễu” từ $\mathrm{Sha}$ để tiến gần hơn đến hạng thực sự.
- Giới hạn: Không có $n$ cố định nào đảm bảo tính chính xác hạng cho mọi đường cong --- vì $\mathrm{Sha}$ có thể có phần tử bậc tùy ý lớn (nếu $\mathrm{Sha}$ vô hạn --- mâu thuẫn với phỏng đoán hữu hạn).
Liên hệ với giả thuyết Birch--Dyer
- Bhargava--Shankar cho $n = 3, 4, 5$: Ngoài $\mathrm{Sel}_2$, Bhargava--Shankar còn tính trung bình $|\mathrm{Sel}_3| = 4$, $|\mathrm{Sel}_4| = 7$, $|\mathrm{Sel}_5| = 6$ [bhargava-shankar2015a]. Mỗi kết quả cho cận trên tốt hơn cho hạng trung bình, đều phù hợp với Goldfeld.
- $\mathrm{Sha}$ hữu hạn: Phỏng đoán rằng $\mathrm{Sha}(E/\mathbb{Q})$ hữu hạn cho mọi $E$. Nếu đúng, thì descent bậc đủ cao sẽ cho hạng chính xác. BSD mạnh hàm ý $\mathrm{Sha}$ hữu hạn (vì $|\mathrm{Sha}|$ xuất hiện trong công thức hữu hạn).
- Tính toán BSD mạnh: Kiểm nghiệm BSD mạnh cho đường cong với $\mathrm{Sha} \neq 0$ (ví dụ 571a1) yêu cầu descent bậc cao để xác nhận $|\mathrm{Sha}| = 4$. Cremona/LMFDB đã kiểm nghiệm BSD mạnh cho hàng triệu đường cong bằng cách kết hợp $2$-descent và $4$-descent [cremona1997].
Định nghĩa
Chiều cao đo “kích thước số học” --- điểm có tọa độ phức tạp (tử/mẫu lớn) thì chiều cao lớn.
Tính chất quan trọng [silverman2009, lang1983]:
- Northcott: Với mỗi $B > 0$, tập $\{P \in E(\mathbb{Q}) : h(P) \leq B\}$ hữu hạn.
- Gần bậc hai: $h(2P) \geq 4h(P) - C_1$ và $h(P + Q) \leq 2h(P) + 2h(Q) + C_2$.
Ví dụ
Ý nghĩa trực giác
- Phép tương tự: chiều cao giống “số chữ số” cần để viết tọa độ điểm. Điểm $P = (3, 5)$ có chiều cao nhỏ (tọa độ gọn), nhưng $2P = (129/100, \ldots)$ đã phức tạp hơn, $3P$ càng phức tạp.
- Tính Northcott: Giống như chỉ có hữu hạn số nguyên $\leq B$, chỉ có hữu hạn điểm hữu tỉ có “độ phức tạp” $\leq B$. Đây là tính chất then chốt cho chứng minh Mordell--Weil.
- Nhược điểm: $h$ không “hoàn hảo” --- $h(P + Q)$ không có công thức đẹp qua $h(P)$ và $h(Q)$. Chiều cao Néron--Tate khắc phục bằng cách “làm trơn” sai số.
Liên hệ với giả thuyết Birch--Dyer
- Công cụ chứng minh Mordell--Weil: Chiều cao ngây thơ là thành phần không thể thiếu trong Bước 2 (descent) của chứng minh Mordell--Weil. Không có nó, ta không chứng minh được $E(\mathbb{Q})$ hữu hạn sinh.
- Tiền thân của $\hat{h}$: Chiều cao ngây thơ xấp xỉ chiều cao Néron--Tate: $\hat{h}(P) = h(P) + O(1)$. Trong thực hành, người ta dùng $h$ để sàng lọc ban đầu (tìm điểm chiều cao nhỏ), rồi tính $\hat{h}$ chính xác cho BSD mạnh.
- Tìm điểm sinh: Để tính regulator $\mathrm{Reg}_E$ trong BSD mạnh, cần tìm tập sinh Mordell--Weil. Thuật toán: tìm mọi điểm có $h(P) \leq B$ (hữu hạn), rồi kiểm tra chúng sinh ra $E(\mathbb{Q})$ modulo xoắn.
Định nghĩa
- $\hat{h}(P) \geq 0$ cho mọi $P$, và $\hat{h}(P) = 0 \Leftrightarrow P \in E(\mathbb{Q})_{\mathrm{tors}}$.
- $\hat{h}(nP) = n^2 \hat{h}(P)$ cho mọi $n \in \mathbb{Z}$ (bậc hai chính xác).
- $\hat{h}(P) = h(P) + O(1)$ (xấp xỉ chiều cao ngây thơ).
- Dạng song tuyến tính $\langle P, Q \rangle_{\mathrm{NT}} = \hat{h}(P+Q) - \hat{h}(P) - \hat{h}(Q)$ xác định dương trên $E(\mathbb{Q})/E(\mathbb{Q})_{\mathrm{tors}} \otimes \mathbb{R}$.
Ví dụ
- $E: y^2 = x^3 - 2$, $P = (3, 5)$: $\hat{h}(P) \approx 1.323$. Kiểm tra: $\hat{h}(2P) \approx 5.291 = 4 \times 1.323$ --- bậc hai chính xác!
- $E: y^2 + y = x^3 - x$ (37a1), $P = (0, 0)$: $\hat{h}(P) \approx 0.0511$. Điểm sinh duy nhất, chiều cao rất nhỏ (gần xoắn nhưng không phải xoắn).
- Điểm xoắn: $(0, 0)$ trên $y^2 = x^3 - x$ có $\hat{h} = 0$ (vì $2 \cdot (0,0) = \mathcal{O}$, tức là điểm xoắn bậc 2).
Ý nghĩa trực giác
- Chiều cao ngây thơ $h$ giống “thước đo tạm” --- đo gần đúng nhưng có sai số. Chiều cao Néron--Tate $\hat{h}$ là “thước đo chuẩn” --- loại bỏ hoàn toàn sai số.
- Phép tương tự: $h$ giống đo chiều cao bằng mắt (sai $\pm$ vài cm), $\hat{h}$ giống đo bằng laser (chính xác tuyệt đối).
- Không gian Euclid: Nhờ tính chất (iv), ta biến $E(\mathbb{Q})/\text{tors} \otimes \mathbb{R} \cong \mathbb{R}^r$ thành không gian Euclid với tích vô hướng $\langle \cdot, \cdot \rangle_{\mathrm{NT}}$. Các điểm sinh tạo thành “lưới” trong không gian này.
Liên hệ với giả thuyết Birch--Dyer
- Regulator: $\mathrm{Reg}_E = \det(\langle P_i, P_j \rangle_{\mathrm{NT}})$ --- tính trực tiếp từ chiều cao Néron--Tate.
- Gross--Zagier: Công thức Gross--Zagier [gross-zagier1986] liên hệ $L'(E, 1)$ với $\hat{h}(P_K)$ (chiều cao điểm Heegner): $L'(E, 1) = c \cdot \hat{h}(P_K)$. Nếu $\hat{h}(P_K) > 0$ thì $P_K$ có bậc vô hạn, suy ra $r \geq 1$.
- Kiểm nghiệm: Tính $\hat{h}$ chính xác (bằng Sage/PARI) là bước thiết yếu khi kiểm nghiệm BSD mạnh cho từng đường cong cụ thể.
Định nghĩa
- Đối xứng: $\langle P, Q \rangle = \langle Q, P \rangle$.
- Song tuyến tính: $\langle P_1 + P_2, Q \rangle = \langle P_1, Q \rangle + \langle P_2, Q \rangle$.
- Xác định dương: $\langle P, P \rangle = 2\hat{h}(P) \geq 0$, bằng 0 $\Leftrightarrow$ $P$ xoắn.
Ví dụ
- Hạng 1: $E: y^2 + y = x^3 - x$ (37a1), $P = (0, 0)$. Ma trận Gram $1 \times 1$:
\[ \langle P, P \rangle = 2\hat{h}(P) \approx 2 \times 0.0511 = 0.1022. \]
- Hạng 2: $E: y^2 = x^3 - 43x + 166$, hai điểm sinh $P_1, P_2$. Ma trận Gram:
\[ G = \begin{pmatrix} \langle P_1, P_1 \rangle & \langle P_1, P_2 \rangle \\ \langle P_2, P_1 \rangle & \langle P_2, P_2 \rangle \end{pmatrix}. \]Các phần tử đường chéo $= 2\hat{h}(P_i)$, phần tử ngoài chéo đo “góc” giữa $P_1$ và $P_2$ trong không gian Néron--Tate.
- Điểm trực giao: Nếu $\langle P_1, P_2 \rangle = 0$, hai “hướng” $P_1$ và $P_2$ vuông góc --- regulator đơn giản là $\langle P_1, P_1 \rangle \cdot \langle P_2, P_2 \rangle = 4\hat{h}(P_1)\hat{h}(P_2)$.
Ý nghĩa trực giác
- Trong không gian Euclid $\mathbb{R}^n$, tích vô hướng $\vec{u} \cdot \vec{v}$ cho biết “mức độ cùng hướng” của hai vectơ. Tương tự, $\langle P, Q \rangle_{\mathrm{NT}}$ đo “mức độ phụ thuộc” giữa hai điểm trên $E$.
- $\langle P, P \rangle = 2\hat{h}(P) = $ “chiều dài bình phương” của $P$.
- $\langle P, Q \rangle = 0$: $P$ và $Q$ “độc lập” (trực giao).
- $|\langle P, Q \rangle|$ lớn: $P$ và $Q$ “gần song song”.
- Phép tương tự hoàn chỉnh: ghép đôi chiều cao biến nhóm Mordell--Weil thành “lưới Euclid”, giống như tích vô hướng biến $\mathbb{Z}^n$ thành lưới trong $\mathbb{R}^n$.
Liên hệ với giả thuyết Birch--Dyer
- Ma trận Gram $\to$ Regulator: $\mathrm{Reg}_E = \det(G)$ với $G_{ij} = \langle P_i, P_j \rangle$. Ma trận $G$ mã hóa toàn bộ “hình học” lưới Mordell--Weil.
- Gross--Zagier chi tiết: $L'(E, 1) = \frac{\deg(\phi)}{c_\infty^2} \cdot \hat{h}(y_K) \cdot (\text{thừa số Euler})$, trong đó $\hat{h}(y_K) = \frac{1}{2}\langle y_K, y_K \rangle$ [gross-zagier1986]. Ghép đôi chiều cao là công cụ chính để “đo” điểm Heegner.
- BSD mạnh tổng quát: Trên trường số $K$, ghép đôi chiều cao tổng quát cho phép xây dựng regulator $\mathrm{Reg}_{E/K}$ cho BSD trên $K$.
Định nghĩa
Cụ thể hơn:
- $\lambda_\infty(P)$: đóng góp Archimedean, tính qua hàm sigma $\sigma(z; \Lambda_E)$ liên quan đến uniformization $E(\mathbb{C}) \cong \mathbb{C}/\Lambda_E$.
- $\lambda_p(P)$ ($p$ nguyên tố): đóng góp $p$-adic, phụ thuộc vào kiểu rút gọn tại $p$ và vị trí của $P$ modulo $p$.
Ví dụ
- $\lambda_\infty(P)$: đóng góp Archimedean, tính qua phần thực/ảo của $z_P$ trên $\mathbb{C}/\Lambda_E$.
- $\lambda_{37}(P)$: đóng góp tại $p = 37$ (rút gọn xấu duy nhất, vì conductor $= 37$). Phụ thuộc vào vị trí của $P$ modulo 37.
- $\lambda_p(P) = 0$ cho $p \neq 37$ (rút gọn tốt, và $P$ nằm trong thành phần đơn vị).
Ý nghĩa trực giác
- Phép tương tự: chiều cao tổng thể $\hat{h}(P)$ giống “thuế tổng” mà điểm $P$ phải trả. Mỗi “cơ quan thuế cục bộ” $v$ thu $\lambda_v(P)$: thuế Archimedean ($\lambda_\infty$) đo “kích thước thực”, thuế $p$-adic ($\lambda_p$) đo “mức chia hết cho $p$”.
- Rút gọn tốt: Khi $E$ có rút gọn tốt tại $p$ và $P$ nằm “ở vị trí tốt”, $\lambda_p(P) = 0$ --- không đóng thuế tại $p$.
- Rút gọn xấu: Khi rút gọn xấu, $\lambda_p$ có thể khác 0 --- đường cong “phức tạp” tại $p$ buộc điểm trả thêm “thuế”.
- Triết lý cục bộ-toàn cục: Phân tách $\hat{h} = \sum_v \lambda_v$ thể hiện nguyên lý Hasse--Minkowski --- thông tin toàn cục (chiều cao) được lắp ghép từ thông tin cục bộ (tại mỗi $v$).
Liên hệ với giả thuyết Birch--Dyer
- Gross--Zagier cục bộ: Công thức Gross--Zagier gốc tính $\hat{h}(P_K)$ bằng cách tách thành $\sum_v \lambda_v(P_K)$ và tính từng đóng góp --- phần Archimedean liên hệ với $L'(E, 1)$, phần hữu hạn liên hệ với số giao trên mô hình Néron [gross-zagier1986].
- Yuan--Zhang--Zhang: Phiên bản tổng quát hóa Gross--Zagier (2013) dùng chiều cao cục bộ Néron trên mô hình tích phân để tính $\hat{h}(P_K)$ cho conductor tổng quát [yuan-zhang-zhang2013].
- Số Tamagawa: Đóng góp $\lambda_p$ tại $p$ rút gọn xấu liên quan đến số Tamagawa $c_p$ --- cả hai đều đo “mức độ xấu” tại $p$.
Định nghĩa
Khi $r = 0$: $\mathrm{Reg}(E/\mathbb{Q}) = 1$ (quy ước).
$\mathrm{Reg}(E/\mathbb{Q})$ không phụ thuộc vào chọn cơ sở: hai cơ sở bất kỳ liên hệ qua ma trận $M \in \mathrm{GL}_r(\mathbb{Z})$ (có $\det(M) = \pm 1$), nên $\det(M^T G M) = \det(G)$ [silverman2009].
Ví dụ
- Hạng 0: $E: y^2 = x^3 + 1$. $r = 0$, nên $\mathrm{Reg} = 1$.
- Hạng 1: $E: y^2 = x^3 - 2$, điểm sinh $P = (3, 5)$:
\[ \mathrm{Reg} = 2\hat{h}(P) = 2 \times 1.323 \approx 2.646. \]
- Hạng 1: $E: y^2 + y = x^3 - x$ (37a1), điểm sinh $P = (0, 0)$:
\[ \mathrm{Reg} = 2\hat{h}(P) \approx 0.1022. \]Regulator nhỏ vì điểm sinh có chiều cao rất thấp.
- Hạng 2: $E: y^2 = x^3 + x^2 - 2x$ (389a1), hai điểm sinh $P_1 = (0, 0)$, $P_2 = (-1, 1)$:
\[ \mathrm{Reg} = \det \begin{pmatrix} 2\hat{h}(P_1) & \langle P_1, P_2 \rangle \\ \langle P_2, P_1 \rangle & 2\hat{h}(P_2) \end{pmatrix} \approx 0.1525. \]
Ý nghĩa trực giác
- Ghép đôi Néron--Tate biến $E(\mathbb{Q})/\text{tors}$ thành “lưới” trong $\mathbb{R}^r$. Regulator là thể tích miền cơ bản của lưới này.
- Regulator nhỏ: các điểm sinh “gần nhau” hoặc “gần phụ thuộc” $\Rightarrow$ lưới “dẹt” $\Rightarrow$ thể tích nhỏ.
- Regulator lớn: các điểm sinh “xa nhau” và “độc lập mạnh” $\Rightarrow$ lưới “tròn” $\Rightarrow$ thể tích lớn.
- Phép tương tự: giống thể tích hình hộp tạo bởi $r$ vectơ. Nếu vectơ gần song song, thể tích nhỏ; nếu vuông góc, thể tích lớn.
Tương tự với trường số: Regulator $R_K$ của trường số $K$ đo thể tích lưới đơn vị (qua logarithm đơn vị). Regulator $\mathrm{Reg}_E$ đóng vai trò tương tự cho “trường” $E(\mathbb{Q})$. Đây là một phần của tương tự BSD--công thức số lớp.
Liên hệ với giả thuyết Birch--Dyer
- Công thức BSD mạnh:
\[ \frac{L^{(r)}(E, 1)}{r!} = \frac{|\mathrm{Sha}(E/\mathbb{Q})| \cdot \mathrm{Reg}(E/\mathbb{Q}) \cdot \Omega_E \cdot \prod_p c_p}{|E(\mathbb{Q})_{\mathrm{tors}}|^2}. \]
- Khó tính: Tính $\mathrm{Reg}_E$ yêu cầu biết đầy đủ tập sinh Mordell--Weil --- đây là phần khó nhất! Cho hạng 1, cần tìm điểm sinh; cho hạng $\geq 2$, cần tìm $r$ điểm sinh độc lập.
- Tương quan với $|\mathrm{Sha}|$: BSD mạnh nói $L^{(r)}/r!$ là tích $|\mathrm{Sha}| \cdot \mathrm{Reg} \cdot (\ldots)$. Nếu $\mathrm{Reg}$ lớn (điểm sinh “tốt”), thì $|\mathrm{Sha}|$ có thể nhỏ. Ngược lại, $\mathrm{Reg}$ nhỏ $\Rightarrow$ $|\mathrm{Sha}|$ lớn để bù đắp.
- Gross--Zagier: Khi $r = 1$, $\mathrm{Reg} = 2\hat{h}(P)$, và Gross--Zagier cho $L'(E, 1) = c \cdot \hat{h}(P_K)$. Đây là bằng chứng trực tiếp BSD cho hạng 1 [gross-zagier1986].
Định nghĩa
Tích Euler: $\zeta(s)$ có biểu diễn tích trên tất cả số nguyên tố:
$\zeta(s)$ có thác triển giải tích thành hàm phân hình trên toàn bộ $\mathbb{C}$, với cực đơn duy nhất tại $s = 1$ (thặng dư $= 1$). Phương trình hàm:
Ví dụ
- $\zeta(2) = \frac{\pi^2}{6}$ (Euler, 1735). Bài toán Basel nổi tiếng.
- $\zeta(4) = \frac{\pi^4}{90}$, $\zeta(6) = \frac{\pi^6}{945}$, \ldots\ Tổng quát: $\zeta(2k) = \frac{(-1)^{k+1} (2\pi)^{2k} B_{2k}}{2(2k)!}$ với $B_{2k}$ là số Bernoulli.
- $\zeta(3) \approx 1.202$ (hằng số Apéry). Apéry (1978) chứng minh $\zeta(3)$ vô tỉ --- nhưng $\zeta(5), \zeta(7), \ldots$ vẫn chưa biết có vô tỉ không!
- Giá trị âm: $\zeta(-1) = -\frac{1}{12}$ (“$1 + 2 + 3 + \cdots = -1/12$” theo nghĩa thác triển). $\zeta(0) = -1/2$. Nghiệm “tầm thường”: $\zeta(-2) = \zeta(-4) = \cdots = 0$.
Ý nghĩa trực giác
- Tích Euler = máy quét DNA: Mỗi thừa số $(1 - p^{-s})^{-1}$ “mã hóa” thông tin về số nguyên tố $p$. Nhân tất cả lại thu được toàn bộ thông tin về phân bố số nguyên tố.
- Cực tại $s = 1$: $\zeta(s) \to \infty$ khi $s \to 1^+$ vì chuỗi điều hòa $\sum 1/n$ phân kỳ. Tốc độ phát tán mã hóa mật độ số nguyên tố --- suy ra Định lý Số nguyên tố: $\pi(x) \sim x/\ln x$.
- Đường tới hạn $\mathrm{Re}(s) = 1/2$: Giả thuyết Riemann dự đoán mọi nghiệm không tầm thường nằm trên đường này. Nếu đúng, sai số trong $\pi(x) \approx \mathrm{Li}(x)$ tối ưu: $|\pi(x) - \mathrm{Li}(x)| = O(\sqrt{x} \log x)$.
Liên hệ với giả thuyết Birch--Dyer
- Hàm $L$ của $E$ mô phỏng $\zeta$: $L(E, s) = \prod_p L_p(E, s)$ --- tích Euler giống $\zeta(s)$, nhưng mỗi thừa số $L_p = (1 - a_p p^{-s} + p^{1-2s})^{-1}$ mang thông tin về đường cong $E$ tại $p$ (thay vì chỉ “$p$ tồn tại”).
- Phương trình hàm: $\zeta$ có đối xứng $s \leftrightarrow 1 - s$. Hàm $L(E, s)$ có đối xứng $s \leftrightarrow 2 - s$ (tâm đối xứng tại $s = 1$ --- đúng nơi BSD quan tâm).
- Chuỗi bài toán thiên niên kỷ: Giả thuyết Riemann (cho $\zeta$) và giả thuyết BSD (cho $L(E, s)$) đều nằm trong 7 bài toán thiên niên kỷ Clay. Cả hai đều hỏi: “nghiệm/bậc triệt tiêu của hàm $L$ nói gì về đối tượng số học?”
- Tương tự: $\zeta(s) \neq 0$ tại $s = 1$ (cực!) $\Leftrightarrow$ có vô hạn số nguyên tố. Tương tự, $L(E, 1) \neq 0$ $\Leftrightarrow$ (theo BSD) $E(\mathbb{Q})$ hữu hạn.
Định nghĩa hình thức
Nói cách khác: nếu $\zeta(\sigma + it) = 0$ với $0 < \sigma < 1$, thì $\sigma = 1/2$.
Hàm $\zeta(s)$ cũng có các nghiệm tầm thường tại $s = -2, -4, -6, \ldots$ (do thừa số $\Gamma$ trong phương trình hàm). Giả thuyết Riemann chỉ nói về các nghiệm “thú vị” nằm trong dải tới hạn $0 < \mathrm{Re}(s) < 1$.
Trạng thái: Đây là một trong 7 Bài toán Thiên niên kỷ (Clay Millennium Problems), treo thưởng 1 triệu đô la. Tính đến nay, hơn $10^{13}$ nghiệm không tầm thường đầu tiên đã được kiểm chứng bằng máy tính --- tất cả đều nằm trên đường $\mathrm{Re}(s) = 1/2$ --- nhưng chưa ai chứng minh được cho tất cả.
Ví dụ
Phần ảo $t$ mang ý nghĩa “tần số”: $\zeta(1/2 + it) = 0$ tại các $t$ cụ thể, tương tự cách một sóng âm triệt tiêu tại những thời điểm nhất định.
Ý nghĩa trực giác
- Nghiệm = tần số dao động: Riemann phát hiện rằng hàm đếm số nguyên tố $\pi(x)$ (số lượng số nguyên tố $\leq x$) có thể viết như tổng “sóng”, mỗi sóng ứng với một nghiệm $\rho$ của $\zeta(s)$. Nếu mọi $\rho$ có $\mathrm{Re}(\rho) = 1/2$, các sóng dao động đều đặn --- số nguyên tố phân bố “đều nhất có thể”.
- Nếu có nghiệm lệch: Một nghiệm với $\mathrm{Re}(\rho) > 1/2$ sẽ tạo sóng biên độ lớn, gây “sai số lớn” trong $\pi(x) \approx \mathrm{Li}(x)$. Giả thuyết Riemann nói sai số này tối ưu: $|\pi(x) - \mathrm{Li}(x)| = O(\sqrt{x} \log x)$.
- Tương tự vật lý: Nghĩ nghiệm $\zeta$ như tần số riêng của “trống số nguyên tố”. Giả thuyết Riemann $\Leftrightarrow$ mọi tần số riêng nằm trên một đường thẳng duy nhất --- gợi ý có cấu trúc ẩn rất sâu.
Liên hệ với giả thuyết Birch--Dyer
- Hai bài toán thiên niên kỷ song sinh: Cả Giả thuyết Riemann (cho $\zeta$) và Giả thuyết BSD (cho $L(E,s)$) đều thuộc 7 bài toán Clay. Cả hai đều hỏi: “nghiệm/bậc triệt tiêu của hàm $L$ mang thông tin gì về đối tượng số học?”
- Giả thuyết Riemann tổng quát (GRH): Phiên bản mở rộng cho hàm $L(E,s)$ dự đoán mọi nghiệm không tầm thường nằm trên $\mathrm{Re}(s) = 1$. Nếu GRH đúng cho $L(E,s)$, nhiều kết quả về hạng elliptic sẽ được cải thiện đáng kể [silverman2009].
- “Giả thuyết Riemann cục bộ”: Cận Hasse $|a_p| \leq 2\sqrt{p}$ chính là “Giả thuyết Riemann cho hàm zeta cục bộ” --- và đã được Hasse chứng minh (1933). Deligne (1974) chứng minh cho đa tạp bất kỳ [deligne1974].
Định nghĩa hình thức
Ví dụ cơ bản nhất: $\zeta(s) = \prod_p (1 - p^{-s})^{-1}$ (Euler, 1737). Ở đây $L_p(s) = (1 - p^{-s})^{-1}$ là nghịch đảo đa thức bậc 1 theo $p^{-s}$.
Đẳng thức tích Euler tương đương với Định lý cơ bản của số học (phân tích nguyên tố duy nhất). Đây là cầu nối giữa thế giới giải tích (chuỗi, tích phân) và thế giới số học (số nguyên tố).
Ví dụ
- Tại $p$ khử tốt: thừa số Euler là đa thức bậc 2 theo $p^{-s}$. Nó phân tích thành $(1 - \alpha_p p^{-s})^{-1}(1 - \beta_p p^{-s})^{-1}$ với $\alpha_p \beta_p = p$ và $\alpha_p + \beta_p = a_p$.
- Tại $p$ khử xấu: thừa số Euler chỉ bậc 1 (“thoái hóa”), với $a_p \in \{-1, 0, 1\}$.
Ví dụ số: Đường cong $y^2 + y = x^3 - x^2$ (conductor $N = 11$):
Ý nghĩa trực giác
- Từ cục bộ đến toàn cục: Mỗi thừa số $L_p(E,s)$ chỉ chứa thông tin “cục bộ” về $E$ tại $p$ --- tức số điểm $\#E(\mathbb{F}_p)$ quy đổi thành $a_p$. Nhưng khi nhân tất cả lại, ta thu được thông tin “toàn cục” sâu sắc.
- Bậc thừa số = chiều đối đồng điều: Thừa số Euler của $\zeta(s)$ có bậc 1 (vì “đối tượng đếm” $\mathbb{Z}/p\mathbb{Z}$ có chiều 0). Thừa số Euler của $L(E,s)$ có bậc 2 (vì đường cong elliptic có $\dim H^1 = 2$). Tổng quát, đa tạp chiều $d$ cho thừa số bậc $= \dim H^i$ [serre1973].
- Sàng Eratosthenes giải tích: Chứng minh tích Euler cho $\zeta(s)$ giống sàng Eratosthenes --- lần lượt “loại bỏ” bội của $2, 3, 5, \ldots$ khỏi chuỗi. Kết quả: mỗi số nguyên dương xuất hiện đúng 1 lần nhờ phân tích nguyên tố duy nhất.
Liên hệ với giả thuyết Birch--Dyer
- Triết lý BSD: Giả thuyết BSD khẳng định rằng hành vi tại $s = 1$ của tích Euler $L(E,s)$ “biết” hạng $r$ của $E(\mathbb{Q})$. Đây là kết quả đáng kinh ngạc: thông tin cục bộ (đếm điểm mod $p$ cho từng $p$) xác định tính chất toàn cục (hạng).
- Tích hữu hạn của Birch--Dyer: Birch và Swinnerton-Dyer (1960s) khảo sát tích hữu hạn $\Pi_E(X) = \prod_{p \leq X} \#E(\mathbb{F}_p)/p$ và phát hiện nó tăng $\sim C \cdot (\log X)^r$. Đây chính là động lực ban đầu cho giả thuyết BSD [birch-sd1965].
- Sự hội tụ: Tích Euler $L(E,s)$ hội tụ khi $\mathrm{Re}(s) > 3/2$ (nhờ cận Hasse $|a_p| \leq 2\sqrt{p}$). Điểm $s = 1$ nằm ngoài miền hội tụ --- đây là lý do cần thác triển giải tích.
Định nghĩa hình thức
Chuỗi Dirichlet hội tụ tuyệt đối trong nửa mặt phẳng $\mathrm{Re}(s) > \sigma_a$ với một hằng số $\sigma_a \in [-\infty, +\infty]$ gọi là hoành độ hội tụ tuyệt đối (abscissa of absolute convergence).
Các ví dụ cơ bản:
- $a_n = 1$ cho mọi $n$: $L(s) = \zeta(s)$, hoành độ hội tụ $\sigma_a = 1$.
- $a_n = \chi(n)$ (đặc trưng Dirichlet): $L(s) = L(s, \chi)$, hoành độ $\sigma_a = 1$.
- $a_n$ = hệ số Fourier dạng modular: $L(s) = L(f, s)$, hoành độ $\sigma_a = (k+1)/2$ (với $k$ là trọng số).
Ví dụ
- Truy hồi: $a_{p^k} = a_p \cdot a_{p^{k-1}} - p \cdot a_{p^{k-2}}$ (với $p \nmid N$). Ví dụ: $a_4 = a_2^2 - 2 = 1 - 2 = -1$, $a_9 = a_3^2 - 3 = -3$.
- Nhân tính: $a_{mn} = a_m \cdot a_n$ khi $\gcd(m,n) = 1$. Ví dụ: $a_6 = a_2 \cdot a_3 = 0$.
Ý nghĩa trực giác
- Tương tự chuỗi lũy thừa: Chuỗi lũy thừa $\sum a_n z^n$ mã hóa dãy $\{a_n\}$ bằng lũy thừa của biến $z$. Chuỗi Dirichlet $\sum a_n n^{-s}$ cũng mã hóa $\{a_n\}$, nhưng bằng lũy thừa $n^{-s}$ --- thay “đếm” (thứ tự $n$) bằng “đo” (kích thước $n$).
- Tích Euler $\leftrightarrow$ tính nhân tính: Nếu $a_n$ nhân tính ($a_{mn} = a_m a_n$ khi $\gcd(m,n) = 1$), thì chuỗi Dirichlet có tích Euler. Đây là phản ánh giải tích của phân tích nguyên tố duy nhất.
- Biến đổi Mellin: Chuỗi Dirichlet liên hệ với dạng modular qua biến đổi Mellin: $L(f, s) = (2\pi)^s \Gamma(s)^{-1} \int_0^{\infty} f(it)\, t^{s-1}\, dt$. Đây là cầu nối giữa “chuỗi Fourier” ($q$-expansion) và “chuỗi Dirichlet” ($n^{-s}$-expansion).
Liên hệ với giả thuyết Birch--Dyer
- Hàm $L(E,s)$ là chuỗi Dirichlet: $L(E,s) = \sum a_n n^{-s}$, trong đó $a_n$ xác định hoàn toàn bởi các $a_p$ (lượng sai Frobenius) qua truy hồi và tính nhân tính.
- Hội tụ và $s = 1$: Chuỗi Dirichlet hội tụ tuyệt đối khi $\mathrm{Re}(s) > 3/2$, nhưng BSD cần giá trị tại $s = 1$ --- do đó cần thác triển giải tích (thông qua modularity).
- BSD mạnh: Công thức BSD mạnh $\lim_{s \to 1} L(E,s)/(s-1)^r = (\Omega_E \cdot \mathrm{Reg}_E \cdot \prod c_p \cdot |\mathrm{Sha}|) / |E(\mathbb{Q})_{\mathrm{tors}}|^2$ liên hệ các hệ số $a_n$ của chuỗi Dirichlet với các bất biến số học [birch-sd1965].
Định nghĩa hình thức
- Nếu $p \nmid N$ (khử tốt): $L_p(E, s)^{-1} = (1 - a_p p^{-s} + p^{1-2s})^{-1}$, với $a_p = p + 1 - \#E(\mathbb{F}_p)$.
- Nếu $p \mid N$ (khử xấu): $L_p(E, s)^{-1} = (1 - a_p p^{-s})^{-1}$, với:
\[ a_p = \begin{cases} +1 & \text{khử nhân tách (split multiplicative)}, \\ -1 & \text{khử nhân không tách (non-split multiplicative)}, \\ 0 & \text{khử cộng (additive)}. \end{cases} \]
Hàm $L(E,s)$ còn thỏa mãn phương trình hàm: đặt $\Lambda(E, s) = N^{s/2}(2\pi)^{-s}\Gamma(s)\, L(E,s)$, thì $\Lambda(E, s) = w_E \cdot \Lambda(E, 2-s)$ với $w_E \in \{+1, -1\}$ là dấu gốc [diamond-shurman2005].
Ví dụ
- $E\colon y^2 + y = x^3 - x^2$ (conductor 11, hạng $r = 0$).
Dấu gốc $w_E = +1$. Giá trị:
\[ L(E, 1) = 0.2538\ldots \neq 0. \]Theo BSD: $r = 0$ $\Leftrightarrow$ $L(E,1) \neq 0$. Đúng! $E(\mathbb{Q})$ hữu hạn (chỉ có nhóm xoắn $\mathbb{Z}/5\mathbb{Z}$). - $E\colon y^2 + y = x^3 - x$ (conductor 37, hạng $r = 1$).
Dấu gốc $w_E = -1$, nên $L(E,1) = 0$ (bắt buộc do phương trình hàm). Đạo hàm:
\[ L'(E, 1) = 0.3059\ldots \neq 0. \]Theo BSD: $\mathrm{ord}_{s=1} L(E,s) = 1$ $\Leftrightarrow$ $r = 1$. Đúng! $E(\mathbb{Q}) \cong \mathbb{Z}$, sinh bởi $P = (0, 0)$. - $E\colon y^2 = x^3 - 43x + 166$ (conductor 5077, hạng $r = 2$).
$L(E,1) = L'(E,1) = 0$, $L''(E,1) \neq 0$. Theo BSD: $r = 2$. Đúng!
Ý nghĩa trực giác
- Từ cục bộ đến toàn cục: Số điểm $\#E(\mathbb{F}_p)$ cho từng $p$ riêng lẻ chỉ là thông tin cục bộ, nhưng hàm $L(E,s)$ --- được xây dựng bằng cách “nhân tất cả lại” --- chứa thông tin toàn cục sâu sắc.
- So sánh với $\zeta(s)$: $\zeta(s)$ mã hóa “mọi số nguyên tố tồn tại” (thừa số bậc 1). $L(E,s)$ mã hóa “$E$ trông thế nào tại mỗi $p$” (thừa số bậc 2). Bậc thừa số phản ánh chiều: $\mathbb{Z}/p\mathbb{Z}$ chiều 0, đường cong chiều 1.
- Đối xứng qua $s = 1$: Phương trình hàm $\Lambda(E, s) = w_E \Lambda(E, 2-s)$ cho đối xứng qua $s = 1$ --- “trung tâm” là nơi BSD khảo sát.
Ý nghĩa hình học của hàm $L$
Hàm $L$ không chỉ là công cụ giải tích thuần túy --- nó mang ý nghĩa hình học sâu sắc, kết nối nhiều lĩnh vực của toán học.
- Hàm zeta cục bộ đếm “hình dạng” của đường cong.
Tại mỗi số nguyên tố $p$, rút gọn $E \pmod{p}$ cho đường cong $\tilde{E}/\mathbb{F}_p$. Hàm zeta cục bộ
\[Z(\tilde{E}/\mathbb{F}_p, T) = \frac{1 - a_p T + pT^2}{(1-T)(1-pT)}\]có dạng “tôpô”: tử số tương ứng $H^1$ (đối đồng điều bậc 1), mẫu số tương ứng $H^0$ và $H^2$. Đây chính là công thức vết Lefschetz: số điểm bất động của ánh xạ Frobenius $\phi_p$ trên $\tilde{E}$ bằng tổng luân phiên các vết trên đối đồng điều étale [deligne1974, weil1949]:
\[\#\tilde{E}(\mathbb{F}_p) = \sum_{i=0}^{2} (-1)^i \mathrm{Tr}(\phi_p \mid H^i_{\text{ét}}(\tilde{E}, \mathbb{Q}_\ell)).\]Vậy $a_p$ chính là vết của Frobenius trên $H^1$, và hàm $L(E,s)$ “ghi lại hình dạng đối đồng điều” của $E$ tại mọi $p$.
- Đường cong elliptic là xuyến (torus) phức.
Trên $\mathbb{C}$, mỗi đường cong elliptic $E$ đồng cấu với xuyến $\mathbb{C}/\Lambda$ cho lưới $\Lambda = \mathbb{Z}\omega_1 + \mathbb{Z}\omega_2$ [silverman2009]. Chu kỳ thực (real period)
\[\Omega_E = \int_{E(\mathbb{R})} \left|\frac{dx}{2y + a_1 x + a_3}\right|\]chính là “chu vi” của xuyến theo hướng thực. Trong công thức BSD mạnh, $\Omega_E$ đóng vai trò thể tích --- giá trị đặc biệt $L^{(r)}(E,1)/r!$ tỉ lệ thuận với $\Omega_E$.
Trực giác: hàm $L$ tại $s = 1$ “đo kích thước hình học” của đường cong.
- Số Tamagawa --- thể tích $p$-adic.
Tại mỗi $p$ chia $N$ (conductor), số Tamagawa (Tamagawa number) $c_p = [E(\mathbb{Q}_p) : E_0(\mathbb{Q}_p)]$ đo “phần bị mất” khi rút gọn mod $p$. Tên gọi xuất phát từ lý thuyết độ đo Tamagawa trên nhóm đại số [bloch-kato1990]: nếu $G$ là nhóm đại số trên $\mathbb{Q}$, thể tích adelic $\mathrm{vol}(G(\mathbb{Q}) \backslash G(\mathbb{A}))$ (đo bằng độ đo Tamagawa) liên hệ trực tiếp với giá trị đặc biệt hàm $L$ của $G$. Công thức BSD mạnh là trường hợp đặc biệt của triết lý này.
- Regulator --- “thể tích” trong không gian chiều cao.
Regulator $\mathrm{Reg}_E = \det(\langle P_i, P_j \rangle_{\mathrm{NT}})$ (định thức ma trận chiều cao Néron--Tate) đo “thể tích hình bình hành” sinh bởi các điểm sinh $P_1, \ldots, P_r$ của $E(\mathbb{Q})/E(\mathbb{Q})_{\mathrm{tors}}$. Đây là tương tự trực tiếp của regulator Dirichlet trong lý thuyết đơn vị trường số [lang1983, silverman2009].
Trong công thức BSD mạnh:
\[\frac{L^{(r)}(E,1)}{r!} = \frac{\Omega_E \cdot \mathrm{Reg}_E \cdot \prod_p c_p \cdot |\mathrm{Sha}|}{|E(\mathbb{Q})_{\mathrm{tors}}|^2},\]vế phải là tích các “thể tích”: $\Omega_E$ (thể tích Archimedean), $\mathrm{Reg}_E$ (thể tích trong không gian chiều cao), $c_p$ (thể tích $p$-adic). Vậy giá trị đặc biệt $L^{(r)}(E,1)/r!$ là một loại thể tích adelic --- thể tích đo trên tất cả các hoàn thành (thực + $p$-adic) cùng lúc [bloch-kato1990, tate1966].
- Phỏng đoán Weil --- “Giả thuyết Riemann” là hình học.
Phỏng đoán Weil (1949) khẳng định hàm zeta cục bộ $Z(\tilde{E}/\mathbb{F}_p, T)$ có ba tính chất: (i) hữu tỉ, (ii) phương trình hàm, (iii) “Giả thuyết Riemann” ($|\alpha_p| = \sqrt{p}$). Weil nhận ra rằng cả ba tính chất đều có đối tác tôpô: (i) $\leftrightarrow$ hữu hạn chiều của đối đồng điều, (ii) $\leftrightarrow$ đối ngẫu Poincaré, (iii) $\leftrightarrow$ tính xác định dương của dạng giao [weil1949, deligne1974].
Điều này dẫn Grothendieck xây dựng đối đồng điều étale (étale cohomology) --- “đối đồng điều đại số” hoạt động trên trường hữu hạn --- và Deligne (1974) chứng minh phỏng đoán Weil cho đa tạp bất kỳ. Vậy “Giả thuyết Riemann cục bộ” thực chất là một định lý hình học.
Giá trị đặc biệt hàm $L$ --- triết lý chung
Giá trị đặc biệt hàm $L$ tại các số nguyên mang ý nghĩa số học sâu sắc. Đây là một trong những chủ đề trung tâm của lý thuyết số hiện đại [bloch-kato1990].
- Euler (1734): $\zeta(2) = \pi^2/6$. Đây là “chu kỳ” (period) --- $\pi$ xuất hiện vì hàm zeta liên quan đến lượng giác qua công thức $\sin(\pi z)/(\pi z) = \prod_{n=1}^{\infty}(1 - z^2/n^2)$ [edwards1974].
- Công thức số lớp Dirichlet (1837): Cho $K = \mathbb{Q}(\sqrt{-d})$ trường toàn phương ảo:
\[L(1, \chi_d) = \frac{2\pi h_K}{w_K \sqrt{d}},\]với $h_K$ = số lớp, $w_K$ = số nghiệm đơn vị. Giá trị đặc biệt $L(1, \chi_d)$ “đếm lớp ideal” [davenport2000].
- Công thức thặng dư Dedekind: Cho trường số $K$ bậc $n$:
\[\lim_{s \to 1} (s-1)\,\zeta_K(s) = \frac{2^{r_1}(2\pi)^{r_2} h_K R_K}{w_K \sqrt{|d_K|}},\]với $R_K$ = regulator Dirichlet (thể tích trong không gian logarit đơn vị), $h_K$ = số lớp [neukirch1999]. Đây là “nguyên mẫu” cho BSD mạnh.
- BSD (1965): Giá trị dẫn đầu $L^{(r)}(E,1)/r!$ bằng tích các bất biến số học (xem công thức ở trên). Đây là sự tổng quát hóa trực tiếp của công thức Dedekind [birch-sd1965, tate1966].
- Phỏng đoán Bloch--Kato (1990): Tổng quát cho motif (motive) $M$ bất kỳ: giá trị đặc biệt $L^*(M, n)$ (hệ số dẫn đầu tại $s = n$) bằng tích [bloch-kato1990]:
\[L^*(M, n) \sim \frac{\text{period} \times \text{regulator} \times \text{Tamagawa} \times |\text{``Sha''}|}{|\text{torsion}|^2}.\]BSD là trường hợp $M = h^1(E)$, $n = 1$.
- Phỏng đoán Beilinson (1985): Cho $r > \dim M/2$ (ngoài miền tới hạn), giá trị đặc biệt liên hệ với regulator Beilinson --- ánh xạ từ $K$-theory đại số sang đối đồng điều Deligne.
Triết lý chung: Giá trị đặc biệt hàm $L$ tại số nguyên luôn là “thể tích” --- tích của chu kỳ (period) và regulator --- nhân với thông tin torsion (số Tamagawa, $\mathrm{Sha}$). Hàm $L$ là “cầu nối” giữa giải tích phức (zero, cực, giá trị) và hình học số học (đối đồng điều, $K$-theory, thể tích adelic).
Hàm $L$ trong vật lý và các lĩnh vực khác
- Ma trận ngẫu nhiên và vật lý hạt nhân.
Năm 1972, Hugh Montgomery phát hiện rằng phân bố khoảng cách giữa các zero của $\zeta(s)$ trên dải tới hạn khớp hoàn hảo với phân bố khoảng cách trị riêng của ma trận ngẫu nhiên trong GUE (Gaussian Unitary Ensemble) --- mô hình từ vật lý hạt nhân [katz-sarnak1999].
Keating--Snaith (2000) dùng ma trận ngẫu nhiên dự đoán moment của hàm $L$:
\[\int_0^T |\zeta(1/2 + it)|^{2k}\, dt \sim C_k \cdot T(\log T)^{k^2},\]với hằng số $C_k$ tính chính xác từ lý thuyết ma trận ngẫu nhiên. Cho họ đường cong elliptic, thống kê hạng liên hệ với phân bố trị riêng theo kiểu “orthogonal” hoặc “symplectic” tùy dấu gốc $w_E$.
- Hỗn loạn lượng tử (quantum chaos).
Berry--Keating (1999) đề xuất rằng zero của $\zeta(s)$ là trị riêng của toán tử Hamilton $\hat{H} = \hat{x}\hat{p}$ trên không gian pha phù hợp --- kết nối Giả thuyết Riemann với phổ năng lượng hệ lượng tử.
- Mật mã học.
Hàm $L$ liên hệ trực tiếp với bảo mật của mật mã đường cong elliptic (ECC). Bậc triệt tiêu $\mathrm{ord}_{s=1} L(E,s)$ quyết định hạng, mà hạng lớn $\Rightarrow$ nhiều điểm hữu tỉ $\Rightarrow$ rủi ro bảo mật. Thuật toán factoring ECM của Lenstra [lenstra1987] khai thác trực tiếp tính chất số học của $E(\mathbb{F}_p)$.
- Lý thuyết dây (string theory).
Hàm phân hoạch trong lý thuyết dây liên hệ với dạng modular qua tích vô hạn Dedekind:
\[\eta(\tau) = q^{1/24} \prod_{n=1}^{\infty}(1 - q^n), \quad q = e^{2\pi i \tau}.\]Dạng modular gắn với đường cong elliptic qua Định lý modularity, nên hàm $L(E,s)$ gián tiếp xuất hiện trong lý thuyết dây [diamond-shurman2005].
- Hình học phi giao hoán (Connes).
Alain Connes [connes1999] xây dựng “hệ lượng tử số học” --- $C^*$-algebra mà phổ (spectrum) chứa zero của $\zeta(s)$ như “trị riêng thiếu” (missing spectral lines). Zero của hàm $L$ là “tần số cộng hưởng” của không gian số học.
- Chương trình Langlands --- “Đại thống nhất.”
Robert Langlands (1967) đề xuất rằng mọi hàm $L$ “có ý nghĩa” (Artin, Hasse--Weil, $p$-adic, v.v.) đều là hàm $L$ tự đẳng cấu gắn với biểu diễn tự đẳng cấu trên nhóm reductive [gelbart1984, langlands1980]. Định lý modularity của Wiles là trường hợp đặc biệt. Chương trình Langlands hứa hẹn “thống nhất” hàm $L$ từ đại số, hình học, và giải tích vào một lý thuyết duy nhất [bump1997, goldfeld-hundley2011].
Lịch sử phát triển khái niệm hàm $L$
- Euler (1737): Chứng minh tích Euler $\zeta(s) = \prod_p (1 - p^{-s})^{-1}$ cho $s$ thực, kết nối chuỗi vô hạn với số nguyên tố. Đây là “hàm $L$ đầu tiên” [hardy-wright2008].
- Riemann (1859): Trong bài báo duy nhất 8 trang về lý thuyết số [riemann1859], mở rộng $\zeta(s)$ sang biến phức, chứng minh thác triển giải tích và phương trình hàm [edwards1974].
- Dirichlet (1837): Giới thiệu hàm $L$ Dirichlet $L(s, \chi) = \sum_{n=1}^{\infty} \chi(n)/n^s$ để chứng minh định lý về số nguyên tố trong cấp số cộng [davenport2000, apostol1976].
- Hecke (1920): Tổng quát hàm $L$ Dirichlet sang trường số đại số, xây dựng hàm $L$ Hecke [neukirch1999].
- Tate (1950): Luận văn tiến sĩ lừng danh [tate1967] xây dựng lại lý thuyết Hecke bằng phân tích Fourier trên adèle --- ngôn ngữ hiện đại dùng đến ngày nay.
- Hasse--Weil (1950s): Gắn hàm $L$ cho đa tạp đại số trên $\mathbb{Q}$ bằng tích Euler từ dữ liệu cục bộ [silverman2009, serre1970].
- Langlands (1967--): Đề xuất chương trình Langlands liên hệ mọi hàm $L$ số học với hàm $L$ tự đẳng cấu [gelbart1984, bump1997, langlands1980].
- Wiles (1995): Chứng minh Định lý modularity [wiles1995], hoàn thành bởi BCDT [bcdt2001]. Hệ quả: $L(E,s)$ có thác triển giải tích --- điều kiện tiên quyết cho BSD.
Phân tích tài liệu kinh điển về hàm $L$
Hàm $L$ là chủ đề rộng, trải dài từ giải tích cơ bản đến tiền tuyến nghiên cứu. Dưới đây là phân tích các tài liệu chính:
Nhóm 1: Nền tảng --- Hàm zeta Riemann và hàm $L$ Dirichlet
- Edwards [edwards1974]: Riemann's Zeta Function. Trình bày theo bài báo gốc của Riemann 1859. Sách tốt nhất để hiểu sâu $\zeta(s)$.
- Titchmarsh [titchmarsh1986]: The Theory of the Riemann Zeta-Function (sửa bởi Heath-Brown). Tài liệu tham khảo chuẩn mực nhất.
- Apostol [apostol1976]: Introduction to Analytic Number Theory. Sách giáo khoa chuẩn cho undergraduate. Nên đọc đầu tiên.
- Serre [serre1973]: A Course in Arithmetic. 70 trang cô đọng tuyệt đẹp về hàm zeta, hàm $L$ Dirichlet, dạng modular.
- Davenport [davenport2000]: Multiplicative Number Theory. Tập trung vào hàm $L$ Dirichlet, vùng không zero.
Nhóm 2: Đường cong elliptic và hàm $L$
- Lozano-Robledo [lozano-robledo2011]: Elliptic Curves, Modular Forms, and their L-functions. Sách nhập môn tuyệt vời (dưới 200 trang). Nên đọc đầu tiên nếu quan tâm mối liên hệ EC--$L$.
- Silverman [silverman2009]: The Arithmetic of Elliptic Curves. Sách chuẩn mực số 1. Chương V xây dựng hàm $L(E,s)$ nghiêm ngặt.
- Silverman [silverman1994]: Advanced Topics. Nhân phức, hàm $L$ $p$-adic, chiều cao.
- Koblitz [koblitz1993]: Introduction to Elliptic Curves and Modular Forms. Tiếp cận qua bài toán số đồng dư.
- Knapp [knapp1992]: Elliptic Curves. Từ sơ cấp đến Eichler--Shimura.
Nhóm 3: Dạng modular và Định lý modularity
- Diamond--Shurman [diamond-shurman2005]: A First Course in Modular Forms. Sách chuẩn cho dạng modular.
- Shimura [shimura1971]: Introduction to the Arithmetic Theory of Automorphic Functions. Kinh điển.
- Cornell--Silverman--Stevens [cornell-silverman-stevens1997]: Modular Forms and Fermat's Last Theorem. Giải thích chứng minh Wiles.
Nhóm 4: Lý thuyết số giải tích nâng cao và hàm $L$ tự đẳng cấu
- Iwaniec--Kowalski [iwaniec-kowalski2004]: Analytic Number Theory. Cuốn toàn diện nhất (615 trang): “bách khoa toàn thư” lý thuyết số giải tích hiện đại.
- Bump [bump1997]: Automorphic Forms and Representations. Cầu nối cổ điển $\leftrightarrow$ biểu diễn tự đẳng cấu.
- Goldfeld--Hundley [goldfeld-hundley2011]: Automorphic Representations and $L$-Functions for $\mathrm{GL}(n)$ (2 tập). Framework adelic, tự chứa.
- Gelbart [gelbart1975]: Automorphic Forms on Adele Groups. Giới thiệu tiên phong chương trình Langlands.
Nhóm 5: Hàm $L$ $p$-adic và Iwasawa
- Koblitz [koblitz1984]: $p$-adic Numbers, $p$-adic Analysis, and Zeta-Functions. Nhập môn hàm zeta $p$-adic.
- Perrin-Riou [perrin-riou1995]: Fonctions $L$ $p$-adiques. Chuyên khảo nâng cao.
- Coates--Sujatha [coates-sujatha2006]: Cyclotomic Fields and Zeta Values.
Nhóm 6: Tài liệu gốc và survey
- Tate [tate1967]: Luận văn “Fourier Analysis in Number Fields” (1950). Một trong những luận văn có ảnh hưởng nhất thế kỷ 20.
- Gelbart [gelbart1984]: “An Elementary Introduction to the Langlands Program”. Bài tổng quan 42 trang cho non-specialist.
- Katz--Sarnak [katz-sarnak1999]: Random Matrices, Frobenius Eigenvalues, and Monodromy. Kết nối số luận $\leftrightarrow$ vật lý.
| Trình độ | Sách đề xuất |
|---|---|
| Nhập môn | Apostol → Lozano-Robledo → Koblitz |
| Trung cấp | Serre → Silverman (GTM 106) → Diamond--Shurman |
| Nâng cao | Iwaniec--Kowalski → Silverman (GTM 151) → Bump |
| Chuyên gia | Goldfeld--Hundley, Gelbart, Tate (thesis) |
Liên hệ với giả thuyết Birch--Dyer
- BSD yếu: $\mathrm{ord}_{s=1} L(E, s) = \mathrm{rk} E(\mathbb{Q})$.
- BSD mạnh: Hệ số dẫn đầu $L^{(r)}(E, 1)/r!$ (với $r = \mathrm{rk} E(\mathbb{Q})$) bằng:
\[ \frac{L^{(r)}(E, 1)}{r!} = \frac{\Omega_E \cdot \mathrm{Reg}_E \cdot \prod_p c_p \cdot |\mathrm{Sha}(E/\mathbb{Q})|}{|E(\mathbb{Q})_{\mathrm{tors}}|^2}. \]
- Dấu gốc: Nếu $w_E = -1$ thì $L(E,1) = 0$ $\Rightarrow$ BSD dự đoán $r \geq 1$ (có vô hạn điểm hữu tỉ). Nếu $w_E = +1$, $r$ phải chẵn.
- Trạng thái: BSD đã được chứng minh cho $r = 0$ (Kolyvagin, khi $L(E,1) \neq 0$) và $r = 1$ (Gross--Zagier + Kolyvagin, khi $\mathrm{ord}_{s=1} L(E,s) = 1$). Trường hợp $r \geq 2$ vẫn mở [kolyvagin1990, gross-zagier1986].
Định nghĩa hình thức
Bằng Định lý Hasse--Weil, hàm zeta cục bộ là hàm hữu tỉ [hasse1933]:
Ví dụ
Kiểm tra: Nghiệm $\alpha, \beta$ của $T^2 + 3T + 5 = 0$ (đổi $T \to 1/T$ cho $1 + 3T + 5T^2$) là $\alpha = (-3 + i\sqrt{11})/2$. Kiểm tra $|\alpha|^2 = (9 + 11)/4 = 5$, nên $|\alpha| = \sqrt{5}$. Đúng!
Đếm điểm trên $\mathbb{F}_{p^k}$: Dùng công thức $\#E(\mathbb{F}_{5^k}) = 5^k + 1 - \alpha^k - \beta^k$:
Ý nghĩa trực giác
- Hơn cả đếm điểm: Đếm điểm trên $\mathbb{F}_p$ chỉ cho một con số $\#E(\mathbb{F}_p)$. Nhưng hàm zeta cục bộ gộp thông tin từ mọi mở rộng $\mathbb{F}_{p^k}$ ($k = 1, 2, 3, \ldots$) vào một hàm duy nhất --- chứa nhiều thông tin hơn hẳn.
- Tính hữu tỉ: Dù $Z(\tilde{E}/\mathbb{F}_p, T)$ được xây dựng từ vô hạn dữ liệu ($\#E(\mathbb{F}_{p^k})$ cho mọi $k$), nó là hàm hữu tỉ --- chỉ cần biết một số $a_p$ là xác định hoàn toàn! Điều này vì Frobenius $\phi_p$ “điều khiển” mọi $\#E(\mathbb{F}_{p^k})$ thông qua đa thức đặc trưng bậc 2.
- Phỏng đoán Weil: Tính hữu tỉ, phương trình hàm, và “Giả thuyết Riemann cục bộ” ($|\alpha_p| = \sqrt{p}$) là ba phần của Phỏng đoán Weil (1949), được Deligne chứng minh 1974 cho đa tạp bất kỳ [deligne1974].
Liên hệ với giả thuyết Birch--Dyer
- Thừa số Euler = nghịch đảo tử số: Thừa số Euler của $L(E,s)$ tại $p$ (khử tốt) chính là nghịch đảo tử số $Z(\tilde{E}/\mathbb{F}_p, T)$ khi thay $T = p^{-s}$:
\[ L_p(E, s) = \frac{1}{1 - a_p p^{-s} + p^{1-2s}} = \frac{1}{P_1(p^{-s})}. \]Vậy hàm $L(E,s)$ toàn cục được xây dựng từ các hàm zeta cục bộ.
- Cận Hasse $\Rightarrow$ hội tụ: Cận $|a_p| \leq 2\sqrt{p}$ (tương đương $|\alpha_p| = \sqrt{p}$) đảm bảo tích Euler hội tụ khi $\mathrm{Re}(s) > 3/2$.
- Sato--Tate: Phân bố của $a_p / (2\sqrt{p})$ khi $p \to \infty$ tuân theo luật bán tròn (Sato--Tate, đã chứng minh 2011 cho đường cong không CM). Đây là “thống kê vĩ mô” của dữ liệu cục bộ [katz-sarnak1999].
Định nghĩa hình thức
Nếu $V$ liên thông, thác triển giải tích (nếu tồn tại) là duy nhất --- đây là nguyên lý đồng nhất giải tích (identity theorem) [serre1973].
Ý tưởng: Ta có công thức tính $f(s)$ chỉ “hoạt động” trong miền nhỏ $U$ (ví dụ: chuỗi chỉ hội tụ khi $\mathrm{Re}(s) > 3/2$). Thác triển giải tích tìm cách “kéo dài” $f$ ra ngoài $U$, sử dụng tính chất giải tích (chứ không phải tính trực tiếp từ chuỗi).
Ví dụ
- Chuỗi hình học: $f(z) = 1 + z + z^2 + \cdots$ hội tụ khi $|z| < 1$. Nhưng $g(z) = 1/(1-z)$ có nghĩa cho mọi $z \neq 1$, và $g|_{|z|<1} = f$. Vậy $g$ là thác triển giải tích của $f$.
- Hàm zeta Riemann: $\zeta(s) = \sum n^{-s}$ hội tụ khi $\mathrm{Re}(s) > 1$. Riemann (1859) chứng minh $\zeta$ thác triển thành hàm phân hình trên $\mathbb{C}$, với cực đơn duy nhất tại $s = 1$ [riemann1859]. Phương pháp: biến đổi Mellin $\Gamma(s)\zeta(s) = \int_0^{\infty} t^{s-1}/(e^t - 1)\, dt$.
- Hàm $L(E,s)$: Tích Euler hội tụ khi $\mathrm{Re}(s) > 3/2$. Nhờ Định lý modularity [wiles1995, bcdt2001], $L(E,s)$ trùng hàm $L$ của dạng modular $f_E$, mà hàm $L$ dạng modular thác triển nhờ biến đổi Mellin: $\Lambda(E,s) = N^{s/2} \int_0^{\infty} f_E(it)\, t^{s-1}\, dt$.
Ý nghĩa trực giác
- Tương tự đời thường: Bạn biết nhiệt độ ngoài trời từ 6h--12h. Nếu nhiệt độ biến đổi “trơn” (giải tích), bạn có thể dự đoán nhiệt độ lúc 15h --- dù chưa đo. Thác triển giải tích làm điều tương tự: từ giá trị hàm trong miền nhỏ, “dự đoán” giá trị ngoài miền.
- Tại sao duy nhất?: Hàm giải tích “cứng nhắc” hơn hàm liên tục rất nhiều. Biết $f$ trên bất kỳ miền mở nào (dù nhỏ) xác định $f$ trên toàn $\mathbb{C}$ (trừ các cực). Đây là sức mạnh cốt lõi của giải tích phức.
- Chuỗi $\neq$ hàm: Chuỗi $\sum n^{-s}$ và hàm $\zeta(s)$ khác nhau! Chuỗi chỉ là “cách tính” $\zeta$ trong miền $\mathrm{Re}(s) > 1$. Hàm $\zeta$ “sống” trên toàn $\mathbb{C}$ (trừ $s = 1$), với nhiều “cách tính” khác nhau ở các miền khác nhau.
Liên hệ với giả thuyết Birch--Dyer
- Không có thác triển, không có BSD: Giả thuyết BSD nói về $\mathrm{ord}_{s=1} L(E,s)$ --- bậc triệt tiêu tại $s = 1$. Nhưng tích Euler chỉ hội tụ khi $\mathrm{Re}(s) > 3/2$, nên $L(E,1)$ không có nghĩa nếu thiếu thác triển! Thác triển giải tích là điều kiện tiên quyết để phát biểu BSD.
- Lịch sử: Trước 1995, thác triển chỉ biết cho đường cong CM (Deuring, 1953). Định lý modularity (Wiles 1995, BCDT 2001) cho thác triển với mọi $E/\mathbb{Q}$ --- lần đầu tiên BSD có nghĩa cho mọi đường cong elliptic trên $\mathbb{Q}$ [wiles1995, bcdt2001].
- Hai con đường thác triển:
- CM: $L(E,s) = L(\psi, s) \cdot L(\bar{\psi}, s)$ phân tích thành tích hàm $L$ Hecke $\Rightarrow$ thác triển từ lý thuyết cổ điển [deuring1953].
- Modularity: $L(E,s) = L(f_E, s)$ trùng hàm $L$ dạng modular $\Rightarrow$ thác triển nhờ biến đổi Mellin [wiles1995].
- Phương trình hàm: Thác triển còn cho phương trình hàm $\Lambda(E, s) = w_E \Lambda(E, 2-s)$. Từ đó: nếu $w_E = -1$ thì $L(E,1) = 0$ bắt buộc, và BSD dự đoán hạng $r \geq 1$ [diamond-shurman2005].
Định nghĩa hình thức
Phương trình hàm thiết lập đối xứng qua $s = 1$: phép thay $s \to 2 - s$ biến $\Lambda(E, s)$ thành (cùng dấu hoặc đổi dấu) chính nó. Đường thẳng $\mathrm{Re}(s) = 1$ là “trục đối xứng”.
So sánh: Hàm zeta Riemann có đối xứng $\xi(s) = \xi(1 - s)$ qua $s = 1/2$. Hàm $L(E,s)$ có đối xứng qua $s = 1$ --- đúng nơi BSD khảo sát.
Ví dụ
- $w_E = -1$: $\Lambda(E,1) = -\Lambda(E,1) \implies \Lambda(E,1) = 0 \implies L(E,1) = 0$. Hàm $L$ bắt buộc triệt tiêu tại $s = 1$. BSD dự đoán hạng $r \geq 1$.
- $w_E = +1$: $L(E,1)$ có thể khác 0 hoặc bằng 0, nhưng bậc triệt tiêu phải là chẵn (do đối xứng $L(E, 1+t) \approx L(E, 1-t)$ buộc $c(s-1)^r$ có $r$ chẵn).
Các ví dụ cụ thể:
\renewcommand{\arraystretch}{1.2}
| Đường cong | $N$ | $w_E$ | Hệ quả |
|---|---|---|---|
| $y^2 + y = x^3 - x^2$ | 11 | $+1$ | $r$ chẵn; thực tế $r = 0$ |
| $y^2 + y = x^3 - x$ | 37 | $-1$ | $L(E,1) = 0$, $r \geq 1$; thực tế $r = 1$ |
| $y^2 = x^3 - 43x + 166$ | 5077 | $+1$ | $r$ chẵn; thực tế $r = 2$ |
Ý nghĩa trực giác
- Đối xứng = ràng buộc mạnh: Phương trình hàm liên hệ giá trị $L(E,s)$ ở “bên trái” ($s < 1$) với “bên phải” ($s > 1$). Biết hàm một bên $\Rightarrow$ biết hàm bên kia. Đây là ràng buộc cực kỳ mạnh --- “một nửa thông tin” xác định toàn bộ hàm.
- Dấu gốc = “tính chẵn lẻ”: Dấu $w_E = +1$ giống hàm chẵn ($f(x) = f(-x)$), $w_E = -1$ giống hàm lẻ ($f(x) = -f(-x)$). Hàm lẻ buộc $f(0) = 0$ --- tương tự, $w_E = -1$ buộc $L(E,1) = 0$.
- Nguồn gốc: Phương trình hàm đến từ Định lý modularity --- tính chất biến đổi $f_E(-1/(N\tau)) = w_E N \tau^2 f_E(\tau)$ của dạng modular trực tiếp suy ra đối xứng $s \leftrightarrow 2-s$ qua biến đổi Mellin.
Liên hệ với giả thuyết Birch--Dyer
- Phỏng đoán tính chẵn lẻ (Parity conjecture): $(-1)^{r} = w_E$, tức tính chẵn lẻ của hạng bằng dấu gốc. Đây là hệ quả yếu nhất của BSD, nhưng cũng chưa được chứng minh hoàn toàn (đã biết cho đường cong bán ổn định nhờ Dokchitser--Dokchitser 2010) [silverman2009].
- “Nửa” BSD: Dấu gốc $w_E = -1$ $\Rightarrow$ $L(E,1) = 0$ $\Rightarrow$ (theo BSD) $E(\mathbb{Q})$ vô hạn. Đây là “nửa” BSD: nó nói khi nào có vô hạn điểm hữu tỉ, nhưng chưa nói bao nhiêu (hạng chính xác).
- BSD mạnh: Phương trình hàm cho phép định nghĩa hệ số dẫn đầu $L^{(r)}(E,1)/r!$ --- chính số hạng mà BSD mạnh liên hệ với $\Omega_E \cdot \mathrm{Reg}_E \cdot \prod c_p \cdot |\mathrm{Sha}| / |E(\mathbb{Q})_{\mathrm{tors}}|^2$.
Định nghĩa hình thức
Áp dụng cho hàm $L$ Hasse--Weil: $\mathrm{ord}_{s=1} L(E,s)$ là bậc triệt tiêu của $L(E,s)$ tại điểm $s = 1$.
Nói đơn giản: bậc triệt tiêu đếm “$L(E,s)$ triệt tiêu bao nhiêu lần” tại $s = 1$. Bậc 0 nghĩa là $L(E,1) \neq 0$; bậc 1 nghĩa là $L(E,1) = 0$ nhưng đạo hàm $L'(E,1) \neq 0$; bậc $r$ nghĩa là $L(E,1) = L'(E,1) = \cdots = L^{(r-1)}(E,1) = 0$ nhưng $L^{(r)}(E,1) \neq 0$.
Ví dụ
- $E\colon y^2 + y = x^3 - x^2$ (conductor 11): $L(E, 1) = 0.2538\ldots \neq 0$. Vậy $\mathrm{ord}_{s=1} L(E,s) = 0$. Hạng đại số: $r = 0$. BSD đúng!
- $E\colon y^2 + y = x^3 - x$ (conductor 37): $L(E, 1) = 0$, $L'(E, 1) = 0.3059\ldots \neq 0$. Vậy $\mathrm{ord}_{s=1} L(E,s) = 1$. Hạng đại số: $r = 1$ (sinh bởi $P = (0,0)$). BSD đúng!
- $E\colon y^2 = x^3 - 43x + 166$ (conductor 5077): $L(E,1) = 0$, $L'(E,1) = 0$, $L''(E,1) \neq 0$. Vậy $\mathrm{ord}_{s=1} L(E,s) = 2$. Hạng đại số: $r = 2$. BSD đúng!
Lưu ý: Đường cong conductor 5077 là đường cong đầu tiên có hạng 2 được kiểm chứng BSD --- Cremona xác nhận cả hạng đại số và bậc triệt tiêu bằng máy tính [cremona1997].
Ý nghĩa trực giác
- Đồ thị: Hình dung đồ thị $y = L(E, s)$ gần $s = 1$. Nếu $r = 0$: đồ thị cắt $s = 1$ ở giá trị $\neq 0$ (không phẳng). Nếu $r = 1$: đồ thị “chạm” trục hoành (tiếp tuyến ngang). Nếu $r = 2$: đồ thị “ôm” trục hoành phẳng hơn nữa.
- Tương tự đa thức: $f(x) = (x-1)^r \cdot g(x)$ với $g(1) \neq 0$. Bậc $r$ cao hơn $\Leftrightarrow$ đường cong “phẳng” hơn tại $x = 1$. Tương tự, $L(E,s) \approx c(s-1)^r$ gần $s = 1$.
- Ý nghĩa BSD: Bậc triệt tiêu “đếm” số chiều của không gian nghiệm hữu tỉ. $r$ càng lớn $\Leftrightarrow$ $E(\mathbb{Q})$ càng “phong phú” --- hàm $L$ “biết” điều này qua mức độ phẳng tại $s = 1$.
Liên hệ với giả thuyết Birch--Dyer
- BSD yếu: $\mathrm{ord}_{s=1} L(E, s) = \mathrm{rk} E(\mathbb{Q})$. Đây là phát biểu cô đọng nhất của BSD --- bậc triệt tiêu (giải tích) bằng hạng (đại số).
- Trạng thái đã biết:
- $\mathrm{ord}_{s=1} L(E,s) = 0$ $\Rightarrow$ $\mathrm{rk} E(\mathbb{Q}) = 0$ (Kolyvagin [kolyvagin1990]).
- $\mathrm{ord}_{s=1} L(E,s) = 1$ $\Rightarrow$ $\mathrm{rk} E(\mathbb{Q}) = 1$ (Gross--Zagier + Kolyvagin [gross-zagier1986, kolyvagin1990]).
- $\mathrm{ord}_{s=1} L(E,s) \geq 2$: hoàn toàn mở! Ta thậm chí không biết cách chứng minh $\mathrm{rk} E(\mathbb{Q}) \geq 2$ từ $\mathrm{ord}_{s=1} L(E,s) \geq 2$.
• Chiều ngược ($\mathrm{rk} \to \mathrm{ord}$): Nếu $\mathrm{rk} E(\mathbb{Q}) = 0$ thì $\mathrm{ord}_{s=1} L(E,s) = 0$ (Skinner--Urban 2014, dưới một số điều kiện kỹ thuật). Chiều ngược cho hạng 1 cũng được biết nhờ Skinner (2020).
Định nghĩa hình thức
Để phân biệt: hạng đại số (algebraic rank) (hay hạng Mordell--Weil) $r = \mathrm{rk} E(\mathbb{Q})$ là số sinh tự do trong phân tích $E(\mathbb{Q}) \cong \mathbb{Z}^r \oplus E(\mathbb{Q})_{\mathrm{tors}}$. Giả thuyết BSD yếu nói rằng: $r_{\mathrm{an}} = r$.
Ví dụ
| Đường cong | $N$ | $r$ (đại số) | $r_{\mathrm{an}}$ (giải tích) | BSD? |
|---|---|---|---|---|
| $y^2 + y = x^3 - x^2$ | 11 | 0 | 0 | $\checkmark$ |
| $y^2 + y = x^3 - x$ | 37 | 1 | 1 | $\checkmark$ |
| $y^2 = x^3 - 43x + 166$ | 5077 | 2 | 2 | $\checkmark$ |
| $y^2 + y = x^3 - 7x + 6$ | 5077 | 3 | 3 | $\checkmark$ |
Trong mọi trường hợp đã kiểm chứng, $r = r_{\mathrm{an}}$. Cơ sở dữ liệu LMFDB chứa hơn 3 triệu đường cong, và không có phản ví dụ nào được tìm thấy [cremona1997].
Ý nghĩa trực giác
- Hạng đại số $r$: Đếm “số chiều” của không gian nghiệm hữu tỉ. Đây là đại lượng đại số/hình học --- cần tìm các điểm cụ thể trên đường cong.
- Hạng giải tích $r_{\mathrm{an}}$: Đo “mức độ phẳng” của hàm $L$ tại $s = 1$. Đây là đại lượng giải tích --- tính bằng chuỗi/tích phân, không cần biết điểm nào.
- BSD: Hai đại lượng từ hai thế giới hoàn toàn khác nhau (đại số vs giải tích) luôn bằng nhau! Đây là “phép màu” của BSD --- hay nói theo ngôn ngữ hiện đại, đây là biểu hiện của triết lý Langlands: đối tượng đại số $\leftrightarrow$ đối tượng giải tích.
Liên hệ với giả thuyết Birch--Dyer
- BSD yếu: $r_{\mathrm{an}}(E) = \mathrm{rk} E(\mathbb{Q})$. Nói cách khác, hạng giải tích xác định hạng đại số.
- Tính toán $r_{\mathrm{an}}$: Trong thực tế, tính $r_{\mathrm{an}}$ dễ hơn tính $r$! Hạng giải tích tính được bằng phương pháp số (chuỗi hội tụ nhanh, công thức Dokchitser), trong khi hạng đại số đòi hỏi tìm điểm hữu tỉ hoặc chặn nhóm Selmer.
- Hệ quả thực tiễn: Nếu BSD đúng, ta có thể “tính hạng bằng giải tích” --- tính $r_{\mathrm{an}}$ rồi kết luận $r = r_{\mathrm{an}}$. Đây là chiến lược Bhargava--Skinner--Zhang (2014) dùng để chứng minh $\geq 66.48\%$ đường cong elliptic có hạng 0 hoặc 1 [bhargava-skinner-zhang2014].
- Rào cản $r_{\mathrm{an}} \geq 2$: Phương pháp Gross--Zagier chỉ xây dựng 1 điểm Heegner (cho $r = 1$). Không có phương pháp nào tạo ra 2 điểm độc lập từ $r_{\mathrm{an}} = 2$ --- đây là rào cản lớn nhất hiện nay.
Định nghĩa hình thức
Nói cách khác: số điểm trên đường cong elliptic modulo $p$ luôn nằm trong khoảng $[p + 1 - 2\sqrt{p},\; p + 1 + 2\sqrt{p}]$, tức lệch khỏi “kỳ vọng” $p + 1$ không quá $2\sqrt{p}$.
Lịch sử: Phỏng đoán bởi Emil Artin (1924), chứng minh bởi Helmut Hasse (1933). Đây là trường hợp chiều 1 của Phỏng đoán Weil, sau này Deligne (1974) chứng minh cho đa tạp bất kỳ [deligne1974].
Ví dụ
| $p$ | $\#E(\mathbb{F}_p)$ | $a_p$ | $2\sqrt{p}$ | $|a_p| \leq 2\sqrt{p}$? |
|---|---|---|---|---|
| 2 | 3 | 0 | 2.83 | $\checkmark$ |
| 3 | 4 | 0 | 3.46 | $\checkmark$ |
| 5 | 9 | $-3$ | 4.47 | $\checkmark$ |
| 7 | 5 | 3 | 5.29 | $\checkmark$ |
| 11 | 8 | 4 | 6.63 | $\checkmark$ |
| 13 | 16 | $-2$ | 7.21 | $\checkmark$ |
Mọi $|a_p|$ đều $\leq 2\sqrt{p}$. Lưu ý $a_p$ có thể dương hoặc âm, và biên độ dao động tăng theo $\sqrt{p}$.
Ý nghĩa trực giác
- Kỳ vọng $\approx p + 1$: Trên $\mathbb{F}_p$ có $p$ giá trị $x$. Với mỗi $x$, phương trình $y^2 = f(x)$ có trung bình $\approx 1$ nghiệm (0 nghiệm hoặc 2 nghiệm, mỗi xác suất $\approx 1/2$). Tổng $\approx p$ điểm affine $+$ $\mathcal{O}$ $= p + 1$.
- Dao động $\leq 2\sqrt{p}$: Số điểm thực tế dao động quanh $p + 1$, nhưng sai số bị chặn bởi $2\sqrt{p}$. Đây là tương tự “$\sqrt{n}$-dao động” trong xác suất: lật $p$ đồng xu, kỳ vọng $p/2$ mặt ngửa, sai số $\sim \sqrt{p}$.
- “Giả thuyết Riemann cục bộ”: Cận $|a_p| \leq 2\sqrt{p}$ tương đương với “hai nghiệm $\alpha_p, \beta_p$ của $T^2 - a_p T + p = 0$ có $|\alpha_p| = |\beta_p| = \sqrt{p}$”. Đây chính là dạng “Giả thuyết Riemann” cho hàm zeta cục bộ --- nhưng đã được chứng minh!
Liên hệ với giả thuyết Birch--Dyer
- Sự hội tụ tích Euler: Cận $|a_p| \leq 2\sqrt{p}$ đảm bảo tích Euler $L(E,s) = \prod_p L_p(E,s)$ hội tụ tuyệt đối khi $\mathrm{Re}(s) > 3/2$. Không có cận Hasse, ta không biết tích Euler xác định hàm giải tích hay không!
- Phân bố $a_p$ và BSD: Giá trị trung bình $a_p \approx 0$ (theo Sato--Tate) giải thích tại sao $\Pi_E(X) = \prod_{p \leq X} (p+1-a_p)/p$ tăng chậm (logarithmic) --- dẫn đến quan sát $\Pi_E(X) \sim C (\log X)^r$ của Birch--Swinnerton-Dyer.
- Thuật toán: Tính $a_p$ cho $p$ nhỏ bằng liệt kê ($O(p)$), cho $p$ lớn bằng thuật toán Schoof ($O(\log^5 p)$). Cận Hasse giúp kiểm tra tính đúng đắn: nếu $|a_p| > 2\sqrt{p}$, có lỗi tính toán [silverman2009].
Định nghĩa hình thức
- $\alpha_p + \beta_p = a_p$ \quad (vết Frobenius),
- $\alpha_p \cdot \beta_p = p$ \quad (bậc Frobenius),
- $|\alpha_p| = |\beta_p| = \sqrt{p}$ \quad (cận Hasse).
Frobenius $\phi_p$ thỏa mãn “phương trình Hamilton--Cayley” trong vành tự đồng cấu $\mathrm{End}(\tilde{E})$:
Ví dụ
- $p = 5$: $\#E(\mathbb{F}_5) = 9$, $a_5 = -3$. Đa thức: $T^2 + 3T + 5$. Nghiệm: $\alpha = (-3 + i\sqrt{11})/2$, $\beta = (-3 - i\sqrt{11})/2$. Kiểm tra: $\alpha \beta = (9 + 11)/4 = 5 = p$. $\checkmark$
- $p = 7$: $\#E(\mathbb{F}_7) = 5$, $a_7 = 3$. Đa thức: $T^2 - 3T + 7$. Biệt thức: $9 - 28 = -19 < 0$ $\Rightarrow$ hai nghiệm phức liên hợp. $|\alpha| = \sqrt{7}$.
- $p = 2$: $\#E(\mathbb{F}_2) = 3$, $a_2 = 0$. Đa thức: $T^2 + 2$. Nghiệm: $\alpha = i\sqrt{2}$, $\beta = -i\sqrt{2}$. Đường cong “siêu kỳ dị” tại $p = 2$ (vì $a_2 = 0$ và $p = 2$).
Ý nghĩa trực giác
- Ma trận $2 \times 2$: Frobenius $\phi_p$ tác động trên module Tate $T_\ell(E) \cong \mathbb{Z}_\ell^2$ như một ma trận $2 \times 2$, với vết $= a_p$ và định thức $= p$. Đa thức $T^2 - a_p T + p$ chính là đa thức đặc trưng của ma trận này --- giống hoàn toàn đại số tuyến tính cơ bản!
- Một số $a_p$ xác định tất cả: Biết $a_p$ (tức biết $\#E(\mathbb{F}_p)$) $\Rightarrow$ biết đa thức đặc trưng $\Rightarrow$ biết $\alpha_p, \beta_p$ $\Rightarrow$ biết $\#E(\mathbb{F}_{p^k})$ cho mọi $k$ (qua $\#E(\mathbb{F}_{p^k}) = p^k + 1 - \alpha_p^k - \beta_p^k$). Đây là sức mạnh tổng hợp: đếm điểm trên $\mathbb{F}_p$ “biết” mọi mở rộng!
- Giá trị riêng = “tần số”: Nghĩ $\alpha_p, \beta_p$ là “tần số dao động” của đường cong tại $p$. Cận Hasse $|\alpha_p| = \sqrt{p}$ nói dao động đều đặn --- tương tự Giả thuyết Riemann cho “tần số” của $\zeta(s)$.
Liên hệ với giả thuyết Birch--Dyer
- Thừa số Euler: Thừa số Euler tại $p$ (khử tốt) là:
\[ L_p(E, s) = \frac{1}{P_p(p^{-s})} = \frac{1}{(1 - \alpha_p p^{-s})(1 - \beta_p p^{-s})}. \]Vậy đa thức đặc trưng Frobenius trực tiếp xác định thừa số Euler, từ đó xác định $L(E,s)$.
- Biểu diễn Galois: Hệ số $a_p$ là vết (trace) của ma trận Frobenius trong biểu diễn $\rho_{E,\ell}\colon \mathrm{Gal}(\bar{\mathbb{Q}}/\mathbb{Q}) \to \mathrm{GL}_2(\mathbb{Z}_\ell)$. Đường cong $E$ được “mã hóa” hoàn toàn bởi dãy $\{a_p\}$ --- và Định lý modularity nói rằng dãy này cũng là hệ số Fourier của một dạng modular [wiles1995].
- Phân bố Sato--Tate: Góc $\theta_p$ xác định bởi $a_p = 2\sqrt{p}\cos\theta_p$ có phân bố $\frac{2}{\pi}\sin^2\theta$ (bán tròn) khi $p \to \infty$ --- đây là “luật lớn” cho dữ liệu cục bộ xây dựng hàm $L$ [katz-sarnak1999].
Định nghĩa hình thức
- Mở rộng giai thừa: $\Gamma(n) = (n-1)!$ cho $n \in \mathbb{Z}_{> 0}$.
- Phương trình hàm: $\Gamma(s+1) = s \cdot \Gamma(s)$.
- Thác triển: $\Gamma(s)$ thác triển thành hàm phân hình trên $\mathbb{C}$, với cực đơn tại $s = 0, -1, -2, \ldots$
- Công thức phản xạ: $\Gamma(s)\Gamma(1-s) = \pi / \sin(\pi s)$.
- Giá trị đặc biệt: $\Gamma(1/2) = \sqrt{\pi}$, $\Gamma(1) = 1$.
Ví dụ
- Hàm zeta Riemann: Hàm hoàn chỉnh $\xi(s) = \frac{1}{2}s(s-1)\pi^{-s/2}\Gamma(s/2)\zeta(s)$ thỏa $\xi(s) = \xi(1-s)$. Thừa số $\Gamma(s/2)$ “cân bằng” sự tăng trưởng của $\zeta(s)$.
- Hàm $L(E,s)$: Hàm hoàn chỉnh $\Lambda(E,s) = N^{s/2}(2\pi)^{-s}\Gamma(s) L(E,s)$ thỏa $\Lambda(E,s) = w_E \Lambda(E, 2-s)$. Ở đây $\Gamma(s)$ (không phải $\Gamma(s/2)$) vì $L(E,s)$ tương ứng dạng modular trọng số 2 (trọng số $k$ cho thừa số $\Gamma(s)$ khi $k = 2$).
- Giá trị cụ thể: Tại $s = 1$: $\Gamma(1) = 1$, nên $\Lambda(E,1) = \sqrt{N}/(2\pi) \cdot L(E,1)$. Thừa số Gamma không ảnh hưởng đến bậc triệt tiêu tại $s = 1$ (vì $\Gamma(1) \neq 0$).
Ý nghĩa trực giác
- Giai thừa liên tục: Hàm Gamma nội suy $n!$ cho các giá trị phức bất kỳ. Nó xuất hiện tự nhiên khi chuyển đổi giữa “chuỗi” và “tích phân” (biến đổi Mellin: $n^{-s} = \Gamma(s)^{-1} \int_0^{\infty} t^{s-1} e^{-nt}\, dt$).
- Thừa số “tại vô cực”: Trong lý thuyết số, số nguyên tố “thật” ($p = 2, 3, 5, \ldots$) cho thừa số Euler $L_p$. Thừa số $\Gamma$ đóng vai trò “thừa số tại $p = \infty$” --- tương ứng completion Archimedean của $\mathbb{Q}$ (tức $\mathbb{R}$). Hàm $L$ hoàn chỉnh $\Lambda = \prod_p L_p \cdot L_\infty$ gộp tất cả thừa số, bao gồm cả “vô cực”.
- Tại sao cần Gamma?: Phương trình hàm $\Lambda(E,s) = w_E \Lambda(E, 2-s)$ chỉ đúng khi bao gồm thừa số $\Gamma(s)$. Không có Gamma, hàm $L(E,s)$ vẫn thác triển nhưng không có phương trình hàm đẹp.
Liên hệ với giả thuyết Birch--Dyer
- Không ảnh hưởng bậc triệt tiêu: Vì $\Gamma(1) = 1 \neq 0$, thừa số Gamma không thay đổi bậc triệt tiêu tại $s = 1$: $\mathrm{ord}_{s=1} L(E,s) = \mathrm{ord}_{s=1} \Lambda(E,s)$. Vậy BSD yếu ($\mathrm{ord}_{s=1} L(E,s) = r$) không phụ thuộc vào Gamma.
- BSD mạnh: Tuy nhiên, giá trị $L^{(r)}(E,1)/r!$ (hệ số dẫn đầu) bị ảnh hưởng bởi cách chuẩn hóa. Công thức BSD mạnh sử dụng $L(E,s)$ (không có Gamma), nhưng thừa số $\Omega_E = \int_{E(\mathbb{R})} |\omega|$ (chu kỳ thực) bù lại --- cả hai “thừa số vô cực” triệt tiêu nhau [silverman2009].
- Biến đổi Mellin: Đẳng thức $L(E,s) = (2\pi)^s \Gamma(s)^{-1} \int_0^{\infty} f_E(it)\, t^{s-1}\, dt$ cho thấy Gamma là “cầu nối” giữa dạng modular $f_E$ và chuỗi Dirichlet $L(E,s)$.
Định nghĩa hình thức
Ý nghĩa: Xác suất một số nguyên $n$ lớn là số nguyên tố $\approx 1/\log n$. Số nguyên tố “thưa dần” nhưng không bao giờ hết --- và tốc độ thưa chính xác là $1/\log n$.
Lịch sử: Phỏng đoán bởi Gauss (khoảng 1793, khi 15 tuổi!) và Legendre. Chứng minh độc lập bởi Hadamard và de la Vallée-Poussin (1896), sử dụng tính chất giải tích của hàm zeta Riemann --- cụ thể: $\zeta(s) \neq 0$ trên đường $\mathrm{Re}(s) = 1$.
Ví dụ
| $x$ | $\pi(x)$ | $x/\log x$ | Sai số tương đối |
|---|---|---|---|
| $10^3$ | 168 | 145 | $-13.7\%$ |
| $10^6$ | 78,498 | 72,382 | $-7.8\%$ |
| $10^9$ | 50,847,534 | 48,254,942 | $-5.1\%$ |
| $10^{12}$ | 37,607,912,018 | 36,191,206,825 | $-3.8\%$ |
Xấp xỉ $x/\log x$ ngày càng tốt khi $x$ tăng. Hàm $\mathrm{Li}(x)$ cho xấp xỉ tốt hơn nhiều (sai số $< 0.01\%$ với $x = 10^{12}$).
Ý nghĩa trực giác
- Phương pháp giải tích: Chứng minh Định lý SNT không dùng kỹ thuật sàng hay tổ hợp --- mà dùng giải tích phức! Tính chất $\zeta(s) \neq 0$ trên $\mathrm{Re}(s) = 1$ trực tiếp suy ra phân bố tiệm cận $\pi(x) \sim x/\log x$. Đây là thắng lợi vĩ đại đầu tiên của “phương pháp giải tích trong lý thuyết số”.
- Triết lý BSD: Cùng triết lý --- dùng hàm $L$ (giải tích) để “đọc” thông tin số học. Định lý SNT nói: hành vi của $\zeta(s)$ gần $s = 1$ xác định phân bố số nguyên tố. BSD nói: hành vi của $L(E,s)$ tại $s = 1$ xác định hạng.
- “Nghiệm $\zeta$ = tần số dao động $\pi(x)$”: Công thức Riemann biểu diễn $\pi(x)$ như tổng sóng, mỗi sóng ứng nghiệm $\rho$ của $\zeta$. Tương tự, hệ số dẫn đầu $L^{(r)}(E,1)/r!$ trong BSD mạnh “mã hóa” các bất biến số học.
Liên hệ với giả thuyết Birch--Dyer
- Triết lý chung: Cả Định lý SNT và BSD đều thuộc “chương trình giải tích lý thuyết số”: dùng hàm $L$ để trích xuất thông tin số học. Cực của $\zeta(s)$ tại $s = 1$ cho phân bố số nguyên tố; bậc triệt tiêu của $L(E,s)$ tại $s = 1$ cho hạng.
- Cận Hasse → Tích Euler hội tụ: Chứng minh Định lý SNT cần $\zeta(1+it) \neq 0$. Tương tự, chứng minh BSD (phần $r = 0$) cần $L(E, 1) \neq 0$ kết hợp Kolyvagin.
- Mở rộng: Thay $\zeta(s)$ bằng $L(E,s)$, “số nguyên tố” bằng “điểm hữu tỉ trên $E$”: Định lý SNT tổng quát hóa thành giả thuyết BSD.
Định nghĩa hình thức
Khi $K = \mathbb{Q}$: $\mathcal{O}_K = \mathbb{Z}$, ideal $= (n)$, $N((n)) = |n|$, và $\zeta_\mathbb{Q}(s) = \zeta(s)$ là hàm zeta Riemann. Vậy $\zeta_K(s)$ tổng quát hóa $\zeta(s)$ cho trường số bất kỳ.
$\zeta_K(s)$ có thác triển phân hình trên $\mathbb{C}$ với cực đơn duy nhất tại $s = 1$. Thặng dư tại $s = 1$ cho bởi công thức lớp số giải tích (analytic class number formula):
Ví dụ
- $p = 2$: $(1+i)^2 = (2)$ --- phân nhánh (ramified). Thừa số: $(1 - 2^{-s})^{-1}$.
- $p \equiv 1 \pmod{4}$: $p = \mathfrak{p}\bar{\mathfrak{p}}$ --- tách (split). Thừa số: $(1 - p^{-s})^{-2}$.
- $p \equiv 3 \pmod{4}$: $(p)$ nguyên tố --- trơ (inert). Thừa số: $(1 - p^{-2s})^{-1}$.
Ý nghĩa trực giác
- Tích Euler = phân rã ideal: Mỗi thừa số Euler mã hóa cách số nguyên tố $p$ phân rã trong $\mathcal{O}_K$ (tách, trơ, hoặc phân nhánh). Đây là tương tự hoàn hảo với $\zeta(s) = \prod_p (1-p^{-s})^{-1}$.
- Công thức lớp số = “BSD cho trường số”: Thặng dư tại $s = 1$ mã hóa bất biến số học ($h_K, R_K, w_K, d_K$). Đây là tiền thân trực tiếp của công thức BSD mạnh: cả hai đều liên hệ giá trị đặc biệt hàm $L$ với bất biến đại số.
- Tổng quát hóa: $\zeta(s)$ cho $\mathbb{Z}$, $\zeta_K(s)$ cho $\mathcal{O}_K$, $L(E,s)$ cho đường cong elliptic --- cùng một triết lý, đối tượng khác nhau.
Liên hệ với giả thuyết Birch--Dyer
- Tiền thân của BSD: Công thức lớp số giải tích (Dirichlet, 1839) là “BSD cho trường số” --- đã được chứng minh từ thế kỷ 19! BSD là nỗ lực tổng quát hóa công thức này cho đường cong elliptic.
- Đường cong CM: Khi $E$ có nhân phức bởi $\mathcal{O}_K$, $L(E,s)$ phân tích thành tích hàm $L$ Hecke trên $K$, liên hệ trực tiếp với $\zeta_K(s)$ [deuring1953].
So sánh cấu trúc:
| Trường số $K$ | Đường cong $E$ | |
|---|---|---|
| Hàm $L$ | $\zeta_K(s)$ | $L(E, s)$ |
| Bậc triệt tiêu | $\mathrm{ord}_{s=1} = 1$ (cực đơn) | $\mathrm{ord}_{s=1} = r$ |
| Regulator | $R_K$ | $\mathrm{Reg}_E$ |
| “Sha” | $h_K$ (số lớp) | $|\mathrm{Sha}(E/\mathbb{Q})|$ |
| Xoắn | $w_K$ | $|E(\mathbb{Q})_{\mathrm{tors}}|$ |
Định nghĩa hình thức
Nói đơn giản: $L_p(E, s)$ là phiên bản “$p$-adic” của $L(E,s)$ phức. Nó sống trên thế giới $p$-adic (thay vì thế giới phức), nhưng “nội suy” giá trị đặc biệt của $L(E,s)$ phức tại các twist bởi đặc trưng.
Xây dựng: Kubota--Leopoldt (cho $\zeta$), Mazur--Swinnerton-Dyer (cho $E$ ordinary, 1974), Amice--Vélu, Višik (cho $E$ supersingular).
Ví dụ
- $a_5 = 2$ (từ bảng $a_p$), nên $p \nmid a_5$: khử tốt thường.
- Đa thức $T^2 - 2T + 5 = 0$. Nghiệm: $\alpha = 1 + 2i$, $\beta = 1 - 2i$. Trong $\mathbb{Q}_5$: chọn $\alpha_5$ sao cho $|\alpha_5|_5 = 1$.
- Thừa số Euler $p$-adic: $(1 - 1/\alpha_5)^2$.
- $L_5(E, 1) = (1 - 1/\alpha_5)^2 \cdot L(E,1)/\Omega_E^+$.
Hiện tượng “zero ngoại lệ”: Nếu $E$ có khử nhân tính tách tại $p$ (ví dụ $E\colon y^2 + y = x^3 - x^2$ tại $p = 11$), thì $\alpha_p = 1$, nên $(1 - 1/\alpha_p) = 0$: $L_p(E, 1) = 0$ ngay cả khi $L(E,1) \neq 0$! Đây là “zero ngoại lệ” của Mazur--Tate--Teitelbaum [mazur-tate-teitelbaum1986].
Ý nghĩa trực giác
- Hai thế giới song song: Mọi lý thuyết giải tích phức đều có phiên bản $p$-adic. Hàm $L$ phức sống trên $\mathbb{C}$; hàm $L$ $p$-adic sống trên $\mathbb{Q}_p$. Cả hai mã hóa thông tin số học, nhưng bằng “ngôn ngữ” khác nhau.
- Nội suy: Hàm $L$ $p$-adic không phải “thác triển $p$-adic” của $L(E,s)$. Nó được xây dựng bằng cách nội suy các giá trị đặc biệt $L(E, \chi, 1)/\Omega$ khi $\chi$ chạy qua các đặc trưng $p$-lũy thừa.
- Ưu thế: Phương pháp $p$-adic đôi khi dễ kiểm soát hơn phương pháp phức (vì $\mathbb{Q}_p$ có cấu trúc đại số phong phú hơn $\mathbb{C}$). Nhiều kết quả về BSD đã được chứng minh trước trong thế giới $p$-adic.
Liên hệ với giả thuyết Birch--Dyer
- BSD $p$-adic: $\mathrm{ord}_{s=1} L_p(E, s) = r(E/\mathbb{Q})$ [mazur-tate-teitelbaum1986]. Đây là phiên bản $p$-adic của BSD, cùng dự đoán nhưng trong thế giới $p$-adic.
- Phỏng đoán chính Iwasawa (IMC): Liên hệ $L_p(E,s)$ với nhóm Selmer $p$-adic. IMC đã được chứng minh cho nhiều trường hợp bởi Kato (một chiều) và Skinner--Urban (chiều ngược) --- đây là tiến bộ lớn nhất hướng tới BSD.
- Kết quả đã biết: Nếu $L(E,1) \neq 0$ và $p$ là số nguyên tố tốt, thì $\mathrm{rk} E(\mathbb{Q}) = 0$ và $|\mathrm{Sha}(E/\mathbb{Q})[p^\infty]| < \infty$. Chứng minh đi qua hàm $L$ $p$-adic và IMC (Kato, Skinner--Urban).
- Zero ngoại lệ: Khi xảy ra, cần sửa công thức BSD $p$-adic bằng thừa số $\mathcal{L}$-bất biến (Mazur--Tate--Teitelbaum conjecture, Greenberg--Stevens 1993 chứng minh cho trường hợp ordinary).
Định nghĩa hình thức
Quy tắc tính dấu gốc cục bộ (trường hợp đơn giản):
- Khử nhân tính tách tại $p$: $w_p = -1$.
- Khử nhân tính không tách tại $p$: $w_p = +1$.
- Khử cộng tính: $w_p$ phụ thuộc chi tiết vào đường cong (cần thuật toán Tate).
Ví dụ
Ví dụ (Dấu gốc và tính chẵn lẻ của hạng).
| Đường cong | $N$ | $w_E$ | $r$ | $(-1)^r$ | Khớp? |
|---|---|---|---|---|---|
| $y^2 + y = x^3 - x^2$ | 11 | $+1$ | 0 | $+1$ | $\checkmark$ |
| $y^2 + y = x^3 - x$ | 37 | $-1$ | 1 | $-1$ | $\checkmark$ |
| $y^2 = x^3 - 43x + 166$ | 5077 | $+1$ | 2 | $+1$ | $\checkmark$ |
| $y^2 + y = x^3 - 7x + 6$ | 5077 | $-1$ | 3 | $-1$ | $\checkmark$ |
| $y^2 = x^3 - x$ | 32 | $-1$ | 0 | $+1$ | $\times$?? |
Chú ý: Đường cong $y^2 = x^3 - x$ thực ra có $w_E = +1$ (không phải $-1$), và $r = 0$ phù hợp. Dấu gốc luôn nhất quán với tính chẵn lẻ của hạng trong mọi trường hợp đã kiểm chứng.
Ý nghĩa trực giác
- Tính từ dữ liệu cục bộ: Dấu gốc tính được hoàn toàn từ conductor $N$ và loại khử tại mỗi $p \mid N$ --- không cần biết hạng $r$ hay bất kỳ điểm hữu tỉ nào. Đây là thông tin “miễn phí”.
- Hệ quả bắt buộc: Nếu $w_E = -1$, phương trình hàm buộc $L(E,1) = 0$. Theo BSD, $r \geq 1$ --- đường cong phải có vô hạn điểm hữu tỉ. Vậy trước khi tìm kiếm điểm, ta biết tìm kiếm sẽ thành công!
- Khoảng 50/50: Trong “trung bình” (theo thống kê trên cơ sở dữ liệu lớn), khoảng 50% đường cong có $w_E = +1$ và 50% có $w_E = -1$. Kết hợp BSD yếu: khoảng 50% có $r$ chẵn, 50% có $r$ lẻ.
Liên hệ với giả thuyết Birch--Dyer
- Phỏng đoán tính chẵn lẻ (Parity Conjecture): $(-1)^{r(E/\mathbb{Q})} = w_E$. Đây là hệ quả yếu nhất của BSD yếu, nhưng cũng chưa chứng minh hoàn toàn. Dokchitser--Dokchitser (2010) chứng minh cho đường cong bán ổn định [dokchitser2010].
- $w_E = -1 \Rightarrow r \geq 1$: Kết hợp phương trình hàm ($L(E,1) = 0$) với Kolyvagin ($L(E,1) = 0$ và $L'(E,1) \neq 0 \Rightarrow r = 1$): nếu thêm $L'(E,1) \neq 0$, ta được $r = 1$ chính xác. Đây là cách chứng minh BSD cho $r = 1$.
- BSD mạnh: Dấu gốc $w_E$ cũng xuất hiện trong phương trình hàm $\Lambda(E,s) = w_E \Lambda(E, 2-s)$, ảnh hưởng đến cách tính hệ số dẫn đầu $L^{(r)}(E,1)/r!$.
- Bhargava--Shankar: 50% đường cong có $w_E = +1$. Trong số này, Bhargava--Shankar chứng minh phần lớn có $r = 0$ (thông qua chặn nhóm Selmer). Kết hợp: $\geq 66.48\%$ đường cong thỏa BSD [bhargava-skinner-zhang2014].
Định nghĩa hình thức
Lịch sử: Phỏng đoán bởi Mikio Sato (qua thư từ, không công bố chính thức) và John Tate (1963) dựa trên dữ liệu thực nghiệm. Chứng minh bởi Barnet-Lamb, Geraghty, Harris, Taylor (2008--2011) cho đường cong non-CM trên trường hoàn toàn thực [taylor2008].
Trường hợp CM: Nếu $E$ có nhân phức, phân bố khác hẳn! Khoảng 50% các $p$ có $a_p = 0$ (ứng với $\theta_p = \pi/2$), và phần còn lại phân bố đều trên $[0, \pi]$.
Ví dụ
Mật độ $\mu(\theta) = \frac{2}{\pi}\sin^2\theta$ có:
- Cực đại tại $\theta = \pi/2$ ($a_p \approx 0$): hầu hết $a_p$ gần 0.
- Triệt tiêu tại $\theta = 0$ và $\pi$ ($a_p \approx \pm 2\sqrt{p}$): rất hiếm $a_p$ gần biên Hasse.
- Đối xứng: $\mu(\pi - \theta) = \mu(\theta)$, phản ánh $a_p$ phân bố đối xứng quanh 0.
So sánh: đường cong CM $y^2 = x^3 - x$ cho histogram hoàn toàn khác --- “nhọn” tại $\theta = \pi/2$ (do $a_p = 0$ cho mọi $p \equiv 3 \pmod 4$).
Ý nghĩa trực giác
- “Đồng xu thiên lệch”: Mỗi $a_p$ riêng lẻ trông “ngẫu nhiên”. Nhưng khi $p$ chạy, chúng tuân theo quy luật thống kê chính xác --- mật độ bán tròn $\frac{2}{\pi}\sin^2\theta$. Đây tương tự Định lý giới hạn trung tâm: mỗi kết quả riêng lẻ ngẫu nhiên, nhưng tổng thể tuân theo phân bố Gauss.
- Nhóm $\mathrm{SU}(2)$: Phân bố $\frac{2}{\pi}\sin^2\theta$ chính là phân bố Haar (đo tự nhiên) trên nhóm unitary đặc biệt $\mathrm{SU}(2)$, chiếu lên góc riêng. Ma trận Frobenius (chuẩn hóa) $\begin{pmatrix} e^{i\theta_p} & 0 \\ 0 & e^{-i\theta_p} \end{pmatrix}$ phân bố “đều” trên $\mathrm{SU}(2)$ --- nhóm đối xứng ẩn đằng sau!
- Chứng minh cực khó: Chứng minh Sato--Tate đòi hỏi “nâng” modularity lên $\mathrm{GL}_2$ trên trường hoàn toàn thực --- một thành tựu kỹ thuật phi thường của Taylor et al.
Liên hệ với giả thuyết Birch--Dyer
- Thống kê cục bộ: Sato--Tate cho “luật lớn” cho dữ liệu $a_p$ --- chính dữ liệu xây dựng hàm $L(E,s)$ và tích hữu hạn $\Pi_E(X)$. Phân bố $a_p$ ảnh hưởng đến tốc độ hội tụ tích Euler.
- Liên hệ gián tiếp: Sato--Tate không trực tiếp chứng minh BSD, nhưng nó xác nhận “dữ liệu đầu vào” ($a_p$) cho hàm $L$ có cấu trúc hợp lý. Nó cũng là hệ quả của Langlands (cùng chương trình lớn chứa BSD).
- Moments: Các moment $\sum_{p \leq X} a_p^k / p^{k/2}$ tính được từ phân bố Sato--Tate, cho thông tin về hàm $L$ đối xứng $\mathrm{Sym}^k L(E,s)$ --- đối tượng nghiên cứu tích cực trong chương trình Langlands [katz-sarnak1999].
Định nghĩa hình thức
Nhờ cận Hasse, $\cos\theta_p = a_p/(2\sqrt{p}) \in [-1, 1]$, nên $\theta_p$ luôn xác định. Giá trị $\theta_p$ mã hóa “lệch” của $\#E(\mathbb{F}_p)$ so với kỳ vọng $p+1$:
- $\theta_p = \pi/2$ ($a_p = 0$): đúng kỳ vọng, $\#E(\mathbb{F}_p) = p + 1$.
- $\theta_p \approx 0$ ($a_p \approx 2\sqrt{p}$): ít điểm hơn kỳ vọng.
- $\theta_p \approx \pi$ ($a_p \approx -2\sqrt{p}$): nhiều điểm hơn kỳ vọng.
Ví dụ
| $p$ | $a_p$ | $2\sqrt{p}$ | $\cos\theta_p = \frac{a_p}{2\sqrt{p}}$ | $\theta_p$ |
|---|---|---|---|---|
| 2 | 0 | 2.83 | 0 | $\pi/2 = 1.571$ |
| 3 | 0 | 3.46 | 0 | $\pi/2 = 1.571$ |
| 5 | $-3$ | 4.47 | $-0.671$ | $2.307$ |
| 7 | 3 | 5.29 | $0.567$ | $0.970$ |
| 11 | 4 | 6.63 | $0.603$ | $0.923$ |
| 13 | $-2$ | 7.21 | $-0.277$ | $1.852$ |
Giá trị $\theta_p$ “nhảy” thất thường --- nhưng phân bố thống kê tuân theo mật độ bán tròn $\frac{2}{\pi}\sin^2\theta$ (Sato--Tate).
Ý nghĩa trực giác
- Giá trị riêng trên đường tròn: Hai nghiệm $\alpha_p = \sqrt{p}\, e^{i\theta_p}$, $\beta_p = \sqrt{p}\, e^{-i\theta_p}$ nằm trên đường tròn bán kính $\sqrt{p}$. Góc $\theta_p$ xác định vị trí trên đường tròn --- “pha” của Frobenius.
- Ma trận unitary: Chuẩn hóa bỏ $\sqrt{p}$: $\tilde{\alpha}_p = e^{i\theta_p}$, $\tilde{\beta}_p = e^{-i\theta_p}$. Ma trận Frobenius chuẩn hóa $\begin{pmatrix} e^{i\theta_p} & 0 \\ 0 & e^{-i\theta_p} \end{pmatrix} \in \mathrm{SU}(2)$. Phỏng đoán Sato--Tate nói ma trận này phân bố “đều” trên $\mathrm{SU}(2)$.
- Thừa số Euler: $L_p(E, s) = (1 - \alpha_p p^{-s})^{-1}(1 - \beta_p p^{-s})^{-1}$. Thay $\alpha_p = \sqrt{p}\, e^{i\theta_p}$:
\[ L_p(E, s) = \frac{1}{1 - 2\cos\theta_p \cdot p^{1/2-s} + p^{1-2s}}. \]Vậy $\theta_p$ trực tiếp xác định thừa số Euler, từ đó xác định $L(E,s)$.
Liên hệ với giả thuyết Birch--Dyer
- Dữ liệu đầu vào: Dãy $\{\theta_p\}_{p \text{ nguyên tố}}$ xác định hoàn toàn hàm $L(E,s)$ (qua tích Euler). BSD nói rằng hành vi “tổng hợp” của dãy này (cụ thể: bậc triệt tiêu tại $s = 1$) bằng hạng.
- “Trung bình” $\theta_p$ và tích hữu hạn: $\log \Pi_E(X) = \sum_{p \leq X} \log(1 - a_p/p + 1/p)$. Vì $a_p = 2\sqrt{p}\cos\theta_p$, số hạng chính $\approx -2\cos\theta_p / \sqrt{p}$. Phân bố Sato--Tate cho $\langle \cos\theta_p \rangle \approx 0$, giải thích tại sao $\Pi_E(X)$ tăng chậm (logarithmic).
- Hàm $L$ đối xứng: Các moment $\cos^k\theta_p$ liên quan đến hàm $L$ lũy thừa đối xứng $L(\mathrm{Sym}^k E, s)$. Tính chất giải tích của các hàm này (thác triển, phương trình hàm) nằm trong chương trình Langlands --- framework rộng hơn chứa BSD [katz-sarnak1999].
Định nghĩa
- Unitary: $U^* U = I$ (trong đó $U^* = \overline{U}^T$ là chuyển vị liên hợp).
- Định thức 1: $\det U = 1$.
Ví dụ
- Ma trận đơn vị: $I = \begin{pmatrix} 1 & 0 \\ 0 & 1 \end{pmatrix}$ (lấy $\alpha = 1$, $\beta = 0$).
- Ma trận Pauli: Ba ma trận Pauli (nhân với $i$) cho ba phần tử đặc biệt:
\[ i\sigma_1 = \begin{pmatrix} 0 & i \\ i & 0 \end{pmatrix}, \quad i\sigma_2 = \begin{pmatrix} 0 & 1 \\ -1 & 0 \end{pmatrix}, \quad i\sigma_3 = \begin{pmatrix} i & 0 \\ 0 & -i \end{pmatrix}. \]
- Ma trận chéo: $\begin{pmatrix} e^{i\theta} & 0 \\ 0 & e^{-i\theta} \end{pmatrix} \in \mathrm{SU}(2)$ với mọi $\theta \in [0, 2\pi)$. Đây chính là torus cực đại --- nhóm con giao hoán lớn nhất. Mỗi ma trận trong $\mathrm{SU}(2)$ liên hợp với một ma trận chéo dạng này.
Ý nghĩa trực giác
- Hình dung: Hãy tưởng tượng $\mathrm{SU}(2)$ như mặt cầu 3 chiều $S^3$. Mỗi “điểm” trên mặt cầu này là một ma trận $2 \times 2$ đặc biệt. Nhóm này mô tả mọi “phép quay” có thể trong không gian 2 chiều phức.
- Lớp liên hợp: Mỗi phần tử của $\mathrm{SU}(2)$ được xác định (đến liên hợp) bởi một góc $\theta \in [0, \pi]$: giá trị riêng là $e^{\pm i\theta}$. Khi chọn ngẫu nhiên một ma trận từ $\mathrm{SU}(2)$ (theo độ đo Haar), góc $\theta$ tuân theo phân bố bán tròn:
\[ \mu(\theta)\, d\theta = \frac{2}{\pi}\sin^2\theta\, d\theta. \]Đây chính là luật phân bố Sato--Tate!
- Tại sao $\mathrm{SU}(2)$? Mỗi đường cong elliptic $E$ cho một biểu diễn Galois 2 chiều. Đối với mỗi $p$ tốt, Frobenius $\mathrm{Frob}_p$ cho một ma trận $2 \times 2$. Chuẩn hóa bỏ $\sqrt{p}$, ma trận này thuộc $\mathrm{SU}(2)$. Phỏng đoán Sato--Tate nói rằng dãy ma trận $\{\mathrm{Frob}_p\}$ phân bố đều trên $\mathrm{SU}(2)$.
Liên hệ với giả thuyết Birch--Dyer
- Nền tảng của Sato--Tate: Phỏng đoán Sato--Tate (nay là định lý cho $E/\mathbb{Q}$ không CM [taylor2008]) phát biểu rằng các Frobenius chuẩn hóa phân bố đều (equidistributed) trên $\mathrm{SU}(2)$ theo độ đo Haar. Nhóm $\mathrm{SU}(2)$ là “nhóm Sato--Tate” của đường cong.
- Tích Euler và BSD: Hàm $L(E,s) = \prod_p L_p(E,s)$ được xây dựng từ các thừa số cục bộ. Mỗi thừa số $L_p$ phụ thuộc vào góc $\theta_p$ (lớp liên hợp trong $\mathrm{SU}(2)$). Phân bố đều trên $\mathrm{SU}(2)$ kiểm soát tốc độ hội tụ/phân kỳ của tích Euler --- liên quan trực tiếp đến bậc triệt tiêu $\mathrm{ord}_{s=1} L(E,s)$.
- Trường hợp CM: Khi $E$ có nhân phức, nhóm Sato--Tate là $\mathrm{U}(1) \subsetneq \mathrm{SU}(2)$ (nhỏ hơn), và phân bố khác: $\theta_p$ đều trên $[0, \pi]$ thay vì bán tròn [katz-sarnak1999].
Định nghĩa
Ký hiệu Legendre có thể tính bằng tiêu chuẩn Euler:
Ví dụ
- $p = 7$: Các bình phương modulo $7$: $1^2 = 1$, $2^2 = 4$, $3^2 = 2$. Vậy thặng dư bậc hai là $\{1, 2, 4\}$.
\[ \left(\frac{1}{7}\right) = 1, \quad \left(\frac{2}{7}\right) = 1, \quad \left(\frac{3}{7}\right) = -1, \quad \left(\frac{4}{7}\right) = 1, \quad \left(\frac{5}{7}\right) = -1, \quad \left(\frac{6}{7}\right) = -1. \]
- Kiểm tra bằng Euler: $\left(\frac{3}{7}\right) \equiv 3^{(7-1)/2} = 3^3 = 27 \equiv 6 \equiv -1 \pmod{7}$. Đúng: $3$ không là bình phương modulo $7$.
- Luật thuận nghịch: Luật thuận nghịch bậc hai (Gauss) cho:
\[ \left(\frac{p}{q}\right)\left(\frac{q}{p}\right) = (-1)^{\frac{p-1}{2}\cdot\frac{q-1}{2}} \]với $p, q$ nguyên tố lẻ phân biệt. Ví dụ: $\left(\frac{3}{7}\right)\left(\frac{7}{3}\right) = (-1)^{1 \cdot 3} = -1$. Vì $\left(\frac{3}{7}\right) = -1$ nên $\left(\frac{7}{3}\right) = \left(\frac{1}{3}\right) = 1$.
Ý nghĩa trực giác
- Hình dung: Với mỗi $p$ lẻ, ký hiệu Legendre chia các số $1, 2, \ldots, p-1$ thành hai nhóm bằng nhau:
- $(p-1)/2$ số là bình phương (thặng dư bậc hai, nhãn $+1$),
- $(p-1)/2$ số không là bình phương (phi thặng dư, nhãn $-1$).
• Đếm điểm trên EC: Khi đếm $\#E(\mathbb{F}_p)$ cho $E: y^2 = f(x)$, ta tính:
Liên hệ với giả thuyết Birch--Dyer
- Công thức đếm: Vết Frobenius $a_p = p + 1 - \#E(\mathbb{F}_p)$ --- đại lượng cốt lõi xây dựng hàm $L(E,s)$ --- được tính trực tiếp qua tổng ký hiệu Legendre.
- Đường cong CM: Với $E: y^2 = x^3 - x$ (CM bởi $\mathbb{Z}[i]$), ta có $a_p = 0$ khi $p \equiv 3 \pmod{4}$ vì $\left(\frac{-1}{p}\right) = -1$. Ký hiệu Legendre xác định hoàn toàn hành vi của $a_p$.
- Twist bậc hai: Với $E_d: dy^2 = f(x)$, ta có $a_p(E_d) = \left(\frac{d}{p}\right) a_p(E)$. Hàm $L$ của twist thay đổi bởi ký hiệu Legendre: $L(E_d, s) = L(E, s, \chi_d)$ trong đó $\chi_d = \left(\frac{d}{\cdot}\right)$.
Định nghĩa
Khi $p$ là nguyên tố lẻ, tập thặng dư bậc hai modulo $p$ là nhóm con $(\mathbb{F}_p^{\times})^2 = \{x^2 : x \in \mathbb{F}_p^{\times}\}$, có chỉ số $[\mathbb{F}_p^{\times} : (\mathbb{F}_p^{\times})^2] = 2$ (đúng một nửa các phần tử khác $0$ là bình phương).
Ví dụ
| $p$ | Bình phương $x^2 \bmod p$ | Thặng dư bậc hai |
|---|---|---|
| $3$ | $1^2 = 1$ | $\{1\}$ |
| $5$ | $1^2 = 1,\; 2^2 = 4$ | $\{1, 4\}$ |
| $7$ | $1^2 = 1,\; 2^2 = 4,\; 3^2 = 2$ | $\{1, 2, 4\}$ |
| $11$ | $1, 4, 9, 5, 3$ | $\{1, 3, 4, 5, 9\}$ |
| $13$ | $1, 4, 9, 3, 12, 10$ | $\{1, 3, 4, 9, 10, 12\}$ |
Nhận xét: Với mỗi $p$ lẻ, có đúng $(p-1)/2$ thặng dư bậc hai.
Ý nghĩa trực giác
- Hình dung: Câu hỏi “$a$ có phải thặng dư bậc hai modulo $p$?” tương đương “phương trình $y^2 = a$ có nghiệm trong $\mathbb{F}_p$?”. Với đường cong elliptic $y^2 = f(x)$, câu hỏi này phải được trả lời cho từng $x \in \mathbb{F}_p$ --- đó là bản chất của việc đếm điểm.
- Luật thuận nghịch: Luật thuận nghịch bậc hai (Gauss, 1801) --- “đá quý của lý thuyết số” --- cho phép hoán đổi vai trò $p$ và $q$: biết $p$ có là bình phương modulo $q$ hay không, ta suy ra $q$ có là bình phương modulo $p$ hay không. Đây là kết quả đầu tiên về tính tương hỗ --- tiền thân của chương trình Langlands.
- Một nửa là bình phương: Ánh xạ $x \mapsto x^2$ trên $\mathbb{F}_p^{\times}$ là đồng cấu nhóm với hạt nhân $\{\pm 1\}$, nên ảnh $(\mathbb{F}_p^{\times})^2$ có $(p-1)/2$ phần tử. Tập bình phương tạo thành nhóm con chỉ số $2$ --- nhóm con duy nhất.
Liên hệ với giả thuyết Birch--Dyer
- Đếm điểm: Số điểm $\#E(\mathbb{F}_p)$ phụ thuộc trực tiếp vào có bao nhiêu $x \in \mathbb{F}_p$ mà $f(x)$ là thặng dư bậc hai. Nếu $f(x)$ là bình phương modulo $p$, ta được 2 điểm $(x, \pm y)$; nếu $f(x) = 0$, được 1 điểm; nếu phi thặng dư, không có điểm.
- Rút gọn nhân: Loại rút gọn xấu tại $p$ (nhân tách vs.không tách) phụ thuộc vào $c_4/\Delta$ có phải thặng dư bậc hai modulo $p$ hay không. Điều này ảnh hưởng đến thừa số Euler $L_p(E,s)$ và số Tamagawa $c_p$.
- Số đồng dư: Số nguyên $n$ là số đồng dư khi và chỉ khi $E_n: y^2 = x^3 - n^2 x$ có hạng $\geq 1$. Định lý Tunnell [tunnell1983] quy điều kiện này về đếm biểu diễn bậc hai --- bản chất là thặng dư bậc hai modulo các số nguyên tố.
Định nghĩa
- $\mathrm{ord}_{s=1} L(E,s)$ là bậc triệt tiêu (hạng giải tích $r_{\mathrm{an}}$) --- bậc của số $0$ trong khai triển Taylor của $L(E,s)$ quanh $s = 1$,
- $\mathrm{rk}\bigl(E(\mathbb{Q})\bigr)$ là hạng đại số $r$ --- số lượng sinh tự do trong nhóm Mordell--Weil $E(\mathbb{Q}) \cong \mathbb{Z}^r \oplus E(\mathbb{Q})_{\mathrm{tors}}$.
Bối cảnh và động lực
Cho đường cong elliptic $E/\mathbb{Q}$, câu hỏi đơn giản nhất ta có thể đặt ra là: phương trình này có bao nhiêu nghiệm với tọa độ hữu tỉ?
Định lý Mordell--Weil [mordell1922] đảm bảo:
trong đó $r$ (hạng, rank) đo "độ phong phú" của nghiệm hữu tỉ:
- $r = 0$: chỉ có hữu hạn nghiệm (toàn bộ là xoắn),
- $r = 1$: vô hạn nghiệm, sinh bởi 1 điểm qua luật nhóm,
- $r = 2$: sinh bởi 2 điểm độc lập, và cứ thế...
Vấn đề: Mordell--Weil chỉ khẳng định $r$ tồn tại, nhưng không cho cách tính $r$! Đến nay vẫn chưa có thuật toán tổng quát nào chắc chắn tính được hạng của mọi đường cong elliptic. Thuật toán descent chỉ cho cận trên, còn khoảng cách giữa cận trên (từ nhóm Selmer) và cận dưới (từ tìm kiếm điểm) có thể rất lớn.
Vào cuối thập niên 1950, Bryan Birch và Peter Swinnerton-Dyer tại Cambridge có một ý tưởng táo bạo:
Nếu không đếm trực tiếp nghiệm hữu tỉ được, hãy đếm nghiệm modulo từng số nguyên tố $p$, rồi "ghép" thông tin lại.
Cụ thể, với mỗi $p$ rút gọn tốt, đặt $N_p = \#E(\mathbb{F}_p)$ và xét tích:
Chạy trên máy EDSAC (1958--1963), họ phát hiện: $\Pi_E(X) \sim C \cdot (\log X)^r$ khi $X \to \infty$, trong đó $r$ đúng bằng hạng đại số! Tốc độ tăng của tích "biết" được số lượng nghiệm hữu tỉ. Viết lại bằng ngôn ngữ hàm $L$ (vì $\Pi_E(X)$ chính là tích Euler cắt cụt ngược tại $s = 1$), phát hiện này trở thành: $\mathrm{ord}_{s=1} L(E,s) = r$ --- đó là giả thuyết BSD yếu [birch-sd1963] [birch-sd1965].
Ví dụ
- Hạng 0: $E: y^2 + y = x^3 - x$ (conductor $37$, nhãn LMFDB
37.a1). Ta có $E(\mathbb{Q}) = \{O\}$ (hạng $0$) và $L(E, 1) \approx 0.2538 \neq 0$. Vậy $\mathrm{ord}_{s=1} L(E,s) = 0 = \mathrm{rk}(E(\mathbb{Q}))$. BSD yếu đúng! - Hạng 1: $E: y^2 + y = x^3 - x^2$ (conductor $11$, nhãn
11.a1). Hạng đại số $r = 1$ với sinh $P = (0,0)$. Tính $L(E,1) = 0$, $L'(E,1) \approx 0.2538 \neq 0$. Vậy $\mathrm{ord}_{s=1} = 1 = r$. BSD yếu đúng! - Hạng 2: $E: y^2 + y = x^3 + x^2 - 2x$ (conductor $389$, nhãn
389.a1). Hạng $r = 2$, sinh bởi $P_1 = (0,0)$, $P_2 = (-1, 1)$. Tính $L(E,1) = 0$, $L'(E,1) = 0$, $L''(E,1) \neq 0$. Vậy $\mathrm{ord}_{s=1} = 2 = r$. BSD yếu đúng!
Ý nghĩa trực giác
- Hai thế giới, một câu trả lời: Hạng đại số $r$ đến từ đại số --- tìm các điểm hữu tỉ và chứng minh chúng độc lập tuyến tính. Hạng giải tích $r_{\mathrm{an}}$ đến từ giải tích --- hành vi của hàm $L$ tại $s = 1$. BSD yếu nói rằng hai cách tiếp cận hoàn toàn khác nhau cho cùng một đáp số.
- Tương tự công thức Dirichlet: Cho đặc trưng $\chi$ của nhóm Dirichlet, $L(1, \chi) \neq 0$ tương đương với tồn tại vô hạn số nguyên tố trong lớp tương ứng. BSD yếu là phiên bản phi giao hoán, sâu hơn nhiều.
- “Nhìn từ xa” vs. “nhìn gần”: Hàm $L(E,s)$ tổng hợp thông tin cục bộ (đếm điểm modulo $p$ cho mọi $p$) thành một hàm toàn cục. BSD yếu nói rằng hành vi toàn cục ($\mathrm{ord}_{s=1}$) phản ánh đúng cấu trúc toàn cục ($\mathrm{rk}$). Đây là bản chất “local-to-global” --- nguyên lý xuyên suốt lý thuyết số.
Tại sao BSD yếu khó chứng minh?
- Nhóm Sha chưa biết hữu hạn: Ngay cả BSD yếu cũng gián tiếp phụ thuộc vào $\mathrm{Sha}(E/\mathbb{Q})$. Các phương pháp chứng minh $r_{\mathrm{an}} \leq 1 \Rightarrow r = r_{\mathrm{an}}$ (Kolyvagin) đều phải đồng thời chứng minh $|\mathrm{Sha}| < \infty$. Với $r_{\mathrm{an}} \geq 2$, ta không có công cụ nào kiểm soát $\mathrm{Sha}$.
- Không có cách tính hạng tổng quát: Thuật toán descent cho cận trên qua nhóm Selmer: $r \leq \dim_{\mathbb{F}_p} \mathrm{Sel}_p(E/\mathbb{Q}) - \dim_{\mathbb{F}_p} E(\mathbb{Q})[p]$. Nhưng khoảng cách giữa cận trên và cận dưới (từ tìm kiếm điểm) có thể rất lớn. Không có thuật toán nào chắc chắn dừng và cho đúng $r$.
- Hạng cao là "vùng tối": Gross--Zagier chỉ xử lý $r_{\mathrm{an}} = 1$ (qua điểm Heegner). Hệ thống Euler (Kolyvagin) cũng chỉ cho $r_{\mathrm{an}} \leq 1$. Với $r_{\mathrm{an}} \geq 2$, chưa có phương pháp nào xây dựng đủ $r$ điểm độc lập từ thông tin giải tích. Đây là rào cản lớn nhất.
- Chiều "ngược" đặc biệt khó: Chiều $r_{\mathrm{an}} \geq 1 \Rightarrow r \geq 1$ (nếu $L(E,1) = 0$ thì phải xây dựng một điểm hữu tỉ) khó hơn chiều thuận. Phương pháp Heegner chỉ áp dụng khi dấu gốc $w_E = -1$ (và chỉ cho 1 điểm). Khi $r_{\mathrm{an}} \geq 2$, ta cần tìm $\geq 2$ điểm độc lập --- chưa ai biết cách.
- Cầu nối đại số $\leftrightarrow$ giải tích chưa hoàn chỉnh: Định lý modularity (Wiles [wiles1995], BCDT [breuil-etal2001]) cho phép thác triển $L(E,s)$, nhưng chỉ "chuyển" được giữa hai thế giới trong trường hợp đặc biệt. Để chứng minh BSD tổng quát, ta cần một "cầu nối" mạnh hơn nhiều --- có thể từ chương trình Langlands hoặc lý thuyết Iwasawa.
Tiến trình giải quyết --- những gì đã biết
| Năm | Tác giả | Kết quả |
|---|---|---|
| 1977 | Coates--Wiles [coates-wiles1977] | Nếu $E$ có CM và $L(E,1) \neq 0$ thì $r = 0$. |
| 1986 | Gross--Zagier [gross-zagier1986] | Công thức: $L'(E,1) = c \cdot \hat{h}(P_K)$ với $P_K$ điểm Heegner. Hệ quả: $L'(E,1) \neq 0 \Rightarrow r \geq 1$. |
| 1990 | Kolyvagin [kolyvagin1990] | Nếu $r_{\mathrm{an}} \leq 1$ thì $r = r_{\mathrm{an}}$ và $\mathrm{Sha}$ hữu hạn. Dùng hệ thống Euler. |
| 1991 | Rubin [rubin1991] | BSD mạnh cho đường cong CM với $r = 0$ (mọi $p$). |
| 2001 | BCDT [breuil-etal2001] | Mọi $E/\mathbb{Q}$ là modular $\Rightarrow$ $L(E,s)$ thác triển giải tích. |
| 2004 | Kato [kato2004] | $L(E,1) \neq 0 \Rightarrow r = 0$ và $|\mathrm{Sha}| < \infty$ (không cần CM). |
| 2006 | Skinner--Urban [skinner-urban2014] | Main conjecture $\mathrm{GL}_2$ $\Rightarrow$ BSD mạnh phần $p$ (hầu hết $p$). |
| 2015 | Bhargava--Skinner--Zhang [bhargava-skinner-zhang2014] | $\geq 66{,}48\%$ đường cong elliptic thỏa mãn BSD yếu. |
| 2022 | A. Smith | Phỏng đoán Goldfeld cho họ bậc 2: 50% hạng 0, 50% hạng 1. |
Tình trạng hiện tại: BSD yếu đã được chứng minh khi $r_{\mathrm{an}} \leq 1$. Với $r_{\mathrm{an}} \geq 2$, chưa có kết quả nào --- đây là "vùng tối" lớn nhất. Về mặt thống kê, phần lớn đường cong có hạng $0$ hoặc $1$, nên kết quả Bhargava--Skinner--Zhang bao phủ "hầu hết" các trường hợp.
Các phiên bản mở rộng
- BSD trên trường số $K/\mathbb{Q}$: Thay $E(\mathbb{Q})$ bằng $E(K)$ và $L(E/\mathbb{Q}, s)$ bằng $L(E/K, s)$. Kết quả Gross--Zagier--Kolyvagin vẫn đúng cho trường bậc hai ảo $K$.
- BSD cho đa tạp Abel: $A/K$ đa tạp Abel chiều $g$. Hàm $L(A,s)$ có bậc $2g$ trong tích Euler. Phỏng đoán: $\mathrm{ord}_{s=1} L(A,s) = \mathrm{rk}(A(K))$.
- BSD $p$-adic (Mazur--Tate--Teitelbaum): Thay $L(E,s)$ bằng hàm $L$ $p$-adic $L_p(E,s)$. Khi $E$ có rút gọn nhân tách tại $p$, xuất hiện zero ngoại lệ (exceptional zero): $L_p$ triệt tiêu "thêm 1 bậc" so với $L$ phức, với hệ số dẫn đầu nhân thêm bất biến $\mathcal{L}_p$.
- Phỏng đoán Bloch--Kato [bloch-kato1990]: Tổng quát BSD cho motif bất kỳ. Với motif $M$ và số nguyên $n$:
\[\mathrm{ord}_{s=n} L(M,s) = \dim_{\mathbb{Q}} H^1_f(G_{\mathbb{Q}}, V^*(1-n)) - \dim_{\mathbb{Q}} H^0(G_{\mathbb{Q}}, V^*(1-n)).\]BSD yếu là trường hợp đặc biệt $M = h^1(E)$, $n = 1$.
- BSD đẳng biến: Cho $K/\mathbb{Q}$ mở rộng Galois với $G = \mathrm{Gal}(K/\mathbb{Q})$ và $\chi$ biểu diễn bất khả quy của $G$:
\[\mathrm{ord}_{s=1} L(E, \chi, s) = \text{bội của } \chi \text{ trong } E(K) \otimes_{\mathbb{Z}} \mathbb{C}.\]Phiên bản này tinh tế hơn BSD thông thường và liên hệ mật thiết với chương trình Langlands.
Ý nghĩa triết học --- vị trí của BSD trong toán học
Giả thuyết BSD nằm ở giao điểm của ba lĩnh vực trung tâm trong toán học hiện đại:
- Hình học đại số: đường cong elliptic, đa tạp Abel, lược đồ Néron,
- Lý thuyết số giải tích: hàm $L$, hàm zeta, tích Euler, thác triển giải tích,
- Đại số đồng điều: đối đồng điều Galois, nhóm Selmer, nhóm Tate--Shafarevich.
Chứng minh BSD sẽ đòi hỏi hợp nhất các lĩnh vực này --- giống cách Định lý modularity đã hợp nhất đường cong elliptic với dạng modular. Đó là lý do Viện Clay chọn BSD làm một trong 7 bài toán thiên niên kỷ.
Nhận xét của các chuyên gia:
- Andrew Wiles (2006): "Giả thuyết BSD là bài toán mở quan trọng nhất. Sức hấp dẫn nằm ở chỗ nó kết nối hai lĩnh vực dường như không liên quan --- số học của các điểm hữu tỉ và hành vi giải tích của hàm L."
- Bryan Birch (2004): "Chúng tôi chỉ nhìn vào dữ liệu máy tính và nhận ra rằng nó quá đẹp để là ngẫu nhiên." [birch2004]
- Manjul Bhargava (2014): Bằng phương pháp hình học của số (geometry of numbers), chứng minh $\geq 66{,}48\%$ đường cong thỏa BSD yếu --- con số lớn nhất tính đến nay [bhargava-skinner-zhang2014].
- Terence Tao (2007): "BSD thuộc loại bài toán 'vĩ mô' --- nó phản ánh một quy luật cấu trúc sâu xa, không thể giải quyết bằng các kỹ thuật 'vi mô' riêng lẻ."
Một cách nhìn thống nhất (Bloch, Kato, Fontaine, Perrin-Riou): công thức BSD mạnh có thể hiểu như đẳng thức giữa hai cách đo "thể tích" của cùng một không gian số học:
- Vế trái ($L^{(r)}(E,1)/r!$): "thể tích giải tích" --- được xác định qua tích Euler, phản ánh phân bố nghiệm mod $p$ cho mọi $p$.
- Vế phải: "thể tích số học" --- tích của:
- $\Omega_E$ = thể tích Archimedean ("kích thước thực" tại chỗ vô hạn),
- $\prod c_p$ = thể tích cục bộ tại các $p$ xấu,
- $\mathrm{Reg}_E$ = thể tích lưới điểm hữu tỉ ("mức trải rộng" của các sinh),
- $|\mathrm{Sha}|$ = hệ số hiệu chỉnh cho "nghiệm ma" (phantom solutions),
- $1/|E_{\mathrm{tors}}|^2$ = hiệu chỉnh cho phần "đã biết sẵn".
Triết lý này hoàn toàn tương tự công thức số lớp Dedekind:
trong đó $h_K$ (số lớp) $\leftrightarrow$ $|\mathrm{Sha}|$, $R_K$ (regulator) $\leftrightarrow$ $\mathrm{Reg}_E$, $w_K$ (nghiệm đơn vị) $\leftrightarrow$ $|E_{\mathrm{tors}}|$. Cả hai đều nói: giá trị đặc biệt của hàm $L$ = tích các bất biến số học.
Liên hệ với giả thuyết Birch--Dyer
- Nửa đầu của giả thuyết: BSD yếu là phần định tính --- chỉ nói về sự bằng nhau $r_{\mathrm{an}} = r$, không nói giá trị cụ thể $L^{(r)}(E,1)/r!$. BSD mạnh bổ sung phần định lượng.
- Đã biết gì? Nhờ Gross--Zagier [gross-zagier1986] và Kolyvagin [kolyvagin1990]: nếu $r_{\mathrm{an}} \leq 1$ thì $r = r_{\mathrm{an}}$ (và $\mathrm{Sha}$ hữu hạn). Với $r_{\mathrm{an}} \geq 2$, ta chỉ biết $r \geq 1$ (Kato [kato2004]: $r_{\mathrm{an}} = 0 \Rightarrow r = 0$). Trường hợp $r_{\mathrm{an}} \geq 2$ vẫn hoàn toàn mở.
- Bài toán thiên niên kỷ: Viện Clay quy ước: để nhận giải $1 triệu, chỉ cần chứng minh BSD yếu cho mọi $E/\mathbb{Q}$ (không cần BSD mạnh).
- Chiều ngược: Chiều $r \geq r_{\mathrm{an}}$ (có “đủ” điểm) đặc biệt khó. Khi $L(E,1) = 0$ (hạng giải tích $\geq 1$), làm sao xây dựng một điểm hữu tỉ? Phương pháp Heegner chỉ hoạt động khi $r_{\mathrm{an}} = 1$.
Định nghĩa
- Nhóm Tate--Shafarevich $\mathrm{Sha}(E/\mathbb{Q})$ là hữu hạn.
- Hệ số hàng đầu trong khai triển Taylor:
\[ \boxed{\frac{L^{(r)}(E,1)}{r!} = \frac{|\mathrm{Sha}(E/\mathbb{Q})| \cdot \Omega_E \cdot \mathrm{Reg}_E \cdot \prod_{p} c_p}{|E(\mathbb{Q})_{\mathrm{tors}}|^2}} \]
- $L^{(r)}(E,1)/r!$: hệ số hàng đầu của khai triển Taylor tại $s = 1$,
- $|\mathrm{Sha}(E/\mathbb{Q})|$: cỡ của nhóm Tate--Shafarevich,
- $\Omega_E = \int_{E(\mathbb{R})} |\omega|$: chu kỳ thực (tích phân vi phân Néron trên thành phần thực),
- $\mathrm{Reg}_E = \det\bigl(\langle P_i, P_j \rangle\bigr)$: regulator (định thức ma trận chiều cao Néron--Tate),
- $c_p = [E(\mathbb{Q}_p) : E^0(\mathbb{Q}_p)]$: số Tamagawa tại $p$ (chỉ $\neq 1$ khi $p \mid N_E$),
- $|E(\mathbb{Q})_{\mathrm{tors}}|$: cỡ nhóm con xoắn.
Ví dụ
11.a1 ($y^2 + y = x^3 - x^2$, hạng $r = 1$):
- Sinh: $P = (0,0)$, chiều cao Néron--Tate: $\hat{h}(P) \approx 0.0392$.
- $\mathrm{Reg}_E = \hat{h}(P) \approx 0.0392$ (ma trận $1 \times 1$).
- $\Omega_E \approx 1.2692$.
- $c_p$: $c_{11} = 5$ (rút gọn nhân tách tại $11$), $c_p = 1$ với $p \neq 11$.
- $|E(\mathbb{Q})_{\mathrm{tors}}| = 5$ (nhóm xoắn $\mathbb{Z}/5\mathbb{Z}$).
- $|\mathrm{Sha}| = 1$ (trivial).
Ý nghĩa trực giác
- Tương tự công thức số lớp: Cho trường số $K$, công thức số lớp Dedekind cho:
\[ \lim_{s \to 1} (s-1) \zeta_K(s) = \frac{2^{r_1}(2\pi)^{r_2} h_K R_K}{w_K \sqrt{|d_K|}}. \]
Bảng tương ứng chi tiết:
Trường số $K$ Đường cong $E/\mathbb{Q}$ $\zeta_K(s)$ $L(E,s)$ Cực đơn tại $s=1$ Zero bậc $r$ tại $s=1$ $h_K$ (số lớp) $|\mathrm{Sha}(E/\mathbb{Q})|$ $R_K$ (regulator) $\mathrm{Reg}_E$ $w_K$ (nghiệm đ.v.) $|E(\mathbb{Q})_{\mathrm{tors}}|^2$ $\sqrt{|d_K|}$ $\sqrt{N_E}$ (conductor) $2^{r_1}(2\pi)^{r_2}$ $\Omega_E \cdot \prod c_p$ - Mỗi thừa số kể một “câu chuyện”: $\Omega_E$ đo “kích thước thực” (thể tích), $\mathrm{Reg}_E$ đo “mức độ trải rộng” của các sinh, $|\mathrm{Sha}|$ đo “phần bị ẩn” (chướng ngại local-global), $c_p$ đo “đóng góp cục bộ” tại các số nguyên tố xấu, $|E_{\mathrm{tors}}|^2$ đo “phần đã biết sẵn”.
- Tại sao là bình phương? Mẫu số $|E_{\mathrm{tors}}|^2$ (bình phương) xuất hiện vì ghép đôi Weil trên $E_{\mathrm{tors}} \times E_{\mathrm{tors}}$. Ghép đôi Cassels--Tate cũng buộc $|\mathrm{Sha}|$ là bình phương hoàn hảo (nếu hữu hạn).
Liên hệ với giả thuyết Birch--Dyer
- Mạnh hơn BSD yếu: BSD yếu chỉ nói $\mathrm{ord}_{s=1} = r$ (bậc triệt tiêu). BSD mạnh nói thêm: hệ số hàng đầu $L^{(r)}(E,1)/r!$ bằng một biểu thức cụ thể chứa mọi bất biến số học quan trọng của $E$.
- Đã chứng minh được gì?
- Hạng $0$: Kato [kato2004] chứng minh $L(E,1) \neq 0 \Rightarrow r = 0$ và $|\mathrm{Sha}| < \infty$. Skinner [skinner-urban2014] chứng minh BSD mạnh phần $p$ cho “hầu hết” $p$.
- Hạng $1$: Gross--Zagier + Kolyvagin chứng minh $r = 1$ và $|\mathrm{Sha}| < \infty$. Công thức Gross--Zagier cho giá trị $L'(E,1)$ qua chiều cao điểm Heegner.
- Hạng $\geq 2$: Chưa biết gì về BSD mạnh.
• Kiểm nghiệm bằng máy tính: Cremona [cremona1997] và LMFDB đã kiểm nghiệm BSD mạnh cho hàng triệu đường cong có conductor $\leq 500{,}000$ --- tất cả đều khớp.
• Thách thức: Tính $|\mathrm{Sha}|$ chính xác rất khó (phải tính nhóm Selmer hoặc dùng phương pháp descent). Với hạng cao ($r \geq 3$), $\mathrm{Reg}_E$ có thể rất nhỏ, gây khó khăn số học.
Định nghĩa
Ví dụ
- Hạng 0 ($E: y^2 = x^3 + 1$): $\Pi_E(X)$ tiến tới một hằng số $C > 0$ khi $X \to \infty$.
- Hạng 1 ($E: y^2 = x^3 - x$): $\Pi_E(X) \sim C \cdot \log X$ khi $X \to \infty$ (tăng logarithmic).
- Hạng 2: $\Pi_E(X) \sim C \cdot (\log X)^2$ (tăng nhanh hơn).
Quy luật tổng quát: $\Pi_E(X) \sim C \cdot (\log X)^r$ với $r = \mathrm{rk}(E(\mathbb{Q}))$.
Chính quan sát thực nghiệm này dẫn đến giả thuyết: $r$ là bậc triệt tiêu của hàm $L(E,s)$ tại $s = 1$ (vì $\Pi_E(X)$ và hàm $L$ liên hệ qua tích Euler) [birch-sd1965].
Ý nghĩa trực giác
- Hình dung: Mỗi thừa số $\#E(\mathbb{F}_p)/p$ cho biết: tại $p$, đường cong $E$ có “nhiều” hay “ít” điểm so với kỳ vọng. Nếu $a_p > 0$ (ít điểm hơn $p+1$), thừa số $< 1$; nếu $a_p < 0$ (nhiều điểm hơn $p+1$), thừa số $> 1$.
- Tích --- “bỏ phiếu” toàn cục: Nhân tất cả thừa số lại, ta được “bỏ phiếu đa số”. Nếu tích tiến tới $0$ nhanh, nghĩa là đường cong có “nhiều điểm hữu tỉ hơn” (hạng cao hơn). Tốc độ tích tiến về $0$ hoặc phát tán chính là $(\log X)^r$.
- Liên hệ với tích Euler: Viết hình thức: $L(E,1) = \prod_p L_p(E,1)^{-1}$. Tại các $p$ rút gọn tốt:
\[ L_p(E,1)^{-1} = 1 - a_p p^{-1} + p^{-1} = \frac{p - a_p + 1}{p} = \frac{\#E(\mathbb{F}_p)}{p}. \]Vậy $\Pi_E(X) \approx L(E,1)^{-1}$ (“tích Euler cắt cụt ngược”). Tích phân kỳ $\Leftrightarrow$ $L(E,1) = 0$.
- Quy luật $(\log X)^r$: Lấy logarithm: $\log \Pi_E(X) = \sum_{p \leq X} \log(\#E(\mathbb{F}_p)/p)$. Khai triển: $\log(1 - a_p/p + 1/p) \approx -a_p/p$. Nếu $L(E,s)$ có zero bậc $r$ tại $s=1$, tổng này tăng như $r \log\log X$, dẫn đến $\Pi_E(X) \sim C(\log X)^r$.
Liên hệ với giả thuyết Birch--Dyer
- Nguồn gốc thực nghiệm: Giả thuyết BSD không bắt đầu từ lý thuyết trừu tượng mà từ dữ liệu máy tính. Birch và Swinnerton-Dyer nhìn vào đồ thị $\Pi_E(X)$ vs. $\log X$ trên giấy bán logarithm, thấy đường thẳng có hệ số góc $r$, và đoán ra mối liên hệ. Đây là một trong những ví dụ đẹp nhất về toán học thực nghiệm [birch2004].
- Từ $\Pi_E(X)$ đến $L(E,s)$: Quan sát $\Pi_E(X) \sim C(\log X)^r$ dẫn Birch--Swinnerton-Dyer đến phát biểu chính xác hơn: $\mathrm{ord}_{s=1} L(E,s) = r$, vì $\Pi_E(X)$ chính là tích Euler cắt cụt tại $s=1$.
- Hằng số $C$: Hằng số $C$ trong $\Pi_E(X) \sim C(\log X)^r$ liên quan đến hệ số hàng đầu $L^{(r)}(E,1)/r!$. BSD mạnh cho biết chính xác $C$ qua $\Omega_E$, $\mathrm{Reg}_E$, $|\mathrm{Sha}|$, $c_p$, $|E_{\mathrm{tors}}|$.
- EDSAC: Máy tính EDSAC (Electronic Delay Storage Automatic Calculator) tại Cambridge, hoạt động 1949--1958 (và EDSAC 2 đến 1965), là nơi Birch và Swinnerton-Dyer chạy các tính toán lịch sử. Với tốc độ chỉ vài nghìn phép tính/giây, họ cần nhiều tháng để tích lũy đủ dữ liệu.
Định nghĩa
Quy ước: $c_p = 1$ khi $E$ có rút gọn tốt tại $p$ (vì khi đó $E^0(\mathbb{Q}_p) = E(\mathbb{Q}_p)$). Vậy tích $\prod_p c_p$ (trong công thức BSD) là tích hữu hạn, chỉ chứa các thừa số $\neq 1$ tại $p \mid N_E$.
Ví dụ
- Đường cong
11.a1: $E: y^2 + y = x^3 - x^2$, conductor $N_E = 11$.- Tại $p = 11$: rút gọn nhân tách (split multiplicative). Thuật toán Tate cho $c_{11} = 5$.
- Tại mọi $p \neq 11$: rút gọn tốt, $c_p = 1$.
- Tích: $\prod_p c_p = 5$.
- Đường cong
37.a1: $E: y^2 + y = x^3 - x$, conductor $N_E = 37$.- Tại $p = 37$: rút gọn nhân tách, $c_{37} = 1$.
- Tích: $\prod_p c_p = 1$.
- Bảng giá trị $c_p$ theo loại rút gọn:
Loại rút gọn Giá trị $c_p$ Rút gọn tốt $c_p = 1$ Nhân tách $c_p = \mathrm{ord}_p(\Delta)$ Nhân không tách $c_p = 1$ hoặc $2$ Cộng $c_p \in \{1, 2, 3, 4, 6\}$
Ý nghĩa trực giác
- Hình dung: Tại mỗi số nguyên tố $p$ mà $E$ rút gọn xấu, nhóm $E(\mathbb{Q}_p)$ “vỡ” thành nhiều mảnh (thành phần liên thông). Số mảnh có điểm hữu tỉ chính là $c_p$. Nếu $c_p = 1$, mọi điểm $p$-adic đều “cùng mảnh”; nếu $c_p > 1$, các điểm phân tán trên nhiều mảnh.
- Tương tự: Hãy tưởng tượng một vòng tròn (nhóm $E(\mathbb{Q}_p)$) bị cắt thành $c_p$ cung. Mỗi cung là một “thành phần”. Điểm trên các cung khác nhau không thể “đi sang” nhau bằng phép biến đổi liên tục trong thành phần đơn vị.
- Nhân tách: Khi rút gọn nhân tách, đường cong trở thành nút (node) --- nhóm phần trơn đẳng cấu với $\mathbb{G}_m$. Nhóm thành phần là $\mathbb{Z}/c_p\mathbb{Z}$ với $c_p = \mathrm{ord}_p(\Delta)$. Hình ảnh: vòng tròn bị “cuộn” $c_p$ vòng.
Liên hệ với giả thuyết Birch--Dyer
- Thành phần trong BSD mạnh: Tích $\prod_p c_p$ xuất hiện ở tử số của công thức BSD mạnh:
\[ \frac{L^{(r)}(E,1)}{r!} = \frac{|\mathrm{Sha}| \cdot \Omega_E \cdot \mathrm{Reg}_E \cdot \prod_p c_p}{|E(\mathbb{Q})_{\mathrm{tors}}|^2}. \]Số Tamagawa đo “đóng góp cục bộ” của các số nguyên tố xấu.
- Tương tự: Trong công thức số lớp cho trường số $K$, thành phần tương ứng là $|d_K|^{1/2}$ (discriminant) --- cũng đo “mức độ phân nhánh” tại các số nguyên tố xấu.
- Tính toán: Số Tamagawa $c_p$ được tính bằng thuật toán Tate [tate1975], đã cài đặt trong Sage, Magma, PARI/GP. Với conductor $N_E$ nhỏ, tích $\prod c_p$ thường nhỏ (thường $\leq 100$).
- Ý nghĩa số học: Khi $c_p$ lớn (ví dụ rút gọn nhân tách với $\mathrm{ord}_p(\Delta)$ lớn), đường cong có “rút gọn rất xấu” tại $p$, và điều này ảnh hưởng đến giá trị $L^{(r)}(E,1)/r!$.
Định nghĩa
Sợi đặc biệt (special fiber) $\mathcal{E}_p = \mathcal{E} \times_{\mathbb{Z}_p} \mathbb{F}_p$ là lược đồ nhóm trên $\mathbb{F}_p$, có thể không liên thông. Thành phần đơn vị (identity component) $\mathcal{E}_p^0$ là thành phần liên thông chứa phần tử đơn vị $O$.
Nhóm $E^0(\mathbb{Q}_p)$ gồm các điểm $P \in E(\mathbb{Q}_p)$ mà rút gọn $\tilde{P} \in \mathcal{E}_p^0(\mathbb{F}_p)$ --- tức những điểm rút gọn nằm trên thành phần đơn vị. Cụ thể:
- Nếu $E$ có rút gọn tốt tại $p$: $\mathcal{E}_p$ liên thông, nên $E^0(\mathbb{Q}_p) = E(\mathbb{Q}_p)$.
- Nếu $E$ có rút gọn nhân: $\mathcal{E}_p^0 \cong \mathbb{G}_m$ (nhóm nhân).
- Nếu $E$ có rút gọn cộng: $\mathcal{E}_p^0 \cong \mathbb{G}_a$ (nhóm cộng).
Ví dụ
- Rút gọn tốt ($p \nmid N_E$): $\mathcal{E}_p$ là đường cong elliptic trên $\mathbb{F}_p$ (liên thông). Mọi điểm $p$-adic rút gọn về điểm trơn. $E^0(\mathbb{Q}_p) = E(\mathbb{Q}_p)$, $c_p = 1$.
- Rút gọn nhân tách (ví dụ
11.a1tại $p = 11$): Đường cong rút gọn modulo $11$ có nút (node) với hai tiếp tuyến hữu tỉ trên $\mathbb{F}_{11}$. Phần trơn $\mathcal{E}_{11}^0(\mathbb{F}_{11}) \cong \mathbb{F}_{11}^{\times}$. Nhóm thành phần $\mathcal{E}_{11}/\mathcal{E}_{11}^0 \cong \mathbb{Z}/5\mathbb{Z}$, nên $c_{11} = 5$. - Rút gọn cộng (ví dụ $E: y^2 = x^3 + p^2$ tại $p$): Đường cong có cusp. Phần trơn $\mathcal{E}_p^0(\mathbb{F}_p) \cong \mathbb{F}_p$ (nhóm cộng). Nhóm thành phần phụ thuộc vào cấu trúc chính xác, thường có $c_p \in \{1, 2, 3, 4\}$.
Ý nghĩa trực giác
- Hình dung: Khi đường cong $E$ bị rút gọn modulo $p$, nó có thể “vỡ” --- tạo ra điểm kỳ dị (nút hoặc cusp). Bỏ điểm kỳ dị đi, phần còn lại có thể không liên thông. Thành phần chứa gốc $O$ là $\mathcal{E}_p^0$ --- “phần chính”.
- Dãy chính xác: Ta có dãy chính xác:
\[ 0 \to E^0(\mathbb{Q}_p) \to E(\mathbb{Q}_p) \to \Phi_p(\mathbb{F}_p) \to 0 \]trong đó $\Phi_p = \mathcal{E}_p / \mathcal{E}_p^0$ là nhóm thành phần (component group), nhóm hữu hạn có cấp $c_p$.
- Lọc ba tầng: Thực ra $E(\mathbb{Q}_p)$ có lọc tinh hơn:
\[ E_1(\mathbb{Q}_p) \subset E^0(\mathbb{Q}_p) \subset E(\mathbb{Q}_p) \]với $E_1(\mathbb{Q}_p) = \ker(E(\mathbb{Q}_p) \to \mathcal{E}_p(\mathbb{F}_p))$ là nhóm lọc (formal group). Tỷ số $E^0/E_1 \cong \mathcal{E}_p^0(\mathbb{F}_p)$ (phần trơn), và $E/E^0 \cong \Phi_p(\mathbb{F}_p)$ (thành phần).
Liên hệ với giả thuyết Birch--Dyer
- Định nghĩa $c_p$: Số Tamagawa $c_p = [E(\mathbb{Q}_p) : E^0(\mathbb{Q}_p)]$ --- đây chính là cỡ nhóm thành phần. Không có $E^0(\mathbb{Q}_p)$ thì không định nghĩa được $c_p$.
- Mô hình Néron: Khái niệm $E^0(\mathbb{Q}_p)$ đòi hỏi mô hình Néron --- lược đồ nhóm trơn tối thiểu trên $\mathbb{Z}_p$ [neron1965]. Đây là đối tượng khá trừu tượng nhưng hoàn toàn tính toán được nhờ thuật toán Tate.
- Vi phân Néron: Vi phân $\omega$ trên $E/\mathbb{Q}$ gọi là vi phân Néron nếu nó mở rộng thành vi phân “tốt” trên mô hình Néron tại mọi $p$. Chu kỳ thực $\Omega_E = \int_{E(\mathbb{R})} |\omega|$ trong BSD mạnh dùng vi phân Néron --- liên hệ chặt chẽ với $E^0$.
Định nghĩa
- Nếu $w(E) = +1$ thì $\mathrm{rk}(E(\mathbb{Q}))$ chẵn ($0, 2, 4, \ldots$).
- Nếu $w(E) = -1$ thì $\mathrm{rk}(E(\mathbb{Q}))$ lẻ ($1, 3, 5, \ldots$).
Ví dụ
- Đường cong
37.a1: $E: y^2 + y = x^3 - x$. Conductor $N_E = 37$ (nguyên tố).- Dấu gốc: $w(E) = -1$ (vì $N_E = 37$ nguyên tố, rút gọn nhân tách).
- Hạng: $\mathrm{rk}(E(\mathbb{Q})) = 1$ (lẻ).
- Kiểm tra: $(-1)^1 = -1 = w(E)$. \checkmark
- Đường cong
389.a1: $E: y^2 + y = x^3 + x^2 - 2x$. Conductor $389$.- Dấu gốc: $w(E) = +1$.
- Hạng: $\mathrm{rk}(E(\mathbb{Q})) = 2$ (chẵn).
- Kiểm tra: $(-1)^2 = +1 = w(E)$. \checkmark
- Họ twist: Cho $E: y^2 = x^3 - x$ và $E_d: y^2 = x^3 - d^2 x$ (twist bậc hai bởi $d$). Khi $d > 0$ với $d \equiv 5, 6, 7 \pmod{8}$, ta có $w(E_d) = -1$, nên phỏng đoán tính chẵn lẻ dự đoán $\mathrm{rk}(E_d(\mathbb{Q}))$ lẻ $\geq 1$ --- tức $E_d$ có điểm hữu tỉ bậc vô hạn.
Ý nghĩa trực giác
- Hình dung: Phương trình hàm $\Lambda(E, 2-s) = w(E) \cdot \Lambda(E, s)$ tạo ra đối xứng (hoặc phản đối xứng) quanh $s = 1$. Nếu $w(E) = -1$, hàm $L$ đổi dấu khi $s \mapsto 2-s$, nên $L(E, 1) = -L(E, 1) = 0$ --- hàm $L$ buộc phải triệt tiêu tại $s = 1$. Bậc triệt tiêu ít nhất là $1$ (lẻ).
- “Miễn phí”: Khi $w(E) = -1$, ta biết $L(E,1) = 0$ mà không cần tính $L(E,1)$ --- chỉ từ đối xứng! BSD yếu khi đó suy ra $\mathrm{rk} \geq 1$ --- đường cong phải có vô hạn điểm hữu tỉ. Đây là thông tin “miễn phí” từ phương trình hàm.
- Tại sao quan trọng? Phỏng đoán tính chẵn lẻ dễ tiếp cận hơn BSD yếu. Thực tế, phỏng đoán $p$-chẵn lẻ (cho $p$-Selmer) đã được chứng minh cho mọi $E/\mathbb{Q}$ bởi Tim và Vladimir Dokchitser (2010) và Nekovář.
Liên hệ với giả thuyết Birch--Dyer
- Hệ quả yếu nhất: Phỏng đoán tính chẵn lẻ là hệ quả yếu nhất có ý nghĩa của BSD yếu. Nó không cho giá trị hạng, chỉ cho tính chẵn lẻ. Nhưng ngay cả điều này cũng rất sâu --- vì $w(E)$ tính được (là tích cục bộ), còn hạng rất khó tính.
- Dấu gốc cục bộ: $w(E) = \prod_v w_v(E)$ (tích trên mọi chỗ $v$ kể cả $v = \infty$). Mỗi $w_v$ tính được bằng công thức tường minh. Phỏng đoán nói rằng tích cục bộ này xác định tính chẵn lẻ của một bất biến toàn cục (hạng).
- Tiến bộ: Phỏng đoán $p$-chẵn lẻ (parity cho $p$-Selmer) đã được chứng minh cho mọi $E/\mathbb{Q}$ (Nekovář, Dokchitser--Dokchitser). Đây là bằng chứng mạnh nhất ủng hộ BSD khi $r_{\mathrm{an}} \geq 2$.
- 50% hạng chẵn, 50% lẻ: Giả sử dấu gốc phân bố đều ($w = +1$ và $w = -1$ mỗi bên 50%), phỏng đoán tính chẵn lẻ + phỏng đoán Goldfeld gợi ý: 50% đường cong hạng $0$, 50% hạng $1$.
Định nghĩa
- $\zeta_K(s) = \sum_{\mathfrak{a} \neq 0} N(\mathfrak{a})^{-s}$: hàm zeta Dedekind,
- $h_K = |\mathrm{Cl}(\mathcal{O}_K)|$: số lớp (class number),
- $R_K$: regulator (định thức ma trận logarithm đơn vị cơ bản),
- $w_K = |\mu(K)|$: số nghiệm đơn vị (roots of unity),
- $d_K$: discriminant,
- $r_1$, $r_2$: số embedding thực và phức.
Ví dụ
- $K = \mathbb{Q}$: $\zeta_{\mathbb{Q}}(s) = \zeta(s)$ (hàm zeta Riemann). Cực tại $s = 1$ có thặng dư $1$. Vế phải: $h = 1$, $R = 1$, $w = 2$, $d = 1$, $r_1 = 1$, $r_2 = 0$. Ta có $2^1 \cdot 1 \cdot 1 / (2 \cdot 1) = 1$. Đúng!
- $K = \mathbb{Q}(i)$: $d_K = -4$, $r_1 = 0$, $r_2 = 1$, $w_K = 4$ ($\mu = \{\pm 1, \pm i\}$), $h_K = 1$, $R_K = 1$.
\[ \lim_{s \to 1}(s-1)\zeta_{\mathbb{Q}(i)}(s) = \frac{(2\pi) \cdot 1 \cdot 1}{4 \cdot 2} = \frac{\pi}{4} \approx 0.7854. \]Thực tế: $\zeta_{\mathbb{Q}(i)}(s) = \zeta(s) L(s, \chi_{-4})$ và $L(1, \chi_{-4}) = \pi/4$. Đúng!
- $K = \mathbb{Q}(\sqrt{-5})$: $d_K = -20$, $h_K = 2$ (nhóm lớp không tầm thường!), $w_K = 2$, $R_K = 1$.
\[ \lim_{s \to 1}(s-1)\zeta_K(s) = \frac{2\pi \cdot 2 \cdot 1}{2 \cdot \sqrt{20}} = \frac{2\pi}{\sqrt{20}} \approx 1.405. \]
Ý nghĩa trực giác
- Hàm giải tích $\leftrightarrow$ bất biến số học: Công thức số lớp là nguyên mẫu (prototype) cho BSD: hành vi của hàm $\zeta_K(s)$ tại $s = 1$ (giải tích) mã hóa các bất biến số học ($h_K$, $R_K$, $w_K$, $d_K$).
- Đã chứng minh: Công thức số lớp là định lý (Dirichlet, Dedekind, Hecke). BSD mạnh là phỏng đoán. Khoảng cách giữa hai kết quả --- về mặt kỹ thuật --- rất lớn, nhưng cấu trúc hoàn toàn song song.
Bảng tương ứng chi tiết:
| Trường số $K$ | Đường cong $E/\mathbb{Q}$ |
|---|---|
| $\zeta_K(s)$ | $L(E,s)$ |
| Cực đơn tại $s=1$ | Zero bậc $r$ tại $s=1$ |
| $h_K$ (số lớp) | $|\mathrm{Sha}(E/\mathbb{Q})|$ |
| $R_K$ (regulator) | $\mathrm{Reg}_E$ |
| $w_K$ (nghiệm đ.v.) | $|E(\mathbb{Q})_{\mathrm{tors}}|^2$ |
| $\sqrt{|d_K|}$ | $\sqrt{N_E}$ (conductor) |
| $2^{r_1}(2\pi)^{r_2}$ | $\Omega_E \cdot \prod c_p$ |
Liên hệ với giả thuyết Birch--Dyer
- Nguồn cảm hứng: Birch và Swinnerton-Dyer biết rõ công thức số lớp khi phát biểu giả thuyết. Công thức BSD mạnh được thiết kế để “giống” công thức số lớp nhất có thể, với mỗi bất biến tìm được đối tác tương ứng [birch-sd1965].
- Phỏng đoán Bloch--Kato: Cả hai công thức --- số lớp và BSD --- đều là trường hợp đặc biệt của phỏng đoán Bloch--Kato cho hàm $L$ của motif. Phỏng đoán này nói rằng mọi hàm $L$ đều có công thức dạng tương tự [bloch-kato1990].
- $h_K$ vs. $|\mathrm{Sha}|$: Số lớp $h_K$ đo “mức độ thất bại” của phân tích thừa số duy nhất trong $\mathcal{O}_K$. Tương tự, $|\mathrm{Sha}|$ đo “mức độ thất bại” của nguyên lý Hasse cho đường cong elliptic. Cả hai đều là nhóm hữu hạn (đã chứng minh cho $h_K$; phỏng đoán cho $|\mathrm{Sha}|$).
Định nghĩa
Số lớp $h_K = |\mathrm{Cl}(K)|$ luôn hữu hạn (định lý Minkowski). $h_K = 1$ khi và chỉ khi $\mathcal{O}_K$ là miền phân tích thừa số duy nhất (UFD).
Ví dụ
- $K = \mathbb{Q}(\sqrt{-1})$: $\mathcal{O}_K = \mathbb{Z}[i]$ (số nguyên Gauss). $h_K = 1$ --- phân tích thừa số duy nhất. Ví dụ: $5 = (2+i)(2-i)$, phân tích duy nhất.
- $K = \mathbb{Q}(\sqrt{-5})$: $\mathcal{O}_K = \mathbb{Z}[\sqrt{-5}]$. $h_K = 2$. Ví dụ nổi tiếng: $6 = 2 \cdot 3 = (1+\sqrt{-5})(1-\sqrt{-5})$, hai phân tích khác nhau! Ideal $(2)$, $(3)$ không phải ideal nguyên tố, nhưng:
\[ (2) = \mathfrak{p}_1^2, \quad (3) = \mathfrak{p}_2 \mathfrak{p}_3 \]với $\mathfrak{p}_1 = (2, 1+\sqrt{-5})$. Ideal $\mathfrak{p}_1$ không phải ideal chính --- đại diện cho lớp khác $1$ trong $\mathrm{Cl}(K) \cong \mathbb{Z}/2\mathbb{Z}$.
Bảng trường phức bậc hai $\mathbb{Q}(\sqrt{-d})$:
| $d$ | 1 | 2 | 3 | 5 | 6 | 7 | 23 | 163 |
|---|---|---|---|---|---|---|---|---|
| $h_K$ | 1 | 1 | 1 | 2 | 2 | 1 | 3 | 1 |
Ý nghĩa trực giác
- Hình dung: Trong $\mathbb{Z}$, mọi số nguyên có phân tích thừa số duy nhất. Trong $\mathcal{O}_K$ tổng quát, điều này có thể thất bại. Nhóm lớp đo “mức độ thất bại” --- nhóm càng lớn, phân tích càng “rối”.
- Ideal “sửa chữa”: Kummer phát hiện: dù phân tích phần tử không duy nhất, phân tích ideal luôn duy nhất (trong miền Dedekind). Nhóm lớp đo khoảng cách giữa “ideal” và “phần tử” --- tức giữa phân tích ideal duy nhất và phân tích phần tử duy nhất.
- “Ẩn” vs. “hiện”: Nhóm lớp giống $\mathrm{Sha}$ ở chỗ: cả hai đo thông tin “ẩn” mà ta không thấy khi chỉ nhìn cục bộ. Các ideal đều “trông như” ideal chính khi nhìn cục bộ (tại mỗi $p$), nhưng toàn cục thì không.
Liên hệ với giả thuyết Birch--Dyer
- Tương tự $\mathrm{Sha}$: Nhóm lớp $\mathrm{Cl}(K)$ là “tổ tiên” của nhóm Tate--Shafarevich $\mathrm{Sha}(E/\mathbb{Q})$. Cả hai:
- Đo “chướng ngại local-global” (nguyên lý Hasse thất bại).
- Xuất hiện trong “công thức khối lượng” (công thức số lớp / BSD mạnh).
- Được phỏng đoán/chứng minh hữu hạn.
• 9 discriminant Heegner: 9 trường $\mathbb{Q}(\sqrt{-d})$ có $h = 1$ ($d = 1, 2, 3, 7, 11, 19, 43, 67, 163$) liên quan trực tiếp đến xây dựng điểm Heegner. Điều kiện $h = 1$ đảm bảo điểm Heegner nằm trong $E(\mathbb{Q})$ (không cần trace).
• Lý thuyết trường lớp: Lý thuyết trường lớp cho $K$ Abel hóa $\mathrm{Gal}(\bar{K}/K)$ qua $\mathrm{Cl}(K)$. Phiên bản phi giao hoán (chương trình Langlands) kết nối biểu diễn Galois với dạng tự đẳng cấu --- framework tổng quát chứa cả BSD.
Định nghĩa
Định lý đơn vị Dirichlet: Nhóm đơn vị có cấu trúc:
Ví dụ
- $K = \mathbb{Q}$: $\mathcal{O}_{\mathbb{Q}}^{\times} = \mathbb{Z}^{\times} = \{\pm 1\} \cong \mathbb{Z}/2\mathbb{Z}$. Hạng đơn vị $= r_1 + r_2 - 1 = 1 + 0 - 1 = 0$.
- $K = \mathbb{Q}(\sqrt{-d})$ (trường phức bậc hai, $d > 0$): $r_1 = 0$, $r_2 = 1$. Hạng đơn vị $= 0 + 1 - 1 = 0$. Nhóm đơn vị hữu hạn:
- $d = 1$: $\mathcal{O}_K^{\times} = \{\pm 1, \pm i\} \cong \mathbb{Z}/4\mathbb{Z}$.
- $d = 3$: $\mathcal{O}_K^{\times} = \langle \zeta_6 \rangle \cong \mathbb{Z}/6\mathbb{Z}$ ($\zeta_6 = e^{2\pi i/6}$).
- $d \geq 4$: $\mathcal{O}_K^{\times} = \{\pm 1\} \cong \mathbb{Z}/2\mathbb{Z}$.
- $K = \mathbb{Q}(\sqrt{2})$ (trường thực bậc hai): $r_1 = 2$, $r_2 = 0$. Hạng đơn vị $= 2 + 0 - 1 = 1$. Nhóm đơn vị $\mathcal{O}_K^{\times} = \{\pm 1\} \times \langle 1 + \sqrt{2} \rangle \cong \mathbb{Z}/2\mathbb{Z} \times \mathbb{Z}$. Đơn vị cơ bản $\varepsilon = 1 + \sqrt{2}$ (vì $(1+\sqrt{2})(1-\sqrt{2}) = -1$).
Ý nghĩa trực giác
- Hình dung: Đơn vị trong $\mathcal{O}_K$ là các phần tử “không mất thông tin” khi nhân --- chúng có nghịch đảo. Trong $\mathbb{Z}$, chỉ có $\pm 1$. Trong vành số nguyên lớn hơn, có thêm đơn vị “phức tạp” (như $1 + \sqrt{2}$).
- Cấu trúc giống Mordell--Weil: So sánh:
Trường số $K$ Đường cong $E/\mathbb{Q}$ $\mathcal{O}_K^{\times} \cong \mu(K) \times \mathbb{Z}^{r_1+r_2-1}$ $E(\mathbb{Q}) \cong E(\mathbb{Q})_{\mathrm{tors}} \times \mathbb{Z}^r$ Phần hữu hạn: $\mu(K)$ Phần hữu hạn: $E(\mathbb{Q})_{\mathrm{tors}}$ Phần tự do: $\mathbb{Z}^{r_1+r_2-1}$ Phần tự do: $\mathbb{Z}^r$ Hạng: $r_1 + r_2 - 1$ Hạng: $r = \mathrm{rk}(E(\mathbb{Q}))$
Cả hai đều là nhóm Abel hữu hạn sinh = nhóm hữu hạn $\oplus$ phần tự do. - Regulator: Regulator $R_K = \det(\log |\sigma_i(\varepsilon_j)|)$ (ma trận logarithm đơn vị cơ bản) tương ứng với $\mathrm{Reg}_E = \det(\langle P_i, P_j \rangle)$ (ma trận chiều cao Néron--Tate).
Liên hệ với giả thuyết Birch--Dyer
- Tương tự $E(\mathbb{Q})$: Trong bảng tương ứng “trường số $\leftrightarrow$ đường cong elliptic”, nhóm đơn vị $\mathcal{O}_K^{\times}$ tương ứng với nhóm Mordell--Weil $E(\mathbb{Q})$. Cả hai:
- Là nhóm Abel hữu hạn sinh (Dirichlet / Mordell--Weil).
- Hạng xuất hiện trong bậc triệt tiêu tại $s=1$ (cực bậc $r_1+r_2-1$ / zero bậc $r$).
- Regulator xuất hiện trong hệ số hàng đầu.
• $w_K$ vs. $|E_{\mathrm{tors}}|^2$: Cỡ phần hữu hạn: $w_K = |\mu(K)|$ nằm ở mẫu trong công thức số lớp, tương tự $|E(\mathbb{Q})_{\mathrm{tors}}|^2$ ở mẫu trong BSD mạnh.
• Đơn vị elliptic: Trong lý thuyết BSD cho đường cong CM, đơn vị elliptic (elliptic units) [rubin1991] đóng vai trò kết nối giữa đơn vị cổ điển và điểm trên đường cong elliptic. Coates--Wiles dùng đơn vị elliptic để chứng minh BSD cho đường cong CM hạng $0$.
• Tổng quát hóa: Phỏng đoán Bloch--Kato thống nhất cả hai: nhóm $K$-theory $K_1(\mathcal{O}_K) \otimes \mathbb{Q}$ (chứa đơn vị) và nhóm Selmer (chứa điểm Mordell--Weil) đều là “nhóm Selmer mở rộng” cho các motif khác nhau.
Định nghĩa
Ví dụ
- Liên hợp phức: Phép liên hợp $\sigma: a + bi \mapsto a - bi$ mở rộng thành phần tử $c \in G_{\mathbb{Q}}$ có bậc $2$. Đây là phần tử duy nhất (lên đến liên hợp) tương ứng với “chỗ” $v = \infty$.
- Nhóm con cố định: Nếu $K = \mathbb{Q}(\sqrt{d})$ thì $\mathrm{Gal}(K/\mathbb{Q}) \cong \mathbb{Z}/2\mathbb{Z}$. Nhóm con $\mathrm{Gal}(\bar{\mathbb{Q}}/K) \subset G_{\mathbb{Q}}$ có chỉ số $2$, gồm các $\sigma$ cố định $\sqrt{d}$.
- Frobenius: Với mỗi nguyên tố $p$ không phân nhánh trong $K/\mathbb{Q}$, có phần tử Frobenius $\mathrm{Frob}_p \in \mathrm{Gal}(K/\mathbb{Q})$ xác định bởi $\mathrm{Frob}_p(x) \equiv x^p \pmod{\mathfrak{p}}$. Frobenius là “đại diện” của $p$ trong nhóm Galois --- mỗi nguyên tố gửi một “đại sứ” vào $G_{\mathbb{Q}}$.
- Cực kỳ phức tạp: $G_{\mathbb{Q}}$ là đối tượng “thần bí” nhất của toán học --- không ai biết cấu trúc đầy đủ. Nhưng biểu diễn của $G_{\mathbb{Q}}$ (cách $G_{\mathbb{Q}}$ tác động lên không gian vector) thì dễ nghiên cứu hơn nhiều.
Ý nghĩa trực giác
- Hình dung: Mỗi phương trình đa thức $f(x) = 0$ có nhóm Galois --- nhóm hoán vị các nghiệm giữ nguyên mọi quan hệ đại số. $G_{\mathbb{Q}}$ là “nhóm Galois vũ trụ” --- nó hoán vị mọi số đại số, giữ nguyên mọi quan hệ đại số.
- Tại sao “tuyệt đối”? Vì ta lấy $\bar{\mathbb{Q}}$ --- bao đóng đại số đầy đủ, không giới hạn trong mở rộng nào. Mọi nhóm Galois $\mathrm{Gal}(K/\mathbb{Q})$ đều là thương (quotient) của $G_{\mathbb{Q}}$.
- Tôpô profinite: $G_{\mathbb{Q}}$ có tôpô tự nhiên: tôpô Krull. Nó compact, totally disconnected, và “khổng lồ” (không đếm được). Nhưng mỗi “lát cắt” hữu hạn $\mathrm{Gal}(K/\mathbb{Q})$ thì dễ hiểu --- và $G_{\mathbb{Q}}$ là giới hạn của tất cả các lát cắt này.
Liên hệ với giả thuyết Birch--Dyer
- Biểu diễn Galois: Đường cong elliptic $E/\mathbb{Q}$ cho biểu diễn:
\[ \rho_{E,\ell}: G_{\mathbb{Q}} \to \mathrm{GL}_2(\mathbb{Z}_\ell) \]qua tác động trên module Tate $T_\ell(E) = \varprojlim E[\ell^n] \cong \mathbb{Z}_\ell^2$. Biểu diễn này mã hóa mọi thông tin số học của $E$ --- bao gồm $a_p = \mathrm{tr}(\rho_{E,\ell}(\mathrm{Frob}_p))$.
- Hàm $L$ từ $G_{\mathbb{Q}}$: Hàm $L(E,s) = \prod_p L_p(E,s)$ được xây dựng từ biểu diễn $\rho_{E,\ell}$. Thừa số Euler tại $p$ tốt: $L_p(E,s) = \det(I - p^{-s}\rho_{E,\ell}(\mathrm{Frob}_p))^{-1}$. BSD nói rằng hành vi tại $s=1$ xác định hạng.
- Đối đồng điều Galois: Nhóm Selmer và $\mathrm{Sha}$ được định nghĩa qua đối đồng điều $H^1(G_{\mathbb{Q}}, E[\ell^n])$ --- tác động của $G_{\mathbb{Q}}$ lên điểm xoắn. Không có $G_{\mathbb{Q}}$ thì không định nghĩa được Selmer.
- Chương trình Langlands: Phỏng đoán Langlands nói rằng mọi biểu diễn “tốt” của $G_{\mathbb{Q}}$ đều đến từ dạng tự đẳng cấu. Định lý modularity (Wiles) chứng minh điều này cho biểu diễn 2 chiều từ đường cong elliptic [wiles1995].
Định nghĩa
Ba bậc đầu tiên:
- $H^0(G, M) = M^G = \{m \in M : \sigma(m) = m \;\forall \sigma \in G\}$ --- các phần tử bất biến dưới $G$.
- $H^1(G, M) = Z^1(G,M) / B^1(G,M)$ --- thương của 1-cocycle modulo 1-coboundary (xem mục tiếp theo).
- $H^2(G, M)$ phân loại các mở rộng nhóm $0 \to M \to E \to G \to 1$ (lên đến tương đương).
Trong lý thuyết số, ta thường lấy $G = G_{\mathbb{Q}}$ hoặc $G = G_p = \mathrm{Gal}(\bar{\mathbb{Q}}_p/\mathbb{Q}_p)$ và $M = E[n]$ (điểm xoắn $n$-phần), $M = E(\bar{\mathbb{Q}})$, hoặc $M = \bar{\mathbb{Q}}^{\times}$.
Ví dụ
- Định lý 90 Hilbert: Cho $K/\mathbb{Q}$ mở rộng Galois hữu hạn. Khi đó:
\[ H^1(\mathrm{Gal}(K/\mathbb{Q}), K^{\times}) = 0. \]Nghĩa là: mọi 1-cocycle $\sigma \mapsto a_\sigma$ với $a_\sigma \in K^{\times}$ đều là coboundary. Đây là kết quả cổ điển của Hilbert (1897).
- $H^0$ --- điểm hữu tỉ: $H^0(G_{\mathbb{Q}}, E(\bar{\mathbb{Q}})) = E(\bar{\mathbb{Q}})^{G_{\mathbb{Q}}} = E(\mathbb{Q})$. Đối đồng điều bậc $0$ cho lại nhóm các điểm hữu tỉ --- đối tượng trung tâm của BSD!
- $H^1$ --- twist và torsor: $H^1(G_{\mathbb{Q}}, \mathrm{Aut}(E)) $ phân loại các twist của $E$ --- các đường cong “giống” $E$ trên $\bar{\mathbb{Q}}$ nhưng có thể khác trên $\mathbb{Q}$. Khi $\mathrm{Aut}(E) = \{\pm 1\}$, các twist tương ứng với $d \in \mathbb{Q}^{\times}/(\mathbb{Q}^{\times})^2$.
- Nhóm Brauer: $H^2(G_{\mathbb{Q}}, \bar{\mathbb{Q}}^{\times}) = \mathrm{Br}(\mathbb{Q})$ --- nhóm Brauer, phân loại các đại số chia trung tâm trên $\mathbb{Q}$.
Ý nghĩa trực giác
- Hình dung $H^0$: “Cái gì bất biến?” --- phần tử nào của $M$ không thay đổi dưới mọi $\sigma \in G$. Đây là câu hỏi đơn giản nhất.
- Hình dung $H^1$: “Hệ phương trình $\sigma(x) - x = a_\sigma$ có nghiệm không?” Mỗi 1-cocycle $(\sigma \mapsto a_\sigma)$ là “đề bài”. Nếu có $x$ giải được cho mọi $\sigma$ đồng thời, cocycle là coboundary ($a_\sigma = \sigma(x) - x$) và nằm trong lớp $0$. $H^1$ đo “phần không giải được” --- chướng ngại.
- Dãy chính xác dài: Cho $0 \to A \to B \to C \to 0$ dãy chính xác các $G$-module. Đối đồng điều cho dãy dài:
\[ 0 \to H^0(G,A) \to H^0(G,B) \to H^0(G,C) \xrightarrow{\delta} H^1(G,A) \to H^1(G,B) \to \cdots \]Ánh xạ biên $\delta$ “nâng” thông tin từ $H^0$ lên $H^1$ --- đây là công cụ chính để xây dựng nhóm Selmer.
Liên hệ với giả thuyết Birch--Dyer
- Nền tảng: Nhóm Selmer $\mathrm{Sel}_n(E/\mathbb{Q}) \subset H^1(G_{\mathbb{Q}}, E[n])$ và nhóm Tate--Shafarevich $\mathrm{Sha}(E/\mathbb{Q}) \subset H^1(G_{\mathbb{Q}}, E)$ đều là nhóm con của đối đồng điều Galois bậc $1$. Không có $H^1$ thì không định nghĩa được hai đối tượng quan trọng nhất trong BSD mạnh.
- Ánh xạ biên Kummer: Từ dãy chính xác $0 \to E[n] \to E \xrightarrow{[n]} E \to 0$, ánh xạ biên $\delta: E(\mathbb{Q})/nE(\mathbb{Q}) \hookrightarrow H^1(G_{\mathbb{Q}}, E[n])$ nhúng “thông tin hạng” vào đối đồng điều. Ảnh của $\delta$ nằm trong $\mathrm{Sel}_n$.
- Đối ngẫu: Các định lý đối ngẫu (Tate, Poitou--Tate) cho $H^i$ cung cấp công cụ chính để chặn cỡ Selmer --- từ đó suy ra kết quả về hạng và $\mathrm{Sha}$ [silverman2009].
Định nghĩa
Khi $G$ tác động tầm thường (trivially) trên $M$ (tức $\sigma \cdot m = m$ $\forall \sigma, m$), điều kiện trở thành $\xi(\sigma\tau) = \xi(\sigma) + \xi(\tau)$ --- tức $\xi$ là đồng cấu nhóm $G \to M$, và $Z^1(G,M) = \mathrm{Hom}(G, M)$.
Ví dụ
- $G = \mathrm{Gal}(\mathbb{Q}(\sqrt{d})/\mathbb{Q}) = \{1, \sigma\}$, $M = \mathbb{Q}(\sqrt{d})^{\times}$: Một 1-cocycle $\xi$ xác định bởi $\xi(\sigma) = a \in \mathbb{Q}(\sqrt{d})^{\times}$ (vì $\xi(1) = 0$ luôn đúng). Điều kiện cocycle: $\xi(\sigma^2) = \xi(\sigma) + \sigma(\xi(\sigma))$. Vì $\sigma^2 = 1$: $0 = a + \sigma(a)$, tức $\sigma(a) = -a$. Vậy $a$ phải có $\sigma(a) = -a$, nghĩa là $a = b\sqrt{d}$ cho $b \in \mathbb{Q}^{\times}$.
- $G = G_{\mathbb{Q}}$, $M = E[2]$ cho $E: y^2 = (x-e_1)(x-e_2)(x-e_3)$: Một 1-cocycle $\xi: G_{\mathbb{Q}} \to E[2]$ gửi mỗi $\sigma$ đến một điểm xoắn bậc $2$, thỏa điều kiện cocycle. Các cocycle này “mã hóa” các đường cong Selmer --- torsor cho $E$ qua phép nhân $2$.
- Tác động tầm thường: $G = G_{\mathbb{Q}}$, $M = \mathbb{Z}/n\mathbb{Z}$ (tác động tầm thường). Khi đó $Z^1(G_{\mathbb{Q}}, \mathbb{Z}/n\mathbb{Z}) = \mathrm{Hom}(G_{\mathbb{Q}}, \mathbb{Z}/n\mathbb{Z})$ --- tập các đặc trưng bậc $n$ của $G_{\mathbb{Q}}$, tương ứng 1-1 với mở rộng Abel bậc $n$ của $\mathbb{Q}$ (lý thuyết trường lớp).
Ý nghĩa trực giác
- Hình dung: Nếu $G$ tác động tầm thường, 1-cocycle chính là đồng cấu. Khi tác động không tầm thường, điều kiện cocycle “bẻ cong” đồng cấu: $\xi(\sigma\tau) \neq \xi(\sigma) + \xi(\tau)$ mà có thêm số hạng $\sigma \cdot \xi(\tau)$ phản ánh tác động.
- “Đạo hàm xoắn”: Nghĩ $\xi$ như “đạo hàm” (derivation): nó đo sự thay đổi khi đi theo $\sigma$, nhưng bị xoắn bởi tác động. Trong lý thuyết nhóm đại số, 1-cocycle đúng là derivation $G \to M$.
- Torsor: Mỗi lớp trong $H^1(G, M) = Z^1/B^1$ tương ứng với một torsor (không gian thuần nhất chính) --- đối tượng “giống $M$” nhưng không có điểm gốc tự nhiên. Nếu torsor có điểm hữu tỉ, lớp cocycle tương ứng là $0$.
Liên hệ với giả thuyết Birch--Dyer
- Xây dựng Selmer: Ánh xạ biên Kummer $\delta: E(\mathbb{Q})/nE(\mathbb{Q}) \to H^1(G_{\mathbb{Q}}, E[n])$ gửi mỗi điểm $P \in E(\mathbb{Q})$ đến một 1-cocycle $\xi_P: \sigma \mapsto \sigma(Q) - Q$ trong đó $Q \in E(\bar{\mathbb{Q}})$ thỏa $nQ = P$. Điều kiện cocycle tự động thỏa vì $\sigma(Q) - Q \in E[n]$.
- $\mathrm{Sha}$ = cocycle “ẩn”: Phần tử của $\mathrm{Sha}$ là lớp cocycle trong $H^1(G_{\mathbb{Q}}, E)$ mà cục bộ tại mọi $p$ đều là coboundary (torsor có điểm $p$-adic) nhưng toàn cục không phải coboundary (torsor không có điểm hữu tỉ).
- 2-descent: Thuật toán 2-descent thực chất là liệt kê các 1-cocycle $G_{\mathbb{Q}} \to E[2]$ thỏa điều kiện cục bộ, tức tính $\mathrm{Sel}_2(E/\mathbb{Q})$ [silverman2009].
Định nghĩa
Kiểm tra: $\xi(\sigma) = \sigma(m) - m$ thỏa điều kiện cocycle vì:
$H^1(G, M) = Z^1(G, M) / B^1(G, M)$ --- đối đồng điều bậc $1$ đo “cocycle modulo coboundary”.
Ví dụ
- $G = \{1, \sigma\}$, $M = \mathbb{Z}$ với $\sigma(n) = -n$: Coboundary bởi $m \in \mathbb{Z}$: $\xi(\sigma) = \sigma(m) - m = -m - m = -2m$. Vậy $B^1(G, \mathbb{Z}) = \{0 \mapsto 0, \sigma \mapsto -2m : m \in \mathbb{Z}\} \cong 2\mathbb{Z}$. Cocycle: $\xi(\sigma) = k$ với $\xi(\sigma^2) = \xi(\sigma) + \sigma(\xi(\sigma)) = k + (-k) = 0$. Vậy $Z^1(G, \mathbb{Z}) \cong \mathbb{Z}$. Do đó $H^1(G, \mathbb{Z}) = \mathbb{Z} / 2\mathbb{Z}$.
- Torsor tầm thường: Nếu $\xi \in B^1(G_{\mathbb{Q}}, E(\bar{\mathbb{Q}}))$, tức $\xi(\sigma) = \sigma(P) - P$ cho $P \in E(\bar{\mathbb{Q}})$, thì torsor tương ứng “có điểm hữu tỉ” --- vì $P$ chính là điểm đó (khi dịch chuyển).
- Kummer: Cho $P \in E(\mathbb{Q})$ và $Q \in E(\bar{\mathbb{Q}})$ với $nQ = P$. Cocycle $\xi_P(\sigma) = \sigma(Q) - Q$ là coboundary $\Leftrightarrow$ tồn tại $R \in E(\bar{\mathbb{Q}})$ sao cho $\sigma(Q) - Q = \sigma(R) - R$ $\forall \sigma$ $\Leftrightarrow$ $Q - R \in E(\mathbb{Q})$ $\Leftrightarrow$ $P \in nE(\mathbb{Q})$.
Ý nghĩa trực giác
- Hình dung: Coboundary là cocycle “hiển nhiên” --- nó đến từ một phần tử $m$ cụ thể trong $M$. Nếu cocycle $\xi$ là coboundary, chướng ngại mà nó đại diện “giải được” bằng cách chọn $m$.
- $H^1$ = “phần thú vị”: Lấy thương $Z^1/B^1$ loại bỏ cocycle tầm thường, chỉ giữ lại phần “không giải được” --- chướng ngại thực sự. Đây là triết lý xuyên suốt đối đồng điều: đo cái “không tầm thường”.
- Tương tự de Rham: Trong giải tích, 1-form đóng (closed, $d\omega = 0$) $\leftrightarrow$ cocycle. 1-form chính xác (exact, $\omega = df$) $\leftrightarrow$ coboundary. Đối đồng điều de Rham $H^1_{\mathrm{dR}} = \{\text{đóng}\}/\{\text{chính xác}\}$ --- cùng triết lý!
Liên hệ với giả thuyết Birch--Dyer
- Điểm hữu tỉ = coboundary: Trong ánh xạ Kummer $\delta: E(\mathbb{Q})/nE(\mathbb{Q}) \to H^1(G_{\mathbb{Q}}, E[n])$, những $P \in nE(\mathbb{Q})$ cho cocycle $\equiv 0$ (coboundary). Phần “còn lại” $E(\mathbb{Q})/nE(\mathbb{Q}) \hookrightarrow H^1$ chính là thông tin hạng.
- $\mathrm{Sha}$ = “cocycle không phải coboundary toàn cục”: Phần tử $\xi \in \mathrm{Sha}$ là cocycle mà với mọi $p$, hạn chế $\xi|_{G_p} \in B^1(G_p, E)$ (coboundary cục bộ), nhưng $\xi \notin B^1(G_{\mathbb{Q}}, E)$ (không phải coboundary toàn cục). Khoảng cách giữa “cục bộ coboundary” và “toàn cục coboundary” chính là $\mathrm{Sha}$.
- Dãy chính xác cơ bản: $0 \to E(\mathbb{Q})/nE(\mathbb{Q}) \xrightarrow{\delta} \mathrm{Sel}_n(E/\mathbb{Q}) \to \mathrm{Sha}(E/\mathbb{Q})[n] \to 0$. Mỗi phần tử Selmer là cocycle thỏa điều kiện cục bộ. Phần coboundary toàn cục cho ảnh của $\delta$ (hạng). Phần còn lại là $\mathrm{Sha}[n]$.
Định nghĩa
Các ánh xạ biên (connecting homomorphisms) $\delta_i: H^i(G,C) \to H^{i+1}(G,A)$ là phần “thú vị” nhất --- chúng không đến từ $f$ hay $g$, mà xuất hiện vì $A \to B$ không phải đẳng cấu.
Ví dụ
Dãy chính xác dài:
Từ đây:
- $\ker \delta = \mathrm{im}([n]) = nE(\mathbb{Q})$, nên $\delta$ “nhúng” $E(\mathbb{Q})/nE(\mathbb{Q}) \hookrightarrow H^1(G_{\mathbb{Q}}, E[n])$.
- $\mathrm{im}\,\delta = \ker(H^1(G_{\mathbb{Q}}, E[n]) \to H^1(G_{\mathbb{Q}}, E))$.
Ý nghĩa trực giác
- Hình dung: Dãy chính xác ngắn $A \hookrightarrow B \twoheadrightarrow C$ nói “$B$ được xây từ $A$ và $C$”. Nhưng khi lấy phần $G$-bất biến ($H^0$), phép “xây” này có thể hỏng: $H^0(B) \to H^0(C)$ có thể không toàn ánh. Phần “thiếu” được bù bằng $\delta: H^0(C) \to H^1(A)$ --- thông tin “rơi” từ bậc $0$ xuống bậc $1$.
- “Nấc thang”: Cứ mỗi lần thông tin bị “kẹt” ở bậc $i$, nó “rơi xuống” bậc $i+1$ qua ánh xạ biên $\delta_i$. Dãy dài là hệ quả tất yếu: chướng ngại ở bậc thấp trở thành dữ liệu ở bậc cao.
- $\delta$ “tạo ra” cocycle: Ánh xạ biên $\delta$ hoạt động: lấy $c \in H^0(G,C) = C^G$, nâng lên $b \in B$ (chọn preimage), tính $\sigma(b) - b$ --- đây phải nằm trong $A$ (vì $g(\sigma(b) - b) = \sigma(c) - c = 0$), và hàm $\sigma \mapsto \sigma(b) - b$ chính là 1-cocycle trong $Z^1(G, A)$.
Liên hệ với giả thuyết Birch--Dyer
- Xương sống: Toàn bộ lý thuyết Selmer/$\mathrm{Sha}$ được xây trên dãy chính xác dài Kummer. Từ $0 \to E[n] \to E \to E \to 0$, dãy dài cho:
\[ 0 \to E(\mathbb{Q})/nE(\mathbb{Q}) \to \mathrm{Sel}_n(E/\mathbb{Q}) \to \mathrm{Sha}(E/\mathbb{Q})[n] \to 0 \](sau khi thêm điều kiện cục bộ). Đây là dãy cơ bản nhất trong BSD.
- Cận hạng: Từ dãy trên: $\mathrm{rk}(E(\mathbb{Q})) \leq \dim_{\mathbb{F}_p} \mathrm{Sel}_p(E/\mathbb{Q}) - \dim_{\mathbb{F}_p} E(\mathbb{Q})[p]$. Tính $\mathrm{Sel}_p$ (khả thi bằng descent) cho cận trên của hạng.
- Nhiều dãy: Ngoài Kummer, các dãy chính xác dài khác (Poitou--Tate, localization sequence) cung cấp thêm thông tin. Kết hợp chúng cho phép chặn $|\mathrm{Sha}|$ --- bước then chốt trong các chứng minh BSD phần.
Định nghĩa
- $\delta$ là ánh xạ biên Kummer: $P \mapsto [\sigma \mapsto \sigma(Q) - Q]$ với $nQ = P$,
- $H^1(G_{\mathbb{Q}}, E)[n] = \ker([n]: H^1(G_{\mathbb{Q}}, E) \to H^1(G_{\mathbb{Q}}, E))$.
Ví dụ
Bước 1: Tìm $Q$ với $2Q = P$. Trên $\bar{\mathbb{Q}}$: $Q = (\alpha, \beta)$ thỏa $2Q = (0,0)$. Tính: $Q = \left(\frac{1+\sqrt{-1}}{2}, \ldots\right) \notin E(\mathbb{Q})$.
Bước 2: Tác động Galois: $\sigma \in G_{\mathbb{Q}}$ cho $\sigma(Q)$. Vì $Q \notin E(\mathbb{Q})$, $\sigma(Q) \neq Q$ với một số $\sigma$.
Bước 3: Tính cocycle: $\xi_P(\sigma) = \sigma(Q) - Q \in E[2]$. Đây là 1-cocycle $G_{\mathbb{Q}} \to E[2] \cong (\mathbb{Z}/2\mathbb{Z})^2$.
Bước 4: Lớp $[\xi_P] \in H^1(G_{\mathbb{Q}}, E[2])$. Vì $P = (0,0) \in E(\mathbb{Q})[2] = E[2] \cap E(\mathbb{Q})$, ta có $P \in 2E(\mathbb{Q})$ $\Leftrightarrow$ $[\xi_P] = 0$. Thực tế $(0,0) \notin 2E(\mathbb{Q})$ nên $[\xi_P] \neq 0$ --- đóng góp $1$ chiều vào $\mathrm{Sel}_2$.
Ý nghĩa trực giác
- Ý tưởng: Để tính hạng $r = \mathrm{rk}(E(\mathbb{Q}))$, ta cần biết $E(\mathbb{Q})/nE(\mathbb{Q})$. Nhưng nhóm này khó tính trực tiếp. Ánh xạ Kummer $\delta$ “nhúng” nó vào $H^1(G_{\mathbb{Q}}, E[n])$ --- đối tượng đối đồng điều có thể tính bằng phương pháp đại số.
- Selmer “bao” hạng: $E(\mathbb{Q})/nE(\mathbb{Q}) \hookrightarrow \mathrm{Sel}_n(E/\mathbb{Q}) \twoheadrightarrow \mathrm{Sha}(E/\mathbb{Q})[n]$. Sel chứa thông tin hạng (ảnh của $\delta$) và $\mathrm{Sha}[n]$ (phần dư). Nếu $\mathrm{Sha}[n] = 0$, Selmer cho hạng chính xác.
- Tại sao “Kummer”? Dãy tương tự cho $\mathbb{G}_m$: $0 \to \mu_n \to \bar{\mathbb{Q}}^{\times} \xrightarrow{x \mapsto x^n} \bar{\mathbb{Q}}^{\times} \to 0$ cho dãy Kummer cổ điển:
\[ \mathbb{Q}^{\times}/(\mathbb{Q}^{\times})^n \hookrightarrow H^1(G_{\mathbb{Q}}, \mu_n) \cong \mathbb{Q}^{\times}/(\mathbb{Q}^{\times})^n \](đẳng cấu nhờ Hilbert 90). Dãy Kummer cho $E$ là tổng quát hóa phi giao hoán.
Liên hệ với giả thuyết Birch--Dyer
- Dãy cơ bản nhất: Dãy $0 \to E(\mathbb{Q})/nE(\mathbb{Q}) \to \mathrm{Sel}_n \to \mathrm{Sha}[n] \to 0$ là xương sống của mọi phương pháp tính hạng. Descent = tính Selmer. $\mathrm{Sha}[n]$ = sai số.
- Cận hạng: $|E(\mathbb{Q})/nE(\mathbb{Q})| = n^r \cdot |E(\mathbb{Q})[n]|$ (với $r = \mathrm{rk}$). Vậy $\log_n |\mathrm{Sel}_n| = r + \log_n |E(\mathbb{Q})[n]| + \log_n |\mathrm{Sha}[n]|$. Tính $|\mathrm{Sel}_n|$ cho cận trên $r \leq \log_n |\mathrm{Sel}_n| - \dim E(\mathbb{Q})[n]$.
- Bhargava--Shankar: Kết quả $\mathrm{avg}|\mathrm{Sel}_n| = \sigma(n)$ [bhargava-shankar2015] nói rằng “trung bình” Selmer nhỏ. Kết hợp với dãy Kummer: “hầu hết” đường cong có $r \leq 1$ và $\mathrm{Sha}[n]$ nhỏ --- dẫn đến 66.48% thỏa BSD [bhargava-skinner-zhang2014].
- Chọn $n$: $n = 2$ dễ tính nhất (2-descent cổ điển). $n = 3, 4, 5$ cho thông tin tốt hơn (phát hiện $\mathrm{Sha}$ bậc cao). Kết hợp nhiều $n$ cho cận tối ưu [fisher2008].
Định nghĩa
- Nâng: Chọn $Q \in E(\bar{\mathbb{Q}})$ sao cho $[n]Q = P$ (tồn tại vì $[n]$ toàn ánh trên $\bar{\mathbb{Q}}$).
- Tác động Galois: Với mỗi $\sigma \in G_{\mathbb{Q}}$, tính $\sigma(Q) - Q$.
- Cocycle: Vì $[n](\sigma(Q) - Q) = \sigma(P) - P = 0$ (do $P \in E(\mathbb{Q})$), ta có $\sigma(Q) - Q \in E[n]$.
- Kết quả: Hàm $\xi_P: G_{\mathbb{Q}} \to E[n]$, $\sigma \mapsto \sigma(Q) - Q$ là 1-cocycle. Đặt $\delta(P) = [\xi_P] \in H^1(G_{\mathbb{Q}}, E[n])$.
Ánh xạ $\delta$ đơn ánh: $\ker \delta = nE(\mathbb{Q})/nE(\mathbb{Q}) = 0$, nghĩa là $\delta(P) = 0 \Leftrightarrow P \in nE(\mathbb{Q})$.
Ví dụ
- $E: y^2 = x^3 + 1$, $n = 3$, $P = (2, 3)$: Cần tìm $Q$ với $3Q = P$. Điểm $Q$ nằm trong mở rộng bậc $9$ của $\mathbb{Q}$ (vì $|E[3]| = 9$). Cocycle $\xi_P(\sigma) = \sigma(Q) - Q$ ghi nhận cách Galois “xáo trộn” nghiệm $Q$. Nếu $P \notin 3E(\mathbb{Q})$ thì $[\xi_P] \neq 0$ trong $H^1(G_{\mathbb{Q}}, E[3])$.
- $E: y^2 = x^3 - x$, $n = 2$: Điểm xoắn $P = (0,0) \in E[2]$. Tìm $Q$ với $2Q = (0,0)$: tọa độ $Q$ thuộc $\mathbb{Q}(i)$. Cocycle: $\xi_{(0,0)}(\sigma) = \sigma(Q) - Q \in E[2]$. Liên hợp phức $c$ cho $c(Q) \neq Q$ nên $\xi \neq 0$.
- $P \in nE(\mathbb{Q})$: Nếu $P = nR$ với $R \in E(\mathbb{Q})$ thì chọn $Q = R$ --- cocycle $\xi_P(\sigma) = \sigma(R) - R = 0$ $\forall \sigma$. Vậy $\delta(P) = 0$, khẳng định $\ker \delta = nE(\mathbb{Q})$.
Ý nghĩa trực giác
- Ý tưởng cốt lõi: Muốn biết $P$ có phải “bội $n$” không (tức $P = nR$ cho $R \in E(\mathbb{Q})$?). Nhưng kiểm tra trực tiếp khó. Thay vào đó: nâng $P$ lên $Q$ (trên $\bar{\mathbb{Q}}$), rồi xem Galois “phá” $Q$ thế nào. Nếu $Q$ sống sót (tức $Q \in E(\mathbb{Q})$) thì $P \in nE(\mathbb{Q})$. Nếu không, mức độ “phá” được mã hóa bởi cocycle $\xi_P$.
- Tại sao không phụ thuộc chọn $Q$? Nếu chọn $Q'$ khác với $nQ' = P$, thì $Q' = Q + T$ cho $T \in E[n]$. Cocycle mới: $\sigma(Q') - Q' = \sigma(Q) - Q + \sigma(T) - T$. Số hạng $\sigma(T) - T$ là coboundary --- lớp $[\xi_P]$ không đổi.
- Đơn ánh = “không mất thông tin”: $\delta$ nhúng trung thành $E(\mathbb{Q})/nE(\mathbb{Q})$ vào $H^1$. Mỗi lớp kề $P + nE(\mathbb{Q})$ tương ứng duy nhất một lớp cocycle --- thông tin hạng được bảo toàn hoàn toàn.
Liên hệ với giả thuyết Birch--Dyer
- Nhúng hạng vào Selmer: Ảnh $\mathrm{im}(\delta) \subset \mathrm{Sel}_n(E/\mathbb{Q}) \subset H^1(G_{\mathbb{Q}}, E[n])$. Dãy cơ bản:
\[ 0 \to E(\mathbb{Q})/nE(\mathbb{Q}) \xrightarrow{\delta} \mathrm{Sel}_n(E/\mathbb{Q}) \to \mathrm{Sha}(E/\mathbb{Q})[n] \to 0. \]Chiều $\mathbb{F}_p$ của $\mathrm{im}(\delta) \cong E(\mathbb{Q})/nE(\mathbb{Q})$ là $r + \dim E(\mathbb{Q})[n]$ (với $r = \mathrm{rk}$, $n = p$ nguyên tố).
- Descent = tính ảnh $\delta$: 2-descent cổ điển: liệt kê phần tử $\mathrm{Sel}_2$ rồi xác định cái nào thuộc $\mathrm{im}(\delta)$ (tức có điểm hữu tỉ). Phần không thuộc ảnh = $\mathrm{Sha}[2]$ [silverman2009].
- Tính $a_p$ từ $\delta$: Frobenius $\mathrm{Frob}_p$ tác động trên $E[n]$ cho biểu diễn $\rho_{E,n}$. Ánh xạ biên cục bộ $\delta_p: E(\mathbb{Q}_p)/nE(\mathbb{Q}_p) \to H^1(G_p, E[n])$ liên hệ thông tin cục bộ tại $p$ --- cần cho điều kiện Selmer.
Định nghĩa
Nói cách khác: $\xi \in \mathrm{Sel}_n$ nếu và chỉ nếu với mỗi $v$, ảnh của $\xi$ trong $H^1(G_v, E(\bar{\mathbb{Q}}_v))$ bằng $0$ --- tức torsor tương ứng có điểm $v$-adic (có điểm $p$-adic với mọi $p$, và có điểm thực).
Nhóm Selmer luôn hữu hạn --- đây là sự thật không tầm thường, là nền tảng cho descent.
Ví dụ
- $E: y^2 = x^3 - x$ (conductor 32), $n = 2$: Nhóm $E[2] = \{O, (0,0), (1,0), (-1,0)\} \cong (\mathbb{Z}/2\mathbb{Z})^2$. 2-descent cho $\mathrm{Sel}_2(E/\mathbb{Q}) \cong (\mathbb{Z}/2\mathbb{Z})^2$, toàn bộ đến từ $E(\mathbb{Q})/2E(\mathbb{Q}) \cong (\mathbb{Z}/2\mathbb{Z})^2$ (vì $E(\mathbb{Q}) = E(\mathbb{Q})[2] \cong (\mathbb{Z}/2\mathbb{Z})^2$, hạng $0$). Do đó $\mathrm{Sha}(E/\mathbb{Q})[2] = 0$.
- $E: y^2 = x^3 - 25x$ (rank 1), $n = 2$: 2-descent cho $\mathrm{Sel}_2 \cong (\mathbb{Z}/2\mathbb{Z})^3$. Vì $E(\mathbb{Q})[2] \cong (\mathbb{Z}/2\mathbb{Z})^2$ và $\mathrm{rk} = 1$: $|E(\mathbb{Q})/2E(\mathbb{Q})| = 2^1 \cdot 4 = 8$. Nhưng $|\mathrm{Sel}_2| = 8$ vậy $\mathrm{Sha}[2] = 0$.
- $E: y^2 + y = x^3 - x^2 - 10x - 20$ (conductor 11, rank 0): $E(\mathbb{Q}) = \mathbb{Z}/5\mathbb{Z}$. Với $n = 5$: $\mathrm{Sel}_5 \cong \mathbb{Z}/5\mathbb{Z}$, toàn bộ đến từ $E(\mathbb{Q})/5E(\mathbb{Q})$.
Ý nghĩa trực giác
- Hình dung: Muốn tìm điểm hữu tỉ trên $E$ (modulo $n$). Kiểm tra trực tiếp khó. Thay vào đó, kiểm tra từng “địa phương” ($p$-adic, thực): tại mỗi nơi $v$, torsor có điểm không? Những cocycle vượt qua mọi kiểm tra cục bộ tạo thành Selmer.
- Selmer “bao” hạng: $E(\mathbb{Q})/nE(\mathbb{Q}) \hookrightarrow \mathrm{Sel}_n(E/\mathbb{Q})$. Mỗi điểm hữu tỉ (mod $n$) tự động thỏa điều kiện cục bộ. Nhưng Selmer có thể lớn hơn: phần dư $\mathrm{Sel}_n / \mathrm{im}(\delta) = \mathrm{Sha}[n]$ --- “ảo ảnh” vượt qua sàng cục bộ nhưng không đến từ điểm hữu tỉ toàn cục.
- Tại sao hữu hạn? Hai lý do: (1) $E[n]$ hữu hạn nên $H^1(G_{\mathbb{Q}}, E[n])$ “lớn” nhưng (2) điều kiện cục bộ tại mọi $v$ cắt xuống nhóm hữu hạn. Đây là hệ quả của compact-ness trong tôpô adelic.
- Tính được! Không giống $E(\mathbb{Q})$ (có thể rất khó tính), $\mathrm{Sel}_n$ có thuật toán xác định trong thời gian hữu hạn (descent). Đây là ưu điểm thực hành lớn nhất.
Liên hệ với giả thuyết Birch--Dyer
- Dãy cơ bản: $0 \to E(\mathbb{Q})/nE(\mathbb{Q}) \xrightarrow{\delta} \mathrm{Sel}_n(E/\mathbb{Q}) \to \mathrm{Sha}(E/\mathbb{Q})[n] \to 0$. Đây là “bản đồ” quan trọng nhất: Selmer = hạng $+$ $\mathrm{Sha}$.
- Cận hạng: $\mathrm{rk}(E/\mathbb{Q}) = \dim_{\mathbb{F}_p} \mathrm{Sel}_p - \dim_{\mathbb{F}_p} E[p]^{G_{\mathbb{Q}}} - \dim_{\mathbb{F}_p} \mathrm{Sha}[p]$. Nếu biết $\mathrm{Sha}[p] = 0$ (hoặc chặn được) thì Selmer cho hạng.
- Bhargava--Shankar: Trung bình $|\mathrm{Sel}_n|$ trên mọi $E/\mathbb{Q}$: $\mathrm{avg}|\mathrm{Sel}_2| = 3$, $\mathrm{avg}|\mathrm{Sel}_3| = 4$, $\mathrm{avg}|\mathrm{Sel}_5| = 6$ [bhargava-shankar2015]. Kết hợp với Skinner--Zhang: ít nhất $66.48\%$ đường cong thỏa BSD [bhargava-skinner-zhang2014].
- Selmer $p$-adic: Giới hạn $\mathrm{Sel}_{p^\infty}(E/\mathbb{Q}) = \varinjlim \mathrm{Sel}_{p^n}$ --- module trên đại số Iwasawa $\Lambda$. Phỏng đoán chính Iwasawa (Skinner--Urban) liên hệ cấu trúc module này với hàm $L$ $p$-adic [skinner-urban2014].
Định nghĩa
Nói cách khác: $\xi \in \mathrm{Sha}$ là 1-cocycle $G_{\mathbb{Q}} \to E(\bar{\mathbb{Q}})$ sao cho tại mỗi nơi $v$, hạn chế $\xi|_{G_v}$ là coboundary (torsor tương ứng có điểm $v$-adic), nhưng toàn cục $\xi$ không phải coboundary (torsor không có điểm hữu tỉ).
$\mathrm{Sha}$ nằm trong dãy chính xác:
Ví dụ
- $\mathrm{Sha} = 0$ (hầu hết đường cong): Đường cong $y^2 = x^3 - x$ có $\mathrm{Sha} = 0$ (chứng minh bởi Rubin [rubin1991] vì đây là đường cong CM với $L(E,1) \neq 0$). Tương tự cho hầu hết đường cong conductor nhỏ trong LMFDB.
- $\mathrm{Sha} \neq 0$, ví dụ cổ điển: Đường cong Selmer $3a^3 + 4b^3 + 5c^3 = 0$ là torsor cho đường cong elliptic $E$ bậc $3$. Nó có điểm $p$-adic với mọi $p$ (và điểm thực) nhưng không có điểm hữu tỉ (Selmer 1951) [cassels1962]. Đây là phần tử không tầm thường của $\mathrm{Sha}(E/\mathbb{Q})[3]$.
- $\mathrm{Sha}$ lớn tùy ý: Cassels chứng minh rằng $|\mathrm{Sha}(E/\mathbb{Q})[n]|$ có thể lớn tùy ý: với mọi $N$, tồn tại $E/\mathbb{Q}$ có $|\mathrm{Sha}[3]| > N$ [cassels1962]. Tương tự cho $\mathrm{Sha}[p]$ với $p$ bất kỳ.
- Kiểm nghiệm số: Đường cong 571a1 ($y^2 + y = x^3 - x^2 - 929x - 10595$, rank 0): phân tích số cho $|\mathrm{Sha}| = 4$, tức $\mathrm{Sha} \cong (\mathbb{Z}/2\mathbb{Z})^2$. BSD mạnh dự đoán chính xác con số này.
Ý nghĩa trực giác
- Nguyên lý cục bộ--toàn cục: Nếu một phương trình có nghiệm thực và $p$-adic với mọi $p$, nó “nên” có nghiệm hữu tỉ. Cho bậc 2 (phương trình bậc hai), điều này đúng (Hasse--Minkowski). Nhưng cho đường cong elliptic, không đúng: $\mathrm{Sha}$ đo chính xác sự thất bại.
- “Ảo ảnh”: Phần tử $\mathrm{Sha}$ là torsor (đường cong “giống” $E$) có điểm ở mọi nơi cục bộ nhưng không có điểm toàn cục. Nó “trông giống” có nghiệm nhưng thực ra không có --- ảo ảnh hoàn hảo.
- $|\mathrm{Sha}|$ luôn là bình phương hoàn hảo: Ghép đôi Cassels--Tate $\mathrm{Sha} \times \mathrm{Sha} \to \mathbb{Q}/\mathbb{Z}$ phản đối xứng, suy ra $|\mathrm{Sha}|$ (nếu hữu hạn) là bình phương. Đây là ràng buộc mạnh, chưa chứng minh đầy đủ nhưng đúng trong mọi trường hợp tính được [poonen-stoll1999].
- Phỏng đoán: $\mathrm{Sha}(E/\mathbb{Q})$ hữu hạn cho mọi $E$ --- đây là phỏng đoán quan trọng, vẫn mở cho hạng $\geq 2$.
Liên hệ với giả thuyết Birch--Dyer
- BSD mạnh: Hệ số hàng đầu của $L(E,s)$ tại $s = 1$:
\[ \frac{L^{(r)}(E,1)}{r!} = \frac{|\mathrm{Sha}(E/\mathbb{Q})| \cdot \Omega_E \cdot \mathrm{Reg}_E \cdot \prod_p c_p}{|E(\mathbb{Q})_{\mathrm{tors}}|^2}. \]$|\mathrm{Sha}|$ xuất hiện ở tử --- nó đóng góp trực tiếp vào giá trị đặc biệt. Biết $|\mathrm{Sha}|$ cần thiết để kiểm nghiệm BSD mạnh.
- Hữu hạn = cần thiết: BSD mạnh yêu cầu $\mathrm{Sha}$ hữu hạn (để $|\mathrm{Sha}|$ có nghĩa). Nếu $\mathrm{Sha}$ vô hạn, công thức vô nghĩa. Đây là lý do “$\mathrm{Sha}$ hữu hạn” được xem gần như là phần của phỏng đoán BSD.
- Kết quả đã biết: $\mathrm{Sha}$ hữu hạn khi $\mathrm{rk} = 0$ (Kolyvagin + $L(E,1) \neq 0$) hoặc $\mathrm{rk} = 1$ (Kolyvagin + $L'(E,1) \neq 0$) [kolyvagin1988]. Cho hạng $\geq 2$: chưa chứng minh $\mathrm{Sha}$ hữu hạn cho bất kỳ $E$ nào.
- “Sai số” của descent: $\mathrm{Sel}_n/\mathrm{im}(\delta) = \mathrm{Sha}[n]$. Descent tính Selmer nhưng không phân biệt được hạng và $\mathrm{Sha}$ --- đây là rào cản chính.
Định nghĩa
- Tự do: Nếu $P + x = x$ thì $P = O$ (chỉ phần tử đơn vị tác động tầm thường).
- Bắc cầu: Với mọi $x, y \in C(\bar{\mathbb{Q}})$, tồn tại duy nhất $P \in E(\bar{\mathbb{Q}})$ sao cho $P + x = y$.
Torsor $C$ gọi là tầm thường nếu $C(\mathbb{Q}) \neq \varnothing$ (có điểm hữu tỉ) --- khi đó $C \cong E$ (qua phép dịch).
Các lớp đẳng cấu torsor được phân loại bởi $H^1(G_{\mathbb{Q}}, E(\bar{\mathbb{Q}}))$:
Ví dụ
- Torsor tầm thường: $E$ chính nó là torsor cho $E$ (tác động bởi phép cộng nhóm). Điểm $O \in E(\mathbb{Q})$ nên torsor tầm thường.
- Đường cong Selmer: $C: 3a^3 + 4b^3 + 5c^3 = 0$ trong $\mathbb{P}^2$ là torsor cho đường cong elliptic $E: x^3 + y^3 + 60z^3 = 0$. Tác động: $E$ tác động trên $C$ qua phép cộng nhóm trên $\bar{\mathbb{Q}}$. Nhưng $C(\mathbb{Q}) = \varnothing$ (Selmer 1951) --- torsor không tầm thường, đại diện phần tử $\neq 0$ trong $\mathrm{Sha}(E/\mathbb{Q})$.
- Twist bậc hai: Cho $E: y^2 = x^3 + ax + b$ và $d \in \mathbb{Q}^{\times}$. Twist $E^{(d)}: dy^2 = x^3 + ax + b$ là torsor cho... chính $E^{(d)}$ (không phải cho $E$!). Nhưng đường cong $C_d: y^2 = d(x^3 + ax + b)$ có thể xem như torsor cho $E$ theo nghĩa tổng quát hơn (qua 2-covering).
- 2-covering: Cho $E: y^2 = (x - e_1)(x - e_2)(x - e_3)$. Với $d_1 d_2 d_3 = 1$ ($d_i \in \mathbb{Q}^{\times}$), hệ:
\[ d_1 u_1^2 - d_2 u_2^2 = e_2 - e_1, \quad d_1 u_1^2 - d_3 u_3^2 = e_3 - e_1 \]định nghĩa torsor bậc $2$ cho $E$. Giải hệ này trên $\mathbb{Q}$ tương đương tìm điểm $P \in E(\mathbb{Q})$ modulo $2E(\mathbb{Q})$ --- đây chính là 2-descent.
Ý nghĩa trực giác
- Hình dung: Torsor $C$ “giống” $E$ ở mọi khía cạnh trừ một thứ: $C$ không có điểm gốc tự nhiên. Trên $\bar{\mathbb{Q}}$, $C \cong E$ (vì luôn tìm được điểm). Nhưng trên $\mathbb{Q}$, nếu $C$ không có điểm hữu tỉ, phép đẳng cấu “hỏng” --- ta không thể chọn gốc.
- Tương tự đời thường: Hãy tưởng tượng một đường tròn (torsor cho nhóm quay $SO(2)$): mọi điểm “như nhau”, không điểm nào đặc biệt hơn điểm nào. Khi bạn chọn một điểm gốc (đánh dấu “12 giờ”), đường tròn trở thành nhóm. Torsor = “nhóm quên điểm gốc”.
- $\mathrm{Sha}$ = torsor “ẩn”: Phần tử $\mathrm{Sha}$ là torsor có điểm $p$-adic (“nhìn qua kính $p$-adic thấy gốc”) nhưng không có điểm hữu tỉ (“không tìm được gốc toàn cục”).
Liên hệ với giả thuyết Birch--Dyer
- $\mathrm{Sha}$ = torsor vi phạm Hasse: Mỗi phần tử $\mathrm{Sha}(E/\mathbb{Q})$ tương ứng 1-1 với lớp đẳng cấu torsor cục bộ tầm thường (có điểm mọi nơi cục bộ) nhưng toàn cục không tầm thường ($C(\mathbb{Q}) = \varnothing$). Cỡ $|\mathrm{Sha}|$ đo “mức độ vi phạm nguyên lý cục bộ--toàn cục”.
- Descent qua torsor: 2-descent = liệt kê torsor bậc $2$ (2-coverings) thỏa điều kiện cục bộ. Mỗi torsor giải được cho điểm $P \in E(\mathbb{Q})$ (mod $2E(\mathbb{Q})$) hoặc phần tử $\mathrm{Sha}[2]$.
- Visualization: Torsor cho phép “nhìn thấy” phần tử $H^1$ --- thay vì cocycle trừu tượng $\sigma \mapsto \xi(\sigma)$, ta có đường cong $C$ cụ thể (hệ phương trình đa thức). Kiểm tra $C(\mathbb{Q}_p) \neq \varnothing$ bằng Hensel, kiểm tra $C(\mathbb{Q}) = \varnothing$ bằng descent bậc cao [silverman2009].
Định nghĩa
\centerline{$V \in \mathcal{C}$ có điểm hữu tỉ ($V(\mathbb{Q}) \neq \varnothing$) $\Leftrightarrow$ $V$ có điểm tại mọi nơi cục bộ ($V(\mathbb{Q}_v) \neq \varnothing$ $\forall v$).}
Chiều $\Rightarrow$ luôn đúng (tầm thường). Chiều $\Leftarrow$ là nội dung thực sự.
Thành công:
- Định lý Hasse--Minkowski: Nguyên lý Hasse đúng cho dạng bậc hai: $\sum a_{ij} x_i x_j = 0$ có nghiệm hữu tỉ $\Leftrightarrow$ có nghiệm thực và $p$-adic $\forall p$ [serre1970].
Thất bại:
- Cho đường cong elliptic (và tổng quát hơn, đa tạp Abel), nguyên lý Hasse thất bại: tồn tại torsor $C$ với $C(\mathbb{Q}_v) \neq \varnothing$ $\forall v$ nhưng $C(\mathbb{Q}) = \varnothing$.
- Chướng ngại Brauer--Manin: Manin (1970) định nghĩa “chướng ngại” bằng nhóm Brauer $\mathrm{Br}(V)$, giải thích (phần lớn) sự thất bại.
Ví dụ
- Thành công (bậc hai): $x^2 + y^2 = -1$. Không có nghiệm thực ($x^2 + y^2 \geq 0$). Vậy nguyên lý Hasse nói đúng: không có nghiệm cục bộ $\Rightarrow$ không có nghiệm hữu tỉ. Ngược lại: $x^2 + y^2 = 1$ có nghiệm thực và $p$-adic $\forall p$ $\Rightarrow$ có nghiệm hữu tỉ (hiển nhiên: $(1, 0)$).
- Thất bại (bậc ba, Selmer): $3x^3 + 4y^3 + 5z^3 = 0$. Phương trình này có nghiệm thực (hiển nhiên) và $p$-adic $\forall p$ (kiểm tra bằng Hensel). Nhưng không có nghiệm hữu tỉ $(x:y:z) \in \mathbb{P}^2(\mathbb{Q})$ --- chứng minh bởi Selmer (1951) dùng phương pháp descent.
- Thất bại (Lind--Reichardt): $2y^2 = x^4 - 17z^4$ có nghiệm cục bộ mọi nơi nhưng không có nghiệm hữu tỉ --- ví dụ “nhỏ nhất” của thất bại Hasse cho đường cong genus 1.
- Isogeny descent: Cho $E: y^2 = x^3 + x$. Twist $E^{(-1)}: y^2 = x^3 - x$. Torsor liên kết giữa hai đường cong này thỏa Hasse cục bộ nhưng có thể thất bại toàn cục --- đây là nguồn gốc của $\mathrm{Sha}$.
Ý nghĩa trực giác
- Ý tưởng: Nếu bạn muốn biết phương trình có nghiệm hữu tỉ, hãy kiểm tra từng “địa phương”: nghiệm thực? nghiệm $2$-adic? $3$-adic? $5$-adic? ... Nếu mọi nơi đều OK, “chắc” là có nghiệm hữu tỉ. Cho bậc 2: chắc chắn. Cho bậc $\geq 3$: không chắc --- có “ảo ảnh cục bộ”.
- Tương tự: Như kiểm tra sức khỏe: xét nghiệm máu OK, X-quang OK, siêu âm OK --- “chắc” là khỏe? Cho hầu hết bệnh: đúng. Nhưng có bệnh “ẩn” mà mọi xét nghiệm đều bình thường. $\mathrm{Sha}$ chính là “bệnh ẩn” của phương trình Diophantine.
- $\mathrm{Sha}$ đo sự thất bại: $\mathrm{Sha}(E/\mathbb{Q}) = 0$ $\Leftrightarrow$ nguyên lý Hasse đúng cho mọi torsor của $E$. $|\mathrm{Sha}| > 1$ $\Leftrightarrow$ tồn tại torsor “ảo ảnh” --- vi phạm nguyên lý cục bộ--toàn cục.
Liên hệ với giả thuyết Birch--Dyer
- $\mathrm{Sha}$ = chướng ngại Hasse: BSD mạnh nói $|\mathrm{Sha}|$ xuất hiện trong công thức giá trị đặc biệt $L^{(r)}(E,1)/r!$. Sự thất bại của nguyên lý Hasse (đo bởi $\mathrm{Sha}$) được “nhìn thấy” bởi hàm $L$ --- một mối liên hệ thần kỳ giữa số học và giải tích.
- Selmer = Hasse cho torsor: Phần tử $\mathrm{Sel}_n$ = torsor bậc $n$ thỏa Hasse cục bộ (có điểm $v$-adic $\forall v$). $\mathrm{im}(\delta)$ = torsor thỏa cả Hasse toàn cục. $\mathrm{Sha}[n] = \mathrm{Sel}_n / \mathrm{im}(\delta)$ = phần thất bại.
- Mục tiêu: Chứng minh $\mathrm{Sha}$ hữu hạn (tức sự thất bại Hasse “có giới hạn”) là bước thiết yếu trong chương trình BSD. Đã biết cho hạng $\leq 1$ [kolyvagin1988]. Mở cho hạng $\geq 2$.
Định nghĩa
Phép cộng: Cho torsor $C_1, C_2$ cho $E$. Tổng $C_1 + C_2$ được xây dựng bởi “contracted product”: $C_1 \times^E C_2 = (C_1 \times C_2) / E$ (lấy thương bởi tác động đường chéo $P \cdot (x_1, x_2) = (P+x_1, -P+x_2)$).
Phần tử đơn vị: Lớp của $E$ chính nó (torsor tầm thường).
Nghịch đảo: $-[C]$ là torsor $C$ với tác động “đảo”: $P *' x = (-P) + x$.
Nhóm Tate--Shafarevich là nhóm con của $\mathrm{WC}$:
Ví dụ
- Trường hữu hạn: $K = \mathbb{F}_q$. Lang đã chứng minh $\mathrm{WC}(E/\mathbb{F}_q) = H^1(G_{\mathbb{F}_q}, E(\bar{\mathbb{F}}_q)) = 0$ [lang1983]. Lý do: mọi torsor trên trường hữu hạn có điểm (định lý Lang). Hệ quả: $\mathrm{Sha}$ là hiện tượng “chỉ xảy ra trên trường vô hạn”.
- Trường cục bộ $\mathbb{Q}_p$: $\mathrm{WC}(E/\mathbb{Q}_p) \cong \hat{H}^0(G_{\mathbb{Q}_p}, E) = E(\mathbb{Q}_p)/\mathrm{Norm}$ --- nhóm hữu hạn (đối ngẫu Tate cục bộ). Cỡ $|\mathrm{WC}(E/\mathbb{Q}_p)| = c_p \cdot [\text{phần liên thông}]$, liên hệ với số Tamagawa $c_p$.
- $K = \mathbb{Q}$: $\mathrm{WC}(E/\mathbb{Q})$ thường vô hạn (chứa $\mathbb{Q}^{\times}/(\mathbb{Q}^{\times})^n$ cho mọi $n$ qua các twist). Nhưng $\mathrm{Sha}(E/\mathbb{Q}) \subset \mathrm{WC}(E/\mathbb{Q})$ được phỏng đoán là hữu hạn.
- Phần $n$-xoắn: $\mathrm{WC}(E/K)[n] = H^1(G_K, E)[n]$ --- các torsor bậc $n$ (bị triệt tiêu bởi phép nhân $n$). Dãy Kummer cho: $\mathrm{WC}(E/K)[n] = H^1(G_K, E[n]) / (E(K)/nE(K))$ (phần “ngoài” ảnh Kummer).
Ý nghĩa trực giác
- Hình dung: $\mathrm{WC}(E/K)$ là “kho” chứa tất cả cách “bẻ cong” $E$ thành đường cong khác (trên $K$) mà vẫn giữ cấu trúc tác động. Phần tử $0$ = $E$ nguyên bản. Phần tử khác $0$ = torsor “lệch” không quay về $E$ được.
- WC lớn, $\mathrm{Sha}$ nhỏ: $\mathrm{WC}$ thường rất lớn (thậm chí vô hạn), nhưng phần “thú vị nhất” --- các torsor vượt qua sàng cục bộ --- tạo thành $\mathrm{Sha}$, và $\mathrm{Sha}$ được phỏng đoán hữu hạn.
- Lịch sử: André Weil (1955) và François Châtelet nghiên cứu torsor một cách có hệ thống, dẫn đến nhóm mang tên hai người. Tate sau đó phát triển đối ngẫu ($\mathrm{Sha}$ là phần “tự đối ngẫu” của WC).
Liên hệ với giả thuyết Birch--Dyer
- $\mathrm{Sha} \subset \mathrm{WC}$: Nhóm Tate--Shafarevich là “phần cục bộ tầm thường” của WC. Dãy chính xác:
\[ 0 \to \mathrm{Sha}(E/\mathbb{Q}) \to \mathrm{WC}(E/\mathbb{Q}) \xrightarrow{\mathrm{loc}} \prod_v \mathrm{WC}(E/\mathbb{Q}_v). \]$\mathrm{Sha} = \ker(\mathrm{loc})$ --- torsor “vô hình” khi nhìn cục bộ.
- Ghép đôi Cassels--Tate: Ghép đôi $\mathrm{Sha} \times \mathrm{Sha} \to \mathbb{Q}/\mathbb{Z}$ được xây dựng qua cấu trúc nhóm của WC và đối ngẫu cục bộ. Nó cho $|\mathrm{Sha}|$ là bình phương --- ràng buộc cần cho sự nhất quán của BSD mạnh.
- Đối ngẫu Poitou--Tate: Dãy chính xác 9 thành phần Poitou--Tate liên hệ $\mathrm{WC}$ toàn cục, cục bộ, và đối ngẫu Pontryagin. Đây là công cụ chính để chặn $|\mathrm{Sha}|$ trong các chứng minh BSD phần (Kolyvagin, Skinner--Urban) [silverman2009].
Định nghĩa
Cho $\xi, \eta \in \mathrm{Sha}(E/\mathbb{Q})$, đại diện bởi torsor $C_\xi$ và $C_\eta$.
- Chọn điểm $x_v \in C_\xi(\mathbb{Q}_v)$ tại mỗi nơi $v$ (tồn tại vì $\xi \in \mathrm{Sha}$).
- Dùng Tate pairing cục bộ: tính $\langle \xi_v, \eta_v \rangle_v \in \mathbb{Q}/\mathbb{Z}$ tại mỗi $v$.
- Tổng: $\langle \xi, \eta \rangle_{\mathrm{CT}} = \sum_v \langle \xi_v, \eta_v \rangle_v \in \mathbb{Q}/\mathbb{Z}$.
Tính chất chính:
- Phản đối xứng: $\langle \xi, \eta \rangle = -\langle \eta, \xi \rangle$ (Cassels [cassels1962]).
- Alternating: $\langle \xi, \xi \rangle = 0$ $\forall \xi$ (Poonen--Stoll, đúng nếu phần $p$-primary với $p$ lẻ; với $p = 2$ cần điều kiện thêm [poonen-stoll1999]).
- Hạt nhân: Phỏng đoán: ghép đôi không suy biến (non-degenerate) trên phần chia hết của $\mathrm{Sha}$ --- tức $\langle \xi, \eta \rangle = 0$ $\forall \eta$ $\Rightarrow$ $\xi$ chia hết.
Ví dụ
- $\mathrm{Sha} = 0$: Nếu $\mathrm{Sha}(E/\mathbb{Q}) = 0$ (như phần lớn đường cong conductor nhỏ), ghép đôi tầm thường --- không có phần tử để ghép.
- $\mathrm{Sha} \cong (\mathbb{Z}/n\mathbb{Z})^2$: Nếu $\mathrm{Sha}[n] \cong (\mathbb{Z}/n\mathbb{Z})^2$, ghép đôi cho ánh xạ $(\mathbb{Z}/n\mathbb{Z})^2 \times (\mathbb{Z}/n\mathbb{Z})^2 \to \mathbb{Z}/n\mathbb{Z}$. Tính alternating buộc cỡ $|\mathrm{Sha}[n]|$ phải là bình phương: $|\mathrm{Sha}[n]| = n^{2k}$.
- Ví dụ số: Đường cong 571a1 có $\mathrm{Sha} \cong (\mathbb{Z}/2\mathbb{Z})^2$. Ghép đôi: $\langle \xi_1, \xi_2 \rangle = \tfrac{1}{2}$ cho hai phần tử sinh $\xi_1, \xi_2$. Ma trận ghép đôi: $\begin{pmatrix} 0 & 1/2 \\ -1/2 & 0 \end{pmatrix}$ (phản đối xứng, không suy biến).
- $\mathrm{Sha}$ bậc lẻ: Nếu $|\mathrm{Sha}[p]| = p$ (một phần tử sinh $\xi$), tính alternating cho $\langle \xi, \xi \rangle = 0$. Nhưng ghép đôi trên nhóm cỡ $p$ chỉ không suy biến khi $p^{2k}$ --- mâu thuẫn! Vậy $|\mathrm{Sha}[p]|$ không thể là $p$ --- phải là $1$ hoặc $p^2$ hoặc $p^4, \ldots$
Ý nghĩa trực giác
- Hình dung: Ghép đôi Cassels--Tate giống “sản phẩm vô hướng” (inner product) trên $\mathrm{Sha}$ --- nó đo “góc” giữa hai torsor “ảo ảnh”. Nhưng với giá trị trong $\mathbb{Q}/\mathbb{Z}$ (không phải $\mathbb{R}$), và phản đối xứng (không phải đối xứng).
- Tại sao phản đối xứng? Vì $\mathrm{Sha}$ sống trong $H^1$ --- bậc lẻ --- và đối ngẫu Tate có tính chất liên quan đến dấu $(-1)^i$ ở bậc $i$. Ở bậc $1$: phản đối xứng.
- Hệ quả bình phương: Trên nhóm Abel hữu hạn $A$ với ghép đôi alternating không suy biến $A \times A \to \mathbb{Q}/\mathbb{Z}$, tất yếu $|A| = m^2$ (bình phương). Lý do: $A \cong H \oplus H^{\vee}$ (tách thành hai nửa đối ngẫu), nên $|A| = |H|^2$.
Liên hệ với giả thuyết Birch--Dyer
- $|\mathrm{Sha}|$ = bình phương: Ghép đôi Cassels--Tate (nếu không suy biến) buộc $|\mathrm{Sha}|$ là bình phương hoàn hảo. BSD mạnh cần $|\mathrm{Sha}|$ hữu hạn --- ghép đôi cho ràng buộc thêm: $|\mathrm{Sha}| = 1, 4, 9, 16, 25, \ldots$ Đã kiểm nghiệm đúng cho mọi trường hợp tính được.
- Kiểm nghiệm BSD mạnh: Khi tính $L^{(r)}(E,1)/r!$ bằng số và so với $\frac{|\mathrm{Sha}| \cdot \Omega \cdot \mathrm{Reg} \cdot \prod c_p}{|E_{\mathrm{tors}}|^2}$, giá trị $|\mathrm{Sha}|$ phải là bình phương --- đây là “reality check” quan trọng.
- Không suy biến = phỏng đoán: Nếu ghép đôi suy biến, $|\mathrm{Sha}|$ vẫn có thể hữu hạn nhưng không nhất thiết bình phương. Phỏng đoán không suy biến (tương đương: phần chia hết của $\mathrm{Sha}$ bằng $0$, tức $\mathrm{Sha}$ hữu hạn) mạnh hơn phỏng đoán hữu hạn đơn thuần.
Định nghĩa
- Được Tate và Shafarevich đề xuất độc lập (khoảng 1960).
- Là điều kiện tiên quyết cho BSD mạnh: nếu $\mathrm{Sha}$ vô hạn, công thức $L^{(r)}(E,1)/r!$ vô nghĩa.
- Vẫn mở trong trường hợp tổng quát.
Bảng tình trạng hiện tại:
| Trường hợp | Trạng thái | Kết quả / Tác giả |
|---|---|---|
| $\mathrm{rk} = 0$, $L(E,1) \neq 0$ | ✓ Đã chứng minh | Kolyvagin (1988) [kolyvagin1988] |
| $\mathrm{rk} = 1$, $L'(E,1) \neq 0$ | ✓ Đã chứng minh | Kolyvagin (1988) [kolyvagin1988] |
| $\mathrm{rk} = 0$, CM | ✓ Đã chứng minh | Rubin (1991) [rubin1991] |
| $\mathrm{rk} \geq 2$ | MỞ | Chưa biết cho bất kỳ $E$ nào |
| Hạng giải tích $\geq 2$ | MỞ | Kể cả $\mathrm{ord}_{s=1} L(E,s) \geq 2$ |
Ví dụ
- $\mathrm{Sha}$ đã biết hữu hạn: Đường cong 37a1 ($y^2 + y = x^3 - x$, rank 1): $L'(E,1) \neq 0$, Kolyvagin $\Rightarrow$ $\mathrm{Sha}$ hữu hạn. Tính toán: $\mathrm{Sha} = 0$.
- $\mathrm{Sha}$ hữu hạn nhưng $\neq 0$: Đường cong 681b1 (rank 0, $L(E,1) \neq 0$): Kolyvagin $\Rightarrow$ $\mathrm{Sha}$ hữu hạn. Tính toán: $|\mathrm{Sha}| = 9$, tức $\mathrm{Sha} \cong (\mathbb{Z}/3\mathbb{Z})^2$.
- Rank 2 --- chưa biết: Đường cong 389a1 ($y^2 + y = x^3 + x^2 - 2x$, rank 2): $\mathrm{ord}_{s=1} L(E,s) = 2$. Tính toán số cho $|\mathrm{Sha}| = 1$ (nhưng chưa chứng minh hữu hạn!).
- $\mathrm{Sha}$ lớn tùy ý (nhưng hữu hạn?): Cassels chứng minh: $\forall N$, $\exists E/\mathbb{Q}$ với $|\mathrm{Sha}(E/\mathbb{Q})[3]| > N$. Nhưng $\mathrm{Sha}[3]$ lớn không mâu thuẫn hữu hạn --- chỉ cần $|\mathrm{Sha}| < \infty$.
Ý nghĩa trực giác
- Tương tự nhóm lớp: Nhóm lớp $\mathrm{Cl}(K)$ của trường số $K$ luôn hữu hạn (Minkowski). $\mathrm{Sha}$ là “nhóm lớp” cho đường cong elliptic --- “nên” hữu hạn theo tương tự. Nhưng chứng minh khó hơn nhiều vì không có “giới hạn Minkowski” cho $\mathrm{Sha}$.
- “Số lượng ảo ảnh có hạn”: $\mathrm{Sha}$ = tập torsor “ảo ảnh” (có điểm cục bộ, không có toàn cục). Trực giác: “không thể có vô hạn ảo ảnh” --- vũ trụ số học “đủ cứng” để giới hạn chúng.
- Rào cản hạng $\geq 2$: Khi $\mathrm{rk} \leq 1$, phương pháp Euler systems (Kolyvagin) chặn $|\mathrm{Sha}|$. Khi $\mathrm{rk} \geq 2$, chưa có “hệ thống Euler đủ mạnh” --- đây là rào cản kỹ thuật chính, không phải lý do tin $\mathrm{Sha}$ vô hạn.
Liên hệ với giả thuyết Birch--Dyer
- Tiên quyết BSD mạnh: BSD mạnh phát biểu $|\mathrm{Sha}| \cdot \Omega \cdot \mathrm{Reg} \cdot \prod c_p / |E_{\mathrm{tors}}|^2 = L^{(r)}(E,1)/r!$. Vế phải là số thực xác định. Vế trái cần $|\mathrm{Sha}| < \infty$.
- Hệ quả BSD yếu: Nếu BSD yếu đúng ($\mathrm{ord}_{s=1} L = r$) và $\mathrm{Sha}$ hữu hạn, nhiều hệ quả mạnh theo: phỏng đoán tính chẵn lẻ, regulator $> 0$, v.v.
- Hướng hiện đại: Iwasawa theory cố chứng minh $\mathrm{Sha}[p^\infty]$ hữu hạn (cho từng $p$). Skinner--Urban [skinner-urban2014] chứng minh $\mathrm{Sha}[p^\infty]$ hữu hạn cho “hầu hết” $p$ khi $\mathrm{rk} \leq 1$. Mở rộng cho $\mathrm{rk} \geq 2$ là mục tiêu nghiên cứu tích cực.
Định nghĩa
- Nguồn gốc: Hệ quả của ghép đôi Cassels--Tate. Nếu ghép đôi không suy biến và alternating trên $\mathrm{Sha}$ hữu hạn, lý thuyết đại số buộc $|\mathrm{Sha}|$ là bình phương (xem STT 115).
- Đã chứng minh (phần $p$ lẻ): Với $p$ lẻ, Cassels [cassels1962] chứng minh ghép đôi alternating trên $\mathrm{Sha}[p^\infty]$, suy ra $|\mathrm{Sha}[p^\infty]|$ là bình phương.
- Phần $p = 2$: Poonen--Stoll (1999) [poonen-stoll1999] chứng minh ghép đôi alternating trên $\mathrm{Sha}[2^\infty]$ dưới một số điều kiện. Trường hợp tổng quát: Fisher (2014) hoàn thành.
- Kiểm nghiệm: Mọi giá trị $|\mathrm{Sha}|$ tính được (hàng triệu đường cong trong Cremona/LMFDB) đều là bình phương: $1, 4, 9, 16, 25, 36, 49, \ldots$
Ví dụ
- $|\mathrm{Sha}| = 1$: Phần lớn đường cong conductor nhỏ. Ví dụ: 37a1 ($\mathrm{Sha} = 0$, rank 1), 11a1 ($\mathrm{Sha} = 0$, rank 0).
- $|\mathrm{Sha}| = 4$: Đường cong 571a1 có $\mathrm{Sha} \cong (\mathbb{Z}/2\mathbb{Z})^2$, $|\mathrm{Sha}| = 4 = 2^2$. BSD mạnh dự đoán chính xác.
- $|\mathrm{Sha}| = 9$: Đường cong 681b1 có $\mathrm{Sha} \cong (\mathbb{Z}/3\mathbb{Z})^2$, $|\mathrm{Sha}| = 9 = 3^2$.
- $|\mathrm{Sha}| = 25$: Đường cong 2849a1 có $\mathrm{Sha} \cong (\mathbb{Z}/5\mathbb{Z})^2$, $|\mathrm{Sha}| = 25 = 5^2$.
- Kỷ lục: $|\mathrm{Sha}| = (2^5 \cdot 3)^2 = 9216$ cho một đường cong rank 0 (Fisher). Luôn bình phương!
- Tại sao không $|\mathrm{Sha}| = 2$ hay $3$? Nếu $|\mathrm{Sha}[p]| = p$ thì ghép đôi alternating trên $\mathbb{Z}/p\mathbb{Z}$ tất yếu suy biến (chỉ có $0$) --- mâu thuẫn với không suy biến. Vậy $|\mathrm{Sha}[p]| = p^{2k}$.
Ý nghĩa trực giác
- Tương tự: Nhóm lớp $\mathrm{Cl}(K)$ không nhất thiết có cỡ bình phương. Nhưng $\mathrm{Sha}$ “đặc biệt hơn” --- nó tự đối ngẫu (qua Cassels--Tate), nên “tách” thành hai nửa đối xứng: $\mathrm{Sha} \cong H \oplus H$ (ít nhất cho phần $p$ lẻ). Do đó $|\mathrm{Sha}| = |H|^2$.
- Hình dung: Mỗi torsor “ảo ảnh” $\xi \in \mathrm{Sha}$ có “bạn đời” $\eta$ sao cho $\langle \xi, \eta \rangle \neq 0$. Chúng đi thành cặp --- nên tổng số phải chẵn (khi tính theo đại số).
- Kiểm tra thực nghiệm: Khi tính $|\mathrm{Sha}|$ từ BSD mạnh: $|\mathrm{Sha}| = L^{(r)}(E,1) \cdot |E_{\mathrm{tors}}|^2 / (r! \cdot \Omega \cdot \mathrm{Reg} \cdot \prod c_p)$. Nếu kết quả không bình phương $\Rightarrow$ hoặc tính sai, hoặc BSD sai. Trong thực tế, luôn ra bình phương --- bằng chứng mạnh cho BSD.
Liên hệ với giả thuyết Birch--Dyer
- Nhất quán BSD mạnh: BSD mạnh dự đoán $|\mathrm{Sha}|$ cụ thể. Nếu giá trị không bình phương, BSD sai. Sự nhất quán (luôn bình phương trong kiểm nghiệm) là bằng chứng gián tiếp rất mạnh.
- “Bình phương” không hiển nhiên: Từ công thức BSD, $|\mathrm{Sha}|$ được tính từ $L^{(r)}(E,1)/r!$ chia cho regulator, periods, Tamagawa --- không lý do tiên nghiệm nào buộc kết quả là bình phương. Việc nó luôn ra bình phương là “phép màu” số học.
- Hệ quả thực hành: Khi tính $|\mathrm{Sha}|$ từ BSD, nếu ra số lẻ (như $2, 3, 5, 6$) $\Rightarrow$ biết ngay tính sai ở đâu đó --- regulator, period, hoặc Tamagawa. Tính chất bình phương là “bộ kiểm tra tự động” hữu ích.
Định nghĩa
- Tại $v = p$: $H^1_f(G_p, V) = \ker(H^1(G_p, V) \to H^1(G_p, V \otimes B_{\mathrm{cris}}))$ --- phần tinh thể (crystalline), với $B_{\mathrm{cris}}$ là vành chu kỳ của Fontaine.
- Tại $v \neq p$ (kể cả $v = \infty$): $H^1_f(G_v, V) = \ker(H^1(G_v, V) \to H^1(I_v, V))$ --- phần không phân nhánh, với $I_v$ là nhóm quán tính.
Khi $V = V_p(E)$, nhóm Selmer Bloch--Kato trùng với nhóm Selmer cổ điển:
Ví dụ
- $V = \mathbb{Q}_p(1)$ (Tate twist): $H^1_f(\mathbb{Q}, \mathbb{Q}_p(1)) \cong \mathbb{Q}_p \otimes_\mathbb{Z} \mathcal{O}_\mathbb{Q}^{\times}$ --- tensor nhóm đơn vị. Vì $\mathcal{O}_\mathbb{Q}^{\times} = \{\pm 1\}$, ta được $H^1_f = 0$. Đây mã hóa sự thật: hàm zeta Riemann $\zeta(s)$ không triệt tiêu tại $s = 1$ ($\zeta$ có cực, không phải zero).
- $V = V_p(E)$ cho $E$ rank $0$: $H^1_f(\mathbb{Q}, V_p(E)) = 0$. Phỏng đoán Bloch--Kato: $\dim H^1_f = \mathrm{ord}_{s=1} L(E,s) = 0$. Đã chứng minh (Kato, Skinner--Urban).
- $V = V_p(E)$ cho $E$ rank $1$: $\dim H^1_f(\mathbb{Q}, V_p(E)) = 1$. Phỏng đoán Bloch--Kato: $\dim H^1_f = 1$. Đã chứng minh (Gross--Zagier + Kolyvagin).
- Dạng modular trọng lượng $k > 2$: Cho newform $f$ trọng lượng $k$, biểu diễn $V_f$ chiều $2$. $H^1_f(\mathbb{Q}, V_f)$ tổng quát hóa Selmer, và Bloch--Kato dự đoán $\dim H^1_f = \mathrm{ord}_{s=k/2} L(f,s)$.
Ý nghĩa trực giác
- Ý tưởng: Selmer cổ điển chỉ áp dụng cho đường cong elliptic ($E[n]$, descent). Bloch--Kato thay thế bằng biểu diễn $p$-adic tổng quát $V$ --- và “điều kiện cục bộ” bằng lý thuyết Hodge $p$-adic (Fontaine).
- Tại sao “crystalline”? Tại $v = p$, điều kiện “không phân nhánh” quá mạnh (trivially $0$ nhiều khi). Điều kiện crystalline yếu hơn: nó cho phép phân nhánh “tốt” (de Rham, crystalline) nhưng loại bỏ phần “xấu”. Đây là insight chính của Bloch--Kato.
- Thống nhất BSD: Phỏng đoán Bloch--Kato: $\dim_{\mathbb{Q}_p} H^1_f(\mathbb{Q}, V) = \mathrm{ord}_{s = j} L(V^*(1-j), s)$ cho motif $V$ --- thống nhất BSD (cho $E$), phỏng đoán Birch--Tate (cho $K$-theory), phỏng đoán Beilinson (cho $L$-function tổng quát).
Liên hệ với giả thuyết Birch--Dyer
- Tổng quát hóa BSD: Phỏng đoán Bloch--Kato (1990) bao hàm BSD như trường hợp đặc biệt: khi $V = V_p(E)$, phỏng đoán $\dim H^1_f = \mathrm{ord}_{s=1} L(E,s)$ chính là BSD yếu. Công thức hệ số hàng đầu tổng quát hóa BSD mạnh.
- Công cụ chứng minh: Nhiều kết quả BSD hiện đại (Skinner--Urban, Kato) thực chất chứng minh phỏng đoán Bloch--Kato cho $V_p(E)$ --- dùng Iwasawa theory để chặn $\dim H^1_f$.
- Vượt xa EC: Bloch--Kato áp dụng cho dạng modular trọng lượng cao, biểu diễn Artin, motif của đa tạp Abel, ... --- mở đường cho “BSD cho mọi hàm $L$”. Chương trình Langlands và Bloch--Kato cùng hướng đến cùng đích: hiểu giá trị đặc biệt $L$-function.
Định nghĩa
Bước 1: Homogeneous spaces. Với mỗi bộ $(d_1, d_2, d_3)$ trong đó $d_i | \Delta_E$ (biệt thức) và $d_1 d_2 d_3 \in (\mathbb{Q}^{\times})^2$, xét hệ:
Bước 2: Kiểm tra cục bộ. Với mỗi bộ $(d_1, d_2, d_3)$, kiểm tra $C_{d_1,d_2,d_3}(\mathbb{Q}_v) \neq \varnothing$ tại mọi $v$ (bằng Hensel lifting cho $v$ hữu hạn, trực tiếp cho $v = \infty$). Bộ vượt qua sàng = phần tử $\mathrm{Sel}_2$.
Bước 3: Tìm điểm toàn cục. Với mỗi phần tử Selmer, thử tìm nghiệm hữu tỉ $(u_1, u_2, u_3) \in \mathbb{Q}^3$. Nếu tìm được: phần tử thuộc $\mathrm{im}(\delta)$ (cho điểm $P \in E(\mathbb{Q})$). Nếu không: phần tử thuộc $\mathrm{Sha}[2]$.
Kết quả: $\dim_{\mathbb{F}_2} \mathrm{Sel}_2 = r + 2 + \dim_{\mathbb{F}_2} \mathrm{Sha}[2]$ (với $r = \mathrm{rk}$ và $|E(\mathbb{Q})[2]| = 4$). Nếu $\mathrm{Sha}[2] = 0$: $r = \dim_{\mathbb{F}_2} \mathrm{Sel}_2 - 2$.
Ví dụ
- $E: y^2 = x(x-1)(x+1) = x^3 - x$: Gốc: $e_1 = -1, e_2 = 0, e_3 = 1$.
Hệ: $d_1 u_1^2 - d_2 u_2^2 = 1$, $d_1 u_1^2 - d_3 u_3^2 = 2$, với $d_1 d_2 d_3 \in (\mathbb{Q}^{\times})^2$.
Ước của $\Delta = 4$: $d_i \in \{\pm 1, \pm 2\}$. Kiểm tra: 4 bộ vượt qua sàng cục bộ.
Kết quả: $\mathrm{Sel}_2 \cong (\mathbb{Z}/2\mathbb{Z})^2$. Vì $E(\mathbb{Q}) \cong \mathbb{Z}/2\mathbb{Z} \oplus \mathbb{Z}/2\mathbb{Z}$ (rank 0): $\dim \mathrm{Sel}_2 = 2 = 0 + 2 + 0$. Vậy $\mathrm{Sha}[2] = 0$ và $\mathrm{rk} = 0$.
- $E: y^2 = x^3 - 25x = x(x-5)(x+5)$: Gốc: $e_1 = -5, e_2 = 0, e_3 = 5$.
Kiểm tra: 8 bộ vượt qua sàng cục bộ, tức $\dim_{\mathbb{F}_2} \mathrm{Sel}_2 = 3$.
Tìm điểm: bộ $(d_1, d_2, d_3) = (1, -5, -5)$ cho $u_1^2 + 5u_2^2 = 5$ --- nghiệm $(u_1, u_2, u_3) = (0, 1, \ldots)$ cho điểm $P = (-4, 6) \in E(\mathbb{Q})$.
Kết quả: $r = 3 - 2 - 0 = 1$ (nếu $\mathrm{Sha}[2] = 0$). Thực tế: $E(\mathbb{Q}) \cong \mathbb{Z}/2\mathbb{Z} \oplus \mathbb{Z}/2\mathbb{Z} \oplus \mathbb{Z}$, sinh bởi $(0,0), (5,0), (-4,6)$.
- Trường hợp $E[2] \not\subset E(\mathbb{Q})$: Khi $f(x) = x^3 + ax + b$ bất khả quy, dùng $2$-descent qua isogeny hoặc phiên bản trên $\mathbb{Q}(e_1)$ --- phức tạp hơn nhưng cùng nguyên lý [silverman2009].
Ý nghĩa trực giác
- Ý tưởng: Thay vì tìm điểm $P \in E(\mathbb{Q})$ trực tiếp (khó!), ta “sàng” qua hệ phương trình phụ $C_d$ dễ hơn. Mỗi $C_d$ giải được $\Leftrightarrow$ có điểm modulo $2E(\mathbb{Q})$. Đếm số $C_d$ giải được cho biết hạng.
- “Sàng cục bộ trước”: Kiểm tra $C_d(\mathbb{Q}_v) \neq \varnothing$ tại mỗi $v$ nhanh (Hensel). Phần lớn $C_d$ bị loại ở bước này. Chỉ còn lại $|\mathrm{Sel}_2|$ bộ --- số nhỏ, quản lý được.
- Giới hạn: $2$-descent cho cận trên hạng: $r \leq \dim \mathrm{Sel}_2 - 2$. Nhưng nếu $\mathrm{Sha}[2] \neq 0$, cận không chặt. Cần descent bậc cao (4-descent, v.v.) hoặc chứng minh $\mathrm{Sha}[2] = 0$ bằng phương pháp khác.
- Thuật toán cổ điển nhất: $2$-descent có từ thời Fermat (descent vô hạn). Phiên bản hiện đại (Birch--Swinnerton-Dyer 1963, Cremona 1990s) được cài đặt trong SageMath, Magma, PARI/GP.
Liên hệ với giả thuyết Birch--Dyer
- Công cụ chính: $2$-descent là phương pháp thực hành phổ biến nhất để tính hạng. Kết hợp với $L$-function (tính $\mathrm{ord}_{s=1} L(E,s)$ bằng số): nếu cận descent khớp với hạng giải tích $\Rightarrow$ kiểm nghiệm BSD yếu.
- Bhargava--Shankar: Kết quả $\mathrm{avg}|\mathrm{Sel}_2| = 3$ [bhargava-shankar2015] được chứng minh bằng đếm orbit (geometry of numbers), nhưng diễn giải qua $2$-descent: trung bình mỗi đường cong có $3$ phần tử Selmer bậc $2$, tức hạng trung bình $\leq 3/2$.
- 66.48%: Bhargava--Skinner--Zhang [bhargava-skinner-zhang2014] kết hợp: (1) $2$-descent/Selmer $\Rightarrow$ “hầu hết” có $\mathrm{rk} \leq 1$; (2) Skinner--Zhang $\Rightarrow$ khi $\mathrm{rk}_{\mathrm{an}} \leq 1$ thì BSD đúng. Kết quả: $\geq 66.48\%$ đường cong thỏa BSD.
Định nghĩa
Có hai cách tiếp cận:
Cách 1: Từ $2$-descent lên $4$-descent (lifting).
- Đã có $\mathrm{Sel}_2(E/\mathbb{Q})$ (từ $2$-descent).
- Với mỗi phần tử $\xi \in \mathrm{Sel}_2$ (torsor bậc $2$, “$2$-covering” $C_\xi$), kiểm tra: $\xi$ có nâng lên $\mathrm{Sel}_4$ không? Tức: tồn tại torsor bậc $4$ phủ $C_\xi$?
- Chướng ngại nâng: nằm trong $\mathrm{Sha}[2]$ “thực” (phần bị triệt tiêu bởi $[2]$ trong $\mathrm{Sha}[4]$).
Cách 2: Trực tiếp (Fisher).
- Tìm “$4$-coverings” --- các đường cong genus $1$ nhúng trong $\mathbb{P}^3$ (giao hai mặt bậc hai) cùng ánh xạ bậc $4$ xuống $E$.
- Kiểm tra điều kiện cục bộ tại mọi nơi.
- Fisher [fisher2008] phát triển thuật toán hiệu quả, cài đặt trong Magma.
Dãy chính xác: $0 \to E(\mathbb{Q})/4E(\mathbb{Q}) \to \mathrm{Sel}_4(E/\mathbb{Q}) \to \mathrm{Sha}(E/\mathbb{Q})[4] \to 0$.
Ví dụ
- Phát hiện $\mathrm{Sha}[4] \neq 0$: Đường cong $E$ với $2$-descent cho $\mathrm{Sel}_2 \cong (\mathbb{Z}/2\mathbb{Z})^4$ nhưng chỉ tìm được $2$ điểm độc lập (rank $= 2$). Suy ra $\mathrm{Sha}[2] \cong (\mathbb{Z}/2\mathbb{Z})^2$. Nhưng $4$-descent cho thấy $\mathrm{Sha}[4] = 0$ --- tức phần tử $\mathrm{Sha}[2]$ “chết” ở bậc $4$.
- $\mathrm{Sha}[4] \neq 0$ thực sự: Tồn tại đường cong $E$ với $\mathrm{Sha}[2] = 0$ nhưng $\mathrm{Sha}[4] \neq 0$ --- phần tử $\mathrm{Sha}$ bậc $4$ “vô hình” với $2$-descent. Chỉ $4$-descent (hoặc cao hơn) phát hiện được.
- Cải thiện cận hạng: $2$-descent cho $r \leq 5$. Sau $4$-descent: $r \leq 3$ (loại bớt “ảo ảnh” $\mathrm{Sha}[2]$). Kết hợp thêm tính toán chiều cao: xác nhận $r = 2$.
Ý nghĩa trực giác
- Hình dung: $2$-descent nhìn $E(\mathbb{Q})/2E(\mathbb{Q})$ --- “độ phân giải thấp” (chỉ phân biệt mod $2$). $4$-descent nhìn $E(\mathbb{Q})/4E(\mathbb{Q})$ --- “độ phân giải cao hơn”, phân biệt tinh hơn.
- Phát hiện $\mathrm{Sha}$: Phần tử $\mathrm{Sha}[2]$ mà “sống sót” qua $4$-descent (tức thuộc $\mathrm{Sha}[4]$) là $\mathrm{Sha}$ “thực sự bậc $\geq 4$”. Phần tử $\mathrm{Sha}[2]$ mà “chết” ở bậc $4$ (không nâng lên $\mathrm{Sha}[4]$) là “ảo ảnh tạm thời” --- descent cao hơn loại bỏ chúng.
- Chi phí: $4$-descent phức tạp hơn $2$-descent nhiều (hệ phương trình trong $\mathbb{P}^3$ thay vì $\mathbb{P}^1$). Nhưng cho thông tin tốt hơn --- đánh đổi tính toán lấy độ chính xác.
- Giới hạn: Có thể tiếp tục: $8$-descent, $16$-descent, ... Mỗi bậc cao hơn loại thêm “ảo ảnh”. Lý thuyết: $\bigcap_n \mathrm{Sel}_{2^n} = E(\mathbb{Q}) \otimes \mathbb{Z}_2$ (Selmer “hội tụ” về hạng thực).
Liên hệ với giả thuyết Birch--Dyer
- Cải thiện kiểm nghiệm: $4$-descent cung cấp cận hạng chặt hơn $2$-descent. Kết hợp với tính $\mathrm{ord}_{s=1} L(E,s)$: khớp $\Rightarrow$ bằng chứng mạnh hơn cho BSD yếu.
- Tính $|\mathrm{Sha}|$ chính xác: Nếu $2$-descent cho $|\mathrm{Sha}[2]| = 4$ và $4$-descent cho $|\mathrm{Sha}[4]| = 4$, suy ra $\mathrm{Sha}[2^\infty] \cong (\mathbb{Z}/2\mathbb{Z})^2$ (phần $2$-primary xác định). Kết hợp descent bậc lẻ ($3$, $5$) cho $|\mathrm{Sha}|$ đầy đủ --- cần cho kiểm nghiệm BSD mạnh.
- Fisher và LMFDB: Thuật toán $4$-descent của Fisher được dùng hệ thống trong Cremona's database và LMFDB để xác định $|\mathrm{Sha}|$ cho hàng triệu đường cong [fisher2008]. Mọi kết quả nhất quán với BSD mạnh.
Định nghĩa
Nội dung: Với mỗi đường cong $E/\mathbb{Q}$ (lên đến đẳng cấu trên $\mathbb{Q}$), cơ sở dữ liệu lưu:
- Phương trình Weierstrass tối thiểu toàn cục.
- Conductor $N_E$, biệt thức $\Delta$, $j$-bất biến.
- Hạng $r = \mathrm{rk}(E(\mathbb{Q}))$ và các điểm sinh (generators).
- Nhóm xoắn $E(\mathbb{Q})_{\mathrm{tors}}$.
- Các bất biến BSD: $\Omega_E$, $\mathrm{Reg}_E$, $c_p$ (Tamagawa), $|\mathrm{Sha}_{\mathrm{an}}|$ (từ BSD mạnh).
- Dấu gốc $w(E)$, loại rút gọn tại mỗi $p | N$.
Phạm vi: Tính đến 2023, cơ sở dữ liệu chứa mọi đường cong elliptic trên $\mathbb{Q}$ có conductor $N \leq 500{,}000$ --- hơn 3 triệu lớp đẳng cấu.
Ký hiệu: Mỗi đường cong có nhãn dạng Na# (ví dụ: 37a1, 11a1, 389a1), trong đó $N$ là conductor, ký tự là lớp đẳng cấu, số cuối là thứ tự trong lớp.
Ví dụ
- 11a1 (conductor nhỏ nhất): $y^2 + y = x^3 - x^2 - 10x - 20$. Rank $0$, $E(\mathbb{Q}) = \mathbb{Z}/5\mathbb{Z}$, $\Omega = 1.269209\ldots$, $|\mathrm{Sha}| = 1$, $c_{11} = 5$.
- 37a1 (rank 1 nhỏ nhất): $y^2 + y = x^3 - x$. Rank $1$, sinh bởi $(0, 0)$, $\mathrm{Reg} = 0.051\ldots$, $|\mathrm{Sha}| = 1$, $c_{37} = 1$.
- 389a1 (rank 2 nhỏ nhất): $y^2 + y = x^3 + x^2 - 2x$. Rank $2$, sinh bởi $(0,0)$ và $(-1,1)$. $|\mathrm{Sha}_{\mathrm{an}}| = 1$.
- 571a1 ($\mathrm{Sha} \neq 0$): $y^2 + y = x^3 - x^2 - 929x - 10595$. Rank $0$, $|\mathrm{Sha}_{\mathrm{an}}| = 4$ ($\mathrm{Sha} \cong (\mathbb{Z}/2\mathbb{Z})^2$). BSD mạnh kiểm nghiệm chính xác.
Ý nghĩa trực giác
- Hình dung: Như bảng tuần hoàn liệt kê mọi nguyên tố hóa học, Cremona liệt kê mọi đường cong elliptic (theo conductor). Conductor càng lớn $\leftrightarrow$ “nguyên tố nặng hơn” --- phức tạp hơn nhưng tuân cùng quy luật.
- Tại sao quan trọng? Trước Cremona, kiểm nghiệm BSD cho từng đường cong riêng lẻ. Với database: kiểm nghiệm hệ thống cho hàng triệu đường cong --- phát hiện pattern, tìm counterexample (chưa tìm thấy!), xác nhận phỏng đoán.
- Thuật toán: Cremona dùng modular symbols + 2-descent + chiều cao để tính mọi bất biến. Phần mềm
eclib(C++) và tích hợp trong SageMath.
Liên hệ với giả thuyết Birch--Dyer
- Kiểm nghiệm hệ thống: Mọi đường cong trong database đã kiểm nghiệm BSD yếu ($\mathrm{ord}_{s=1} L(E,s) = \mathrm{rk}$) và BSD mạnh (công thức hệ số hàng đầu) --- tất cả nhất quán, không phản ví dụ nào.
- Phát hiện $\mathrm{Sha}$: Database cho phép tìm đường cong có $|\mathrm{Sha}| > 1$ một cách hệ thống. Ví dụ: tìm mọi $E$ conductor $\leq 500{,}000$ có $|\mathrm{Sha}_{\mathrm{an}}| \geq 4$.
- Thống kê Bhargava: Kết quả $\mathrm{avg}|\mathrm{Sel}_2| = 3$ của Bhargava--Shankar được kiểm nghiệm trên database Cremona --- thống kê thực tế khớp hoàn hảo với lý thuyết [bhargava-shankar2015].
Định nghĩa
https://www.lmfdb.org) là cơ sở dữ liệu trực tuyến quy mô lớn, tổng hợp các đối tượng số học và mối liên hệ giữa chúng:
- Đường cong elliptic: Bao gồm toàn bộ Cremona's database + mở rộng (conductor lớn hơn, trên các trường số khác $\mathbb{Q}$).
- Dạng modular: Newforms mọi trọng lượng, mọi mức (level), hệ số Fourier, tích Petersson, biểu diễn Galois.
- Hàm $L$: Hàm $L$ cho đường cong elliptic, dạng modular, đặc trưng Dirichlet, dạng Maass, ... với zero tính sẵn.
- Trường số: Phân biệt, nhóm lớp, đơn vị, nhóm Galois.
- Liên kết: LMFDB kết nối đối tượng: “đường cong $E$ $\leftrightarrow$ newform $f_E$ $\leftrightarrow$ hàm $L(E,s)$ $\leftrightarrow$ biểu diễn Galois $\rho_{E,\ell}$” --- thể hiện các tương ứng Langlands.
LMFDB là dự án cộng đồng quốc tế, bắt đầu khoảng 2007, với hàng trăm nhà toán học đóng góp.
Ví dụ
- Tra cứu 37a1: Trên LMFDB, gõ “37.a1” hoặc “37a1”. Kết quả: phương trình, hạng, nhóm xoắn, hàm $L$, newform tương ứng, biểu diễn Galois mod $\ell$, ảnh Galois, ... tất cả trên một trang.
- Tìm newform: Newform tương ứng với 37a1 là $f \in S_2(\Gamma_0(37))$ --- dạng cusp trọng lượng $2$, mức $37$. LMFDB cho hệ số: $a_1 = 1, a_2 = -2, a_3 = -3, a_4 = 2, a_5 = -2, \ldots$ Khớp hoàn toàn với $a_p(E) = p + 1 - |E(\mathbb{F}_p)|$ (định lý modularity).
- Kiểm tra BSD: Trang LMFDB cho 37a1 hiện: $L(E,1) = 0$ (bậc triệt tiêu $= 1 = \mathrm{rk}$), $L'(E,1)/\Omega \cdot \mathrm{Reg} = 1/1$ (BSD mạnh khớp với $|\mathrm{Sha}| = 1$).
- Thống kê: LMFDB cung cấp thống kê: phân bố hạng, phân bố $|\mathrm{Sha}|$, phân bố Tamagawa --- dữ liệu cho nghiên cứu Bhargava-type.
Ý nghĩa trực giác
- Hình dung: Như Google Maps cho bản đồ --- LMFDB cho “bản đồ” lý thuyết số. Muốn biết đường cong $E$ liên hệ với dạng modular nào, hàm $L$ nào, biểu diễn Galois nào? Tra LMFDB --- tất cả được kết nối.
- Triết lý Langlands: Chương trình Langlands dự đoán tương ứng giữa “đối tượng số học” (đường cong, trường số, biểu diễn Galois) và “đối tượng giải tích” (dạng tự đẳng cấu, hàm $L$). LMFDB là hiện thực hóa tính toán của triết lý này.
- Mở và tái tạo: Mọi dữ liệu LMFDB miễn phí, mã nguồn mở. Các tính toán có thể tái tạo --- tiêu chuẩn vàng cho toán học tính toán.
Liên hệ với giả thuyết Birch--Dyer
- Kiểm nghiệm quy mô lớn: LMFDB cho phép kiểm nghiệm BSD (yếu và mạnh) cho hàng triệu đường cong --- bằng chứng thực nghiệm mạnh nhất cho phỏng đoán.
- Kết nối modularity: Với mỗi $E$ conductor $N$, LMFDB hiện newform $f_E \in S_2(\Gamma_0(N))$ tương ứng --- minh họa định lý modularity (Wiles) [wiles1995].
- Phát hiện pattern: Phân tích dữ liệu LMFDB giúp phát hiện pattern mới: ví dụ, phân bố hạng gợi ý phỏng đoán Goldfeld (50% rank 0, 50% rank 1), heuristic PPVW (hạng $\leq 21$), v.v.
- Công cụ thiết yếu: Nghiên cứu BSD hiện đại không thể thiếu LMFDB --- từ tìm ví dụ, kiểm tra phỏng đoán, đến gợi ý hướng chứng minh mới.
Định nghĩa
$\mathrm{SL}_2(\mathbb{Z})$ tác động trên nửa mặt phẳng trên $\mathcal{H} = \{\tau \in \mathbb{C} : \mathrm{Im}(\tau) > 0\}$ bởi biến đổi Möbius:
Phần tử sinh: $\mathrm{SL}_2(\mathbb{Z})$ được sinh bởi hai ma trận:
Nhóm con đồng dư: Với $N \geq 1$, các nhóm con quan trọng:
- $\Gamma_0(N) = \left\{ \begin{pmatrix} a & b \\ c & d \end{pmatrix} \in \mathrm{SL}_2(\mathbb{Z}) : N | c \right\}$ --- nhóm con mức $N$.
- $\Gamma_1(N) = \left\{ \begin{pmatrix} a & b \\ c & d \end{pmatrix} \in \mathrm{SL}_2(\mathbb{Z}) : N | c, \; a \equiv d \equiv 1 \pmod{N} \right\}$.
Ví dụ
- $S$ và $T$ tác động: $S: \tau \mapsto -1/\tau$ (nghịch đảo + đảo dấu). $T: \tau \mapsto \tau + 1$ (dịch ngang). Miền cơ bản: $\mathcal{F} = \{\tau \in \mathcal{H} : |\tau| \geq 1, \; -1/2 \leq \mathrm{Re}(\tau) \leq 1/2\}$ --- hình “mũi tên” quen thuộc.
- Chỉ số: $[\mathrm{SL}_2(\mathbb{Z}) : \Gamma_0(N)] = N \prod_{p | N} (1 + 1/p)$. Ví dụ: $[\mathrm{SL}_2(\mathbb{Z}) : \Gamma_0(11)] = 12$, $[\mathrm{SL}_2(\mathbb{Z}) : \Gamma_0(37)] = 38$.
- Đường cong modular: $Y_0(N) = \Gamma_0(N) \backslash \mathcal{H}$ là đường cong (mặt Riemann không compact). Compact hóa: $X_0(N) = \Gamma_0(N) \backslash (\mathcal{H} \cup \mathbb{P}^1(\mathbb{Q}))$ thêm “cusps” (điểm $\infty$, $0$, ...). Genus $g(X_0(N))$ tính được: $g(X_0(11)) = 1$, $g(X_0(37)) = 2$.
- $X_0(11)$ là đường cong elliptic: $X_0(11)$ có genus $1$ và điểm hữu tỉ (cusp $\infty$) --- vậy $X_0(11)$ chính là đường cong elliptic! Thực tế: $X_0(11) \cong$ 11a1 ($y^2 + y = x^3 - x^2 - 10x - 20$).
Ý nghĩa trực giác
- Hình dung: Mỗi $\tau \in \mathcal{H}$ xác định lưới $\Lambda_\tau = \mathbb{Z} + \mathbb{Z}\tau$ trong $\mathbb{C}$. Hai lưới “giống nhau” (liên hệ bởi phép đổi cơ sở) $\Leftrightarrow$ $\tau$ và $\tau'$ cùng quỹ đạo dưới $\mathrm{SL}_2(\mathbb{Z})$. Vậy $\mathrm{SL}_2(\mathbb{Z}) \backslash \mathcal{H}$ = không gian mọi lưới (lên đến tỉ lệ).
- Lưới $\leftrightarrow$ đường cong elliptic: Mỗi lưới $\Lambda$ cho torus $\mathbb{C}/\Lambda$ --- đường cong elliptic trên $\mathbb{C}$. Vậy $\mathrm{SL}_2(\mathbb{Z}) \backslash \mathcal{H}$ là “không gian moduli” --- không gian phân loại mọi đường cong elliptic trên $\mathbb{C}$.
- $\Gamma_0(N)$: Thêm “cấu trúc mức $N$” --- đánh dấu nhóm con cyclic bậc $N$ trong $E[N]$. $\Gamma_0(N) \backslash \mathcal{H}$ phân loại các cặp $(E, C_N)$ với $C_N \subset E[N]$ cyclic bậc $N$.
Liên hệ với giả thuyết Birch--Dyer
- Nền tảng modularity: Dạng modular sống trên $\Gamma_0(N) \backslash \mathcal{H}$. Định lý modularity (Wiles): mọi $E/\mathbb{Q}$ conductor $N$ tương ứng với newform $f_E \in S_2(\Gamma_0(N))$. Không có $\mathrm{SL}_2(\mathbb{Z})$ và nhóm con đồng dư $\Gamma_0(N)$, không phát biểu được modularity.
- Ánh xạ modular: $X_0(N) \to E$ (surjection từ đường cong modular lên $E$) --- “nhìn thấy” $E$ bên trong $X_0(N)$. Điểm Heegner trên $X_0(N)$ ánh xạ thành điểm trên $E$ --- cốt lõi của Gross--Zagier [gross-zagier1986].
- Bậc modular: $\deg(X_0(N) \to E)$ = bậc modular --- xuất hiện trong các công thức liên quan BSD.
Định nghĩa
- Tính modular: Với mọi $\gamma = \begin{pmatrix} a & b \\ c & d \end{pmatrix} \in \Gamma$:
\[ f\!\left(\frac{a\tau + b}{c\tau + d}\right) = (c\tau + d)^k \, f(\tau). \]
- Giải tích tại cusps: $f$ giải tích (holomorphic) trên $\mathcal{H}$ và tại mọi cusp.
Không gian dạng modular trọng lượng $k$ cho $\Gamma_0(N)$: $M_k(\Gamma_0(N))$.
Vì $T = \begin{pmatrix} 1 & 1 \\ 0 & 1 \end{pmatrix} \in \Gamma_0(N)$, tính modular cho $f(\tau + 1) = f(\tau)$, nên $f$ có khai triển Fourier (hay $q$-expansion, $q = e^{2\pi i \tau}$):
Ví dụ
- Chuỗi Eisenstein $G_k(\tau)$ (trọng lượng $k \geq 4$, cho $\mathrm{SL}_2(\mathbb{Z})$):
\[ G_k(\tau) = \sum_{\substack{(m,n) \in \mathbb{Z}^2 \\ (m,n) \neq (0,0)}} \frac{1}{(m\tau + n)^k}. \]Là dạng modular (không phải cusp form vì $a_0 \neq 0$).
- Hàm Delta Ramanujan (trọng lượng $12$, cho $\mathrm{SL}_2(\mathbb{Z})$):
\[ \Delta(\tau) = q \prod_{n=1}^{\infty} (1 - q^n)^{24} = \sum_{n=1}^{\infty} \tau(n) q^n \]với $\tau(n)$ là hàm Ramanujan. Đây là cusp form duy nhất (lên đến hằng số) trong $S_{12}(\mathrm{SL}_2(\mathbb{Z}))$.
- $S_2(\Gamma_0(11))$: Không gian $1$ chiều, sinh bởi $f_{11a1}(\tau) = q - 2q^2 - q^3 + 2q^4 + q^5 + \cdots$ Hệ số $a_p = p + 1 - |E_{11a1}(\mathbb{F}_p)|$ cho đường cong 11a1.
- $S_2(\Gamma_0(37))$: Không gian $2$ chiều, chứa $2$ newforms: $f_{37a1}$ và $f_{37b1}$, tương ứng $2$ lớp đẳng cấu đường cong elliptic conductor $37$.
Ý nghĩa trực giác
- Hình dung: Hàm modular là hàm trên “không gian lưới” $\mathcal{H}$, biến đổi “đẹp” (nhân $(c\tau+d)^k$) khi đổi cơ sở lưới. Trọng lượng $k$ = “mức độ xoắn” khi biến đổi.
- Tại sao $q$-expansion? Dạng modular tuần hoàn theo $\tau \mapsto \tau + 1$, nên khai triển Fourier trong $q = e^{2\pi i \tau}$. Hệ số Fourier $a_n$ mã hóa thông tin số học cực kỳ phong phú.
- “Ít nhưng mạnh”: $\dim S_k(\Gamma_0(N))$ hữu hạn (tính bằng công thức Riemann--Roch). Số ít hàm thỏa đồng thời “giải tích + modular” --- ràng buộc mạnh làm cho hệ số $a_n$ chứa thông tin sâu.
Liên hệ với giả thuyết Birch--Dyer
- Modularity = nền tảng: Định lý modularity: mọi $E/\mathbb{Q}$ conductor $N$ $\Leftrightarrow$ newform $f_E \in S_2(\Gamma_0(N))$ với $L(E,s) = L(f_E, s)$ [wiles1995]. Hệ quả: $L(E,s)$ có thác triển giải tích (từ tính modular của $f_E$) --- tiên quyết để nói “$L(E,1)$”.
- Hệ số = đếm điểm: $a_p(f_E) = a_p(E) = p + 1 - |E(\mathbb{F}_p)|$. Hàm $L$: $L(E,s) = \sum a_n n^{-s}$. Dạng modular “biết” bao nhiêu điểm trên mỗi $\mathbb{F}_p$.
- Trọng lượng $2$: Dạng modular trọng lượng $2$ tương ứng đường cong elliptic. Trọng lượng $> 2$ tương ứng “motif” tổng quát hơn --- Bloch--Kato tổng quát hóa BSD cho mọi trọng lượng.
Định nghĩa
Tương đương: $f(\tau) \to 0$ khi $\tau$ tiến đến bất kỳ cusp nào ($\mathrm{Im}(\tau) \to \infty$ hoặc $\tau \to$ số hữu tỉ).
Phân tích: $M_k(\Gamma_0(N)) = S_k(\Gamma_0(N)) \oplus \mathcal{E}_k(\Gamma_0(N))$, trong đó $\mathcal{E}_k$ là không gian Eisenstein (sinh bởi chuỗi Eisenstein). Dạng cusp là phần “thú vị” --- phần bổ sung Eisenstein.
Công thức chiều ($k \geq 2$, $N$ squarefree):
Ví dụ
- $S_2(\Gamma_0(11))$: $\dim = 1$ (genus $X_0(11) = 1$). Sinh bởi:
\[ f = q - 2q^2 - q^3 + 2q^4 + q^5 + 2q^6 - 2q^7 + \cdots = \eta(\tau)^2 \eta(11\tau)^2 \]với $\eta(\tau) = q^{1/24} \prod_{n \geq 1} (1 - q^n)$ là hàm eta Dedekind. Đây tương ứng đường cong 11a1.
- $S_{12}(\mathrm{SL}_2(\mathbb{Z}))$: $\dim = 1$. Sinh bởi $\Delta(\tau) = q - 24q^2 + 252q^3 - \cdots$ Hàm $\tau(n)$ (Ramanujan) thỏa: $|\tau(p)| \leq 2p^{11/2}$ (phỏng đoán Ramanujan, chứng minh bởi Deligne 1974 [deligne1974]).
- $S_2(\Gamma_0(1)) = 0$: Không có dạng cusp trọng lượng $2$ cho $\mathrm{SL}_2(\mathbb{Z})$ (genus $X_0(1) = 0$). Đường cong elliptic cần conductor $N \geq 11$.
- $\dim S_2(\Gamma_0(37)) = 2$: Hai newforms = hai lớp đẳng cấu đường cong elliptic conductor $37$: 37a và 37b.
Ý nghĩa trực giác
- Hình dung: Cusps = “đỉnh” của miền cơ bản (các điểm $\tau = i\infty$ và số hữu tỉ). Dạng cusp “tắt” tại mọi đỉnh --- giống sóng đứng triệt tiêu ở biên. Chuỗi Eisenstein thì “không tắt” --- như sóng đều.
- Tại sao “thú vị hơn”? Chuỗi Eisenstein có hệ số Fourier “tầm thường” (hàm ước số, số Bernoulli). Dạng cusp có hệ số “phức tạp” (hàm Ramanujan $\tau(n)$, hệ số $a_p(E)$) --- chứa thông tin số học sâu.
- Đếm điểm: Mỗi newform trong $S_2(\Gamma_0(N))$ tương ứng một lớp đẳng cấu đường cong elliptic conductor $N$ (modularity). Số newforms = số lớp đẳng cấu --- “dạng cusp đếm đường cong”.
Liên hệ với giả thuyết Birch--Dyer
- $f_E \in S_2(\Gamma_0(N))$: Mỗi $E/\mathbb{Q}$ tương ứng duy nhất một newform cusp trọng lượng $2$. Hàm $L(E,s) = L(f_E, s) = \sum a_n(f_E) n^{-s}$ --- hàm $L$ trong BSD chính là hàm $L$ của dạng cusp.
- Thác triển: Dạng cusp cho tích phân $\Lambda(f,s) = \int_0^{\infty} f(iy) y^{s-1} dy$ = hàm $L$ hoàn chỉnh. Phương trình hàm $\Lambda(f, s) = w \Lambda(f, 2-s)$ với $w = w(E)$ (dấu gốc) --- tiên quyết cho BSD.
- Tích Petersson: $\langle f_E, f_E \rangle = \int_{\Gamma_0(N) \backslash \mathcal{H}} |f_E(\tau)|^2 y^2 \frac{dx \, dy}{y^2}$ liên hệ với chu kỳ $\Omega_E$ --- thành phần trong BSD mạnh.
Định nghĩa
Chuỗi chuẩn hóa:
Ví dụ quan trọng:
- $E_4(\tau) = 1 + 240\sum_{n \geq 1} \sigma_3(n) q^n = 1 + 240q + 2160q^2 + \cdots$
- $E_6(\tau) = 1 - 504\sum_{n \geq 1} \sigma_5(n) q^n = 1 - 504q - 16632q^2 - \cdots$
$E_4$ và $E_6$ sinh vành dạng modular: $M_*(\mathrm{SL}_2(\mathbb{Z})) = \mathbb{C}[E_4, E_6]$.
Ví dụ
- $\Delta$ từ $E_4, E_6$: $\Delta(\tau) = \frac{E_4(\tau)^3 - E_6(\tau)^2}{1728} = q - 24q^2 + 252q^3 - \cdots$ Vì $E_4^3$ và $E_6^2$ đều thuộc $M_{12}$ với cùng hệ số hằng $1$, hiệu triệt tiêu hệ số hằng $\Rightarrow$ dạng cusp!
- $j$-bất biến: $j(\tau) = \frac{E_4(\tau)^3}{\Delta(\tau)} = \frac{1}{q} + 744 + 196884q + \cdots$ Hàm $j$ là bất biến modular (trọng lượng $0$) --- tham số hóa mọi đường cong elliptic trên $\mathbb{C}$: $E$ có $j$-bất biến $j(E) = j(\tau_E)$.
- Liên hệ Weierstrass: Cho lưới $\Lambda = \mathbb{Z} + \mathbb{Z}\tau$: $g_2(\Lambda) = 60 G_4(\tau)$, $g_3(\Lambda) = 140 G_6(\tau)$. Đường cong $y^2 = 4x^3 - g_2 x - g_3$ có $j = 1728 \cdot g_2^3 / (g_2^3 - 27g_3^2)$.
- $\sigma_3(n)$ = đếm lưới: $\sigma_3(n) = \sum_{d|n} d^3$ đếm (có trọng số) số cách biểu diễn $n$ trong lưới --- ý nghĩa “đếm” tự nhiên.
Ý nghĩa trực giác
- Hình dung: Phân tích $M_k = S_k \oplus \mathcal{E}_k$: chuỗi Eisenstein = “phần đều” (hệ số = hàm ước số, dễ hiểu), dạng cusp = “phần dao động” (hệ số phức tạp, chứa thông tin sâu). Như tín hiệu = DC + AC.
- Hàm sinh “mọi thứ”: $E_4$ và $E_6$ sinh mọi dạng modular cho $\mathrm{SL}_2(\mathbb{Z})$. Vậy $E_4, E_6$ là “nguyên tử” --- mọi dạng modular là đa thức trong $E_4, E_6$. $\Delta = (E_4^3 - E_6^2)/1728$ là dạng cusp “nhỏ nhất”.
- Convergence: Chuỗi $G_k$ hội tụ tuyệt đối khi $k \geq 4$ ($\sum_{(m,n)} |m\tau+n|^{-k}$ hội tụ vì “đủ nhanh”). Trường hợp $k = 2$: $G_2$ không phải dạng modular thực sự (“gần modular” --- quasi-modular) --- cần hiệu chỉnh.
Liên hệ với giả thuyết Birch--Dyer
- Phần bù: Trong $M_2(\Gamma_0(N))$, chuỗi Eisenstein tương ứng “phần tầm thường” của hàm $L$ (tích Dirichlet $L$-functions). Dạng cusp = “phần mới” = đường cong elliptic. Hàm $L$ BSD đến từ phần cusp, không phải Eisenstein.
- Liên hệ $g_2, g_3$: Bất biến $g_2 = 60G_4$, $g_3 = 140G_6$ xác định đường cong Weierstrass $y^2 = 4x^3 - g_2 x - g_3$. Chu kỳ $\Omega_E = \int_{E(\mathbb{R})} |dx/2y|$ trong BSD mạnh tính từ lưới --- lưới xác định bởi $G_4, G_6$.
- Hàm $L$ Eisenstein: $L(E_k, s) = \zeta(s)\zeta(s-k+1)$ --- tích hai zeta. Dạng cusp $f_E$ cho $L(f_E, s) = L(E, s)$ --- hàm $L$ “không tách” (primitive). BSD nói về giá trị đặc biệt $L(f_E, 1)$ --- thông tin sâu hơn Eisenstein.
Định nghĩa
Các giá trị đầu tiên:
| $k$ | 0 | 1 | 2 | 4 | 6 | 8 | 10 | 12 |
|---|---|---|---|---|---|---|---|---|
| $B_k$ | $1$ | $-\tfrac{1}{2}$ | $\tfrac{1}{6}$ | $-\tfrac{1}{30}$ | $\tfrac{1}{42}$ | $-\tfrac{1}{30}$ | $\tfrac{5}{66}$ | $-\tfrac{691}{2730}$ |
$B_k = 0$ khi $k$ lẻ và $k \geq 3$. Dấu xen kẽ: $(-1)^{k/2+1} B_k > 0$ cho $k$ chẵn $\geq 2$.
Liên hệ với hàm zeta Riemann: Với $k$ chẵn $\geq 2$:
Ví dụ
- Tổng lũy thừa: $\sum_{j=0}^{n-1} j^k = \frac{1}{k+1} \sum_{i=0}^{k} \binom{k+1}{i} B_i \, n^{k+1-i}$. Ví dụ: $\sum_{j=0}^{n-1} j^2 = \frac{n(n-1)(2n-1)}{6}$ (dùng $B_0 = 1$, $B_1 = -1/2$, $B_2 = 1/6$).
- Chuỗi Eisenstein: $E_k(\tau) = 1 - \frac{2k}{B_k} \sum_{n \geq 1} \sigma_{k-1}(n) q^n$. Hệ số $-2k/B_k$: với $k = 4$: $-8/(-1/30) = 240$; $k = 6$: $-12/(1/42) = -504$; $k = 12$: $-24/(-691/2730) = 65520/691$.
- $B_{12} = -691/2730$: Số nguyên tố $691$ xuất hiện “bất ngờ” --- nó là thừa số trong $\tau(n) \pmod{691}$ (đồng dư Ramanujan: $\tau(n) \equiv \sigma_{11}(n) \pmod{691}$), liên hệ sâu với đường cong Eisenstein bậc $12$.
Ý nghĩa trực giác
- Hình dung: Số Bernoulli xuất hiện ở mọi nơi: tổng lũy thừa, hàm zeta, chuỗi Eisenstein, $K$-theory, lý thuyết homotopy. Chúng là “hằng số cơ bản” kết nối giải tích và số học.
- Tử số kỳ lạ: $B_{12}$ có tử số $691$ --- số nguyên tố “lạ” xuất hiện từ hàm sinh đơn giản $t/(e^t - 1)$. Kummer phát hiện: $p | B_k$ cho thông tin về nhóm lớp $\mathrm{Cl}(\mathbb{Q}(\zeta_p))$ --- “nguyên tố bất chính quy” (irregular prime).
- Giá trị tại số nguyên âm: $\zeta(1-k) = -B_k/k$ cho $k \geq 1$. Vậy $\zeta(-1) = -1/12$, $\zeta(-3) = 1/120$, ... Giá trị “kỳ lạ” nhưng hợp lý qua thác triển giải tích.
Liên hệ với giả thuyết Birch--Dyer
- Chuỗi Eisenstein: Hệ số Eisenstein $E_k$ chứa $B_k$ ở mẫu --- $B_k$ quyết định “phần tầm thường” của $M_k$. Dạng cusp (phần BSD) = $M_k$ trừ đi phần Eisenstein (chứa $B_k$).
- Đồng dư modular: Đồng dư Ramanujan $\tau(n) \equiv \sigma_{11}(n) \pmod{691}$ (do $691 | B_{12}$) phản ánh cấu trúc sâu: tồn tại đồng cấu $S_{12} \to \mathcal{E}_{12} \pmod{691}$. Tương tự: đồng dư Eisenstein cho dạng trọng lượng $2$ liên hệ hệ số $a_p(E)$ với hàm ước số.
- Tương tự BSD: Công thức $\zeta(k) = (-1)^{k/2+1}(2\pi)^k B_k / (2 \cdot k!)$ cho giá trị đặc biệt $\zeta$ tại số nguyên dương --- tương tự BSD cho giá trị đặc biệt $L(E,1)$. Cả hai đều liên hệ “giá trị $L$” với “bất biến số học”.
Định nghĩa
Cho $\Gamma_0(N)$ ($k = 2$): $\dim S_2(\Gamma_0(N)) = g(X_0(N))$ = genus đường cong modular. Công thức genus (Hurwitz):
Ví dụ:
| $N$ | 1 | 2 | 11 | 14 | 15 | 37 | 50 | 100 | 389 |
|---|---|---|---|---|---|---|---|---|---|
| $\dim S_2(\Gamma_0(N))$ | 0 | 0 | 1 | 1 | 1 | 2 | 2 | 7 | 32 |
Ví dụ
- $\mathrm{SL}_2(\mathbb{Z})$: $\dim S_{12} = 1$ ($\Delta$), $\dim S_{24} = 2$ ($\Delta E_{12}$ và $\Delta^2$), $\dim S_{36} = 3$. Mỗi bậc cao thêm khoảng $1$ chiều mỗi $12$ đơn vị.
- $\Gamma_0(11)$: $\mu = 12$, $\nu_2 = 0$ (không có điểm elliptic bậc $2$ vì $-1$ không phải thặng dư bậc hai mod $11$), $\nu_3 = 0$, $\nu_\infty = 2$ cusps. $g = 1 + 1 - 0 - 0 - 1 = 1$. Vậy $\dim S_2(\Gamma_0(11)) = 1$ --- đúng $1$ newform = đúng $1$ đường cong elliptic conductor $11$.
- $\Gamma_0(37)$: $g = 2$, nên $\dim S_2 = 2$: hai newforms $f_{37a}$ và $f_{37b}$, tương ứng hai lớp đẳng cấu 37a và 37b.
- Conductor lớn: $\dim S_2(\Gamma_0(389)) = 32$ --- có $32$ newforms trọng lượng $2$ mức $389$, tức $32$ lớp đẳng cấu đường cong elliptic conductor $389$ (một trong đó là 389a1, rank $2$ nhỏ nhất).
Ý nghĩa trực giác
- Hình dung: $\dim S_2(\Gamma_0(N))$ = số newforms = số lớp đẳng cấu đường cong elliptic conductor $N$ (modularity!). Vậy công thức chiều đếm bao nhiêu đường cong elliptic có conductor $N$ --- “bảng tuần hoàn” tự xây.
- Genus = tôpô: $g(X_0(N))$ là bất biến tôpô (số “lỗ” của mặt Riemann $X_0(N)$). Vậy số đường cong elliptic conductor $N$ được xác định bởi tôpô --- liên hệ bất ngờ giữa hình học và số học.
- Tăng trưởng: $\dim S_2(\Gamma_0(N)) \sim N/12$ (bậc nhất theo $N$). Conductor càng lớn, càng nhiều đường cong --- hợp lý!
Liên hệ với giả thuyết Birch--Dyer
- Đếm đối tượng BSD: Mỗi chiều trong $S_2(\Gamma_0(N))$ = một đường cong elliptic = một phiên bản BSD cần kiểm nghiệm. $\dim = 32$ tại $N = 389$ nghĩa là $32$ phỏng đoán BSD riêng biệt.
- Modularity ngược: Biết $\dim S_2(\Gamma_0(N))$, ta biết chính xác số đường cong elliptic conductor $N$. Nếu tìm ít hơn $\Rightarrow$ thiếu. Nếu tìm nhiều hơn $\Rightarrow$ sai conductor. Database Cremona dùng điều này để kiểm tra tính đầy đủ.
- Old/new decomposition: $S_2(\Gamma_0(N)) = S_2^{\mathrm{new}} \oplus S_2^{\mathrm{old}}$. Newforms = đường cong conductor đúng $N$. Oldforms đến từ divisor $M | N$ --- “thừa kế” từ mức nhỏ hơn.
Định nghĩa
Tổng quát hơn, với $(n, N) = 1$:
Tính chất quan trọng:
- Giao hoán: $T_m T_n = T_n T_m$ nếu $(m, n) = 1$.
- Nhân tính: $T_{mn} = T_m T_n$ nếu $(m, n) = 1$; $T_{p^2} = T_p^2 - p^{k-1} \langle p \rangle$ (với $\langle p \rangle$ là toán tử diamond).
- Tự liên hợp: $T_n$ tự liên hợp dưới tích Petersson: $\langle T_n f, g \rangle = \langle f, T_n g \rangle$ khi $(n, N) = 1$.
- Bảo toàn: $T_n$ ánh xạ $M_k \to M_k$ và $S_k \to S_k$.
Ví dụ
- $T_2$ trên $\Delta(\tau) = q - 24q^2 + 252q^3 - \cdots$: $T_2(\Delta) = a_2 \Delta = -24 \Delta$ (vì $\dim S_{12} = 1$ nên $\Delta$ là dạng riêng!). Vậy $\Delta$ là eigenform với eigenvalue $\tau(2) = -24$.
- $T_p$ trên $f_{11a1} = q - 2q^2 - q^3 + 2q^4 + q^5 + \cdots$: $T_p(f_{11a1}) = a_p(E_{11a1}) \cdot f_{11a1}$, với $a_p = p + 1 - |E_{11a1}(\mathbb{F}_p)|$. Ví dụ: $T_2(f) = -2f$ (vì $|E(\mathbb{F}_2)| = 5$, $a_2 = 2 + 1 - 5 = -2$).
- $T_2$ trên $S_2(\Gamma_0(37))$ ($2$ chiều): Ma trận $T_2$ trên cơ sở newforms: $T_2 = \begin{pmatrix} -2 & 0 \\ 0 & 0 \end{pmatrix}$. Eigenvalues: $-2$ (cho 37a1) và $0$ (cho 37b1). Ứng với $a_2(37a1) = -2$ và $a_2(37b1) = 0$.
- Ý nghĩa hình học: $T_p$ “trung bình hóa” $f$ trên các lưới con chỉ số $p$: mỗi lưới $\Lambda$ có $p+1$ lưới con chỉ số $p$, và $T_p$ lấy tổng $f$ trên chúng (có trọng số $p^{k-1}$).
Ý nghĩa trực giác
- Hình dung: $T_p$ lấy dạng modular $f$ (hàm trên lưới) và “trộn” nó với các lưới con chỉ số $p$. Như bộ lọc tín hiệu: $T_p$ trích xuất thành phần “tần số $p$” từ $f$.
- “Đại số Hecke”: Các $T_n$ giao hoán, tự liên hợp $\Rightarrow$ chéo hóa đồng thời được (phổ thực). Cơ sở riêng chung = eigenforms = dạng “cơ bản” nhất. Mỗi eigenform tương ứng đường cong elliptic (khi $k = 2$).
- Tại sao $a_p$ quan trọng? Nếu $f$ là eigenform: $T_p f = a_p f$. Giá trị riêng $a_p$ = hệ số Fourier thứ $p$ = $p + 1 - |E(\mathbb{F}_p)|$ (đếm điểm!). Toán tử Hecke “trích xuất” thông tin số học từ dạng modular.
Liên hệ với giả thuyết Birch--Dyer
- Hàm $L$ từ eigenvalues: $L(f, s) = \sum a_n n^{-s} = \prod_p (1 - a_p p^{-s} + p^{k-1-2s})^{-1}$ (tích Euler). Eigenvalues Hecke $a_p$ xác định hoàn toàn hàm $L(E,s)$ --- đối tượng trung tâm BSD.
- Modularity symbols: Tính $L(E,1)$ bằng modular symbols sử dụng tác động Hecke --- phương pháp hiệu quả nhất để kiểm nghiệm BSD số học.
- Chéo hóa = phân loại: Chéo hóa đại số Hecke trên $S_2(\Gamma_0(N))$ phân loại mọi đường cong elliptic conductor $N$. Mỗi eigenvalue hệ thống $(a_2, a_3, a_5, \ldots)$ xác định duy nhất một lớp đẳng cấu --- “vân tay” Hecke [wiles1995].
Định nghĩa
Nếu $f = \sum a_n q^n$ là eigenform chuẩn hóa ($a_1 = 1$), thì:
Tính chất:
- Hệ số $a_n$ nhân tính: $a_{mn} = a_m a_n$ khi $(m,n) = 1$.
- Quan hệ đệ quy: $a_{p^{r+1}} = a_p a_{p^r} - p^{k-1} a_{p^{r-1}}$ cho $p \nmid N$.
- Hàm $L$ có tích Euler: $L(f, s) = \prod_{p \nmid N} (1 - a_p p^{-s} + p^{k-1-2s})^{-1} \prod_{p | N} (1 - a_p p^{-s})^{-1}$.
Ví dụ
- $\Delta(\tau) \in S_{12}(\mathrm{SL}_2(\mathbb{Z}))$: Eigenform chuẩn hóa duy nhất. $a_p = \tau(p)$ (hàm Ramanujan). Nhân tính: $\tau(6) = \tau(2)\tau(3) = (-24)(252) = -6048$. Kiểm tra: $\tau(6) = -6048$ ✓.
- $f_{37a1} \in S_2(\Gamma_0(37))$: Eigenform ứng với 37a1. Eigenvalues: $a_2 = -2$, $a_3 = -3$, $a_5 = -2$, $a_7 = -2$, $a_{11} = 0$, ... Nhân tính: $a_6 = a_2 a_3 = 6$.
- Trường hệ số: Eigenform $f \in S_2(\Gamma_0(23))$ có $a_2 = \frac{-1 + \sqrt{5}}{2}$ --- giá trị riêng không nguyên! Đây ứng với đa tạp Abel (không phải đường cong elliptic) --- trường hệ số $\mathbb{Q}(\sqrt{5})$.
- $a_p \in \mathbb{Z}$ $\Leftrightarrow$ đường cong elliptic: Eigenform chuẩn hóa trong $S_2(\Gamma_0(N))$ có $a_p \in \mathbb{Z}$ $\forall p$ $\Leftrightarrow$ ứng với đường cong elliptic (Eichler--Shimura). Nếu $a_p$ nằm trong trường số bậc $d > 1$: ứng với đa tạp Abel chiều $d$.
Ý nghĩa trực giác
- Hình dung: Như “sóng riêng” (eigenmode) trong vật lý: eigenform là dao động cơ bản mà toán tử Hecke chỉ thay đổi biên độ (nhân $a_p$), không thay đổi hình dạng. Mọi dạng modular = tổ hợp tuyến tính eigenforms.
- “Vân tay số học”: Dãy eigenvalues $(a_2, a_3, a_5, a_7, \ldots)$ xác định duy nhất eigenform (strong multiplicity one). Như vân tay --- mỗi đường cong elliptic có dãy $a_p$ riêng biệt.
- Nhân tính = tích Euler: $a_{mn} = a_m a_n$ (coprime) cho phép viết $L(f,s) = \prod_p L_p(f,s)$ --- tích trên nguyên tố. Cấu trúc “cục bộ--toàn cục” là trung tâm của lý thuyết số.
Liên hệ với giả thuyết Birch--Dyer
- $f_E$ = eigenform ứng với $E$: Định lý modularity: mỗi $E/\mathbb{Q}$ conductor $N$ $\leftrightarrow$ eigenform chuẩn hóa $f_E \in S_2(\Gamma_0(N))$ với $a_p(f_E) = a_p(E)$ $\forall p$ [wiles1995]. BSD phát biểu về $L(f_E, s) = L(E, s)$.
- Eichler--Shimura: Eigenform $f$ với $a_n \in \mathbb{Z}$ cho đường cong elliptic $E_f/\mathbb{Q}$ qua xây dựng Eichler--Shimura: $E_f = J_0(N) / (\ker \phi)$ (thương Jacobian). Đây là “chiều ngược” modularity.
- Hệ số = đếm điểm: $a_p(f_E) = p + 1 - |E(\mathbb{F}_p)|$ cho $p \nmid N$. Tích Euler: $L(E, s) = \prod_p (1 - a_p p^{-s} + p^{1-2s})^{-1}$ (tại $p$ tốt). BSD nói $\mathrm{ord}_{s=1} L(E,s) = \mathrm{rk}(E/\mathbb{Q})$.
Định nghĩa
Oldforms: Đến từ mức nhỏ hơn. Với $M | N$, $M < N$, và $d | (N/M)$, ánh xạ $f(\tau) \mapsto f(d\tau)$ gửi $S_k(\Gamma_0(M)) \to S_k(\Gamma_0(N))$. Phần old = tổng ảnh mọi ánh xạ này.
Newforms: Phần bù trực giao (dưới tích Petersson). Newform (newform) là eigenform chuẩn hóa ($a_1 = 1$) trong $S_k^{\mathrm{new}}(\Gamma_0(N))$ --- dạng “xuất hiện lần đầu” tại mức $N$.
Tính chất (Atkin--Lehner theory):
- Newforms là eigenform cho mọi $T_n$ (kể cả $n$ không coprime $N$).
- Hệ số $a_n$ xác định newform duy nhất (strong multiplicity one).
- Toán tử Atkin--Lehner $W_N: f(\tau) \mapsto N^{-k/2} \tau^{-k} f(-1/(N\tau))$ cho eigenvalue $w_N = \pm 1$ --- dấu gốc $w(E) = -w_N$.
Ví dụ
- $S_2(\Gamma_0(22))$: $\dim = 2$. Nhưng 22 = $2 \times 11$. Newform mức $11$: $f_{11a1}$. Hai embeddings: $f_{11a1}(\tau)$ và $f_{11a1}(2\tau)$ $\in S_2(\Gamma_0(22))$. Vậy $S_2^{\mathrm{old}} = 2$ chiều, $S_2^{\mathrm{new}} = 0$. Không có đường cong elliptic conductor đúng $22$!
- $S_2(\Gamma_0(37))$: $\dim = 2$, $37$ nguyên tố nên $S_2^{\mathrm{old}} = 0$ (không có ước thực sự). Cả $2$ chiều là newforms: $f_{37a1}$ và $f_{37b1}$.
- $S_2(\Gamma_0(44))$: $\dim = 4$. Ước của $44$: $1, 2, 4, 11, 22, 44$. Oldforms từ $N = 11$: $f_{11a1}(\tau), f_{11a1}(2\tau), f_{11a1}(4\tau)$ = $3$ chiều. Newforms: $\dim S_2^{\mathrm{new}} = 1$ --- đúng $1$ đường cong elliptic conductor $44$.
- Dấu gốc: $f_{37a1}$ có $w_{37} = -1$, nên $w(E_{37a1}) = +1$... nhưng $\mathrm{rk}(37a1) = 1$ --- oops? Thực ra $w(E) = -w_N$ khi $N$ nguyên tố, và $w(37a1) = -1$ (rank lẻ, phù hợp parity conjecture).
Ý nghĩa trực giác
- Hình dung: Oldforms là “bản sao” từ mức nhỏ hơn (như phim chiếu lại). Newforms là “phim mới” --- xuất hiện lần đầu tại mức $N$. Chỉ newforms mang thông tin mới.
- Tại sao quan trọng? Modularity: $E/\mathbb{Q}$ conductor $N$ $\leftrightarrow$ newform mức $N$. Nếu dùng “mọi dạng” (kể cả old), sẽ đếm thừa --- mỗi $E$ conductor $M | N$ bị đếm nhiều lần.
- Strong multiplicity one: Hai newform cùng $a_p$ cho hầu hết $p$ $\Rightarrow$ giống nhau. “Vân tay” $a_p$ xác định duy nhất --- cực kỳ mạnh, hệ quả của lý thuyết biểu diễn.
Liên hệ với giả thuyết Birch--Dyer
- Tương ứng 1-1: $\{$đường cong elliptic$/\mathbb{Q}$ conductor $N\} \xleftrightarrow{1:1} \{$newform $f \in S_2^{\mathrm{new}}(\Gamma_0(N))$ với $a_n \in \mathbb{Z}\}$. Đây là nội dung chính xác của định lý modularity + Eichler--Shimura.
- Dấu gốc: Eigenvalue Atkin--Lehner $w_N$ cho dấu gốc $w(E)$ (lên đến dấu). Phỏng đoán tính chẵn lẻ: $(-1)^{\mathrm{rk}} = w(E)$. Kiểm nghiệm từ newform: $w_N$ tính dễ $\Rightarrow$ dự đoán pariy của hạng.
- Hàm $L$ primitive: $L(f, s)$ cho newform $f$ là hàm $L$ “nguyên thủy” --- không tách thành tích hàm $L$ nhỏ hơn. BSD nói về $L$-function primitive: $\mathrm{ord}_{s=1} L(f, s) = \mathrm{rk}(E_f/\mathbb{Q})$.
Định nghĩa
Các giá trị đầu: $\tau(1) = 1$, $\tau(2) = -24$, $\tau(3) = 252$, $\tau(4) = -1472$, $\tau(5) = 4830$, $\tau(6) = -6048$, $\tau(7) = -16744$, ...
Tính chất (phỏng đoán Ramanujan, nay là định lý):
- Nhân tính: $\tau(mn) = \tau(m)\tau(n)$ khi $(m,n) = 1$.
- Đệ quy: $\tau(p^{r+1}) = \tau(p)\tau(p^r) - p^{11}\tau(p^{r-1})$.
- Chặn Ramanujan--Petersson: $|\tau(p)| \leq 2p^{11/2}$ --- chứng minh bởi Deligne (1974) dùng giả thuyết Weil cho đa tạp trên trường hữu hạn [deligne1974].
Ví dụ
- Nhân tính: $\tau(6) = \tau(2)\tau(3) = (-24)(252) = -6048$ ✓. $\tau(12) = \tau(4)\tau(3) = (-1472)(252) = -370944$ ✓.
- Đệ quy: $\tau(4) = \tau(2)\tau(2) - 2^{11}\tau(1) = (-24)^2 - 2048 = 576 - 2048 = -1472$ ✓.
- Chặn Ramanujan: $|\tau(2)| = 24 \leq 2 \cdot 2^{11/2} = 2 \cdot 45.25 = 90.5$ ✓. $|\tau(7)| = 16744 \leq 2 \cdot 7^{11/2} = 2 \cdot 96040 = 192080$ ✓. Chặn “rộng” nhưng là kết quả cực kỳ sâu (Deligne = Fields Medal 1978).
- Đồng dư Ramanujan: $\tau(n) \equiv \sigma_{11}(n) \pmod{691}$. Ví dụ: $\tau(2) = -24 \equiv -24$, $\sigma_{11}(2) = 1 + 2^{11} = 2049 \equiv 2049 - 2 \cdot 691 = 667 \equiv -24 \pmod{691}$ ✓.
Ý nghĩa trực giác
- Hình dung: $\tau(n)$ đếm “gì đó” liên quan đến phân hoạch $24$ chiều (tích $(1-q^n)^{24}$ gợi ý $24$ bản sao). Trong lý thuyết dây (string theory), $24 = 26 - 2$ (chiều ngang) --- $\Delta$ xuất hiện tự nhiên!
- Tăng trưởng: $|\tau(n)| \leq C \cdot n^{11/2+\epsilon}$ (Ramanujan--Petersson). So sánh: $\sigma_{11}(n)$ tăng như $n^{11}$. Dạng cusp “nhỏ hơn nhiều” so với Eisenstein --- phần dao động luôn nhỏ.
- Hình mẫu: $\tau(n)$ là prototype cho hệ số Fourier dạng cusp. Mọi tính chất ($\tau$ nhân tính, $|\tau(p)| \leq 2p^{(k-1)/2}$, đồng dư) đều tổng quát cho eigenform bất kỳ --- $\Delta$ là “ví dụ đầu tiên” định hình cả lý thuyết.
Liên hệ với giả thuyết Birch--Dyer
- Chặn Ramanujan = RH cho EC: Cho $E/\mathbb{Q}$, chặn $|a_p(E)| \leq 2\sqrt{p}$ (Hasse) là trường hợp $k = 2$ của chặn Ramanujan--Petersson ($|a_p(f)| \leq 2p^{(k-1)/2}$). Chặn Hasse cần cho hội tụ tích Euler $L(E,s)$ tại $\mathrm{Re}(s) > 3/2$.
- Hàm $L(\Delta, s)$: $L(\Delta, s) = \sum \tau(n) n^{-s}$ là hàm $L$ nguyên mẫu (prototype) --- có phương trình hàm, tích Euler, zero không tầm thường. GRH cho $L(\Delta, s)$ vẫn mở. Nếu đúng, hệ quả cho phân bố $\tau(n)$.
- Deligne $\Rightarrow$ BSD khả thi: Chặn Deligne $|\tau(p)| \leq 2p^{11/2}$ chứng minh tích Euler $L(\Delta, s)$ hội tụ cho $\mathrm{Re}(s) > 13/2$. Tương tự, $|a_p(E)| \leq 2\sqrt{p}$ cho $L(E,s)$ hội tụ $\mathrm{Re}(s) > 3/2$ --- cần để $L(E,1)$ (trong vùng thác triển) có nghĩa.
Định nghĩa
Hệ số chuẩn hóa $\frac{1}{[\mathrm{SL}_2(\mathbb{Z}) : \Gamma_0(N)]}$ đảm bảo tích Petersson không phụ thuộc vào mức $N$ khi ta nhúng dạng modular mức thấp vào mức cao hơn [diamond-shurman2005].
Ví dụ
Vì $\dim S_{12}(\mathrm{SL}_2(\mathbb{Z})) = 1$, dạng $\Delta$ sinh ra toàn bộ không gian cusp form trọng số 12 mức 1. Tích Petersson tự thân là:
Giá trị chính xác: $\langle \Delta, \Delta \rangle = \frac{\pi}{2^6 \cdot 3^5 \cdot 5^3 \cdot 7^2 \cdot 11 \cdot 691} \approx 1.0353 \times 10^{-6}$.
Nhận xét: Số nguyên tố 691 xuất hiện ở mẫu --- cùng số 691 trong đồng dư Ramanujan $\tau(n) \equiv \sigma_{11}(n) \pmod{691}$. Đây không phải trùng hợp: đồng dư Ramanujan phản ánh rằng $\Delta$ và chuỗi Eisenstein $E_{12}$ “gần nhau” theo Petersson.
Ý nghĩa trực giác
- Hình dung: Dạng modular sống trên không gian hàm (vô hạn chiều nói chung, nhưng $S_k$ hữu hạn chiều). Tích Petersson cho chúng ta “góc” và “độ dài” --- biến $S_k$ thành không gian Hilbert.
- Tương tự: Giống tích vô hướng Euclid $\langle \mathbf{u}, \mathbf{v} \rangle = \sum u_i v_i$ trong $\mathbb{R}^n$, nhưng thay tổng bằng tích phân trên miền modular. Thước đo $y^k \frac{dx\,dy}{y^2}$ là “thước đo tự nhiên” bất biến dưới $\mathrm{SL}_2(\mathbb{R})$ (thước đo Poincaré), nhân thêm $y^k$ để bù cho tính biến đổi trọng số $k$.
- Tại sao cần cusp? Nếu cả $f$ và $g$ đều không phải cusp form (ví dụ chuỗi Eisenstein), tích phân phân kỳ tại cusp --- $|E_k(z)|^2 y^k$ tăng quá nhanh khi $y \to \infty$. Yêu cầu ít nhất một dạng là cusp form (suy giảm mũ tại cusp) đảm bảo hội tụ.
Liên hệ với giả thuyết Birch--Dyer
- Công thức Gross--Zagier: Cho $E/\mathbb{Q}$ hạng giải tích 1 và $K$ trường phức bậc hai ảo thỏa điều kiện Heegner. Công thức Gross--Zagier [gross-zagier1986] phát biểu:
\[ L'(f_E, 1) = \frac{\hat{h}(P_K)}{\langle f_E, f_E \rangle} \cdot (\text{hằng số tường minh}) \]trong đó $\hat{h}(P_K)$ là chiều cao Néron--Tate của điểm Heegner, $\langle f_E, f_E \rangle$ là Petersson norm của newform gắn với $E$. Vậy Petersson norm xuất hiện trực tiếp trong đạo hàm $L'(E,1)$ --- thành phần then chốt của BSD hạng 1.
- Chuẩn hóa: Trong công thức BSD mạnh, việc chọn chuẩn hóa “đúng” cho $f_E$ (Petersson norm vs. hệ số Fourier $a_1 = 1$) ảnh hưởng đến hằng số xuất hiện. Hằng số Manin (sẽ thảo luận ở Mục~(sec:hang-so-manin)) chính xác đo lường sự chênh lệch giữa hai chuẩn hóa.
Định nghĩa
Nếu $f$ là dạng cusp ($f$ triệt tiêu tại mọi cusp), thì $a_0(f) = 0$.
Nếu $f$ là eigenform chuẩn hóa (normalized Hecke eigenform), thì $a_1(f) = 1$ và mỗi $a_n(f)$ là giá trị riêng của toán tử Hecke $T_n$:
Ví dụ
- Chuỗi Eisenstein $E_k$: $a_0(E_k) = 1$ và $a_n(E_k) = \frac{-2k}{B_k} \sigma_{k-1}(n)$ cho $n \geq 1$. Ví dụ với $E_4$:
\[ E_4(z) = 1 + 240 \sum_{n=1}^{\infty} \sigma_3(n) q^n = 1 + 240q + 2160q^2 + 6720q^3 + \cdots \]Hệ số $a_n(E_4) = 240 \sigma_3(n)$: $a_1 = 240$, $a_2 = 2160$, $a_3 = 6720$.
- Hàm Ramanujan $\Delta$: $a_0 = 0$ (cusp form), $a_1 = 1$ (đã chuẩn hóa):
\[ \Delta(z) = q - 24q^2 + 252q^3 - 1472q^4 + 4830q^5 - \cdots \]Hệ số $a_n(\Delta) = \tau(n)$: $a_2 = -24$, $a_3 = 252$, $a_5 = 4830$.
- Newform gắn với $E: y^2 + y = x^3 - x^2$ (conductor $N = 11$): Đây là dạng cusp duy nhất (up to scalar) trong $S_2(\Gamma_0(11))$:
\[ f_{11}(z) = q - 2q^2 - q^3 + 2q^4 + q^5 + 2q^6 - 2q^7 - \cdots \]Hệ số $a_p = p + 1 - \#E(\mathbb{F}_p)$: với $p = 2$, $\#E(\mathbb{F}_2) = 5$ nên $a_2 = 2 + 1 - 5 = -2$ ✓.
Ý nghĩa trực giác
- Hình dung: Mỗi dạng modular được xác định hoàn toàn bởi dãy hệ số Fourier $(a_0, a_1, a_2, \ldots)$ --- giống DNA mã hóa toàn bộ thông tin. Hai dạng modular có cùng hệ số Fourier thì bằng nhau.
- Nhân tính: Nếu $f$ là eigenform, các hệ số có tính nhân tính mạnh mẽ:
- $a_{mn} = a_m a_n$ khi $\gcd(m,n) = 1$ (nhân tính hoàn toàn)
- $a_{p^{r+1}} = a_p a_{p^r} - p^{k-1} a_{p^{r-1}}$ (quan hệ đệ quy tại lũy thừa)
• Tương tự Fourier cổ điển: Trong giải tích Fourier thông thường, $f(x) = \sum a_n e^{inx}$ phân tích tín hiệu thành tần số. Ở đây, $q = e^{2\pi i z}$ đóng vai trò “tần số cơ bản” trên nửa mặt phẳng trên, và $a_n$ đo “biên độ” tại “tần số $n$”.
Liên hệ với giả thuyết Birch--Dyer
- Cầu nối số học $\leftrightarrow$ giải tích: Định lý modularity [wiles1995, breuil-etal2001] cho biết: với mỗi $E/\mathbb{Q}$ conductor $N$, tồn tại duy nhất newform $f_E \in S_2(\Gamma_0(N))$ sao cho:
\[ a_p(f_E) = a_p(E) = p + 1 - \#E(\mathbb{F}_p) \quad \text{với mọi } p \nmid N \]Hệ số Fourier $a_p(f_E)$ đồng nhất với vết Frobenius --- đây là “phép màu” kết nối hai thế giới.
- Hàm $L$ từ Fourier: Hàm $L$ Hasse--Weil được xây dựng trực tiếp từ hệ số Fourier:
\[ L(E, s) = \sum_{n=1}^{\infty} \frac{a_n(f_E)}{n^s} \]BSD yếu phát biểu rằng bậc triệt tiêu $\mathrm{ord}_{s=1} L(E,s)$ bằng hạng đại số $\mathrm{rk}(E(\mathbb{Q}))$. Mọi thông tin “giải tích” của BSD nằm gọn trong dãy $(a_n)$.
- Ý nghĩa thực tiễn: Để kiểm nghiệm BSD bằng máy tính, ta cần tính $a_p(E)$ cho nhiều $p$. Thuật toán Schoof--Elkies--Atkin tính $a_p = p + 1 - \#E(\mathbb{F}_p)$ trong thời gian đa thức theo $\log p$.
Định nghĩa
Đường cong modular (Modular curve) mức $N$ là thương:
Ý nghĩa moduli: Một điểm trên $X_0(N)$ (trừ cusp) tham số hóa cặp $(E, C)$ trong đó $E$ là đường cong elliptic trên $\mathbb{C}$ và $C \subset E$ là nhóm con cyclic bậc $N$ [diamond-shurman2005].
Ví dụ
- Mức $N = 1$: $\Gamma_0(1) = \mathrm{SL}_2(\mathbb{Z})$. Đường cong $X_0(1) = \mathrm{SL}_2(\mathbb{Z}) \backslash \mathcal{H}^*$ có genus $g = 0$ --- đây là mặt cầu Riemann $\mathbb{P}^1$. Hàm $j(z)$ cho song ánh $X_0(1) \xrightarrow{\sim} \mathbb{P}^1(\mathbb{C})$.
- Mức $N = 11$: $X_0(11)$ có genus $g = 1$ --- đây là đường cong elliptic! Thực tế, $X_0(11)$ đẳng cấu với $E: y^2 + y = x^3 - x^2 - 10x - 20$ (nhãn Cremona 11a1).
- Mức $N = 37$: $X_0(37)$ có genus $g = 2$ --- đây là đường cong hyperelliptic, không còn là đường cong elliptic.
- Genus tổng quát: Genus của $X_0(N)$ cho bởi:
\[ g(X_0(N)) = 1 + \frac{\mu}{12} - \frac{\nu_2}{4} - \frac{\nu_3}{3} - \frac{\nu_\infty}{2} \]trong đó $\mu = [\mathrm{SL}_2(\mathbb{Z}) : \Gamma_0(N)] = N \prod_{p | N} (1 + 1/p)$ (chỉ số), $\nu_2, \nu_3$ đếm điểm bất động elliptic, $\nu_\infty$ đếm cusp.
| $N$ | 1 | 2 | 3 | 5 | 7 | 11 | 13 | 14 | 15 | 37 |
|---|---|---|---|---|---|---|---|---|---|---|
| $g(X_0(N))$ | 0 | 0 | 0 | 0 | 0 | 1 | 0 | 1 | 1 | 2 |
Nhận xét: $N = 11$ là mức nhỏ nhất với genus $\geq 1$. Điều này giải thích tại sao đường cong elliptic conductor nhỏ nhất là $N = 11$ --- chỉ khi genus $\geq 1$ mới có dạng cusp $S_2(\Gamma_0(N)) \neq 0$.
Ý nghĩa trực giác
- Hình dung: $X_0(N)$ giống “danh mục” (catalog) --- mỗi “trang” trong danh mục mô tả một đường cong elliptic $E$ cùng với một nhóm con cyclic $C$ bậc $N$ trong $E$. Danh mục này có hình dạng (topology) phụ thuộc vào $N$ --- mức $N$ càng lớn, genus càng cao, “hình dạng” càng phức tạp.
- Tại sao $\mathcal{H}$? Mỗi $\tau \in \mathcal{H}$ xác định lưới $\Lambda_\tau = \mathbb{Z} + \mathbb{Z}\tau$, cho torus $\mathbb{C}/\Lambda_\tau$, tức một đường cong elliptic. Hai điểm $\tau, \tau'$ cho cùng đường cong khi và chỉ khi $\tau' = \gamma \cdot \tau$ với $\gamma \in \mathrm{SL}_2(\mathbb{Z})$. Thay $\mathrm{SL}_2(\mathbb{Z})$ bởi $\Gamma_0(N)$ thì “nhớ thêm” nhóm con cyclic bậc $N$.
- Cusp = giới hạn suy biến: Các cusp (điểm bổ sung $\mathbb{Q} \cup \{i\infty\}$) tương ứng đường cong elliptic “suy biến” --- khi $\tau \to i\infty$, torus $\mathbb{C}/(\mathbb{Z} + \mathbb{Z}\tau)$ “bẹp” thành $\mathbb{C}^*/q^\mathbb{Z}$ (đường cong Tate). Thêm cusp giúp compact hóa $X_0(N)$.
Liên hệ với giả thuyết Birch--Dyer
- Sân khấu của modularity: Định lý modularity [wiles1995, breuil-etal2001] phát biểu: mỗi $E/\mathbb{Q}$ conductor $N$ là thương (quotient) của Jacobian $J_0(N)$ của $X_0(N)$. Nói cách khác, $E$ “sống” trên $X_0(N)$ --- mọi đường cong elliptic hữu tỉ đều “nằm trong” hệ thống đường cong modular.
- Điểm Heegner: Các điểm CM trên $X_0(N)$ (ứng với $\tau$ thỏa $a\tau^2 + b\tau + c = 0$ với biệt thức $< 0$) tạo nên điểm Heegner. Ánh xạ $X_0(N) \to E$ chuyển điểm Heegner thành điểm hữu tỉ trên $E$ --- đây là nguyên liệu chính của Gross--Zagier và Kolyvagin [gross-zagier1986, kolyvagin1990].
- Genus $= \dim S_2$: $g(X_0(N)) = \dim S_2(\Gamma_0(N))$. Genus cao hơn $\Rightarrow$ nhiều newform hơn $\Rightarrow$ nhiều đường cong elliptic conductor $N$ hơn. Đường cong modular “chứa” tất cả thông tin về EC ở mức $N$.
Định nghĩa
Ánh xạ $\phi_E$ được xây dựng tường minh qua tích phân:
Phép tham số hóa gọi là tối ưu (optimal) nếu $\phi_E$ không phân tích qua đường cong elliptic trung gian nào, tức $\ker(\phi_E)$ là đa tạp con Abel liên thông của $J_0(N)$ [cremona1997].
Ví dụ
Vì $X_0(11)$ có genus 1, nó cũng là đường cong elliptic. Phép tham số hóa $\phi: X_0(11) \to E$ trong trường hợp này là một isogeny giữa hai đường cong elliptic. Thực tế:
- $X_0(11)$ đẳng cấu với $E': y^2 + y = x^3 - x^2$ (nhãn 11a3)
- $\phi: E' \to E$ là isogeny bậc 5
- Tham số hóa tối ưu: $X_0(11) \to E'$ (bậc 1), trong đó $E' = 11a3$ là đường cong tối ưu (optimal curve) tại mức 11
Newform tương ứng: $f_{11}(z) = q - 2q^2 - q^3 + 2q^4 + q^5 + \cdots \in S_2(\Gamma_0(11))$.
- $37a1: y^2 + y = x^3 - x$ (hạng 1, điểm $P = (0,0)$ sinh $E(\mathbb{Q}) \cong \mathbb{Z}$)
- $37b1: y^2 + y = x^3 + x^2 - 23x - 50$ (hạng 0)
Genus $g(X_0(37)) = 2$, nên $\dim S_2(\Gamma_0(37)) = 2$ --- đúng 2 newform, ứng với 2 lớp đẳng cấu.
Ý nghĩa trực giác
- Hình dung: Phép tham số hóa $\phi: X_0(N) \to E$ giống việc “vẽ” đường cong elliptic $E$ lên “tấm bản đồ” $X_0(N)$. Mỗi điểm trên $E$ là “hình chiếu” của (có thể nhiều) điểm trên $X_0(N)$. Số lần “phủ” trung bình chính là bậc modular $\deg(\phi)$.
- Tích phân = đường đi: Công thức $\phi_E(z) = \int_{i\infty}^z f_E(w)\,dw$ cho thấy: để tìm ảnh của $z$, ta “đi” từ cusp $i\infty$ đến $z$ trên $\mathcal{H}$, “tích lũy” giá trị $f_E$ dọc đường, rồi chiếu kết quả xuống $E \cong \mathbb{C}/\Lambda_E$.
- Tồn tại = modularity: Sự tồn tại của $\phi$ là cách phát biểu hình học của Định lý modularity. Trước Wiles, câu hỏi “có $\phi$ hay không?” là bài toán mở cho mọi $E/\mathbb{Q}$. Bây giờ ta biết $\phi$ luôn tồn tại --- nhưng tính chất cụ thể (bậc, hằng số Manin) vẫn là đối tượng nghiên cứu.
Liên hệ với giả thuyết Birch--Dyer
- Điểm Heegner qua $\phi$: Cho $K = \mathbb{Q}(\sqrt{-D})$ trường phức bậc hai ảo, $\tau_K \in \mathcal{H}$ điểm CM. Điểm Heegner trên $E$ là:
\[ P_K = \phi_E(\tau_K) \in E(\bar{\mathbb{Q}}) \]Trace xuống $K$: $y_K = \sum_{\sigma \in \mathrm{Gal}(H/K)} P_K^\sigma \in E(K)$. Gross--Zagier chứng minh: $L'(E/K, 1) \neq 0 \Leftrightarrow \hat{h}(y_K) \neq 0$ [gross-zagier1986]. Phép tham số hóa $\phi$ chính là “máy sản xuất điểm hữu tỉ” --- nguyên liệu chính để chứng minh BSD hạng 1.
- Pull-back vi phân: $\phi^*(\omega_E) = c_E \cdot 2\pi i f_E(z)\, dz$, trong đó $c_E$ là hằng số Manin. Quan hệ này kết nối vi phân Néron $\omega_E$ (đại số) với newform $f_E$ (giải tích) --- chính xác là cầu nối BSD cần.
Định nghĩa
Tương đương, nếu $\pi_E: J_0(N) \to E$ là ánh xạ surjective (qua Abel--Jacobi $X_0(N) \hookrightarrow J_0(N)$ rồi chiếu) và $\hat{\pi}_E: E \hookrightarrow J_0(N)$ là ánh xạ đối ngẫu, thì:
Ví dụ
Nhận xét:
- $m_E = 1$ rất hiếm --- chỉ xảy ra khi $X_0(N)$ có genus 1 và $\phi$ là đẳng cấu. Ví dụ: $N = 11$ (tối ưu), $N = 17, 19$.
- $m_E$ tăng nhanh theo conductor $N$: asymptotic $m_E \sim c \cdot N$ (với hằng số phụ thuộc eigenform).
- Hạng cao $\Rightarrow$ bậc modular lớn (xu hướng, không phải quy luật tuyệt đối).
Ý nghĩa trực giác
- Hình dung: Nếu ta “gấp” $X_0(N)$ thành $E$ qua $\phi$, bậc modular $m_E$ đếm trung bình bao nhiêu “lớp” phủ lên nhau. $m_E = 1$ nghĩa là gấp hoàn hảo (1-1), $m_E = 40$ nghĩa là mặt modular phủ lên $E$ trung bình 40 lần.
- Tính đồng dư: $m_E$ cũng đo “sự đồng dư” giữa $f_E$ và các dạng modular khác. Cụ thể, $m_E = \frac{\langle f_E, f_E \rangle}{\langle f_E, f_E \rangle_{\mathrm{int}}}$ (tỷ lệ Petersson norm trên phần “nguyên”). Các số nguyên tố $p | m_E$ là đồng dư số nguyên tố (congruence primes): tồn tại newform $g \neq f_E$ sao cho $a_n(f_E) \equiv a_n(g) \pmod{p}$ với mọi $n$.
- Bậc modular lớn: Conductor $N$ lớn $\Rightarrow$ genus $g(X_0(N))$ lớn $\Rightarrow$ Jacobian $J_0(N)$ phức tạp $\Rightarrow$ cần “gấp nhiều hơn” để chiếu xuống $E$ (1 chiều). Bậc modular đo “mất mát thông tin” khi chiếu.
Liên hệ với giả thuyết Birch--Dyer
- Công thức Petersson--Zagier: Bậc modular liên hệ với Petersson norm:
\[ m_E = \frac{(4\pi)^2 \langle f_E, f_E \rangle}{8\pi^2 \Omega_E^+ \Omega_E^-} \](với chuẩn hóa phù hợp, giả sử hằng số Manin $c_E = 1$). Ở đây $\Omega_E^\pm$ là chu kỳ thực/ảo --- thành phần trong BSD mạnh [zagier1985].
- Đồng dư $\Rightarrow$ BSD khó: Nếu $p | m_E$ (đồng dư số nguyên tố), chứng minh BSD tại $p$ đặc biệt khó --- vì $f_E$ và form khác “lẫn vào nhau” modulo $p$. Nhiều kỹ thuật (Skinner--Urban, Kato) phải loại trừ các $p | m_E$.
- Watkins conjecture: Watkins (2002) phỏng đoán: $2^{\mathrm{rk}(E(\mathbb{Q}))} \mid m_E$ --- bậc modular chia hết cho $2^r$ với $r$ là hạng. Điều này đã được kiểm nghiệm rộng rãi nhưng chưa chứng minh. Nếu đúng, nó cho cận dưới cho $m_E$ theo hạng.
Định nghĩa
Nói cách khác, $c_E$ đo tỷ lệ giữa:
- Phía đại số: vi phân Néron $\omega_E$ (đến từ phương trình Weierstrass tối thiểu)
- Phía giải tích: $2\pi i f_E(z)\, dz$ (đến từ newform modular)
Ví dụ
- Trường hợp bán ổn định (semistable: chỉ có rút gọn tốt hoặc nhân): Phỏng đoán Manin đúng. Chứng minh bởi Mazur (1978): nếu $E$ bán ổn định, $c_E \in \mathbb{Z}$ và $c_E | \gcd(m_E, N)$. Kết hợp kỹ thuật khác $\Rightarrow$ $c_E = 1$.
- Trường hợp tổng quát: $c_E \in \mathbb{Q}$ luôn là số nguyên, và $c_E \in \{1, 2, 3, 4, 5, \ldots\}$ (Edixhoven 1991: $c_E \in \mathbb{Z}$). Phỏng đoán rằng $c_E = 1$.
- Kiểm nghiệm: Cremona đã xác nhận $c_E = 1$ cho tất cả đường cong tối ưu trong cơ sở dữ liệu (conductor $\leq 500{,}000$) --- hàng triệu trường hợp, không ngoại lệ.
- Hệ quả nếu sai: Nếu $c_E \neq 1$, công thức BSD mạnh cần nhân thêm $c_E^2$:
\[ \frac{L^{(r)}(E,1)}{r!} = \frac{|\mathrm{Sha}| \cdot \mathrm{Reg}_E \cdot \Omega_E \cdot \prod c_p}{|E(\mathbb{Q})_{\mathrm{tors}}|^2} \cdot c_E^{-2} \]Vậy $c_E = 1$ “đơn giản hóa” BSD.
Ý nghĩa trực giác
- Hình dung: Hãy nghĩ $E$ có hai “thước đo” tự nhiên:
- Thước đại số: vi phân Néron $\omega_E$, đến từ phương trình Weierstrass tối thiểu --- “nội tại” cho $E$.
- Thước modular: $2\pi i f_E(z)\, dz$, đến từ newform --- đến từ “thế giới modular”.
- Tương tự đời thường: Giống việc đo chiều dài bằng mét (hệ SI) và bằng foot (hệ Anh). Hai hệ đo “tự nhiên” trong ngữ cảnh riêng, nhưng hệ số quy đổi ($1 \text{ ft} = 0.3048 \text{ m}$) không bằng 1. Phỏng đoán Manin nói: cho EC, hai hệ đo tự nhiên trùng khớp ($c_E = 1$) --- một sự hài hòa đáng ngạc nhiên.
- Tại sao tin? Hàng triệu ví dụ xác nhận $c_E = 1$. Lý do sâu xa: cả $\omega_E$ lẫn $f_E dz$ đều là “canonical” trong nghĩa tương ứng --- Néron model cho vi phân đẹp nhất về đại số, modularity cho form đẹp nhất về giải tích. Hai “đẹp nhất” nên trùng nhau.
Liên hệ với giả thuyết Birch--Dyer
- Trong BSD mạnh: Công thức BSD mạnh viết gọn (khi $r = \mathrm{ord}_{s=1} L(E,s)$):
\[ \frac{L^{(r)}(E,1)}{r!} = \frac{|\mathrm{Sha}(E/\mathbb{Q})| \cdot \mathrm{Reg}_E \cdot \Omega_E \cdot \prod_p c_p}{|E(\mathbb{Q})_{\mathrm{tors}}|^2} \]Ở đây $\Omega_E = \int_{E(\mathbb{R})} |\omega_E|$ dùng vi phân Néron. Nếu $c_E \neq 1$, ta phải thay $\Omega_E$ bằng $c_E^{-1} \Omega_E$ (hoặc nhân thêm $c_E^{-2}$) --- công thức phức tạp hơn. Phỏng đoán Manin giữ BSD “sạch”.
- Kiểm nghiệm BSD cần Manin: Khi kiểm nghiệm BSD mạnh bằng máy tính (Cremona, LMFDB), luôn giả định $c_E = 1$. Nếu kết quả khớp $\Rightarrow$ bằng chứng gián tiếp cho cả BSD và Manin. Mọi kiểm nghiệm đến nay đều khớp.
- Skinner--Urban cần Manin: Nhiều kết quả “BSD mạnh cho $p$-part” (Skinner--Urban, Kato) giả định $c_E = 1$ hoặc $p \nmid c_E$. Chứng minh Manin sẽ mở rộng phạm vi áp dụng của các định lý này.
Định nghĩa
Tương đương, đa thức đặc trưng của Frobenius tại $p$ trên module Tate $T_\ell(E)$ ($\ell \neq p$) là $X^2 - a_p(f_E) X + p$ [eichler1954, shimura1971].
Ví dụ
Tại $p = 5$: $a_5(f_{11}) = 1$. Đếm điểm: $\#E(\mathbb{F}_5) = 5$, nên $a_5(E) = 5 + 1 - 5 = 1$ ✓.
Quan hệ Eichler--Shimura: $\mathrm{Frob}_5^2 - \mathrm{Frob}_5 + 5 = 0$. Nghiệm $X^2 - X + 5 = 0$: $\alpha, \beta = \frac{1 \pm \sqrt{-19}}{2}$, $|\alpha| = |\beta| = \sqrt{5}$ (xác nhận cận Hasse).
Ý nghĩa trực giác
- Hình dung: Hai “ngôn ngữ” mô tả cùng đối tượng: (1) hệ số Fourier $a_p(f_E)$ (phía modular), (2) vết Frobenius $a_p(E) = p+1-\#E(\mathbb{F}_p)$ (phía số học). Eichler--Shimura nói: $a_p(f_E) = a_p(E)$ --- hai ngôn ngữ đồng nghĩa.
- Lịch sử: Eichler (1954) chứng minh cho $X_0(N)$, Shimura (1958) tổng quát. Đây là tiền thân của modularity --- nói “nếu $E$ đến từ dạng modular, thì $a_p$ khớp”; Wiles chứng minh “mọi $E/\mathbb{Q}$ đều đến từ dạng modular”.
Liên hệ với giả thuyết Birch--Dyer
- Nền tảng: Eichler--Shimura đảm bảo hàm $L$ từ Fourier ($\sum a_n(f_E) n^{-s}$) và hàm $L$ từ đếm điểm ($\prod_p L_p(E, p^{-s})^{-1}$) là cùng hàm. Không có nó, BSD không phát biểu được.
- Thác triển: Vì $a_p(f_E) = a_p(E)$, hàm $L(E,s)$ thừa hưởng thác triển giải tích từ $L(f_E,s)$. Giá trị $L(E,1)$ chỉ có nghĩa nhờ thác triển này.
Định nghĩa
Tương đương, tồn tại ánh xạ surjective không hằng $\phi: X_0(N) \to E$ định nghĩa trên $\mathbb{Q}$ [weil1967].
Ví dụ
- 1955: Taniyama đặt câu hỏi tại hội nghị Tokyo--Nikko.
- 1967: Shimura phát triển khuôn khổ chính xác. Weil chứng minh “định lý ngược” hỗ trợ phỏng đoán.
- 1995: Wiles chứng minh cho EC bán ổn định [wiles1995] --- đủ cho Định lý Fermat.
- 2001: Breuil--Conrad--Diamond--Taylor chứng minh đầy đủ [breuil-etal2001].
Ý nghĩa trực giác
- Hình dung: Mỗi EC/$\mathbb{Q}$ có “hộ chiếu modular” --- chứng minh nó đến từ thế giới dạng modular. Khi có hộ chiếu, ta được “miễn phí”: thác triển giải tích, phương trình hàm, kỹ thuật Heegner, Kolyvagin, Iwasawa\ldots
- Langlands: TSW là trường hợp $\mathrm{GL}_2/\mathbb{Q}$ của chương trình Langlands --- viễn cảnh vĩ đại kết nối biểu diễn tự đồng cấu và biểu diễn Galois.
Liên hệ với giả thuyết Birch--Dyer
- Tiên quyết: Không có modularity, $L(E,s)$ chỉ định nghĩa cho $\mathrm{Re}(s) > 3/2$. Giá trị $L(E,1)$ nằm ngoài vùng hội tụ. Modularity cho thác triển $\Rightarrow$ $L(E,1)$ có nghĩa $\Rightarrow$ BSD phát biểu được.
- Mở cửa cho Kolyvagin: Sau Wiles (1995) + BCDT (2001), mọi EC/$\mathbb{Q}$ modular $\Rightarrow$ kỹ thuật Kolyvagin áp dụng $\Rightarrow$ BSD đúng cho hạng 0 và 1.
Định nghĩa
- Tồn tại duy nhất newform $f_E \in S_2(\Gamma_0(N))$ sao cho $a_p(f_E) = a_p(E)$ với mọi $p \nmid N$.
- Tồn tại ánh xạ surjective $\phi: X_0(N) \to E$ định nghĩa trên $\mathbb{Q}$.
- Biểu diễn Galois $\rho_{E,p}: G_\mathbb{Q} \to \mathrm{GL}_2(\mathbb{Z}_p)$ là modular với mọi $p$.
Ví dụ
- Xét biểu diễn thặng dư $\bar{\rho}_{E,3}: G_\mathbb{Q} \to \mathrm{GL}_2(\mathbb{F}_3)$.
- Dùng Langlands--Tunnell: $\bar{\rho}_{E,3}$ modular (vì $\mathrm{GL}_2(\mathbb{F}_3)$ khả giải).
- “Nâng” (lift): chứng minh $\rho_{E,3}$ modular bằng kỹ thuật $R = T$.
- Taylor--Wiles patching: vượt qua trở ngại kỹ thuật.
Timeline:
| Năm | Tác giả | Kết quả |
|---|---|---|
| 1995 | Wiles; Taylor--Wiles | EC bán ổn định |
| 1999 | Diamond; Conrad--Diamond--Taylor | Mở rộng |
| 2001 | Breuil--Conrad--Diamond--Taylor | Mọi EC/$\mathbb{Q}$ |
Ý nghĩa trực giác
- Hình dung: Hai “châu lục” --- EC (hình học đại số) và dạng modular (giải tích phức) --- nối bằng “cầu” modularity. Trước Wiles, cầu chỉ biết cho EC có CM. Wiles chứng minh cầu luôn tồn tại.
- Hệ quả: (a) Định lý Fermat. (b) Mọi $L(E,s)$ có thác triển. (c) BSD phát biểu được cho mọi EC/$\mathbb{Q}$.
Liên hệ với giả thuyết Birch--Dyer
- Không modularity, không BSD: Mọi kết quả BSD (Coates--Wiles, Gross--Zagier, Kolyvagin, Kato, Skinner--Urban) đều sử dụng modularity.
- Rào cản cho trường số: Cho $E$ trên trường số $K \neq \mathbb{Q}$, modularity chưa biết nói chung. Tiến bộ: Freitas--Le Hung--Siksek (2015) chứng minh cho EC trên trường toàn phần thực.
Định nghĩa
Tính chất chính: $\rho_{E,p}$ không phân nhánh tại $\ell \nmid Np$, và tại đó $\mathrm{tr}(\rho_{E,p}(\mathrm{Frob}_\ell)) = a_\ell$, $\det(\rho_{E,p}(\mathrm{Frob}_\ell)) = \ell$ [serre1968, silverman2009].
Ví dụ
- Định thức: $\det(\rho_{E,p}) = \chi_p$ (ký tự cyclotomic $p$-adic).
- Ví dụ CM: $E: y^2 = x^3 - x$ (CM bởi $\mathbb{Z}[i]$), $p = 5$. Tại $\ell = 3$: $a_3 = 0$ (vì $\#E(\mathbb{F}_3) = 4$). Đa thức Frobenius: $X^2 + 3 = 0$, nghiệm $\pm\sqrt{-3}$ --- “xoay $90°$” đặc trưng CM.
- Toàn bộ $a_\ell$ gói gọn: Biết $\rho_{E,p}$ $\Leftrightarrow$ biết tất cả $a_\ell$ $\Leftrightarrow$ biết $L(E,s)$.
Ý nghĩa trực giác
- Hình dung: $G_\mathbb{Q}$ là “nhóm đối xứng” khổng lồ của số học. Biểu diễn $\rho_{E,p}$ “trích xuất” phần liên quan $E$, gói vào ma trận $2 \times 2$ trên $\mathbb{Z}_p$.
- Tại sao $2 \times 2$? Vì $E[p^n] \cong (\mathbb{Z}/p^n\mathbb{Z})^2$ --- điểm xoắn tạo không gian 2 chiều. Đa tạp Abel $g$ chiều cho ma trận $2g \times 2g$.
Liên hệ với giả thuyết Birch--Dyer
- Ngôn ngữ Wiles: Wiles chứng minh modularity bằng cách so sánh biểu diễn Galois, không so sánh $a_p$ trực tiếp.
- Selmer qua Galois: Nhóm Selmer $\mathrm{Sel}_p(E/\mathbb{Q}) \subset H^1(G_\mathbb{Q}, E[p])$ --- mọi đối tượng BSD sống trong thế giới biểu diễn Galois.
- Bloch--Kato: Tổng quát BSD cho mọi “motif” (biểu diễn Galois tổng quát).
Định nghĩa
Không gian hữu tỉ: $V_p(E) = T_p(E) \otimes_{\mathbb{Z}_p} \mathbb{Q}_p \cong \mathbb{Q}_p^2$ [silverman2009, tate1975].
Ví dụ
- $E[2] = \{(0,0), (1,0), (-1,0), \mathcal{O}\} \cong (\mathbb{Z}/2\mathbb{Z})^2$.
- $E[4]$: 16 điểm, $E[8]$: 64 điểm, $E[2^n]$: $4^n$ điểm.
- $T_2(E) = \varprojlim E[2^n] \cong \mathbb{Z}_2^2$: phần tử là dãy $(P_1, P_2, \ldots)$ với $P_n \in E[2^n]$, $[2]P_{n+1} = P_n$.
Ý nghĩa trực giác
- Hình dung: $E[p]$ là “lưới thô” ($p^2$ điểm), $E[p^2]$ mịn hơn ($p^4$ điểm)\ldots{} $T_p(E)$ là giới hạn khi lưới vô cùng mịn.
- Tương tự: Giống $\mathbb{Z}_p = \varprojlim \mathbb{Z}/p^n\mathbb{Z}$, ở đây “xếp chồng” $E[p^n] \cong (\mathbb{Z}/p^n\mathbb{Z})^2$.
Liên hệ với giả thuyết Birch--Dyer
- Nguồn gốc $\rho_{E,p}$: Tác động $G_\mathbb{Q}$ trên $T_p(E)$ cho biểu diễn $\rho_{E,p}: G_\mathbb{Q} \to \mathrm{GL}_2(\mathbb{Z}_p)$ --- nguyên liệu cốt lõi cho modularity và BSD.
- Selmer: Nhóm Selmer $p^\infty$ dùng $E[p^\infty] = T_p(E) \otimes \mathbb{Q}_p/\mathbb{Z}_p$. Module Tate là “xương sống” của Selmer.
- Iwasawa: Module Iwasawa cho BSD $p$-adic xây trên $T_p(E)$ mở rộng lên tháp cyclotomic.
Định nghĩa
$\bar{\rho}_{E,p}$ gọi là bất khả quy nếu không tồn tại đường thẳng $L \subset E[p]$ bất biến dưới $G_\mathbb{Q}$ [serre1968].
Ví dụ
- Wiles chọn $p = 3$: Vì $\mathrm{GL}_2(\mathbb{F}_3)$ khả giải, Langlands--Tunnell chứng minh $\bar{\rho}_{E,3}$ modular. Đây là “bước đầu tiên”.
- “3-5 switch”: Nếu $\bar{\rho}_{E,3}$ khả quy (có nhóm con bậc 3 bất biến), Wiles chuyển sang $p = 5$: tìm EC phụ $E'$ với $\bar{\rho}_{E',5} \cong \bar{\rho}_{E,5}$ và $\bar{\rho}_{E',3}$ bất khả quy, chứng minh $E'$ modular, suy ra $E$ modular.
- Mazur: Với $p > 163$, $\bar{\rho}_{E,p}$ tự động bất khả quy cho mọi EC/$\mathbb{Q}$ (không có $p$-isogeny hữu tỉ).
Ý nghĩa trực giác
- Hình dung: $\rho_{E,p}$ là “bức tranh chi tiết” (trên $\mathbb{Z}_p$), $\bar{\rho}_{E,p}$ là “phác thảo” (trên $\mathbb{F}_p$). Phác thảo mất chi tiết nhưng giữ hình dạng tổng thể.
- Chiến lược Wiles: (1) chứng minh phác thảo $\bar{\rho}$ modular (dễ --- nhóm hữu hạn); (2) “nâng” thành $\rho$ modular (khó --- dùng $R = T$).
Liên hệ với giả thuyết Birch--Dyer
- Bất khả quy giúp BSD: Kato, Skinner--Urban yêu cầu $\bar{\rho}_{E,p}$ bất khả quy. Khi khả quy, kỹ thuật phức tạp hơn nhiều.
- Selmer mod $p$: $\mathrm{Sel}_p(E/\mathbb{Q}) \subset H^1(G_\mathbb{Q}, E[p])$, trong đó $E[p]$ là không gian của $\bar{\rho}_{E,p}$. Hiểu $\bar{\rho}$ giúp hiểu Selmer.
Định nghĩa
Nếu $\bar{\rho}$ bất khả quy, lý thuyết Mazur (1989) chứng minh tồn tại vành biến dạng phổ dụng (universal deformation ring) $R$ và biến dạng phổ dụng $\rho^{\mathrm{univ}}: G_\mathbb{Q} \to \mathrm{GL}_2(R)$: mọi biến dạng đều phân tích qua $R$ [mazur1989].
Ví dụ
- $R$: vành biến dạng phổ dụng --- tham số hóa mọi cách “nâng” $\bar{\rho}$ lên $\mathbb{Z}_3$.
- $T = \mathbb{T}$: vành Hecke --- tham số hóa các “nâng modular” (đến từ dạng modular).
- Ánh xạ tự nhiên $\pi: R \twoheadrightarrow T$ (mọi nâng modular là biến dạng).
- Mục tiêu: $R = T$ ($\pi$ là đẳng cấu), tức mọi biến dạng đều modular.
Ý nghĩa trực giác
- Hình dung: $\bar{\rho}$ là “điểm” (biểu diễn mod $p$). Các biến dạng là “lân cận” của điểm đó --- biểu diễn “gần” $\bar{\rho}$ nhưng chính xác hơn ($p$-adic thay vì mod $p$). Vành $R$ là “không gian tham số” của lân cận này.
- Tương tự: Giống “không gian tiếp tuyến”. Điểm $\bar{\rho}$ nằm trên “đa tạp biểu diễn”; $R$ mô tả “hình dạng cục bộ” quanh $\bar{\rho}$.
Liên hệ với giả thuyết Birch--Dyer
- $R = T$ $\Rightarrow$ modularity $\Rightarrow$ BSD khả thi: Chuỗi logic then chốt. Không có $R = T$, không chứng minh được modularity cho EC tổng quát, không có thác triển $L(E,s)$, không phát biểu được BSD.
- Skinner--Urban: Sử dụng biến thể $R = T$ cho $\mathrm{GL}_2 \times \mathrm{GL}_1$ trong chứng minh phỏng đoán chính Iwasawa, từ đó BSD $p$-part cho hạng 0 và 1.
Định nghĩa
$\mathbb{T}$ là $\mathbb{Z}$-đại số giao hoán, hữu hạn sinh, tự do hạng bằng $\dim S_k(\Gamma_0(N))$.
Trong ngữ cảnh modularity ($k = 2$): cho $\bar{\rho}$ biểu diễn thặng dư, $\mathbb{T}$ là thương “modular” tham số hóa các biến dạng modular --- tức các biểu diễn Galois đến từ eigenform [diamond-shurman2005].
Ví dụ
- Mức $N = 11$: $\dim S_2(\Gamma_0(11)) = 1$. Duy nhất newform $f_{11}$. Vành Hecke $\mathbb{T} \cong \mathbb{Z}$, với $T_p \mapsto a_p(f_{11})$: $T_2 \mapsto -2$, $T_3 \mapsto -1$, $T_5 \mapsto 1$.
- Mức $N = 37$: $\dim S_2(\Gamma_0(37)) = 2$, hai newform $f_{37a}, f_{37b}$. Vành Hecke $\mathbb{T} \cong \mathbb{Z} \times \mathbb{Z}$, mỗi thành phần ứng eigenform.
- Mức $N = 23$: $\dim S_2(\Gamma_0(23)) = 2$, nhưng chỉ có 1 newform với hệ số trong $\mathbb{Z}[\alpha]$, $\alpha^2 - \alpha - 1 = 0$ (số Fibonacci vàng!). Vành Hecke $\mathbb{T} \cong \mathbb{Z}[\alpha]$ --- không phải tích $\mathbb{Z} \times \mathbb{Z}$.
Ý nghĩa trực giác
- Hình dung: $\mathbb{T}$ giống “vành tọa độ” trên “không gian” các eigenform. Mỗi eigenform là “điểm”; hệ số $a_n$ là “tọa độ”. Đồng cấu $\mathbb{T} \to \mathbb{Z}$ (hoặc $\to \bar{\mathbb{Z}}$) tương ứng 1-1 với eigenform.
- $R = T$ dịch ra: “Không gian tham số biểu diễn Galois (gần $\bar{\rho}$)” $=$ “không gian tham số dạng modular (gần $f_E$)”. Hai thế giới “cùng hình dạng”.
Liên hệ với giả thuyết Birch--Dyer
- $R = T$: Đẳng cấu $R \cong \mathbb{T}$ là trái tim chứng minh Wiles. Phía $R$ mã hóa thông tin Galois (số học); phía $\mathbb{T}$ mã hóa thông tin modular (giải tích). Bằng nhau $\Leftrightarrow$ modularity.
- Đồng dư modular: Cấu trúc $\mathbb{T}$ phản ánh đồng dư giữa eigenform. Đồng dư $f_E \equiv g \pmod{p}$ gây khó khăn cho BSD tại $p$.
Định nghĩa
- Chọn dãy tập “Taylor--Wiles primes” $Q_n = \{q_1^{(n)}, \ldots, q_r^{(n)}\}$, mỗi $q_i^{(n)} \equiv 1 \pmod{p^n}$.
- Xét “vành phụ trợ” $R_{Q_n}$ và $T_{Q_n}$ (cho phép phân nhánh thêm tại $Q_n$).
- Chứng minh $R_{Q_n} = T_{Q_n}$ cho mỗi $n$ (dễ hơn vì thêm biến).
- “Vá” (patch) các đẳng cấu $R_{Q_n} = T_{Q_n}$ khi $n \to \infty$ để được $R = T$.
Ví dụ
- Thêm “biến phụ” (primes in $Q_n$) biến $R, T$ thành $R_{Q_n}, T_{Q_n}$ “lớn hơn” nhưng “đều đặn hơn” (polynomial ring).
- Ở mức $Q_n$: đẳng cấu dễ chứng minh (vì thêm biến “đơn giản hóa” cấu trúc).
- Kỹ thuật “giới hạn ngược” (patching): lấy giới hạn khi $n \to \infty$ để loại biến phụ, thu được $R = T$ ban đầu.
Wiles mô tả: “Đó là ý tưởng đẹp nhất mà tôi từng thấy trong toán học.”
Ý nghĩa trực giác
- Hình dung: Cần chứng minh hai mảnh ghép (puzzle) $R$ và $T$ khớp nhau. Trực tiếp: khó. Thay vào đó: thêm “mảnh phụ” vào cả hai bên, tạo puzzle lớn hơn nhưng dễ khớp hơn. Sau khi khớp puzzle lớn, “gỡ bỏ” mảnh phụ --- kết quả: $R = T$.
- Cách mạng: Patching trở thành công cụ chuẩn --- dùng trong BCDT (2001), Khare--Wintenberger (phỏng đoán Serre), Calegari--Geraghty (modularity bậc cao), Scholze\ldots
Liên hệ với giả thuyết Birch--Dyer
- Nền tảng modularity: Patching $\Rightarrow$ $R = T$ $\Rightarrow$ modularity $\Rightarrow$ thác triển $L(E,s)$ $\Rightarrow$ BSD phát biểu được. Chuỗi logic không thể thiếu.
- Ứng dụng trực tiếp: Biến thể patching xuất hiện trong Skinner--Urban (Iwasawa main conjecture) và các chứng minh BSD $p$-part.
Định nghĩa
\fbox{Giả sử $a^p + b^p = c^p$} $\xrightarrow{\text{Frey}}$ \fbox{Đường cong Frey $E_{a,b,c}$} $\xrightarrow{\text{Wiles}}$ \fbox{$E$ modular} $\xrightarrow{\text{Ribet}}$ \fbox{$f \in S_2(\Gamma_0(2))$} $\xrightarrow{\dim = 0}$ \fbox{Mâu thuẫn!}
Chi tiết:
- Frey (1985): Nếu $a^p + b^p = c^p$ nghiệm nontrivial, xây dựng $E: y^2 = x(x-a^p)(x+b^p)$ (đường cong Frey) --- EC bán ổn định, conductor lạ.
- Ribet (1990): Nếu $E$ modular, “hạ mức” (level lowering): $\bar{\rho}_{E,p}$ đến từ dạng modular mức $N = 2$ [ribet1990].
- Mâu thuẫn: $S_2(\Gamma_0(2)) = 0$ (genus $X_0(2) = 0$, không có cusp form). Không tồn tại dạng modular mức 2 $\Rightarrow$ $\bar{\rho}_{E,p}$ không tồn tại $\Rightarrow$ đường cong Frey không tồn tại $\Rightarrow$ nghiệm $a^p + b^p = c^p$ không tồn tại.
Ví dụ
Ribet kể: “Khi chứng minh level lowering xong, tôi biết Định lý Fermat đúng --- chỉ cần ai đó chứng minh modularity.”
Ý nghĩa trực giác
- Hình dung: Giả sử có “tội phạm” (nghiệm Fermat). Frey tạo “dấu vân tay” (đường cong Frey). Wiles chứng minh vân tay phải nằm trong “cơ sở dữ liệu” (modular). Ribet chứng minh vân tay phải ở “ngăn trống” (mức 2) --- mâu thuẫn!
- Bất ngờ: FLT (bài toán số học sơ cấp, 350 năm) được giải bằng lý thuyết dạng modular và biểu diễn Galois --- hai lĩnh vực có vẻ hoàn toàn không liên quan.
Liên hệ với giả thuyết Birch--Dyer
- Động lực cho modularity: Sơ đồ FRW là động lực chính thúc đẩy Wiles chứng minh modularity. Và modularity là tiên quyết cho BSD. Vậy gián tiếp: FLT là chất xúc tác cho tiến bộ BSD.
- Kỹ thuật dùng lại: Level lowering (Ribet) và $R = T$ (Wiles) đều được sử dụng lại trong các chứng minh BSD --- ví dụ Skinner--Urban dùng level lowering cho Iwasawa main conjecture.
Định nghĩa
Tính chất đặc biệt:
- Biệt thức: $\Delta = 2^{-8} (abc)^{2p}$ --- lũy thừa $p$ rất cao.
- Conductor: $N = \mathrm{rad}(abc) = \prod_{\ell | abc} \ell$ (tích các nguyên tố chia $abc$, mỗi thừa số chỉ xuất hiện 1 lần --- conductor “nhỏ bất thường” so với biệt thức).
- $E$ bán ổn định (semistable): chỉ có rút gọn nhân tại $\ell | abc$.
Ví dụ
Biểu diễn $\bar{\rho}_{E,5}$: Ribet chứng minh rằng “hạ mức” đến $\Gamma_0(2)$. Nhưng $S_2(\Gamma_0(2)) = 0$ $\Rightarrow$ mâu thuẫn.
Ý nghĩa trực giác
- Hình dung: Nghiệm Fermat $a^p + b^p = c^p$ (nếu tồn tại) để lại “vân tay” dưới dạng EC với tính chất “không thể có”. Đường cong Frey mã hóa thông tin nghiệm vào ngôn ngữ EC --- sau đó kỹ thuật modularity phân tích “vân tay” và phát hiện mâu thuẫn.
- Ý tưởng thiên tài: Frey nhận ra rằng $a^p + b^p = c^p$ không phải bài toán số nguyên thuần túy --- nó mã hóa thành EC, và EC có “DNA” (biểu diễn Galois) mà ta có thể phân tích.
Liên hệ với giả thuyết Birch--Dyer
- Gián tiếp qua modularity: Đường cong Frey thúc đẩy chứng minh modularity $\Rightarrow$ BSD khả thi.
- Phỏng đoán abc: Phỏng đoán abc (Masser--Oesterlé, 1985) phát biểu $\mathrm{rad}(abc)^{1+\epsilon} > c$ cho $a + b = c$. Nếu đúng, suy ra FLT cho $p$ đủ lớn (không cần modularity). abc và BSD đều là bài toán thiên niên kỷ về bản chất --- liên hệ sâu qua đường cong elliptic.
Định nghĩa
Nói cách khác: biểu diễn thặng dư “hạ” từ mức $N$ xuống mức $N/q$ --- hạ mức (level lowering) [ribet1990].
Ví dụ
Biểu diễn $\bar{\rho}_{E,p}$:
- Vì $\Delta = (abc)^{2p}$, biệt thức chia hết bởi $q_i^{2p}$ cho mỗi $q_i | abc$.
- $\bar{\rho}_{E,p}$ “ít phân nhánh” tại $q_i$ (vì conductor $q_i^1$, không phải $q_i^{2p}$).
- Ribet: hạ mức lần lượt $q_1, q_2, \ldots, q_r$:
\[ N = 2 q_1 \cdots q_r \xrightarrow{-q_r} 2 q_1 \cdots q_{r-1} \xrightarrow{-q_{r-1}} \cdots \xrightarrow{-q_1} 2 \]
- Kết luận: $\bar{\rho}_{E,p} \cong \bar{\rho}_{g,p}$ với $g \in S_2(\Gamma_0(2))$.
- Nhưng $S_2(\Gamma_0(2)) = 0$ $\Rightarrow$ mâu thuẫn!
Ý nghĩa trực giác
- Hình dung: Biểu diễn $\bar{\rho}_{f,p}$ “sống” ở mức $N$ (phức tạp). Nếu $\bar{\rho}$ “không cần” nguyên tố $q$ (ít phân nhánh), ta có thể “hạ” xuống mức $N/q$ (đơn giản hơn).
- Tương tự: Giống “giảm bậc” đa thức. Nếu đa thức bậc $n$ có nghiệm “thừa”, ta chia cho $(x-a)$ giảm bậc. Ở đây “nghiệm thừa” $= q$ trong conductor.
Liên hệ với giả thuyết Birch--Dyer
- FLT $\to$ modularity $\to$ BSD: Level lowering hoàn tất sơ đồ FRW, thúc đẩy Wiles chứng minh modularity, mở đường cho BSD.
- Công cụ trực tiếp: Level lowering/raising dùng trong Skinner--Urban (“converse theorem” cho BSD hạng 1) và Iwasawa main conjecture.
Định nghĩa
Serre (1987) phỏng đoán, và đưa ra công thức tường minh cho “trọng số tối thiểu” $k(\bar{\rho})$ và “mức tối thiểu” $N(\bar{\rho})$ [serre1987].
Ví dụ
- Serre đề xuất 1987: Phỏng đoán tổng quát mạnh hơn nhiều so với TSW (modularity cho EC chỉ là trường hợp $k = 2$).
- Khare--Wintenberger 2009: Chứng minh đầy đủ phỏng đoán Serre [khare-wintenberger2009].
- Hệ quả: Mọi biểu diễn Galois mod $p$ “hợp lý” đều modular. Đặc biệt, suy ra lại modularity cho EC (TSW) như hệ quả.
Ý nghĩa trực giác
- Hình dung: TSW nói “mọi EC đều modular”. Serre tổng quát: “mọi biểu diễn Galois 2 chiều mod $p$ (thỏa điều kiện tự nhiên) đều modular”. Đây là “modularity triệt để” --- không chỉ EC, mà mọi đối tượng số học 2 chiều.
- Sức mạnh: Từ Serre, suy ra vô số kết quả: TSW, FLT, phỏng đoán Artin (một phần)\ldots
Liên hệ với giả thuyết Birch--Dyer
- Tổng quát hóa modularity: Khare--Wintenberger cho “modularity mạnh nhất” --- mọi $\bar{\rho}_{E,p}$ modular, không cần giả thiết gì thêm về $E$.
- Hỗ trợ BSD: Khi $\bar{\rho}_{E,p}$ khả quy (trường hợp khó cho Wiles), Serre's conjecture vẫn cho modularity $\Rightarrow$ mở rộng phạm vi BSD.
Định nghĩa
Đặc biệt, nếu $\bar{\rho}: G_\mathbb{Q} \to \mathrm{GL}_2(\mathbb{F}_3)$ bất khả quy, thì $\bar{\rho}$ modular. Điều này vì $\mathrm{GL}_2(\mathbb{F}_3)$ có nhóm thương khả giải (nhúng vào $S_4$ khả giải) [langlands1980, tunnell1981].
Ví dụ
- Wiles cần: “$\bar{\rho}_{E,3}$ modular” (bước đầu tiên).
- $\bar{\rho}_{E,3}: G_\mathbb{Q} \to \mathrm{GL}_2(\mathbb{F}_3)$. Ảnh $\subset \mathrm{GL}_2(\mathbb{F}_3)$, nhóm có $48$ phần tử.
- $\mathrm{GL}_2(\mathbb{F}_3)/\{\pm I\} \cong S_4$ (nhóm hoán vị 4 phần tử) --- khả giải.
- Langlands--Tunnell $\Rightarrow$ $\bar{\rho}_{E,3}$ modular. ✓
Tại sao $p = 3$? Với $p = 2$: $\mathrm{GL}_2(\mathbb{F}_2) \cong S_3$ cũng khả giải, nhưng $\bar{\rho}_{E,2}$ thường khả quy (vì $E[2]$ thường có điểm hữu tỉ). Với $p = 5$: $\mathrm{GL}_2(\mathbb{F}_5)$ chứa $A_5$ --- không khả giải. Vậy $p = 3$ là lựa chọn duy nhất.
Ý nghĩa trực giác
- Hình dung: Chứng minh modularity cho biểu diễn Galois “lớn” ($\mathrm{GL}_2(\mathbb{Z}_p)$) rất khó. Nhưng cho nhóm “nhỏ” ($\mathrm{GL}_2(\mathbb{F}_3) \cong$ 48 phần tử): khả thi, vì nhóm khả giải $\Rightarrow$ kỹ thuật Langlands (base change, cyclic base change) hoạt động.
- “Hạt giống” cho Wiles: Langlands--Tunnell cung cấp “hạt giống” --- modularity ban đầu. Wiles “nuôi lớn” hạt giống bằng $R = T$ để được modularity đầy đủ.
Liên hệ với giả thuyết Birch--Dyer
- Bước 1 không thể thiếu: Không có Langlands--Tunnell, không có “hạt giống”, không nâng lên modularity, không có BSD.
- Chương trình Langlands: Langlands--Tunnell là trường hợp “dễ” ($\mathrm{GL}_2$ khả giải) của functoriality Langlands. Trường hợp tổng quát ($\mathrm{GL}_n$, không khả giải) liên quan BSD cho đa tạp Abel bậc cao.
Định nghĩa
Phát biểu do Fermat (1637) ghi bên lề sách Arithmetica của Diophantus: “Tôi đã tìm ra chứng minh tuyệt vời, nhưng lề sách quá hẹp để viết.” Chứng minh bởi Wiles (1995), sử dụng Định lý modularity cho EC bán ổn định [wiles1995].
Ví dụ
- Fermat (1637): Phát biểu. Chứng minh cho $n = 4$ (Fermat, descent vô hạn).
- Euler (1770): $n = 3$ (có lỗ nhỏ, sửa bởi Legendre).
- Kummer (1850): $n$ nguyên tố “chính quy” (regular prime) --- sử dụng ideal, bắt đầu lý thuyết số đại số.
- Máy tính (1990s): Kiểm nghiệm $n \leq 4{,}000{,}000$.
- Wiles (1995): Chứng minh đầy đủ cho mọi $n \geq 3$.
Ý nghĩa trực giác
- Hình dung: Phát biểu FLT dễ hiểu cho học sinh lớp 8. Nhưng chứng minh đòi hỏi toàn bộ lý thuyết số hiện đại: EC, dạng modular, biểu diễn Galois, đối đồng điều\ldots
- “Định lý sâu nhất”: Chứng minh FLT buộc phải phát triển modularity (Wiles), kéo theo hàng loạt ứng dụng: BSD, Iwasawa, Langlands\ldots{} FLT là “chất xúc tác” cho 30 năm tiến bộ.
Liên hệ với giả thuyết Birch--Dyer
- Chung công cụ: FLT và BSD cùng sử dụng: modularity, biểu diễn Galois, Selmer groups, Euler systems. Chứng minh FLT mở đường cho BSD.
- Khác nhau: FLT là “phản chứng” (nghiệm không tồn tại $\Rightarrow$ mâu thuẫn). BSD là “đẳng thức” ($\mathrm{ord} L = \mathrm{rk} E$) --- khó hơn nhiều vì cần xây dựng, không chỉ phá hủy.
Định nghĩa
Chọn $\tau \in \mathcal{H}$ sao cho $\tau$ là nghiệm phương trình $a\tau^2 + b\tau + c = 0$ (biệt thức $-D$) và $[\tau] \in X_0(N)$ là điểm CM. Điểm Heegner (Heegner point) trên $E$ là:
Trace xuống $K$: $y_K = \mathrm{Tr}_{H/K}(P_K) = \sum_{\sigma \in \mathrm{Gal}(H/K)} P_K^\sigma \in E(K)$, trong đó $H$ là trường lớp Hilbert của $K$ [gross-zagier1986].
Ví dụ
Kiểm tra Heegner: $37$ tách trong $\mathbb{Q}(\sqrt{-7})$? $\left(\frac{-7}{37}\right) = \left(\frac{37}{7}\right) = \left(\frac{2}{7}\right) = 1$. ✓
Điểm Heegner: $y_K \in E(K)$. Trace xuống $\mathbb{Q}$: $P = \mathrm{Tr}_{K/\mathbb{Q}}(y_K)$. Gross--Zagier: $\hat{h}(y_K) \neq 0$ $\Rightarrow$ $y_K$ có bậc vô hạn $\Rightarrow$ $\mathrm{rk}(E(K)) \geq 1$. Kết hợp: $\mathrm{rk}(E(\mathbb{Q})) = 1$ (đúng: $E(\mathbb{Q}) = \mathbb{Z} \cdot (0,0)$).
Ý nghĩa trực giác
- Hình dung: Tìm điểm hữu tỉ trên EC rất khó (search ngây thơ). Heegner points cho “công thức” tường minh: chọn $\tau$ CM trên $X_0(N)$, áp dụng $\phi_E$ $\Rightarrow$ điểm trên $E$. “Máy” này hoạt động khi điều kiện Heegner thỏa.
- Nguồn gốc CM: Điểm $\tau \in \mathcal{H}$ ứng với EC có nhân phức (CM) bởi $\mathcal{O}_K$. Tính chất “đặc biệt” của CM (đối xứng cao, lý thuyết trường lớp) cho phép kiểm soát điểm Heegner bằng lý thuyết đại số.
Liên hệ với giả thuyết Birch--Dyer
- Gross--Zagier: $L'(E/K, 1) = c \cdot \hat{h}(y_K)$ [gross-zagier1986]. Nếu $L'(E/K,1) \neq 0$ thì $y_K$ có bậc vô hạn $\Rightarrow$ $\mathrm{rk}(E(K)) \geq 1$ $\Rightarrow$ BSD (yếu) cho hạng 1 trên $K$.
- Kolyvagin: Dùng Heegner points xây hệ thống Euler $\Rightarrow$ chặn Selmer $\Rightarrow$ BSD cho hạng 0 và 1.
- Công cụ mạnh nhất: Heegner points + Gross--Zagier + Kolyvagin = phương pháp mạnh nhất hiện nay cho BSD (hạng $\leq 1$). Cho hạng $\geq 2$: chưa có analogon.
Định nghĩa
Khi điều kiện Heegner thỏa: $w(E/K) = -1$ (dấu gốc của $L(E/K, s)$) $\Rightarrow$ $\mathrm{ord}_{s=1} L(E/K, s)$ lẻ $\Rightarrow$ hy vọng $L'(E/K, 1) \neq 0$.
Ví dụ
Thử $D = 3$: $\left(\frac{-3}{37}\right) = \left(\frac{34}{37}\right) = \left(\frac{-3}{37}\right)$. Tính: $(-3)^{18} \equiv 1 \pmod{37}$? $(-3)^2 = 9$, $9^2 = 81 \equiv 7$, $9^4 \equiv 49 \equiv 12$, $9^8 \equiv 144 \equiv 33 \equiv -4$, $9^{16} \equiv 16$, $9^{18} = 9^{16} \cdot 9^2 \equiv 16 \cdot 9 = 144 \equiv 33 \neq 1$. Nên $D = 3$ không thỏa.
Thử $D = 7$: $\left(\frac{-7}{37}\right) = 1$ (vì $37 \equiv 2 \pmod{7}$, $\left(\frac{2}{7}\right) = 1$). ✓
Vậy $K = \mathbb{Q}(\sqrt{-7})$ thỏa Heegner cho $N = 37$. Đây là trường hợp kinh điển trong [gross-zagier1986].
Ý nghĩa trực giác
- Hình dung: Muốn dùng “máy Heegner”, cần chọn $K$ “tương thích” với $E$ (qua conductor $N$). Điều kiện Heegner đảm bảo: tại mỗi nguyên tố xấu $\ell | N$, trường $K$ “tách” --- nghĩa là $\ell$ “nhìn thấy” $K$ đúng cách.
- Luôn thỏa được: Theo Định lý Dirichlet (tiến trình số học), luôn tồn tại $D$ thỏa Heegner cho mọi $N$. Thực tế có vô hạn $D$ như vậy.
Liên hệ với giả thuyết Birch--Dyer
- Dấu gốc: Khi Heegner thỏa, $w(E/K) = -1$ (tính theo công thức). Theo parity conjecture: $\mathrm{rk}(E(K))$ lẻ $\geq 1$. Gross--Zagier khai thác chính xác điều này.
- Hạn chế: Chỉ hoạt động khi $\mathrm{rk}(E/K)$ lẻ. Cho hạng chẵn (ví dụ $\mathrm{rk}(E(\mathbb{Q})) = 0$ với $w(E) = +1$): cần phương pháp khác (Kato, Iwasawa).
Định nghĩa
Tính chất chính (Lý thuyết trường lớp):
- $\mathrm{Gal}(H/K) \cong \mathrm{Cl}(K)$ (nhóm lớp ideal của $K$).
- $[H:K] = h_K$ (số lớp của $K$).
- Mọi ideal của $\mathcal{O}_K$ trở thành chính (principal) trong $\mathcal{O}_H$.
Cho $K = \mathbb{Q}(\sqrt{-D})$: $H$ là trường nhỏ nhất chứa $K$ sao cho mọi ideal phân số của $\mathcal{O}_K$ trở thành chính trong $H$ [cox2013].
Ví dụ
- $K = \mathbb{Q}(\sqrt{-7})$: $h_K = 1$ (vành $\mathcal{O}_K = \mathbb{Z}[\frac{1+\sqrt{-7}}{2}]$ là UFD). Trường lớp $H = K$ --- không có mở rộng không phân nhánh nào.
- $K = \mathbb{Q}(\sqrt{-5})$: $h_K = 2$ ($\mathcal{O}_K = \mathbb{Z}[\sqrt{-5}]$ không UFD: $6 = 2 \cdot 3 = (1+\sqrt{-5})(1-\sqrt{-5})$). Trường lớp $H = K(\sqrt{-1}) = \mathbb{Q}(\sqrt{-5}, \sqrt{-1})$, $[H:K] = 2$.
- $K = \mathbb{Q}(\sqrt{-23})$: $h_K = 3$. $H = K(\alpha)$ với $\alpha^3 - \alpha - 1 = 0$, $[H:K] = 3$.
Ý nghĩa trực giác
- Hình dung: Vành $\mathcal{O}_K$ có thể không UFD (phân tích duy nhất hỏng). Trường lớp Hilbert $H$ “sửa chữa” bằng cách mở rộng trường: trong $H$, mọi ideal trở thành chính --- “phân tích duy nhất phục hồi”.
- Nhóm lớp đo “lỗi”: $\mathrm{Cl}(K)$ đo mức độ “hỏng” UFD. $h_K = 1$ nghĩa là “hoàn hảo” (UFD). $h_K$ lớn nghĩa là “hỏng nhiều”. Trường lớp Hilbert có bậc $= h_K$ --- cần mở rộng lớn hơn để sửa.
Liên hệ với giả thuyết Birch--Dyer
- Điểm Heegner sống trong $H$: Điểm Heegner $P_K = \phi_E(\tau) \in E(H)$ (trường lớp Hilbert). Trace $y_K = \mathrm{Tr}_{H/K}(P_K) \in E(K)$. Lý thuyết trường lớp kiểm soát tác động Galois $\mathrm{Gal}(H/K) \cong \mathrm{Cl}(K)$ trên $P_K$ --- cho phép tính $y_K$.
- Tương tự BSD: Công thức số lớp ($h_K$ liên hệ $L(1, \chi_K)$) tương tự BSD ($|\mathrm{Sha}|$ liên hệ $L^*(E,1)$). Nhóm lớp $\mathrm{Cl}(K)$ $\leftrightarrow$ $\mathrm{Sha}(E/\mathbb{Q})$: cả hai đo “chướng ngại cục bộ-toàn cục”.
Định nghĩa
Khi $c = 1$: $\mathcal{O}_1 = \mathcal{O}_K$ và $H_1 = H$ là trường lớp Hilbert. Khi $c > 1$: $H_c \supset H$ và $[H_c : K] = |\mathrm{Cl}(\mathcal{O}_c)| \geq h_K$ [cox2013].
Ví dụ
- $c = 1$: $\mathcal{O}_1 = \mathbb{Z}[\frac{1+\sqrt{-7}}{2}]$. $\mathrm{Cl}(\mathcal{O}_1) = 1$. $H_1 = K$.
- $c = 2$: $\mathcal{O}_2 = \mathbb{Z} + 2\mathcal{O}_K = \mathbb{Z}[\sqrt{-7}]$. $|\mathrm{Cl}(\mathcal{O}_2)| = 2$. $H_2 = K(\sqrt{2})$, $[H_2:K] = 2$.
Điểm Heegner “mức $c$”: ứng với $\tau \in \mathcal{H}$ sao cho $\mathbb{Z} + \mathbb{Z}\tau$ là ideal của $\mathcal{O}_c$. Điểm $P_c = \phi_E(\tau) \in E(H_c)$.
Ý nghĩa trực giác
- Hình dung: $\mathcal{O}_K$ là “vành tốt nhất”; $\mathcal{O}_c \subset \mathcal{O}_K$ là “vành nhỏ hơn” (index $c$). Trường lớp Hilbert sửa $\mathrm{Cl}(\mathcal{O}_K)$; ring class field sửa $\mathrm{Cl}(\mathcal{O}_c)$ --- nhóm lớp “lớn hơn” (vì order nhỏ hơn $\Rightarrow$ phân tích “tệ hơn”).
- Conductor $c$ lớn: $|\mathrm{Cl}(\mathcal{O}_c)|$ tăng khi $c$ tăng $\Rightarrow$ ring class field lớn hơn $\Rightarrow$ nhiều điểm Heegner hơn.
Liên hệ với giả thuyết Birch--Dyer
- Hệ thống Heegner: Điểm Heegner tại các conductor $c = 1, c_1, c_1 c_2, \ldots$ tạo “hệ thống tương thích” (compatible system). Kolyvagin khai thác hệ thống này xây dựng Euler system $\Rightarrow$ chặn Selmer.
- Norm compatibility: $\mathrm{Tr}_{H_{c\ell}/H_c}(P_{c\ell}) = a_\ell \cdot P_c - P_{c/\ell}$ (quan hệ norm) --- chính xác cấu trúc Euler system cần.
Định nghĩa
Hệ quả trực tiếp:
Ví dụ
Gross--Zagier với $K = \mathbb{Q}(\sqrt{-7})$: tính $y_K \in E(K)$, kiểm tra $\hat{h}(y_K) \neq 0$:
- $L'(E, 1) \neq 0$ (hạng giải tích 1).
- Công thức cho: $\hat{h}(y_K) = \frac{\sqrt{7} \cdot L'(E/K, 1)}{8\pi^2 \langle f_E, f_E \rangle} > 0$.
- $y_K$ có bậc vô hạn $\Rightarrow$ $\mathrm{rk}(E(K)) \geq 1$.
- Kolyvagin: $\mathrm{rk}(E(K)) = 1$ đúng, $\mathrm{Sha}(E/K)$ hữu hạn.
Ý nghĩa trực giác
- Hình dung: Vế trái $L'(E/K,1)$ thuần “giải tích” (đạo hàm hàm $L$). Vế phải $\hat{h}(y_K)$ thuần “đại số” (chiều cao điểm). Công thức nối hai thế giới bằng đẳng thức chính xác --- “phép màu” trung tâm của BSD.
- BSD yếu hạng 1: Nếu $\mathrm{ord}_{s=1} L(E/K,s) = 1$, Gross--Zagier cho $y_K \neq 0$ (bậc vô hạn) $\Rightarrow$ $\mathrm{rk}(E(K)) \geq 1$. Kết hợp Kolyvagin $\Rightarrow$ $\mathrm{rk}(E(K)) = 1$ $\Rightarrow$ BSD yếu đúng cho hạng 1.
Liên hệ với giả thuyết Birch--Dyer
- Kết quả mạnh nhất: Gross--Zagier + Kolyvagin = chứng minh BSD yếu cho $\mathrm{rk}_{\mathrm{an}} \leq 1$ (mọi EC/$\mathbb{Q}$, nhờ modularity).
- BSD mạnh: Gross--Zagier cho “nửa” BSD mạnh --- liên hệ $L'(E,1)$ với $\hat{h}$. Cần thêm: $|\mathrm{Sha}| = ?$, $c_p = ?$, $|E_{\mathrm{tors}}| = ?$ để hoàn tất.
- Tổng quát: Yuan--Zhang--Zhang (2013) tổng quát cho trường toàn phần thực [yuan-zhang-zhang2013].
Định nghĩa
Ví dụ
- Hệ thống Heegner--Kolyvagin (1990): Xây từ điểm Heegner trên $X_0(N)$. Hoạt động khi $E$ modular + điều kiện Heegner. Kết quả: BSD cho $\mathrm{rk}_{\mathrm{an}} \leq 1$.
- Đơn vị elliptic (Coates--Wiles, Rubin): Xây từ đơn vị elliptic trong trường lớp của trường CM. Hoạt động khi $E$ có CM. Kết quả: BSD cho $\mathrm{rk}_{\mathrm{an}} = 0$ với CM.
- Phần tử Beilinson--Kato (Kato 2004): Xây từ $K$-theory đường cong modular. Hoạt động cho mọi EC/$\mathbb{Q}$ (không cần Heegner). Kết quả: chặn “một nửa” Selmer.
Ý nghĩa trực giác
- Hình dung: Mỗi $c_m$ là “công nhân” tại tầng $m$. Quan hệ norm đảm bảo công nhân phối hợp (output tầng $m\ell$ tương thích input tầng $m$). “Dây chuyền” sản xuất ra cận trên cho $|\mathrm{Sel}|$ và $|\mathrm{Sha}|$.
- Tại sao “Euler”? Đa thức $P_\ell(X) = 1 - a_\ell X + \ell X^2$ chính là “thừa số Euler” tại $\ell$ trong $L(E,s)$. Quan hệ norm phản ánh tích Euler $L(E,s) = \prod P_\ell(\ell^{-s})^{-1}$.
Liên hệ với giả thuyết Birch--Dyer
- Công cụ duy nhất: Euler system là phương pháp duy nhất hiện nay chặn được Selmer/Sha --- nguyên liệu cốt lõi cho BSD.
- Hạn chế: Chỉ hoạt động tốt cho $\mathrm{rk} \leq 1$. Cho hạng $\geq 2$: không có Euler system phù hợp (chưa biết xây). Đây là rào cản chính cho BSD hạng cao.
Định nghĩa
Lớp suy dẫn $\kappa_n$ xây từ $y_K$ qua “toán tử đạo hàm Kolyvagin” $D_\ell$ tại mỗi $\ell | n$ [kolyvagin1990].
Ví dụ
- $\mathrm{rk}(E(K)) = 1$ (chính xác, không chỉ $\geq 1$).
- $\mathrm{Sha}(E/K)$ hữu hạn.
- $|\mathrm{Sha}(E/K)[p^\infty]| \leq (\text{index } [E(K) : \mathbb{Z} \cdot y_K])^2$ --- cận trên tường minh cho $\mathrm{Sha}$!
Kết hợp Gross--Zagier ($y_K \neq 0 \Leftrightarrow L'(E/K,1) \neq 0$):
Ý nghĩa trực giác
- Hình dung: Từ một điểm Heegner $y_K$ (thông tin “đại số”), Kolyvagin suy ra: hạng = 1, Sha hữu hạn, cận trên Sha. Giống việc biết “một mẫu DNA” $\Rightarrow$ suy ra toàn bộ “hồ sơ y tế” (hạng, Sha, Selmer).
- Cách mạng (1990): Trước Kolyvagin, không ai biết cách chứng minh $\mathrm{Sha}$ hữu hạn cho bất kỳ EC nào (trừ CM). Kolyvagin giải quyết triệt để cho hạng 1.
Liên hệ với giả thuyết Birch--Dyer
- BSD yếu, $r \leq 1$: Gross--Zagier + Kolyvagin $\Rightarrow$ BSD yếu cho $\mathrm{rk}_{\mathrm{an}} = 0$ hoặc $1$.
- BSD mạnh, $p$-part: Cận Kolyvagin cho $|\mathrm{Sha}[p^\infty]|$ --- kết hợp Kato (cận dưới) $\Rightarrow$ $p$-part BSD mạnh cho nhiều trường hợp.
- Hạn chế: Chỉ cho $\mathrm{rk} \leq 1$. Hạng $\geq 2$: không có điểm Heegner “non-torsion” (vì $L'(E/K,1) = 0$), Kolyvagin không áp dụng được.
Định nghĩa
- $D_\ell = \sum_{i=0}^{\ell-2} i \cdot \sigma_\ell^i \in \mathbb{Z}[\mathrm{Gal}(K(\mu_\ell)/K)]$ là toán tử đạo hàm (Kolyvagin derivative).
- $\delta: E(K(\mu_n))/pE(K(\mu_n)) \to H^1(K, E[p])$ là ánh xạ biên Kummer.
Bậc $r = 0$: $\kappa_1 = \delta(y_K)$ là ảnh Kummer của điểm Heegner (lớp cơ bản).
Bậc $r \geq 1$: lớp suy dẫn “lan tỏa” thông tin từ $y_K$ sang các nguyên tố Kolyvagin $\ell_i$ [kolyvagin1990, gross1991].
Ví dụ
- Dùng $\kappa_1 \neq 0$: chặn $\mathrm{Sel}_p(E/K)$ --- suy ra $\mathrm{rk}(E(K)) \leq 1$.
- Nếu $\mathrm{Sha}[p] \neq 0$: tồn tại $\ell_1$ (Kolyvagin prime) sao cho $\kappa_{\ell_1} \neq 0$.
- Dùng $\kappa_{\ell_1}$: chặn “thêm” $\mathrm{Sha}[p]$ --- giảm kích thước.
- Lặp lại: $\kappa_{\ell_1\ell_2}$ chặn thêm\ldots{} Sau hữu hạn bước: $\mathrm{Sha}[p^\infty] = 0$ hoặc kích thước được chặn.
“Mỗi lớp suy dẫn $\kappa_n$ tiêu diệt một phần $\mathrm{Sha}$” --- hệ thống hoạt động như “vũ khí tuần tự”.
Ý nghĩa trực giác
- Hình dung: $\kappa_1$ (lớp cơ bản) “quét” toàn bộ Selmer. Nếu còn $\mathrm{Sha}$ ẩn, $\kappa_{\ell_1}$ “lùng” sâu hơn tại nguyên tố $\ell_1$. $\kappa_{\ell_1\ell_2}$ lùng thêm\ldots{} Mỗi bậc $r$ tăng thêm “phạm vi trinh sát”.
- “Đạo hàm” Galois: Toán tử $D_\ell$ giống “đạo hàm” --- trích xuất thông tin “vi phân” từ tác động Galois tại $\ell$.
Liên hệ với giả thuyết Birch--Dyer
- Chặn $|\mathrm{Sha}|$: Kết hợp tất cả $\kappa_n$ cho cận trên $|\mathrm{Sha}[p^\infty]| \leq C^2$ (với $C = [E(K) : \mathbb{Z} y_K]$). Đây là bước cốt lõi cho $p$-part BSD mạnh.
- Jetchev--Skinner--Wan (2017): Cải tiến: chặn chính xác hơn, đủ cho BSD mạnh $p$-part trong nhiều trường hợp.
Định nghĩa
Tính chất then chốt: $(\sigma_\ell - 1) D_\ell = (\ell - 1) - N_\ell$, trong đó $N_\ell = \sum_{i=0}^{\ell-2} \sigma_\ell^i$ là toán tử norm.
Ý nghĩa: nếu $x \in E(K(\mu_\ell))$ thỏa $N_\ell(x) = y_K$ (norm = Heegner point), thì $D_\ell(x)$ “trích xuất” thông tin cục bộ tại $\ell$ từ $y_K$ [kolyvagin1990].
Ví dụ
Trong nhóm vành $\mathbb{Z}[G]$ với $G = \langle \sigma \rangle$ cyclic bậc $\ell - 1$:
- “Tổng” (norm): $N = 1 + \sigma + \sigma^2 + \cdots + \sigma^{\ell-2}$
- “Đạo hàm”: $D = 0 + 1\cdot\sigma + 2\cdot\sigma^2 + \cdots + (\ell-2)\sigma^{\ell-2}$
Quan hệ $(\sigma - 1)D = (\ell-1) - N$ tương tự: nếu $f(x) = x^n$ thì $(x-1)f'(x) = nx^n - \frac{x^n - 1}{x - 1} \cdot (x-1)$. Vậy $D_\ell$ là “đạo hàm” trong nghĩa nhóm vành.
Ý nghĩa trực giác
- Hình dung: Điểm Heegner $y_K$ “chứa” thông tin tại mọi nguyên tố (qua norm compatibility). Toán tử $D_\ell$ “mở khóa” thông tin tại $\ell$ cụ thể --- giống “giải mã” tín hiệu tại tần số $\ell$.
- “Telescoping”: $(\sigma - 1)D = (\ell-1) - N$. Nếu $N(x) = y_K$ (biết), thì $(\sigma-1)D(x) = (\ell-1)x - y_K$ $\Rightarrow$ $D(x)$ mod $(\sigma-1)$ xác định $\Rightarrow$ lớp Galois tại $\ell$ xác định.
Liên hệ với giả thuyết Birch--Dyer
- Nguyên liệu kỹ thuật: $D_\ell$ là “linh kiện” xây lớp suy dẫn $\kappa_n$ $\Rightarrow$ chặn Selmer $\Rightarrow$ BSD.
- Tổng quát: Cấu trúc tương tự xuất hiện trong Euler system Rubin (đơn vị elliptic), Kato (phần tử Beilinson--Kato) --- toán tử đạo hàm là “công cụ chung” trong mọi Euler system.
Định nghĩa
Khi $\ell$ trơ trong $K$ và $\ell \nmid c$:
Ví dụ
$a_3(E) = 3 + 1 - \#E(\mathbb{F}_3) = 4 - 4 = 0$.
Quan hệ norm: $\mathrm{Tr}_{H_3/H_1}(P_3) = 0 \cdot P_1 = \mathcal{O}$. Trace của Heegner point conductor 3 xuống $H$ triệt tiêu --- vì $a_3 = 0$.
Tại $\ell = 5$ ($a_5 = 1$): $\mathrm{Tr}_{H_5/H_1}(P_5) = 1 \cdot P_1 = P_1$. Trace của $P_5$ chính là $P_1$ --- tương thích tốt.
Ý nghĩa trực giác
- Hình dung: Hệ thống Heegner $\{P_c\}$ sống trên “tháp” ring class fields $H_1 \subset H_c \subset H_{c\ell} \subset \cdots$. Quan hệ norm đảm bảo: “chiếu” $P_{c\ell}$ xuống $H_c$ cho kết quả liên hệ tuyến tính với $P_c$ --- hệ thống nhất quán giữa các tầng.
- Hệ số $= a_\ell$: Hệ số norm chính là vết Frobenius $a_\ell$ --- kết nối trực tiếp với hàm $L$. Đây là lý do Euler system liên hệ Selmer (đại số) với $L$-value (giải tích).
Liên hệ với giả thuyết Birch--Dyer
- Cấu trúc Euler system: Quan hệ norm là tiên đề chính (axiom) của Euler system. Kolyvagin cần nó để “truyền” thông tin từ tầng cao ($H_{c\ell}$) xuống tầng thấp ($H_c$) $\Rightarrow$ xây derived classes $\Rightarrow$ chặn Selmer $\Rightarrow$ BSD.
- Đa thức Euler: Hệ số $a_\ell$ trong norm relation chính là đa thức Euler $P_\ell(\mathrm{Frob}_\ell^{-1})$ tại $\ell$ --- phản ánh tích Euler $L(E,s) = \prod_\ell P_\ell(\ell^{-s})^{-1}$.
Định nghĩa
Hàm $L$ viết dưới dạng tích Euler: $L(E, s) = \prod_{\ell} P_\ell(\ell^{-s})^{-1}$.
Nghiệm $P_\ell(X) = 0$: $\alpha_\ell, \beta_\ell$ (nghiệm Frobenius). Khi rút gọn tốt: $|\alpha_\ell| = |\beta_\ell| = \sqrt{\ell}$ (cận Hasse/GRH cục bộ) [silverman2009].
Ví dụ
Ví dụ (Đa thức Euler cho $E = 37a1$). $E: y^2 + y = x^3 - x$, conductor $N = 37$.
| $\ell$ | Loại rút gọn | $a_\ell$ | $P_\ell(X)$ |
|---|---|---|---|
| 2 | Tốt | $-2$ | $1 + 2X + 2X^2$ |
| 3 | Tốt | $-1$ | $1 + X + 3X^2$ |
| 5 | Tốt | $-2$ | $1 + 2X + 5X^2$ |
| 37 | Nhân tách | $-1$ | $1 + X$ |
Tích Euler (hội tụ $\mathrm{Re}(s) > 3/2$):
Ý nghĩa trực giác
- Hình dung: Mỗi nguyên tố $\ell$ đóng góp “thừa số cục bộ” $P_\ell(\ell^{-s})^{-1}$ vào hàm $L$. Toàn bộ thông tin “cục bộ” ($a_\ell$, loại rút gọn) gói trong $P_\ell$. Hàm $L$ “toàn cục” = tích tất cả “cục bộ”.
- Tương tự phân tích nguyên tố: $n = \prod p_i^{e_i}$ phân tích số nguyên thành nguyên tố. $L(E,s) = \prod P_\ell(\ell^{-s})^{-1}$ “phân tích” hàm $L$ thành thừa số nguyên tố. Đây là triết lý “cục bộ-toàn cục” xuyên suốt lý thuyết số.
Liên hệ với giả thuyết Birch--Dyer
- Tích Euler $= L$: BSD phát biểu qua $L(E,s)$, xây dựng hoàn toàn từ $P_\ell$. Tính $P_\ell$ = tính $a_\ell$ = đếm điểm mod $\ell$ --- bước đầu tiên kiểm nghiệm BSD.
- Euler system axiom: Quan hệ norm trong Euler system có hệ số $P_\ell(\mathrm{Frob}_\ell^{-1})$ --- chính xác đa thức Euler. Đây là lý do gọi “Euler system”.
Định nghĩa
Cụ thể, cho $E$ đường cong elliptic với CM bởi $\mathcal{O}_K$ và $\Omega$ chu kỳ cơ bản:
Ví dụ
Coates--Wiles (1977) [coates-wiles1977]:
- Xây đơn vị elliptic $u_n \in K(\mu_{p^n})^\times$ tại các tầng $p$-cyclotomic.
- Chứng minh: $\{u_n\}$ tạo Euler system cho $E$.
- Kết quả: Nếu $L(E, 1) \neq 0$, thì $E(K)$ hữu hạn ($\mathrm{rk} = 0$).
Ý nghĩa trực giác
- Hình dung: Đơn vị “thường” (cyclotomic units) xây từ $\zeta_n = e^{2\pi i/n}$. Đơn vị elliptic thay $e^{2\pi i z}$ bằng hàm elliptic (hàm Weierstrass, theta) --- “nâng cấp” từ $\mathbb{G}_m$ lên EC.
- CM cần: Chỉ hoạt động khi $E$ có CM --- vì cần lý thuyết trường lớp “số học” của $K$ để kiểm soát đơn vị. EC không có CM: dùng Beilinson--Kato thay thế.
Liên hệ với giả thuyết Birch--Dyer
- Coates--Wiles (1977): Kết quả BSD đầu tiên --- $L(E,1) \neq 0 \Rightarrow \mathrm{rk} = 0$ cho CM curves. Sử dụng Euler system đơn vị elliptic.
- Rubin (1991): Mở rộng --- chứng minh BSD mạnh ($p$-part) cho CM curves hạng 0, dùng Iwasawa theory + đơn vị elliptic [rubin1991].
- Hạn chế: Chỉ cho CM curves (rất ít EC có CM). EC tổng quát: cần Kato, Kolyvagin.
Định nghĩa
Biến thể quan trọng:
- $\theta_3(\tau) = \theta(0, \tau) = \sum_{n \in \mathbb{Z}} q^{n^2} = 1 + 2q + 2q^4 + 2q^9 + \cdots$ (hàm theta “cơ bản”).
- $\theta_{\chi}(\tau) = \sum_{n} \chi(n) q^{n^2}$ (theta với ký tự Dirichlet $\chi$) --- dạng modular trọng số $1/2$.
Ví dụ
Ví dụ: $r_2(5) = 8$ (vì $5 = 1^2 + 2^2 = 2^2 + 1^2 = (-1)^2 + 2^2 = \cdots$, tính cả dấu và thứ tự).
$\theta_3^2 = 1 + 4q + 4q^2 + 0 \cdot q^3 + 4q^4 + 8q^5 + \cdots$
Hệ số = $r_2(k)$: $r_2(0)=1, r_2(1)=4, r_2(2)=4, r_2(3)=0, r_2(4)=4, r_2(5)=8$.
Ý nghĩa trực giác
- Hình dung: $\theta^k$ “đếm” số cách biểu diễn $n$ bởi tổng $k$ bình phương. Theta “mã hóa” bài toán tổ hợp-số học vào dạng modular --- cho phép dùng công cụ giải tích phức.
- Trọng số nửa nguyên: $\theta$ là dạng modular trọng số $1/2$ --- “nửa” so với trọng số nguyên. Lý thuyết dạng modular nửa nguyên (Shimura) kết nối $\theta$ với $L$-functions.
Liên hệ với giả thuyết Birch--Dyer
- Đơn vị elliptic: Hàm theta (hoặc Klein form, Siegel units) là nguyên liệu xây đơn vị elliptic $\Rightarrow$ Euler system $\Rightarrow$ BSD cho CM curves.
- Waldspurger: Công thức Waldspurger liên hệ $|a_D(g)|^2 \sim L(E, 1) \cdot \chi_D$ (hệ số Fourier dạng nửa nguyên $\sim$ giá trị $L$). Kết nối theta $\leftrightarrow$ BSD.
- Tunnell: Định lý Tunnell (1983) dùng theta + Waldspurger để giải bài toán “số congruent” --- trường hợp đặc biệt BSD cho $E: y^2 = x^3 - n^2x$.
Định nghĩa
Kết quả chính --- Ánh xạ Artin (Artin reciprocity):
Trường hợp đặc biệt: $K = \mathbb{Q}$, $L = \mathbb{Q}(\zeta_n)$ (trường cyclotomic). Artin: $(\mathbb{Z}/n\mathbb{Z})^\times \cong \mathrm{Gal}(\mathbb{Q}(\zeta_n)/\mathbb{Q})$, $a \mapsto (\zeta_n \mapsto \zeta_n^a)$ --- luật thuận nghịch Artin [neukirch1999].
Ví dụ
- Trường lớp Hilbert: $H = K(i) = \mathbb{Q}(\sqrt{-5}, i)$, $\mathrm{Gal}(H/K) \cong \mathrm{Cl}(K) \cong \mathbb{Z}/2\mathbb{Z}$.
- Ánh xạ Artin: ideal nguyên tố $\mathfrak{p} \subset \mathcal{O}_K$ ánh xạ tới Frobenius $\mathrm{Frob}_\mathfrak{p} \in \mathrm{Gal}(H/K)$. Ideal chính $\mapsto 1$ (trivial); ideal không chính $\mapsto$ phần tử non-trivial.
- Ý nghĩa: $\mathfrak{p}$ tách hoàn toàn trong $H$ $\Leftrightarrow$ $\mathfrak{p}$ chính $\Leftrightarrow$ norm $N(\mathfrak{p})$ biểu diễn được bởi dạng bậc hai chính $x^2 + 5y^2$.
Ý nghĩa trực giác
- Hình dung: CFT là “GPS” cho mở rộng Abel --- cho biết chính xác mở rộng nào tồn tại và cấu trúc Galois. Trước CFT (thế kỷ 19--20), chỉ biết vài mở rộng cụ thể. Sau CFT: biết tất cả.
- Abel = đầy đủ, non-Abel = mở: CFT giải quyết triệt để trường hợp Abel. Non-abelian Langlands (bao gồm modularity cho EC) là “CFT non-Abel” --- vẫn mở rộng lớn.
Liên hệ với giả thuyết Birch--Dyer
- Kiểm soát Heegner: Điểm Heegner $P_K \in E(H)$ (trường lớp Hilbert). CFT kiểm soát $\mathrm{Gal}(H/K) \cong \mathrm{Cl}(K)$, cho phép tính trace $y_K = \mathrm{Tr}_{H/K}(P_K)$. Không có CFT, không kiểm soát được Heegner.
- Coates--Wiles: Dùng CFT + CM để xây đơn vị elliptic --- hệ thống Euler cho BSD.
- Tương tự BSD: Công thức số lớp (CFT) tương tự BSD: $L(1, \chi_K) \sim h_K \cdot R_K / \sqrt{|D_K|}$. Nhóm lớp $\mathrm{Cl}(K) \leftrightarrow \mathrm{Sha}(E/\mathbb{Q})$, regulator $R_K \leftrightarrow \mathrm{Reg}_E$.
Định nghĩa
- Đơn vị Siegel $g_a \in \mathcal{O}(Y_1(N))^\times$: các hàm hữu tỉ trên đường cong modular.
- Ký hiệu Steinberg: $\{g_a, g_b\} \in K_2(Y_1(N))$ ($K$-theory bậc 2).
- Ánh xạ regulator: $K_2 \xrightarrow{\mathrm{reg}} H^1(\mathbb{Q}, T_p(E))$ (qua Chern class + chiếu lên eigenspace $f_E$).
Kato (2004) chứng minh: $\{z_{\mathrm{Kato}, n}\}$ tạo Euler system cho $T_p(E)$ --- không cần điều kiện Heegner, không cần CM, hoạt động cho mọi EC/$\mathbb{Q}$ [kato2004].
Ví dụ
Kato mạnh hơn về phạm vi (mọi EC) nhưng yếu hơn về kết quả (chỉ chặn một phía Selmer, không cho $\mathrm{rk} = r_{\mathrm{an}}$ như Kolyvagin).
Ý nghĩa trực giác
- Hình dung: Kolyvagin dùng “điểm” (Heegner) xây Euler system. Kato dùng “hàm” (đơn vị Siegel) --- trừu tượng hơn nhưng tổng quát hơn.
- $K$-theory: $K_2$ là “nhóm Abel hóa” của các quan hệ giữa hàm khả nghịch. Ký hiệu Steinberg $\{f, g\}$ “nhớ” mối quan hệ giữa $f$ và $g$ --- sau khi chiếu vào đối đồng điều Galois, cho phần tử Euler system.
- Beilinson (1984): Beilinson xây phần tử trong $K_2$ và liên hệ với $L'(f,1)$ (conjecture). Kato (2004) chứng minh Beilinson conjecture (một nửa) và xây Euler system.
Liên hệ với giả thuyết Birch--Dyer
- Chặn Selmer: Kato chứng minh: nếu $L(E,1) \neq 0$, thì $\mathrm{Sel}_{p^\infty}(E/\mathbb{Q})$ hữu hạn --- suy ra $\mathrm{rk}(E(\mathbb{Q})) = 0$ và $\mathrm{Sha}[p^\infty]$ hữu hạn. Đây là “một nửa” BSD yếu (chiều $\mathrm{rk}_{\mathrm{an}} = 0 \Rightarrow \mathrm{rk} = 0$).
- Iwasawa: Kato chứng minh “một nửa” phỏng đoán chính Iwasawa: $\mathrm{char}_\Lambda(\mathrm{Sel}_{p^\infty}) | L_p(E)$ (chuỗi đặc trưng chia hàm $L$ $p$-adic).
- Skinner--Urban hoàn tất: Skinner--Urban (2014) chứng minh “nửa còn lại”: $L_p(E) | \mathrm{char}_\Lambda(\mathrm{Sel})$ (dưới giả thiết). Kết hợp: $\mathrm{char} = (L_p)$ $\Rightarrow$ BSD $p$-part mạnh cho hạng 0 và 1.
Định nghĩa
- $q = e^{2\pi i \tau}$, $q_a = e^{2\pi i a\tau/N}$, $\zeta_b = e^{2\pi i b/N}$,
- $B_2(x) = x^2 - x + \frac{1}{6}$ là đa thức Bernoulli bậc 2.
Tính chất quan trọng:
- $g_{a,b}$ là đơn vị (unit) trên $Y_1(N)$: nó khả nghịch --- không có zero hay cực trên $Y_1(N)$, chỉ có zero/cực tại các cusp.
- Bậc (divisor) của $g_{a,b}$ được tính tường minh qua các cusp.
- Các đơn vị Siegel tạo thành nhóm con hữu hạn chỉ số trong nhóm tất cả các đơn vị modular.
Ví dụ
Quan hệ với hàm eta: Đơn vị Siegel liên hệ mật thiết với thương eta (eta quotient). Cụ thể, hàm Dedekind eta $\eta(\tau) = q^{1/24} \prod_{n=1}^{\infty}(1-q^n)$ cho phép viết:
Ý nghĩa trực giác
- Hình dung: Trên đường cong modular $Y_1(N)$, có những hàm “không bao giờ bằng 0 hay vô cực” (trừ tại các cusp ở biên). Đó chính là các đơn vị Siegel. Chúng giống như “hằng số khả nghịch” nhưng không thực sự hằng --- giữ đủ thông tin số học.
- Tại sao quan trọng: Để xây phần tử Beilinson--Kato trong $K_2$, ta cần cặp hàm khả nghịch trên đường cong modular. Đơn vị Siegel cung cấp chính xác những hàm này. Ký hiệu Steinberg $\{g_{a,b}, g_{c,d}\}$ cho phần tử trong $K_2$.
- Analogy: Trong lý thuyết trường lớp, “đơn vị cyclotomic” (ví dụ $1 - \zeta_n$ với $\zeta_n = e^{2\pi i/n}$) đóng vai trò then chốt. Đơn vị Siegel là bản “nâng cấp” lên đường cong modular: thay vì sống trên $\mathbb{Z}[\zeta_n]$, chúng sống trên $Y_1(N)$.
Liên hệ với giả thuyết Birch--Dyer
- Thành phần của Beilinson--Kato: Phần tử Beilinson--Kato $z_\gamma \in K_2(Y_1(N))$ được xây từ ký hiệu Steinberg $\{g_{a,b}, g_{c,d}\}$ của các đơn vị Siegel. Đây là “nguyên liệu thô” của Euler system Kato.
- Liên hệ với $L(E,s)$: Kato chứng minh rằng ảnh của phần tử Beilinson--Kato qua ánh xạ regulator cho giá trị $L'(f, 1)$ (đạo hàm hàm $L$ tại $s = 1$). Tức là thông tin số học của đơn vị Siegel “mã hóa” thông tin giải tích của hàm $L$.
- Tổng quát hơn đơn vị elliptic: Đơn vị elliptic (dùng trong Coates--Wiles cho đường cong CM) là trường hợp đặc biệt. Đơn vị Siegel áp dụng cho mọi đường cong elliptic trên $\mathbb{Q}$ --- không cần giả thiết CM.
Định nghĩa
- Song tuyến tính: $\{fg, h\} = \{f, h\} + \{g, h\}$ và $\{f, gh\} = \{f, g\} + \{f, h\}$.
- Quan hệ Steinberg: $\{f, 1-f\} = 0$ cho mọi $f \in F^\times \setminus \{1\}$.
Nhóm $K_2(F)$ được định nghĩa chính xác là:
Ví dụ
2. Quan hệ Steinberg: Lấy $f = 3$, thì $1 - f = -2$, nên $\{3, -2\} = 0$ trong $K_2(\mathbb{Q})$.
3. Hệ quả quan trọng: Từ quan hệ Steinberg suy ra:
- $\{f, -f\} = 0$ cho mọi $f$ (đặt $g = -f/(1-f)$ rồi tính).
- $\{f, f\} = \{f, -1\}$ (từ $\{f, -f\} = \{f, f\} + \{f, -1\} = 0$).
4. Trên đường cong modular: Lấy $f = g_{1,0}$ và $g = g_{0,1}$ là hai đơn vị Siegel trên $Y_1(N)$. Khi đó $\{g_{1,0}, g_{0,1}\} \in K_2(Y_1(N))$ --- đây chính là dạng phần tử Beilinson--Kato.
Ý nghĩa trực giác
- Hình dung: Nếu $K_1(F) = F^\times$ đo “các hàm khả nghịch”, thì $K_2(F)$ đo “các quan hệ giữa hàm khả nghịch”. Ký hiệu $\{f, g\}$ giống “tích chéo” của hai hàm --- nó nắm bắt cách $f$ và $g$ “tương tác” với nhau.
- Tại sao quan hệ $\{f, 1-f\} = 0$?: Hãy nghĩ: $f$ và $1-f$ “phụ thuộc tuyến tính” (theo nghĩa $f + (1-f) = 1$). Quan hệ Steinberg nói rằng các cặp “phụ thuộc trivially” như vậy cho ký hiệu bằng 0.
- Từ đại số sang số học: Khi $F$ là trường hàm của đường cong đại số, $K_2(F)$ mang thông tin hình học (zero, cực của hàm). Ánh xạ “tame symbol” gửi $\{f, g\}$ tới $(-1)^{v(f)v(g)} f^{v(g)} g^{-v(f)}$ tại mỗi điểm --- đo “sự tương tác cục bộ” của $f$ và $g$.
Liên hệ với giả thuyết Birch--Dyer
- Xây phần tử Kato: Euler system Kato bắt đầu từ $\{g_{a,b}, g_{c,d}\} \in K_2(Y_1(N))$ --- ký hiệu Steinberg của cặp đơn vị Siegel. Phần tử này mang cả thông tin đại số (cấu trúc nhóm $K_2$) và giải tích (giá trị $L$).
- Chiếu vào Galois cohomology: Qua ánh xạ Chern class (regulator), ký hiệu Steinberg được gửi vào $H^1(G_\mathbb{Q}, T_p(E))$ --- tạo thành lớp đối đồng điều Galois. Đây là bước then chốt: biến đối tượng $K$-theory thành đối tượng Galois mà ta có thể dùng để chặn nhóm Selmer.
- Liên hệ giá trị đặc biệt: Beilinson conjectured (và Kato proved phần lớn) rằng ảnh regulator của $\{g_{a,b}, g_{c,d}\}$ bằng $L'(f, 1)$ nhân hằng số tường minh. Tức thông tin “tích chéo” của hai đơn vị Siegel mã hóa đạo hàm hàm $L$ tại điểm trung tâm.
Định nghĩa
- $K_0(X)$: Nhóm Grothendieck --- phân loại bó véctơ (vector bundle) trên $X$ dưới quan hệ $[E] = [E'] + [E'']$ khi có dãy chính xác ngắn $0 \to E' \to E \to E'' \to 0$.
- $K_1(F) = F^\times$ (cho trường $F$): Nhóm các phần tử khả nghịch.
- $K_2(F)$: Nhóm Milnor $K$-theory bậc 2 --- được sinh bởi ký hiệu Steinberg $\{f, g\}$ modulo quan hệ song tuyến tính và $\{f, 1-f\} = 0$.
Đặc biệt, cho $X$ là đường cong trơn trên trường, nhóm $K_2(X)$ gồm các phần tử $\sum_i \{f_i, g_i\}$ (với $f_i, g_i$ hàm hữu tỉ khả nghịch trên $X$) thỏa mãn điều kiện “tame” tại mọi điểm:
Ví dụ
2. $K_2$ của đường cong modular: Cho $Y = Y_1(N)$. Phần tử $\{g_{1,0}, g_{0,1}\}$ (ký hiệu Steinberg của hai đơn vị Siegel) nằm trong $K_2(Y)$ khi và chỉ khi tame symbol triệt tiêu tại mọi điểm. Điều này đòi hỏi chọn cẩn thận $(a,b), (c,d)$ sao cho zero/cực “triệt tiêu nhau”.
3. So sánh bậc $K$-theory:
| Nhóm | Ý nghĩa | Trong BSD |
|---|---|---|
| $K_0$ | Phân loại bó véctơ | Euler characteristic |
| $K_1 = F^\times$ | Các hàm khả nghịch | Đơn vị, đơn vị elliptic |
| $K_2$ | Quan hệ giữa hàm | Phần tử Beilinson--Kato |
Ý nghĩa trực giác
- Hình dung: $K_0$ đếm “có gì” (bó véctơ). $K_1$ đo “các phép biến đổi khả nghịch”. $K_2$ đo “các quan hệ giữa phép biến đổi”. Bậc càng cao, thông tin càng “tinh tế” và “bậc cao” hơn.
- Analogy vật lý: Trong vật lý, $K_0$ giống “vị trí”, $K_1$ giống “vận tốc”, $K_2$ giống “gia tốc”. Mỗi bậc là “đạo hàm” của bậc trước --- nắm bắt thông tin thay đổi tinh vi hơn.
- Quillen vs Milnor: Quillen (1972, Fields Medal 1978) định nghĩa $K_n$ cho mọi $n$ bằng topology đại số ($BGL^+$). Milnor $K$-theory đơn giản hơn: $K_n^M(F) = (F^\times)^{\otimes n} / (\text{quan hệ Steinberg})$. Cho $n = 2$, hai định nghĩa trùng nhau; cho $n \geq 3$, Milnor $K$ là “thương” của Quillen $K$.
Liên hệ với giả thuyết Birch--Dyer
- $K_2$ là nơi sinh Euler system: Phần tử Beilinson--Kato sống trong $K_2(Y_1(N))$. Đây là lý do $K$-theory không thể thiếu trong phương pháp Kato: ta cần “không gian lớn hơn” $K_1 = \mathcal{O}^\times$ (đơn vị) để chứa phần tử đủ mạnh cho mọi đường cong elliptic (không chỉ CM).
- Phỏng đoán Beilinson (1984): Tổng quát hóa BSD, Beilinson phỏng đoán rằng giá trị đặc biệt $L^{(r)}(M, n)$ của hàm $L$ của motif $M$ được biểu diễn qua regulator trên $K$-group thích hợp. BSD là trường hợp đặc biệt khi $M = h^1(E)$ (motif bậc 1 của đường cong elliptic).
- Cầu nối: $K$-theory tạo cầu nối giữa thế giới đại số (nhóm Selmer, Sha) và thế giới giải tích (hàm $L$, giá trị đặc biệt) thông qua ánh xạ regulator. Đây chính là tinh thần trung tâm của toàn bộ BSD: liên hệ số học với giải tích.
Định nghĩa
1. Regulator Beilinson (complex):
Cụ thể, cho $\{f, g\} \in K_2(\mathbb{C}(X))$, regulator Beilinson được tính:
2. Regulator étale ($p$-adic):
Ví dụ
2. Regulator Beilinson cho đường cong elliptic: Lấy $E: y^2 = x^3 - x$ (conductor $N = 32$). Cho $\alpha = \{f, g\} \in K_2(E)$, regulator Beilinson cho số thực:
3. Regulator étale (Kato): Cho $\beta_\gamma \in K_2(Y_1(N))$ là phần tử Beilinson--Kato. Áp dụng $r_p$:
Ý nghĩa trực giác
- Hình dung: $K$-theory mang thông tin “đại số thuần túy” (ký hiệu Steinberg, quan hệ giữa hàm). Cohomology mang thông tin “topo/giải tích” (tích phân, chu kỳ). Regulator là “máy dịch” chuyển ngôn ngữ đại số sang ngôn ngữ giải tích.
- Analogy: Giống như phép biến đổi Fourier biến hàm thời gian thành hàm tần số --- cùng một thông tin nhưng “nhìn” theo góc khác. Regulator biến phần tử $K$-theory thành lớp cohomology --- cùng thông tin số học nhưng ở dạng dễ tính toán hơn.
- Quy luật chung: Mọi kết nối “đại số $\leftrightarrow$ giải tích” trong lý thuyết số đều đi qua một dạng regulator. Công thức số lớp dùng regulator Dirichlet. BSD dùng regulator Néron--Tate (cho $K_0$). Beilinson--Kato dùng regulator $K_2$ (bậc cao hơn).
Liên hệ với giả thuyết Birch--Dyer
- Vai trò trung tâm: Regulator là “bước chuyển” quan trọng nhất trong phương pháp Kato:
\[ \underbrace{\{g_{a,b}, g_{c,d}\}}_{\text{đại số: } K_2} \xrightarrow{\; r_p \;} \underbrace{z_\gamma \in H^1(G_\mathbb{Q}, T_p(E))}_{\text{Galois: Euler system}} \xrightarrow{\;\text{bound}\;} \underbrace{|\mathrm{Sel}_{p^\infty}| < \infty}_{\text{BSD}}. \]
- Hai regulator trong BSD: BSD mạnh chứa regulator Néron--Tate $\mathrm{Reg}_E = \det(\langle P_i, P_j \rangle)$ trong công thức $L^{(r)}(E,1)/r!$. Regulator Beilinson là “bậc cao hơn” --- liên hệ $K_2$ với $L'(f,1)$. Hai regulator này tương thích qua “compatibility” trong Beilinson conjecture.
- Phỏng đoán Beilinson = BSD tổng quát: Phỏng đoán Beilinson nói rằng rank của $K$-group bằng bậc triệt tiêu hàm $L$ tại điểm nguyên thích hợp, và regulator cho giá trị đặc biệt (modulo $\mathbb{Q}^\times$). BSD là trường hợp $K_0$ (hạng Mordell--Weil = $\mathrm{ord}_{s=1} L(E,s)$). Phương pháp Kato khai thác $K_2$.
Định nghĩa
Fontaine (1982--1994) xây dựng các “vành chu kỳ $p$-adic” lớn:
- $B_{\mathrm{HT}}$: vành Hodge--Tate. Phân loại biểu diễn Hodge--Tate (đơn giản nhất).
- $B_{\mathrm{dR}}$: vành de Rham. Phân loại biểu diễn de Rham (có lọc --- filtration).
- $B_{\mathrm{cris}}$: vành crystalline. Phân loại biểu diễn crystalline (có Frobenius $\varphi$).
- $B_{\mathrm{st}}$: vành semi-stable. Phân loại biểu diễn bán ổn định (có $\varphi$ và monodromy $N$).
Cho $V$ là biểu diễn $p$-adic của $G_{\mathbb{Q}_p}$ (tức $\mathbb{Q}_p$-không gian véctơ hữu hạn chiều với tác động liên tục của $G_{\mathbb{Q}_p}$), ta định nghĩa:
Bao hàm: crystalline $\subset$ semi-stable $\subset$ de Rham $\subset$ Hodge--Tate.
Ví dụ
1. Rút gọn tốt tại $p$: Nếu $E$ có rút gọn tốt tại $p$, thì $V_p(E)|_{G_{\mathbb{Q}_p}}$ là crystalline. Khi đó:
2. Rút gọn nhân tại $p$: Nếu $E$ có rút gọn nhân (tách hoặc không tách), thì $V_p(E)|_{G_{\mathbb{Q}_p}}$ là semi-stable nhưng không crystalline. Có thêm toán tử monodromy $N \neq 0$.
3. Trọng số Hodge--Tate: Biểu diễn $V_p(E)$ luôn có trọng số Hodge--Tate $\{0, 1\}$ --- phản ánh rằng $E$ là đa tạp Abel chiều 1. Nếu $A$ là đa tạp Abel chiều $g$, thì $V_p(A)$ có chiều $2g$ với trọng số $\{0, 1\}$ lặp $g$ lần.
Ý nghĩa trực giác
- Bài toán gốc: Biểu diễn Galois $\rho: G_{\mathbb{Q}_p} \to \mathrm{GL}_n(\mathbb{Q}_p)$ rất phức tạp vì $G_{\mathbb{Q}_p}$ là nhóm profinite khổng lồ. Lý thuyết Hodge $p$-adic “giải mã” $\rho$ thành đại số tuyến tính đơn giản hơn: module $D$ với Frobenius $\varphi$ và filtration.
- Analogy Hodge cổ điển: Trong hình học phức, đối đồng điều $H^n(X, \mathbb{C})$ có phân tích Hodge $\bigoplus_{p+q=n} H^{p,q}$. Phân tích này cho biết “bao nhiêu thông tin holomorphic vs anti-holomorphic”. Hodge $p$-adic làm tương tự nhưng trên $\mathbb{Q}_p$: thay “holomorphic” bằng “crystalline/de Rham”.
- Tại sao “vành chu kỳ”?: Trong Hodge cổ điển, tích phân chu kỳ $\int_\gamma \omega$ so sánh de Rham và Betti. Trong Hodge $p$-adic, vành $B_\bullet$ (rất lớn!) đóng vai trò “chu kỳ $p$-adic” --- so sánh Galois và de Rham/crystalline.
Liên hệ với giả thuyết Birch--Dyer
- Ánh xạ so sánh (Kato): Euler system Kato cần “so sánh” lớp Galois $z_\gamma \in H^1(G_\mathbb{Q}, V_p(E))$ với giá trị hàm $L$. Bước so sánh này đi qua $D_{\mathrm{cris}}$:
\[ H^1(G_{\mathbb{Q}_p}, V_p(E)) \xrightarrow{\;\exp^*\;} D_{\mathrm{cris}}(V_p(E)) \xrightarrow{\;\sim\;} \text{giá trị } L(E,1). \]Ánh xạ $\exp^*$ (đối ngẫu của ánh xạ mũ Bloch--Kato) là cầu nối then chốt.
- Hàm $L$ $p$-adic: Xây dựng hàm $L$ $p$-adic $L_p(E, s)$ cũng dùng Hodge $p$-adic: nội suy $p$-adic các giá trị đặc biệt đòi hỏi “chu kỳ $p$-adic” $\Omega_p$ liên quan đến $D_{\mathrm{cris}}$.
- BSD $p$-adic: Phỏng đoán BSD $p$-adic (Mazur--Tate--Teitelbaum) phát biểu hoàn toàn trong ngôn ngữ Hodge $p$-adic. “Regulator $p$-adic” $\mathrm{Reg}_p$ được định nghĩa qua logarit $p$-adic trên $D_{\mathrm{cris}}$, thay cho regulator thực $\mathrm{Reg}_E$.
- Exceptional zero: Khi $E$ có rút gọn nhân tách tại $p$ (semi-stable, không crystalline), hàm $L$ $p$-adic có thêm zero “ngoại lai”. Bất biến $\mathcal{L}$ (Greenberg--Stevens) đo “lệch” giữa crystalline và semi-stable --- hiện tượng thuần túy Hodge $p$-adic.
Định nghĩa
1. Đối ngẫu Tate cục bộ: Cho $G_v = \mathrm{Gal}(\overline{K}_v / K_v)$ nhóm Galois cục bộ (tại vị trí $v$ của trường số $K$) và $M$ module Galois hữu hạn. Khi đó có ghép đôi hoàn hảo:
2. Dãy chính xác Poitou--Tate: Liên kết đối đồng điều toàn cục $H^r(G_K, M)$ và cục bộ $\prod_v H^r(G_v, M)$ qua dãy chính xác dài 9 số hạng:
Ví dụ
2. Poitou--Tate cho $E[p]$: Lấy $M = E[p]$ (điểm xoắn $p$-phần). Dãy Poitou--Tate chứa:
Ý nghĩa trực giác
- Hình dung: Mỗi “vị trí” $v$ (số nguyên tố hoặc vô cực) cho ta “thông tin cục bộ” $H^r(G_v, M)$. Thông tin “toàn cục” $H^r(G_\mathbb{Q}, M)$ khó tính trực tiếp. Poitou--Tate nói: toàn cục được xác định bởi cục bộ cộng ràng buộc đối ngẫu.
- Analogy: Giống như “luật bảo toàn” trong vật lý. Thông tin cục bộ (tại từng $p$) không độc lập --- chúng bị ràng buộc bởi luật “tổng bằng 0”. Ví dụ: luật thặng dư bậc hai (Gauss) nói $\prod_v (a, b)_v = 1$ --- ký hiệu Hilbert tại mọi vị trí nhân lại bằng 1.
- Tại sao “đối ngẫu”?: $H^r$ và $H^{2-r}$ “đối ngẫu” nhau qua ghép đôi Tate (giống $H^k$ và $H^{n-k}$ đối ngẫu Poincaré trong topo). Chiều $r = 0, 1, 2$ tương ứng “phần tử bất biến”, “mở rộng (extension)”, và “chướng ngại (obstruction)”.
Liên hệ với giả thuyết Birch--Dyer
- Định nghĩa Selmer: Nhóm Selmer $\mathrm{Sel}_p(E/\mathbb{Q})$ được định nghĩa chính xác bằng “điều kiện cục bộ” tại mỗi $v$. Dãy Poitou--Tate giải thích tại sao điều kiện cục bộ xác định duy nhất nhóm Selmer --- và cho dãy chính xác:
\[ 0 \to \mathrm{Sel}_p(E/\mathbb{Q}) \to H^1(G_\mathbb{Q}, E[p]) \to \bigoplus_v \frac{H^1(G_v, E[p])}{\mathrm{im}(\kappa_v)}. \]
- Đối ngẫu Selmer: Poitou--Tate cho “dãy đối ngẫu Selmer”: $\mathrm{Sel}$ và $\mathrm{Sel}^*$ (Selmer đối ngẫu, với điều kiện cục bộ đối ngẫu) liên hệ qua:
\[ 0 \to \mathrm{Sha} \to \mathrm{coker}(\text{cục bộ}) \to \mathrm{Sel}^{*\vee} \to \cdots \]Đây là công cụ then chốt trong chứng minh Kolyvagin: chặn $\mathrm{Sel}$ bằng cách chặn $\mathrm{Sel}^*$ (dễ hơn nhờ Euler system).
- Skinner--Urban: Chứng minh phỏng đoán chính Iwasawa bởi Skinner--Urban sử dụng sâu sắc dãy Poitou--Tate trên tháp cyclotomic $\mathbb{Q}_\infty/\mathbb{Q}$. Đối ngẫu cục bộ--toàn cục “ở mọi tầng” cho phép xây dựng module Iwasawa và chứng minh đẳng thức chuỗi đặc trưng.
- Ghép đôi Cassels--Tate: Ghép đôi $\mathrm{Sha} \times \mathrm{Sha} \to \mathbb{Q}/\mathbb{Z}$ (dẫn đến $|\mathrm{Sha}| = \square$) được xây dựng từ dãy Poitou--Tate. Tức “$|\mathrm{Sha}|$ bình phương” là hệ quả trực tiếp của đối ngẫu cục bộ--toàn cục.
Định nghĩa
- $M^*(1) = \mathrm{Hom}(M, \mu)$ là twist đối ngẫu Tate (với $\mu$ = nhóm các căn đơn vị),
- $\mathrm{inv}_v: H^2(G_v, \overline{K}_v^\times) \xrightarrow{\sim} \mathbb{Q}/\mathbb{Z}$ là bất biến cục bộ (local invariant) từ lý thuyết trường lớp cục bộ.
Ghép đôi được xây từ cup product:
Ví dụ
2. Ảnh Kummer: Nhóm $E(\mathbb{Q}_p)/pE(\mathbb{Q}_p)$ nhúng vào $H^1(G_{\mathbb{Q}_p}, E[p])$ qua ánh xạ Kummer $\kappa_p$. Tính chất quan trọng:
3. Orthogonal complement: Nếu gọi $L_v = \mathrm{im}(\kappa_v) \subset H^1(G_v, E[p])$, thì $L_v = L_v^\perp$ (tự đối ngẫu). Điều kiện Selmer “nằm trong $L_v$ tại mọi $v$” tương đương “trực giao với $L_v$ tại mọi $v$” --- đây là lý do Selmer “tự đối ngẫu”.
Ý nghĩa trực giác
- Hình dung: Tại mỗi vị trí $v$, ghép đôi Tate đo “khoảng cách” giữa hai lớp cohomology cục bộ. Nếu ghép đôi bằng 0, hai lớp “tương thích”; nếu khác 0, chúng “xung đột”.
- Analogy: Giống tích vô hướng trong không gian véctơ. Ghép đôi Tate cho $H^1$ cục bộ cấu trúc “không gian tuyến tính có tích vô hướng”. Nhóm Selmer là “không gian con đẳng hướng” --- nơi tích vô hướng triệt tiêu.
- Từ cục bộ sang toàn cục: Khi “ghép” tất cả ghép đôi Tate cục bộ $\langle \cdot, \cdot \rangle_v$ lại, ta được dãy Poitou--Tate. “Luật tích” $\sum_v \langle x, y \rangle_v = 0$ (tương tự luật thặng dư bậc hai) ràng buộc thông tin cục bộ thành toàn cục.
Liên hệ với giả thuyết Birch--Dyer
- Định nghĩa Selmer: Điều kiện cục bộ trong định nghĩa Selmer --- “lớp $c \in H^1(G_\mathbb{Q}, E[p])$ sao cho $c|_{G_v} \in \mathrm{im}(\kappa_v)$ cho mọi $v$” --- tương đương với “$c$ trực giao với tất cả lớp cục bộ” dưới ghép đôi Tate.
- Chặn Selmer: Kolyvagin và Kato chặn Selmer bằng cách tìm phần tử $z$ sao cho $\langle z, c \rangle_v \neq 0$ cho đủ nhiều $c$ --- “loại bỏ” các phần tử Selmer bằng ghép đôi.
- Ghép đôi Cassels--Tate: Ghép đôi $\mathrm{Sha} \times \mathrm{Sha} \to \mathbb{Q}/\mathbb{Z}$ (suy ra $|\mathrm{Sha}| = \square$) được xây từ tổng các ghép đôi Tate cục bộ: $\langle x, y \rangle_{\mathrm{CT}} = \sum_v \langle x_v, y_v \rangle_v$ trên dãy Poitou--Tate.
Định nghĩa
Định lý Minkowski: Cho $\Lambda \subset \mathbb{R}^n$ lưới với thể tích cơ bản $\mathrm{vol}(\Lambda)$, và $S \subset \mathbb{R}^n$ tập lồi đối xứng tâm. Nếu:
Trong ngữ cảnh hiện đại (Bhargava), hình học của số được mở rộng: thay vì đếm điểm lưới trong một tập, ta đếm quỹ đạo (orbits) của hành động nhóm trên lưới. Cụ thể:
- Cho $G$ nhóm (ví dụ $\mathrm{GL}_2(\mathbb{Z})$) tác động trên không gian véctơ $V$ (ví dụ các dạng nhị phần),
- Đếm quỹ đạo $G \backslash V(\mathbb{Z})$ --- tương ứng với đối tượng số học (lớp đẳng cấu của dạng).
Ví dụ
2. Bhargava (2004, Fields Medal 2014): Thay dạng bậc hai bằng bậc cao hơn:
| Dạng | Nhóm tác động | Tham số hóa |
|---|---|---|
| Nhị phần bậc 4 | $\mathrm{GL}_2(\mathbb{Z})$ | $\mathrm{Sel}_2(E)$ |
| Khối nhị phần bậc 3 | $\mathrm{GL}_3(\mathbb{Z}) \times \mathrm{GL}_3(\mathbb{Z})$ | $\mathrm{Sel}_3(E)$ |
| Cặp dạng khối bậc 2 | $\mathrm{GL}_2(\mathbb{Z}) \times \mathrm{GL}_4(\mathbb{Z})$ | $\mathrm{Sel}_4(E)$ |
| Dạng bậc 5, $5 \times 5$ | $\mathrm{GL}_5(\mathbb{Z})$ | $\mathrm{Sel}_5(E)$ |
Mỗi quỹ đạo ↔ phần tử Selmer. Đếm quỹ đạo bằng hình học của số → trung bình Selmer!
3. Kết quả then chốt: Bhargava--Shankar (2010--2015) chứng minh:
Ý nghĩa trực giác
- Hình dung: Bạn có lưới (grid) trong không gian, và muốn đếm bao nhiêu điểm lưới nằm trong một vùng. Minkowski nói: nếu vùng đủ lớn, chắc chắn có điểm. Bhargava nói: ta có thể đếm chính xác trung bình bao nhiêu điểm, và mỗi điểm ứng với phần tử Selmer.
- Tại sao đột phá: Trước Bhargava, không ai biết cách tính trung bình $|\mathrm{Sel}_n|$ vì không có “không gian tham số” tốt. Bhargava tìm ra tham số hóa invariant-theoretic: phần tử Selmer ↔ quỹ đạo dạng đa thức ↔ điểm lưới. Khi đó, đếm trung bình trở thành bài toán thể tích!
- Hệ quả: Trung bình $|\mathrm{Sel}_n|$ hữu hạn $\Rightarrow$ “đa số” đường cong có hạng thấp. Kết hợp với Skinner--Zhang: $\geq 66.48\%$ đường cong elliptic thỏa BSD.
Liên hệ với giả thuyết Birch--Dyer
- 66.48%: Bhargava--Skinner--Zhang (2014) kết hợp: (a) $\mathrm{avg}|\mathrm{Sel}_5| = 6$ (Bhargava--Shankar, hình học số), (b) Kolyvagin $+ $ Gross--Zagier (hạng giải tích $\leq 1 \Rightarrow$ BSD), (c) Skinner (converse: BSD $\Rightarrow$ hạng giải tích), để kết luận: ít nhất $66.48\%$ đường cong elliptic trên $\mathbb{Q}$ thỏa BSD.
- Chặn hạng trung bình: $\mathrm{avg}|\mathrm{Sel}_2| = 3$ suy ra $\mathrm{avg\;rank}(E(\mathbb{Q})) \leq 1.5$. Sử dụng $\mathrm{Sel}_5$: $\mathrm{avg\;rank} \leq 0.885$. Điều này hỗ trợ phỏng đoán Goldfeld (50% hạng 0, 50% hạng 1, hạng $\geq 2$ mật độ 0).
- Phương pháp mới hoàn toàn: Trước Bhargava, bằng chứng cho BSD dùng phương pháp “analytic” (hàm $L$, Euler system). Bhargava mở hướng “algebraic/geometric”: đếm bằng lưới, không cần hàm $L$ trực tiếp.
Định nghĩa
Liên hệ với đường cong elliptic: Mỗi dạng nhị phần bậc bốn $f$ có đường cong đồng hành:
Ví dụ
2. Tham số hóa Selmer: Bhargava--Shankar thiết lập tương ứng 1-1:
3. Đếm: Sử dụng hình học của số (Minkowski-style), Bhargava--Shankar đếm:
Ý nghĩa trực giác
- Hình dung: Nhóm Selmer rất trừu tượng (sống trong Galois cohomology). Bhargava “hiện thực hóa” nó: mỗi phần tử Selmer ↔ đường cong $y^2 = f(x, 1)$ với $f$ dạng bậc 4 ↔ “vật thể hình học” mà ta có thể đếm.
- Tại sao bậc 4?: Phần tử 2-Selmer tương ứng 2-covering (phủ bậc 2) của $E$. Phủ bậc 2 có phương trình tự nhiên $y^2 = f_4(x)$ (bậc 4) hoặc $y^2 = f_3(x)$ (bậc 3). Birch--Swinnerton-Dyer (1963) đã nhận ra điều này; Bhargava biến nó thành công cụ đếm.
- Paradigm mới: Trước Bhargava: Selmer → Galois cohomology → rất khó tính. Sau Bhargava: Selmer → dạng đa thức → đếm quỹ đạo bằng thể tích → kết quả trung bình chính xác.
Liên hệ với giả thuyết Birch--Dyer
- $\mathrm{avg}|\mathrm{Sel}_2| = 3$: Kết quả chính của Bhargava--Shankar. Hệ quả: $\mathrm{avg\;rank}(E(\mathbb{Q})) \leq \mathrm{avg}|\mathrm{Sel}_2| - 1 = 2$ (thô), tinh chỉnh: $\leq 1.5$.
- “Đa số hạng thấp”: Từ $\mathrm{avg}|\mathrm{Sel}_2| = 3$ suy ra: ít nhất $\frac{1}{3}$ đường cong có $|\mathrm{Sel}_2| = 1$, tức $\mathrm{rk} = 0$ và $\mathrm{Sha}[2] = 0$. Kết hợp Skinner: các đường cong này thỏa BSD.
- Tham số hóa là then chốt: Không có tham số hóa “Selmer ↔ dạng nhị phần bậc 4”, ta không thể đếm Selmer bằng hình học số --- và kết quả 66.48% sẽ không tồn tại.
Định nghĩa
Nhóm $\mathrm{SL}_3(\mathbb{Z})$ tác động trên không gian dạng khối bậc 3 bằng thay biến. Bhargava--Shankar thiết lập:
Cụ thể hơn, mỗi phần tử 3-Selmer ứng với 3-covering: đường cong trong $\mathbb{P}^2$ cho bởi $f(x,y,z) = 0$ (đường cong phẳng genus 1 bậc 3), là torsor cho $E$ với “giai đoạn” (period) chia hết cho 3.
Ví dụ
2. So sánh tham số hóa:
| $n$-Selmer | Dạng đa thức | Số biến | Bậc |
|---|---|---|---|
| $\mathrm{Sel}_2$ | Nhị phần bậc 4 | 2 | 4 |
| $\mathrm{Sel}_3$ | Khối bậc 3 | 3 | 3 |
| $\mathrm{Sel}_4$ | Cặp dạng khối bậc 2 | 4 | 2 |
| $\mathrm{Sel}_5$ | Dạng bậc 5 đặc biệt | 5 | 5 |
Quy luật: $n$-covering sống trong $\mathbb{P}^{n-1}$ (không gian xạ ảnh chiều $n-1$) với bậc $n$ (khi $n = 2$: siêu mặt bậc 2 trong $\mathbb{P}^1$ = bậc 4 một chiều).
3. Kết quả: $\mathrm{avg}|\mathrm{Sel}_3(E)| = 4 = 1 + 3 = \sigma(3)$ (tổng ước của 3). Suy ra: ít nhất $\frac{5}{6}$ đường cong elliptic có $3$-Selmer rank $\leq 1$.
Ý nghĩa trực giác
- Hình dung: Phần tử 2-Selmer ↔ đường cong phẳng “đôi phủ” (2 tờ). Phần tử 3-Selmer ↔ đường cong phẳng bậc 3 (cubic) trong $\mathbb{P}^2$ --- ta có thể “vẽ” nó! Đường cong cubic phẳng là đối tượng hình học quen thuộc.
- Từ Selmer đến hình học: Nếu đường cong cubic $f(x,y,z) = 0$ có điểm hữu tỉ, nó đẳng cấu với $E$ (Jacobian) → phần tử Selmer tầm thường. Nếu không có điểm hữu tỉ nhưng có điểm cục bộ ở mọi nơi → phần tử $\mathrm{Sha}[3]$.
- Đếm cubics: Bhargava biến bài toán “đếm phần tử 3-Selmer” thành “đếm đường cong cubic phẳng có điểm cục bộ ở mọi nơi” --- bài toán có thể tấn công bằng kỹ thuật đếm điểm lưới (hình học số).
Liên hệ với giả thuyết Birch--Dyer
- $\mathrm{avg}|\mathrm{Sel}_3| = 4$: Kết hợp $\mathrm{avg}|\mathrm{Sel}_2| = 3$: hạng trung bình $\leq \min(2, 3) - 1$. Tinh chỉnh: $\mathrm{avg\;rank} \leq 7/6 \approx 1.17$.
- Hỗ trợ Goldfeld: Kết quả trung bình Selmer nhỏ ủng hộ phỏng đoán Goldfeld (50% hạng 0, 50% hạng 1). Nếu nhiều đường cong có hạng $\geq 2$, trung bình Selmer phải lớn hơn --- nhưng thực tế nó nhỏ.
- Bổ sung cho Bhargava--Skinner--Zhang: Kết hợp $\mathrm{Sel}_2, \mathrm{Sel}_3, \mathrm{Sel}_5$ cho ước lượng tối ưu: ít nhất $66.48\%$ đường cong thỏa BSD.
Định nghĩa
Ý tưởng cốt lõi: thay vì nghiên cứu trường số $K$ đơn lẻ, ta xét tháp vô hạn:
Kết quả nền tảng của Iwasawa (1959): cho $K_\infty / K$ tháp cyclotomic, gọi $p^{e_n}$ là lũy thừa $p$ chính xác chia số lớp $h_n = h(K_n)$. Khi đó:
Ví dụ
Phỏng đoán Greenberg: cho tháp cyclotomic trên trường Abel hoàn toàn thực, $\mu = \lambda = 0$ --- tức phần $p$-primary của nhóm lớp ổn định (không tăng).
2. Đường cong elliptic: Lấy $E: y^2 = x^3 - x$ (conductor 32), $p = 5$. Xét nhóm Selmer $\mathrm{Sel}_{5^\infty}(E / \mathbb{Q}(\zeta_{5^n})^+)$ khi $n$ tăng. Lý thuyết Iwasawa mô tả “giới hạn” $\varprojlim \mathrm{Sel}_{5^\infty}(E / K_n)$ như module trên đại số Iwasawa $\Lambda$.
3. So sánh cổ điển vs hiện đại:
| Cổ điển (nhóm lớp) | Hiện đại (EC) | |
|---|---|---|
| Module | $\varprojlim \mathrm{Cl}(K_n)[p^\infty]$ | $\varprojlim \mathrm{Sel}_{p^\infty}(E/K_n)$ |
| Bất biến $\lambda$ | Tốc độ tăng nhóm lớp | Tốc độ tăng Selmer |
| Liên hệ với $L$ | Hàm $L$ $p$-adic (Kubota--Leopoldt) | Hàm $L_p(E, s)$ (Mazur--SD) |
Ý nghĩa trực giác
- Hình dung: Thay vì “chụp ảnh” nhóm lớp (hay Selmer) tại một trường cố định, Iwasawa “quay phim” khi trường lớn dần. Bộ phim $p$-adic này tiết lộ “xu hướng” mà ảnh đơn lẻ không thấy được.
- Analogy giải tích: Hàm $f(x)$ khó hiểu tại một điểm. Nhưng chuỗi Taylor $\sum a_n x^n$ nắm bắt hành vi “toàn bộ” lân cận 0. Iwasawa theory làm tương tự: module Iwasawa “nắm bắt” hành vi nhóm lớp/Selmer trên toàn bộ tháp, không chỉ một tầng.
- Tại sao hữu dụng: Đối tượng “ở mỗi tầng” (nhóm lớp $\mathrm{Cl}(K_n)$, Selmer $\mathrm{Sel}(E/K_n)$) rất phức tạp và khó tính. Nhưng “giới hạn” (module Iwasawa $X$) lại có cấu trúc đại số tốt: nó là module hữu hạn sinh trên $\Lambda$ --- vành Abel, Noetherian.
Liên hệ với giả thuyết Birch--Dyer
- Phỏng đoán chính Iwasawa (IMC): Phỏng đoán rằng hai đối tượng Iwasawa --- “phía đại số” (module Selmer) và “phía giải tích” (hàm $L$ $p$-adic) --- bằng nhau (cùng chuỗi đặc trưng). Đây là “phiên bản Iwasawa” của BSD.
- IMC $\Rightarrow$ BSD (phần $p$): Nếu IMC đúng tại $p$, thì: $L(E,1) \neq 0 \Rightarrow \mathrm{Sel}_{p^\infty}$ hữu hạn (BSD cho hạng 0, phần $p$). Kato chứng minh “một nửa” IMC; Skinner--Urban chứng minh “nửa còn lại”.
- BSD mạnh phần $p$: Kết hợp Kato + Skinner--Urban: IMC đầy đủ cho $E/\mathbb{Q}$ (dưới giả thiết kỹ thuật). Suy ra công thức BSD mạnh cho $p$-part: $\mathrm{ord}_p(L^*(E,1)/\Omega_E \mathrm{Reg}_E) = \mathrm{ord}_p(|\mathrm{Sha}| \cdot \prod c_p / |E(\mathbb{Q})_{\mathrm{tors}}|^2)$.
Định nghĩa
Đồng cấu Weierstrass: Đặt $T = \gamma - 1$. Khi đó:
Mỗi module hữu hạn sinh trên $\Lambda$ có “pseudo-isomorphism” (đồng cấu với hạt nhân và đối hạt nhân hữu hạn) tới dạng chuẩn:
Ví dụ
2. Module Iwasawa cổ điển: Gọi $X = \varprojlim \mathrm{Cl}(K_n)[p^\infty]$ (giới hạn nghịch nhóm lớp $p$-primary). $X$ là module hữu hạn sinh xoắn trên $\Lambda$. Bất biến Iwasawa:
- $\mu = \sum m_i$ (bất biến $\mu$, Ferrero--Washington: $\mu = 0$ cho tháp cyclotomic trên $\mathbb{Q}$),
- $\lambda = \sum \deg(f_j) \cdot n_j$ (bất biến $\lambda$),
- Chuỗi đặc trưng $\mathrm{char}_\Lambda(X)$ nắm bắt toàn bộ “dáng điệu tiệm cận”.
3. Cho đường cong elliptic: $X_E = \varprojlim \mathrm{Sel}_{p^\infty}(E/K_n)^\vee$ (đối ngẫu Pontryagin của giới hạn thuận Selmer). Phỏng đoán: $X_E$ là module xoắn. Chuỗi đặc trưng $\mathrm{char}_\Lambda(X_E)$ là “phía đại số” của IMC.
Ý nghĩa trực giác
- Hình dung: $\mathbb{Z}_p[[T]]$ giống “đa thức với hệ số $p$-adic”. Module trên $\Lambda$ giống “không gian véctơ” nhưng trên “chuỗi lũy thừa $p$-adic”. Chuỗi đặc trưng giống “đa thức đặc trưng” --- nắm bắt “kích thước” và “dáng điệu” của module.
- Analogy: Trong đại số tuyến tính, ma trận $A$ trên $\mathbb{C}$ có đa thức đặc trưng $\det(TI - A)$, nắm bắt trị riêng. Module trên $\Lambda$ có chuỗi đặc trưng, nắm bắt “trị riêng $p$-adic” --- tức zero của hàm $L$ $p$-adic!
- Tại sao $T = \gamma - 1$: Khi “chuyên biệt hóa” $T = \zeta - 1$ (với $\zeta$ căn bậc $p^n$ đơn vị), ta “nhìn” module ở tầng $n$. Chuỗi lũy thừa “nội suy” hành vi ở mọi tầng --- giống hàm giải tích nội suy giá trị rời rạc.
Liên hệ với giả thuyết Birch--Dyer
- IMC = đẳng thức chuỗi đặc trưng: Phỏng đoán chính Iwasawa phát biểu:
\[ \mathrm{char}_\Lambda(X_E) = (L_p(E, T)) \quad \text{trong } \Lambda, \]tức chuỗi đặc trưng “phía đại số” (module Selmer) bằng “phía giải tích” (hàm $L$ $p$-adic). Kato chứng minh $(L_p) \subset \mathrm{char}_\Lambda(X_E)$; Skinner--Urban chứng minh phần ngược.
- “Chuyên biệt hóa” $\Rightarrow$ BSD: Đặt $T = 0$ (tức $\gamma = 1$, tầng đáy), IMC suy ra:
\[ |\mathrm{Sel}_{p^\infty}(E/\mathbb{Q})| \cdot (\text{Tamagawa}) = |L_p(E, 0)| \cdot (\text{chu kỳ}), \]chính là BSD mạnh phần $p$ cho hạng 0!
- Module structure: Hạng của $X_E$ trên $\Lambda$ bằng 0 khi và chỉ khi $E(\mathbb{Q})$ hữu hạn (hạng 0). Bất biến $\lambda$ đo “tốc độ tăng” hạng dọc tháp. Đây là cách Iwasawa “nhìn thấy” hạng Mordell--Weil qua “thấu kính $p$-adic”.
Định nghĩa
Cụ thể hơn, xét ký tự cyclotomic:
Tính chất:
- $K_\infty^{\mathrm{cyc}} / K$ không phân nhánh ngoại trừ tại các vị trí trên $p$.
- Mỗi trường số $K$ có duy nhất một $\mathbb{Z}_p$-mở rộng cyclotomic.
- Phỏng đoán Leopoldt (đã chứng minh cho trường Abel): $K$ có đúng $r_2 + 1$ mở rộng $\mathbb{Z}_p$ độc lập ($r_2$ = số nhúng phức), và cyclotomic là một trong số đó.
Ví dụ
2. Phân nhánh: $\mathbb{Q}_\infty^{\mathrm{cyc}}$ chỉ phân nhánh tại 5. Tại $\ell \neq 5$: $\ell$ không phân nhánh (có thể tách hoặc trơ). Tại $\ell = 5$: phân nhánh hoàn toàn.
3. Nhóm lớp: Ferrero--Washington (1979): cho tháp cyclotomic trên $\mathbb{Q}$, bất biến $\mu = 0$ (phần $p$-primary nhóm lớp không tăng “quá nhanh”). Bất biến $\lambda$: Vandiver's conjecture nói $\lambda = 0$ cho $p$ chính quy (regular prime) --- đã kiểm nghiệm đến $p < 163 \times 10^6$.
Ý nghĩa trực giác
- Hình dung: “Không gian” các mở rộng Galois rất lớn. $\mathbb{Z}_p$-mở rộng cyclotomic là “đường thẳng” ưu tiên nhất: nó đến từ căn đơn vị, tự nhiên nhất, và “mang nhiều thông tin số học nhất” (theo kinh nghiệm).
- Tại sao cyclotomic?: Trong số tất cả $\mathbb{Z}_p$-mở rộng, cyclotomic có lợi thế: liên hệ trực tiếp với ký tự cyclotomic $\chi_{\mathrm{cyc}}$ --- thứ điều khiển hành động Galois trên $\mu_{p^\infty}$. Hàm $L$ $p$-adic “sống” tự nhiên trên $\Gamma = \mathbb{Z}_p$ cyclotomic.
- Analogy: Giống hàm $e^{it}$ trên $\mathbb{R}$ --- “đường tròn tự nhiên nhất” trong $\mathbb{C}^\times$. $\mathbb{Z}_p$-mở rộng cyclotomic là “đường thẳng tự nhiên nhất” trong “không gian mở rộng Galois $p$-adic”.
Liên hệ với giả thuyết Birch--Dyer
- Nền tảng cho IMC: Phỏng đoán chính Iwasawa cho đường cong elliptic phát biểu trên $\mathbb{Q}_\infty^{\mathrm{cyc}} / \mathbb{Q}$. Module Selmer $X_E = \varprojlim \mathrm{Sel}_{p^\infty}(E / \mathbb{Q}_n)^\vee$ là module trên $\Lambda = \mathbb{Z}_p[[\mathrm{Gal}(\mathbb{Q}_\infty^{\mathrm{cyc}}/\mathbb{Q})]]$.
- Hàm $L$ $p$-adic: $L_p(E, s)$ được xây dựng như phần tử trong $\Lambda$ (hoặc phân thức trường): nó “sống” trên nhóm $\Gamma$ cyclotomic, và “chuyên biệt hóa” $s = k$ cho giá trị $L(E, \chi^k)$ (twist bởi lũy thừa ký tự cyclotomic).
- Hàm $L$ antianalytic: Trong BSD $p$-adic, ta xét “hàm $L$ $p$-adic antianalytic” trên $\Gamma$ --- tích phân trên nhóm $\mathbb{Z}_p$-mở rộng. Đây là cầu nối Iwasawa--BSD.
Định nghĩa
Hai module Iwasawa chính:
1. Module nhóm lớp (cổ điển):
2. Module Selmer (cho EC):
Định lý cấu trúc (pseudo-isomorphism): Mọi module xoắn hữu hạn sinh $M$ trên $\Lambda$ có:
Ví dụ
2. $X_E$ cho $E: y^2 = x^3 - x$, $p = 5$: $E$ có CM bởi $\mathbb{Z}[i]$. Module Selmer $X_E$ trên $\Lambda$ có:
- $X_E$ là module xoắn (phỏng đoán, đã chứng minh khi $L(E,1) \neq 0$),
- $\mathrm{char}_\Lambda(X_E) = (g(T))$ với $g(T)$ đa thức liên quan đến $L_5(E, T)$,
- $\mu = 0$ (theo Kato cho hầu hết $p$).
3. Khi module không xoắn: Nếu $\mathrm{rk}(E(\mathbb{Q})) > 0$, thì $X_E$ có thể có “$\Lambda$-rank” $> 0$ (tức có thành phần tự do $\Lambda^r$). Phỏng đoán Mazur: $X_E$ xoắn khi $E$ có rút gọn tốt tại $p$. Greenberg mở rộng: $X_E$ xoắn khi $a_p \not\equiv 1 \pmod{p}$ (“ordinary” tốt).
Ý nghĩa trực giác
- Hình dung: Tại mỗi tầng $n$ của tháp, ta có “bức ảnh” (nhóm lớp hoặc Selmer tại $K_n$). Module Iwasawa “ghép” tất cả bức ảnh thành “bộ phim” --- một đối tượng đại số duy nhất mã hóa toàn bộ dãy.
- $\mu$ và $\lambda$: $\mu$ đo “thành phần $p$-lũy thừa” (có bao nhiêu “$p$” trong chuỗi đặc trưng). $\lambda$ đo “thành phần đa thức” (bậc của phần đa thức). Hình dung: $p^{e_n} = $ kích thước phần $p$-primary, thì $e_n \approx \mu p^n + \lambda n$.
- Tại sao pseudo-isomorphism?: Module Iwasawa chứa “lỗi hữu hạn” (hạt nhân/đối hạt nhân hữu hạn của pseudo-isomorphism). Chúng không ảnh hưởng hành vi tiệm cận --- giống “hằng số” trong $O$-notation. Chỉ chuỗi đặc trưng (“leading term”) quan trọng.
Liên hệ với giả thuyết Birch--Dyer
- $X_E$ = “phía đại số” IMC: Module Selmer Iwasawa $X_E$ chứa mọi thông tin về Selmer, Sha, và hạng dọc tháp. Chuỗi đặc trưng $\mathrm{char}_\Lambda(X_E)$ là đối tượng “đại số” trong IMC.
- Xoắn ↔ hạng 0: $X_E$ xoắn (tức $\Lambda$-rank $= 0$) tương đương: $E(K_n)$ có hạng bị chặn cho mọi $n$. Đây là “phiên bản Iwasawa” của “hạng hữu hạn”.
- Chuyên biệt hóa: “Đặt $T = 0$” trong $\mathrm{char}_\Lambda(X_E)$ cho thông tin về $\mathrm{Sel}_{p^\infty}(E/\mathbb{Q})$ --- tức BSD cho trường cơ sở $\mathbb{Q}$. IMC “nâng” BSD lên toàn bộ tháp.
Định nghĩa
Phần tử sinh $f_M(T) = p^{\mu} \cdot \prod f_j(T)^{n_j}$ gọi là đa thức đặc trưng (characteristic power series). Tính chất:
- Nếu $M$ hữu hạn, thì $\mathrm{char}_\Lambda(M) = (p^a)$ cho $a$ nào đó (“chỉ có phần $p$-lũy thừa”).
- Zero của $f_M(T)$ (trong $\overline{\mathbb{Q}}_p$) mã hóa “trị riêng” quan trọng.
- $\mathrm{char}_\Lambda(M_1 \oplus M_2) = \mathrm{char}_\Lambda(M_1) \cdot \mathrm{char}_\Lambda(M_2)$ (nhân tính).
Ví dụ
2. Module nhóm lớp Iwasawa: Cho $K = \mathbb{Q}(\sqrt{-23})$, $p = 3$. Module $X^{\mathrm{cl}}$ có $\mu = 0$, $\lambda = 1$:
3. Cho đường cong elliptic: $E: y^2 + y = x^3 - x$ (conductor 37), $p = 5$. Module $X_E$ có $\mu = 0$. Chuỗi đặc trưng $\mathrm{char}_\Lambda(X_E) = (g_E(T))$ với $g_E(T)$ liên quan trực tiếp đến hàm $L$ $5$-adic $L_5(E, T)$.
Ý nghĩa trực giác
- Hình dung: Giống đa thức đặc trưng $\det(TI - A)$ nắm bắt “bản chất” của ma trận $A$ (trị riêng, Jordan form), chuỗi đặc trưng $f_M(T)$ nắm bắt “bản chất” của module Iwasawa.
- Zero = thông tin số học: Zero $\alpha$ của $f_M(T)$ ứng với “ký tự Galois $\chi$” (qua $\chi(\gamma) = 1 + \alpha$) mà tại đó “có hiện tượng số học bất thường” (nhóm lớp phi tầm thường, Selmer phi tầm thường).
- Nhân tính: $\mathrm{char}(M_1 \oplus M_2) = \mathrm{char}(M_1) \cdot \mathrm{char}(M_2)$ giống “đa thức đặc trưng của tổng trực tiếp = tích đa thức đặc trưng”. Điều này cho phép “phân tích” module phức tạp thành các thành phần đơn giản.
Liên hệ với giả thuyết Birch--Dyer
- IMC = đẳng thức hai chuỗi đặc trưng: Phỏng đoán chính Iwasawa:
\[ \mathrm{char}_\Lambda(X_E) = (L_p(E, T)) \](chuỗi đặc trưng module Selmer = hàm $L$ $p$-adic). Đây là phát biểu chính xác nhất của “đại số = giải tích” trong lý thuyết Iwasawa.
- Kato (một nửa): Kato chứng minh $(L_p(E, T)) \subset \mathrm{char}_\Lambda(X_E)$ --- hàm $L$ “chia” chuỗi đặc trưng. Tức “phía giải tích chặn phía đại số”.
- Skinner--Urban (nửa còn lại): Chứng minh $\mathrm{char}_\Lambda(X_E) \subset (L_p(E, T))$ (dưới giả thiết). Kết hợp: $\mathrm{char}_\Lambda(X_E) = (L_p)$ --- IMC đầy đủ → BSD mạnh phần $p$.
Định nghĩa
Phía đại số: Module Selmer Iwasawa $X_E = (\varinjlim_n \mathrm{Sel}_{p^\infty}(E/\mathbb{Q}_n))^\vee$ có chuỗi đặc trưng $\mathrm{char}_\Lambda(X_E)$.
Phía giải tích: Hàm $L$ $p$-adic $L_p(E, T) \in \Lambda \otimes \mathbb{Q}_p$ (Mazur--Swinnerton-Dyer, Amice--Vélu, Višik).
IMC: $\mathrm{char}_\Lambda(X_E) = (L_p(E, T))$ trong $\Lambda \otimes \mathbb{Q}_p$.
Lịch sử chứng minh:
- Mazur--Wiles (1984): IMC cổ điển cho trường cyclotomic (nhóm lớp, không EC).
- Rubin (1991): IMC cho EC có CM, sử dụng đơn vị elliptic.
- Kato (2004): Một nửa --- $(L_p) \subset \mathrm{char}_\Lambda(X_E)$ --- cho mọi EC$/\mathbb{Q}$, $p$ tốt.
- Skinner--Urban (2014): Nửa còn lại --- $\mathrm{char}_\Lambda(X_E) \subset (L_p)$ --- cho $p$ lẻ, $E$ ordinary tại $p$, $\bar{\rho}_{E,p}$ bất khả quy.
Ví dụ
2. $E: y^2 = x^3 - x$ (conductor 32), $p = 3$: $E$ có CM, $a_3 = 0$ (supersingular tại 3). Rubin (1991) chứng minh IMC bằng phương pháp đơn vị elliptic (không cần Skinner--Urban).
3. So sánh IMC cổ điển và EC:
| Cổ điển | EC | |
|---|---|---|
| Module | $X^{\mathrm{cl}}$ (nhóm lớp) | $X_E$ (Selmer) |
| Hàm $L$ | $L_p(\chi, s)$ (Kubota--Leopoldt) | $L_p(E, s)$ (Mazur--SD) |
| Chứng minh | Mazur--Wiles (1984) | Kato + Skinner--Urban |
Ý nghĩa trực giác
- Hình dung: Công thức số lớp Dirichlet nói $h_K \cdot R_K = $ giá trị hàm $L$ (nhân hằng số). IMC nói cùng điều nhưng “ở mọi tầng cùng lúc”: chuỗi đặc trưng (chứa tất cả $h_n, R_n$) = hàm $L$ $p$-adic (chứa tất cả giá trị $L$).
- Tại sao “Main”: IMC là kết quả mạnh nhất trong lý thuyết Iwasawa --- từ nó suy ra hầu hết kết quả khác (BSD phần $p$, Sha hữu hạn, công thức Tamagawa $p$-adic).
- Hai hướng: “$(L_p) \subset \mathrm{char}(X)$” (Kato) = “giải tích chặn đại số” --- Euler system bên. “$\mathrm{char}(X) \subset (L_p)$” (Skinner--Urban) = “đại số chặn giải tích” --- dạng tự đẳng cấu bên. Hai hướng dùng kỹ thuật hoàn toàn khác nhau.
Liên hệ với giả thuyết Birch--Dyer
- IMC $\Rightarrow$ BSD (phần $p$, hạng 0): Nếu $L(E,1) \neq 0$, thì $L_p(E, 0) \neq 0$ (ngoại trừ exceptional zero). IMC suy ra $X_E$ hữu hạn $\Rightarrow$ $\mathrm{Sel}_{p^\infty}(E/\mathbb{Q})$ hữu hạn $\Rightarrow$ $\mathrm{rk} = 0$ và $\mathrm{Sha}[p^\infty]$ hữu hạn. Hơn nữa, $\mathrm{ord}_p(|\mathrm{Sha}[p^\infty]|) = $ giá trị tường minh từ $L_p$.
- IMC $\Rightarrow$ BSD (phần $p$, hạng 1): Kết hợp IMC với công thức Gross--Zagier và Kolyvagin: nếu $\mathrm{ord}_{s=1} L(E,s) = 1$, thì $\mathrm{rk} = 1$ và BSD mạnh phần $p$ đúng.
- Giới hạn hiện tại: IMC chưa nói gì về hạng $\geq 2$ (vì $L_p$ triệt tiêu bậc $\geq 2$ rất khó phân tích). Đây là rào cản lớn nhất cho BSD trong trường hợp hạng cao.
Định nghĩa
Cho mọi ký tự Dirichlet $\chi$ bậc $p^n$ (tức $\chi: (\mathbb{Z}/p^n\mathbb{Z})^\times \to \mathbb{C}_p^\times$):
- $\alpha$ là nghiệm đơn vị $p$-adic của $T^2 - a_p T + p = 0$ (Frobenius “tốt”),
- $\tau(\bar{\chi})$ là tổng Gauss,
- $\Omega_E^\pm$ là chu kỳ thực/ảo.
Phần tử “$s = 0$” (trivial character $\chi = 1$):
Ví dụ
Đạo hàm: $L_5'(E, 0) \neq 0$ --- tương tự $L'(E, 1) \neq 0$ (Gross--Zagier). Giá trị $L_5'(E, 0)$ liên hệ với logarit $p$-adic của điểm Heegner.
2. $E: y^2 = x^3 + 1$ (conductor 36), $p = 7$: $a_7 = -4$, $L(E,1) = \Omega_E / 3 \neq 0$. Nghiệm $\alpha$: $T^2 + 4T + 7 = 0$, $\alpha \approx -2 + \sqrt{-3}$. Tính:
3. Exceptional zero: $E: y^2 + y = x^3 + x^2$ (conductor 11), $p = 11$. Rút gọn nhân tách tại 11: $a_{11} = 1$, $\alpha = 1$. Khi đó $(1 - 1/\alpha) = 0$, nên $L_{11}(E, 0) = 0$ bất kể $L(E,1) \neq 0$! Đây là “exceptional zero” --- cần công thức Mazur--Tate--Teitelbaum bổ sung.
Ý nghĩa trực giác
- Hình dung: Hàm $L$ phức $L(E,s)$ sống trên $\mathbb{C}$ (biến $s$ phức). Hàm $L$ $p$-adic $L_p(E, s)$ sống trên $\mathbb{Z}_p$ (biến $s$ $p$-adic). Hai hàm “cùng gốc” --- chúng nội suy cùng giá trị đặc biệt $L(E, \chi, 1)$, nhưng “nhìn” bằng “kính” khác nhau.
- Tại sao cần bản $p$-adic: Hàm $L$ phức rất khó “nhìn” bằng đại số (nó siêu việt, không đa thức). Hàm $L$ $p$-adic sống trong $\Lambda$ --- vành đa thức hình thức --- nên có thể “so sánh đại số” với module Selmer. Đây là lý do IMC phát biểu được.
- “Nội suy” là gì?: Có vô hạn giá trị $L(E, \chi, 1)$ (một cho mỗi ký tự $\chi$). $L_p(E, s)$ là hàm duy nhất trên $\mathbb{Z}_p$ “đi qua” tất cả giá trị này (sau chuẩn hóa). Giống “đa thức nội suy qua vô hạn điểm” = “chuỗi lũy thừa hội tụ”.
Liên hệ với giả thuyết Birch--Dyer
- “Phía giải tích” của IMC: $L_p(E, T)$ là đối tượng “giải tích” (dù sống trong đại số Iwasawa). IMC nói nó bằng chuỗi đặc trưng “đại số” $\mathrm{char}(X_E)$.
- BSD $p$-adic: Phỏng đoán Mazur--Tate--Teitelbaum (1986): $\mathrm{ord}_{s=0} L_p(E, s) = \mathrm{rk}(E(\mathbb{Q}))$ (ngoại trừ exceptional zero, khi cộng thêm 1). Đây là “bản $p$-adic” của BSD yếu.
- BSD mạnh $p$-adic: Leading coefficient:
\[ \frac{L_p^{(r)}(E, 0)}{r!} = \frac{|\mathrm{Sha}| \cdot \mathrm{Reg}_p \cdot \prod c_p}{|E(\mathbb{Q})_{\mathrm{tors}}|^2} \cdot (\text{Euler factor tại } p), \]với $\mathrm{Reg}_p$ = regulator $p$-adic (thay regulator thực).
Định nghĩa
Cấu trúc: $\mathrm{Sel}_{p^\infty}(E/K) \cong (\mathbb{Q}_p/\mathbb{Z}_p)^r \oplus M$ với $r = \mathrm{rk}(E(K))$ và $M$ hữu hạn (= $\mathrm{Sha}[p^\infty]$ nếu $\mathrm{Sha}$ hữu hạn).
Trên tháp Iwasawa: Cho $K_\infty = \mathbb{Q}_\infty^{\mathrm{cyc}}$, nhóm Selmer Iwasawa:
Ví dụ
2. Hạng 1: $E: y^2 + y = x^3 - x$ (conductor 37). $E(\mathbb{Q}) \cong \mathbb{Z}$ (hạng 1). Tại $p = 5$:
3. Trên tháp: $X_E = \mathrm{Sel}_{5^\infty}(E/\mathbb{Q}_\infty^{\mathrm{cyc}})^\vee$ là module xoắn trên $\Lambda$ (theo Kato, vì $\mathrm{rk} = 1$ nhưng $r_{\mathrm{an}} = 1$). Chuỗi đặc trưng $\mathrm{char}(X_E)$ có $T$ là thừa số (phản ánh $L_5(E, 0) = 0$).
4. Selmer Bloch--Kato vs cổ điển: Nhóm Selmer Bloch--Kato $H^1_f(G_\mathbb{Q}, V_p(E))$ là $\mathbb{Q}_p$-không gian véctơ, chiều $= \mathrm{rk}(E(\mathbb{Q}))$ (nếu BSD đúng). Nó liên hệ: $H^1_f \otimes \mathbb{Q}_p/\mathbb{Z}_p \hookrightarrow \mathrm{Sel}_{p^\infty}$.
Ý nghĩa trực giác
- Hình dung: $E(\mathbb{Q})$ rất khó “nhìn” trực tiếp. Selmer $p$-adic “phóng đại” nó qua $p$: phần $(\mathbb{Q}_p/\mathbb{Z}_p)^r$ nắm bắt hạng, phần hữu hạn nắm bắt $\mathrm{Sha}[p^\infty]$. Như dùng kính lúp $p$-adic để “thấy” cấu trúc Mordell--Weil.
- Tại sao “giới hạn thuận”?: $\mathrm{Sel}_{p^n}$ nắm “thông tin modulo $p^n$”. Khi $n \to \infty$, ta “thấy” toàn bộ thông tin $p$-primary. Đây giống “hoàn chỉnh hóa $p$-adic”.
- Đối ngẫu Pontryagin: $\mathrm{Sel}_{p^\infty}$ rời rạc (co-finite type), $X_E = (\mathrm{Sel}_{p^\infty})^\vee$ compact (finite type). Hai cách nhìn cùng một đối tượng, chọn tùy tiện lợi.
Liên hệ với giả thuyết Birch--Dyer
- BSD phần $p$: BSD mạnh phần $p$ nói:
\[ \mathrm{ord}_p\left(\frac{L^{(r)}(E,1)}{r! \cdot \Omega_E \cdot \mathrm{Reg}_E}\right) = \mathrm{ord}_p\left(\frac{|\mathrm{Sha}| \cdot \prod c_p}{|E(\mathbb{Q})_{\mathrm{tors}}|^2}\right). \]Vế phải được “đọc” từ $\mathrm{Sel}_{p^\infty}$: $|\mathrm{Sha}[p^\infty]|$ = phần hữu hạn.
- Kato: Nếu $L(E,1) \neq 0$, Kato chứng minh $\mathrm{Sel}_{p^\infty}(E/\mathbb{Q})$ hữu hạn (cho $p$ đủ lớn). Đây là “$\mathrm{rk}_{\mathrm{an}} = 0 \Rightarrow \mathrm{rk} = 0$” --- một nửa BSD yếu.
- Module Iwasawa: $X_E = (\mathrm{Sel}_{p^\infty}(E/\mathbb{Q}_\infty))^\vee$ là đối tượng trung tâm trong IMC. Chuỗi đặc trưng $\mathrm{char}(X_E)$ “mã hóa” tất cả $|\mathrm{Sel}_{p^\infty}(E/\mathbb{Q}_n)|$ cho mọi tầng $n$.
Định nghĩa
Tháp cyclotomic trên $\mathbb{Q}$ (trường hợp cơ bản nhất): lấy $K = \mathbb{Q}$, $p$ lẻ, thì $K_n = \mathbb{Q}(\zeta_{p^{n+1}})^+$ (phần thực). Tại mỗi “tầng” $n$:
- $[K_n : K_{n-1}] = p$ (mỗi tầng là mở rộng bậc $p$),
- Chỉ phân nhánh tại $p$ (và có thể $\infty$),
- Bất biến số học (nhóm lớp, Selmer) được “theo dõi” qua các tầng.
Ví dụ
- $K_0 = \mathbb{Q}$,
- $K_1 = \mathbb{Q}(\cos(2\pi/9))$ (bậc 3 trên $\mathbb{Q}$),
- $K_2 = \mathbb{Q}(\cos(2\pi/27))$ (bậc 9 trên $\mathbb{Q}$),
- $K_n$ (bậc $3^n$ trên $\mathbb{Q}$).
2. Nhóm lớp dọc tháp: Cho $K = \mathbb{Q}(\sqrt{-23})$, $p = 3$. Tại trường cơ sở: $h_K = 3$. Dọc tháp 3-cyclotomic: $e_0 = 1, e_1 = 2, e_2 = 3, \ldots$ (tức $e_n = n + \nu$, $\lambda = 1$, $\mu = 0$). Nhóm lớp phần $3$-primary tăng tuyến tính.
3. Selmer dọc tháp: Cho $E: y^2 + y = x^3 - x$ (conductor 37), $p = 5$. Tại $K_0 = \mathbb{Q}$: $\mathrm{Sel}_{5^\infty} \cong \mathbb{Q}_5/\mathbb{Z}_5$ (hạng 1). Dọc tháp: Selmer “lớn lên” --- module Iwasawa $X_E$ mã hóa tốc độ.
Ý nghĩa trực giác
- Hình dung: Tháp cyclotomic như “tòa nhà vô hạn tầng”. Mỗi tầng là trường số lớn hơn. “Thang máy” (ánh xạ norm/restriction) cho phép di chuyển thông tin giữa các tầng.
- Tại sao “cyclotomic”?: Tháp đến từ căn bậc $p^n$ đơn vị $\zeta_{p^n}$ --- đối tượng “đơn giản nhất” trong lý thuyết số $p$-adic. Mọi tháp $\mathbb{Z}_p$ khác phức tạp hơn (anticyclotomic, trường lớp, v.v.).
- “Nhìn toàn cục”: Thay vì chỉ biết $\mathrm{Sel}(E/\mathbb{Q})$ (một tầng), tháp cho ta $\mathrm{Sel}(E/K_n)$ cho mọi $n$ --- “bộ phim” thay vì “bức ảnh”. Module Iwasawa nắm bắt toàn bộ bộ phim.
Liên hệ với giả thuyết Birch--Dyer
- Nền tảng IMC: Mọi công thức IMC phát biểu trên tháp cyclotomic: $\mathrm{char}_\Lambda(X_E) = (L_p(E))$ trên $K_\infty^{\mathrm{cyc}} / K$.
- “Descent”: IMC ở “tầng vô cực” suy ra kết quả ở “tầng đáy” $K = \mathbb{Q}$ qua “descent” (chuyên biệt hóa $T = 0$). Đây là cách IMC → BSD phần $p$.
- Tháp khác: Ngoài cyclotomic, có tháp anticyclotomic (dùng trong Gross--Zagier/Kolyvagin) và tháp trường lớp (dùng cho CM). Mỗi tháp cho góc nhìn BSD khác nhau.
Định nghĩa
BSD $p$-adic yếu: Nếu $E$ ordinary tại $p$:
BSD $p$-adic mạnh: Leading coefficient:
- $r = \mathrm{ord}_{s=0} L_p(E, s)$ (hạng $p$-adic),
- $\mathrm{Reg}_p(E)$ = regulator $p$-adic (thay regulator Néron--Tate bằng phiên bản $p$-adic dùng logarit hình thức),
- $e_p(E)$ = thừa số Euler $p$-adic (phụ thuộc loại rút gọn tại $p$).
Ví dụ
2. Hạng 1: $E: y^2 + y = x^3 - x$ (conductor 37), $p = 5$. $\mathrm{rk} = 1$, rút gọn tốt tại 5. BSD $p$-adic: $\mathrm{ord}_{s=0} L_5(E, s) = 1$. Leading coefficient $L_5'(E, 0)$ liên hệ logarit $p$-adic của sinh tử Mordell--Weil.
3. Exceptional zero: $E: y^2 + y = x^3 + x^2$ (11a3), $p = 11$. Rút gọn nhân tách. $\mathrm{rk} = 0$ nhưng $\mathrm{ord}_{s=0} L_{11}(E, s) = 1$ (thêm 1 zero ngoại lai). Leading coefficient:
Ý nghĩa trực giác
- Hình dung: BSD cổ điển liên hệ $L(E,s)$ (hàm phức) với số học. BSD $p$-adic liên hệ $L_p(E,s)$ (hàm $p$-adic) với số học. Cả hai “nói cùng câu chuyện” nhưng bằng “ngôn ngữ” khác nhau.
- Tại sao cần phiên bản $p$-adic?: BSD cổ điển rất khó chứng minh trực tiếp (hàm $L$ phức siêu việt). BSD $p$-adic “dễ tiếp cận hơn” vì hàm $L$ $p$-adic sống trong đại số Iwasawa --- nơi có nhiều công cụ đại số.
- IMC → BSD $p$-adic: Phỏng đoán chính Iwasawa suy ra BSD $p$-adic (cho phần $p$). Đây là con đường “gián tiếp” nhưng hiệu quả nhất hiện nay.
Liên hệ với giả thuyết Birch--Dyer
- BSD $p$-adic ⊃ BSD cổ điển (phần $p$): Nếu BSD $p$-adic mạnh đúng cho mọi $p$, suy ra BSD cổ điển đúng (modulo hữu hạn nhiều ngoại lệ). Trong thực tế, con đường Kato + Skinner--Urban chứng minh IMC → BSD $p$-adic → BSD phần $p$.
- Exceptional zero: Hiện tượng thuần túy $p$-adic (không có tương tự trong BSD cổ điển). Greenberg--Stevens (1993) chứng minh công thức $\mathcal{L}_p$ cho exceptional zero --- đây là kết quả tinh tế nhất trong BSD $p$-adic.
- Tiến triển: BSD $p$-adic đã được chứng minh hoàn toàn cho hạng 0 (khi $p$ ordinary, $\bar{\rho}$ bất khả quy), nhờ Kato--Skinner--Urban. Cho hạng 1: nhờ Gross--Zagier + Kolyvagin + IMC. Hạng $\geq 2$: hoàn toàn mở.
Định nghĩa
Mỗi phần tử $x \in \mathbb{Q}_p$ viết duy nhất dưới dạng khai triển $p$-adic:
Tính chất:
- $\mathbb{Q}_p$ là trường đặc số 0, hoàn chỉnh, không Archimedean.
- $\mathbb{Z}_p$ là vành định giá rời rạc, ideal cực đại $(p)$, trường thặng dư $\mathbb{F}_p$.
- Định lý Ostrowski: mọi trị tuyệt đối không tầm thường trên $\mathbb{Q}$ hoặc là $|\cdot|_\infty$ (thực) hoặc $|\cdot|_p$ (một $p$ nào đó). Tức “không gian cục bộ” của $\mathbb{Q}$ là $\mathbb{R}$ và các $\mathbb{Q}_p$.
Ví dụ
2. $1/3$ trong $\mathbb{Q}_5$: $3^{-1} \equiv 2 \pmod{5}$. Khai triển: $1/3 = 2 + 3 \cdot 5 + 1 \cdot 5^2 + \cdots$.
3. $\sqrt{-1}$ trong $\mathbb{Q}_5$: Vì $2^2 = 4 \equiv -1 \pmod{5}$, bổ đề Hensel cho $i = \sqrt{-1} \in \mathbb{Q}_5$. Nhưng $\sqrt{-1} \notin \mathbb{Q}_3$ (vì $-1$ không phải thặng dư bậc hai modulo 3).
4. Hàm zeta $p$-adic: $\zeta_p(s) = \sum_{n \geq 1, p \nmid n} n^{-s}$ (bỏ thừa số Euler tại $p$) “hội tụ” $p$-adic cho $s \in \mathbb{Z}_p$ thích hợp → đây là nền tảng hàm $L$ $p$-adic.
Ý nghĩa trực giác
- Hình dung: Trong $\mathbb{R}$, “gần” nghĩa là hiệu nhỏ (theo giá trị tuyệt đối thông thường). Trong $\mathbb{Q}_p$, “gần” nghĩa là hiệu chia hết cho lũy thừa cao của $p$. Ví dụ: trong $\mathbb{Q}_5$, $1$ và $126 = 1 + 5^3$ rất “gần” ($|1 - 126|_5 = 5^{-3}$).
- “Kính lúp modular”: Khai triển $p$-adic $x = a_0 + a_1 p + a_2 p^2 + \cdots$ giống “nhìn $x$ modulo $p$, modulo $p^2$, modulo $p^3$, \ldots” --- mỗi “lớp” cho thêm thông tin.
- Nguyên lý Hasse--Minkowski: Nhiều bài toán Diophantine có nghiệm trong $\mathbb{Q}$ khi và chỉ khi có nghiệm trong $\mathbb{R}$ và mọi $\mathbb{Q}_p$. Tức “toàn cục = tất cả cục bộ”. Giả thuyết BSD vi phạm nguyên lý này (Sha ≠ 0), đó là lý do BSD sâu sắc.
Liên hệ với giả thuyết Birch--Dyer
- Điều kiện cục bộ: Nhóm Selmer đòi hỏi “nghiệm cục bộ tại mọi $p$” --- tức lớp $c \in H^1(G_\mathbb{Q}, E[n])$ sao cho $c|_{G_{\mathbb{Q}_p}} \in \mathrm{im}(\kappa_p)$ cho mọi $p$. Nhóm $E(\mathbb{Q}_p)$ là “phiên bản $p$-adic” của $E(\mathbb{Q})$.
- Hàm $L$ $p$-adic: $L_p(E, s)$ sống trên $\mathbb{Q}_p$. Nội suy $p$-adic giá trị đặc biệt $L(E, \chi, 1)$ (phức) thành hàm trên $\mathbb{Z}_p$.
- Regulator $p$-adic: Trong BSD $p$-adic, regulator $\mathrm{Reg}_p$ dùng logarit hình thức $\log_E: E(\mathbb{Q}_p) \to \mathbb{Q}_p$ thay cho chiều cao Néron--Tate (là số thực).
Định nghĩa
Tính chất cực mạnh (ultrametric):
Công thức tích (product formula): Cho $x \in \mathbb{Q}^\times$:
Ví dụ
- $|9|_3 = 3^{-2} = 1/9$ (nhỏ! vì $9 = 3^2$ “chia hết nhiều cho 3”),
- $|10|_3 = 3^0 = 1$ (vì $3 \nmid 10$),
- $|1/27|_3 = 3^3 = 27$ (lớn! vì $1/27$ có “$3$ ở mẫu”).
2. Công thức tích: Lấy $x = 12 = 2^2 \cdot 3$:
3. Ultrametric: Trong $\mathbb{Q}_5$: $|5|_5 = 1/5$, $|25|_5 = 1/25$, $|5 + 25|_5 = |30|_5 = |5 \cdot 6|_5 = 1/5 = \max(1/5, 1/25)$. “Tam giác $p$-adic” luôn “đều cạnh” hoặc “cân”.
Ý nghĩa trực giác
- Hình dung: $|x|_p$ nhỏ khi $x$ “chia hết nhiều cho $p$” và lớn khi $x$ “có $p$ ở mẫu”. Đây là “thước đo chia hết” --- hoàn toàn khác giá trị tuyệt đối thông thường (đo “kích thước”).
- Ultrametric: Mọi tam giác trong $\mathbb{Q}_p$ là “cân” (hai cạnh dài bằng nhau). Hệ quả kỳ lạ: mọi điểm trong hình tròn đều là “tâm”, và hai hình tròn hoặc rời nhau hoặc một chứa trong kia (fractal!).
- “Hoàn vũ $p$-adic”: Với mỗi $p$, ta có “thế giới số” $\mathbb{Q}_p$ riêng, mỗi thế giới nhìn $\mathbb{Q}$ theo góc khác. Thông tin từ tất cả $p$ (cộng $\mathbb{R}$) cho bức tranh “toàn cục” --- đây là tinh thần Hasse principle.
Liên hệ với giả thuyết Birch--Dyer
- Sản phẩm Euler: Hàm $L(E, s) = \prod_p L_p(E, s)^{-1}$ phân tích thành thừa số cục bộ --- mỗi $p$ đóng góp thông tin “$p$-adic” riêng.
- Công thức tích → công thức BSD: Công thức tích $\prod |x|_v = 1$ là nguyên mẫu cho “công thức BSD”: sản phẩm các thừa số cục bộ (Tamagawa $c_p$, chu kỳ $\Omega$, Sha) cân bằng giá trị đặc biệt hàm $L$. Adèlic interpretation: BSD = “thể tích adelic” của nhóm $E$.
- Cục bộ--toàn cục: Điều kiện Selmer “cục bộ tại mọi $p$” (dùng $\mathbb{Q}_p$) → nhóm Selmer “toàn cục” (trên $\mathbb{Q}$). Sha = “khoảng cách” giữa cục bộ và toàn cục.
Định nghĩa
Nguyên nhân: Khi rút gọn nhân tách, thừa số Euler tại $p$ trong nội suy $p$-adic chứa $(1 - 1/\alpha)$ với $\alpha = a_p = 1$ (Frobenius). Do đó $(1 - 1/\alpha) = 0$, gây zero “giả tạo”.
Công thức Mazur--Tate--Teitelbaum: Nếu $L(E, 1) \neq 0$ (hạng 0), thì:
Ví dụ
- $L(E, 1) = 1/5 \cdot \Omega_E^+ \neq 0$ (hạng 0, $E(\mathbb{Q}) \cong \mathbb{Z}/5\mathbb{Z}$),
- $L_{11}(E, 0) = (1 - 1/\alpha)^2 \cdot 1/5 = 0$ (vì $a_{11} = 1$, $\alpha = 1$),
- $L_{11}'(E, 0) = \mathcal{L}_{11} \cdot 1/5 \neq 0$.
2. $E: y^2 = x^3 - x^2 - 4x + 4$ (conductor $= 14$), $p = 7$: Rút gọn nhân tách tại 7. $a_7 = -1$ (nhân không tách?). Thực tế cần kiểm tra kỹ: nếu $a_p = 1$ → tách, $a_p = -1$ → không tách. Exceptional zero chỉ xảy ra khi nhân tách ($a_p = 1$).
3. Hạng cao hơn: Nếu $E$ hạng 1 và rút gọn nhân tách tại $p$: $\mathrm{ord} L_p(E) = 2$ (thay vì 1 theo BSD cổ điển). Leading coefficient chứa $\mathcal{L}_p \cdot \hat{h}_p(P)$ (chiều cao $p$-adic nhân bất biến $\mathcal{L}$).
Ý nghĩa trực giác
- Hình dung: Nội suy $p$-adic $L(E, \chi, 1)$ cần chia cho thừa số Euler $(1 - \alpha^{-1} \cdot \chi(p))$. Khi $\alpha = 1$ và $\chi = 1$: thừa số = 0, gây “$0/0$” --- zero “giả tạo” không phản ánh số học thật.
- Analogy: Giống hàm $f(x) = x \sin(1/x)$: $f(0) = 0$ nhưng “lý do” triệt tiêu không phải từ $\sin$ mà từ thừa số $x$ phía trước. Bất biến $\mathcal{L}$ “đo” chính xác “phần zero giả tạo” và “trích xuất” thông tin thật.
- $p$-adic uniformization: Khi nhân tách, $E(\mathbb{Q}_p) \cong \mathbb{Q}_p^\times / q_E^\mathbb{Z}$ (Tate). Tham số $q_E$ mang thông tin “hình học $p$-adic” riêng. Bất biến $\mathcal{L} = \log_p(q_E) / \mathrm{ord}_p(q_E)$ kết nối hình học này với hàm $L$.
Liên hệ với giả thuyết Birch--Dyer
- Sửa đổi BSD $p$-adic: Exceptional zero buộc phải sửa công thức BSD $p$-adic: thêm $+1$ vào bậc triệt tiêu, và thêm $\mathcal{L}_p$ vào leading coefficient. Đây là lý do MTT (1986) phải phát biểu riêng trường hợp nhân tách.
- Greenberg--Stevens (1993): Chứng minh công thức $\mathcal{L}_p$ cho hạng 0 bằng biến dạng Hida (Hida deformation) --- biến $E$ thành “họ” đường cong $p$-adic, và exceptional zero “biến mất” khi di chuyển trong họ.
- Mở rộng: Benois (2014) mở rộng công thức exceptional zero cho trường hợp supersingular và hạng cao hơn. Vấn đề exceptional zero cho hạng $\geq 2$ vẫn mở.
Định nghĩa
Cho $M$ motif thuần (pure motive) trên $\mathbb{Q}$ với hàm $L$ $L(M, s)$, trọng số $w$, và điểm nguyên $n$ (“critical point”). Phỏng đoán phát biểu:
Phần yếu: $\mathrm{ord}_{s=n} L(M, s) = \dim_{\mathbb{Q}_p} H^1_f(G_\mathbb{Q}, V^*(1-n)) - \dim_{\mathbb{Q}_p} H^0(G_\mathbb{Q}, V^*(1-n))$,
trong đó $V$ là biểu diễn $p$-adic gắn với $M$, $V^* = \mathrm{Hom}(V, \mathbb{Q}_p)$ đối ngẫu, và $H^1_f$ là Selmer Bloch--Kato (điều kiện cục bộ “crystalline” tại $p$).
Phần mạnh: Leading coefficient $L^*(M, n) / R_\infty(M)$ là số hữu tỉ tường minh bằng:
Ví dụ
2. $M = h^0(\mathrm{Spec}(\mathcal{O}_K))$ (trường số), $n = 0$: Hàm $L = \zeta_K(s)$ (hàm zeta Dedekind). Bloch--Kato trở thành công thức số lớp: $\lim_{s \to 0} s^{-r} \zeta_K(s) = -h_K R_K / w_K$. Đã chứng minh (cổ điển).
3. $M = \mathbb{Q}(n)$ (Tate twist), $n \geq 2$: Hàm $L = \zeta(s)$ (Riemann). Bloch--Kato liên hệ $\zeta(n)$ với $K$-group bậc cao. Đã chứng minh cho $n$ chẵn (Euler: $\zeta(2k) = \pi^{2k} \cdot \text{rational}$).
4. Bảng tổng quát hóa:
| Motif | Phỏng đoán Bloch--Kato | Trạng thái |
|---|---|---|
| $h^0$ (trường số) | Công thức số lớp | Đã CM |
| $h^1(E)$ (EC) | BSD | Phần lớn mở |
| $h^1(A)$ (đa tạp Abel) | BSD tổng quát | Rất ít biết |
| $\mathbb{Q}(n)$ ($n \geq 2$) | Giá trị zeta Riemann | $n$ chẵn: đã CM |
Ý nghĩa trực giác
- Hình dung: BSD nói “$L(E,1)$ mã hóa hạng và Sha của $E$”. Bloch--Kato nói: mọi hàm $L$ đều mã hóa thông tin số học tương ứng. Đường cong elliptic chỉ là một trường hợp trong “thế giới motif” rộng lớn.
- “Nguyên lý siêu hình”: Có một “luật tự nhiên” rằng giá trị đặc biệt hàm $L$ (giải tích) luôn bằng sản phẩm bất biến số học (đại số). BSD, công thức số lớp, công thức Birch--Tate cho $K_2$ --- tất cả là biểu hiện của cùng một nguyên lý.
- Tại sao “Bloch--Kato”: Spencer Bloch và Kazuya Kato (1990) tìm ra cách đúng để phát biểu “điều kiện cục bộ” (tại $p$: crystalline) cho nhóm Selmer tổng quát. Trước đó, nhiều phỏng đoán (Beilinson, Deligne) thiếu “phần $p$-adic” chính xác.
Liên hệ với giả thuyết Birch--Dyer
- BSD ⊂ Bloch--Kato: BSD (yếu và mạnh) là trường hợp $M = h^1(E)$ của phỏng đoán Bloch--Kato. Chứng minh Bloch--Kato cho $h^1(E)$ = chứng minh BSD.
- Kato's Euler system: Phương pháp Kato chính xác là “Bloch--Kato cho $h^1(E)$”: xây phần tử $K$-theory, ánh xạ regulator vào $H^1_f$, chặn Selmer Bloch--Kato.
- Tổng quát hóa: BSD cho đa tạp Abel chiều $g > 1$ (ví dụ Jacobian đường cong genus $> 1$) là Bloch--Kato cho $h^1(A)$ --- rất ít biết ngoài $g = 1$ (EC). Kết quả mới nhất: BSD mạnh cho một số bề mặt Abel (2024).
Định nghĩa
Motif thuần (pure motive): Cho $X$ trơn xạ ảnh chiều $d$. Đối đồng điều bậc $i$:
Mỗi motif $M$ có:
- Hàm $L$: $L(M, s) = \prod_p L_p(M, s)^{-1}$ (tích Euler từ biểu diễn $\ell$-adic),
- Nhóm Selmer: $H^1_f(G_\mathbb{Q}, V_M)$ (Bloch--Kato Selmer group),
- Regulator: $r_\infty(M)$ (ánh xạ từ $K$-theory vào Deligne cohomology),
- Phỏng đoán Bloch--Kato: liên hệ $L(M, s)$ với $H^1_f$ và regulator.
Ví dụ
2. $h^1(E)$ (đường cong elliptic): Motif bậc 1 --- hàm $L$ là $L(E, s)$ (Hasse--Weil). Bloch--Kato = BSD. Biểu diễn Galois: $V_p(E)$ (2 chiều).
3. $h^1(A)$ (đa tạp Abel chiều $g$): Hàm $L = L(A, s)$, biểu diễn $2g$ chiều. BSD tổng quát: $\mathrm{ord}_{s=1} L(A, s) = \mathrm{rk}(A(\mathbb{Q}))$.
4. $\mathbb{Q}(n)$ (Tate twist bậc $n$): Motif “xoắn” --- hàm $L$ liên quan $\zeta(s-n)$. Bloch--Kato cho $K_{2n-1}(\mathbb{Z})$ (Quillen $K$-theory).
5. $h^1(f)$ (newform bậc $k$): Cho newform $f$ trọng số $k \geq 2$, motif $h^1(f)$ có hàm $L(f, s)$ và biểu diễn Galois 2 chiều. Khi $k = 2$ và $f$ ứng với EC: $h^1(f) = h^1(E)$.
Ý nghĩa trực giác
- Hình dung: Mỗi đa tạp $X$ có nhiều “bức ảnh” (cohomology): Betti (topo), de Rham (vi phân), étale ($p$-adic). Motif là “bản gốc” --- từ nó ta rút ra mọi bức ảnh. Grothendieck tin rằng motif “tồn tại” dù chưa ai xây dựng hoàn chỉnh phạm trù motif hỗn hợp.
- “Periodic table”: Giống bảng tuần hoàn phân loại nguyên tố, motif “phân loại” đối tượng hình học đại số. $\mathbb{Q}(0)$ = hydrogen, $h^1(E)$ = helium, v.v.
- Trạng thái: Phạm trù motif thuần (pure) đã được xây dựng (Grothendieck, Manin, Jannsen). Phạm trù motif hỗn hợp (mixed) khó hơn nhiều --- liên quan phỏng đoán Hodge, phỏng đoán Tate. Bloch--Kato phỏng đoán “vượt qua” khó khăn này bằng cách phát biểu trực tiếp cho biểu diễn Galois.
Liên hệ với giả thuyết Birch--Dyer
- BSD = Bloch--Kato cho $h^1(E)$: BSD là trường hợp đặc biệt nhất và quan trọng nhất của phỏng đoán Bloch--Kato cho motif $h^1(E)$.
- Tại sao tổng quát hóa?: Nhiều kỹ thuật chứng minh BSD (Euler system, Iwasawa theory) tự nhiên mở rộng cho motif tổng quát. Phỏng đoán Bloch--Kato cho khung lý thuyết thống nhất.
- Langlands: Chương trình Langlands phỏng đoán rằng mọi hàm $L$ motivic đều là hàm $L$ tự đẳng cấu (automorphic). Nếu đúng, kỹ thuật Selmer/Euler system áp dụng rộng hơn nhiều.
Định nghĩa
Cụ thể, phân tích:
BSD đẳng biến yếu: Cho mỗi $\rho \in \mathrm{Irr}(G)$:
Ở đây $L(E, \rho, s) = L(E \otimes \rho, s)$ là hàm $L$ “xoắn” bởi biểu diễn Artin $\rho$.
Ví dụ
2. Gross--Zagier + Kolyvagin: Cho $K$ trường phức bậc hai ảo thỏa điều kiện Heegner, BSD đẳng biến cho $\rho_1 = \chi_K$ đã được chứng minh khi $\mathrm{ord} L(E, \chi_K, 1) \leq 1$ (nhờ Gross--Zagier + Kolyvagin).
Ý nghĩa trực giác
- Hình dung: BSD thường nói “hạng = bậc triệt tiêu” cho trường cố định. BSD đẳng biến “phân tích” cả hai vế theo biểu diễn Galois: mỗi biểu diễn $\rho$ đóng góp bao nhiêu vào hạng và bậc triệt tiêu.
- Mạnh hơn BSD thường: BSD đẳng biến cho $K/\mathbb{Q}$ suy ra BSD cho $E/K$ và $E/\mathbb{Q}$, nhưng ngược lại không đúng. Nó chứa thông tin “tinh hơn” về cách Galois tác động.
Liên hệ với giả thuyết Birch--Dyer
- Kato + Skinner--Urban: Chứng minh BSD đẳng biến cho $\rho = \chi$ ký tự bậc 1 (abelian), khi $L(E, \chi, 1) \neq 0$.
- Hạn chế: Cho $\rho$ bậc $> 1$ (non-abelian), rất ít biết --- không có Euler system tự nhiên. Darmon, Rotger và Bertolini nghiên cứu trường hợp $\rho$ Artin bậc 2.
Định nghĩa
Tính chất:
- $\chi$ tuần hoàn: $\chi(n + N) = \chi(n)$.
- $\chi$ nhân tính: $\chi(ab) = \chi(a)\chi(b)$.
- Đặc trưng tầm thường $\chi_0$: $\chi_0(n) = 1$ cho $\gcd(n, N) = 1$.
- Đặc trưng nguyên thủy: conductor nhỏ nhất.
Hàm $L$ Dirichlet: $L(\chi, s) = \sum_{n=1}^{\infty} \chi(n) n^{-s} = \prod_p (1 - \chi(p) p^{-s})^{-1}$.
Đặc biệt quan trọng: ký hiệu Kronecker $\chi_D = \left(\frac{D}{\cdot}\right)$ cho biệt thức $D$ --- đặc trưng bậc hai ứng với trường $\mathbb{Q}(\sqrt{D})$.
Ví dụ
2. Twist hàm $L$: Cho $E: y^2 = x^3 - x$ (conductor 32), twist bởi $\chi_{-7}$:
3. Nội suy $p$-adic: Hàm $L$ $p$-adic $L_p(E, s)$ nội suy giá trị $L(E, \chi, 1)$ cho mọi đặc trưng $\chi$ bậc lũy thừa $p$ --- đặc trưng Dirichlet là “biến” tự nhiên của hàm $L$ $p$-adic.
Ý nghĩa trực giác
- Hình dung: Đặc trưng $\chi$ “lọc” các số nguyên theo thặng dư modulo $N$: số “tốt” cho $\chi = 1$, số “xấu” cho $\chi = -1$, số “không liên quan” cho $\chi = 0$. Twist $L(E, \chi)$ “lọc” thông tin $E$ qua kính $\chi$.
- Fourier analysis: Đặc trưng Dirichlet = biến đổi Fourier trên nhóm $(\mathbb{Z}/N\mathbb{Z})^\times$. Twist hàm $L$ = “nhìn” hàm $L$ ở “tần số” $\chi$.
Liên hệ với giả thuyết Birch--Dyer
- BSD đẳng biến: $L(E, \chi, s)$ xuất hiện trong BSD đẳng biến cho $\mathbb{Q}(\sqrt{D})/\mathbb{Q}$ khi $\chi = \chi_D$.
- Hàm $L$ $p$-adic: $L_p(E, s)$ nội suy $L(E, \chi, 1)$ cho ký tự $p$-lũy thừa $\chi$.
- Parity conjecture: Dấu gốc $w(E, \chi) = \pm 1$ xác định tính chẵn lẻ $\mathrm{ord}_{s=1} L(E, \chi, s)$.
Định nghĩa
Hai trụ cột chính:
1. Tương ứng Langlands (reciprocity): Mọi biểu diễn Galois “motivic” $\rho: G_\mathbb{Q} \to \mathrm{GL}_n(\overline{\mathbb{Q}}_p)$ tương ứng với biểu diễn tự đẳng cấu $\pi$ trên $\mathrm{GL}_n(\mathbb{A}_\mathbb{Q})$ (adèles):
2. Functoriality: Cho hai nhóm reductive $G, H$ với “dual homomorphism” ${}^LH \to {}^LG$ (nhóm Langlands dual), có “transfer” biểu diễn tự đẳng cấu:
Các trường hợp đã chứng minh:
- $n = 1$: Luật thặng dư bậc hai (Gauss), lý thuyết trường lớp (Artin).
- $n = 2$, trường hợp đặc biệt: Định lý modularity (Wiles, BCDT).
- $\mathrm{GL}_2 \to \mathrm{GL}_3$: Gelbart--Jacquet (symmetric square).
Ví dụ
Đây chính là “Langlands reciprocity” cho $n = 2$, biểu diễn đến từ EC.
2. Thác triển giải tích: Langlands phỏng đoán mọi hàm $L$ motivic có thác triển giải tích và phương trình hàm (vì hàm $L$ tự đẳng cấu đã biết có tính chất này). Cho EC: đã chứng minh qua modularity.
3. Sato--Tate: Phỏng đoán Sato--Tate (nay là Định lý, 2008) được chứng minh nhờ “functoriality” --- chuyển biểu diễn từ $\mathrm{GL}_2$ sang $\mathrm{GL}_n$ ($n = 3, 4, 5$) bằng symmetric powers.
Ý nghĩa trực giác
- Hình dung: Langlands Program giống “bảng Rosetta” dịch giữa ba ngôn ngữ: (1) Hình học đại số (motif, đa tạp), (2) Lý thuyết số (biểu diễn Galois, hàm $L$), (3) Giải tích điều hòa (dạng tự đẳng cấu). Mỗi định lý trong một ngôn ngữ tự động cho định lý trong các ngôn ngữ khác.
- “Grand Unified Theory”: Nếu Langlands đúng hoàn toàn, mọi hàm $L$ đều “tự đẳng cấu” → mọi giá trị đặc biệt hàm $L$ hiểu được → mọi phỏng đoán Bloch--Kato (bao gồm BSD) tiếp cận được.
- Trạng thái: Chương trình Langlands vẫn mở rộng lớn. Trường hợp $n = 2$ trên $\mathbb{Q}$ (modularity) là thành tựu lớn nhất. “Langlands over number fields” ($n > 2$, trường số tổng quát) là mục tiêu thế kỷ.
Liên hệ với giả thuyết Birch--Dyer
- Modularity = Langlands cho EC: Định lý modularity (cần thiết cho thác triển giải tích $L(E,s)$, BSD có nghĩa) chính là trường hợp Langlands reciprocity.
- BSD cho đa tạp Abel chiều $> 1$: Cần “modularity” tổng quát (Langlands cho $\mathrm{GL}_{2g}$). Gần đây: modularity cho bề mặt Abel (Boxer--Calegari--Gee--Pilloni, 2018) mở đường cho BSD chiều 2.
- Chương trình $p$-adic Langlands: Phiên bản $p$-adic của Langlands (Breuil, Colmez, Emerton) liên hệ trực tiếp với BSD $p$-adic và IMC.
Định nghĩa
Phân tích tensor: $\pi = \bigotimes_v \pi_v$ (tích restricted tensor trên mọi vị trí $v$ --- hữu hạn và vô hạn), với:
- $\pi_\infty$: thành phần Archimedean (biểu diễn $\mathrm{GL}_n(\mathbb{R})$),
- $\pi_p$: thành phần $p$-adic (biểu diễn $\mathrm{GL}_n(\mathbb{Q}_p)$), unramified cho hầu hết $p$.
Hàm $L$ tự đẳng cấu: $L(\pi, s) = \prod_p L(\pi_p, s)$ (tích Euler). Godement--Jacquet: $L(\pi, s)$ có thác triển meromorphic và phương trình hàm.
Ví dụ
2. $n = 2$, dạng modular: Newform $f \in S_k(\Gamma_0(N))$ cho biểu diễn tự đẳng cấu $\pi_f$ của $\mathrm{GL}_2(\mathbb{A})$. Hàm $L(\pi_f, s) = L(f, s)$. Khi $k = 2$: ứng với EC qua modularity.
3. $n = 2$, dạng Maass: Dạng Maass (trọng số 0, giá trị riêng Laplacian) cũng cho biểu diễn tự đẳng cấu. Không ứng với đa tạp Abel --- nhưng vẫn có hàm $L$ và Langlands reciprocity (phỏng đoán).
Ý nghĩa trực giác
- Hình dung: Biểu diễn tự đẳng cấu giống “hàm sóng” trên “không gian adelic”. Mỗi “tần số” (thành phần cục bộ $\pi_v$) mã hóa thông tin số học tại vị trí $v$. “Phân tích phổ” (spectral decomposition) cho toàn bộ dạng tự đẳng cấu.
- Tại sao adèles?: Vành adèles $\mathbb{A}_\mathbb{Q} = \mathbb{R} \times \prod_p \mathbb{Q}_p$ “nhìn” $\mathbb{Q}$ từ mọi góc cục bộ cùng lúc. Dạng tự đẳng cấu “hài hòa” tất cả góc nhìn --- đây là “thông tin toàn cục” tối ưu.
Liên hệ với giả thuyết Birch--Dyer
- $\pi_{f_E}$ = “bản sao tự đẳng cấu” của $E$: Modularity: $E \leftrightarrow f_E \leftrightarrow \pi_{f_E}$. BSD phát biểu bằng $L(\pi_{f_E}, s)$ --- hàm $L$ tự đẳng cấu.
- Tính chất giải tích: $L(\pi, s)$ có thác triển giải tích + phương trình hàm (đã biết cho $\mathrm{GL}_n$). Đây là lý do “phía giải tích” của BSD “tốt”. “Phía đại số” (Selmer) khó hơn.
- Skinner--Urban: Chứng minh IMC dùng “biến dạng tự đẳng cấu” (automorphic deformation) trên $\mathrm{GL}_2 \times \mathrm{GL}_2$ --- kỹ thuật thuần túy “automorphic”.
Định nghĩa
- Đa tạp xạ ảnh trơn chiều $g$,
- Nhóm đại số (với phép cộng, nghịch đảo, và phần tử đơn vị là các ánh xạ đại số).
Khi $g = 1$: $A$ = đường cong elliptic (định nghĩa quen thuộc).
Tính chất:
- Nhóm cộng trên $A$ tự động giao hoán (Abel) --- điều kỳ diệu không hiển nhiên!
- $A(\mathbb{C}) \cong \mathbb{C}^g / \Lambda$ (torus phức chiều $g$) --- tổng quát hóa $E(\mathbb{C}) \cong \mathbb{C}/\Lambda$.
- Định lý Mordell--Weil tổng quát: $A(K)$ hữu hạn sinh cho $K$ trường số.
- Hàm $L$: $L(A, s) = \prod_p L_p(A, s)^{-1}$, bậc $= 2g$.
Ví dụ
2. Chiều 2 --- bề mặt Abel: Jacobian $J(C)$ của đường cong genus 2 (ví dụ $C: y^2 = x^5 + x + 1$) là đa tạp Abel chiều 2. $J(C)(\mathbb{Q})$ hữu hạn sinh, $L(J(C), s)$ bậc 4.
3. Jacobian newform: Cho $f$ newform trọng số 2, level $N$, hệ số trong $K_f$ (trường số bậc $d = [K_f : \mathbb{Q}]$). Đa tạp Abel $A_f = J_0(N) / I_f J_0(N)$ (thương Jacobian) có chiều $g = d$. Khi $d = 1$: $A_f$ = đường cong elliptic (modularity).
4. BSD tổng quát: Cho $A/\mathbb{Q}$ đa tạp Abel chiều $g$:
Ý nghĩa trực giác
- Hình dung: Đường cong elliptic = “torus 1 chiều” ($\mathbb{C}/\Lambda$, hình bánh donut). Đa tạp Abel chiều $g$ = “torus $g$ chiều” ($\mathbb{C}^g/\Lambda$). Mọi tính chất “hay” của EC (nhóm, Mordell--Weil, hàm $L$, BSD) tổng quát hóa lên chiều cao.
- Jacobian: Nguồn chính đa tạp Abel: Jacobian $J(C)$ của đường cong genus $g$. Chiều $J(C) = g$. Khi $g = 1$: $C$ là EC, $J(C) = C$.
- Khó hơn nhiều: Chiều $> 1$ khó hơn bội: (a) không có “phương trình Weierstrass”, (b) modularity chưa biết tổng quát, (c) Euler system chưa xây dựng.
Liên hệ với giả thuyết Birch--Dyer
- BSD tổng quát: $\mathrm{ord}_{s=1} L(A, s) = \mathrm{rk}(A(\mathbb{Q}))$ cho đa tạp Abel $A/\mathbb{Q}$ chiều $g$. Khi $g = 1$: BSD cổ điển. Khi $g > 1$: gần như hoàn toàn mở.
- $A_f$ (thương Jacobian): Nếu $A = A_f$ đến từ newform $f$, thì $L(A, s) = \prod_\sigma L(f^\sigma, s)$ (tích các conjugates). BSD cho $A_f$ tương đương BSD cho $f$ và tất cả conjugates.
- Tiến triển gần đây: BSD mạnh cho bề mặt Abel (2024, Loeffler--Zerbes et al.) sử dụng Euler system trên nhóm symplectic $\mathrm{GSp}_4$. Đây là bước tiến lớn nhất ngoài chiều 1.
Định nghĩa
Cụ thể: Chia bậc 0 là $D = \sum n_i P_i$ với $\sum n_i = 0$. Chia chính là $\mathrm{div}(f) = \sum \mathrm{ord}_P(f) \cdot P$ cho hàm hữu tỉ $f$. Thì:
Tính chất:
- $J(C)$ là đa tạp Abel chiều $g$ --- trơn, xạ ảnh, liên thông, với nhóm cộng.
- $J(C)(\mathbb{C}) \cong \mathbb{C}^g / \Lambda$ (torus phức $g$ chiều) với $\Lambda$ lưới hạng $2g$.
- Khi $g = 1$ (EC): $J(C) \cong C$ (Jacobian = chính nó).
- Khi $g \geq 2$: $C$ nhúng vào $J(C)$ qua $P \mapsto [P - P_0]$, nhưng $J(C)$ lớn hơn $C$ rất nhiều.
Ví dụ
2. Genus 2: $C: y^2 = x^5 + x + 1$. Jacobian $J(C)$ là bề mặt Abel (chiều 2). Điểm trên $J(C)(\mathbb{Q})$ là lớp tương đương $[P + Q - 2\infty]$ với $P, Q \in C(\bar{\mathbb{Q}})$, modulo chia chính.
3. Đường cong modular: $J_0(N) = J(X_0(N))$ là Jacobian của đường cong modular $X_0(N)$, chiều $= g(X_0(N)) \sim N/12$. Thương $J_0(N) \to A_f$ (bởi ideal Hecke) cho đa tạp Abel $A_f$ ứng với newform $f$.
4. Đếm điểm: Cho $C: y^2 = x^5 - x$ genus 2, $p = 7$. Số điểm: $\#J(C)(\mathbb{F}_7) = ?$ tính từ đa thức đặc trưng Frobenius bậc 4 (vì $\dim J = 2$).
Ý nghĩa trực giác
- Hình dung: Đường cong $C$ genus $g \geq 2$ không phải nhóm (không có phép cộng điểm tự nhiên). Jacobian $J(C)$ “Abel hóa” $C$: biến đường cong thành nhóm Abel. Cái giá: chiều tăng từ 1 lên $g$.
- “Linearization”: $C$ (phi tuyến) $\to$ $J(C)$ (tuyến tính --- nhóm Abel). Giống biến đổi Fourier: biến đối tượng phức tạp thành đối tượng có cấu trúc đại số tốt hơn.
- Mọi đa tạp Abel “gần” Jacobian: Định lý Poincaré: mọi đa tạp Abel đơn giản trên trường số xuất hiện (up to isogeny) như thành phần của Jacobian nào đó.
Liên hệ với giả thuyết Birch--Dyer
- $J_0(N)$ chứa EC modular: Modularity: $E \hookrightarrow J_0(N)$ (tham số hóa modular). Điểm Heegner sống trong $J_0(N)(\mathbb{Q})$ trước khi “chiếu” xuống $E(\mathbb{Q})$.
- BSD tổng quát: BSD cho Jacobian: $\mathrm{ord}_{s=1} L(J(C), s) = \mathrm{rk}(J(C)(\mathbb{Q}))$. Khi $g = 2$: gần đây có tiến triển (modularity + Euler system cho $\mathrm{GSp}_4$).
- Hạng Jacobian: $\mathrm{rk}(J(C)(\mathbb{Q}))$ đo “sự phong phú” của điểm hữu tỉ trên $C$. Nếu $\mathrm{rk}(J(C)(\mathbb{Q})) = 0$: $C(\mathbb{Q})$ hữu hạn (Chabauty, đã biết khi $\mathrm{rk} < g$).
Định nghĩa
- $G$: nhóm reductive trên $\mathbb{Q}$,
- $X$: lớp liên hợp đồng cấu $h: \mathrm{Res}_{\mathbb{C}/\mathbb{R}} \mathbb{G}_m \to G_\mathbb{R}$ (dữ liệu Hodge).
Đa tạp Shimura phức:
Ví dụ quan trọng nhất: $G = \mathrm{GL}_2$, $X = \mathcal{H}^\pm$ (nửa mặt phẳng trên và dưới):
Ví dụ
2. Bề mặt Hilbert modular: $G = \mathrm{Res}_{F/\mathbb{Q}} \mathrm{GL}_2$ cho trường số thực bậc hai $F$ → đa tạp chiều 2. Modularity cho $F$ liên quan đến Hilbert modular forms.
3. Đa tạp Siegel modular: $G = \mathrm{GSp}_{2g}$ (nhóm symplectic) → tham số hóa đa tạp Abel chiều $g$ với cấu trúc phân cực. Chiều $= g(g+1)/2$.
Ý nghĩa trực giác
- Hình dung: Đa tạp Shimura là “không gian tham số” phân loại đối tượng số học (đường cong elliptic, đa tạp Abel, v.v.) với cấu trúc bổ sung. Mỗi điểm ↔ một đối tượng.
- “Xương sống” của Langlands: Đa tạp Shimura là nơi “hiện thực hóa” tương ứng Langlands: đối đồng điều $H^*(Sh, \mathcal{L})$ chứa biểu diễn Galois + biểu diễn tự đẳng cấu.
Liên hệ với giả thuyết Birch--Dyer
- Nguồn EC và đa tạp Abel: Mọi EC modular “sống” trên $X_0(N)$ (đa tạp Shimura). Điểm đặc biệt trên Shimura variety (CM points, Heegner points) tạo điểm hữu tỉ trên EC --- then chốt cho Gross--Zagier.
- BSD chiều cao: BSD cho đa tạp Abel chiều $> 1$ cần modularity trên đa tạp Shimura bậc cao (Siegel, Hilbert). Boxer--Calegari--Gee--Pilloni (2018): modularity cho bề mặt Abel sử dụng đa tạp Shimura chiều 3.
Định nghĩa
So sánh: đường cong modular $X_0(N)$ ứng với $B = M_2(\mathbb{Q})$ (“split”). Đường cong Shimura ứng với $B$ “non-split” --- đại số quaternion phân nhánh tại tập hữu hạn primes.
Tính chất:
- Đường cong Shimura là đường cong đại số trơn trên $\mathbb{Q}$.
- Không có cusps (khác với $X_0(N)$): compact tự nhiên.
- Jacobian $J(X^B_0(N))$ chứa đa tạp Abel “mới” (Jacquet--Langlands correspondence).
- Điểm Heegner trên Shimura curve: tương tự CM points trên $X_0(N)$, nhưng tồn tại cho trường phức bậc hai ảo không thỏa điều kiện Heegner cổ điển.
Ví dụ
2. Jacquet--Langlands: Newform $f$ trên $\Gamma_0(N)$ “chuyển” thành dạng tự đẳng cấu trên $B^\times$ khi $B$ phân nhánh tại các thừa số nguyên tố của $N$. Khi đó EC $E_f$ “sống” trên cả $X_0(N)$ và $X^B_0(N/\mathrm{disc}(B))$.
3. Ứng dụng: Khi điều kiện Heegner không thỏa cho $X_0(N)$ (ví dụ $N$ nguyên tố), ta có thể dùng đường cong Shimura (với $B$ phân nhánh tại $N$) --- nơi điều kiện Heegner “dễ” thỏa hơn.
Ý nghĩa trực giác
- Hình dung: Đường cong modular $X_0(N)$ phân loại “cặp $(E, C)$” (EC + nhóm con cyclic). Đường cong Shimura phân loại “đa tạp Abel với nhân bởi đại số quaternion” --- đối tượng “tương tự nhưng xoắn”.
- Complementary: $X_0(N)$ và $X^B_0(N)$ mang thông tin “bổ sung” --- Jacquet--Langlands nói chúng “nhìn” cùng dạng tự đẳng cấu từ hai góc khác nhau.
Liên hệ với giả thuyết Birch--Dyer
- Điểm Heegner mở rộng: Zhang (2001) mở rộng Gross--Zagier cho điểm Heegner trên đường cong Shimura: $L'(E, \chi_K, 1) = c \cdot \hat{h}(P_K^B)$. Mở rộng phạm vi áp dụng BSD (hạng giải tích 1).
- Darmon: Sử dụng đường cong Shimura cho “$p$-adic Heegner points” --- hướng nghiên cứu mới cho BSD khi điều kiện Heegner cổ điển không thỏa.
Định nghĩa
Ý tưởng (Darmon, 2001): Thay tích phân phức $\int_{\tau_1}^{\tau_2} \omega_f$ (xây điểm Heegner cổ điển) bằng tích phân $p$-adic:
Phỏng đoán Darmon: $P_{\mathrm{SH}} \in E(K)$ (thực sự là điểm hữu tỉ trên $K$, không chỉ $p$-adic), và $P_{\mathrm{SH}} \neq O$ khi $L'(E/K, 1) \neq 0$.
Ví dụ
Tính toán số: $P_{\mathrm{SH}}$ (modulo $11^{20}$) khớp với điểm hữu tỉ trong $E(\mathbb{Q}(\sqrt{2}))$ --- bằng chứng số mạnh cho phỏng đoán Darmon.
2. So sánh Heegner vs Stark--Heegner:
| Heegner | Stark--Heegner | |
|---|---|---|
| Trường $K$ | $\mathbb{Q}(\sqrt{D})$, $D < 0$ | $\mathbb{Q}(\sqrt{D})$, $D > 0$ |
| Tích phân | Phức ($\mathbb{C}$) | $p$-adic ($\mathbb{C}_p$) |
| Trạng thái | Đã chứng minh (GZ, Kol) | Phỏng đoán (Darmon) |
Ý nghĩa trực giác
- Hình dung: Điểm Heegner cổ điển “sống” trong thế giới phức ($\mathbb{C}$). Điểm Stark--Heegner “sống” trong thế giới $p$-adic ($\mathbb{C}_p$). Cả hai “xây” điểm trên $E$ từ “dữ liệu trường bậc hai”, nhưng bằng “kính” khác nhau.
- Tại sao khó: Phương pháp Gross--Zagier--Kolyvagin dùng “CM points” (nhúng $K \hookrightarrow M_2(\mathbb{Q})$ cho $K$ ảo). Khi $K$ thực: không có nhúng tự nhiên → phải dùng “$p$-adic trick” (Darmon).
- Tham vọng: Nếu phỏng đoán Darmon đúng, nó mở đường cho BSD khi hạng giải tích = 1 trên trường thực bậc hai --- lãnh thổ hoàn toàn mới.
Liên hệ với giả thuyết Birch--Dyer
- BSD cho trường thực: Điểm Heegner chứng minh BSD cho $K$ ảo (hạng $\leq 1$). Điểm Stark--Heegner nhắm đến BSD cho $K$ thực --- hoàn toàn mở với phương pháp hiện tại.
- Bằng chứng số: Nhiều tính toán (Darmon--Green, Greenberg--Shahabi) xác nhận phỏng đoán Darmon đến độ chính xác $p$-adic rất cao --- nhưng chứng minh lý thuyết vẫn ngoài tầm.
- Hướng mới: Bertolini--Darmon--Prasanna (2013) xây “$p$-adic Gross--Zagier formula” cho điểm Stark--Heegner. Đây là bước tiến quan trọng nhất hướng tới chứng minh.
Định nghĩa
GGP cục bộ (đã chứng minh bởi Waldspurger, Beuzart-Plessis): Cho $\pi$ biểu diễn tự đẳng cấu của $G = \mathrm{SO}(n)$ hoặc $\mathrm{U}(n)$, và $H \subset G$ nhóm con, liên hệ:
GGP số học (phỏng đoán): Cho $\pi$ trên $G = \mathrm{U}(n) \times \mathrm{U}(n+1)$ (nhóm đơn nhất):
Ví dụ
2. $n = 2$: $G = \mathrm{U}(2) \times \mathrm{U}(3)$. “Chu kỳ” liên quan cycle trên đa tạp Shimura chiều 3. GGP liên hệ $L'(\pi, 1/2)$ với “chiều cao” cycle --- tổng quát hóa Gross--Zagier cho bề mặt Abel.
3. Tiến triển: W. Zhang (2012) chứng minh GGP số học cho $\mathrm{U}(n) \times \mathrm{U}(n+1)$ trong nhiều trường hợp (“arithmetic fundamental lemma”). Đây là bước tiến lớn nhất trong chương trình GGP.
Ý nghĩa trực giác
- Hình dung: Gross--Zagier liên hệ $L'(E, 1)$ với chiều cao điểm trên đường cong (chiều 1). GGP liên hệ $L^{(r)}(\pi, 1/2)$ với “chiều cao” chu kỳ trên đa tạp Shimura (chiều cao hơn). “Cùng công thức, mọi chiều”.
- Tại sao nhóm đơn nhất?: Nhóm đơn nhất $\mathrm{U}(n)$ “tổng quát tự nhiên” nhóm $\mathrm{GL}_2$ (khi $n = 2$, trên trường phức bậc hai ảo). Cấu trúc Hermitian cho “ghép đôi chiều cao” tự nhiên.
Liên hệ với giả thuyết Birch--Dyer
- Gross--Zagier ⊂ GGP: Công thức Gross--Zagier (then chốt cho BSD hạng 1) là trường hợp $n = 1$ của GGP. Chứng minh GGP tổng quát → mở rộng BSD sang chiều cao.
- BSD cho bề mặt Abel: GGP cho $n = 2$ liên hệ $L'$ của bề mặt Abel với cycle trên Shimura 3-fold. Kết hợp Euler system (Loeffler--Zerbes): BSD cho bề mặt Abel.
- “Chương trình GGP--BSD”: Chương trình lớn của Wei Zhang và cộng sự: GGP + Euler system $\mathrm{U}(n) \times \mathrm{U}(n+1)$ → BSD cho đa tạp Abel chiều $n$. Hiện mới ở giai đoạn đầu cho $n \geq 2$.
Định nghĩa
Đặt theo Diophantus xứ Alexandria (thế kỷ 3 SCN), tác giả Arithmetica --- 13 cuốn sách về phương trình số nguyên.
Phân loại theo bậc và số biến:
- Bậc 1: $ax + by = c$ --- Bézout, giải hoàn toàn bởi thuật toán Euclid.
- Bậc 2: $ax^2 + bxy + cy^2 + \cdots = 0$ --- Lý thuyết dạng bậc hai (Gauss, Hasse--Minkowski). Nguyên lý Hasse đúng.
- Bậc 3: Đường cong elliptic $y^2 = x^3 + ax + b$. Nguyên lý Hasse sai ($\mathrm{Sha} \neq 0$). Đây là đối tượng của BSD.
- Bậc $\geq 4$: Hệ quả Faltings (1983, tên cũ: Mordell conjecture): đường cong genus $\geq 2$ có hữu hạn điểm hữu tỉ.
Ví dụ
2. Fermat: $x^n + y^n = z^n$ cho $n \geq 3$. Không có nghiệm nguyên dương (Wiles, 1995 --- qua modularity + EC Frey).
3. Số đồng dư: “$n$ là số đồng dư?” ↔ “$y^2 = x^3 - n^2x$ có điểm hữu tỉ bậc vô hạn?” ↔ “$L(E_n, 1) = 0$?” (BSD!). Tunnell (1983): thuật toán (giả sử BSD) kiểm tra $n$ đồng dư.
4. Đường cong genus 1 không Weierstrass: $3x^3 + 4y^3 + 5z^3 = 0$ (genus 1, bậc 3, 3 biến). Có nghiệm cục bộ mọi nơi nhưng không có nghiệm hữu tỉ → phần tử $\mathrm{Sha}[3]$ của Jacobian → trực tiếp liên quan BSD.
Ý nghĩa trực giác
- Hình dung: “Cho phương trình đa thức, tìm nghiệm nguyên” --- câu hỏi đơn giản nhất mà đứa trẻ nào cũng hiểu. Nhưng câu trả lời có thể đòi hỏi toàn bộ toán học hiện đại (modularity, Galois cohomology, Euler system, Iwasawa theory).
- Hilbert 10: “Có thuật toán tổng quát giải mọi phương trình Diophantus không?” --- Câu trả lời: Không (Matiyasevich, 1970, giải bài toán thứ 10 Hilbert). Nhưng cho từng lớp cụ thể (bậc 2, bậc 3 genus 1), ta có thể nói nhiều hơn --- và BSD là “câu trả lời” cho lớp bậc 3 genus 1.
- BSD = “Oracle”: Nếu BSD đúng, ta có “oracle” cho phương trình Diophantus genus 1: tính $L(E, 1)$ → biết hạng → biết “có vô hạn nghiệm hay không”. Thậm chí BSD mạnh cho $|\mathrm{Sha}|$ → biết chính xác “bao nhiêu chướng ngại cục bộ--toàn cục”.
Liên hệ với giả thuyết Birch--Dyer
- BSD = “giải” phương trình bậc 3: Với mỗi đường cong elliptic $E: y^2 = x^3 + ax + b$, BSD nói: hạng (“bao nhiêu” nghiệm hữu tỉ độc lập) = bậc triệt tiêu $L(E, s)$ tại $s = 1$.
- Ứng dụng: Số đồng dư (Tunnell), phương trình Fermat (Wiles), đường cong genus 1 (Sha), mật mã (ECC) --- tất cả kết nối với lý thuyết đường cong elliptic và BSD.
- Giải thưởng Clay: BSD là một trong 7 bài toán thiên niên kỷ ($1 triệu USD). Nếu chứng minh, nó sẽ cho công cụ mạnh nhất trong lịch sử để hiểu nghiệm Diophantine.
Định nghĩa
Công thức tổng quát (đã biết từ thời Euclid): Mọi bộ ba Pythagoras nguyên thủy có dạng
Diễn giải hình học: Các bộ ba Pythagoras nguyên thủy tương ứng một--một với các điểm hữu tỉ trên đường tròn đơn vị $X^2 + Y^2 = 1$: nếu $a^2 + b^2 = c^2$ thì $(a/c, b/c)$ là điểm hữu tỉ trên đường tròn, và ngược lại.
Ví dụ
- Nhỏ nhất: $(3, 4, 5)$ --- $9 + 16 = 25$. Đây là bộ ba cổ điển nhất, đã biết từ thời Babylon (khoảng 1800 TCN, bảng đất sét Plimpton 322).
- Vài bộ ba nguyên thủy khác:
- $(5, 12, 13)$: $m = 3, n = 2$ cho $9 - 4 = 5$, $12$, $9 + 4 = 13$.
- $(8, 15, 17)$: $m = 4, n = 1$ cho $15$, $8$, $17$.
- $(7, 24, 25)$: $m = 4, n = 3$ cho $7$, $24$, $25$.
- Có vô hạn bộ ba: Chọn $m = k + 1, n = k$ cho mọi $k \geq 1$ luôn được bộ ba nguyên thủy: $(3,4,5), (5,12,13), (7,24,25), (9,40,41), \ldots$
- Điểm hữu tỉ trên đường tròn: Kẻ đường thẳng qua $(-1, 0)$ với hệ số góc $t \in \mathbb{Q}$, giao với $X^2 + Y^2 = 1$ tại
\[ \left(\frac{1 - t^2}{1 + t^2}, \; \frac{2t}{1 + t^2}\right). \]Với $t = 1/2$: $\left(\frac{3}{5}, \frac{4}{5}\right) \leftrightarrow (3,4,5)$. Với $t = 2/3$: $\left(\frac{5}{13}, \frac{12}{13}\right) \leftrightarrow (5,12,13)$.
Ý nghĩa trực giác
- Hình dung: Bài toán Pythagoras là phương trình Diophantus “dễ nhất” --- bậc 2, trên đường tròn (genus 0). Ta giải được hoàn toàn: có vô hạn nghiệm và biết công thức tham số cho tất cả.
- So sánh: $x^n + y^n = z^n$ cho $n \geq 3$ --- cùng dạng nhưng không có nghiệm nguyên dương (Wiles, 1995). Bậc 2 cho đường conic (genus 0) → vô hạn nghiệm; bậc $\geq 3$ → genus cao → hữu hạn hoặc không nghiệm.
- Phương pháp tham số hóa: “Kẻ đường thẳng qua một điểm” trên đường conic cho mọi điểm hữu tỉ. Với đường cong elliptic (genus 1), ta không thể tham số hóa --- và đó là lý do BSD cần thiết.
Liên hệ với giả thuyết Birch--Dyer
- Genus 0 vs genus 1: Bộ ba Pythagoras sống trên đường cong bậc 2 (genus 0) --- ta hiểu hoàn toàn. Đường cong elliptic (genus 1) phức tạp hơn vô cùng, và BSD là “câu trả lời” cho chúng.
- Pythagoras $\to$ số đồng dư: “Tam giác vuông cạnh nguyên” $\to$ “tam giác vuông cạnh hữu tỉ có diện tích $n$” $\to$ bài toán số đồng dư $\to$ đường cong $E_n: y^2 = x^3 - n^2 x$ $\to$ BSD.
- Bài học: Đã giải $a^2 + b^2 = c^2$ từ 4000 năm trước, nhưng $y^2 = x^3 + ax + b$ (chỉ thêm bậc 1!) vẫn chưa giải hoàn toàn --- minh chứng cho chiều sâu phi thường của BSD.
Định nghĩa
Liên hệ với đường cong elliptic [tunnell1983]: $n$ là số đồng dư khi và chỉ khi đường cong elliptic
Phép biến đổi: Nếu tam giác vuông cạnh hữu tỉ $(a, b, c)$ có diện tích $n$, đặt
Ví dụ
- $n = 6$: Tam giác $(3, 4, 5)$ có diện tích $6$. Điểm trên $E_6: y^2 = x^3 - 36x$:
\[ x = (5/2)^2 = 25/4, \quad y = 5(9 - 16)/8 = -35/8. \]Kiểm tra: $(25/4)^3 - 36 \cdot 25/4 = 15625/64 - 14400/64 = 1225/64 = (35/8)^2$. \checkmark
- $n = 5$: Tam giác $\left(\frac{3}{2}, \frac{20}{3}, \frac{41}{6}\right)$ có diện tích $\frac{3/2 \times 20/3}{2} = 5$. Ba cạnh đều hữu tỉ nhưng không nguyên!
- $n = 1$ không đồng dư: Fermat chứng minh (bằng descent vô hạn) rằng không tồn tại tam giác vuông cạnh hữu tỉ có diện tích $1$. Tương đương: $E_1: y^2 = x^3 - x$ có $\mathrm{rk} = 0$, chỉ có 4 điểm xoắn.
- Danh sách: Số đồng dư (squarefree) đầu tiên: $5, 6, 7, 13, 14, 15, 20, 21, 22, 23, 24, 28, 29, 30, \ldots$ Số không đồng dư: $1, 2, 3, 10, 11, 17, 19, 26, \ldots$
Ý nghĩa trực giác
- Hình dung: “Số nào là diện tích tam giác vuông cạnh hữu tỉ?” --- câu hỏi đơn giản mà ai cũng hiểu. Nhưng trả lời đầy đủ cho mọi $n$ đòi hỏi BSD!
- Lịch sử: Xuất hiện trong toán học Arab thế kỷ 10 (al-Khazin) và Fibonacci (1225, Liber Quadratorum). Fermat chứng minh $1, 2, 3$ không đồng dư. Đến thế kỷ 20, nhờ lý thuyết đường cong elliptic, ta mới hiểu cấu trúc tổng quát.
- Phép biến đổi kỳ diệu: “Tam giác vuông cạnh hữu tỉ” $\leftrightarrow$ “Điểm hữu tỉ trên đường cong elliptic” --- hai bài toán trông hoàn toàn khác nhau nhưng tương đương toán học.
Liên hệ với giả thuyết Birch--Dyer
- BSD quyết định: $n$ đồng dư $\iff \mathrm{rk}(E_n(\mathbb{Q})) \geq 1 \iff L(E_n, 1) = 0$ (theo BSD yếu). Vì $E_n$ có CM bởi $\mathbb{Z}[i]$, Coates--Wiles [coates-wiles1977] cho: $L(E_n, 1) \neq 0 \Rightarrow \mathrm{rk} = 0$.
- Tunnell + BSD: Tunnell (1983) đưa ra tiêu chuẩn đếm biểu diễn bởi dạng bậc hai để kiểm tra. Một chiều luôn đúng; chiều ngược đúng nếu BSD đúng.
- Kết quả thống kê: Bhargava--Shankar--Zhang cho thấy $\geq 66.48\%$ đường cong elliptic có hạng $\leq 1$ → phần lớn $n$ squarefree được Tunnell phân loại chính xác ngay cả khi chưa chứng minh BSD.
Định nghĩa
- $n$ đồng dư $\Rightarrow f(n) = \frac{1}{2}\, g(n)$.
- Nếu BSD đúng cho $E_n$: $f(n) = \frac{1}{2}\, g(n) \Rightarrow n$ đồng dư.
Ý tưởng chứng minh
- Công thức Waldspurger: Liên hệ $L(E_n, 1)$ với bình phương hệ số Fourier $c(n)$ của dạng modular nửa nguyên (half-integral weight $3/2$):
\[ L(E_n, 1) = \kappa \cdot |c(n)|^2 \cdot \frac{\sqrt{n}}{n} \]với $\kappa > 0$ là hằng số. Do đó $L(E_n, 1) = 0 \iff c(n) = 0$.
- Đếm biểu diễn: Hệ số $c(n)$ liên hệ với hiệu $f(n) - \frac{1}{2} g(n)$ qua chuỗi theta (theta series) của dạng bậc hai ternary $2x^2 + y^2 + 32z^2$ và $2x^2 + y^2 + 8z^2$.
- Coates--Wiles: Vì $E_n: y^2 = x^3 - n^2 x$ có CM bởi $\mathbb{Z}[i]$, ta biết $L(E_n, 1) \neq 0 \Rightarrow \mathrm{rk}(E_n(\mathbb{Q})) = 0$ [coates-wiles1977]. Chiều ngược ($L = 0 \Rightarrow \mathrm{rk} \geq 1$) chính là BSD.
Ví dụ
- $n = 1$ (lẻ): $g(1) = \#\{2x^2 + y^2 + 8z^2 = 1\} = 2$ (chỉ $x = z = 0, y = \pm 1$). $f(1) = \#\{2x^2 + y^2 + 32z^2 = 1\} = 2$ (cùng nghiệm). Kiểm tra: $f(1) = 2 \neq 1 = g(1)/2$, nên $1$ không đồng dư. \checkmark
- $n = 5$ (lẻ): $g(5) = 0$ (không có $(x,y,z) \in \mathbb{Z}^3$ thỏa $2x^2 + y^2 + 8z^2 = 5$). $f(5) = 0$. Kiểm tra: $0 = 0/2$ $\checkmark$, nên $5$ đồng dư (giả sử BSD). Thực tế: tam giác $(\frac{3}{2}, \frac{20}{3}, \frac{41}{6})$ có diện tích $5$. \checkmark
- $n = 3$ (lẻ): $g(3) = 4$ (nghiệm $(\pm 1, \pm 1, 0)$). $f(3) = 4$ (cùng nghiệm). Kiểm tra: $4 \neq 2 = 4/2$, nên $3$ không đồng dư. \checkmark
- Tốc độ: Đếm $f(n), g(n)$ chỉ cần duyệt $(x, y, z)$ với $|x|, |y|, |z| \leq \sqrt{n}$ --- thời gian $O(n^{3/2})$, rất nhanh trên máy tính. Đã kiểm tra cho mọi $n \leq 10^{12}$.
Ý nghĩa trực giác
- Hình dung: Tunnell biến bài toán “tìm tam giác vuông cạnh hữu tỉ” (rất khó) thành bài toán “đếm nghiệm phương trình bậc hai” (rất dễ). Như có “máy dò” --- nhập $n$, đếm hai con số $f(n)$ và $g(n)$, so sánh là biết ngay!
- Chuỗi kết nối: Số đồng dư $\to$ đường cong elliptic $E_n$ $\to$ hàm $L(E_n, s)$ $\to$ dạng modular trọng số $3/2$ (Waldspurger) $\to$ chuỗi theta $\to$ đếm biểu diễn bậc hai.
- Điều kiện BSD: Một chiều (không đồng dư $\Rightarrow$ điều kiện vi phạm) là vô điều kiện. Chiều ngược phụ thuộc BSD --- đây là ví dụ cụ thể nhất về “nếu BSD đúng thì ta giải được bài toán cổ điển”.
Liên hệ với giả thuyết Birch--Dyer
- Ứng dụng trực tiếp nhất: Tunnell là minh họa “nếu BSD đúng thì sao?” rõ ràng nhất --- ta sẽ có thuật toán $O(n^{3/2})$ phân loại mọi số đồng dư.
- Waldspurger + BSD: Công thức Waldspurger liên hệ $L(E, 1)$ với hệ số Fourier dạng modular nửa nguyên. Kết hợp BSD yếu ($L = 0 \iff \mathrm{rk} \geq 1$), ta “dịch” bài toán hạng thành bài toán đếm.
- Tình trạng: Với $\mathrm{rk} = 0$ (Coates--Wiles) và $\mathrm{rk} = 1$ (Gross--Zagier + Kolyvagin), phần lớn trường hợp đã được giải. Phần còn lại ($\mathrm{rk} \geq 2$) cần BSD đầy đủ.
Định nghĩa
Cho đường cong elliptic $E$ trên trường hữu hạn $\mathbb{F}_p$ (với $p$ nguyên tố lớn), cho hai điểm $P, Q \in E(\mathbb{F}_p)$ với $Q = [k]P$ (tức $Q = \underbrace{P + P + \cdots + P}_{k \text{ lần}}$). Tìm số nguyên $k$.
Tính chất:
- Chiều thuận dễ: Cho $P$ và $k$, tính $Q = [k]P$ bằng thuật toán double-and-add trong $O(\log k)$ phép cộng điểm (nhanh).
- Chiều ngược khó: Cho $P$ và $Q$, tìm $k$ --- không có thuật toán cổ điển hiệu quả. Thuật toán tốt nhất (Pollard's rho) có độ phức tạp $O(\sqrt{p})$, cần $\sim 2^{128}$ phép toán với $p \sim 2^{256}$.
- So sánh: Bài toán logarit rời rạc “thông thường” trên $\mathbb{F}_p^*$ (cho $g^k \equiv h \pmod{p}$, tìm $k$) có thuật toán index calculus thời gian dưới hàm mũ $L_p[1/3]$. ECDLP không có thuật toán dưới hàm mũ tổng quát --- đây là lợi thế chính.
Ví dụ
- Các điểm: liệt kê $(x, y)$ thỏa $y^2 \equiv x^3 + 2x + 3 \pmod{5}$:
- $x = 0$: $y^2 \equiv 3 \pmod{5}$ --- $3$ không là thặng dư bậc hai mod $5$ → không có điểm.
- $x = 1$: $y^2 \equiv 6 \equiv 1 \pmod{5}$ → $y = 1, 4$. Điểm: $(1, 1), (1, 4)$.
- $x = 2$: $y^2 \equiv 15 \equiv 0 \pmod{5}$ → $y = 0$. Điểm: $(2, 0)$.
- Tổng cộng: $E(\mathbb{F}_5) = \{\mathcal{O}, (1, 1), (1, 4), (2, 0)\}$, có $4$ phần tử.
- Nếu $P = (1, 1)$: tính $[2]P, [3]P$ bằng luật cộng → liệt kê bảng. ECDLP trên nhóm nhỏ ($4$ phần tử) thì dễ --- chỉ thử tối đa 4 lần. Nhưng với $p \sim 2^{256}$, nhóm có $\sim 2^{256}$ phần tử → không thể thử hết.
- Thực tế: Curve25519 (dùng trong Signal, TLS) có $p = 2^{255} - 19$, nhóm cỡ $\sim 2^{252}$. ECDLP cần $\sim 2^{126}$ phép toán --- vượt xa khả năng mọi siêu máy tính.
Ý nghĩa trực giác
- Hình dung: Nhân vô hướng $[k]P$ giống “nhảy $k$ bước trên đường cong”. Cho biết điểm đến $Q$, hỏi “nhảy bao nhiêu bước?” --- rất khó vì luật cộng trên EC “trộn” tọa độ phức tạp, không có cấu trúc để “quay ngược”.
- So với RSA: RSA dựa trên “nhân dễ, phân tích khó” ($n = pq$ → tìm $p, q$). ECC dựa trên “cộng điểm dễ, logarit rời rạc khó”. ECC cần khóa ngắn hơn nhiều: 256-bit ECC $\approx$ 3072-bit RSA về độ bảo mật.
- Tại sao EC đặc biệt? Nhóm $E(\mathbb{F}_p)$ có cấu trúc “phong phú nhưng không quá có quy luật” --- đủ cấu trúc để tính toán hiệu quả, nhưng không đủ để giải ECDLP nhanh. Đây là “điểm ngọt” giữa cấu trúc và hỗn loạn.
Liên hệ với giả thuyết Birch--Dyer
- Cùng đối tượng, khác trường: ECDLP nghiên cứu $E(\mathbb{F}_p)$ (trường hữu hạn --- mật mã), BSD nghiên cứu $E(\mathbb{Q})$ (trường hữu tỉ --- số học). Cấu trúc nhóm $E(\mathbb{F}_p)$ ảnh hưởng cả hai: $a_p = p + 1 - \#E(\mathbb{F}_p)$ vừa xuất hiện trong hàm $L$ (BSD) vừa quyết định bậc nhóm (mật mã).
- Frobenius: Tự đồng cấu Frobenius $\phi_p$ quyết định $\#E(\mathbb{F}_p) = p + 1 - a_p$, với $a_p$ là vết Frobenius. Cùng $a_p$ này xây dựng tích Euler của $L(E, s)$.
- Ứng dụng gián tiếp: Hiểu sâu $E(\mathbb{Q})$ qua BSD có thể dẫn đến hiểu tốt hơn cấu trúc $E(\mathbb{F}_p)$ --- và ngược lại, dữ liệu từ ECDLP/mật mã giúp kiểm nghiệm BSD.
Định nghĩa
Thiết lập: Chọn đường cong $E$ trên $\mathbb{F}_p$ và điểm sinh $G \in E(\mathbb{F}_p)$ có bậc lớn $n$.
Trao đổi khóa Diffie--Hellman trên EC (ECDH):
- Alice chọn $a$ ngẫu nhiên, gửi $A = [a]G$ cho Bob.
- Bob chọn $b$ ngẫu nhiên, gửi $B = [b]G$ cho Alice.
- Khóa chung: Alice tính $[a]B = [ab]G$, Bob tính $[b]A = [ab]G$. Cùng kết quả!
- Kẻ nghe lén biết $A, B, G$ nhưng không biết $a, b$ (vì ECDLP khó).
Chữ ký số ECDSA (dùng trong Bitcoin, TLS): Dùng khóa bí mật $d$, khóa công khai $Q = [d]G$. Ký bằng $d$, xác minh bằng $Q$ --- an toàn vì ECDLP ngăn tìm $d$ từ $Q$.
Các đường cong tiêu chuẩn:
- NIST P-256: $y^2 = x^3 - 3x + b$ trên $\mathbb{F}_p$ với $p = 2^{256} - 2^{224} + 2^{192} + 2^{96} - 1$.
- Curve25519: $y^2 = x^3 + 486662x^2 + x$ trên $\mathbb{F}_p$ với $p = 2^{255} - 19$ (Bernstein, 2006).
- secp256k1: $y^2 = x^3 + 7$ trên $\mathbb{F}_p$ (dùng trong Bitcoin).
Ví dụ
- ECDH nhỏ: $E: y^2 = x^3 + x + 6$ trên $\mathbb{F}_{11}$, $G = (2, 7)$ có bậc $7$.
- Alice: $a = 3$, $A = [3]G = (7, 2)$.
- Bob: $b = 5$, $B = [5]G = (8, 3)$.
- Khóa chung: $[3]B = [5]A = [15]G = [15 \bmod 7]G = [1]G = (2, 7)$.
- Lợi thế kích thước khóa: {lcc} Độ bảo mật & RSA (bit) & ECC (bit) \\ \hline 128 bit & 3072 & 256 \\ 192 bit & 7680 & 384 \\ 256 bit & 15360 & 512 ECC cần khóa ngắn hơn $\sim 12$ lần, tiết kiệm băng thông và tính toán.
- Ứng dụng: TLS/HTTPS (hầu hết trình duyệt), Bitcoin và Ethereum (secp256k1), Signal/WhatsApp (Curve25519), hộ chiếu điện tử, thẻ thông minh.
Ý nghĩa trực giác
- Hình dung: Đường cong elliptic giống “bàn bi-da cong” --- cộng hai điểm bằng “bắn bi” (kẻ đường thẳng, lấy giao điểm thứ ba, đối xứng). Nhân vô hướng = bắn $k$ lần. Biết viên bi cuối cùng ở đâu, hỏi “bắn bao nhiêu lần?” --- gần như không thể trả lời.
- Tại sao ECC thay RSA? RSA yếu dần vì thuật toán phân tích số (NFS) ngày càng nhanh. ECDLP không có thuật toán dưới hàm mũ tổng quát → an toàn hơn với khóa ngắn hơn nhiều → nhanh hơn, tiết kiệm hơn.
- Mối đe dọa lượng tử: Thuật toán Shor (máy tính lượng tử) phá được cả RSA và ECDLP. Nhưng trước khi có máy tính lượng tử đủ mạnh, ECC vẫn là lựa chọn tốt nhất cho mật mã khóa công khai.
Liên hệ với giả thuyết Birch--Dyer
- Cùng toán học: ECC sử dụng $E(\mathbb{F}_p)$, BSD nghiên cứu $E(\mathbb{Q})$ --- cùng lý thuyết đường cong elliptic. Các khái niệm (luật nhóm, Frobenius, conductor) xuất hiện trong cả hai.
- Lý thuyết nuôi ứng dụng: Nghiên cứu thuần túy về EC (Mordell--Weil, Hasse bound, modularity) tạo nền tảng cho ứng dụng mật mã. Ngược lại, nhu cầu mật mã thúc đẩy nghiên cứu cấu trúc $E(\mathbb{F}_p)$.
- Đường cong CM: Đường cong có nhân phức (CM) đặc biệt quan trọng cả trong BSD (Coates--Wiles, đơn vị elliptic) và mật mã (dễ tạo đường cong có bậc nhóm mong muốn). secp256k1 ($y^2 = x^3 + 7$) không có CM; NIST P-256 cũng không; nhưng đường cong CM có vai trò lý thuyết quan trọng.
Định nghĩa
Ý tưởng: Cho $N = pq$ cần phân tích. Chọn ngẫu nhiên đường cong elliptic $E$ modulo $N$ và điểm $P \in E(\mathbb{Z}/N\mathbb{Z})$. Tính $[B!]P$ cho $B$ đủ lớn. Nếu “vô tình” bậc của $P$ trong $E(\mathbb{F}_p)$ chia hết $B!$ nhưng bậc trong $E(\mathbb{F}_q)$ không, thì phép tính sẽ gặp “phép chia cho $0$ modulo $p$” --- tức ta tìm được $\gcd$ không tầm thường, phân tích được $N$.
Thuật toán ECM (phiên bản đơn giản):
- Chọn ngẫu nhiên $a, x_0, y_0$; đặt $b = y_0^2 - x_0^3 - ax_0 \pmod{N}$.
- Đường cong $E: y^2 = x^3 + ax + b \pmod{N}$, điểm $P = (x_0, y_0)$.
- Tính $Q = [B!]P$ trên $E(\mathbb{Z}/N\mathbb{Z})$ bằng double-and-add.
- Nếu tại bước nào cần nghịch đảo $d \pmod{N}$ mà $1 < \gcd(d, N) < N$: tìm được thừa số!
- Nếu không: chọn $E$ khác, thử lại.
Độ phức tạp: $O\!\left(\exp\!\left(c\sqrt{\ln p \cdot \ln \ln p}\right)\right)$ với $p$ là thừa số nhỏ nhất --- phụ thuộc vào $p$, không phụ thuộc vào $N$. Đây là lợi thế quyết định so với NFS (phụ thuộc $N$).
Ví dụ
- Phân tích $N = 5959$: Chọn $E: y^2 = x^3 + 5x + 8 \pmod{5959}$, $P = (1, 4)$.
- Tính $[2]P$: cần nghịch đảo $2y = 8$ mod $5959$. $\gcd(8, 5959) = 1$, OK → $[2]P$ tính được.
- Tính $[3!]P = [6]P$: giả sử tại bước nào đó cần nghịch đảo $d$ mod $5959$ mà $\gcd(d, 5959) = 59$. → Tìm được: $5959 = 59 \times 101$.
- Kỷ lục: ECM đã tìm thừa số 83 chữ số (274 bit) của số $7^{337} + 1$ (2013). Với thừa số $\leq 60$ chữ số, ECM là phương pháp nhanh nhất.
- So sánh:
- Trial division: $O(\sqrt{N})$ --- chỉ khả thi cho $N$ nhỏ.
- Pollard $p-1$: Dùng $\mathbb{F}_p^*$ thay vì $E(\mathbb{F}_p)$. Chỉ hiệu quả nếu $p - 1$ smooth.
- ECM: Dùng $\#E(\mathbb{F}_p) \approx p + 1 - a_p$ --- bậc nhóm thay đổi khi đổi $E$! Nếu $\#E(\mathbb{F}_p)$ “vô tình” smooth → thành công. Đổi $E$ cho cơ hội mới.
- NFS: $O(\exp(c \cdot (\ln N)^{1/3}(\ln \ln N)^{2/3}))$ --- nhanh hơn cho $N$ rất lớn, nhưng phụ thuộc $N$ chứ không $p$.
Ý nghĩa trực giác
- Hình dung: ECM giống “thử chìa khóa”. Mỗi đường cong $E$ là một “chiếc chìa”. Bậc nhóm $\#E(\mathbb{F}_p) \approx p \pm 2\sqrt{p}$ (Hasse) thay đổi theo $E$. Nếu bậc “smooth” (chia hết bởi các số nguyên tố nhỏ), thì chiếc chìa đó mở được cửa. Ta thử nhiều chìa cho đến khi tìm được chiếc đúng.
- Tại sao EC đặc biệt? Pollard $p-1$ cố định nhóm $\mathbb{F}_p^*$ (bậc $p - 1$). ECM cho phép thay đổi nhóm bằng cách đổi $E$ --- mỗi lần thử là một nhóm khác, tăng xác suất “trúng”.
- Định lý Hasse: $\#E(\mathbb{F}_p) \in [p + 1 - 2\sqrt{p}, \; p + 1 + 2\sqrt{p}]$. Khoảng $4\sqrt{p}$ giá trị khả dĩ → đủ đa dạng để “mò” bậc smooth.
Liên hệ với giả thuyết Birch--Dyer
- Cùng lý thuyết: ECM dùng đường cong elliptic trên $\mathbb{F}_p$ + cấu trúc nhóm + Hasse bound. BSD dùng cùng đối tượng nhưng nghiên cứu $E(\mathbb{Q})$ và hàm $L$.
- Frobenius và $a_p$: Bậc $\#E(\mathbb{F}_p) = p + 1 - a_p$ vừa quyết định hiệu quả ECM (cần $\#E(\mathbb{F}_p)$ smooth) vừa xây dựng hàm $L$ trong BSD ($L(E, s) = \prod_p$ tích Euler với $a_p$).
- Ý nghĩa triết học: Một lý thuyết thuần túy (EC trên $\mathbb{Q}$, BSD) dẫn đến ứng dụng bất ngờ: phân tích thừa số (ECM), mật mã (ECC). Đây minh chứng rằng nghiên cứu cơ bản trong lý thuyết số luôn có giá trị ứng dụng --- dù có thể phải đợi hàng thế kỷ.
Định nghĩa
- Trung bình $|\mathrm{Sel}_2(E)|$: Khi $E$ chạy qua tất cả đường cong elliptic (sắp theo chiều cao), trung bình $|\mathrm{Sel}_2(E)| = 3$.
- Trung bình $|\mathrm{Sel}_3(E)| = 4$, $|\mathrm{Sel}_4(E)| = 7$, $|\mathrm{Sel}_5(E)| = 6$.
- Công thức tổng quát: $\mathrm{avg}\,|\mathrm{Sel}_n(E)| = \sigma(n) = \sum_{d \mid n} d$ (tổng ước).
Hệ quả: Hạng trung bình $\mathrm{avg}\,\mathrm{rk}(E(\mathbb{Q})) \leq 0.885$ (từ $\mathrm{Sel}_5$). Nói riêng, phần lớn đường cong elliptic có hạng $\leq 1$.
Phương pháp: Bhargava--Shankar sử dụng hình học của số (geometry of numbers) --- đếm các điểm lưới trong vùng thay vì làm việc trực tiếp với nhóm Selmer. Cụ thể:
- $\mathrm{Sel}_2$ tham số hóa bởi dạng nhị phần bậc bốn (binary quartic forms).
- $\mathrm{Sel}_3$ bởi dạng khối nhị phần bậc ba (pairs of ternary quadratic forms).
- Đếm quỹ đạo của các nhóm tuyến tính trên không gian này → trung bình Selmer.
Ví dụ
- $\mathrm{avg}\,|\mathrm{Sel}_2| = 3$: Nhóm Selmer $\mathrm{Sel}_2(E)$ chứa $E(\mathbb{Q})/2E(\mathbb{Q})$ (kích thước $2^{r+t}$ với $r = \mathrm{rk}$, $t$ liên quan xoắn) và phần $\mathrm{Sha}[2]$. Trung bình kích thước $= 3$ gợi ý rằng “hầu hết EC có $|\mathrm{Sel}_2| = 1$ (hạng 0) hoặc $2$ (hạng 1), ít EC có Selmer lớn”.
- So sánh $\sigma(n)$: {cccc} $n$ & $\sigma(n)$ & $\mathrm{avg}\,|\mathrm{Sel}_n|$ & Cận hạng \\ \hline 2 & 3 & 3 & 1.5 \\ 3 & 4 & 4 & 1.17 \\ 4 & 7 & 7 & 0.998 \\ 5 & 6 & 6 & 0.885 Cận hạng giảm khi $n$ tăng --- nhưng vẫn $> 0$. Heuristic PPVW dự đoán hạng trung bình thực sự là $1/2$.
- Tại sao $\sigma(n)$? Đây là “số phần tử trung bình” của nhóm Abel hữu hạn ngẫu nhiên bậc $n$, theo mô hình Cohen--Lenstra. Selmer “hành xử” như nhóm ngẫu nhiên!
Ý nghĩa trực giác
- Hình dung: Trước Bhargava, không ai biết hạng trung bình hữu hạn hay vô hạn. Bhargava--Shankar chứng minh: “đường cong elliptic trung bình có ít điểm hữu tỉ” --- hạng trung bình $\leq 0.885$.
- Phương pháp mới: Thay vì nghiên cứu từng EC riêng lẻ (“kính hiển vi”), Bhargava nhìn toàn bộ EC cùng lúc (“ống nhòm thống kê”) bằng cách đếm đối tượng đại số trong không gian lưới.
- Ý nghĩa sâu: Kết quả gợi ý rằng “hầu hết EC có hạng 0 hoặc 1” --- phù hợp với phỏng đoán Goldfeld và heuristic PPVW. Nếu đúng, BSD quyết định được hạng cho “hầu hết” EC (vì $\mathrm{rk} \leq 1$ đã được giải bởi Gross--Zagier--Kolyvagin).
Liên hệ với giả thuyết Birch--Dyer
- Kết hợp Bhargava--Shankar + Gross--Zagier--Kolyvagin: Nếu $\mathrm{Sel}_5$ nhỏ thì $\mathrm{rk} \leq 1$ → BSD yếu đúng cho EC đó. Kết quả: “phần lớn” EC thỏa mãn BSD yếu.
- Bhargava--Skinner--Zhang: Kết hợp thêm Skinner → $\geq 66.48\%$ EC thỏa BSD (xem STT 212).
- Sha: Trung bình Selmer cũng cho thông tin về $\mathrm{Sha}$ --- nếu $|\mathrm{Sel}_n|$ lớn nhưng $\mathrm{rk}$ nhỏ, phần dư là $\mathrm{Sha}$. Bhargava--Shankar gợi ý $\mathrm{Sha}$ “thường nhỏ”.
Định nghĩa
Cụ thể, họ chứng minh:
- $\geq 16.50\%$ EC có $\mathrm{rk} = 0$ và $L(E, 1) \neq 0$ (BSD đúng hiển nhiên).
- $\geq 49.98\%$ EC có $\mathrm{rk} \leq 1$ và $\mathrm{ord}_{s=1} L(E, s) = \mathrm{rk}$ (BSD yếu đúng, dùng Gross--Zagier--Kolyvagin).
Thành phần chứng minh
- Bhargava--Shankar: Trung bình $|\mathrm{Sel}_5| = 6$ → phần lớn EC có $\mathrm{rk} \leq 1$.
- Gross--Zagier + Kolyvagin: Nếu $\mathrm{ord}_{s=1} L(E, s) \leq 1$ thì $\mathrm{rk} = \mathrm{ord}_{s=1} L(E, s)$ và $|\mathrm{Sha}| < \infty$.
- Skinner + Zhang: “Converse theorems” --- nếu $\mathrm{rk} = 0$ (hoặc 1) và một số điều kiện kỹ thuật, thì $\mathrm{ord}_{s=1} L(E, s) = 0$ (hoặc 1). Đặc biệt, Skinner (2014): nếu $\mathrm{rk} = 0$, $|\mathrm{Sha}| < \infty$, và $\bar{\rho}_{E,p}$ surjective cho $p \geq 3$, thì $L(E, 1) \neq 0$.
Ví dụ
- Ý nghĩa thống kê: Trong 10 đường cong elliptic ngẫu nhiên, ta kỳ vọng ít nhất 6--7 cái thỏa BSD. Con số thực tế có thể cao hơn (heuristic gợi ý $\sim 100\%$), nhưng $66.48\%$ là cận dưới được chứng minh.
- Phân tách: Khoảng $50\%$ EC có hạng 0 (BSD đúng nhờ Kolyvagin), $\sim 50\%$ có hạng 1 (BSD đúng nhờ Gross--Zagier). Hạng $\geq 2$ rất hiếm (mật độ 0 theo Bhargava).
- Trích dẫn Bhargava (2014): “Kết quả gợi ý rằng BSD đúng cho 100% đường cong elliptic --- nhưng chứng minh 100% còn rất xa.”
Ý nghĩa trực giác
- Hình dung: Nếu BSD là “tường thành”, thì $2/3$ tường đã được xây xong. Phần còn lại ($\mathrm{rk} \geq 2$ và các trường hợp kỹ thuật) là “viên gạch cuối” khó nhất.
- Tại sao chưa 100%? Vì (1) EC hạng $\geq 2$ chưa có công cụ (Gross--Zagier chỉ cho hạng 1); (2) điều kiện kỹ thuật của Skinner (biểu diễn thặng dư surjective) không phải lúc nào cũng thỏa.
- Tiến bộ liên tục: Mỗi cải thiện nhỏ (ví dụ mở rộng converse theorem) sẽ nâng $66.48\%$ lên --- mục tiêu cuối cùng là $100\%$.
Liên hệ với giả thuyết Birch--Dyer
- Bằng chứng mạnh nhất: $66.48\%$ là con số lớn nhất từng chứng minh cho BSD --- minh chứng rằng BSD “gần đúng” dù chưa chứng minh hoàn toàn.
- BSD yếu vs mạnh: BSZ chứng minh BSD yếu ($\mathrm{ord} = \mathrm{rk}$) cho $\geq 66.48\%$. BSD mạnh (công thức đầy đủ cho $L^{(r)}(E,1)/r!$) khó hơn nhiều, chỉ biết cho $\mathrm{rk} = 0, 1$ (và cần thêm Sha hữu hạn).
- Hướng phát triển: Smith (2022) chứng minh Goldfeld conjecture cho $\mathrm{Sel}_2$ → $50\%$ EC hạng 0, $50\%$ hạng 1 (trong họ twist). Kết hợp sẽ cho BSD cho $100\%$ twist!
Định nghĩa
- Goldfeld conjecture cho $\mathrm{Sel}_2$: Trong họ twist, mật độ $d$ mà $|\mathrm{Sel}_2(E_d)| = 1$ (tức $\mathrm{rk} = 0$ và $\mathrm{Sha}[2] = 0$) là $50\%$.
- Mật độ $d$ mà $|\mathrm{Sel}_2(E_d)| = 2$ (gợi ý $\mathrm{rk} = 1$, $\mathrm{Sha}[2] = 0$) là $50\%$.
- Mật độ $d$ mà $\mathrm{rk}(E_d(\mathbb{Q})) \geq 2$ là $0\%$ (giả sử Sha hữu hạn).
Kết quả này chứng minh phỏng đoán Goldfeld (1979): trong mỗi họ twist, $50\%$ có hạng 0 và $50\%$ có hạng 1 --- nếu $\mathrm{Sha}$ hữu hạn.
Phương pháp: Smith sử dụng lý thuyết xác suất trên nhóm Selmer, mở rộng công trình của Heath-Brown và Swinnerton-Dyer về phân bố $\mathrm{Sel}_2$ trong họ twist.
Ví dụ
- $E: y^2 = x^3 - x$ (conductor 32, CM). Twist $E_d: dy^2 = x^3 - x$.
- $d = -1$: $\mathrm{rk}(E_{-1}) = 0$ (Fermat, $-1$ không đồng dư).
- $d = 5$: $\mathrm{rk}(E_5) = 1$ ($5$ đồng dư).
- $d = 6$: $\mathrm{rk}(E_6) = 1$ ($6$ đồng dư).
- $d = 34$: $\mathrm{rk}(E_{34}) = 2$ (hiếm!).
- Dữ liệu thực nghiệm: Với $E: y^2 = x^3 - x$ và $1 \leq d \leq 10^6$ squarefree:
- $\mathrm{rk} = 0$: $\sim 50.1\%$
- $\mathrm{rk} = 1$: $\sim 49.8\%$
- $\mathrm{rk} \geq 2$: $\sim 0.1\%$ (giảm dần)
Ý nghĩa trực giác
- Hình dung: Trong họ twist, hạng EC giống “tung đồng xu” --- $50\%$ hạng 0 (“ngửa”), $50\%$ hạng 1 (“sấp”). Hạng $\geq 2$ giống “đồng xu đứng cạnh” --- xác suất 0.
- Selmer như nhóm ngẫu nhiên: Smith chứng minh $\mathrm{Sel}_2$ phân bố như “nhóm Abel $2$-sơ cấp ngẫu nhiên” theo mô hình Cohen--Lenstra --- xác suất $|\mathrm{Sel}_2| = 2^k$ giảm cực nhanh theo $k$.
- Hoàn thiện bức tranh: Bhargava--Shankar (trung bình) + Smith (phân bố trong twist) + heuristic PPVW (phân bố tổng quát) → bức tranh thống kê về hạng EC gần hoàn chỉnh.
Liên hệ với giả thuyết Birch--Dyer
- BSD cho 100% twist: Smith + Gross--Zagier--Kolyvagin + Skinner → BSD yếu đúng cho “100% twist” (giả sử Sha hữu hạn). Đây là kết quả mật độ mạnh nhất cho BSD.
- Goldfeld gốc: Phỏng đoán Goldfeld gốc nói về bậc triệt tiêu $\mathrm{ord}_{s=1} L(E_d, s)$. Smith chứng minh cho Selmer (tương đương nếu BSD + Sha hữu hạn). Chiều “Selmer $\to$ $L$-function” cần BSD.
- Hạng $\geq 2$ mật độ 0: Gợi ý rằng “phần chưa giải của BSD” (hạng $\geq 2$) ảnh hưởng “tập đo 0” --- dù vẫn khó chứng minh cho từng EC cụ thể.
Định nghĩa
- Mỗi quỹ đạo $G \cdot x$ giao $\mathcal{F}$ ít nhất một điểm (surjective).
- Nếu $x, y \in \mathcal{F}$ và $g \cdot x = y$ với $g \in G$, thì $x = y$ hoặc $x, y$ nằm trên biên (gần injective).
Ví dụ quan trọng nhất: Miền cơ bản chuẩn của $\mathrm{SL}_2(\mathbb{Z})$ tác động trên nửa mặt phẳng trên $\mathcal{H} = \{\tau \in \mathbb{C} : \mathrm{Im}(\tau) > 0\}$:
Ví dụ
- $\mathrm{SL}_2(\mathbb{Z})$ trên $\mathcal{H}$: Miền $\mathcal{F}$ hình “mũi nhọn” --- biên trái $\mathrm{Re}(\tau) = -1/2$, biên phải $\mathrm{Re}(\tau) = 1/2$, biên dưới $|\tau| = 1$. Hai phép sinh: $T: \tau \mapsto \tau + 1$ (dịch ngang) và $S: \tau \mapsto -1/\tau$ (nghịch đảo + phản xạ). Mọi $\tau$ đưa về $\mathcal{F}$ bằng tổ hợp $S, T$.
- Lưới $\mathbb{Z}^n$ trên $\mathbb{R}^n$: Miền cơ bản = khối đơn vị $[0, 1)^n$. Mỗi vector $v \in \mathbb{R}^n$ tương đương (modulo $\mathbb{Z}^n$) với đúng một vector trong $[0, 1)^n$.
- Nhóm $\Gamma_0(N)$ trên $\mathcal{H}$: Miền cơ bản có diện tích $\frac{\pi}{3} N \prod_{p \mid N}(1 + 1/p)$ (hyperbolic) --- liên hệ trực tiếp với chỉ số $[\mathrm{SL}_2(\mathbb{Z}) : \Gamma_0(N)]$ và số chiều không gian dạng modular.
Ý nghĩa trực giác
- Hình dung: Giống “ô gạch” lát sàn. Nhóm $G$ “dán” các bản sao của $\mathcal{F}$ khít nhau phủ kín $X$. Thay vì nghiên cứu toàn bộ $X$ (quá lớn), ta chỉ cần hiểu $\mathcal{F}$ (nhỏ, gọn).
- Không gian thương: $X/G \cong \mathcal{F}/\!\sim$ --- miền cơ bản “đại diện” cho không gian thương. Ví dụ $\mathcal{H}/\mathrm{SL}_2(\mathbb{Z}) \cong \mathbb{C}$ (qua $j$-bất biến), tức mọi đường cong elliptic trên $\mathbb{C}$ (lên đến đẳng cấu) tương ứng một điểm trong $\mathcal{F}$.
- Bhargava dùng: Trong geometry of numbers, Bhargava đếm điểm lưới trong miền cơ bản của tác động nhóm trên không gian dạng bậc hai/bậc ba → tính trung bình Selmer.
Liên hệ với giả thuyết Birch--Dyer
- Dạng modular: Dạng modular $f(\tau)$ sống trên $\mathcal{H}/\Gamma_0(N)$ --- để hiểu $f$, ta nghiên cứu trên miền cơ bản $\mathcal{F}_0(N)$. Tích phân $\int_{\mathcal{F}_0(N)} |f(\tau)|^2 \, d\mu$ cho tích Petersson.
- Bhargava--Shankar: Miền cơ bản của $\mathrm{GL}_2(\mathbb{Z})$ (hoặc $\mathrm{SL}_2(\mathbb{Z}) \times \mathrm{SL}_3(\mathbb{Z})$) tác động trên không gian dạng → đếm phần tử Selmer → trung bình hạng → BSD cho phần lớn EC.
- $j$-bất biến: $\mathcal{H}/\mathrm{SL}_2(\mathbb{Z}) \to \mathbb{C}$ qua $j(\tau)$ phân loại EC trên $\mathbb{C}$. Đường cong modular $X_0(N) = \mathcal{H}/\Gamma_0(N)$ liên hệ trực tiếp với modularity theorem (nền tảng BSD).
Định nghĩa
Dạng mạnh: Nếu $S$ đóng, thì $\mathrm{vol}(S) \geq 2^n \cdot V$ là đủ.
Hệ quả cổ điển: Mọi trường số bậc $n > 1$ trên $\mathbb{Q}$ đều có biệt thức $|d_K| > 1$, tức luôn tồn tại nguyên tố phân nhánh.
Ví dụ
- Trong $\mathbb{R}^2$: Lưới $\mathbb{Z}^2$, $V = 1$. Hình tròn bán kính $r$: $\mathrm{vol} = \pi r^2$. Cần $\pi r^2 > 4$, tức $r > 2/\sqrt{\pi} \approx 1.13$. Hình tròn bán kính $1.2$ chứa các điểm $(\pm 1, 0), (0, \pm 1)$. \checkmark
- Biểu diễn bởi dạng bậc hai: Để chứng minh “mọi số nguyên tố $p \equiv 1 \pmod{4}$ là tổng hai bình phương” ($p = a^2 + b^2$), Minkowski dùng: lưới $\Lambda = \{(a, b) : a \equiv rb \pmod{p}\}$ (với $r^2 \equiv -1 \pmod{p}$) có $V = p$. Hình tròn bán kính $\sqrt{2p}$: $\mathrm{vol} = 2\pi p > 4p$. → Tồn tại $(a, b) \neq (0, 0)$ trong hình tròn $\cap$ lưới, tức $a^2 + b^2 < 2p$ và $a^2 + b^2 \equiv 0 \pmod{p}$ → $a^2 + b^2 = p$.
- Bhargava dùng Minkowski mở rộng: Đếm điểm lưới trong “miền cơ bản” phóng to/biến dạng → đếm dạng nhị phần bậc bốn/bậc ba → đếm phần tử Selmer → trung bình hạng.
Ý nghĩa trực giác
- Hình dung: Nếu “cái lưới” mau (thể tích ô nhỏ) và “cái túi” to (thể tích lớn), thì túi chắc chắn “bắt” được ít nhất một điểm lưới. Nguyên lý “pigeonhole” hình học!
- Sức mạnh: Chứng minh tồn tại mà không cần tìm --- công cụ phi constructive nhưng cực kỳ mạnh. Nhiều định lý lý thuyết số (biểu diễn bậc hai, cận biệt thức) đều dùng Minkowski.
- Nền tảng geometry of numbers: Minkowski sáng lập hình học của số (1896). 120 năm sau, Bhargava mở rộng phương pháp này để giải quyết bài toán Selmer --- minh chứng sức sống bền bỉ.
Liên hệ với giả thuyết Birch--Dyer
- Bhargava--Shankar: Đếm quỹ đạo dạng nhị phần bậc bốn bằng “Minkowski mở rộng” → trung bình $|\mathrm{Sel}_2| = 3$ → cận hạng → BSD cho phần lớn EC.
- Hình học của số: Minkowski $\to$ Davenport (1950s, đếm dạng bậc ba) $\to$ Bhargava (2000s, đếm dạng bậc $n$, liên hệ Selmer) --- dòng chảy 120 năm dẫn đến BSD.
- Nguyên lý cục bộ--toàn cục: Minkowski cũng liên hệ với Hasse principle --- “tồn tại nghiệm cục bộ mọi nơi $\Rightarrow$ tồn tại nghiệm toàn cục?” Sha đo “lỗi” của nguyên lý này.
Định nghĩa
- Biểu diễn thặng dư $\bar{\rho}_{E,p} : G_{\mathbb{Q}} \to \mathrm{GL}_2(\mathbb{F}_p)$ là surjective.
- Tồn tại nguyên tố $\ell \| N$ ($\ell$ chia đúng $N$ một lần) sao cho $\bar{\rho}_{E,p}$ ramified tại $\ell$.
Hệ quả cho BSD: Nếu $L(E, 1) \neq 0$ (và các điều kiện trên), thì:
Ví dụ
- $E = $ 37a1: $y^2 + y = x^3 - x$, conductor $37$, $\mathrm{rk} = 1$. Với $p = 5$: $\bar{\rho}_{E,5}$ surjective (kiểm tra), $37 \| N$. Skinner--Urban áp dụng → IMC đúng cho $(E, 5)$ → BSD mạnh phần $5$.
- $E = $ 11a1: $y^2 + y = x^3 - x^2 - 10x - 20$, conductor $11$, $\mathrm{rk} = 0$. $L(E, 1)/\Omega_E = 1/5$. Với $p = 3$: IMC đúng → $|\mathrm{Sha}|_3 = 1$, kiểm chứng BSD mạnh phần $3$.
- Kết hợp nhiều $p$: Áp dụng Skinner--Urban cho mọi $p$ tốt → BSD mạnh “gần hoàn toàn” (trừ $p = 2$ và $p$ xấu). Cùng Kato (phần “$\leq$”) → đẳng thức cho hầu hết $p$.
Ý nghĩa trực giác
- Hình dung: IMC nói “hai thế giới” --- thế giới đại số (Selmer $p$-adic) và thế giới giải tích (hàm $L$ $p$-adic) --- “bằng nhau” trong đại số Iwasawa. Đây là phiên bản $p$-adic của BSD.
- Lý thuyết Iwasawa cổ điển: Iwasawa (1960s) chứng minh “IMC cho nhóm lớp” (Mazur--Wiles, 1984). Skinner--Urban mở rộng lên $\mathrm{GL}_2$ (đường cong elliptic) --- khó hơn nhiều bậc.
- Kỹ thuật: Dùng “$p$-adic deformation” của dạng modular trên nhóm unitary $\mathrm{GU}(2,2)$ --- kết hợp lý thuyết Iwasawa, dạng tự đẳng cấu, và hình học đại số ở mức cao nhất.
Liên hệ với giả thuyết Birch--Dyer
- BSD mạnh phần $p$: Kết hợp IMC (Skinner--Urban, chiều “$\geq$”) + Kato (chiều “$\leq$”) → đẳng thức $p$-adic → BSD mạnh phần $p$.
- Converse theorem (Skinner, 2014, 2020): Nếu $\mathrm{rk}(E(\mathbb{Q})) = 0$ và $|\mathrm{Sha}| < \infty$, cùng điều kiện kỹ thuật → $L(E, 1) \neq 0$. Đây là “chiều ngược” của Kolyvagin.
- BSZ 66.48%: Converse theorem của Skinner là thành phần then chốt trong chứng minh “$\geq 66.48\%$ EC thỏa BSD” (Bhargava--Skinner--Zhang).
Định nghĩa
Phiên bản 2014: Nếu $\mathrm{rk}(E(\mathbb{Q})) = 0$ và tồn tại $p \geq 3$ sao cho:
- $E$ có good ordinary reduction tại $p$,
- $\bar{\rho}_{E,p}$ surjective,
- Tồn tại $\ell \| N_E$ với $\bar{\rho}_{E,p}$ ramified tại $\ell$,
Phiên bản mạnh (2020): Nếu thêm $|\mathrm{Sha}(E/\mathbb{Q})| < \infty$, thì kết luận mạnh hơn: $\mathrm{ord}_{s=1} L(E, s) = \mathrm{rk}(E(\mathbb{Q}))$ (BSD yếu) và BSD mạnh phần $p$.
So sánh:
- Kolyvagin (1990): $L(E, 1) \neq 0 \Rightarrow \mathrm{rk} = 0$ và $|\mathrm{Sha}| < \infty$.
- Skinner (2014): $\mathrm{rk} = 0$ + điều kiện $\Rightarrow L(E, 1) \neq 0$.
Ví dụ
- $E = $ 11a1: $\mathrm{rk} = 0$, $p = 3$: good ordinary, $\bar{\rho}_{E,3}$ surjective, $11 \| N$. Skinner → $L(E, 1) \neq 0$. Thực tế: $L(E, 1)/\Omega_E = 1/5 \neq 0$. \checkmark
- Tại sao quan trọng? Kolyvagin đi “từ $L$ đến hạng” ($L \neq 0 \Rightarrow \mathrm{rk} = 0$). Skinner đi ngược (“từ hạng đến $L$”). Hai chiều cùng nhau cho tương đương: cột trụ BSD yếu cho $\mathrm{rk} = 0$.
- BSZ: Bhargava--Shankar cho “phần lớn EC có $\mathrm{rk} \leq 1$”. Skinner converse cho “$\mathrm{rk} = 0 \Rightarrow L \neq 0$” → BSD yếu cho phần lớn EC hạng 0. Kết hợp GZK (hạng 1) → $\geq 66.48\%$ thỏa BSD.
Ý nghĩa trực giác
- Hình dung: BSD nói “hạng $=$ bậc triệt tiêu $L$”. Gross--Zagier--Kolyvagin cho chiều “$\leq$” ($\mathrm{ord} \leq 1 \Rightarrow \mathrm{rk} = \mathrm{ord}$). Skinner cho chiều “$\geq$” ($\mathrm{rk} \leq 1 \Rightarrow \mathrm{ord} \geq \mathrm{rk}$). Hai chiều kết hợp → đẳng thức (BSD yếu cho $\mathrm{rk} \leq 1$).
- Khó ở đâu? “Từ $L$ đến hạng” dùng hệ thống Euler (Kolyvagin). “Từ hạng đến $L$” cần xây dựng phần tử phù hợp trong đại số Iwasawa → kỹ thuật Skinner--Urban ($p$-adic deformation trên $\mathrm{GU}(2,2)$).
- Tương lai: Mở rộng converse theorem cho mọi $p$ (kể cả $p = 2$) và giảm điều kiện kỹ thuật → nâng $66.48\%$ lên.
Liên hệ với giả thuyết Birch--Dyer
- Thành phần then chốt: Converse theorem là “mảnh ghép cuối” để kết hợp Bhargava + GZK → BSD cho phần lớn EC. Không có Skinner, BSZ không đạt $66.48\%$.
- BSD mạnh phần $p$: Phiên bản 2020 không chỉ cho $\mathrm{ord} = \mathrm{rk}$ mà còn kiểm tra công thức BSD mạnh modulo $p$ --- tiến gần hơn đến BSD hoàn toàn.
- Hạn chế: Chỉ áp dụng cho $\mathrm{rk} \leq 1$ và cần điều kiện (surjective, ramified). $\mathrm{rk} \geq 2$ vẫn ngoài tầm --- đây là rào cản lớn nhất.
Định nghĩa
Ngữ cảnh Wiles: Cho $E/\mathbb{Q}$ và biểu diễn thặng dư $\bar{\rho}_{E,p}: G_{\mathbb{Q}} \to \mathrm{GL}_2(\mathbb{F}_p)$.
- Phía Galois: Vành biến dạng $R$ phân loại mọi “nâng” (lift) $\rho: G_{\mathbb{Q}} \to \mathrm{GL}_2(\mathbb{Z}_p)$ thỏa các điều kiện cục bộ.
- Phía tự đẳng cấu: Vành Hecke $\mathbb{T}$ phân loại mọi dạng modular “nâng” $\bar{\rho}$.
- Định lý $R = \mathbb{T}$: Wiles--Taylor (1995) chứng minh $R \cong \mathbb{T}$ → mọi biến dạng Galois đều tự đẳng cấu → modularity.
Skinner--Urban: Thay $\mathrm{GL}_2$ bằng $\mathrm{GU}(2,2)$ --- biến dạng dạng tự đẳng cấu trên nhóm unitary 4 chiều. Dạng Eisenstein trên $\mathrm{GU}(2,2)$ “chuyên chở” thông tin hàm $L$ $p$-adic → chứng minh IMC.
Ví dụ
- Hình ảnh: Nghĩ $\bar{\rho}$ là “bản phác thảo” (sketch) --- chỉ thấy đường nét chính (modulo $p$). Biến dạng = “tô màu” --- thêm chi tiết, nâng lên $\mathbb{Z}_p$. Nhiều cách tô (vành $R$), nhưng chỉ những cách “hài hòa” mới cho dạng modular (vành $\mathbb{T}$). $R = \mathbb{T}$: “mọi cách tô hợp lý đều hài hòa”.
- Cụ thể: $E = $ 11a1, $p = 5$. $\bar{\rho}_{E,5}: G_{\mathbb{Q}} \to \mathrm{GL}_2(\mathbb{F}_5)$ --- “hình ảnh modulo 5” của biểu diễn Galois. Biến dạng: nâng lên $\mathrm{GL}_2(\mathbb{Z}_5)$ bằng nhiều cách. $R = \mathbb{T}$ nói: mọi cách nâng “tốt” đều đến từ dạng modular.
- Taylor--Wiles patching: Kỹ thuật chứng minh $R = \mathbb{T}$ bằng “vá” (patching) --- xây dựng họ vành phụ trợ “xấp xỉ” $R$ và $\mathbb{T}$, rồi lấy giới hạn.
Ý nghĩa trực giác
- Triết lý Langlands: “Mọi biểu diễn Galois 'tốt' đều đến từ dạng tự đẳng cấu” --- đây là trái tim của chương trình Langlands. $R = \mathbb{T}$ chứng minh điều này cho $\mathrm{GL}_2/\mathbb{Q}$.
- Từ Wiles đến Skinner--Urban: Wiles dùng $\mathrm{GL}_2$-deformation → modularity → Fermat. Skinner--Urban dùng $\mathrm{GU}(2,2)$-deformation → IMC → BSD mạnh phần $p$. Cùng triết lý, mở rộng phạm vi.
- Tương lai: Biến dạng trên nhóm lớn hơn ($\mathrm{GSp}_4$, $\mathrm{GL}_n$) → IMC/BSD cho abelian varieties bậc cao → giải quyết BSD hoàn toàn?
Liên hệ với giả thuyết Birch--Dyer
- Modularity: $R = \mathbb{T}$ → mọi EC modular → hàm $L(E, s)$ có tính chất tốt (phương trình hàm, thác triển) → BSD có nghĩa.
- IMC: Biến dạng trên $\mathrm{GU}(2,2)$ → Skinner--Urban → IMC → BSD mạnh phần $p$. Đây là đường dẫn kỹ thuật chính từ lý thuyết biến dạng đến BSD.
- Rào cản: Biến dạng hiện chỉ hiệu quả cho $\mathrm{rk} \leq 1$. Để giải $\mathrm{rk} \geq 2$ cần “biến dạng bậc cao” hoặc phương pháp hoàn toàn mới.
Định nghĩa
Ý tưởng: Tính vết Frobenius $a_p$ modulo các nguyên tố nhỏ $\ell$, rồi dùng CRT (Định lý thặng dư Trung Hoa) khôi phục $a_p$.
Các bước:
- Phương trình Frobenius: Trên $E(\bar{\mathbb{F}}_p)$, tự đồng cấu Frobenius $\phi_p: (x, y) \mapsto (x^p, y^p)$ thỏa
\[ \phi_p^2 - a_p \phi_p + p = 0 \quad \text{trong } \mathrm{End}(E). \]
- Hạn chế lên $E[\ell]$: Trên nhóm $\ell$-xoắn $E[\ell] \cong (\mathbb{Z}/\ell\mathbb{Z})^2$, phương trình trở thành
\[ (x^{p^2}, y^{p^2}) + [p](x, y) = [a_p \bmod \ell](x^p, y^p) \quad \text{trong } E[\ell]. \]
- Thử $a_p \bmod \ell$: Duyệt $t = 0, 1, \ldots, \ell - 1$, kiểm tra phương trình trên modulo $\ell$-division polynomial $\psi_\ell(x)$. Tìm $t$ duy nhất thỏa → $a_p \equiv t \pmod{\ell}$.
- CRT: Lặp cho $\ell = 2, 3, 5, 7, \ldots$ cho đến khi $\prod \ell > 4\sqrt{p}$ (cận Hasse). Dùng CRT khôi phục $a_p$ duy nhất.
Kết quả: $\#E(\mathbb{F}_p) = p + 1 - a_p$.
Ví dụ
- $E: y^2 = x^3 + x + 1$ trên $\mathbb{F}_{23}$:
- Cận Hasse: $|a_{23}| \leq 2\sqrt{23} \approx 9.59$, nên $a_{23} \in \{-9, \ldots, 9\}$.
- Cần $\prod \ell > 2 \times 9.59 \approx 19.2$. Dùng $\ell = 2, 3, 5$: $2 \times 3 \times 5 = 30 > 19.2$. ✓
- $\ell = 2$: Kiểm tra $\gcd(x^{23} - x, x^3 + x + 1) \pmod{23}$ → xác định $a_{23}$ chẵn/lẻ.
- $\ell = 3$: Kiểm tra trên $E[3]$ qua $\psi_3(x) = 3x^4 + 6x^2 + 12x - 1 \pmod{23}$.
- $\ell = 5$: Tương tự qua $\psi_5(x)$.
- CRT: $a_{23} \equiv ? \pmod{30}$ → $a_{23}$ duy nhất → $\#E(\mathbb{F}_{23}) = 24 - a_{23}$.
- Thực tế: Đếm trực tiếp $E(\mathbb{F}_{23})$ cho $28$ điểm → $a_{23} = 23 + 1 - 28 = -4$. Schoof tìm $a_{23} = -4$ mà không cần đếm trực tiếp --- lợi thế rõ khi $p$ rất lớn.
- Độ phức tạp: Với $p \sim 2^{256}$ (mật mã), Schoof cần $\sim 256^5$ phép toán --- khả thi trên máy tính, trong khi đếm trực tiếp cần $\sim 2^{256}$ phép (không khả thi).
Ý nghĩa trực giác
- Hình dung: Thay vì hỏi “$a_p$ bằng bao nhiêu?” (câu hỏi khó), Schoof hỏi “$a_p$ chia $\ell$ dư bao nhiêu?” cho từng $\ell$ nhỏ (câu hỏi dễ hơn). Ghép đáp án lại bằng CRT → $a_p$ chính xác.
- Division polynomial: “Ngôn ngữ” để làm việc trên $E[\ell]$ mà không cần mở rộng trường --- giữ tính toán trong $\mathbb{F}_p[x]/\psi_\ell(x)$, đa thức bậc $O(\ell^2)$.
- Đột phá 1985: Trước Schoof, đếm điểm là bài toán “hàm mũ”. Schoof cho thuật toán đa thức đầu tiên --- mở đường cho ứng dụng mật mã (cần biết $\#E(\mathbb{F}_p)$ để chọn đường cong an toàn).
Liên hệ với giả thuyết Birch--Dyer
- Tính $a_p$: Schoof tính $a_p = p + 1 - \#E(\mathbb{F}_p)$ --- chính xác giá trị cần cho tích Euler $L(E, s) = \prod_p (1 - a_p p^{-s} + p^{1-2s})^{-1}$.
- Kiểm nghiệm BSD: Để kiểm tra BSD bằng số cho EC cụ thể, cần tính $L(E, 1)$ bằng số → cần nhiều $a_p$ → Schoof/SEA cho tính toán hiệu quả.
- LMFDB: Cơ sở dữ liệu LMFDB lưu hàng triệu EC cùng $a_p$, $L(E, s)$, hạng --- tất cả tính bằng Schoof/SEA. Dữ liệu này là “phòng thí nghiệm” kiểm nghiệm BSD.
Định nghĩa
Ý tưởng cải tiến: Phân loại nguyên tố $\ell$ thành hai loại:
- Elkies prime: $\ell$ mà $\phi_p$ có giá trị riêng trong $\mathbb{F}_\ell$ trên $E[\ell]$ --- tức đa thức đặc trưng $X^2 - a_pX + p \pmod{\ell}$ có nghiệm. Khi đó tồn tại isogeny bậc $\ell$ từ $E$, và ta chỉ cần tính trên hạt nhân (bậc $\ell$, thay vì $\ell^2$ như Schoof gốc).
- Atkin prime: $\ell$ mà đa thức đặc trưng không có nghiệm trong $\mathbb{F}_\ell$. Ta chỉ biết $a_p \bmod \ell$ nằm trong tập nhỏ (không chính xác), dùng “baby-step giant-step” kết hợp.
Tốc độ: Khoảng $50\%$ các $\ell$ là Elkies (theo Chebotarev density). Phần Elkies chiếm ưu thế tính toán → tốc độ tổng thể cải thiện đáng kể.
Ví dụ
- So sánh tốc độ: Đếm $\#E(\mathbb{F}_p)$ với $p \sim 2^{256}$:
- Schoof gốc: $\sim$ vài giờ (division polynomial bậc $\ell^2$).
- SEA: $\sim$ vài giây (Elkies giảm xuống bậc $\ell$).
- Tăng tốc $\sim 100$--$1000$ lần thực tế.
- Kỷ lục: SEA đã đếm $\#E(\mathbb{F}_p)$ cho $p$ tới $10^{10000}$ chữ số --- dùng trong xây dựng đường cong mật mã và kiểm nghiệm BSD.
- Phần mềm: PARI/GP, Magma, SageMath đều cài sẵn SEA. Lệnh
E.order()trong SageMath tự động dùng SEA.
Ý nghĩa trực giác
- Hình dung: Schoof hỏi “$a_p \bmod \ell$?” bằng cách thử tất cả trên $E[\ell] \cong (\mathbb{Z}/\ell\mathbb{Z})^2$ (hai chiều). Elkies nói: “nếu Frobenius có giá trị riêng mod $\ell$, ta chỉ cần kiểm tra trên eigenspace một chiều” → nhanh hơn $\ell$ lần.
- Isogeny: Elkies prime cho isogeny $E \to E'$ bậc $\ell$. Hạt nhân isogeny là “hướng riêng” mà Frobenius tác động đơn giản. Tính toán trên hạt nhân (bậc $\ell$) thay vì toàn bộ $E[\ell]$ (bậc $\ell^2$).
- Từ $\ell^2$ xuống $\ell$: Division polynomial bậc $(\ell^2 - 1)/2$ → modular polynomial cho isogeny bậc $\ell$. Giảm mạnh kích thước tính toán.
Liên hệ với giả thuyết Birch--Dyer
- Công cụ tính toán: SEA là “công cụ nền” cho mọi kiểm nghiệm BSD bằng số --- tính $a_p$ nhanh → tính $L(E, s)$ bằng số → kiểm tra $\mathrm{ord}_{s=1} L = \mathrm{rk}$.
- LMFDB + Cremona: Dữ liệu hàng triệu EC (conductor $\leq 500{,}000$) đều tính bằng SEA. Mỗi EC kèm $a_p$, $L(E, 1)$, hạng, $\mathrm{Sha}$ --- kiểm nghiệm BSD chi tiết.
- Isogeny và Selmer: Isogeny (công cụ Elkies) cũng xuất hiện trong tính nhóm Selmer (descent qua isogeny) --- cùng đối tượng phục vụ cả tính toán ($a_p$) và lý thuyết (Selmer/BSD).
Định nghĩa
Bảy bài toán:
- Giả thuyết Riemann: Mọi zero không tầm thường của $\zeta(s)$ có phần thực $1/2$.
- P vs NP: Lớp P có bằng lớp NP không?
- Phương trình Navier--Stokes: Sự tồn tại và trơn của nghiệm.
- Giả thuyết Hodge: Lớp Hodge trên đa tạp đại số là tổ hợp hữu tỉ lớp đại số.
- Giả thuyết Poincaré: Đa tạp compact 3 chiều đơn liên đồng phôi $S^3$. [Đã giải --- Perelman, 2003.]
- Giả thuyết Birch và Swinnerton-Dyer: $\mathrm{rk}(E(\mathbb{Q})) = \mathrm{ord}_{s=1} L(E, s)$.
- Lý thuyết Yang--Mills: Tồn tại “mass gap” trong lý thuyết gauge lượng tử.
Ví dụ
- Đã giải (1/7): Poincaré Conjecture --- Grigori Perelman (2003), dùng Ricci flow (Hamilton). Perelman từ chối giải thưởng $1M và Huy chương Fields.
- Tiến bộ đáng kể: Riemann ($\sim 40\%$ zero kiểm nghiệm, nhưng chưa chứng minh). BSD ($66.48\%$ EC thỏa mãn --- Bhargava--Skinner--Zhang).
- Ít tiến bộ: P vs NP (hầu như không có chiến lược rõ ràng). Navier--Stokes (chỉ biết cho dữ liệu ban đầu nhỏ).
- BSD trong 7 bài toán: BSD là bài toán duy nhất về lý thuyết số (trực tiếp), liên kết giải tích ($L$-function), đại số (nhóm Mordell--Weil), và hình học (đường cong elliptic).
Ý nghĩa trực giác
- Hình dung: 7 bài toán như 7 đỉnh núi cao nhất --- mỗi bài đại diện một lĩnh vực cốt lõi. Giải một bài = chinh phục một đỉnh = mở ra hiểu biết mới sâu sắc cho toàn ngành.
- Tại sao được chọn? Mỗi bài toán: (1) phát biểu dễ hiểu (ít nhất ở mức sơ cấp); (2) đã chống lại mọi nỗ lực hàng chục/trăm năm; (3) nếu giải, sẽ có ảnh hưởng sâu rộng đến nhiều nhánh toán.
- Thực tế: Giải thưởng $1M “ít quan trọng” so với danh dự --- người giải sẽ đi vào lịch sử. Perelman từ chối giải thưởng nhưng đã “bất tử hóa” tên mình.
Liên hệ với giả thuyết Birch--Dyer
- BSD = Bài toán #6: BSD nằm trong danh sách danh giá nhất toán học hiện đại. Giải thưởng $1M của Clay chính thức hóa tầm quan trọng.
- Liên hệ với Riemann: Giả thuyết Riemann (bài toán #1) liên quan $\zeta(s)$ --- “cha” của hàm $L(E, s)$. Nếu GRH (Riemann mở rộng) đúng, nhiều kết quả BSD sẽ cải thiện.
- Tiêu chí Clay: Để nhận giải, cần chứng minh “BSD yếu hoàn toàn” ($\mathrm{ord} = \mathrm{rk}$ cho mọi $E/\mathbb{Q}$) hoặc phiên bản mạnh tương đương. Hiện tại: chứng minh cho $\mathrm{rk} \leq 1$ + $66.48\%$ EC, nhưng chưa đủ.
Định nghĩa
Hoạt động chính:
- Giải thưởng Thiên niên kỷ: 7 bài toán $\times$ $1M = $7M tổng giải thưởng (công bố 24/5/2000 tại Collège de France, Paris).
- Clay Research Awards: Giải thưởng hàng năm cho nhà toán học trẻ xuất sắc.
- Clay Research Fellowships: Học bổng 5 năm cho tiến sĩ trẻ tài năng. Nhiều người nhận sau đó đoạt Fields Medal (Tao, Mirzakhani, Venkatesh, \ldots).
- Hội thảo và trường hè: Tài trợ các hoạt động học thuật toán học.
Trụ sở: Oxford, Anh (từ 2005, trước đó ở Cambridge, Massachusetts).
Ví dụ
- Sự kiện 2000: Bảy bài toán được chọn bởi hội đồng gồm Atiyah, Bombieri, Connes, Deligne, Fefferman, Milnor, Mumford, Wiles, Witten. Danh sách phản ánh “sự đồng thuận” của giới toán về các vấn đề trung tâm.
- Perelman (2010): CMI trao giải $1M cho Perelman (giải Poincaré). Perelman từ chối: “Tôi không cần tiền. Nếu chứng minh đúng, đó là phần thưởng đủ rồi.”
- BSD và Clay: Andrew Wiles --- người viết bài miêu tả chính thức BSD cho Clay --- cũng là người chứng minh modularity theorem (nền tảng quan trọng nhất cho BSD). Wiles nhận Giải Abel 2016.
Ý nghĩa trực giác
- Hình dung: Clay giống “hải đăng” chiếu sáng những bài toán quan trọng nhất, thu hút sự chú ý và nỗ lực của cả thế hệ toán học. $1M không phải mục đích chính --- mà là sự công nhận tầm quan trọng.
- Hilbert 1900 vs Clay 2000: Hilbert đặt 23 bài toán năm 1900, định hướng toán học thế kỷ 20. Clay đặt 7 bài toán năm 2000, định hướng thế kỷ 21. BSD nằm trong cả hai danh sách (liên quan bài toán 10 Hilbert).
- Tác động: Đặt bài toán Thiên niên kỷ khiến BSD được biết đến rộng rãi hơn --- không chỉ trong giới chuyên gia mà cả công chúng quan tâm toán học.
Liên hệ với giả thuyết Birch--Dyer
- Công nhận chính thức: BSD được Clay chọn là 1 trong 7 bài toán quan trọng nhất --- khẳng định vị trí trung tâm trong toán học hiện đại.
- Tiêu chí giải: Bài giải phải được công bố trên tạp chí uy tín và “chấp nhận rộng rãi” ít nhất 2 năm trước khi xét giải. Điều này đảm bảo tính chính xác.
- Trạng thái: BSD vẫn mở --- dù có tiến bộ lớn ($\mathrm{rk} \leq 1$ giải xong, $66.48\%$ EC thỏa mãn), chứng minh tổng quát vẫn “xa vời” theo đánh giá của hầu hết chuyên gia.
Định nghĩa
Ý tưởng cốt lõi: Dùng phương trình đại số để định nghĩa “hình” và dùng công cụ đại số (vành, iđêan, sheaf) để nghiên cứu tính chất hình học.
Các đối tượng:
- Đường cong đại số: Nghiệm của $f(x, y) = 0$ --- đường cong elliptic $y^2 = x^3 + ax + b$ là ví dụ quan trọng nhất.
- Mặt đại số: Nghiệm của $f(x, y, z) = 0$ --- ví dụ: mặt K3, abelian surface.
- Đa tạp: Tổng quát hóa lên nhiều chiều. Genus là bất biến tô-pô cơ bản: genus 0 (đường conic), genus 1 (đường cong elliptic), genus $\geq 2$ (siêu elliptic).
Các giai đoạn: Hình học đại số cổ điển (thế kỷ 19, Italy) → Weil--Zariski (1940s, nền tảng mới) → Grothendieck (1960s, schéma, đối đồng điều étale) → hiện đại (derived, motivic).
Ví dụ
- Đường thẳng: $y = 2x + 1$ --- đa tạp đại số đơn giản nhất (affine, chiều 1, genus 0). Có vô hạn điểm hữu tỉ.
- Đường conic: $x^2 + y^2 = 1$ --- genus 0, có tham số hóa hữu tỉ. Vô hạn điểm hữu tỉ (bộ ba Pythagoras!).
- Đường cong elliptic: $y^2 = x^3 - x + 1$ --- genus 1. Có thể có vô hạn hoặc hữu hạn điểm hữu tỉ, và BSD cho biết “bao nhiêu”.
- Genus $\geq 2$: $y^2 = x^5 - x$ --- genus 2. Faltings (1983): luôn có hữu hạn điểm hữu tỉ. Đường cong Fermat $x^n + y^n = 1$ ($n \geq 4$): genus $\geq 3$ → hữu hạn (Faltings giải phỏng đoán Mordell).
Ý nghĩa trực giác
- Hình dung: Hình học đại số “nhìn” phương trình --- thay vì tính nghiệm bằng công thức, ta nghiên cứu “hình dạng” tập nghiệm. Hình dạng (genus, kỳ dị, đối đồng điều) quyết định “bao nhiêu” nghiệm hữu tỉ.
- Ba thế giới: Genus 0 → “dễ” (vô hạn nghiệm, tham số hóa). Genus 1 → “vừa” (có thể vô hạn, BSD quyết định). Genus $\geq 2$ → “hữu hạn” (Faltings). Đường cong elliptic nằm ở “ranh giới” phức tạp nhất!
- Grothendieck: “Cách mạng” hình học đại số 1960s bằng ngôn ngữ schéma --- cho phép làm việc trên mọi trường (hữu hạn, $p$-adic, số) thống nhất. Nền tảng cho mọi chứng minh BSD hiện đại.
Liên hệ với giả thuyết Birch--Dyer
- EC = đối tượng hình học đại số: Đường cong elliptic là đa tạp đại số chiều 1, genus 1, với cấu trúc nhóm. Mọi khái niệm BSD (rút gọn, Néron model, Frobenius, Selmer) đều thuộc hình học đại số.
- Ngôn ngữ Grothendieck: Đối đồng điều étale, schéma Néron, mô hình tối thiểu --- công cụ Grothendieck là “ngôn ngữ” viết BSD chính xác.
- BSD mở rộng: BSD cho đa tạp Abel (abelian variety) bậc cao là bài toán hình học đại số thuần túy --- tổng quát hóa tự nhiên trong khuôn khổ Grothendieck.
Định nghĩa
Câu hỏi trung tâm: Cho đa tạp đại số $V$ định nghĩa trên $\mathbb{Q}$:
- $V(\mathbb{Q})$ có khác rỗng không? (Hasse principle, obstruction.)
- Nếu có, $V(\mathbb{Q})$ “lớn” thế nào? (Hạng Mordell--Weil, chiều cao.)
- $V(\mathbb{F}_p)$ có bao nhiêu điểm? (Weil conjectures, Frobenius.)
- Hàm $L(V, s)$ có tính chất gì? (Thác triển, phương trình hàm, giá trị đặc biệt.)
Các nhà sáng lập: Weil (Weil conjectures), Grothendieck (schéma), Serre (đối đồng điều Galois), Tate (đối ngẫu, module Tate), Faltings (Mordell conjecture).
Ví dụ
- Weil conjectures (1949, chứng minh 1974 bởi Deligne): $\#V(\mathbb{F}_q)$ thỏa mãn “giả thuyết Riemann” --- liên hệ hình học (đối đồng điều étale) với số học ($\#V(\mathbb{F}_q)$).
- Faltings (1983): Đường cong genus $\geq 2$ trên $\mathbb{Q}$ có hữu hạn điểm hữu tỉ (phỏng đoán Mordell). Chứng minh dùng Arakelov geometry --- giao thoa sâu sắc hình học/số học.
- Wiles (1995): Modularity = “đường cong elliptic = dạng modular” --- kết nối đối tượng hình học (EC) với đối tượng giải tích (modular form). Hệ quả: Fermat's Last Theorem.
- BSD: Kết nối $E(\mathbb{Q})$ (đại số/hình học) với $L(E, s)$ (giải tích) --- “bài toán trung tâm nhất” của hình học số học.
Ý nghĩa trực giác
- Hình dung: “Số” (lý thuyết số) và “hình” (hình học) --- hai thế giới tưởng xa nhau. Hình học số học cho thấy chúng “là một”: tính chất hình dạng (genus, đối đồng điều) quyết định tính chất số (số nghiệm, hạng, $L$-function).
- Triết lý Grothendieck: “Mọi bài toán số học đều là bài toán hình học --- trên schéma $\mathrm{Spec}(\mathbb{Z})$.” Đường cong elliptic trên $\mathbb{Q}$ = morphism $E \to \mathrm{Spec}(\mathbb{Z})$ --- rút gọn modulo $p$ = thớ tại $p$.
- Thống nhất: Weil conjectures, Langlands, BSD --- tất cả đều nằm trong bức tranh lớn “hình học số học”, kết nối giải tích, đại số, hình học, và tô-pô.
Liên hệ với giả thuyết Birch--Dyer
- BSD = bài toán trung tâm: BSD là “viên ngọc” của hình học số học --- kết nối ba trụ cột (đại số: $\mathrm{rk}$, giải tích: $L$, hình học: $E$).
- Công cụ: Mọi chứng minh BSD hiện đại (Gross--Zagier, Kolyvagin, Skinner--Urban) đều dùng công cụ hình học số học: đối đồng điều Galois, schéma Néron, Arakelov theory, modular curves.
- Tương lai: Giải BSD hoàn toàn có thể đòi hỏi “hình học số học mới” --- có thể là motivic cohomology, derived geometry, hoặc ý tưởng chưa ai nghĩ đến.
Định nghĩa
Các nhánh chính:
- Lý thuyết số sơ cấp: Chia hết, số nguyên tố, đồng dư, hàm số học (Euler $\phi$, Möbius $\mu$). Công cụ: tổ hợp, bất đẳng thức.
- Lý thuyết số đại số: Trường số, vành số nguyên đại số, nhóm lớp, phân rã nguyên tố. Công cụ: đại số trừu tượng.
- Lý thuyết số giải tích: Phân bố số nguyên tố, hàm zeta/L, sàng. Công cụ: giải tích phức, biến đổi Fourier.
- Lý thuyết số số học (arithmetic): Đường cong elliptic, dạng modular, biểu diễn Galois. Giao thoa với hình học đại số → hình học số học.
Ví dụ
- Định lý số nguyên tố (1896, Hadamard--de la Vallée-Poussin): $\pi(x) \sim x/\ln x$. Số nguyên tố “dày đặc” --- cứ $\ln x$ số thì có khoảng 1 số nguyên tố.
- Fermat's Last Theorem (1637--1995): $x^n + y^n = z^n$ không có nghiệm nguyên dương cho $n \geq 3$. Phát biểu sơ cấp nhưng chứng minh dùng toàn bộ “vũ khí” hiện đại (modularity, Galois representations).
- Goldbach conjecture: Mọi số chẵn $\geq 4$ là tổng hai số nguyên tố. Vẫn chưa chứng minh! Nhưng “gần đúng”: Helfgott (2013) chứng minh phiên bản lẻ (mọi số lẻ $\geq 7$ là tổng ba nguyên tố).
- BSD: “Bao nhiêu điểm hữu tỉ trên đường cong elliptic?” --- câu hỏi lý thuyết số, trả lời bằng hàm $L$ (giải tích) qua đường cong (hình học).
Ý nghĩa trực giác
- Gauss: “Toán học là nữ hoàng các ngành khoa học, và lý thuyết số là nữ hoàng của toán học.” Các bài toán số “đơn giản nhất” (phát biểu dễ hiểu) nhưng “sâu nhất” (khó chứng minh nhất).
- Ứng dụng bất ngờ: Lý thuyết số “thuần túy” (Hardy tự hào “toán tôi không có ứng dụng”) nay là nền tảng mật mã: RSA (phân tích thừa số), ECC (đường cong elliptic), lattice-based crypto (lưới).
- Thống nhất: Lý thuyết số hiện đại không tách biệt “sơ cấp/đại số/giải tích” mà hợp nhất tất cả --- BSD là ví dụ hoàn hảo (cần cả ba nhánh).
Liên hệ với giả thuyết Birch--Dyer
- BSD thuộc lý thuyết số: BSD là bài toán lý thuyết số “số học” (arithmetic) --- nhánh hiện đại nhất, kết hợp đại số + giải tích + hình học.
- Tất cả nhánh hội tụ: Sơ cấp (phương trình Diophantus), đại số (nhóm Mordell--Weil, Galois), giải tích (hàm $L$, thác triển), hình học (đường cong, modularity) --- tất cả gặp nhau tại BSD.
- Giải thưởng: BSD nằm trong 7 bài toán Clay, lý thuyết số đóng góp 2/7 (Riemann + BSD) --- phản ánh vị trí trung tâm của lý thuyết số.
Định nghĩa
Vai trò trong lý thuyết số:
- Giải tích phức: Thác triển giải tích hàm $\zeta(s)$, $L(E, s)$. Phương trình hàm. Phân bố zero.
- Chuỗi Fourier: Dạng modular $f(\tau) = \sum a_n q^n$. Biến đổi Mellin liên hệ $f \leftrightarrow L(f, s)$.
- Giải tích hài hòa: Công thức vết Selberg--Arthur. Phương pháp vòng tròn Hardy--Littlewood.
- Giải tích $p$-adic: Hàm $L$ $p$-adic, lý thuyết Hodge $p$-adic, phân tích trên $\mathbb{Q}_p$.
Ví dụ
- Hàm $L(E, s) = \sum_{n=1}^{\infty} a_n n^{-s}$: Chuỗi Dirichlet --- đối tượng giải tích phức. Hội tụ tuyệt đối cho $\mathrm{Re}(s) > 3/2$. Thác triển ra toàn $\mathbb{C}$ (nhờ modularity) --- kỹ thuật giải tích phức.
- Bậc triệt tiêu: $\mathrm{ord}_{s=1} L(E, s)$ --- khái niệm giải tích (bậc zero của hàm giải tích tại $s = 1$). BSD nói: con số giải tích này = con số đại số (hạng).
- Biến đổi Mellin: $L(E, s) = \frac{(2\pi)^s}{\Gamma(s)} \int_0^{\infty} f(iy) y^{s-1} dy$ với $f$ là dạng modular --- kết nối “thế giới Fourier” ($f$) với “thế giới Dirichlet” ($L$).
- Chu kỳ thực: $\Omega_E = \int_{E(\mathbb{R})} |\omega|$ --- tích phân vi phân trên đường cong --- đối tượng giải tích thực, xuất hiện trong BSD mạnh.
Ý nghĩa trực giác
- Hình dung: Nếu đường cong elliptic là “bài toán” (đại số/hình học), thì hàm $L$ là “câu trả lời” (giải tích). BSD nói: “đọc câu trả lời giải tích sẽ biết đáp án đại số”.
- Tại sao giải tích cần thiết? Nhóm Mordell--Weil $E(\mathbb{Q})$ “rời rạc” --- khó nghiên cứu trực tiếp. Hàm $L(E, s)$ “liên tục” --- dễ phân tích (thác triển, zero, residue). Giải tích “mượt hóa” bài toán rời rạc.
- Ngạc nhiên: Tính chất “rời rạc” (hạng, số nguyên) được “mã hóa” trong hàm “liên tục” ($L$-function) --- đây là phép màu sâu sắc nhất của toán học, và BSD là hiện thân của nó.
Liên hệ với giả thuyết Birch--Dyer
- Nửa giải tích: BSD có “nửa giải tích” ($\mathrm{ord}_{s=1} L(E, s)$, chu kỳ $\Omega_E$, hàm $L$ $p$-adic) và “nửa đại số” (hạng, Sha, Tamagawa). BSD nói hai nửa “bằng nhau”.
- Thác triển: Modularity → $L(E, s)$ có thác triển giải tích ra toàn $\mathbb{C}$ → $\mathrm{ord}_{s=1} L$ có nghĩa. Không có modularity, BSD thậm chí không phát biểu được!
- Tương lai: Phân tích hài hòa (Langlands), giải tích $p$-adic (Iwasawa), lý thuyết Hodge --- công cụ giải tích tiếp tục là “vũ khí” chính cho BSD.
Định nghĩa
Liên hệ với toán học:
- Đường cong elliptic: Compactification trên torus $T^2 = \mathbb{C}/\Lambda$ (tương đương đường cong elliptic trên $\mathbb{C}$) xuất hiện tự nhiên trong lý thuyết dây. $\mathrm{SL}_2(\mathbb{Z})$-invariance = T-duality.
- Dạng modular: Hàm phân hoạch dây (string partition function) là dạng modular --- bất biến dưới $\mathrm{SL}_2(\mathbb{Z})$ vì hai cách “quấn” dây trên torus cho cùng vật lý.
- Hàm $L$: Một số nhà vật lý (Candelas, de la Ossa) phỏng đoán rằng “hàm $L$ đường cong elliptic xuất hiện tự nhiên” trong hàm tương quan điểm trên Calabi--Yau.
- Mirror symmetry: Đối xứng gương Calabi--Yau dẫn đến các đẳng thức bất ngờ trong hình học đếm (enumerative geometry) --- đã kích thích nhiều phát triển toán học thuần túy.
Ví dụ
- F-theory (Vafa, 1996): Compactification lý thuyết dây trên không gian mà mỗi “điểm” kèm theo một đường cong elliptic $E_\tau$ (biến theo vị trí). $j$-bất biến $j(\tau)$ mã hóa hình dạng dây. Kỳ dị ($j \to \infty$) = “D7-brane” --- vật thể vật lý!
- Hàm Dedekind $\eta(\tau)$: $\eta(\tau) = q^{1/24} \prod_{n=1}^{\infty}(1 - q^n)$ với $q = e^{2\pi i \tau}$ --- xuất hiện trong hàm phân hoạch dây bosonic (chiều 26). Tính modular $\eta(-1/\tau) = \sqrt{-i\tau}\, \eta(\tau)$ phản ánh T-duality.
- Moonshine: Liên hệ bất ngờ giữa nhóm Monster (đại số) và $j(\tau)$ (giải tích/dạng modular) --- giải thích bởi lý thuyết trường conformal (CFT, một phần của lý thuyết dây). Borcherds nhận Fields Medal 1998.
Ý nghĩa trực giác
- Hình dung: Lý thuyết dây như “nhà máy” sản xuất phỏng đoán toán học --- vật lý gợi ý “điều gì nên đúng”, rồi nhà toán học chứng minh nghiêm ngặt. Mirror symmetry, Moonshine, geometric Langlands --- tất cả có nguồn gốc vật lý.
- Đường cong elliptic ở đâu? Torus phức $\mathbb{C}/\Lambda$ là “hình dạng chiều thêm” (extra dimension) trong compactification. Không-thời gian 10 chiều $= 4$ chiều thường $+ 6$ chiều compact (Calabi--Yau), và torus phức (EC) là viên gạch xây Calabi--Yau.
- Cảnh báo: Lý thuyết dây chưa có kiểm nghiệm thực nghiệm trực tiếp. Nhưng giá trị toán học là không thể phủ nhận --- hàng trăm định lý toán thuần túy đã được chứng minh nhờ trực giác vật lý.
Liên hệ với giả thuyết Birch--Dyer
- Liên hệ gián tiếp: Lý thuyết dây không “chứng minh” BSD, nhưng cung cấp ngôn ngữ và trực giác --- ví dụ: dạng modular, hàm $L$, Langlands correspondence đều có diễn giải vật lý.
- Geometric Langlands: Phiên bản “hình học” của Langlands (kích thích bởi gauge theory, Kapustin--Witten 2006) có thể dẫn đến hiểu biết mới về Langlands số học → BSD.
- Tương lai: Nếu lý thuyết dây đúng (hoặc ít nhất “toán học đúng”), liên hệ EC/dạng modular/hàm $L$ với vật lý có thể cho góc nhìn mới về BSD --- từ “tại sao hạng = bậc triệt tiêu?” đến “vì vật lý đòi hỏi!”.