Tra cứu Khái niệm — Giả thuyết Birch và Swinnerton-Dyer

227 khái niệm từ sách "Giả thuyết Birch và Swinnerton-Dyer" — TS. Đặng Minh Tuấn
Phiên bản 1.14  ·  Xuất bản: 19/02/2026  ·  © 2026
TS. Đặng Minh Tuấn — CMC ATI & CMC University
bit.ly/TuanVietkey
JS Đang tải...
⚙ Mã nguồn logic
🔢 KaTeX — Cơ chế render LaTeX 3 hàm công khai
Pipeline xử lý
expression: string
Chuỗi LaTeX đầu vào
Ví dụ: "E = mc^2"
↓  Settings(options) — xử lý tùy chọn
parseTree(expression, settings)
Lexer + Parser phân tích cú pháp
→ cây nút AST (Abstract Syntax Tree)
↓  nếu lỗi → renderError()
buildTree(tree, expression, settings)
Duyệt cây AST, dựng virtual DOM
Bao gồm HTML + MathML song song
↓  .toNode() hoặc .toMarkup()
DOM Node / HTML string
Gắn vào baseNode trong trang
hoặc trả về chuỗi HTML để chèn vào innerHTML
3 hàm API công khai
katex.render(expr, node, opts)→ void
Xóa nội dung node, render LaTeX rồi gắn trực tiếp vào DOM. Dùng khi đã có sẵn một Element trong trang.
// node.textContent = ""; node.appendChild(renderToDomTree(...).toNode())
katex.renderToString(expr, opts)→ string
Trả về chuỗi HTML chứa ký hiệu đã render. Dùng khi cần chèn vào innerHTML hoặc gửi lên server.
// return renderToDomTree(...).toMarkup()
katex.renderToDomTree(expr, opts)→ VNode
Trả về cây virtual DOM nội bộ — hàm trung gian dùng chung cho cả renderrenderToString. Dùng khi cần kiểm soát sâu hơn hoặc viết extension.
Ứng dụng trong trang này: Thay vì gọi katex.render() trực tiếp, trang dùng renderMathInElement() từ thư viện bổ trợ auto-render — hàm này tự động quét toàn bộ DOM, tìm các đoạn $...$ / $$...$$ rồi gọi katex.render() cho từng đoạn một. Kết hợp với requestIdleCallback, việc render được trì hoãn đến khi trình duyệt rảnh → tăng tốc độ hiển thị trang, tránh block giao diện khi tải lần đầu.
📦 Dữ liệu nặng (TAB_CONFIG & sidebar)
227 khái niệm
1 Nhóm Abel (Abelian group) Ch.1 2

Định nghĩa hình thức

Định nghĩa (Nhóm Abel). Một nhóm Abel (Abelian group) (hay nhóm giao hoán) là một tập hợp $G$ cùng với một phép toán hai ngôi $+ : G \times G \to G$ thỏa mãn bốn tiên đề sau:
  1. Kết hợp: $(a + b) + c = a + (b + c)$ với mọi $a, b, c \in G$;
  2. Phần tử đơn vị: Tồn tại phần tử $0 \in G$ sao cho $a + 0 = 0 + a = a$ với mọi $a \in G$;
  3. Phần tử nghịch đảo: Với mỗi $a \in G$, tồn tại $-a \in G$ sao cho $a + (-a) = 0$;
  4. Giao hoán: $a + b = b + a$ với mọi $a, b \in G$.
Nếu chỉ thỏa mãn (i)--(iii), ta gọi $G$ là một nhóm (group). Điều kiện (iv) là điều phân biệt nhóm Abel với nhóm nói chung [silverman2009, lang1983].

Ví dụ

Ví dụ (Các nhóm Abel quen thuộc).
  1. $(\mathbb{Z}, +)$: Tập các số nguyên với phép cộng thông thường. Phần tử đơn vị là $0$, phần tử nghịch đảo của $n$ là $-n$.
  2. $(\mathbb{Q}, +)$ và $(\mathbb{R}, +)$: Tập các số hữu tỉ và số thực, với phép cộng.
  3. $(\mathbb{Q}^*, \times)$: Tập các số hữu tỉ khác $0$ với phép nhân. Phần tử đơn vị là $1$, nghịch đảo của $a$ là $1/a$.
  4. $(\mathbb{Z}/n\mathbb{Z}, +)$: Nhóm các số nguyên modulo $n$. Ví dụ, $\mathbb{Z}/6\mathbb{Z} = \{0, 1, 2, 3, 4, 5\}$ với phép cộng modulo $6$.
  5. Nhóm điểm trên đường cong elliptic $E(\mathbb{Q})$: Đây chính là ví dụ quan trọng nhất trong sách --- tập hợp các điểm hữu tỉ trên đường cong elliptic $E$, cùng với luật cộng hình học, tạo thành một nhóm Abel.
Ví dụ (Nhóm không giao hoán). Để hiểu tầm quan trọng của tính giao hoán, xét nhóm ma trận $\mathrm{GL}_2(\mathbb{R})$ --- nhóm các ma trận $2 \times 2$ khả nghịch. Phép nhân ma trận không giao hoán:
\[ \begin{pmatrix} 1 & 1 \\ 0 & 1 \end{pmatrix} \begin{pmatrix} 1 & 0 \\ 1 & 1 \end{pmatrix} = \begin{pmatrix} 2 & 1 \\ 1 & 1 \end{pmatrix} \neq \begin{pmatrix} 1 & 1 \\ 1 & 2 \end{pmatrix} = \begin{pmatrix} 1 & 0 \\ 1 & 1 \end{pmatrix} \begin{pmatrix} 1 & 1 \\ 0 & 1 \end{pmatrix}. \]
Vì vậy $\mathrm{GL}_2(\mathbb{R})$ là nhóm nhưng không phải nhóm Abel.

Ý nghĩa hình học

Nhóm Abel và tính đối xứng. Trong hình học, nhóm biểu diễn tính đối xứng của các đối tượng. Một nhóm Abel biểu diễn loại đối xứng “đơn giản nhất” --- trong đó thứ tự thực hiện các phép biến đổi không quan trọng.

Hãy tưởng tượng bạn dịch chuyển một điểm trên mặt phẳng: dịch sang phải 3 đơn vị rồi lên 2 đơn vị cho kết quả giống như lên 2 rồi sang phải 3. Nhóm các phép tịnh tiến $(\mathbb{R}^2, +)$ là Abel.

Ngược lại, xoay một vật thể 3 chiều: xoay quanh trục $x$ rồi trục $y$ thường cho kết quả khác với xoay quanh trục $y$ rồi trục $x$. Nhóm xoay $\mathrm{SO}(3)$ không Abel.

Trên đường cong elliptic, phép cộng hai điểm $P + Q$ luôn bằng $Q + P$ --- đây là tính chất đặc biệt bắt nguồn từ hình học đại số của đường cong.

Liên hệ với giả thuyết Birch--Dyer

Vai trò trong giả thuyết BSD. Nhóm Abel là cấu trúc đại số nền tảng của toàn bộ giả thuyết BSD:
  • Tập các điểm hữu tỉ $E(\mathbb{Q})$ trên đường cong elliptic là một nhóm Abel.
  • Định lý Mordell--Weil [mordell1922] khẳng định $E(\mathbb{Q})$ là nhóm Abel hữu hạn sinh (xem Khái niệm 2).
  • Giả thuyết BSD liên hệ cấu trúc của nhóm Abel $E(\mathbb{Q})$ (cụ thể là hạng của nó) với tính chất giải tích của hàm $L(E,s)$.
  • Nhóm Selmer và nhóm Tate--Shafarevich cũng là các nhóm Abel, đóng vai trò “trung gian” trong việc hiểu $E(\mathbb{Q})$.
Nói ngắn gọn: giả thuyết BSD là một câu hỏi về kích thước của nhóm Abel $E(\mathbb{Q})$.
2 Nhóm Abel hữu hạn sinh (Finitely generated abelian group) Ch.1 3

Định nghĩa hình thức

Định nghĩa (Nhóm Abel hữu hạn sinh). Một nhóm Abel $G$ được gọi là hữu hạn sinh (finitely generated) nếu tồn tại một tập hữu hạn các phần tử $g_1, g_2, \ldots, g_n \in G$ sao cho mỗi phần tử $g \in G$ đều viết được dưới dạng:
\[ g = a_1 g_1 + a_2 g_2 + \cdots + a_n g_n, \quad a_i \in \mathbb{Z}. \]
Ta nói $\{g_1, \ldots, g_n\}$ là một tập sinh (generating set) của $G$ [silverman2009].
Định lý (Định lý cấu trúc của nhóm Abel hữu hạn sinh). Mọi nhóm Abel hữu hạn sinh $G$ đều đẳng cấu với một tích trực tiếp:
\[ G \cong \mathbb{Z}^r \oplus \mathbb{Z}/n_1\mathbb{Z} \oplus \mathbb{Z}/n_2\mathbb{Z} \oplus \cdots \oplus \mathbb{Z}/n_k\mathbb{Z}, \]
trong đó $r \geq 0$ là số nguyên được xác định duy nhất (gọi là hạng của $G$), và $n_1 \mid n_2 \mid \cdots \mid n_k$ là các số nguyên dương $\geq 2$ được xác định duy nhất [lang1983].

Ví dụ

Ví dụ (Minh họa Định lý cấu trúc).
  1. $G = \mathbb{Z}$: Hạng $r = 1$, không có phần xoắn. Tập sinh $\{1\}$.
  2. $G = \mathbb{Z}^3$: Hạng $r = 3$. Ví dụ: các véctơ nguyên trong không gian 3 chiều.
  3. $G = \mathbb{Z}/6\mathbb{Z}$: Hạng $r = 0$, nhóm hữu hạn cấp $6$. Mỗi phần tử $g$ thỏa $6g = 0$.
  4. $G = \mathbb{Z}^2 \oplus \mathbb{Z}/2\mathbb{Z}$: Hạng $r = 2$ với phần xoắn $\mathbb{Z}/2\mathbb{Z}$. Điều này có nghĩa nhóm có hai phần tử sinh “tự do” và một phần tử cấp $2$.
  5. Đường cong elliptic: Với $E: y^2 = x^3 - x$ trên $\mathbb{Q}$, ta có $E(\mathbb{Q}) \cong \mathbb{Z}/2\mathbb{Z} \oplus \mathbb{Z}/2\mathbb{Z}$ (hạng $r = 0$). Với $E: y^2 = x^3 - x + 1$ trên $\mathbb{Q}$, ta có $E(\mathbb{Q}) \cong \mathbb{Z}$ (hạng $r = 1$) [silverman2009].

Ý nghĩa hình học

Phần tự do và phần xoắn. Hãy hình dung nhóm Abel hữu hạn sinh như một “lưới có thêm cấu trúc xoắn”:
  • Phần tự do $\mathbb{Z}^r$: Giống như một lưới $r$ chiều trong không gian. Các phần tử sinh tự do cho phép ta “đi” vô hạn xa theo $r$ hướng độc lập. Số $r$ (hạng) đo “số bậc tự do” của nhóm.
  • Phần xoắn $\mathbb{Z}/n_1\mathbb{Z} \oplus \cdots \oplus \mathbb{Z}/n_k\mathbb{Z}$: Các phần tử “quay vòng” --- cộng chúng đủ nhiều lần sẽ quay về $0$. Giống như kim đồng hồ: xoay $12$ lần thì về vị trí cũ.
Kết hợp lại: hãy tưởng tượng một lưới vô hạn (phần tự do) kết hợp với một vòng xoay nhỏ tại mỗi nút (phần xoắn).

Liên hệ với giả thuyết Birch--Dyer

Vai trò trung tâm trong BSD. Đây là một trong những khái niệm quan trọng nhất:
  • Định lý Mordell--Weil [mordell1922]: Nếu $E$ là đường cong elliptic trên $\mathbb{Q}$, thì $E(\mathbb{Q})$ là nhóm Abel hữu hạn sinh. Do đó:
    \[ E(\mathbb{Q}) \cong \mathbb{Z}^r \oplus E(\mathbb{Q})_{\mathrm{tors}}, \]
    trong đó $r$ là hạng và $E(\mathbb{Q})_{\mathrm{tors}}$ là phần xoắn hữu hạn.
  • Giả thuyết BSD yếu nói rằng hạng $r$ (số bậc tự do) bằng bậc triệt tiêu của hàm $L(E,s)$ tại $s = 1$.
  • Giả thuyết BSD mạnh cho công thức chính xác chứa cả $|E(\mathbb{Q})_{\mathrm{tors}}|^2$ ở mẫu số.
Nói cách khác, giả thuyết BSD dự đoán rằng ta có thể “đọc” cấu trúc đại số của $E(\mathbb{Q})$ (hạng, phần xoắn) từ hàm $L$ --- một đối tượng giải tích.
3 Nhóm con xoắn (Torsion subgroup) Ch.1 3

Định nghĩa hình thức

Định nghĩa (Phần tử xoắn và nhóm con xoắn). Cho $G$ là một nhóm Abel. Một phần tử $g \in G$ được gọi là phần tử xoắn (torsion element) nếu tồn tại số nguyên dương $n$ sao cho $ng = 0$. Số nguyên dương nhỏ nhất $n$ với tính chất này gọi là cấp (order) của $g$.

Nhóm con xoắn của $G$ là tập hợp tất cả các phần tử xoắn:

\[ G_{\mathrm{tors}} = \{g \in G : \text{tồn tại } n \in \mathbb{Z}_{>0} \text{ sao cho } ng = 0\}. \]
Đây là một nhóm con của $G$ [silverman2009].

Trong ngữ cảnh đường cong elliptic, ta viết $E(\mathbb{Q})_{\mathrm{tors}}$ cho nhóm con xoắn của $E(\mathbb{Q})$.

Định lý (Định lý Mazur). [mazur1977]

Nếu $E$ là đường cong elliptic trên $\mathbb{Q}$, thì $E(\mathbb{Q})_{\mathrm{tors}}$ đẳng cấu với đúng một trong 15 nhóm sau:

  • Nhóm cyclic: $\mathbb{Z}/n\mathbb{Z}$ với $1 \leq n \leq 10$ hoặc $n = 12$.
  • Nhóm không cyclic: $\mathbb{Z}/2\mathbb{Z} \oplus \mathbb{Z}/2n\mathbb{Z}$ với $1 \leq n \leq 4$.

Ví dụ

Ví dụ (Nhóm xoắn trên đường cong elliptic).
  1. $E: y^2 = x^3 + 1$ trên $\mathbb{Q}$: $E(\mathbb{Q})_{\mathrm{tors}} \cong \mathbb{Z}/6\mathbb{Z}$. Điểm $(2, 3)$ có cấp $6$: cộng nó $6$ lần cho điểm ở vô cực $\mathcal{O}$.
  2. $E: y^2 = x^3 - x$ trên $\mathbb{Q}$: $E(\mathbb{Q})_{\mathrm{tors}} \cong \mathbb{Z}/2\mathbb{Z} \oplus \mathbb{Z}/2\mathbb{Z}$. Ba điểm xoắn bậc $2$ là $(0,0)$, $(1,0)$, $(-1,0)$ --- đây là các điểm có $y = 0$, tức tiếp tuyến đứng, nên $2P = \mathcal{O}$.
  3. $E: y^2 = x^3 - 2$ trên $\mathbb{Q}$: $E(\mathbb{Q})_{\mathrm{tors}} = \{{\mathcal{O}}\}$ --- không có phần tử xoắn nào ngoài phần tử đơn vị.

Ý nghĩa hình học

Điểm xoắn = điểm “quay vòng”. Trên đường cong elliptic, một điểm xoắn $P$ là một điểm mà khi cộng với chính nó đủ số lần sẽ “quay về” điểm ở vô cực $\mathcal{O}$.

Hình dung đường cong elliptic như một vòng dây cao su méo. Các điểm xoắn bậc $2$ (với $2P = \mathcal{O}$) chính là các điểm trên trục $x$ (có $y = 0$): từ điểm đó, đường thẳng “tiếp tuyến” đi thẳng đứng lên vô cực.

Các điểm xoắn bậc $3$ (với $3P = \mathcal{O}$) là các điểm uốn (inflection point) của đường cong --- nơi tiếp tuyến cắt đường cong tại chính điểm đó (với bội $3$).

Định lý Mazur nói rằng trên $\mathbb{Q}$, số lượng “kiểu quay vòng” có thể xảy ra rất hạn chế --- chỉ có 15 khả năng.

Liên hệ với giả thuyết Birch--Dyer

Nhóm xoắn trong công thức BSD. Nhóm con xoắn xuất hiện trực tiếp trong giả thuyết BSD mạnh. Công thức dự đoán:
\[ \frac{L^{(r)}(E,1)}{r!} = \frac{|\mathrm{Sha}(E/\mathbb{Q})| \cdot \Omega_E \cdot R_E \cdot \prod_p c_p}{|E(\mathbb{Q})_{\mathrm{tors}}|^2}, \]
trong đó $|E(\mathbb{Q})_{\mathrm{tors}}|^2$ xuất hiện ở mẫu số. Điều này có nghĩa: nhóm xoắn càng lớn thì giá trị đặc biệt của $L$ càng “nhỏ” (với các yếu tố khác giữ nguyên).

Hơn nữa, nhờ Định lý Mazur, phần xoắn hoàn toàn xác định được --- đây là thành phần “dễ tính nhất” trong công thức BSD [mazur1977].

4 Hạng (của nhóm Abel) (Rank) Ch.1 3

Định nghĩa hình thức

Định nghĩa (Hạng của nhóm Abel hữu hạn sinh). Cho $G$ là nhóm Abel hữu hạn sinh với phân tích $G \cong \mathbb{Z}^r \oplus G_{\mathrm{tors}}$. Số nguyên $r \geq 0$ được gọi là hạng (rank) của $G$, ký hiệu $\mathrm{rk}(G) = r$.

Tương đương, hạng bằng số phần tử trong một tập sinh cực đại gồm các phần tử độc lập tuyến tính trên $\mathbb{Z}$ modulo phần xoắn [silverman2009].

Trong ngữ cảnh đường cong elliptic, hạng đại số (algebraic rank) $r = \mathrm{rk}(E(\mathbb{Q}))$ là hạng của nhóm Mordell--Weil $E(\mathbb{Q})$.

Ví dụ

Ví dụ (Các đường cong với hạng khác nhau).
  1. Hạng $0$: $E: y^2 = x^3 + 1$. Ta có $E(\mathbb{Q}) \cong \mathbb{Z}/6\mathbb{Z}$: mọi điểm hữu tỉ đều là xoắn. Không có “hướng tự do” nào.
  2. Hạng $1$: $E: y^2 = x^3 - x + 1$. Ở đây $E(\mathbb{Q}) \cong \mathbb{Z}$, sinh bởi một điểm $P$. Mọi điểm hữu tỉ đều có dạng $nP$ với $n \in \mathbb{Z}$.
  3. Hạng $2$: $E: y^2 = x^3 - 5x + 4$. Ta có $E(\mathbb{Q}) \cong \mathbb{Z}^2$: có hai điểm sinh độc lập $P_1, P_2$, mọi điểm có dạng $n_1 P_1 + n_2 P_2$.
  4. Hạng lớn: Kỷ lục hiện tại (tính đến 2024) là các đường cong có hạng $\geq 28$, do Elkies phát hiện [elkies2006]. Câu hỏi “hạng có bị chặn hay không?” vẫn chưa có lời giải.

Ý nghĩa hình học

Hạng đo “kích thước” của tập nghiệm hữu tỉ. Hạng $r$ cho biết “có bao nhiêu hướng độc lập” để sinh ra tất cả điểm hữu tỉ trên đường cong:
  • $r = 0$: Chỉ có hữu hạn điểm hữu tỉ (các điểm xoắn). Tập nghiệm “rời rạc”.
  • $r = 1$: Điểm hữu tỉ nằm trên một “dãy” --- từ một điểm sinh $P$, ta tạo ra $2P$, $3P$, $\ldots$ Về mặt hình học, các điểm này trải dài trên đường cong, ngày càng phức tạp (tọa độ có tử/mẫu rất lớn).
  • $r = 2$: Hai “dãy” độc lập. Điểm hữu tỉ “phủ dày” đường cong hơn.
Hình dung tương tự: hạng của $\mathbb{Z}^r$ tương ứng với số chiều của lưới trong không gian --- $\mathbb{Z}$ là đường thẳng, $\mathbb{Z}^2$ là mặt phẳng, $\mathbb{Z}^3$ là không gian 3 chiều.

Liên hệ với giả thuyết Birch--Dyer

Hạng --- trung tâm của giả thuyết BSD. Hạng $r = \mathrm{rk}(E(\mathbb{Q}))$ chính là đối tượng trung tâm của giả thuyết BSD:

Giả thuyết BSD yếu: $\mathrm{rk}(E(\mathbb{Q})) = \mathrm{ord}_{s=1} L(E,s)$.

Tức là, hạng đại số (đo bằng cấu trúc nhóm) bằng hạng giải tích (đo bằng bậc triệt tiêu của hàm $L$). Đây là cầu nối giữa đại sốgiải tích --- hai thế giới hoàn toàn khác nhau trong toán học.

Các kết quả đã biết [coates-wiles1977, gross-zagier1986, kolyvagin1990]:

  • Nếu $\mathrm{ord}_{s=1} L(E,s) = 0$ thì $\mathrm{rk}(E(\mathbb{Q})) = 0$ (Kolyvagin, dựa trên Gross--Zagier).
  • Nếu $\mathrm{ord}_{s=1} L(E,s) = 1$ thì $\mathrm{rk}(E(\mathbb{Q})) = 1$ (Gross--Zagier + Kolyvagin).
  • Trường hợp $\mathrm{ord}_{s=1} L(E,s) \geq 2$ vẫn hoàn toàn mở.
Theo thống kê Bhargava--Skinner--Zhang [bhargava-skinner-zhang2014], giả thuyết BSD yếu đúng cho ít nhất $66{,}48\%$ các đường cong elliptic (khi sắp xếp theo chiều cao).

5 Vành (Ring) Ch.2 2

Định nghĩa hình thức

Định nghĩa (Vành). Một vành (ring) là một tập hợp $R$ được trang bị hai phép toán hai ngôi --- phép cộng “$+$” và phép nhân “$\cdot$” --- thỏa mãn:
  1. $(R, +)$ là nhóm Abel (với phần tử đơn vị $0$);
  2. Phép nhân kết hợp: $(a \cdot b) \cdot c = a \cdot (b \cdot c)$ với mọi $a, b, c \in R$;
  3. Phân phối: $a \cdot (b + c) = a \cdot b + a \cdot c$ và $(a + b) \cdot c = a \cdot c + b \cdot c$.
Nếu phép nhân có phần tử đơn vị $1 \in R$ (tức $1 \cdot a = a \cdot 1 = a$), ta gọi $R$ là vành có đơn vị (unital ring). Nếu phép nhân giao hoán ($a \cdot b = b \cdot a$), ta gọi $R$ là vành giao hoán [lang1983].

Ví dụ

Ví dụ (Các vành trong lý thuyết số).
  1. $\mathbb{Z}$: Vành các số nguyên --- vành giao hoán có đơn vị đơn giản nhất.
  2. $\mathbb{Z}[i] = \{a + bi : a, b \in \mathbb{Z}\}$: Vành các số nguyên Gauss. Đây là một vành các số nguyên đại số trong trường $\mathbb{Q}(i)$.
  3. $\mathbb{Z}/n\mathbb{Z}$: Vành các số nguyên modulo $n$. Ví dụ $\mathbb{Z}/6\mathbb{Z}$ có ước của không ($2 \cdot 3 = 0$ trong $\mathbb{Z}/6\mathbb{Z}$), nên không phải miền nguyên.
  4. $M_2(\mathbb{Z})$: Vành ma trận $2 \times 2$ với hệ số nguyên --- đây là vành không giao hoán.
  5. $\mathrm{End}(E)$: Vành tự đồng cấu của đường cong elliptic $E$. Thông thường $\mathrm{End}(E) \cong \mathbb{Z}$ (phép nhân vô hướng), nhưng với đường cong có nhân phức (CM), $\mathrm{End}(E)$ lớn hơn --- chẳng hạn $\mathrm{End}(E) \cong \mathbb{Z}[i]$ cho $E: y^2 = x^3 - x$ [silverman2009, cox2013].

Ý nghĩa hình học

Vành và “hệ số”. Vành xuất hiện tự nhiên khi ta muốn nói về “hệ số” cho phép cộng trong một nhóm. Với nhóm Abel $G$:
  • $\mathbb{Z}$ luôn đóng vai trò vành hệ số cơ bản: ta có thể nhân phần tử $g \in G$ với $n \in \mathbb{Z}$ bằng cách cộng $g$ với chính nó $n$ lần.
  • Nếu $G = E(\overline{\mathbb{Q}})$ (các điểm trên bao đóng đại số), thì $\mathrm{End}(E)$ mô tả mọi “phép biến đổi nội tại” của đường cong --- đây là cấu trúc phong phú hơn nhiều so với chỉ nhân vô hướng.
Trong hình học đại số, vành tọa độ $k[x,y]/(f)$ của đường cong $f(x,y) = 0$ mã hóa mọi thông tin đại số của đường cong.

Liên hệ với giả thuyết Birch--Dyer

Vành trong bối cảnh BSD. Các vành xuất hiện ở nhiều cấp độ trong lý thuyết BSD:
  • $\mathrm{End}(E)$: Xác định đường cong có nhân phức (CM) hay không. Trường hợp CM là trường hợp “dễ nhất” mà BSD đã được chứng minh (Coates--Wiles [coates-wiles1977], Rubin [rubin1987]).
  • $\mathbb{Z}_p$ (vành các số nguyên $p$-adic): Nền tảng cho hàm $L$ $p$-adic và lý thuyết Iwasawa.
  • Vành Hecke $\mathbb{T}$: Đóng vai trò then chốt trong chứng minh Wiles ($R = \mathbb{T}$) [wiles1995].
  • Vành biến dạng $R$: Tham số hóa các biểu diễn Galois --- trung tâm của phương pháp Taylor--Wiles [taylor-wiles1995].
6 Trường (Field) Ch.1 2

Định nghĩa hình thức

Định nghĩa (Trường). Một trường (field) là một vành giao hoán có đơn vị $(K, +, \cdot)$ trong đó mọi phần tử khác $0$ đều khả nghịch. Tức là:
  1. $(K, +)$ là nhóm Abel (phần tử đơn vị $0$);
  2. $(K \setminus \{0\}, \cdot)$ là nhóm Abel (phần tử đơn vị $1$);
  3. Phân phối: $a \cdot (b + c) = a \cdot b + a \cdot c$ với mọi $a, b, c \in K$.
Nói ngắn gọn: trong trường, ta có thể cộng, trừ, nhân, và chia (trừ cho $0$), với mọi phép toán tuân theo các quy tắc quen thuộc [lang1983].

Ví dụ

Ví dụ (Các trường quan trọng trong sách).
  1. $\mathbb{Q}$ (số hữu tỉ): Trường nhỏ nhất chứa $\mathbb{Z}$. Đường cong elliptic được nghiên cứu chủ yếu trên $\mathbb{Q}$ trong bối cảnh BSD.
  2. $\mathbb{R}$ (số thực): Trên $\mathbb{R}$, đường cong elliptic $y^2 = x^3 + ax + b$ có dạng hình học quen thuộc --- một hoặc hai “nhánh” liên thông.
  3. $\mathbb{C}$ (số phức): Trên $\mathbb{C}$, mọi đường cong elliptic đẳng cấu với một torus (bánh donut) $\mathbb{C}/\Lambda$, nhờ hàm $\wp$ của Weierstrass.
  4. $\mathbb{F}_p = \mathbb{Z}/p\mathbb{Z}$ (trường hữu hạn): Với $p$ nguyên tố, ta đếm số điểm $\#E(\mathbb{F}_p) = p + 1 - a_p$, trong đó $a_p$ là vết Frobenius --- dữ liệu đầu vào để xây dựng hàm $L(E,s)$.
  5. $\mathbb{Q}_p$ (số $p$-adic): Hoàn thành $\mathbb{Q}$ theo trị tuyệt đối $p$-adic. Đường cong trên $\mathbb{Q}_p$ cung cấp thông tin “cục bộ” --- điều kiện cục bộ xác định nhóm Selmer.
  6. $\mathbb{Q}(\sqrt{-D})$ (trường phức bậc hai ảo): Nơi sinh sống của điểm Heegner --- công cụ chính trong chứng minh Gross--Zagier.

Ý nghĩa hình học

Trường xác định “thế giới” hình học. Trong hình học đại số, trường xác định “hệ tọa độ” mà ta làm việc:
  • Cùng một phương trình $y^2 = x^3 - x$, nhưng trên các trường khác nhau cho các “thế giới” hoàn toàn khác:
  • Trên $\mathbb{R}$: đường cong trơn trong mặt phẳng thực, có hai nhánh.
  • Trên $\mathbb{C}$: torus phức (bánh donut), có cấu trúc phong phú.
  • Trên $\mathbb{F}_5$: chỉ có hữu hạn điểm: $(0,0), (1,0), (4,0)$ cùng $\mathcal{O}$.
  • Trên $\mathbb{Q}$: bốn điểm hữu tỉ.
• Triết lý “cục bộ--toàn cục” trong lý thuyết số: nghiên cứu đường cong trên từng $\mathbb{Q}_p$ (cục bộ) để suy ra thông tin trên $\mathbb{Q}$ (toàn cục).

Liên hệ với giả thuyết Birch--Dyer

Các trường trong giả thuyết BSD. Trường là “sân khấu” nơi câu chuyện BSD diễn ra:
  • $\mathbb{Q}$: BSD cổ điển nghiên cứu $E(\mathbb{Q})$ và $L(E,s)$.
  • $\mathbb{F}_p$: Số điểm $\#E(\mathbb{F}_p)$ cho dữ liệu $a_p$ để xây dựng $L(E,s) = \prod_p L_p(E,s)$.
  • $\mathbb{Q}_p$: Điều kiện cục bộ trong nhóm Selmer; hàm $L$ $p$-adic; lý thuyết Iwasawa.
  • $\mathbb{C}$: Thác triển giải tích của $L(E,s)$; đường cong modular; dạng modular.
  • Trường số $K/\mathbb{Q}$: BSD tổng quát hóa cho $E(K)$ --- ví dụ, BSD đẳng biến.
  • Trường phức bậc hai ảo $\mathbb{Q}(\sqrt{-D})$: Xây dựng điểm Heegner [gross-zagier1986], bước then chốt trong chứng minh BSD cho hạng $1$.
Mỗi trường cung cấp một “góc nhìn” khác nhau về đường cong elliptic, và giả thuyết BSD tổng hợp tất cả các góc nhìn này thành một câu trả lời thống nhất.
7 Trường số (Number field) Ch.1 4

Định nghĩa hình thức

Định nghĩa (Trường số). Một trường số (number field) là một mở rộng hữu hạn $K/\mathbb{Q}$ của trường các số hữu tỉ. Tức là $K$ là một trường chứa $\mathbb{Q}$ sao cho $K$ là không gian véctơ hữu hạn chiều trên $\mathbb{Q}$. Số chiều $[K : \mathbb{Q}] = \dim_\mathbb{Q} K$ được gọi là bậc của trường số [lang1983].

Tương đương, $K = \mathbb{Q}(\alpha)$ cho một số đại số $\alpha$ nào đó --- tức $\alpha$ là nghiệm của một đa thức $f(x) \in \mathbb{Q}[x]$ bất khả quy.

Định nghĩa (Vành các số nguyên đại số). Cho $K$ là trường số. Vành các số nguyên (ring of integers) của $K$, ký hiệu $\mathcal{O}_K$, là tập hợp tất cả các phần tử $\alpha \in K$ thỏa mãn một đa thức monic (bậc nhất hệ số $1$) với hệ số nguyên:
\[ \mathcal{O}_K = \{\alpha \in K : \exists f(x) = x^n + a_{n-1}x^{n-1} + \cdots + a_0 \in \mathbb{Z}[x], \ f(\alpha) = 0\}. \]
Khi $K = \mathbb{Q}$, ta có $\mathcal{O}_\mathbb{Q} = \mathbb{Z}$ [silverman2009].

Ví dụ

Ví dụ (Các trường số cơ bản).
  1. $\mathbb{Q}$ chính nó: Trường số đơn giản nhất, bậc $[\mathbb{Q} : \mathbb{Q}] = 1$.
  2. $\mathbb{Q}(\sqrt{2})$: Trường bậc $2$ gồm các số dạng $a + b\sqrt{2}$ với $a, b \in \mathbb{Q}$. Vành số nguyên $\mathcal{O}_{\mathbb{Q}(\sqrt{2})} = \mathbb{Z}[\sqrt{2}] = \{a + b\sqrt{2} : a, b \in \mathbb{Z}\}$.
  3. $\mathbb{Q}(i) = \mathbb{Q}(\sqrt{-1})$: Trường Gauss, bậc $2$. Vành số nguyên $\mathcal{O}_{\mathbb{Q}(i)} = \mathbb{Z}[i]$ (số nguyên Gauss).
  4. $\mathbb{Q}(\sqrt{-D})$ với $D > 0$: Trường phức bậc hai ảo --- đặc biệt quan trọng cho điểm Heegner (xem Khái niệm 9).
  5. $\mathbb{Q}(\zeta_n)$ với $\zeta_n = e^{2\pi i/n}$: Trường cyclotomic bậc $\phi(n)$. Đóng vai trò trong lý thuyết Iwasawa qua tháp cyclotomic $\mathbb{Q}(\zeta_{p^n})$.

Ý nghĩa hình học

Trường số và “lưới” trong không gian. Có một cách hình dung đẹp cho trường số qua nhúng Minkowski:

Với trường số $K$ bậc $n = [K:\mathbb{Q}]$, vành số nguyên $\mathcal{O}_K$ có thể nhúng vào $\mathbb{R}^n$ như một lưới (lattice) --- tập rời rạc các điểm phân bố đều đặn.

Ví dụ: $\mathbb{Z}[i] \subset \mathbb{C} \cong \mathbb{R}^2$ tạo thành lưới vuông trên mặt phẳng --- mỗi số nguyên Gauss $a + bi$ tương ứng với điểm $(a, b)$. Hình học của lưới này (thể tích ô cơ sở, v.v.) mã hóa các bất biến số học (biệt thức, regulator) của trường số.

Triết lý “hình học của số” (geometry of numbers) --- do Minkowski phát triển --- sử dụng hình dạng của các lưới này để chứng minh các kết quả số học. Bhargava đã mở rộng ý tưởng này một cách sáng tạo để nghiên cứu nhóm Selmer [bhargava-shankar2015].

Liên hệ với giả thuyết Birch--Dyer

Trường số trong BSD. Trường số xuất hiện ở nhiều cấp độ:
  • BSD trên trường số: Giả thuyết BSD tổng quát hóa cho $E(K)$ với trường số $K$ bất kỳ, dự đoán $\mathrm{rk}(E(K)) = \mathrm{ord}_{s=1} L(E/K, s)$.
  • Điểm Heegner: Xây dựng trên trường phức bậc hai ảo $K = \mathbb{Q}(\sqrt{-D})$, sau đó “kéo xuống” $\mathbb{Q}$ qua trace map --- trung tâm của chứng minh Gross--Zagier [gross-zagier1986].
  • Hệ thống Euler: Sử dụng tháp trường số $K \subset K_1 \subset K_2 \subset \cdots$ để xây dựng các lớp đối đồng điều tương thích [kolyvagin1990, rubin2000].
  • Lý thuyết trường lớp: Liên hệ nhóm Galois $\mathrm{Gal}(K^{\mathrm{ab}}/K)$ với nhóm idèle --- nền tảng cho việc hiểu biểu diễn Galois.
8 Trường hữu hạn $\mathbb{F}_p$ (Finite field) Ch.1 3

Định nghĩa hình thức

Định nghĩa (Trường hữu hạn). Một trường hữu hạn (finite field) là trường có hữu hạn phần tử. Với mỗi lũy thừa nguyên tố $q = p^n$ ($p$ nguyên tố, $n \geq 1$), tồn tại duy nhất (sai khác đẳng cấu) một trường hữu hạn có $q$ phần tử, ký hiệu $\mathbb{F}_q$.

Trường hợp quan trọng nhất: $\mathbb{F}_p = \mathbb{Z}/p\mathbb{Z}$ --- trường các số nguyên modulo $p$ [silverman2009].

Ví dụ

Ví dụ (Đếm điểm trên đường cong elliptic). Xét $E: y^2 = x^3 + 1$ trên $\mathbb{F}_7$. Ta liệt kê mọi cặp $(x, y) \in \mathbb{F}_7^2$ thỏa phương trình:
$x$ $x^3 + 1 \pmod{7}$ QR? Điểm $(x,y)$
$0$$1$$1 = 1^2$$(0, 1), (0, 6)$
$1$$2$Không---
$2$$2$Không---
$3$$0$$0 = 0^2$$(3, 0)$
$4$$2$Không---
$5$$0$$0 = 0^2$$(5, 0)$
$6$$0$$0 = 0^2$$(6, 0)$

Vậy $\#E(\mathbb{F}_7) = 5 + 1 = 6$ (5 điểm affine cộng điểm vô cực $\mathcal{O}$).

Vết Frobenius: $a_7 = 7 + 1 - 6 = 2$. Kiểm tra cận Hasse: $|a_7| = 2 \leq 2\sqrt{7} \approx 5{,}29$ --- thỏa mãn.

Ví dụ (Trường hữu hạn mở rộng). $\mathbb{F}_{p^2}$ có $p^2$ phần tử. Trên $\mathbb{F}_{p^2}$, đường cong elliptic có nhiều điểm hơn trên $\mathbb{F}_p$. Cụ thể, các điểm xoắn $n$-phần $E[n]$ sống hoàn toàn trong $\mathbb{F}_{p^{2k}}$ cho $k$ đủ lớn (với $\gcd(n, p) = 1$):
\[ E[n] \cong (\mathbb{Z}/n\mathbb{Z})^2 \quad \text{(luôn có } n^2 \text{ điểm xoắn $n$-phần trên bao đóng đại số)}. \]

Ý nghĩa hình học

Hình học “rời rạc” trên trường hữu hạn. Trên trường hữu hạn $\mathbb{F}_p$, đường cong elliptic không còn là đường cong trơn liên tục --- mà trở thành tập hữu hạn các điểm rời rạc. Dù vậy, cấu trúc nhóm (luật cộng) vẫn hoạt động hoàn hảo.

Hình dung: thay vì mặt phẳng thực vô hạn, ta làm việc trên “bàn cờ” $p \times p$ ô. Đường cong chỉ “chạy qua” một số ô nhất định. Nhưng đáng kinh ngạc là: phép cộng hình học (kẻ đường thẳng qua hai điểm, tìm giao điểm thứ ba) vẫn có nghĩa trên bàn cờ rời rạc này!

Số điểm $\#E(\mathbb{F}_p)$ dao động quanh $p + 1$ theo cận Hasse: $|p + 1 - \#E(\mathbb{F}_p)| \leq 2\sqrt{p}$ [hasse1933]. Sự dao động này, khi $p$ chạy qua tất cả các nguyên tố, chính là “nhịp đập” mà hàm $L$ ghi nhận.

Liên hệ với giả thuyết Birch--Dyer

Trường hữu hạn --- nguồn dữ liệu cho hàm $L$. Trường hữu hạn cung cấp “dữ liệu đầu vào” then chốt cho giả thuyết BSD:
  • Số điểm $\#E(\mathbb{F}_p)$ xác định vết Frobenius $a_p = p + 1 - \#E(\mathbb{F}_p)$.
  • Hàm $L$ được xây dựng từ tích Euler:
    \[ L(E,s) = \prod_{p \text{ tốt}} \frac{1}{1 - a_p p^{-s} + p^{1-2s}} \cdot \prod_{p \text{ xấu}} (\text{nhân tử đơn giản hơn}). \]
  • Ý tưởng ban đầu của Birch--Swinnerton-Dyer [birch-sd1963]: Nếu $E(\mathbb{Q})$ có nhiều điểm hữu tỉ (hạng lớn), thì $E(\mathbb{F}_p)$ “xu hướng” có nhiều điểm hơn trung bình cho mỗi $p$, khiến tích $\prod_{p \leq X} \frac{\#E(\mathbb{F}_p)}{p}$ tăng nhanh. Đây chính là quan sát thực nghiệm dẫn đến giả thuyết BSD.
  • Thuật toán Schoof [schoof1985] cho phép tính $a_p$ hiệu quả, từ đó kiểm nghiệm BSD bằng máy tính.
9 Trường phức bậc hai ảo (Imaginary quadratic field) Ch.6 4

Định nghĩa hình thức

Định nghĩa (Trường phức bậc hai ảo). Một trường phức bậc hai ảo (imaginary quadratic field) là trường số có dạng
\[ K = \mathbb{Q}(\sqrt{-D}), \quad D \in \mathbb{Z}_{>0} \text{ không có thừa số bình phương}, \]
với vành số nguyên:
\[ \mathcal{O}_K = \begin{cases} \mathbb{Z}\left[\frac{1 + \sqrt{-D}}{2}\right] & \text{nếu } D \equiv 3 \pmod{4}, \\[4pt] \mathbb{Z}[\sqrt{-D}] & \text{nếu } D \equiv 1, 2 \pmod{4}. \end{cases} \]
Biệt thức của $K$ là $d_K = -D$ (nếu $D \equiv 3 \pmod{4}$) hoặc $d_K = -4D$ (nếu $D \not\equiv 3 \pmod{4}$) [cox2013].

Ví dụ

Ví dụ (Các trường phức bậc hai ảo quan trọng).
  1. $\mathbb{Q}(i) = \mathbb{Q}(\sqrt{-1})$: $\mathcal{O}_K = \mathbb{Z}[i]$, biệt thức $d_K = -4$. Số lớp $h_K = 1$ (phân tích duy nhất). Liên quan đến đường cong CM $y^2 = x^3 - x$.
  2. $\mathbb{Q}(\sqrt{-3})$: $\mathcal{O}_K = \mathbb{Z}\left[\frac{1+\sqrt{-3}}{2}\right] = \mathbb{Z}[\omega]$ (số nguyên Eisenstein, $\omega = e^{2\pi i/3}$). Số lớp $h_K = 1$. Liên quan đến đường cong CM $y^2 = x^3 + 1$.
  3. $\mathbb{Q}(\sqrt{-5})$: $\mathcal{O}_K = \mathbb{Z}[\sqrt{-5}]$, số lớp $h_K = 2$. Không có phân tích duy nhất: $6 = 2 \cdot 3 = (1+\sqrt{-5})(1-\sqrt{-5})$.
  4. $\mathbb{Q}(\sqrt{-163})$: Số lớp $h_K = 1$. Liên quan đến hằng số Ramanujan: $e^{\pi\sqrt{163}} \approx 262537412640768744$ (gần nguyên đáng kinh ngạc!).

Ý nghĩa hình học

Lưới trong mặt phẳng phức. Vành số nguyên $\mathcal{O}_K$ của trường phức bậc hai ảo tạo thành một lưới trong mặt phẳng phức $\mathbb{C}$:
  • $\mathbb{Z}[i]$: lưới vuông (mỗi ô cơ sở là hình vuông đơn vị).
  • $\mathbb{Z}[\omega]$: lưới tam giác đều (mỗi ô cơ sở là hình bình hành với góc $60°$).
  • $\mathbb{Z}[\sqrt{-5}]$: lưới hình chữ nhật (chiều $1 \times \sqrt{5}$).
Lưới $\mathcal{O}_K$ cũng chính là một lưới chu kỳ cho đường cong elliptic có CM bởi $\mathcal{O}_K$: đường cong $E$ sao cho $\mathbb{C}/\mathcal{O}_K \cong E(\mathbb{C})$. Đây là mối liên hệ sâu sắc giữa số học (trường phức bậc hai) và hình học (torus phức).

Liên hệ với giả thuyết Birch--Dyer

Trường phức bậc hai ảo --- chìa khóa cho BSD. Đây là một trong những cấu trúc quan trọng nhất cho các chứng minh về BSD:
  1. Nhân phức (CM): Đường cong elliptic có $\mathrm{End}(E) \cong \mathcal{O}_K$ (cho trường phức bậc hai ảo $K$) được gọi là đường cong CM. Định lý Coates--Wiles [coates-wiles1977]: Nếu $E$ có CM và $L(E,1) \neq 0$ thì $E(\mathbb{Q})$ hữu hạn --- đây là kết quả đầu tiên theo hướng BSD.
  2. Điểm Heegner: Cho $K = \mathbb{Q}(\sqrt{-D})$ thỏa điều kiện Heegner ($D$ tách hoàn toàn trong $\mathbb{Z}/N\mathbb{Z}$). Khi đó ta xây dựng được điểm Heegner $P_K \in E(K)$, rồi chiếu xuống $E(\mathbb{Q})$ qua trace map. Công thức Gross--Zagier [gross-zagier1986]:
    \[ L'(E,1) = c \cdot \hat{h}(P_K), \]
    với $c > 0$ tường minh. Nếu $L'(E,1) \neq 0$ thì $P_K$ là điểm có chiều cao dương --- tức có bậc vô hạn, suy ra $\mathrm{rk}(E(\mathbb{Q})) \geq 1$.
  3. Kolyvagin [kolyvagin1990]: Kết hợp với Gross--Zagier, chứng minh $L'(E,1) \neq 0 \Rightarrow \mathrm{rk}(E(\mathbb{Q})) = 1$ và $|\mathrm{Sha}| < \infty$.
10 Số nguyên (Integer) Ch.1 1

Định nghĩa hình thức

Định nghĩa (Số nguyên). Tập hợp các số nguyên (integer) $\mathbb{Z} = \{\ldots, -2, -1, 0, 1, 2, \ldots\}$ là vành giao hoán có đơn vị nhỏ nhất chứa số tự nhiên $\mathbb{N}$ và đóng kín với phép trừ. Các tính chất cơ bản:
  • $(\mathbb{Z}, +)$ là nhóm Abel (phần tử đơn vị $0$);
  • $(\mathbb{Z}, +, \cdot)$ là miền nguyên (không có ước của không);
  • $\mathbb{Z}$ là vành chính (mọi ideal đều chính: $I = (n)$ cho $n \in \mathbb{Z}$);
  • $\mathbb{Z}$ là vành phân tích duy nhất (mọi số nguyên $n \neq 0, \pm 1$ phân tích duy nhất thành tích các nguyên tố) [lang1983].

Ví dụ

Ví dụ (Vai trò số nguyên trong phương trình Diophantus). Tìm nghiệm nguyên là bài toán cổ xưa nhất của lý thuyết số:
  1. Bộ ba Pythagoras: $x^2 + y^2 = z^2$ với $x, y, z \in \mathbb{Z}$. Nghiệm: $(3, 4, 5)$, $(5, 12, 13)$, $\ldots$ --- có vô hạn nghiệm, tham số hóa hoàn toàn.
  2. Định lý cuối Fermat: $x^n + y^n = z^n$ không có nghiệm nguyên dương với $n \geq 3$ [wiles1995].
  3. Đường cong elliptic: Tìm điểm $(x, y) \in \mathbb{Q}^2$ trên $y^2 = x^3 + ax + b$ (với $a, b \in \mathbb{Z}$). Đây là bài toán Diophantus “bậc hai” mà BSD nghiên cứu.

Ý nghĩa hình học

Số nguyên như “lưới” cơ bản nhất. $\mathbb{Z}$ là lưới một chiều đơn giản nhất --- các điểm cách đều nhau trên đường thẳng số. Từ $\mathbb{Z}$, ta xây dựng mọi cấu trúc số học:
  • $\mathbb{Z}^2 = \mathbb{Z} \times \mathbb{Z}$: lưới vuông trên mặt phẳng.
  • $\mathbb{Z}[i]$, $\mathbb{Z}[\omega]$: lưới trong mặt phẳng phức (số nguyên đại số).
  • $\mathbb{Z}_p$ (số nguyên $p$-adic): hoàn thành $\mathbb{Z}$ theo chuẩn $p$-adic.
Trong lý thuyết số hiện đại, “hình dạng” và “mật độ” của các lưới (dẫn xuất từ $\mathbb{Z}$) mã hóa thông tin số học sâu sắc --- đây là triết lý nền tảng của hình học số (geometry of numbers).

Liên hệ với giả thuyết Birch--Dyer

Số nguyên trong BSD. Dù đơn giản, $\mathbb{Z}$ là nền tảng cho mọi khái niệm trong BSD:
  • Hệ số $a, b$ trong phương trình Weierstrass $y^2 = x^3 + ax + b$ thuộc $\mathbb{Z}$ (sau khi đưa về mô hình tối thiểu).
  • Hạng $r = \mathrm{rk}(E(\mathbb{Q}))$ là một số nguyên --- và BSD dự đoán $r = \mathrm{ord}_{s=1} L(E,s)$.
  • Conductor $N_E$, số Tamagawa $c_p$, và $|\mathrm{Sha}|$ đều là các số nguyên dương.
  • Công thức BSD mạnh dự đoán đẳng thức giữa các đại lượng hữu tỉ --- cuối cùng quy về quan hệ giữa các số nguyên.
11 Số hữu tỉ (Rational number) Ch.1 1

Định nghĩa hình thức

Định nghĩa (Số hữu tỉ). Trường các số hữu tỉ (rational number) $\mathbb{Q}$ là trường thương (field of fractions) của vành $\mathbb{Z}$:
\[ \mathbb{Q} = \left\{\frac{a}{b} : a \in \mathbb{Z}, \, b \in \mathbb{Z} \setminus \{0\}\right\}, \quad \text{với } \frac{a}{b} = \frac{c}{d} \iff ad = bc. \]
$\mathbb{Q}$ là trường nhỏ nhất có đặc số $0$ (characteristic $0$). Mọi trường số đều chứa $\mathbb{Q}$ như trường con [lang1983].

Ví dụ

Ví dụ (Điểm hữu tỉ trên đường cong elliptic). Xét $E: y^2 = x^3 - 2x + 2$. Điểm $(1, 1) \in E(\mathbb{Q})$ vì $1^2 = 1^3 - 2 \cdot 1 + 2 = 1$.

Bắt đầu từ $P = (1,1)$, phép nhân đôi cho:

\[ 2P = \left(\frac{9}{4}, -\frac{21}{8}\right), \quad 3P = \left(\frac{1681}{1296}, \frac{37471}{46656}\right). \]
Tọa độ ngày càng phức tạp: tử số và mẫu số tăng nhanh theo cấp số nhân. Hiện tượng “bùng nổ” chiều cao này là đặc trưng của các điểm có bậc vô hạn trên đường cong elliptic.

Ý nghĩa hình học

Số hữu tỉ và “lỗ hổng” trên đường thẳng. Trên đường thẳng số thực, $\mathbb{Q}$ là tập “đặc” (dense) nhưng “thưa” theo nghĩa đo (measure zero). Giữa hai số hữu tỉ bất kỳ luôn có vô hạn số vô tỉ.

Với đường cong elliptic, tình huống tương tự: $E(\mathbb{Q})$ là tập “rời rạc” (dù vô hạn nếu $r > 0$) bên trong $E(\mathbb{R})$ liên tục. Giả thuyết BSD nói về “mật độ” của $E(\mathbb{Q})$ bên trong $E(\mathbb{R})$ --- mật độ này được mã hóa bởi hàm $L(E,s)$.

Triết lý “cục bộ--toàn cục”: $\mathbb{Q}$ nhúng vào mọi hoàn thành $\mathbb{Q}_p$ và $\mathbb{R}$. Một điểm hữu tỉ tồn tại trên $E(\mathbb{Q})$ khi và chỉ khi nó tồn tại “cục bộ” trên mọi $E(\mathbb{Q}_p)$ vượt qua “chướng ngại” $\mathrm{Sha}$ (nhóm Tate--Shafarevich).

Liên hệ với giả thuyết Birch--Dyer

$\mathbb{Q}$ --- trường cơ sở của BSD cổ điển. Giả thuyết BSD nguyên bản được phát biểu cho đường cong elliptic $E/\mathbb{Q}$:
  • Câu hỏi cốt lõi: Tập $E(\mathbb{Q})$ “lớn” cỡ nào? (Hạng bằng bao nhiêu?)
  • Trả lời dự đoán: Hạng bằng bậc triệt tiêu $\mathrm{ord}_{s=1} L(E,s)$.
  • Mọi thành phần trong công thức BSD (hạng, phần xoắn, regulator, Sha, Tamagawa, chu kỳ thực) đều liên quan đến tập $E(\mathbb{Q})$ hoặc thông tin “cục bộ” trên $\mathbb{Q}_p$.
  • Sự mở rộng sang trường số $K \supset \mathbb{Q}$ cho BSD tổng quát hơn, nhưng phiên bản trên $\mathbb{Q}$ vẫn là phiên bản được nghiên cứu sâu nhất và có nhiều kết quả nhất.
12 Ideal (Ideal) Ch.6 3

Định nghĩa hình thức

Định nghĩa (Ideal). Cho $R$ là vành giao hoán có đơn vị. Một tập con $I \subseteq R$ được gọi là ideal (ideal) của $R$ nếu:
  1. $(I, +)$ là nhóm con của $(R, +)$ (đặc biệt $0 \in I$);
  2. Với mọi $r \in R$ và $a \in I$, ta có $ra \in I$ (đóng kín khi nhân với phần tử bất kỳ của $R$).
Ideal $I$ được gọi là chính (principal) nếu $I = (a) = \{ra : r \in R\}$ cho $a \in R$ nào đó.

Ideal $\mathfrak{p}$ được gọi là nguyên tố (prime ideal) nếu $ab \in \mathfrak{p} \Rightarrow a \in \mathfrak{p}$ hoặc $b \in \mathfrak{p}$ [lang1983].

Ví dụ

Ví dụ (Ideal trong các vành số nguyên đại số).
  1. Trong $\mathbb{Z}$: Mọi ideal đều chính --- $I = (n)$ cho $n \in \mathbb{Z}$. Ví dụ $(6) = \{0, \pm 6, \pm 12, \ldots\}$. Ideal nguyên tố là $(p)$ với $p$ nguyên tố, và $(0)$.
  2. Trong $\mathbb{Z}[\sqrt{-5}]$: Ideal $(6) = (2)(3)$, nhưng cũng $(6) = (1+\sqrt{-5})(1-\sqrt{-5})$. Vấn đề: $2$ và $3$ không phải phần tử nguyên tố trong $\mathbb{Z}[\sqrt{-5}]$! Tuy nhiên, ở mức ideal:
    \[ (2) = \mathfrak{p}_2^2, \quad (3) = \mathfrak{p}_3 \overline{\mathfrak{p}}_3 \]
    với $\mathfrak{p}_2 = (2, 1+\sqrt{-5})$ và $\mathfrak{p}_3 = (3, 1+\sqrt{-5})$. Phân tích ideal luôn duy nhất --- đây là kết quả nền tảng của Dedekind.
  3. Trong $\mathcal{O}_K$ (vành số nguyên của trường số $K$): Mọi ideal phân tích duy nhất thành tích các ideal nguyên tố. Số lớp $h_K$ đo “mức độ thất bại” của phân tích duy nhất ở mức phần tử: $h_K = 1$ khi và chỉ khi mọi ideal đều chính.

Ý nghĩa hình học

Ideal và “lưới con”. Trong vành số nguyên đại số $\mathcal{O}_K \subset K$, mỗi ideal $I$ tương ứng với một lưới con (sublattice) của lưới $\mathcal{O}_K$ trong $\mathbb{R}^n$.

Ví dụ: trong $\mathbb{Z}[i]$, ideal $(2+i)$ tương ứng với lưới con gồm tất cả bội số Gauss của $2+i$. Lưới này “thưa hơn” lưới ban đầu --- chuẩn (norm) $N(2+i) = 5$ cho biết chỉ số: $[\mathbb{Z}[i] : (2+i)] = 5$.

Nhóm lớp $\mathrm{Cl}(K) = \{\text{ideal phân số}\}/\{\text{ideal chính}\}$ đo “sự khác biệt” giữa ideal và phần tử --- nó là nhóm Abel hữu hạn với $|\mathrm{Cl}(K)| = h_K$.

Liên hệ với giả thuyết Birch--Dyer

Ideal trong bối cảnh BSD. Ideal xuất hiện ở hai nơi chính:
  • Conductor: $N_E = \prod_p p^{f_p}$ là ideal trong $\mathbb{Z}$ (hay số nguyên dương) đo “mức độ rút gọn xấu” của $E$. Conductor xuất hiện trong phương trình hàm của $L(E,s)$ và xác định đường cong modular $X_0(N_E)$ liên kết với $E$ [silverman2009].
  • Nhóm lớp và $\mathrm{Sha}$: Nhóm Tate--Shafarevich $\mathrm{Sha}(E/\mathbb{Q})$ là tương tự của nhóm lớp $\mathrm{Cl}(K)$. Cả hai đo “chướng ngại cục bộ--toàn cục”:
  • $\mathrm{Cl}(K) = 1 \iff$ phân tích duy nhất trong $\mathcal{O}_K$.
  • $\mathrm{Sha}(E/\mathbb{Q}) = 0 \iff$ nguyên lý Hasse đúng cho mọi torsor của $E$.
Công thức số lớp (class number formula) --- tương tự BSD cho trường số --- liên hệ $h_K$ với giá trị đặc biệt hàm zeta Dedekind [washington2008].

Lý thuyết Iwasawa: Module Iwasawa có chuỗi đặc trưng (characteristic ideal) trong đại số Iwasawa $\Lambda$ --- phỏng đoán chính Iwasawa liên hệ ideal này với hàm $L$ $p$-adic.

13 Order (thứ trong vành số nguyên) (Order) Ch.2 5

Định nghĩa hình thức

Định nghĩa (Order). Cho $K$ là trường số bậc $n = [K:\mathbb{Q}]$. Một order (order) trong $K$ là một vành con $\mathcal{O} \subset K$ thỏa mãn:
  1. $\mathcal{O}$ là $\mathbb{Z}$-module tự do hạng $n$ (tức $\mathcal{O} \cong \mathbb{Z}^n$ như nhóm Abel);
  2. $\mathcal{O}$ chứa $1$ (có đơn vị);
  3. $\mathcal{O} \otimes_\mathbb{Z} \mathbb{Q} = K$ (sinh ra $K$ trên $\mathbb{Q}$).
Vành số nguyên $\mathcal{O}_K$ là order cực đại --- chứa mọi order khác. Mọi order $\mathcal{O} \subseteq \mathcal{O}_K$ được xác định bởi conductor $\mathfrak{f} = [\mathcal{O}_K : \mathcal{O}]$ (chỉ số như nhóm Abel) [cox2013].

Ví dụ

Ví dụ (Order trong trường phức bậc hai ảo). Xét $K = \mathbb{Q}(\sqrt{-D})$:
  1. Order cực đại: $\mathcal{O}_K$. Ví dụ $K = \mathbb{Q}(i)$, $\mathcal{O}_K = \mathbb{Z}[i]$.
  2. Order conductor $f$: $\mathcal{O}_f = \mathbb{Z} + f\mathcal{O}_K$. Ví dụ:
    • $K = \mathbb{Q}(i)$, $f = 2$: $\mathcal{O}_2 = \mathbb{Z} + 2\mathbb{Z}[i] = \mathbb{Z}[2i] = \{a + 2bi : a, b \in \mathbb{Z}\}$.
    • $K = \mathbb{Q}(\sqrt{-3})$, $f = 1$: $\mathcal{O}_1 = \mathcal{O}_K = \mathbb{Z}\left[\frac{1+\sqrt{-3}}{2}\right]$.
    • $K = \mathbb{Q}(\sqrt{-3})$, $f = 2$: $\mathcal{O}_2 = \mathbb{Z}[{\sqrt{-3}}]$ (nhỏ hơn $\mathcal{O}_K$).
  3. Biệt thức: Order $\mathcal{O}_f$ có biệt thức $d_f = f^2 d_K$.

Ý nghĩa hình học

Order và “lưới phụ”. Nếu $\mathcal{O}_K$ là lưới “mịn nhất” trong mặt phẳng phức, thì mỗi order $\mathcal{O}_f$ là một “lưới thưa hơn” --- mỗi $f$ ô cơ sở của $\mathcal{O}_K$ gộp thành một ô cơ sở của $\mathcal{O}_f$.

Ví dụ: $\mathbb{Z}[i]$ tạo lưới vuông cạnh $1$. Order $\mathbb{Z}[2i]$ tạo lưới hình chữ nhật $1 \times 2$ --- thưa gấp đôi theo phương ảo.

Trong ngôn ngữ torus phức: $\mathbb{C}/\mathcal{O}_K$ và $\mathbb{C}/\mathcal{O}_f$ là hai đường cong elliptic khác nhau (nhưng liên quan bởi isogeny bậc $f$).

Liên hệ với giả thuyết Birch--Dyer

Order và nhân phức. Khái niệm order liên hệ chặt chẽ với nhân phức:
  • Đường cong elliptic $E$ có nhân phức bởi order $\mathcal{O}$ khi $\mathrm{End}(E) \cong \mathcal{O}$. Thông thường $\mathcal{O} = \mathcal{O}_K$ (order cực đại), nhưng cũng có thể là order nhỏ hơn.
  • Lý thuyết trường lớp liên hệ các order với trường lớp vòng (ring class field): trường $H_f$ sao cho $\mathrm{Gal}(H_f/K) \cong \mathrm{Cl}(\mathcal{O}_f)$ --- nhóm lớp của order [cox2013].
  • Điểm Heegner trên $X_0(N)$ được xây dựng từ các order $\mathcal{O}_f$ thỏa điều kiện Heegner. Conductor $f$ xác định “tầng” nào của tháp trường lớp mà điểm Heegner sống.
  • Công thức Gross--Zagier [gross-zagier1986] sử dụng điểm Heegner ứng với $f = 1$ (order cực đại), nhưng các tổng quát hóa (Yuan--Zhang--Zhang [yuan-zhang-zhang2013]) cho phép $f > 1$.
14 Đường cong elliptic (Elliptic curve) Ch.1 3

Định nghĩa hình thức

Định nghĩa (Đường cong elliptic). Một đường cong elliptic (elliptic curve) trên trường $K$ là một đường cong đại số trơn (không kỳ dị) giống $1$ (genus $1$) cùng với một điểm hữu tỉ được chỉ định $\mathcal{O} \in E(K)$.

Tương đương, $E$ có thể biểu diễn bằng phương trình Weierstrass:

\[ E: y^2 + a_1 xy + a_3 y = x^3 + a_2 x^2 + a_4 x + a_6, \quad a_i \in K, \]
với biệt thức $\Delta \neq 0$ (điều kiện trơn). Điểm $\mathcal{O} = [0:1:0]$ là điểm ở vô cực trong tọa độ xạ ảnh [silverman2009].

Định lý (Cấu trúc nhóm). Tập các điểm $E(K) = \{(x,y) \in K^2 : y^2 + \cdots = x^3 + \cdots\} \cup \{\mathcal{O}\}$ tạo thành nhóm Abel với:
  • Phần tử đơn vị: điểm ở vô cực $\mathcal{O}$;
  • Phần tử nghịch đảo: $-P = (x, -y - a_1 x - a_3)$ nếu $P = (x,y)$;
  • Phép cộng: xác định bởi luật “ba điểm thẳng hàng có tổng bằng $\mathcal{O}$” [silverman-tate2015].

Ví dụ

Ví dụ (Các đường cong elliptic nổi tiếng).
  1. $E: y^2 = x^3 - x$ --- Đường cong có nhân phức bởi $\mathbb{Z}[i]$. Trên $\mathbb{Q}$: $E(\mathbb{Q}) \cong \mathbb{Z}/2\mathbb{Z} \oplus \mathbb{Z}/2\mathbb{Z}$ (hạng $0$). Đây là đường cong trong định lý Coates--Wiles [coates-wiles1977].
  2. $E: y^2 = x^3 - x + 1$ --- Hạng $1$, $E(\mathbb{Q}) \cong \mathbb{Z}$.
  3. $E: y^2 = x^3 - 43x + 166$ --- Conductor $N = 37$, đường cong elliptic đầu tiên (theo conductor). Hạng $1$, điểm sinh $P = (0, \sqrt{166})$... thực ra $(0, \pm\sqrt{166}) \notin \mathbb{Q}$, nhưng $(-2, 12) \in E(\mathbb{Q})$, và $E(\mathbb{Q}) \cong \mathbb{Z}$ sinh bởi $(-2, 12)$.
  4. $E: y^2 + y = x^3 - x$ --- Conductor $N = 37$ (một đường cong khác). Hạng $0$, $E(\mathbb{Q}) \cong \mathbb{Z}/3\mathbb{Z}$.
  5. Đường cong Frey: $E_{a,b}: y^2 = x(x-a^p)(x+b^p)$ --- đường cong liên kết phản chứng với Fermat, dẫn đến chứng minh Wiles [wiles1995].

Ý nghĩa hình học

Đường cong elliptic trên các trường khác nhau. Đường cong elliptic là đối tượng “biến hình” --- thay đổi bộ mặt hoàn toàn tùy trường cơ sở:

Trên $\mathbb{R}$: Đường cong trơn trong mặt phẳng, có một hoặc hai thành phần liên thông. Khi $\Delta > 0$: hai nhánh (một “ốc đảo” và một “dải” vô hạn). Khi $\Delta < 0$: một nhánh liên thông.

Trên $\mathbb{C}$: Đường cong đẳng cấu với torus phức $\mathbb{C}/\Lambda$ --- hình bánh donut! Phép đẳng cấu qua hàm $\wp$ Weierstrass:

\[ z \mapsto \big(\wp(z), \wp'(z)\big). \]
Luật cộng trên torus đơn giản là cộng theo modulo lưới.

Trên $\mathbb{F}_p$: Tập hữu hạn $\sim p$ điểm, nhưng vẫn mang cấu trúc nhóm. Hình dung: “bàn cờ” $p \times p$ với một số ô được đánh dấu.

Đặc biệt: Đường cong elliptic là đường cong đại số duy nhất (genus $1$) mà tập điểm tự nó mang cấu trúc nhóm. Đường cong genus $0$ (đường thẳng, conic) quá đơn giản; đường cong genus $\geq 2$ (theo định lý Faltings) chỉ có hữu hạn điểm hữu tỉ. Genus $1$ là “điểm ngọt” (sweet spot) --- đủ phức tạp để thú vị, đủ đơn giản để nghiên cứu được.

Liên hệ với giả thuyết Birch--Dyer

Đường cong elliptic --- đối tượng trung tâm. Đường cong elliptic là đối tượng chính mà giả thuyết BSD nói về:
  • BSD yếu: $\mathrm{rk}(E(\mathbb{Q})) = \mathrm{ord}_{s=1} L(E,s)$.
  • BSD mạnh: Công thức chính xác cho $\lim_{s \to 1} \frac{L(E,s)}{(s-1)^r}$ qua các bất biến của $E$.
  • Mọi khái niệm khác trong sách (hàm $L$, nhóm Selmer, dạng modular, hệ thống Euler, ...) đều là “công cụ” để hiểu đường cong elliptic.
  • Giải thưởng Clay $1.000.000 [clay2000] dành cho ai chứng minh (hoặc bác bỏ) BSD cho mọi đường cong elliptic trên $\mathbb{Q}$.
15 Phương trình Weierstrass tổng quát (General Weierstrass equation) Ch.2 3

Định nghĩa hình thức

Định nghĩa (Phương trình Weierstrass tổng quát). Phương trình Weierstrass tổng quát (General Weierstrass equation) cho đường cong elliptic trên trường $K$ là:
\[ E: y^2 + a_1 xy + a_3 y = x^3 + a_2 x^2 + a_4 x + a_6, \quad a_1, a_2, a_3, a_4, a_6 \in K. \]
Ký hiệu dạng rút gọn các đại lượng phụ:
\[\begin{aligned} b_2 &= a_1^2 + 4a_2, & b_4 &= a_1 a_3 + 2a_4, \\ b_6 &= a_3^2 + 4a_6, & b_8 &= a_1^2 a_6 - a_1 a_3 a_4 + 4a_2 a_6 + a_2 a_3^2 - a_4^2. \end{aligned}\]
Biệt thức: $\Delta = -b_2^2 b_8 - 8b_4^3 - 27b_6^2 + 9b_2 b_4 b_6$.

Đường cong trơn khi và chỉ khi $\Delta \neq 0$ [silverman2009].

Ví dụ

Ví dụ (Tại sao cần dạng tổng quát?).
  1. Đặc số $2$: Trên $\mathbb{F}_2$, không thể “hoàn thành bình phương” để loại bỏ $a_1 xy$ và $a_3 y$ (vì $2 = 0$). Dạng tổng quát là bắt buộc.
  2. Mô hình tối thiểu: Khi làm việc trên $\mathbb{Z}$ (hoặc $\mathbb{Z}_p$), dạng tổng quát cho phép hệ số nguyên với $|\Delta|$ nhỏ nhất. Ví dụ: $E: y^2 + y = x^3 - x$ có $\Delta = -37$ (tối thiểu!), trong khi dạng rút gọn $y^2 = x^3 - x + 1/4$ có hệ số không nguyên.
  3. $E: y^2 + xy + y = x^3 + x^2$ --- Conductor $N = 11$. Đây là đường cong elliptic với conductor nhỏ nhất có thể.

Ý nghĩa hình học

Weierstrass = “hệ tọa độ chuẩn”. Phương trình Weierstrass đóng vai trò như “hệ tọa độ chuẩn” cho đường cong elliptic, giống như phương trình $x^2 + y^2 = r^2$ là hệ tọa độ chuẩn cho đường tròn.

Thực tế, mọi đường cong elliptic đều có thể đưa về dạng Weierstrass bằng phép đổi biến hữu tỉ. Đây là kết quả cổ điển: genus $1$ + có điểm hữu tỉ $\Rightarrow$ tồn tại nhúng vào $\mathbb{P}^2$ dưới dạng đường cong bậc $3$ (cubic), và từ cubic luôn biến đổi được về Weierstrass.

Năm hệ số $(a_1, a_2, a_3, a_4, a_6)$ là “thừa” --- đường cong chỉ có $1$ tham số thực sự ($j$-bất biến). Nhưng sự “thừa” này cho phép linh hoạt: chọn hệ số tốt cho mỗi mục đích (tối thiểu trên $\mathbb{Z}$, rút gọn trên $\mathbb{Q}$, v.v.).

Liên hệ với giả thuyết Birch--Dyer

Phương trình Weierstrass và BSD. Phương trình Weierstrass là “điểm xuất phát” cho mọi tính toán BSD:
  • Từ các hệ số $(a_1, \ldots, a_6)$, ta tính: biệt thức $\Delta$, $j$-bất biến, conductor $N_E$, rút gọn modulo $p$, vết Frobenius $a_p$, và hàm $L(E,s)$.
  • Mô hình tối thiểu: Để tính chính xác các thành phần BSD mạnh (số Tamagawa $c_p$, chu kỳ thực $\Omega_E$), cần phương trình ở dạng tối thiểu trên $\mathbb{Z}$.
  • Cơ sở dữ liệu Cremona [cremona1997] và LMFDB lưu trữ đường cong dưới dạng Weierstrass tối thiểu, cho phép kiểm nghiệm BSD một cách hệ thống.
16 Phương trình Weierstrass rút gọn (Short Weierstrass equation) Ch.2 3

Định nghĩa hình thức

Định nghĩa (Phương trình Weierstrass rút gọn). Nếu $\mathrm{char}(K) \neq 2, 3$ (đặc biệt khi $K = \mathbb{Q}$), mọi đường cong elliptic có thể đưa về dạng Weierstrass rút gọn (short Weierstrass equation):
\[ E: y^2 = x^3 + ax + b, \quad a, b \in K, \quad \Delta = -16(4a^3 + 27b^2) \neq 0. \]
Phép đổi biến từ dạng tổng quát: hoàn thành bình phương (loại $a_1, a_3$) rồi hoàn thành lập phương (loại $a_2$) [silverman2009].

Ví dụ

Ví dụ (Phép đổi biến tường minh). Xét $E: y^2 + xy + y = x^3 + x^2$ (conductor $11$). Thực hiện:
  1. Thay $y \leftarrow y - \frac{1}{2}(x + 1)$:
    \[ y^2 = x^3 + \frac{5}{4}x^2 + x + \frac{1}{4}. \]
  2. Thay $x \leftarrow x - \frac{5}{12}$ (loại $x^2$):
    \[ y^2 = x^3 - \frac{1}{48}x - \frac{53}{864}. \]
  3. Nhân tỉ lệ $x \leftarrow u^2 x$, $y \leftarrow u^3 y$ với $u$ thích hợp để có hệ số nguyên.
Kết quả: $y^2 = x^3 - 432x - 8208$ (tương đương trên $\mathbb{Q}$, nhưng $|\Delta|$ lớn hơn dạng tổng quát ban đầu!).
Ví dụ (So sánh dạng tổng quát và rút gọn).
Đường cong Dạng tổng quát tối thiểu Dạng rút gọn
$N = 11$ $y^2 + y = x^3 - x^2 - 10x - 20$ $y^2 = x^3 - \frac{1}{48}x - \frac{53}{864}$
$N = 37$ $y^2 + y = x^3 - x$ $y^2 = x^3 - x + 1/4$

Nhận xét: dạng tổng quát tối thiểu có hệ số nguyên “đẹp” hơn, nhưng dạng rút gọn đơn giản hơn về lý thuyết (chỉ có $2$ tham số $a, b$).

Ý nghĩa hình học

Hình dạng đường cong $y^2 = x^3 + ax + b$. Dạng rút gọn cho phép “nhìn thấy” hình học đường cong trực tiếp:
  • Đường cong đối xứng qua trục $x$ (vì $y^2 = \cdots$ nên $(x,y) \in E \iff (x,-y) \in E$).
  • Bên phải $y^2 = f(x)$: đường cong chỉ tồn tại khi $f(x) \geq 0$ (trên $\mathbb{R}$). Nghiệm thực của $f(x) = x^3 + ax + b$ xác định hình dạng:
  • Ba nghiệm thực phân biệt ($\Delta > 0$): hai thành phần --- một “ốc đảo” (vòng khép kín) và một nhánh vô hạn.
  • Một nghiệm thực ($\Delta < 0$): một thành phần liên thông.
• Hệ số $a$ kiểm soát “độ thắt” (waist), $b$ kiểm soát “vị trí” dọc trục $x$.

Liên hệ với giả thuyết Birch--Dyer

Dạng rút gọn trong tính toán BSD. Dạng $y^2 = x^3 + ax + b$ là dạng “lý thuyết” tiêu chuẩn:
  • Công thức luật cộng đơn giản nhất (không có $a_1, a_2, a_3$).
  • Đếm điểm $\#E(\mathbb{F}_p)$: chạy $x = 0, \ldots, p-1$, kiểm tra $x^3 + ax + b$ có phải thặng dư bậc hai modulo $p$ hay không.
  • Chu kỳ thực $\Omega_E = \int_{E(\mathbb{R})} \left|\frac{dx}{2y}\right|$ --- tích phân trên đường cong thực dễ tính nhất ở dạng rút gọn.
  • Tuy nhiên, để tính chính xác các thành phần BSD mạnh (số Tamagawa, mô hình Néron), thường cần quay lại dạng tổng quát tối thiểu.
17 Biệt thức (Discriminant) Ch.2 3

Định nghĩa hình thức

Định nghĩa (Biệt thức của đường cong elliptic). Cho đường cong Weierstrass rút gọn $E: y^2 = x^3 + ax + b$. Biệt thức (discriminant) của $E$ là:
\[ \Delta_E = -16(4a^3 + 27b^2). \]
Với dạng Weierstrass tổng quát, biệt thức phức tạp hơn (xem Khái niệm 15), nhưng tính chất cơ bản giữ nguyên: $E$ trơn (là đường cong elliptic) khi và chỉ khi $\Delta_E \neq 0$ [silverman2009].

Biệt thức tối thiểu $\Delta_{\min}$: biệt thức của mô hình Weierstrass tối thiểu trên $\mathbb{Z}$ --- giá trị $|\Delta|$ nhỏ nhất qua mọi phép đổi biến nguyên. Conductor $N_E$ liên hệ với $\Delta_{\min}$: $N_E \mid \Delta_{\min}$ [silverman2009].

Ví dụ

Ví dụ (Biệt thức và hình dạng).
  1. $E: y^2 = x^3 - x$ ($a = -1$, $b = 0$): $\Delta = -16(4(-1)^3 + 0) = 64$. Vì $\Delta > 0$: hai thành phần trên $\mathbb{R}$.
  2. $E: y^2 = x^3 + 1$ ($a = 0$, $b = 1$): $\Delta = -16(0 + 27) = -432$. Vì $\Delta < 0$: một thành phần trên $\mathbb{R}$.
  3. $E: y^2 = x^3$ ($a = 0$, $b = 0$): $\Delta = 0$ --- không phải đường cong elliptic! Đây là đường cong kỳ dị (có cusp tại gốc tọa độ).
  4. $E: y^2 = x^3 - x^2$ (sau đổi biến): $\Delta = 0$ --- cũng kỳ dị (có nút tại gốc).

Ý nghĩa hình học

Biệt thức đo “mức trơn” của đường cong. Biệt thức $\Delta$ cho biết đường cong có trơn hay không:
  • $\Delta \neq 0$: Đường cong trơn --- mọi điểm đều có tiếp tuyến xác định duy nhất. Đây là đường cong elliptic “thật sự”.
  • $\Delta = 0$: Đường cong có điểm kỳ dị --- nơi tiếp tuyến không xác định (hoặc có nhiều tiếp tuyến):
  • Nút (node): hai nhánh cắt nhau. Nhóm phần trơn $\cong \mathbb{G}_m$ (nhóm nhân).
  • Cusp: một nhánh “nhọn”. Nhóm phần trơn $\cong \mathbb{G}_a$ (nhóm cộng).

Hình dung: $\Delta$ là “nhiệt kế” đo sức khỏe hình học --- $\Delta \neq 0$ nghĩa là đường cong “khỏe mạnh” (trơn), $\Delta = 0$ nghĩa là “bệnh” (kỳ dị).

Liên hệ với giả thuyết Birch--Dyer

Biệt thức trong BSD. Biệt thức liên quan mật thiết đến conductor và rút gọn:
  • Conductor: $N_E = \prod_{p \mid \Delta} p^{f_p}$ --- conductor chỉ chia bởi các nguyên tố chia $\Delta$ (nơi đường cong rút gọn xấu).
  • Rút gọn modulo $p$: Khi $p \nmid \Delta$, rút gọn $\tilde{E}/\mathbb{F}_p$ vẫn trơn (rút gọn tốt). Khi $p \mid \Delta$, rút gọn kỳ dị (nút hoặc cusp) --- loại kỳ dị xác định nhân tử cục bộ trong tích Euler của $L(E,s)$.
  • Phương trình hàm: $N_E$ xuất hiện trực tiếp trong phương trình hàm $\Lambda(E,s) = N_E^{s/2} (2\pi)^{-s} \Gamma(s) L(E,s)$.
  • Biệt thức tối thiểu: $\Delta_{\min}$ xác định mô hình Néron, từ đó tính số Tamagawa $c_p$ --- thành phần trong công thức BSD mạnh.
18 $j$-bất biến ($j$-invariant) Ch.2 4

Định nghĩa hình thức

Định nghĩa ($j$-bất biến). Cho đường cong elliptic $E: y^2 = x^3 + ax + b$. $j$-bất biến ($j$-invariant) là:
\[ j(E) = -1728 \cdot \frac{(4a)^3}{\Delta} = 1728 \cdot \frac{4a^3}{4a^3 + 27b^2}. \]
Với dạng tổng quát: $j = \frac{c_4^3}{\Delta}$ trong đó $c_4 = b_2^2 - 24b_4$.

Tính chất cơ bản: Hai đường cong elliptic trên bao đóng đại số $\overline{K}$ đẳng cấu khi và chỉ khi chúng có cùng $j$-bất biến. Ngược lại, với mỗi $j_0 \in K$, tồn tại đường cong elliptic $E/K$ có $j(E) = j_0$ [silverman2009].

Ví dụ

Ví dụ (Các giá trị $j$ đặc biệt).
  1. $j = 0$: $E: y^2 = x^3 + b$ (tức $a = 0$). Nhóm tự đẳng cấu $\mathrm{Aut}(E) \cong \mathbb{Z}/6\mathbb{Z}$ --- đối xứng bậc $6$. Ví dụ $y^2 = x^3 + 1$: CM bởi $\mathbb{Z}[\omega]$ ($\omega = e^{2\pi i/3}$).
  2. $j = 1728$: $E: y^2 = x^3 + ax$ (tức $b = 0$). Nhóm $\mathrm{Aut}(E) \cong \mathbb{Z}/4\mathbb{Z}$ --- đối xứng bậc $4$. Ví dụ $y^2 = x^3 - x$: CM bởi $\mathbb{Z}[i]$.
  3. $j \neq 0, 1728$: Nhóm $\mathrm{Aut}(E) = \{\pm 1\} \cong \mathbb{Z}/2\mathbb{Z}$ --- đường cong “tổng quát” chỉ có đối xứng $P \mapsto -P$.
  4. $j = -3375 = -15^3$: Đường cong CM bởi $\mathcal{O}_{\mathbb{Q}(\sqrt{-7})}$.
  5. $j = -262537412640768000$: Liên quan đến $\mathbb{Q}(\sqrt{-163})$ và hằng số Ramanujan. Giá trị “khổng lồ” này giải thích tại sao $e^{\pi\sqrt{163}}$ gần nguyên.

Ý nghĩa hình học

$j$-bất biến phân loại “hình dạng” đường cong. $j$-bất biến đóng vai trò giống “DNA” của đường cong elliptic --- hai đường cong cùng $j$ thì “giống nhau” (đẳng cấu trên $\overline{K}$), dù phương trình khác nhau.

Trên $\mathbb{C}$: mỗi đường cong elliptic $\cong \mathbb{C}/\Lambda$ cho lưới $\Lambda$. Nếu $\Lambda = \mathbb{Z} + \mathbb{Z}\tau$ ($\tau \in \mathcal{H}$ nửa mặt phẳng trên), thì:

\[ j(\tau) = \frac{1}{q} + 744 + 196884q + 21493760q^2 + \cdots, \quad q = e^{2\pi i \tau}. \]
Hàm $j(\tau)$ là hàm modular --- bất biến dưới tác động của $\mathrm{SL}_2(\mathbb{Z})$ lên $\mathcal{H}$. Điều này nghĩa là $j$ chỉ phụ thuộc “hình dạng” lưới (tỉ lệ khung hình), không phụ thuộc “kích thước” hay “hướng”.

Không gian moduli: tập tất cả đường cong elliptic (trên $\overline{K}$) tham số hóa bởi $j \in K$ --- “đường thẳng affine” $\mathbb{A}^1$. Mỗi điểm trên đường thẳng này là một “lớp tương đương” đường cong.

Liên hệ với giả thuyết Birch--Dyer

$j$-bất biến và CM trong BSD. $j$-bất biến liên hệ với BSD qua nhân phức:
  • Đường cong CM: $j(E)$ là số nguyên đại số khi $E$ có CM. Cụ thể, $j(E) \in H$ (trường lớp Hilbert của trường phức bậc hai ảo). Chỉ có hữu hạn giá trị $j$ nguyên tương ứng CM --- điều này liên quan đến bài toán số lớp (Heegner, Stark, Baker).
  • Twist: Các đường cong cùng $j$ (nhưng khác nhau trên $\mathbb{Q}$, gọi là twist) có hàm $L$ liên quan nhau bởi đặc trưng Dirichlet. BSD cho twist $E^{(d)}$ liên hệ chặt với BSD cho $E$.
  • Đường cong modular: Hàm $j(\tau)$ liên kết đường cong elliptic với đường cong modular $X(1) = \mathrm{SL}_2(\mathbb{Z}) \backslash \mathcal{H}^*$ --- nền tảng của Định lý modularity [wiles1995, bcdt2001].
  • Giá trị $j = 0$ và $1728$: Có “đối xứng bổ sung” (extra automorphisms), nên công thức BSD có điều chỉnh nhỏ ở mẫu ($|\mathrm{Aut}(E)|$ thay vì $2$).
19 Điều kiện trơn (Smoothness condition) Ch.2 3

Định nghĩa

Định nghĩa (Đường cong trơn). Cho đường cong đại số phẳng $C$ xác định bởi phương trình $F(x, y) = 0$, trong đó $F$ là đa thức trên trường $K$. Một điểm $P = (x_0, y_0)$ trên $C$ được gọi là điểm trơn (smooth point) (hay điểm không kỳ dị) nếu ít nhất một trong hai đạo hàm riêng khác không tại $P$:
\[ \left(\frac{\partial F}{\partial x}(P),\; \frac{\partial F}{\partial y}(P)\right) \neq (0,\, 0). \]
Đường cong $C$ được gọi là trơn (smooth) (hay không kỳ dị) nếu mọi điểm trên $C$ (kể cả trên bao đóng đại số $\overline{K}$) đều là điểm trơn.

Với đường cong elliptic dạng Weierstrass rút gọn $y^2 = x^3 + ax + b$ trên trường có đặc số khác $2, 3$, điều kiện trơn tương đương với biệt thức khác không:

\[ \Delta = -16(4a^3 + 27b^2) \neq 0. \]
Đây chính là điều kiện để đa thức $x^3 + ax + b$ không có nghiệm bội --- hay nói cách khác, ba nghiệm (trong $\overline{K}$) phân biệt đôi một.

Ví dụ

Ví dụ (Kiểm tra tính trơn).
  1. Đường cong trơn: $E: y^2 = x^3 - x + 1$. Ta có $a = -1$, $b = 1$, nên
    \[ \Delta = -16\bigl(4(-1)^3 + 27(1)^2\bigr) = -16(23) = -368 \neq 0. \]
    Vậy $E$ trơn --- đây là đường cong elliptic.
  2. Đường cong không trơn: $C: y^2 = x^3$. Ta có $a = 0$, $b = 0$, nên
    \[ \Delta = -16(0 + 0) = 0. \]
    Tại gốc tọa độ $(0, 0)$: đạo hàm riêng $\partial F/\partial x = -3x^2 = 0$ và $\partial F/\partial y = 2y = 0$. Vậy $(0,0)$ là điểm kỳ dị --- $C$ không phải đường cong elliptic.

Ý nghĩa trực giác

Tại sao cần trơn?. Về mặt hình học, điều kiện trơn có nghĩa là tại mọi điểm trên đường cong, ta luôn xác định được đường tiếp tuyến duy nhất. Nếu đường cong có điểm kỳ dị (tự cắt hoặc có mũi nhọn), thì tại đó đường tiếp tuyến không xác định hoặc không duy nhất.

Về mặt đại số, tính trơn đảm bảo rằng phép cộng điểm trên đường cong elliptic (luật nhóm) hoạt động mọi lúc mọi nơi --- không có điểm nào “phá vỡ” cấu trúc nhóm.

Tương tự vật lý: đường cong trơn giống bề mặt nhẵn mà ta có thể trượt qua mọi điểm không vấp. Điểm kỳ dị giống “chỗ gãy” --- mọi phép tính vi phân đều hỏng tại đó.

Liên hệ với giả thuyết Birch--Dyer

Trơn và BSD. Giả thuyết BSD chỉ áp dụng cho đường cong elliptic, tức đường cong trơn. Tuy nhiên, khi ta rút gọn $E$ modulo số nguyên tố $p$ (để nghiên cứu tính chất cục bộ), đường cong rút gọn $\widetilde{E}/\mathbb{F}_p$ có thể trở nên kỳ dị:
  • Nếu $\widetilde{E}$ trơn: $p$ là số nguyên tố có rút gọn tốt (good reduction).
  • Nếu $\widetilde{E}$ kỳ dị: $p$ là số nguyên tố có rút gọn xấu (bad reduction). Tập các $p$ này xác định conductor (conductor) $N_E$ --- số mũ trong công thức BSD mạnh.
Conductor $N_E$ đóng vai trò “mức” (level) của dạng modular tương ứng theo Định lý modularity [wiles1995, bcdt2001].
20 Đường cong kỳ dị: nút và cusp (Singular curves: node and cusp) Ch.2 4

Định nghĩa

Định nghĩa (Đường cong kỳ dị và phân loại). Một đường cong đại số $C: F(x,y) = 0$ có điểm kỳ dị (singular point) tại $P$ nếu cả hai đạo hàm riêng triệt tiêu tại $P$. Với đường cong bậc ba Weierstrass $y^2 = f(x)$ (trong đó $\deg f = 3$), điểm kỳ dị xảy ra khi $f(x)$ có nghiệm bội. Có hai loại:
  1. Nút (node (node)): $f(x)$ có nghiệm bội đôi (nghiệm kép). Tại điểm nút, đường cong “tự cắt” --- có hai tiếp tuyến phân biệt. Ví dụ: $y^2 = x^2(x+1)$ tại $(0,0)$.
  2. Cusp (điểm nhọn (cusp)): $f(x)$ có nghiệm bội ba. Tại cusp, đường cong “chụm lại thành mũi nhọn” --- chỉ có một tiếp tuyến. Ví dụ: $y^2 = x^3$ tại $(0,0)$.

Phân biệt hai loại qua khai triển Taylor: nếu $f(x) = x^2(x - \alpha)$ với $\alpha \neq 0$ thì là nút; nếu $f(x) = x^3$ thì là cusp.

Ví dụ

Ví dụ (Phân biệt nút và cusp).
  1. Nút: $C_1: y^2 = x^2(x + 1)$. Đa thức $x^2(x+1)$ có nghiệm $x = 0$ (bội 2) và $x = -1$ (bội 1). Tại $(0,0)$: đường cong tự cắt, hai nhánh có tiếp tuyến $y = \pm x$. Nhóm phần trơn $C_1^{\mathrm{ns}}(\mathbb{Q})$ đẳng cấu với nhóm nhân $\mathbb{Q}^{\times}$ (rút gọn nhân tách) hoặc $K^{\times}$ cho mở rộng bậc hai $K/\mathbb{Q}$ (rút gọn nhân không tách).
  2. Cusp: $C_2: y^2 = x^3$. Đa thức $x^3$ có nghiệm $x = 0$ bội 3. Tại $(0,0)$: đường cong có mũi nhọn, chỉ một tiếp tuyến $y = 0$. Nhóm phần trơn $C_2^{\mathrm{ns}}(\mathbb{Q})$ đẳng cấu với nhóm cộng $\mathbb{Q}^{+}$ (rút gọn cộng).

Ý nghĩa trực giác

Nút vs.cusp --- hình ảnh trực quan. Hãy tưởng tượng bạn vẽ đường cong trên giấy:
  • Đường cong trơn: Nét vẽ mượt mà, không tự cắt, không có góc nhọn. Giống hình số $8$ kéo dãn --- nhưng hai vòng không giao nhau.
  • Nút: Đường cong tự cắt tại một điểm, tạo thành hình chữ $\times$. Giống nút dây thừng --- hai sợi dây đi qua cùng một điểm.
  • Cusp: Đường cong chạy đến một điểm rồi quay lại --- giống đầu nhọn của giọt nước. Không tự cắt nhưng “bẹp” lại.

Sự khác biệt quan trọng: tại nút, có 2 hướng (tiếp tuyến) để “đi tiếp”; tại cusp, chỉ có 1 hướng.

Liên hệ với giả thuyết Birch--Dyer

Đường cong kỳ dị trong BSD. Đường cong kỳ dị không phải đường cong elliptic, nhưng chúng xuất hiện tự nhiên khi ta rút gọn $E$ modulo $p$. Loại kỳ dị ảnh hưởng trực tiếp đến các đại lượng trong BSD:
  • Rút gọn nhân (nút) --- có hai loại:
  • Nhân tách (split multiplicative): Hai tiếp tuyến tại nút xác định trên $\mathbb{F}_p$. Nhân tử Euler tại $p$: $(1 - p^{-s})^{-1}$.
  • Nhân không tách (non-split multiplicative): Tiếp tuyến xác định trên $\mathbb{F}_{p^2}$. Nhân tử Euler: $(1 + p^{-s})^{-1}$.
Rút gọn cộng (cusp): Nhân tử Euler tại $p$: $1$ (không đóng góp). • Số Tamagawa $c_p$: Đo “kích thước” phần connected component identity trong nhóm phần trơn. Xuất hiện trực tiếp trong công thức BSD mạnh [tate1975].
21 Điểm ở vô cực (Point at infinity) Ch.2 3

Định nghĩa

Định nghĩa (Tọa độ xạ ảnh và điểm ở vô cực). Không gian xạ ảnh (projective space) $\mathbb{P}^2(K)$ là tập các lớp tương đương $[X : Y : Z]$ với $(X, Y, Z) \neq (0, 0, 0)$ và $(X, Y, Z) \sim (\lambda X, \lambda Y, \lambda Z)$ cho mọi $\lambda \neq 0$. Phương trình Weierstrass rút gọn ở dạng xạ ảnh:
\[ Y^2 Z = X^3 + aXZ^2 + bZ^3. \]
Điểm ở vô cực (point at infinity) là điểm có $Z = 0$. Thay $Z = 0$ vào: $0 = X^3$, nên $X = 0$. Điểm duy nhất là:
\[ \mathcal{O} = [0 : 1 : 0]. \]
Điểm $\mathcal{O}$ là phần tử đơn vị của luật nhóm trên đường cong elliptic.

Ví dụ

Ví dụ (Điểm ở vô cực --- nhìn từ tọa độ affine). Xét $E: y^2 = x^3 - x$ trên $\mathbb{Q}$. Trong tọa độ affine, $E$ là tập các điểm $(x, y) \in \mathbb{Q}^2$ thỏa mãn phương trình, cùng với điểm $\mathcal{O}$ “ở vô cực”.

Ta có thể hình dung $\mathcal{O}$ bằng cách nhìn theo phương $y$: khi $|y| \to \infty$, đường cong “chạy đi xa” theo chiều dọc. Hai “nhánh” (ứng với $y > 0$ và $y < 0$) gặp nhau tại $\mathcal{O}$ --- giống hai đường song song “gặp nhau ở vô cực” trong hình học xạ ảnh.

Cụ thể: cho $P = (0, 0)$ trên $E$ (đây là điểm trên đường cong vì $0^2 = 0^3 - 0$). Đường thẳng đứng $x = 0$ cắt $E$ tại $P = (0,0)$ và “điểm thứ hai” ở vô cực. Luật nhóm: $P + \mathcal{O} = P$ cho mọi $P$, xác nhận $\mathcal{O}$ là phần tử đơn vị.

Ý nghĩa trực giác

Tại sao cần điểm ở vô cực?. Trong hình học Euclid, hai đường thẳng song song không giao nhau. Nhưng trong hình học xạ ảnh, ta “thêm” các điểm ở vô cực để mọi cặp đường thẳng đều giao nhau --- giống như ta nhìn hai đường ray xe lửa hội tụ ở chân trời.

Cho đường cong elliptic, điểm ở vô cực $\mathcal{O}$ có hai vai trò:

  1. Phần tử đơn vị: Giống số $0$ trong phép cộng số nguyên. $P + \mathcal{O} = P$ cho mọi $P$.
  2. Phần tử nghịch đảo: $P + (-P) = \mathcal{O}$, trong đó $-P$ là đối xứng của $P$ qua trục $x$.

Không có $\mathcal{O}$, tập các điểm trên đường cong elliptic chỉ là “tập hợp” --- không có cấu trúc nhóm.

Liên hệ với giả thuyết Birch--Dyer

Điểm ở vô cực và BSD. Điểm $\mathcal{O}$ tuy “trừu tượng” nhưng đóng vai trò nền tảng trong BSD:
  • Hạng = 0: Nếu giả thuyết BSD đúng, $L(E, 1) \neq 0$ khi và chỉ khi $E(\mathbb{Q}) = \{\mathcal{O}\}$ hữu hạn (chỉ gồm các điểm xoắn). Nghĩa là “phần tử đơn vị là tất cả những gì có” --- không có điểm hữu tỉ bậc vô hạn.
  • Vi phân bất biến: Chu kỳ thực $\Omega_E = \int_{E(\mathbb{R})} |\omega|$ (xuất hiện trong BSD mạnh) được tính bằng tích phân vi phân $\omega = dx/(2y)$, chuẩn hóa theo mô hình Néron --- mà mô hình Néron được xây dựng từ không gian xạ ảnh, nơi $\mathcal{O}$ sống.
  • Chiều cao Néron--Tate: $\hat{h}(P) = 0$ khi và chỉ khi $P$ là điểm xoắn --- liên hệ với $\mathcal{O}$ qua phần tử đơn vị. Regulator $R_E$ được tính từ chiều cao, xuất hiện trong tử số BSD mạnh.
22 Điểm hữu tỉ (Rational point) Ch.1 2

Định nghĩa

Định nghĩa (Điểm hữu tỉ trên đường cong elliptic). Cho đường cong elliptic $E$ xác định bởi phương trình $y^2 = x^3 + ax + b$ với $a, b \in \mathbb{Q}$. Một điểm hữu tỉ (rational point) trên $E$ là một điểm $P = (x_0, y_0)$ với $x_0, y_0 \in \mathbb{Q}$ thỏa mãn phương trình, hoặc điểm ở vô cực $\mathcal{O}$. Tập tất cả điểm hữu tỉ:
\[ E(\mathbb{Q}) = \{(x, y) \in \mathbb{Q}^2 : y^2 = x^3 + ax + b\} \cup \{\mathcal{O}\}. \]
Tổng quát hơn, cho trường $K$ bất kỳ, ta ký hiệu $E(K)$ là tập các điểm trên $E$ có tọa độ trong $K$, cùng với $\mathcal{O}$.

Ví dụ

Ví dụ (Tìm điểm hữu tỉ). Xét $E: y^2 = x^3 - x$ trên $\mathbb{Q}$.
  1. Thử $x = 0$: $y^2 = 0$, nên $(0, 0) \in E(\mathbb{Q})$.
  2. Thử $x = 1$: $y^2 = 0$, nên $(1, 0) \in E(\mathbb{Q})$.
  3. Thử $x = -1$: $y^2 = -2 < 0$ --- không có nghiệm thực, nên không có điểm hữu tỉ.
  4. Thử $x = 2$: $y^2 = 6$ --- $\sqrt{6} \notin \mathbb{Q}$, không có điểm hữu tỉ.
  5. Cùng với $\mathcal{O}$, ta được $E(\mathbb{Q}) = \{(0,0), (1,0), (-1,0), \mathcal{O}\}$ --- đường cong này chỉ có 4 điểm hữu tỉ, tất cả là điểm xoắn bậc 2. Hạng $r = 0$.

    Nhận xét: $(0, 0)$, $(1, 0)$, $(-1, 0)$ đều có $y = 0$, nghĩa là $P = -P$, nên đều có bậc 2.

Ý nghĩa trực giác

Câu hỏi ngàn năm: có bao nhiêu nghiệm hữu tỉ?. Câu hỏi “đường cong có bao nhiêu điểm hữu tỉ?” là một trong những câu hỏi cổ xưa nhất của toán học --- từ phương trình Pythagoras $x^2 + y^2 = z^2$ (vô hạn nghiệm) đến Định lý cuối Fermat $x^n + y^n = z^n$ ($n \geq 3$, không có nghiệm nguyên dương).

Cho đường cong elliptic, câu trả lời phức tạp hơn nhiều:

  • $E(\mathbb{Q})$ luôn là nhóm Abel hữu hạn sinh (Định lý Mordell--Weil).
  • Phần xoắn $E(\mathbb{Q})_{\mathrm{tors}}$ luôn hữu hạn --- Mazur phân loại đầy đủ 15 trường hợp.
  • Phần tự do có hạng $r$: $E(\mathbb{Q}) \cong E(\mathbb{Q})_{\mathrm{tors}} \oplus \mathbb{Z}^r$.
  • Giả thuyết BSD: $r = \mathrm{ord}_{s=1} L(E, s)$ --- hạng bằng bậc triệt tiêu hàm $L$ tại $s = 1$.

Liên hệ với giả thuyết Birch--Dyer

Điểm hữu tỉ --- trung tâm của BSD. Giả thuyết BSD thực chất là về $E(\mathbb{Q})$: có bao nhiêu điểm hữu tỉ độc lập? Cụ thể hơn, hạng $r$ của $E(\mathbb{Q})$ --- số lượng điểm hữu tỉ “cơ bản” (sinh phần tự do) --- được tiên đoán bởi hàm $L$:
  • BSD yếu: $r = \mathrm{ord}_{s=1} L(E, s)$.
  • BSD mạnh: Ngoài hạng, còn tiên đoán giá trị chính xác của đạo hàm bậc $r$ qua công thức:
    \[ \frac{L^{(r)}(E, 1)}{r!} = \frac{|\mathrm{Sha}(E/\mathbb{Q})| \cdot \Omega_E \cdot R_E \cdot \prod_p c_p}{|E(\mathbb{Q})_{\mathrm{tors}}|^2}. \]
Vế trái thuần túy giải tích (từ hàm $L$ --- đếm điểm modulo $p$), vế phải thuần túy đại số (từ cấu trúc nhóm $E(\mathbb{Q})$). Sự liên hệ kỳ diệu này là lý do BSD được Clay Mathematics Institute đưa vào 7 bài toán thiên niên kỷ [clay2000].
23 Luật nhóm trên đường cong elliptic (Group law) Ch.2 3

Định nghĩa

Định nghĩa (Luật nhóm bằng phép cộng dây cung và tiếp tuyến). Cho đường cong elliptic $E: y^2 = x^3 + ax + b$ trên trường $K$. Luật nhóm (group law) trên $E(K)$ được xác định bằng quy tắc hình học “dây cung và tiếp tuyến” (chord-and-tangent):

Phép cộng $P + Q$ (với $P \neq Q$, $P \neq \mathcal{O}$, $Q \neq \mathcal{O}$):

  1. Kẻ đường thẳng $\ell$ qua $P$ và $Q$.
  2. $\ell$ cắt $E$ tại điểm thứ ba $R'$ (theo Định lý Bézout, đường thẳng cắt đường cong bậc 3 tại đúng 3 điểm, tính cả bội).
  3. Lấy đối xứng $R'$ qua trục $x$: $P + Q = -R' = (x_{R'}, -y_{R'})$.

Nhân đôi $P + P = 2P$ (khi $P = Q$):

  1. Kẻ đường tiếp tuyến với $E$ tại $P$.
  2. Tiếp tuyến cắt $E$ tại điểm thứ hai $R'$.
  3. $2P = -R'$.

Phần tử đơn vị: $\mathcal{O}$ (điểm ở vô cực). $P + \mathcal{O} = P$ cho mọi $P$.

Phần tử nghịch đảo: $-P = (x, -y)$ nếu $P = (x, y)$.

Công thức đại số. Cho $P = (x_1, y_1)$ và $Q = (x_2, y_2)$ với $P \neq \pm Q$:

\[ \lambda = \frac{y_2 - y_1}{x_2 - x_1}, \qquad x_3 = \lambda^2 - x_1 - x_2, \qquad y_3 = \lambda(x_1 - x_3) - y_1. \]
Khi $P = Q$ (nhân đôi) và $y_1 \neq 0$:
\[ \lambda = \frac{3x_1^2 + a}{2y_1}, \qquad x_3 = \lambda^2 - 2x_1, \qquad y_3 = \lambda(x_1 - x_3) - y_1. \]

Ví dụ

Ví dụ (Phép cộng trên $y^2 = x^3 - 7x + 10$). Cho $P = (1, 2)$ và $Q = (3, 4)$ trên $E: y^2 = x^3 - 7x + 10$.

Kiểm tra: $2^2 = 1 - 7 + 10 = 4$ ✓ và $4^2 = 27 - 21 + 10 = 16$ ✓.

Tính $P + Q$:

\[ \lambda = \frac{4 - 2}{3 - 1} = 1, \qquad x_3 = 1 - 1 - 3 = -3, \qquad y_3 = 1 \cdot (1 - (-3)) - 2 = 2. \]
Vậy $P + Q = (-3, 2)$. Kiểm tra: $2^2 = -27 + 21 + 10 = 4$ ✓.

Tính $2P$:

\[ \lambda = \frac{3(1)^2 + (-7)}{2(2)} = \frac{-4}{4} = -1, \qquad x_3 = 1 - 2 = -1, \qquad y_3 = (-1)(1-(-1)) - 2 = -4. \]
Vậy $2P = (-1, -4)$. Kiểm tra: $(-4)^2 = -1 + 7 + 10 = 16$ ✓.

Ý nghĩa trực giác

Phép cộng hình học. Luật nhóm trên đường cong elliptic có vẻ “nhân tạo” nhưng thực ra rất tự nhiên. Ý tưởng cốt lõi:

Đường thẳng cắt đường cong bậc 3 tại 3 điểm. Nếu biết 2 điểm, ta “buộc” phải tìm được điểm thứ 3. Phép lấy đối xứng qua trục $x$ biến “3 điểm trên đường thẳng” thành “phép cộng nhóm”.

Tính chất đáng kinh ngạc: phép toán hình học đơn giản này thỏa mãn tất cả tiên đề nhóm --- kết hợp, giao hoán, đơn vị, nghịch đảo. Chứng minh tính kết hợp ($P + (Q + R) = (P + Q) + R$) là phần khó nhất, đòi hỏi kỹ thuật đại số hoặc lý thuyết ước Cartier [silverman2009].

Liên hệ với giả thuyết Birch--Dyer

Luật nhóm và BSD. Luật nhóm là “xương sống” của toàn bộ lý thuyết BSD:
  • Hạng: Số lần bạn cần áp dụng luật nhóm (cộng các điểm sinh) để tạo ra mọi điểm hữu tỉ. Hạng $r$ là số điểm sinh tối thiểu.
  • Descent: Phương pháp chính để ước lượng hạng (2-descent, $n$-descent) dựa trên phân tích luật nhóm modulo bình phương.
  • Chiều cao: Chiều cao Néron--Tate $\hat{h}$ là “norm” trên nhóm $E(\mathbb{Q})/E(\mathbb{Q})_{\mathrm{tors}}$ --- biến phép cộng nhóm thành hình học (không gian Euclid).
  • Regulator: $R_E = \det(\langle P_i, P_j \rangle)$ --- thể tích song song diện trong không gian chiều cao, đo “mức phân tán” của các điểm sinh dưới luật nhóm.
24 Nhân bội (nhân vô hướng) (Scalar multiplication) Ch.2 3

Định nghĩa

Định nghĩa (Nhân vô hướng trên đường cong elliptic). Cho đường cong elliptic $E$ và điểm $P \in E(K)$. Nhân vô hướng (scalar multiplication) $[n]P$ (hay $nP$) với $n \in \mathbb{Z}$ được định nghĩa đệ quy:
\[\begin{aligned} [0]P &= \mathcal{O}, \\ [n]P &= \underbrace{P + P + \cdots + P}_{n \text{ lần}} \quad \text{nếu } n > 0, \\ [n]P &= [-n](-P) \quad \text{nếu } n < 0. \end{aligned}\]

Ánh xạ nhân $n$: $[n]: E \to E$, $P \mapsto nP$ là một đồng cấu nhóm (group homomorphism), và cũng là isogeny bậc $n^2$ (khi $n \neq 0$) với hạt nhân:

\[ E[n] = \ker([n]) = \{P \in E(\overline{K}) : nP = \mathcal{O}\}. \]
Trên trường đặc số $0$ hoặc coprime với $n$: $E[n] \cong (\mathbb{Z}/n\mathbb{Z})^2$ --- tập điểm $n$-xoắn có đúng $n^2$ phần tử [silverman2009].

Ví dụ

Ví dụ (Nhân vô hướng và thuật toán double-and-add). Xét $E: y^2 = x^3 + 1$ và $P = (0, 1)$. Tính $6P$ bằng thuật toán double-and-add:
  1. $2P$: Tiếp tuyến tại $P = (0,1)$: $\lambda = \frac{3 \cdot 0^2}{2 \cdot 1} = 0$. $x_3 = 0 - 0 = 0$, $y_3 = 0 - 1 = -1$. Vậy $2P = (0, -1)$.
  2. $3P = 2P + P = (0,-1) + (0,1)$: Vì $y_1 = -y_2$ và $x_1 = x_2$, ta có $3P = \mathcal{O}$.

Nhận xét: $P$ có bậc 3 (tức $3P = \mathcal{O}$), nên $6P = 2 \cdot (3P) = 2\mathcal{O} = \mathcal{O}$ và $4P = 3P + P = P$, v.v. Toàn bộ nhóm sinh bởi $P$: $\{P, 2P, \mathcal{O}\} \cong \mathbb{Z}/3\mathbb{Z}$.

Thuật toán double-and-add tính $nP$ hiệu quả: viết $n$ dưới dạng nhị phân, lần lượt double và add. Số phép tính: $O(\log n)$ thay vì $O(n)$.

Ý nghĩa trực giác

Nhân bội --- “bước đi” trên đường cong. Nhân vô hướng $nP$ giống “đi $n$ bước” từ gốc $\mathcal{O}$ theo hướng $P$ trên đường cong elliptic:
  • $1P = P$: một bước.
  • $2P = P + P$: hai bước (dùng tiếp tuyến).
  • $nP$: $n$ bước (dùng lặp lại phép cộng).
  • Nếu bạn quay lại $\mathcal{O}$ sau $n$ bước ($nP = \mathcal{O}$) thì $P$ có “bậc $n$” --- đường cong “khép kín” sau $n$ bước.

Bài toán logarit rời rạc trên EC (ECDLP): cho $P$ và $Q = nP$, tìm $n$. Bài toán này “dễ theo chiều thuận” (tính $nP$ nhanh bằng double-and-add) nhưng “cực khó theo chiều ngược” --- nền tảng của mật mã đường cong elliptic (ECC) [lenstra1987].

Liên hệ với giả thuyết Birch--Dyer

Nhân bội trong BSD. Nhân vô hướng liên hệ mật thiết với BSD qua nhiều khía cạnh:
  • Điểm $n$-xoắn $E[n]$: Hạt nhân của $[n]$. Dãy chính xác ngắn
    \[ 0 \to E[n] \to E \xrightarrow{[n]} E \to 0 \]
    là điểm khởi đầu của dãy Kummer, dẫn đến nhóm Selmer $\mathrm{Sel}_n(E/\mathbb{Q})$ và nhóm Tate--Shafarevich $\mathrm{Sha}(E/\mathbb{Q})$.
  • Descent: Phương pháp $n$-descent phân tích ánh xạ $[n]$ để ước lượng hạng. Cụ thể, $n$-Selmer rank cung cấp cận trên cho hạng thực sự.
  • Điểm Heegner: Điểm Heegner $P_K$ trên $E$ được chứng minh có bậc vô hạn (không có $n$ nào cho $nP_K = \mathcal{O}$) khi $L'(E, 1) \neq 0$ --- đây là nội dung chính của Gross--Zagier + Kolyvagin [gross-zagier1986, kolyvagin1990].
  • Phần tử xoắn: $|E(\mathbb{Q})_{\mathrm{tors}}|^2$ xuất hiện ở mẫu số công thức BSD mạnh --- phần xoắn “giảm” giá trị đặc biệt của hàm $L$.
25 Điểm xoắn $n$-phần ($n$-torsion points $E[n]$) Ch.2 5

Định nghĩa

Định nghĩa (Điểm $n$-xoắn). Cho đường cong elliptic $E$ trên trường $K$ và số nguyên dương $n \geq 1$. Tập các điểm $n$-xoắn ($n$-torsion points) là hạt nhân của ánh xạ nhân $n$:
\[ E[n] = \ker([n]) = \{P \in E(\overline{K}) : nP = \mathcal{O}\}. \]
Nói cách khác, $E[n]$ gồm tất cả các điểm trên $E$ (trên bao đóng đại số $\overline{K}$) có bậc chia hết cho $n$.

Khi $\mathrm{char}(K) = 0$ hoặc $\mathrm{char}(K) \nmid n$:

\[ E[n] \cong (\mathbb{Z}/n\mathbb{Z}) \times (\mathbb{Z}/n\mathbb{Z}) \cong (\mathbb{Z}/n\mathbb{Z})^2. \]
Đặc biệt, $|E[n]| = n^2$ [silverman2009].

Khi $\mathrm{char}(K) = p > 0$ và $n = p^k$: $E[p^k] \cong (\mathbb{Z}/p^k\mathbb{Z})$ (đường cong thường --- ordinary) hoặc $E[p^k] = \{0\}$ (đường cong siêu kỳ dị --- supersingular).

Ví dụ

Ví dụ (Điểm $n$-xoắn cụ thể).
  1. Điểm 2-xoắn trên $E: y^2 = x^3 - x = x(x-1)(x+1)$:
    \[ E[2] = \{\mathcal{O},\, (0,0),\, (1,0),\, (-1,0)\} \cong (\mathbb{Z}/2\mathbb{Z})^2. \]
    Các điểm 2-xoắn có $y = 0$ (vì $2P = \mathcal{O} \Leftrightarrow P = -P \Leftrightarrow y = -y$), tức là nghiệm của $x^3 - x = 0$. Cùng $\mathcal{O}$, ta được $|E[2]| = 2^2 = 4$ phần tử.
  2. Điểm 3-xoắn trên $E: y^2 = x^3 + 1$. Điểm $P = (0, 1)$ có $3P = \mathcal{O}$ (đã tính ở mục trước). Trên $\overline{\mathbb{Q}}$, $E[3]$ có $3^2 = 9$ phần tử --- nhưng phần lớn có tọa độ trong $\mathbb{Q}(\zeta_3)$ (trường chứa căn bậc ba của đơn vị).
  3. Biểu diễn Galois: Nhóm Galois tuyệt đối $\mathrm{Gal}(\overline{\mathbb{Q}}/\mathbb{Q})$ tác động lên $E[n]$ (hoán vị các điểm $n$-xoắn). Vì $E[n] \cong (\mathbb{Z}/n\mathbb{Z})^2$, ta được biểu diễn:
    \[ \rho_{E,n}: \mathrm{Gal}(\overline{\mathbb{Q}}/\mathbb{Q}) \to \mathrm{GL}_2(\mathbb{Z}/n\mathbb{Z}). \]
    Đây là biểu diễn Galois modulo $n$ (mod-$n$ Galois representation) --- công cụ cốt lõi trong lý thuyết số hiện đại.

Ý nghĩa trực giác

Điểm xoắn --- “vòng tròn” trên đường cong. Trên đường tròn đơn vị $S^1$, các nghiệm bậc $n$ của đơn vị ($z^n = 1$) chia đường tròn thành $n$ phần bằng nhau --- tạo thành nhóm $\mathbb{Z}/n\mathbb{Z}$.

Trên đường cong elliptic, $E[n]$ giống “lưới chia đều” --- nhưng vì $E$ có “2 chiều” (là torus phức $\mathbb{C}/\Lambda$), nên $E[n]$ là lưới $(\mathbb{Z}/n\mathbb{Z})^2$ với $n^2$ điểm. Cụ thể, nếu $\Lambda = \mathbb{Z}\omega_1 + \mathbb{Z}\omega_2$, thì:

\[ E[n] = \left\{\frac{a\omega_1 + b\omega_2}{n} : a, b \in \{0, 1, \ldots, n-1\}\right\}. \]

Biểu diễn Galois $\rho_{E,n}$ mã hóa cách “đối xứng số học” (Galois) xáo trộn lưới này --- mỗi phần tử Galois “xoay và biến đổi” lưới $n^2$ điểm bằng một ma trận $2 \times 2$.

Liên hệ với giả thuyết Birch--Dyer

$E[n]$ --- cầu nối giữa đường cong và đại số đồng điều. Điểm $n$-xoắn là thành phần cơ bản nhất xây dựng nên nhóm Selmer và Sha:
  • Dãy Kummer: Dãy chính xác ngắn $0 \to E[n] \to E \xrightarrow{[n]} E \to 0$ dẫn đến dãy dài đối đồng điều Galois:
    \[ 0 \to E(K)/nE(K) \to H^1(\mathrm{Gal}(\overline{K}/K),\, E[n]) \to H^1(\mathrm{Gal}(\overline{K}/K),\, E)[n] \to 0. \]
    Từ đây ta xây dựng $\mathrm{Sel}_n(E/K)$ và $\mathrm{Sha}(E/K)[n]$.
  • Biểu diễn Galois $p$-adic: Lấy giới hạn ngược $T_p(E) = \varprojlim E[p^k]$ ta được module Tate (Tate module) $T_p(E) \cong \mathbb{Z}_p^2$, cho biểu diễn $\rho_{E,p}: \mathrm{Gal}(\overline{\mathbb{Q}}/\mathbb{Q}) \to \mathrm{GL}_2(\mathbb{Z}_p)$. Hàm $L$ được xây dựng từ biểu diễn này [serre1970].
  • Phỏng đoán Serre: Với “hầu hết” $E/\mathbb{Q}$ không CM, $\rho_{E,p}$ là toàn ánh cho mọi $p$ đủ lớn. Điều này liên quan đến tính “đơn giản” của nhóm Selmer [khare-wintenberger2009].
26 Twist bậc hai (Quadratic twist) Ch.2 4

Định nghĩa

Định nghĩa (Twist bậc hai). Cho đường cong elliptic $E: y^2 = x^3 + ax + b$ trên $\mathbb{Q}$ và số nguyên không chính phương $d \neq 0$. Twist bậc hai (quadratic twist) của $E$ theo $d$ là đường cong:
\[ E^{(d)}: dy^2 = x^3 + ax + b, \]
hay tương đương (qua phép đổi biến $Y = dy$, $X = x$):
\[ E^{(d)}: Y^2 = x^3 + ad^2 x + bd^3. \]
Hai đường cong $E$ và $E^{(d)}$ có cùng $j$-bất biến nhưng nói chung không đẳng cấu trên $\mathbb{Q}$. Chúng đẳng cấu trên $\mathbb{Q}(\sqrt{d})$:
\[ E \cong_{\mathbb{Q}(\sqrt{d})} E^{(d)}, \qquad (x, y) \mapsto (x,\, y\sqrt{d}). \]

Ví dụ

Ví dụ (Twist của đường cong congruent number). Đường cong “số đồng dư” $E: y^2 = x^3 - x$ có:
  1. $E^{(-1)}: y^2 = x^3 + x$ --- twist theo $d = -1$. Đường cong $E$ có hạng $r = 0$, nhưng $E^{(-1)}$ cũng có hạng $r = 0$.
  2. $E^{(5)}: y^2 = x^3 - 25x$ --- twist theo $d = 5$. Đường cong này có hạng $r = 1$ (điểm $(5, 10)$ là điểm sinh bậc vô hạn), liên quan đến việc $5$ là số đồng dư.
  3. $E^{(6)}: y^2 = x^3 - 36x$ --- twist theo $d = 6$. Hạng $r = 1$ ($6$ cũng là số đồng dư).
Nhận xét: cùng đường cong “gốc” $E$, các twist khác nhau cho hạng khác nhau --- đây chính là nội dung của Định lý Tunnell [tunnell1983].

Ý nghĩa trực giác

Twist --- “biến thể” của đường cong. Twist bậc hai giống như “nhìn cùng một đường cong qua kính khác”:
  • Trên $\overline{\mathbb{Q}}$ (hay $\mathbb{C}$): $E$ và $E^{(d)}$ giống hệt nhau (đẳng cấu).
  • Trên $\mathbb{Q}$: chúng khác nhau --- có thể có số điểm hữu tỉ khác nhau, hạng khác nhau, thậm chí nhóm Sha khác nhau.

Phép tương tự: hai bức ảnh chụp cùng vật thể từ hai góc khác nhau. “Hình dạng” (= $j$-bất biến) giống nhau, nhưng “chi tiết” (= tính chất số học trên $\mathbb{Q}$) khác nhau.

Mỗi đường cong elliptic trên $\mathbb{Q}$ có vô hạn twist (ứng với mỗi $d$ squarefree). Họ twist tạo thành “gia đình” chia sẻ nhiều tính chất chung.

Liên hệ với giả thuyết Birch--Dyer

Twist và BSD. Twist bậc hai đóng vai trò trung tâm trong nhiều tiến bộ về BSD:
  • Hàm $L$ twist: $L(E^{(d)}, s) = L(E, \chi_d, s)$, trong đó $\chi_d = \left(\frac{d}{\cdot}\right)$ là đặc trưng Dirichlet bậc hai. BSD cho $E^{(d)}$ liên hệ với giá trị $L(E, \chi_d, 1)$.
  • Phân bố hạng: Phỏng đoán Goldfeld: trong họ twist $\{E^{(d)}\}$, “hầu hết” có hạng $0$ hoặc $1$ (50% mỗi loại). Smith (2022) chứng minh phỏng đoán này cho đường cong có nhóm 2-Selmer trung bình nhỏ.
  • Bhargava--Shankar--Zhang: Chứng minh $\geq 66.48\%$ đường cong elliptic thỏa mãn BSD yếu, bằng cách nghiên cứu twist và Selmer trung bình [bhargava-skinner-zhang2014].
  • Bài toán số đồng dư: $n$ là số đồng dư $\Leftrightarrow$ $E^{(n)}: y^2 = x^3 - n^2x$ có hạng $\geq 1$. Tunnell cho điều kiện đủ (và cần nếu BSD đúng) bằng công thức đếm biểu diễn [tunnell1983].
27 Đẳng cấu (Isomorphism (of elliptic curves)) Ch.2 3

Định nghĩa

Định nghĩa (Đẳng cấu đường cong elliptic). Hai đường cong elliptic $E_1$ và $E_2$ trên trường $K$ được gọi là đẳng cấu (isomorphic) trên $K$, ký hiệu $E_1 \cong_K E_2$, nếu tồn tại ánh xạ hữu tỉ (đa thức) $\phi: E_1 \to E_2$ là song ánh với ánh xạ ngược $\phi^{-1}$ cũng là hữu tỉ, và $\phi$ bảo toàn điểm gốc: $\phi(\mathcal{O}_1) = \mathcal{O}_2$.

Cụ thể, với đường cong Weierstrass rút gọn trên trường có $\mathrm{char}(K) \neq 2, 3$, đẳng cấu $E_1 \to E_2$ có dạng:

\[ (x, y) \mapsto (u^2 x + r,\; u^3 y + u^2 sx + t) \]
cho các $u, r, s, t \in K$ với $u \neq 0$. Khi cả hai ở dạng rút gọn $y^2 = x^3 + ax + b$, đẳng cấu đơn giản hóa thành:
\[ \phi_u: (x, y) \mapsto (u^2 x,\, u^3 y), \quad a' = u^4 a,\; b' = u^6 b. \]
Hai đường cong đẳng cấu (trên $\overline{K}$) khi và chỉ khi chúng có cùng $j$-bất biến.

Ví dụ

Ví dụ (Đẳng cấu cụ thể).
  1. $E_1: y^2 = x^3 - x$ và $E_2: y^2 = x^3 - 4x$. Phép đổi biến $u = \sqrt{2}$ (không thuộc $\mathbb{Q}$!):
    \[ (x, y) \mapsto (2x,\, 2\sqrt{2}\, y). \]
    Kiểm tra: $a' = u^4 a = 4 \cdot (-1) = -4$ ✓. Vậy $E_1 \cong_{\mathbb{Q}(\sqrt{2})} E_2$ nhưng $E_1 \not\cong_{\mathbb{Q}} E_2$.

    Thực tế: $E_2 = E_1^{(2)}$ là twist bậc hai của $E_1$ theo $d = 2$.

  2. $E_1: y^2 = x^3 + 1$ có $j = 0$. Mọi đường cong có $j = 0$ đều đẳng cấu với $E_1$ trên $\overline{\mathbb{Q}}$, nhưng trên $\mathbb{Q}$ chúng phân thành nhiều lớp twist: $y^2 = x^3 + d$ cho $d$ squarefree.
  3. Nhóm tự đẳng cấu: $\mathrm{Aut}(E_1) = \{(x,y) \mapsto (\zeta^2 x, \zeta^3 y) : \zeta^6 = 1\}$ khi $j = 0$ --- có 6 phần tử (trên $\overline{\mathbb{Q}}$). Với $j \neq 0, 1728$: $|\mathrm{Aut}(E)| = 2$ (chỉ có $\pm \mathrm{id}$).

Ý nghĩa trực giác

Đẳng cấu = “cùng hình dạng”. Đẳng cấu đường cong elliptic giống “phép co giãn hợp lệ” --- thay đổi kích thước nhưng giữ nguyên cấu trúc nhóm. Hai đường cong đẳng cấu có:
  • Cùng $j$-bất biến (“DNA” của đường cong).
  • Cùng nhóm điểm (trên trường đẳng cấu).
  • Cùng hàm $L$ (nếu đẳng cấu trên $\mathbb{Q}$).

Nhưng “đẳng cấu trên trường nào” rất quan trọng: hai đường cong giống hệt trên $\mathbb{C}$ có thể rất khác nhau trên $\mathbb{Q}$ --- hạng, nhóm xoắn, thậm chí Sha đều có thể khác!

Liên hệ với giả thuyết Birch--Dyer

Đẳng cấu và BSD.
  • Bất biến: Nếu $E_1 \cong_\mathbb{Q} E_2$ thì BSD cho $E_1$ tương đương BSD cho $E_2$ --- mọi đại lượng (hạng, $L$, Sha, regulator, ...) giống nhau.
  • Phân loại: Để chứng minh BSD cho “tất cả” đường cong, ta chỉ cần xét mỗi lớp đẳng cấu một đại diện. LMFDB (cơ sở dữ liệu) tổ chức theo lớp đẳng cấu.
  • Tự đẳng cấu: $|\mathrm{Aut}(E)|$ xuất hiện trong công thức BSD mạnh (ở mẫu, thay cho $2$ khi $j = 0$ hoặc $1728$). Cụ thể, chu kỳ thực $\Omega_E$ phải chia cho $|\mathrm{Aut}(E)|/2$ để chuẩn hóa.
28 Đồng cấu (isogeny) (Isogeny) Ch.2 5

Định nghĩa

Định nghĩa (Isogeny). Cho hai đường cong elliptic $E_1, E_2$ trên trường $K$. Một isogeny (isogeny) (đồng cấu) $\phi: E_1 \to E_2$ là ánh xạ hữu tỉ (cho bởi đa thức/phân thức) bảo toàn điểm gốc:
\[ \phi(\mathcal{O}_1) = \mathcal{O}_2. \]
Isogeny khác ánh xạ không (zero map) tự động là toàn ánh và là đồng cấu nhóm: $\phi(P + Q) = \phi(P) + \phi(Q)$.

Bậc của isogeny là bậc của $\phi$ như ánh xạ hữu tỉ: $\deg(\phi) = [K(E_1) : \phi^* K(E_2)]$ (bậc mở rộng trường hàm). Isogeny bậc $n$ có hạt nhân $\ker(\phi)$ là nhóm hữu hạn cỡ $n$ (khi khả ly).

Ánh xạ nhân $[n]: E \to E$ là isogeny bậc $n^2$ với $\ker([n]) = E[n]$ [silverman2009].

Ví dụ

Ví dụ (Isogeny bậc 2). Xét $E_1: y^2 = x^3 + x$ (có $j = 1728$) và điểm 2-xoắn $T = (0, 0) \in E_1[2]$.

Ánh xạ Vélu: Tồn tại isogeny $\phi: E_1 \to E_2$ bậc 2 với $\ker(\phi) = \{\mathcal{O}, T\}$, cho bởi công thức:

\[ \phi(x, y) = \left(\frac{x^2 + 1}{x},\; \frac{y(x^2 - 1)}{x^2}\right), \]
trong đó $E_2: y^2 = x^3 - 4x$ (đường cong đích).

Kiểm tra: $\phi(0, 0)$ không xác định (cực) --- đây là hạt nhân, nên $\phi(T) = \mathcal{O}_2$ ✓. Bậc: $\deg(\phi) = 2$ (tử bậc 2 chia mẫu bậc 1 trong thành phần $x$).

Ý nghĩa trực giác

Isogeny = “ánh xạ bao phủ” giữa đường cong. Nếu đẳng cấu là “hai đường cong giống hệt nhau”, thì isogeny là “một đường cong bao phủ đường cong kia”:
  • Mỗi điểm trên $E_2$ có đúng $\deg(\phi)$ “tiền ảnh” trên $E_1$ (tính cả bội).
  • Isogeny “nén” nhóm $E_1$ bằng cách “chia” cho hạt nhân: $E_2 \cong E_1/\ker(\phi)$.
  • Giống ánh xạ $\mathbb{Z} \twoheadrightarrow \mathbb{Z}/n\mathbb{Z}$: “cuộn” đường thẳng số thành vòng tròn.

Hai đường cong isogenous (có isogeny giữa chúng) chia sẻ nhiều tính chất số học --- cùng conductor, cùng hàm $L$ (up to nhân tử), cùng thỏa BSD (hoặc không).

Liên hệ với giả thuyết Birch--Dyer

Isogeny và BSD. Isogeny là bất biến “mềm” nhất bảo toàn BSD:
  • Bất biến isogeny: Nếu $\phi: E_1 \to E_2$ là isogeny thì $L(E_1, s) = L(E_2, s)$ --- hàm $L$ chỉ phụ thuộc vào lớp isogeny. Do đó, bậc triệt tiêu $\mathrm{ord}_{s=1} L(E, s)$ là bất biến isogeny.
  • Hạng bất biến: $\mathrm{rk}(E_1(\mathbb{Q})) = \mathrm{rk}(E_2(\mathbb{Q}))$ --- isogeny bảo toàn hạng (vì $\phi$ và $\hat{\phi}$ đối ngẫu cho ra cặp đồng cấu nhóm).
  • Lớp isogeny trong LMFDB: Mỗi lớp isogeny (ví dụ “37a”) chứa tất cả đường cong isogenous --- chúng chia sẻ cùng hàm $L$, conductor, hạng. BSD yếu đúng cho một $\Leftrightarrow$ đúng cho tất cả trong lớp.
  • BSD mạnh: Các hằng số trong BSD mạnh (Sha, regulator, Tamagawa) thay đổi qua isogeny, nhưng thay đổi theo cách “bù trừ” nhau --- gọi là isogeny invariance của công thức BSD [cassels1962].
29 Đồng cấu đối ngẫu (Dual isogeny) Ch.2 6

Định nghĩa

Định nghĩa (Isogeny đối ngẫu). Cho isogeny $\phi: E_1 \to E_2$ bậc $n$. Tồn tại duy nhất isogeny $\hat{\phi}: E_2 \to E_1$ (gọi là isogeny đối ngẫu (dual isogeny)) thỏa mãn:
\[ \hat{\phi} \circ \phi = [n]_{E_1}, \qquad \phi \circ \hat{\phi} = [n]_{E_2}, \]
trong đó $[n]$ là ánh xạ nhân $n$. Đặc biệt, $\deg(\hat{\phi}) = \deg(\phi) = n$ [silverman2009].

Các tính chất:

  1. $\widehat{\phi \circ \psi} = \hat{\psi} \circ \hat{\phi}$ (đảo thứ tự).
  2. $\hat{\hat{\phi}} = \phi$ (đối ngẫu của đối ngẫu là chính nó).
  3. $\widehat{[n]} = [n]$ (đối ngẫu của nhân $n$ là chính nó).
  4. $\widehat{\phi + \psi} = \hat{\phi} + \hat{\psi}$ (tuyến tính).

Ví dụ

Ví dụ (Đối ngẫu của isogeny bậc 2). Tiếp ví dụ trước: $\phi: E_1 \to E_2$ bậc 2, trong đó $E_1: y^2 = x^3 + x$ và $E_2: y^2 = x^3 - 4x$, với $\ker(\phi) = \{\mathcal{O}, (0,0)\}$.

Isogeny đối ngẫu $\hat{\phi}: E_2 \to E_1$ cũng có bậc 2, với $\ker(\hat{\phi}) = \{\mathcal{O}_2, (0,0)_2\}$ --- điểm 2-xoắn trên $E_2$.

Kiểm tra: $\hat{\phi} \circ \phi = [2]_{E_1}$. Với $P \in E_1$: $\hat{\phi}(\phi(P)) = 2P$. Đặc biệt, nếu $P \in E_1[2]$: $\hat{\phi}(\phi(P)) = \mathcal{O}$, tức $\phi(P) \in \ker(\hat{\phi})$ --- phù hợp vì $\phi$ gửi $E_1[2]$ vào $E_2[2]$.

Ý nghĩa trực giác

Đối ngẫu = “quay lại gần đúng”. Isogeny $\phi: E_1 \to E_2$ “nén” $E_1$ (mất thông tin ở $\ker(\phi)$). Đối ngẫu $\hat{\phi}$ “giải nén” --- nhưng không hoàn hảo, chỉ quay lại “lên đến nhân $n$”:
\[ \hat{\phi}(\phi(P)) = nP \quad \text{(không phải $P$!)}. \]

Phép tương tự: nghĩ $\phi$ như “rút gọn modulo $n$” ($\mathbb{Z} \to \mathbb{Z}/n\mathbb{Z}$) và $\hat{\phi}$ như “nhân lại $n$” ($\mathbb{Z}/n\mathbb{Z} \hookrightarrow \mathbb{Z}$). Thành phần “đi rồi về” cho $n$ lần bản gốc.

Đối ngẫu biến “quan hệ isogeny” thành quan hệ đối xứng: nếu $E_1$ isogenous với $E_2$ thì $E_2$ cũng isogenous ngược lại với $E_1$.

Liên hệ với giả thuyết Birch--Dyer

Đối ngẫu trong BSD. Đối ngẫu isogeny đảm bảo “tính nhất quán” của BSD trong lớp isogeny:
  • Bảo toàn hạng: Từ $\hat{\phi} \circ \phi = [n]$, suy ra $\phi$ đơn ánh trên phần tự do: nếu $\phi(P) = \mathcal{O}$ với $P$ bậc vô hạn, thì $nP = \hat{\phi}(\mathcal{O}) = \mathcal{O}$, vô lý. Vậy $\mathrm{rk}(E_1) \leq \mathrm{rk}(E_2)$; đối xứng cho $\leq$ ngược.
  • Cassels--Tate pairing: Ghép đôi $\mathrm{Sha}(E_1) \times \mathrm{Sha}(E_2) \to \mathbb{Q}/\mathbb{Z}$ được xây dựng qua $\phi$ và $\hat{\phi}$ --- “kiểm tra chéo” giữa Sha của hai đường cong isogenous.
  • Isogeny invariance BSD: Công thức BSD mạnh cho $E_1$ và $E_2$ tương thích qua $\phi, \hat{\phi}$: tích $|\mathrm{Sha}| \cdot R \cdot \prod c_p / |E_{\mathrm{tors}}|^2$ bất biến dưới isogeny --- chứng minh bởi Cassels [cassels1962].
30 Tự đồng cấu (Endomorphism) Ch.2 5

Định nghĩa

Định nghĩa (Tự đồng cấu). Một tự đồng cấu (endomorphism) của đường cong elliptic $E$ là isogeny từ $E$ về chính nó:
\[ \phi: E \to E, \quad \phi(\mathcal{O}) = \mathcal{O}. \]
Tập tất cả tự đồng cấu (kể cả ánh xạ không) cùng phép cộng và hợp thành tạo thành vành tự đồng cấu (endomorphism ring):
\[ \mathrm{End}(E) = \{\phi: E \to E \text{ là isogeny hoặc ánh xạ không}\}, \]
với phép cộng $(\phi + \psi)(P) = \phi(P) + \psi(P)$ và phép nhân $(\phi \circ \psi)(P) = \phi(\psi(P))$.

Mọi đường cong elliptic đều có $\mathbb{Z} \hookrightarrow \mathrm{End}(E)$ qua $n \mapsto [n]$ (ánh xạ nhân $n$). Có hai trường hợp chính [silverman2009]:

  1. Không CM: $\mathrm{End}(E) \cong \mathbb{Z}$ --- chỉ có nhân vô hướng. Đây là trường hợp “tổng quát”.
  2. CM (nhân phức): $\mathrm{End}(E) \cong \mathcal{O}_K$, order trong trường phức bậc hai ảo $K = \mathbb{Q}(\sqrt{-d})$. Đường cong có “đối xứng bổ sung” ngoài nhân vô hướng.

Ví dụ

Ví dụ (Tự đồng cấu cụ thể).
  1. Nhân vô hướng: Trên mọi $E$, $[n]: P \mapsto nP$ là tự đồng cấu bậc $n^2$. Ví dụ $[2]: E \to E$ có $\ker = E[2]$, 4 phần tử.
  2. Tự đồng cấu CM: $E: y^2 = x^3 - x$ có tự đồng cấu:
    \[ \iota: (x, y) \mapsto (-x, iy), \]
    trong đó $i = \sqrt{-1}$. Kiểm tra: $(-x)^3 - (-x) = -x^3 + x = -(x^3 - x)$ và $(iy)^2 = -y^2 = -(x^3 - x)$ ✓. Ánh xạ $\iota$ có $\iota^2 = [-1]$ (vì $\iota(\iota(x,y)) = \iota(-x, iy) = (x, i \cdot iy) = (x, -y) = -P$). Vậy $\mathrm{End}(E) \cong \mathbb{Z}[i]$ --- vành số nguyên Gauss, order trong $\mathbb{Q}(i) = \mathbb{Q}(\sqrt{-1})$.
  3. Frobenius: Trên $\mathbb{F}_p$, ánh xạ Frobenius $\pi_p: (x,y) \mapsto (x^p, y^p)$ là tự đồng cấu bậc $p$. Đa thức đặc trưng: $T^2 - a_p T + p = 0$ với $a_p = p + 1 - |E(\mathbb{F}_p)|$.

Ý nghĩa trực giác

Tự đồng cấu = “đối xứng nội tại”. Tự đồng cấu đo “mức đối xứng” của đường cong elliptic:
  • Không CM ($\mathrm{End}(E) \cong \mathbb{Z}$): Đường cong “tổng quát” --- đối xứng tối thiểu, chỉ có phép nhân vô hướng. Giống hình tròn chỉ có phép quay (nhưng không có phép lật).
  • CM ($\mathrm{End}(E) \cong \mathcal{O}_K$): Đường cong có “đối xứng bổ sung” --- giống hình vuông (có cả quay lẫn lật). Phép đối xứng bổ sung $\iota$ liên quan đến trường phức bậc hai ảo $K$.

Trên $\mathbb{C}$: $E \cong \mathbb{C}/\Lambda$. Tự đồng cấu = nhân $\alpha$ với $\alpha\Lambda \subseteq \Lambda$. Nếu $\Lambda = \mathbb{Z} + \mathbb{Z}\tau$:

  • Không CM: chỉ $\alpha \in \mathbb{Z}$ thỏa mãn $\alpha\Lambda \subseteq \Lambda$.
  • CM: nếu $\tau = \sqrt{-d}$, thì $\alpha = a + b\sqrt{-d}$ cũng thỏa mãn.

Liên hệ với giả thuyết Birch--Dyer

Tự đồng cấu trong BSD. Vành $\mathrm{End}(E)$ ảnh hưởng sâu sắc đến BSD:
  • CM và kết quả sớm nhất: Định lý Coates--Wiles (1977) --- kết quả đầu tiên hướng BSD --- chỉ áp dụng cho đường cong CM. Lý do: khi $E$ có CM bởi $K$, hàm $L(E, s)$ phân tích thành tích hai hàm $L$ Hecke trên $K$ --- dễ nghiên cứu hơn [coates-wiles1977].
  • Frobenius và hàm $L$: Hàm $L(E, s) = \prod_p L_p(E, p^{-s})^{-1}$, trong đó nhân tử Euler tại $p$ (rút gọn tốt) xác định bởi đa thức đặc trưng của Frobenius: $1 - a_p p^{-s} + p^{1-2s}$.
  • CM vs.non-CM: Đường cong CM có mật độ “đặc biệt”: chỉ có hữu hạn $j$-bất biến CM (13 giá trị trên $\mathbb{Q}$). Nhưng lại là “phòng thí nghiệm” lý tưởng: Rubin (1991) chứng minh BSD cho CM + hạng 0 đầy đủ (cả phần Sha) [rubin1991].
  • Module Tate: $\mathrm{End}(E) \otimes \mathbb{Z}_p \hookrightarrow \mathrm{End}_{\mathbb{Z}_p}(T_p(E)) \cong M_2(\mathbb{Z}_p)$. Khi CM: $\mathrm{End}(E) \otimes \mathbb{Q}_p$ chứa trường bậc 2 --- hàm $L$ “phân tích” tương ứng.
31 Vành tự đồng cấu (Endomorphism ring $\mathrm{End}(E)$) Ch.2 6

Định nghĩa

Định nghĩa (Vành tự đồng cấu). Cho đường cong elliptic $E$ trên trường $K$. Vành tự đồng cấu (endomorphism ring) của $E$ (trên $\overline{K}$) là:
\[ \mathrm{End}(E) = \mathrm{End}_{\overline{K}}(E) = \{\phi: E \to E \mid \phi \text{ là isogeny hoặc ánh xạ không}\}, \]
với hai phép toán:
  • Cộng: $(\phi + \psi)(P) = \phi(P) + \psi(P)$.
  • Nhân: $(\phi \circ \psi)(P) = \phi(\psi(P))$ (hợp thành).
$\mathrm{End}(E)$ là vành có đơn vị $\mathrm{id}_E$, nói chung không giao hoán.

Có ba khả năng cho $\mathrm{End}(E)$ trên $\overline{K}$ [silverman2009]:

  1. $\mathrm{End}(E) \cong \mathbb{Z}$ --- trường hợp “tổng quát” (không CM).
  2. $\mathrm{End}(E) \cong \mathcal{O}$ --- order trong trường phức bậc hai ảo $K = \mathbb{Q}(\sqrt{-d})$ (có CM).
  3. $\mathrm{End}(E)$ là order trong đại số quaternion --- chỉ xảy ra khi $\mathrm{char}(K) = p > 0$ (siêu kỳ dị).

Ví dụ

Ví dụ (Ba loại vành tự đồng cấu).
  1. Không CM: $E: y^2 = x^3 - x + 1$ trên $\mathbb{Q}$. Đường cong “tổng quát” --- $\mathrm{End}(E) \cong \mathbb{Z}$. Tự đồng cấu duy nhất là $[n]: P \mapsto nP$ cho $n \in \mathbb{Z}$.
  2. CM bởi $\mathbb{Z}[i]$: $E: y^2 = x^3 - x$. Tự đồng cấu $\iota: (x,y) \mapsto (-x, iy)$ thỏa $\iota^2 = [-1]$. Vậy $\mathrm{End}(E) \cong \mathbb{Z}[i] = \{a + bi : a, b \in \mathbb{Z}\}$ --- vành số nguyên Gauss, order cực đại trong $\mathbb{Q}(i)$.
  3. CM bởi $\mathbb{Z}[\omega]$: $E: y^2 = x^3 + 1$. Tự đồng cấu $\zeta: (x,y) \mapsto (\omega x, y)$ với $\omega = e^{2\pi i/3}$ thỏa $\zeta^3 = [\mathrm{id}]$. Vậy $\mathrm{End}(E) \cong \mathbb{Z}[\omega]$ --- vành số nguyên Eisenstein, order cực đại trong $\mathbb{Q}(\sqrt{-3})$.
  4. Siêu kỳ dị: $E: y^2 = x^3 + x$ trên $\mathbb{F}_3$. Ta có $|E(\mathbb{F}_3)| = 4 = 3 + 1$, nên $a_3 = 0$. $\mathrm{End}(E)$ là order trong đại số quaternion $B_{3,\infty}$.

Ý nghĩa trực giác

Vành $\mathrm{End}(E)$ đo “mức đối xứng”. Trên $\mathbb{C}$, $E \cong \mathbb{C}/\Lambda$ với lưới $\Lambda = \mathbb{Z} + \mathbb{Z}\tau$. Tự đồng cấu = nhân số phức $\alpha$ sao cho $\alpha \Lambda \subseteq \Lambda$.
  • Lưới tổng quát ($\tau$ “ngẫu nhiên”): Chỉ $\alpha \in \mathbb{Z}$ thỏa mãn. $\mathrm{End}(E) \cong \mathbb{Z}$.
  • Lưới đặc biệt ($\tau = i$ hoặc $\tau = e^{2\pi i/3}$): Lưới có đối xứng bổ sung (quay $90°$ hoặc $60°$) --- cho tự đồng cấu mới.

Phép tương tự: $\mathrm{End}(E) \cong \mathbb{Z}$ giống hình chữ nhật (chỉ có quay $180°$). $\mathrm{End}(E) \cong \mathbb{Z}[i]$ giống hình vuông (thêm quay $90°$). $\mathrm{End}(E) \cong \mathbb{Z}[\omega]$ giống lục giác đều (thêm quay $60°$).

Liên hệ với giả thuyết Birch--Dyer

Vành $\mathrm{End}(E)$ và BSD.
  • CM $\Rightarrow$ phân tích hàm $L$: Khi $\mathrm{End}(E) \cong \mathcal{O}_K$, hàm $L(E, s)$ phân tích thành tích hai hàm $L$ Hecke của $K$. Điều này cho phép chứng minh thác triển giải tích trực tiếp (không cần Định lý modularity) [deuring1953].
  • Kết quả BSD mạnh nhất: Rubin (1991) chứng minh BSD đầy đủ (cả phần Sha) cho $E$ có CM với $L(E,1) \neq 0$ [rubin1991].
  • 13 giá trị $j$ CM trên $\mathbb{Q}$: Chỉ có $j = 0, 1728, -3375, 8000, \ldots$ (13 giá trị). Mỗi giá trị ứng với order $\mathcal{O}_K$ có số lớp $h(\mathcal{O}_K) = 1$.
  • Không CM: “Hầu hết” đường cong. Kết quả BSD yếu hơn --- cần Định lý modularity + Kolyvagin.
32 Nhân phức (Complex multiplication (CM)) Ch.2 7

Định nghĩa

Định nghĩa (Nhân phức). Đường cong elliptic $E$ được gọi là có nhân phức (complex multiplication) (viết tắt CM) nếu vành tự đồng cấu lớn hơn $\mathbb{Z}$:
\[ \mathrm{End}(E) \supsetneq \mathbb{Z}. \]
Khi $\mathrm{char}(K) = 0$, điều này tương đương với $\mathrm{End}(E) \cong \mathcal{O}$, một order trong trường phức bậc hai ảo $K = \mathbb{Q}(\sqrt{-d})$ cho $d > 0$. Ta nói “$E$ có CM bởi $K$”.

Trên $\mathbb{C}$: $E \cong \mathbb{C}/\Lambda$, và $E$ có CM khi và chỉ khi $\Lambda$ tương đương lưới $\mathbb{Z} + \mathbb{Z}\tau$ với $\tau$ thuộc trường phức bậc hai ảo: $[\mathbb{Q}(\tau):\mathbb{Q}] = 2$ và $\tau \notin \mathbb{R}$ [silverman2009, cox2013].

Ví dụ

Ví dụ (Các đường cong CM kinh điển).
  1. CM bởi $\mathbb{Q}(i)$: $E: y^2 = x^3 - x$, $j = 1728$.
    • Lưới: $\Lambda = \mathbb{Z} + \mathbb{Z} i$ (lưới vuông).
    • Tự đồng cấu: $\iota(x,y) = (-x, iy)$, tương ứng nhân $i$ trên $\mathbb{C}/\Lambda$.
    • $\mathrm{End}(E) \cong \mathbb{Z}[i]$, discriminant $-4$.
  2. CM bởi $\mathbb{Q}(\sqrt{-3})$: $E: y^2 = x^3 + 1$, $j = 0$.
    • Lưới: $\Lambda = \mathbb{Z} + \mathbb{Z}\omega$ với $\omega = e^{2\pi i/3}$ (lưới lục giác).
    • $\mathrm{End}(E) \cong \mathbb{Z}[\omega]$, discriminant $-3$.
  3. CM bởi $\mathbb{Q}(\sqrt{-7})$: $E: y^2 = x^3 - 35x - 98$, $j = -3375$.
    • $\mathrm{End}(E) \cong \mathbb{Z}\left[\frac{1+\sqrt{-7}}{2}\right]$, discriminant $-7$.
    • Đường cong lịch sử: Coates--Wiles (1977) dùng nó để chứng minh kết quả đầu tiên hướng BSD [coates-wiles1977].

Ý nghĩa trực giác

CM = “lưới đặc biệt” trên torus phức. Mọi đường cong elliptic trên $\mathbb{C}$ là torus $\mathbb{C}/\Lambda$. “Hầu hết” lưới tổng quát --- chỉ nhân số nguyên bảo toàn lưới. Nhưng một số lưới “đặc biệt” có đối xứng bổ sung:
  • Lưới vuông $\mathbb{Z} + \mathbb{Z} i$: quay $90°$ ($\times i$) bảo toàn lưới $\Rightarrow$ CM bởi $\mathbb{Q}(i)$.
  • Lưới lục giác $\mathbb{Z} + \mathbb{Z}\omega$: quay $60°$ ($\times \omega$) bảo toàn lưới $\Rightarrow$ CM bởi $\mathbb{Q}(\sqrt{-3})$.

Tên “nhân phức” xuất phát từ: tự đồng cấu tương ứng nhân với số phức (không phải số nguyên) trên $\mathbb{C}/\Lambda$. Thuật ngữ có từ thế kỷ 19, khi Abel và Jacobi nghiên cứu tích phân elliptic có “phép nhân phức tạp”.

Liên hệ với giả thuyết Birch--Dyer

CM --- “phòng thí nghiệm” của BSD. CM là trường hợp “dễ nhất” của BSD, nơi kết quả mạnh nhất đã được chứng minh:
  • Coates--Wiles (1977): Nếu $E/\mathbb{Q}$ có CM và $L(E, 1) \neq 0$, thì $E(\mathbb{Q})$ hữu hạn. Đây là kết quả đầu tiên hướng BSD [coates-wiles1977].
  • Rubin (1991): Nếu $E/\mathbb{Q}$ có CM và $L(E, 1) \neq 0$, thì $\mathrm{Sha}(E/\mathbb{Q})$ hữu hạn và công thức BSD mạnh đúng cho phần $p$-adic (“hầu hết” $p$) [rubin1991].
  • Lý do CM dễ hơn: Hàm $L$ phân tích $L(E, s) = L(\psi, s) \cdot L(\bar{\psi}, s)$ với $\psi$ là Hecke character --- kỹ thuật giải tích mạnh áp dụng trực tiếp.
  • Lý thuyết trường lớp: $j(E)$ sinh trường lớp Hilbert $H_K$ khi $\mathcal{O} = \mathcal{O}_K$. Điểm Heegner xây dựng “tự nhiên” qua lý thuyết trường lớp [gross-zagier1986, heegner1952].
33 Tự đồng cấu Frobenius (Frobenius endomorphism) Ch.2 5

Định nghĩa

Định nghĩa (Tự đồng cấu Frobenius). Cho đường cong elliptic $E$ trên trường hữu hạn $\mathbb{F}_q$ ($q = p^n$). Tự đồng cấu Frobenius (Frobenius endomorphism) là ánh xạ:
\[ \pi_q: E \to E, \qquad (x, y) \mapsto (x^q, y^q), \qquad \pi_q(\mathcal{O}) = \mathcal{O}. \]
Frobenius là tự đồng cấu thuần túy không khả ly bậc $q$. Nó thỏa mãn đa thức đặc trưng:
\[ \pi_q^2 - a_q \pi_q + q = 0 \quad \text{trong } \mathrm{End}(E), \]
trong đó $a_q = q + 1 - |E(\mathbb{F}_q)|$ là vết Frobenius (trace of Frobenius) [silverman2009].

Điểm bất động của $\pi_q$ chính là $E(\mathbb{F}_q)$: $E(\mathbb{F}_q) = \ker(\pi_q - \mathrm{id})$.

Ví dụ

Ví dụ (Frobenius trên $\mathbb{F}_5$). Xét $E: y^2 = x^3 + x$ trên $\mathbb{F}_5$. Frobenius $\pi_5(x,y) = (x^5, y^5)$.

Đếm $|E(\mathbb{F}_5)|$: thử tất cả $x \in \mathbb{F}_5$:

$x$ $x^3 + x$ Phần dư bình phương? Điểm
$0$$0$Có ($0^2$)$(0, 0)$
$1$$2$Không---
$2$$10 \equiv 0$Có ($0^2$)$(2, 0)$
$3$$30 \equiv 0$Có ($0^2$)$(3, 0)$
$4$$68 \equiv 3$Không---

Cùng $\mathcal{O}$: $|E(\mathbb{F}_5)| = 4$. Vết: $a_5 = 5 + 1 - 4 = 2$.

Đa thức đặc trưng: $T^2 - 2T + 5 = 0$, nghiệm $\pi_5 = 1 \pm 2i$. Vì $|1 + 2i|^2 = 5 = q$ ✓.

Nhận xét: $E$ có CM bởi $\mathbb{Z}[i]$ (vì $j = 1728$), và $\pi_5 = 1 + 2i \in \mathbb{Z}[i]$.

Ý nghĩa trực giác

Frobenius = “phép quay” trên trường hữu hạn. Trên $\mathbb{F}_q$, ánh xạ $x \mapsto x^q$ là “phần tử sinh” của nhóm Galois $\mathrm{Gal}(\overline{\mathbb{F}}_q/\mathbb{F}_q) \cong \hat{\mathbb{Z}}$. Frobenius “xoay” các tọa độ --- điểm bất động là điểm có tọa độ trong $\mathbb{F}_q$.

Nếu $E(\overline{\mathbb{F}}_q)$ là “torus rời rạc vô hạn”, thì $\pi_q$ quay torus này --- những điểm “đứng yên” tạo thành $E(\mathbb{F}_q)$.

Đa thức đặc trưng $T^2 - a_q T + q$ mã hóa “tốc độ quay”. Cận Hasse $|a_q| \leq 2\sqrt{q}$ (Giả thuyết Riemann cho $E/\mathbb{F}_q$) nói rằng phép quay “không quá nhanh cũng không quá chậm” --- $|E(\mathbb{F}_q)|$ gần $q + 1$ [hasse1933, deligne1974].

Liên hệ với giả thuyết Birch--Dyer

Frobenius --- viên gạch xây hàm $L$. Frobenius là thành phần cơ bản nhất xây dựng hàm $L$:
  • Nhân tử Euler: Tại mỗi $p$ rút gọn tốt:
    \[ L_p(E, s) = \frac{1}{1 - a_p p^{-s} + p^{1-2s}} = \frac{1}{\det(1 - \pi_p \cdot p^{-s} \mid T_\ell(E))}, \]
    trực tiếp từ đa thức đặc trưng Frobenius.
  • Hàm $L$ toàn cục: $L(E, s) = \prod_p L_p(E, s)$ --- tích vô hạn trên mọi $p$. BSD nói $\mathrm{ord}_{s=1} L(E,s) = \mathrm{rk}(E(\mathbb{Q}))$ --- thông tin “cục bộ” quyết định tính chất “toàn cục”.
  • Birch--Swinnerton-Dyer gốc: Dữ liệu EDSAC (1963) trực tiếp tính $a_p$ cho hàng nghìn $p$ --- tức đếm $|E(\mathbb{F}_p)|$, hay tính vết Frobenius [birch-sd1963, birch1968].
34 Vết Frobenius (Trace of Frobenius $a_p$) Ch.2 4

Định nghĩa

Định nghĩa (Vết Frobenius $a_p$). Cho đường cong elliptic $E/\mathbb{Q}$ và số nguyên tố $p$ có rút gọn tốt. Vết Frobenius (trace of Frobenius) tại $p$ là:
\[ a_p = a_p(E) = p + 1 - |E(\mathbb{F}_p)|. \]
Tương đương, $a_p$ là vết của Frobenius $\pi_p$ trên module Tate:
\[ a_p = \mathrm{tr}(\pi_p \mid T_\ell(E)) \quad \text{cho mọi } \ell \neq p. \]

Cận Hasse (1933): $|a_p| \leq 2\sqrt{p}$, tương đương [hasse1933]:

\[ (\sqrt{p} - 1)^2 \leq |E(\mathbb{F}_p)| \leq (\sqrt{p} + 1)^2. \]

Ví dụ

Ví dụ (Tính $a_p$ cho đường cong 37a1). Đường cong $E: y^2 + y = x^3 - x$ (conductor 37, label LMFDB: 37.a1) [lmfdb]:
$p$ $|E(\mathbb{F}_p)|$ $a_p = p + 1 - |E(\mathbb{F}_p)|$ $2\sqrt{p}$
$2$$5$$-2$$2.83$
$3$$5$$-1$$3.46$
$5$$5$$1$$4.47$
$7$$4$$4$$5.29$
$11$$11$$1$$6.63$
$13$$9$$5$$7.21$

Dãy $\{a_p\}$ xác định hoàn toàn hàm $L(E, s)$. Đường cong này có hạng $r = 1$ (điểm sinh $(0, 0)$).

Ý nghĩa trực giác

Vết Frobenius đo “sai lệch” so với kỳ vọng. Nếu điểm trên $E(\mathbb{F}_p)$ phân bố “ngẫu nhiên”, ta kỳ vọng $\approx p + 1$ điểm. Vết $a_p$ đo sai lệch:
  • $a_p > 0$: ít điểm hơn kỳ vọng (“thưa”).
  • $a_p < 0$: nhiều điểm hơn kỳ vọng (“dày”).
  • $a_p = 0$: “đúng kỳ vọng” --- đường cong siêu kỳ dị tại $p$.

Phỏng đoán Sato--Tate (đã chứng minh, 2008): Dãy chuẩn hóa $a_p / (2\sqrt{p})$ phân bố theo luật bán tròn $\frac{2}{\pi}\sqrt{1 - t^2}\, dt$ khi $E$ không CM [taylor2008].

Liên hệ với giả thuyết Birch--Dyer

$a_p$ --- “DNA số học” của đường cong elliptic.
  • Hàm $L$: $L(E, s) = \prod_{p \nmid N} (1 - a_p p^{-s} + p^{1-2s})^{-1} \cdot \prod_{p \mid N} L_p(E, s)$.
  • Tích BSD gốc: Birch--Swinnerton-Dyer (1963) nghiên cứu $\Pi_E(X) = \prod_{p \leq X} \frac{p + 1 - a_p}{p}$ và phát hiện $\Pi_E(X) \sim C \cdot (\log X)^r$ [birch-sd1963].
  • Modularity: $\{a_p\}$ cũng là hệ số Fourier của newform $f_E(\tau) = \sum a_n q^n$ bậc 2 level $N$ [wiles1995, bcdt2001]. Đây là cầu nối giải tích $\leftrightarrow$ số học.
35 Rút gọn modulo $p$ (Reduction modulo $p$) Ch.2 4

Định nghĩa

Định nghĩa (Rút gọn đường cong elliptic modulo $p$). Cho $E/\mathbb{Q}$ với phương trình Weierstrass hệ số nguyên: $y^2 = x^3 + ax + b$ ($a, b \in \mathbb{Z}$). Rút gọn modulo $p$ (reduction modulo $p$) là đường cong $\widetilde{E}/\mathbb{F}_p$:
\[ \widetilde{E}: y^2 = x^3 + \bar{a}x + \bar{b} \quad \text{trên } \mathbb{F}_p, \]
trong đó $\bar{a} = a \bmod p$, $\bar{b} = b \bmod p$.

Loại rút gọn phụ thuộc biệt thức $\widetilde{\Delta} = \Delta \bmod p$ [silverman2009]:

  1. Rút gọn tốt (good reduction): $p \nmid \Delta$ $\Rightarrow$ $\widetilde{E}$ trơn.
  2. Rút gọn xấu (bad reduction): $p \mid \Delta$ $\Rightarrow$ $\widetilde{E}$ kỳ dị. Chỉ xảy ra tại hữu hạn $p$.

Ví dụ

Ví dụ (Rút gọn $E: y^2 = x^3 - x$ modulo các $p$). Biệt thức: $\Delta = -16(4(-1)^3 + 27 \cdot 0) = 64$. Vậy $p \mid \Delta \Leftrightarrow p = 2$.
  1. $p = 3$: $\widetilde{\Delta} = 64 \equiv 1 \pmod{3} \neq 0$. Rút gọn tốt. $|E(\mathbb{F}_3)| = 4$, $a_3 = 0$ (siêu kỳ dị).
  2. $p = 5$: $\widetilde{\Delta} = 64 \equiv 4 \pmod{5} \neq 0$. Rút gọn tốt. $|E(\mathbb{F}_5)| = 4$, $a_5 = 2$.
  3. $p = 2$: $\widetilde{\Delta} = 0$. Rút gọn xấu. Trên $\mathbb{F}_2$: $x^3 + x = x(x^2+1) = x(x+1)^2$ --- nghiệm $x=1$ bội 2. Đường cong có nút tại $(1, 0)$.

Ý nghĩa trực giác

Rút gọn = “chiếu” xuống thế giới modulo $p$. Đường cong $E/\mathbb{Q}$ là đối tượng “toàn cục”. Rút gọn modulo $p$ giống “chiếu” xuống $\mathbb{F}_p$ --- mỗi $p$ cho một “bức ảnh” khác:
  • Rút gọn tốt: Bức ảnh “sắc nét” --- $\widetilde{E}$ giữ nguyên cấu trúc.
  • Rút gọn xấu: Bức ảnh “bị nhiễu” --- $\widetilde{E}$ có điểm kỳ dị.

Triết lý local-global: ghép tất cả bức ảnh $\widetilde{E}/\mathbb{F}_p$ (cho mọi $p$), ta phục hồi thông tin toàn cục về $E/\mathbb{Q}$. Hàm $L$ chính là cách “ghép” này.

Liên hệ với giả thuyết Birch--Dyer

Rút gọn modulo $p$ --- nền tảng cục bộ của BSD. Toàn bộ vế trái của BSD (hàm $L$) được xây dựng từ rút gọn modulo $p$:
  • Tại $p$ rút gọn tốt: $L_p(E, s) = (1 - a_p p^{-s} + p^{1-2s})^{-1}$ --- nhân tử Euler bậc 2.
  • Tại $p$ rút gọn xấu: $L_p$ đơn giản hơn (bậc 0 hoặc 1), phụ thuộc loại kỳ dị.
  • Conductor: $N_E = \prod_{p \text{ xấu}} p^{f_p}$ --- tích trên các $p$ rút gọn xấu. Xuất hiện trong phương trình hàm và level dạng modular [tate1975].
  • Triết lý BSD: Thông tin cục bộ ($a_p$ tại mỗi $p$) $\Rightarrow$ hàm $L$ $\Rightarrow$ bậc triệt tiêu $\Rightarrow$ hạng toàn cục $E(\mathbb{Q})$.
36 Rút gọn tốt (Good reduction) Ch.2 4

Định nghĩa

Định nghĩa (Rút gọn tốt và phân loại). Đường cong $E/\mathbb{Q}$ có rút gọn tốt (good reduction) tại $p$ nếu rút gọn $\widetilde{E}/\mathbb{F}_p$ là đường cong elliptic (trơn). Tương đương: $p \nmid \Delta_{\min}$ (biệt thức mô hình tối thiểu).

Rút gọn tốt chia thành hai loại [silverman2009]:

  • Thường (ordinary): $p \nmid a_p$ (tức $a_p \not\equiv 0 \pmod{p}$). Phần lớn $p$ thuộc loại này.
  • Siêu kỳ dị (supersingular): $p \mid a_p$. Xảy ra cho tập $p$ mật độ $0$ khi $E$ không CM. Khi $E$ có CM bởi $K = \mathbb{Q}(\sqrt{-d})$: $p$ siêu kỳ dị $\Leftrightarrow$ $p$ trơ (inert) hoặc phân nhánh (ramified) trong $K$.

Tại $p$ rút gọn tốt, nhóm $E(\mathbb{F}_p)$ là nhóm elliptic đầy đủ. Nhân tử Euler:

\[ L_p(E, s) = (1 - a_p p^{-s} + p^{1-2s})^{-1}. \]

Ví dụ

Ví dụ (Ordinary vs.supersingular). Xét $E: y^2 = x^3 - x$ (CM bởi $\mathbb{Q}(i)$, conductor $N = 32$):
$p$ $|E(\mathbb{F}_p)|$ $a_p$ $p \mid a_p$? Loại
$3$$4$$0$Siêu kỳ dị
$5$$4$$2$KhôngOrdinary
$7$$8$$0$Siêu kỳ dị
$11$$12$$0$Siêu kỳ dị
$13$$8$$6$KhôngOrdinary
$17$$16$$2$KhôngOrdinary

Nhận xét: $p = 3, 7, 11$ siêu kỳ dị --- đây là các $p \equiv 3 \pmod{4}$ (trơ trong $\mathbb{Q}(i)$). Các $p \equiv 1 \pmod{4}$ (tách trong $\mathbb{Q}(i)$) luôn ordinary.

Ý nghĩa trực giác

Ordinary vs.supersingular --- “bình thường” vs.“đặc biệt”.
  • Ordinary: Đường cong “bình thường” tại $p$ --- module Tate $p$-adic $T_p(E)$ có “phần thường” (unit root). Frobenius $\pi_p$ tác động “bán đơn giản” --- dễ phân tích.
  • Supersingular: Đường cong “đặc biệt” tại $p$ --- $E[p] = \{0\}$ trên $\overline{\mathbb{F}}_p$ (không có điểm $p$-xoắn!). Frobenius “phức tạp hơn” --- lý thuyết Iwasawa khác biệt.

Phép tương tự: ordinary giống số nguyên có ước nguyên tố $p$ “đơn giản” ($p$ tách); supersingular giống $p$ “đặc biệt” ($p$ trơ hoặc phân nhánh).

Liên hệ với giả thuyết Birch--Dyer

Rút gọn tốt trong BSD.
  • Hầu hết $p$ rút gọn tốt: Chỉ hữu hạn $p$ rút gọn xấu (chính xác: $p \mid N_E$). “Hầu hết” nhân tử Euler đến từ rút gọn tốt.
  • Ordinary vs.supersingular trong Iwasawa: Phỏng đoán chính Iwasawa (Mazur, 1972) ban đầu chỉ phát biểu cho $p$ ordinary. Trường hợp supersingular phức tạp hơn --- cần lý thuyết “plus/minus Selmer groups” (Kobayashi, Sprung) [mazur-swinnerton-dyer1974].
  • BSD $p$-adic: Với $p$ ordinary, BSD $p$-adic dạng Mazur--Tate--Teitelbaum “đơn giản”. Với $p$ supersingular, cần hiệu chỉnh logarit $p$-adic [mazur-tate-teitelbaum1986].
  • Đếm điểm: Thuật toán Schoof--Elkies--Atkin tính $a_p$ trong $O((\log p)^5)$ --- cho phép tính hàm $L$ hiệu quả, kiểm nghiệm BSD bằng máy tính [schoof1985].
37 Rút gọn xấu (Bad reduction) Ch.2 4

Định nghĩa

Định nghĩa (Rút gọn xấu). Đường cong $E/\mathbb{Q}$ có rút gọn xấu (bad reduction) tại $p$ nếu rút gọn $\widetilde{E}/\mathbb{F}_p$ là đường cong kỳ dị ($p \mid \Delta_{\min}$). Có ba loại, phân biệt bởi dạng điểm kỳ dị [silverman2009, tate1975]:
  1. Rút gọn nhân tách (split multiplicative): Nút với hai tiếp tuyến xác định trên $\mathbb{F}_p$. Nhóm phần trơn $\widetilde{E}^{\mathrm{ns}}(\mathbb{F}_p) \cong \mathbb{F}_p^{\times}$. Ký hiệu: $a_p = 1$.
  2. Rút gọn nhân không tách (non-split multiplicative): Nút với tiếp tuyến xác định trên $\mathbb{F}_{p^2} \setminus \mathbb{F}_p$. Nhóm phần trơn $\widetilde{E}^{\mathrm{ns}}(\mathbb{F}_p) \cong \ker(N: \mathbb{F}_{p^2}^{\times} \to \mathbb{F}_p^{\times})$. Ký hiệu: $a_p = -1$.
  3. Rút gọn cộng (additive reduction): Cusp. Nhóm phần trơn $\widetilde{E}^{\mathrm{ns}}(\mathbb{F}_p) \cong \mathbb{F}_p^{+}$. Ký hiệu: $a_p = 0$.

Tập các $p$ rút gọn xấu luôn hữu hạn: $\{p : p \mid \Delta_{\min}\}$.

Ví dụ

Ví dụ (Ba loại rút gọn xấu).
  1. Nhân tách: $E: y^2 + y = x^3 - x$ (conductor 37). Tại $p = 37$: nút, tiếp tuyến tách trên $\mathbb{F}_{37}$. $a_{37} = 1$. Nhóm phần trơn $\cong \mathbb{F}_{37}^{\times} \cong \mathbb{Z}/36\mathbb{Z}$.
  2. Nhân không tách: $E: y^2 = x^3 + x^2 - 2x$ tại $p = 2$. Trên $\mathbb{F}_2$: $y^2 = x^2(x+1)$ --- nút tại $(0,0)$, nhưng tiếp tuyến $y = \pm x\sqrt{x+1}$ không tách trên $\mathbb{F}_2$. $a_2 = -1$.
  3. Cộng: $E: y^2 = x^3 - x$ tại $p = 2$. Trên $\mathbb{F}_2$: $y^2 = x^3 + x = x(x+1)^2$ --- cusp tại $(1,0)$. $a_2 = 0$. Nhóm phần trơn $\cong \mathbb{F}_2^{+} \cong \mathbb{Z}/2\mathbb{Z}$.

Ý nghĩa trực giác

Ba cách “hỏng” --- và hệ quả. Khi rút gọn modulo $p$, đường cong có thể “hỏng” theo ba cách, mỗi cách cho nhóm phần trơn khác nhau:
  • Nhân (tách/không tách): Đường cong tự cắt $\Rightarrow$ nhóm nhân $\mathbb{F}_p^{\times}$ hoặc biến thể. Cấu trúc “giàu” nhất trong ba loại xấu.
  • Cộng: Đường cong có cusp $\Rightarrow$ nhóm cộng $\mathbb{F}_p^{+}$. Cấu trúc “nghèo” nhất --- thông tin bị mất nhiều nhất.

Phân biệt nhanh: nhìn $a_p$ tại $p$ xấu --- $+1$ (nhân tách), $-1$ (nhân không tách), $0$ (cộng). Ba con số này xuất hiện trực tiếp trong nhân tử Euler.

Liên hệ với giả thuyết Birch--Dyer

Rút gọn xấu trong BSD. Các $p$ rút gọn xấu đóng vai trò đặc biệt trong mọi khía cạnh BSD:
  • Nhân tử Euler tại $p$ xấu:
  • Nhân tách: $L_p(E, s) = (1 - p^{-s})^{-1}$. Tại $s = 1$: $L_p(E, 1) = p/(p-1)$.
  • Nhân không tách: $L_p(E, s) = (1 + p^{-s})^{-1}$. Tại $s = 1$: $L_p(E, 1) = p/(p+1)$.
  • Cộng: $L_p(E, s) = 1$. “Vô hình” --- không đóng góp.

Số Tamagawa $c_p$: Chỉ $c_p \neq 1$ khi $p$ rút gọn xấu. $c_p = [E(\mathbb{Q}_p) : E^0(\mathbb{Q}_p)]$ --- số thành phần nhóm đặc biệt. Xuất hiện trong tử số BSD mạnh: $\prod_p c_p$ [tate1975].

Nghiệm ngoại lai: Khi $p$ nhân tách, BSD $p$-adic có “exceptional zero” --- nhân tử Euler triệt tiêu tại $s = 1$, cần hiệu chỉnh $\mathcal{L}$-invariant [mazur-tate-teitelbaum1986].

38 Rút gọn nhân tách (Split multiplicative reduction) Ch.2 5

Định nghĩa

Định nghĩa (Rút gọn nhân tách). Đường cong $E/\mathbb{Q}$ có rút gọn nhân tách (split multiplicative reduction) tại $p$ nếu rút gọn $\widetilde{E}/\mathbb{F}_p$ có nút với hai tiếp tuyến phân biệt xác định trên $\mathbb{F}_p$.

Tương đương: đường cong có mô hình Tate tại $p$ --- tồn tại $q_E \in p\mathbb{Z}_p$ ($|q_E|_p < 1$) sao cho [silverman1994]:

\[ E(\mathbb{Q}_p) \cong \mathbb{Q}_p^{\times} / q_E^{\mathbb{Z}} \]
(“tham số hóa Tate” hay “đường cong Tate”). Giá trị $q_E$ gọi là tham số Tate (Tate parameter).

Nhân tử Euler: $L_p(E, s) = (1 - p^{-s})^{-1}$, ký hiệu $a_p = 1$.

Ví dụ

Ví dụ (Đường cong 11a1 --- conductor nhỏ nhất). $E: y^2 + y = x^3 - x^2 - 10x - 20$ (conductor $N = 11$).

Tại $p = 11$: rút gọn nhân tách. Tham số Tate $q_{11} = 11^{-5} \cdot (1 + O(11))$ (chuỗi $q$-expansion).

Phỏng đoán Mazur--Tate--Teitelbaum: $L_{11\text{-adic}}(E, 1) = \mathcal{L}_{11} \cdot \frac{L^{\mathrm{alg}}(E, 1)}{\Omega_E}$, trong đó $\mathcal{L}_{11} = \frac{\log_{11}(q_{11})}{\mathrm{ord}_{11}(q_{11})}$ là $\mathcal{L}$-invariant --- hệ số hiệu chỉnh cho exceptional zero.

Ý nghĩa trực giác

Tham số hóa Tate --- “vòng xuyến hở”. Trên $\mathbb{C}$: $E \cong \mathbb{C}^{\times}/q^{\mathbb{Z}}$ (uniformization). Tương tự, trên $\mathbb{Q}_p$ khi nhân tách: $E(\mathbb{Q}_p) \cong \mathbb{Q}_p^{\times}/q_E^{\mathbb{Z}}$.

Hình ảnh: torus phức $\mathbb{C}/\Lambda$ “mở ra” thành $\mathbb{C}^{\times}/q^{\mathbb{Z}}$. Tương tự, torus $p$-adic “mở ra” thành “vòng xuyến $p$-adic”. Nhóm nhân $\mathbb{Q}_p^{\times}$ “quấn quanh” bởi lũy thừa $q_E$ --- mỗi vòng quấn cho một “lớp” tương đương.

Liên hệ với giả thuyết Birch--Dyer

Nhân tách và exceptional zero. Rút gọn nhân tách tạo ra hiện tượng “nghiệm ngoại lai” trong BSD $p$-adic:
  • Vấn đề: Nhân tử Euler $L_p = (1 - p^{-s})^{-1}$ có $(1 - p^{-1}) \neq 0$ tại $s = 1$, nhưng phiên bản $p$-adic: $(1 - \alpha_p^{-1})$ với $\alpha_p$ là nghiệm đơn vị --- triệt tiêu!
  • Phỏng đoán MTT (1986): $L_p(E, 1) = 0$ (zero “ngoại lai”, không liên quan hạng), và đạo hàm $L_p'(E, 1) = \mathcal{L}_p \cdot L^{\mathrm{alg}}(E, 1)$ [mazur-tate-teitelbaum1986].
  • Đã chứng minh: Greenberg--Stevens (1993) chứng minh MTT cho $E$ hạng 0.
  • Dấu gốc: Tại $p$ nhân tách, dấu gốc cục bộ $w_p = -1$ --- ảnh hưởng parity conjecture.
39 Rút gọn nhân không tách (Non-split multiplicative reduction) Ch.2 5

Định nghĩa

Định nghĩa (Rút gọn nhân không tách). Đường cong $E/\mathbb{Q}$ có rút gọn nhân không tách (non-split multiplicative reduction) tại $p$ nếu rút gọn $\widetilde{E}/\mathbb{F}_p$ có nút nhưng hai tiếp tuyến tại nút chỉ xác định trên $\mathbb{F}_{p^2}$ (không tách trên $\mathbb{F}_p$).

Nhóm phần trơn: $\widetilde{E}^{\mathrm{ns}}(\mathbb{F}_p) \cong \ker\bigl(N: \mathbb{F}_{p^2}^{\times} \to \mathbb{F}_p^{\times}\bigr)$ --- nhóm “norm 1” trong $\mathbb{F}_{p^2}^{\times}$.

Nhân tử Euler: $L_p(E, s) = (1 + p^{-s})^{-1}$, ký hiệu $a_p = -1$ [silverman2009].

Liên hệ với nhân tách: twist bậc hai $E^{(d)}$ của $E$ (với $d$ thích hợp) biến nhân tách thành nhân không tách và ngược lại.

Ví dụ

Ví dụ (So sánh nhân tách và không tách). Xét $E: y^2 = x^3 + x^2 - 2x$ (conductor $N = 48 = 2^4 \cdot 3$).
  • Tại $p = 3$: rút gọn nhân không tách. $a_3 = -1$. Nhân tử: $L_3(E, s) = (1 + 3^{-s})^{-1}$.
  • Twist $E^{(-1)}: y^2 = x^3 - x^2 - 2x$: tại $p = 3$ trở thành nhân tách. $a_3 = 1$.
Nhận xét: twist đổi dấu $a_p$ tại $p$ nhân --- nhân tách $\leftrightarrow$ nhân không tách.

Ý nghĩa trực giác

“Tách” vs.“không tách” --- nhìn qua tiếp tuyến. Tại nút, đường cong có hai nhánh giao nhau. Mỗi nhánh có tiếp tuyến riêng:
  • Tách: Hai tiếp tuyến “nhìn thấy” trong $\mathbb{F}_p$ --- giống hai đường thẳng cắt nhau trên mặt phẳng.
  • Không tách: Tiếp tuyến “ẩn” --- cần mở rộng sang $\mathbb{F}_{p^2}$ mới thấy. Giống hai đường thẳng “liên hợp” --- chỉ nhìn thấy khi “đeo kính $\mathbb{F}_{p^2}$”.

Phép tương tự: phương trình $x^2 + 1 = 0$ “không tách” trên $\mathbb{R}$ (không có nghiệm thực) nhưng “tách” trên $\mathbb{C}$ (nghiệm $\pm i$).

Liên hệ với giả thuyết Birch--Dyer

Nhân không tách trong BSD.
  • Nhân tử Euler: $L_p(E, 1) = (1 + 1/p)^{-1} = p/(p+1)$. Khác nhân tách: không có exceptional zero $p$-adic.
  • Dấu gốc: $w_p = +1$ (khác nhân tách: $w_p = -1$). Ảnh hưởng dấu phương trình hàm: $w(E) = (-1)^{r_{\mathrm{an}}} = \prod_v w_v$.
  • Số Tamagawa: Tại $p$ nhân (tách hoặc không): $c_p = \mathrm{ord}_p(\Delta_{\min})$ nếu $p$ nhân tách, $c_p = 1$ hoặc $2$ nếu không tách (phụ thuộc $\mathrm{ord}_p(\Delta_{\min})$ chẵn/lẻ).
  • Twist và BSD: BSD cho $E$ và twist $E^{(d)}$ liên hệ qua đổi chỗ nhân tách/không tách --- cho phép “chuyển” kết quả BSD giữa hai đường cong.
40 Rút gọn cộng (Additive reduction) Ch.2 5

Định nghĩa

Định nghĩa (Rút gọn cộng). Đường cong $E/\mathbb{Q}$ có rút gọn cộng (additive reduction) tại $p$ nếu rút gọn $\widetilde{E}/\mathbb{F}_p$ có cusp (mũi nhọn).

Nhóm phần trơn: $\widetilde{E}^{\mathrm{ns}}(\mathbb{F}_p) \cong \mathbb{F}_p^{+}$ (nhóm cộng trường hữu hạn).

Nhân tử Euler: $L_p(E, s) = 1$ --- “vô hình” (bậc 0). Ký hiệu: $a_p = 0$.

Conductor tại $p$ cộng: $f_p \geq 2$ (thay vì $f_p = 1$ cho nhân). Với $p \geq 5$: $f_p = 2$. Với $p = 2, 3$: $f_p$ có thể lên đến $2 + 3\delta$ (“wild part”) [silverman2009, tate1975].

Ví dụ

Ví dụ (Rút gọn cộng).
  1. $E: y^2 = x^3 + p^2$ tại $p$: trên $\mathbb{F}_p$: $y^2 = x^3$ --- cusp tại $(0,0)$. Rút gọn cộng. $f_p = 2$ (tame).
  2. $E: y^2 = x^3 - x$ (conductor $N = 32 = 2^5$) tại $p = 2$: $f_2 = 5$ (wild!). Lý do: $p = 2$ nhỏ, có “wild ramification” --- conductor lớn hơn nhiều so với tame case.
  3. Mọi đường cong có rút gọn cộng tại $p$ có thể “sửa” thành rút gọn tốt hoặc nhân bằng cách mở rộng trường cơ sở. Cụ thể: tồn tại mở rộng hữu hạn $K/\mathbb{Q}_p$ sao cho $E/K$ có rút gọn tốt hoặc nhân (định lý “semistable reduction” --- bất kỳ EC nào cũng trở thành semistable sau mở rộng hữu hạn).

Ý nghĩa trực giác

Cộng = “mất nhiều thông tin nhất”. Ba loại rút gọn xấu xếp theo “mức hỏng”:
  • Nhân (tách/không tách): Nhóm phần trơn $\cong \mathbb{F}_p^{\times}$ --- cấu trúc “tương tự” elliptic (nhóm nhân, bậc $p - 1$). Mất ít thông tin.
  • Cộng: Nhóm phần trơn $\cong \mathbb{F}_p^{+}$ --- cấu trúc “phẳng” (nhóm cộng, bậc $p$). Mất nhiều thông tin --- $L_p = 1$ nghĩa là “không đóng góp” vào hàm $L$.

Phép tương tự: nhân giống “tấm gương mờ” (vẫn phản chiếu, dù méo). Cộng giống “tấm gương vỡ” (không phản chiếu gì).

Liên hệ với giả thuyết Birch--Dyer

Rút gọn cộng trong BSD.
  • Conductor: $p$ cộng đóng góp $p^{f_p}$ với $f_p \geq 2$ --- “nặng” hơn nhân ($f_p = 1$). Điều này ảnh hưởng phương trình hàm: $N^{s/2} (2\pi)^{-s} \Gamma(s) L(E, s)$ đối xứng qua $s \leftrightarrow 2-s$.
  • Semistable: Đường cong semistable ($=$ không có rút gọn cộng tại mọi $p$) là trường hợp Wiles chứng minh modularity đầu tiên (1995) [wiles1995]. BCDT (2001) mở rộng cho mọi đường cong [bcdt2001].
  • Số Tamagawa: Tại $p$ cộng, $c_p$ phức tạp hơn --- phụ thuộc loại fiber Kodaira (thuật toán Tate phân loại). $c_p$ có thể lên đến $4$ (type $I_0^*$) hoặc lớn hơn.
  • BSD mạnh tại $p$ cộng: Thành phần $c_p$ và phần “wild” của conductor gây khó khăn kỹ thuật. Kết quả BSD mạnh thường giả thiết $E$ semistable hoặc loại trừ $p = 2, 3$.
41 Mô hình tối thiểu (Minimal model) Ch.2 5

Định nghĩa

Định nghĩa (Mô hình tối thiểu tại $p$). Cho $E/\mathbb{Q}_p$ (đường cong elliptic trên trường $p$-adic). Mô hình tối thiểu (minimal model) tại $p$ là phương trình Weierstrass:
\[ y^2 + a_1 xy + a_3 y = x^3 + a_2 x^2 + a_4 x + a_6, \quad a_i \in \mathbb{Z}_p, \]
sao cho $\mathrm{ord}_p(\Delta)$ nhỏ nhất có thể (trong lớp đẳng cấu trên $\mathbb{Q}_p$).

Mô hình tối thiểu luôn tồn tại và duy nhất (lên đến đẳng cấu trên $\mathbb{Z}_p$) cho mỗi $p$ [silverman2009].

Biệt thức tối thiểu $\Delta_{\min, p}$: $\mathrm{ord}_p(\Delta_{\min, p}) < 12$ (vì phép đổi biến $u$ nhân $\Delta$ với $u^{12}$).

Phân loại: Nếu $\mathrm{ord}_p(\Delta_{\min}) = 0$: rút gọn tốt. Nếu $> 0$: rút gọn xấu.

Ví dụ

Ví dụ (Tìm mô hình tối thiểu).
  1. $E: y^2 = x^3 + 16$. Biệt thức $\Delta = -27 \cdot 16^2 \cdot 4 = -27648 = -2^{10} \cdot 27$. Tại $p = 2$: $\mathrm{ord}_2(\Delta) = 10$. Phép đổi biến $x = 4X$, $y = 8Y$: $Y^2 = X^3 + 1$. Biệt thức mới $\Delta' = -27$. $\mathrm{ord}_2(\Delta') = 0$ --- mô hình tối thiểu tại $2$.
  2. $E: y^2 = x^3 - 432$ (đường cong với $j = 0$). $\Delta = -2^{12} \cdot 3^9$. Tại $p = 2$: $\mathrm{ord}_2 = 12$. Đổi biến $u = 2$: $\Delta' = \Delta/u^{12} = -3^9$. $\mathrm{ord}_2(\Delta') = 0$. Mô hình tối thiểu: $y^2 = x^3 - 27$.
  3. Thuật toán Tate xác định loại fiber tối thiểu --- phân loại Kodaira--Néron (types $I_n$, $II$, $III$, $IV$, $I_n^*$, $II^*$, $III^*$, $IV^*$) [tate1975].

Ý nghĩa trực giác

Mô hình tối thiểu = “biểu diễn đơn giản nhất”. Một đường cong elliptic có vô hạn phương trình Weierstrass (qua phép đổi biến). Mô hình tối thiểu chọn phương trình “đơn giản nhất” tại mỗi $p$:
  • Biệt thức nhỏ nhất $\Rightarrow$ phương trình “ít phức tạp nhất”.
  • Giống “rút gọn phân số”: $6/4$ và $3/2$ biểu diễn cùng số, nhưng $3/2$ “tối thiểu”.

Mô hình tối thiểu quan trọng vì: rút gọn modulo $p$ chỉ “có nghĩa” khi dùng mô hình tối thiểu --- nếu dùng mô hình không tối thiểu, loại rút gọn có thể “sai” (ví dụ: rút gọn tốt bị biến thành cộng bởi hệ số lớn).

Liên hệ với giả thuyết Birch--Dyer

Mô hình tối thiểu trong BSD.
  • Vi phân Néron: Vi phân bất biến $\omega = \frac{dx}{2y + a_1 x + a_3}$ trên mô hình tối thiểu là vi phân Néron (Néron differential). Chu kỳ thực $\Omega_E = \int_{E(\mathbb{R})} |\omega|$ trong BSD mạnh phải dùng vi phân Néron --- sai mô hình $\Rightarrow$ sai $\Omega_E$ bởi hệ số $u$ [silverman1994].
  • Số Tamagawa: $c_p$ được tính từ mô hình tối thiểu tại $p$ (qua thuật toán Tate).
  • Hằng số Manin: Nếu $\phi: X_0(N) \to E$ là parametrization modular, thì $\phi^*(\omega_E) = c_{\mathrm{Manin}} \cdot 2\pi i f_E(\tau) d\tau$, trong đó $c_{\mathrm{Manin}} \in \mathbb{Z}$ (phỏng đoán Manin: $c_{\mathrm{Manin}} = \pm 1$). Hằng số này phụ thuộc việc chọn mô hình tối thiểu [manin1972].
42 Phương trình tối thiểu toàn cục (Global minimal equation) Ch.2 5

Định nghĩa

Định nghĩa (Phương trình tối thiểu toàn cục). Cho $E/\mathbb{Q}$. Phương trình tối thiểu toàn cục (global minimal equation) (hay mô hình tối thiểu toàn cục) là phương trình Weierstrass:
\[ y^2 + a_1 xy + a_3 y = x^3 + a_2 x^2 + a_4 x + a_6, \quad a_i \in \mathbb{Z}, \]
đồng thời là mô hình tối thiểu tại mọi $p$.

Tồn tại: Trên $\mathbb{Q}$, phương trình tối thiểu toàn cục luôn tồn tại (nhờ $\mathbb{Q}$ có số lớp $h(\mathbb{Q}) = 1$). Trên trường số tổng quát $K$, nó tồn tại khi và chỉ khi lớp ước $\delta_{E/K}$ trong nhóm lớp $\mathrm{Cl}(K)$ tầm thường [silverman2009].

Biệt thức tối thiểu toàn cục: $\Delta_{\min} = \Delta_{\min}(E/\mathbb{Q})$ --- nhỏ nhất tuyệt đối.

Ví dụ

Ví dụ (Phương trình tối thiểu toàn cục).
  1. $E: y^2 + y = x^3 - x$ (37.a1 trong LMFDB [lmfdb]). Đây đã là phương trình tối thiểu toàn cục: $a_1 = 0$, $a_2 = 0$, $a_3 = 1$, $a_4 = -1$, $a_6 = 0$. $\Delta_{\min} = -37$.
  2. $E: y^2 = x^3 - 432$. $\Delta = -2^{12} \cdot 3^9$. Đổi biến $x = 4X + 0$, $y = 8Y + 0$: $Y^2 = X^3 - \frac{432}{64} = X^3 - 6.75$. Không nguyên! Cần dùng phương trình Weierstrass tổng quát (với $a_1, a_3$) để đạt hệ số nguyên tối thiểu.
  3. Phần mềm SageMath/PARI tự động tính mô hình tối thiểu toàn cục [sagemath, pari, cremona1997]. Ví dụ: E = EllipticCurve([0,0,1,-1,0]); E.minimal\_model().

Ý nghĩa trực giác

Toàn cục = “tốt tại mọi nơi cùng lúc”. Mô hình tối thiểu cục bộ (tại mỗi $p$ riêng) luôn tồn tại. Câu hỏi: có thể chọn một phương trình đồng thời tối thiểu tại mọi $p$?

Trên $\mathbb{Q}$: CÓ --- vì $\mathbb{Q}$ “đơn giản” (nhóm lớp tầm thường). Trên trường số $K$ phức tạp: có thể KHÔNG --- “xung đột” giữa các $p$ khác nhau (tương tự: không thể tối ưu mọi mặt cùng lúc).

Phép tương tự: mô hình tối thiểu toàn cục giống “bản vẽ kỹ thuật chuẩn” --- ai nhìn vào cũng thấy cùng đường cong, không bị “biến dạng” bởi phép đổi biến.

Liên hệ với giả thuyết Birch--Dyer

Phương trình tối thiểu toàn cục trong BSD. Mô hình tối thiểu toàn cục là “chuẩn” để tính mọi đại lượng BSD:
  • Conductor: $N_E = \prod_p p^{f_p}$ tính từ mô hình tối thiểu.
  • Chu kỳ thực: $\Omega_E = \int_{E(\mathbb{R})} |\omega_{\min}|$ dùng vi phân Néron từ mô hình tối thiểu toàn cục.
  • LMFDB/Cremona: Cơ sở dữ liệu lưu mỗi đường cong ở dạng tối thiểu toàn cục. Label Cremona (ví dụ 37a1) dùng conductor + ký tự isogeny class + số thứ tự trong class [cremona1997, lmfdb].
  • Kiểm nghiệm BSD: Mọi tính toán kiểm nghiệm BSD (Cremona, Stein, ...) đều bắt đầu từ mô hình tối thiểu toàn cục --- đảm bảo $\Omega_E$, $c_p$, $R_E$, $|\mathrm{Sha}|$ nhất quán.
43 Thuật toán Tate (Tate's algorithm) Ch.2 6

Định nghĩa

Định nghĩa (Thuật toán Tate). Thuật toán Tate (Tate's algorithm) là thuật toán xác định loại rút gọn (reduction type) của đường cong elliptic $E/\mathbb{Q}_p$ tại số nguyên tố $p$, cũng như tính số Tamagawa $c_p$ và số mũ conductor $f_p$.

Cụ thể, cho đường cong elliptic $E$ với phương trình Weierstrass tối thiểu tại $p$:

\[ y^2 + a_1 xy + a_3 y = x^3 + a_2 x^2 + a_4 x + a_6, \]
thuật toán Tate thực hiện các bước:
  1. Nếu $p \nmid \Delta$ (biệt thức): rút gọn tốt, $f_p = 0$, $c_p = 1$. Dừng.
  2. Nếu $p \mid \Delta$ nhưng phần kỳ dị là nút: rút gọn nhân (tách hoặc không tách), $f_p = 1$.
  3. Nếu phần kỳ dị là cusp: rút gọn cộng, $f_p \geq 2$. Thuật toán tiếp tục phân loại chi tiết theo ký hiệu Kodaira ($\mathrm{I}_n$, $\mathrm{I}_n^*$, $\mathrm{II}$, $\mathrm{III}$, $\mathrm{IV}$, $\mathrm{II}^*$, $\mathrm{III}^*$, $\mathrm{IV}^*$).
Thuật toán được Tate trình bày trong [tate1975] và mở rộng cho mọi residue field bởi Ogg và Néron.

Ví dụ

Ví dụ (Thuật toán Tate cho $E: y^2 = x^3 - x^2$ tại $p = 2$). Xét $E: y^2 = x^3 - x^2$, biệt thức $\Delta = -16$.

Bước 1: $2 \mid \Delta$, nên rút gọn không tốt tại $p = 2$.

Bước 2: Rút gọn modulo 2: $\tilde{E}: y^2 = x^3 + x^2$ trên $\mathbb{F}_2$. Điểm kỳ dị $(0,0)$: đạo hàm riêng $\partial F/\partial x = 3x^2 + 2x \equiv x^2$, $\partial F/\partial y = 2y \equiv 0$. Tại $(0,0)$: cả hai bằng $0$, xác nhận kỳ dị. Ma trận Hessian cho thấy đây là nút, nên rút gọn nhân.

Bước 3: Kiểm tra tách/không tách trên $\mathbb{F}_2$: tiếp tuyến tại nút cho hai hướng trong $\mathbb{F}_2$ $\Rightarrow$ rút gọn nhân tách, ký hiệu Kodaira $\mathrm{I}_1$, $c_2 = 1$, $f_2 = 1$.

Ví dụ (Bảng Kodaira cho đường cong 11a1). Đường cong $E: y^2 + y = x^3 - x^2 - 10x - 20$ (conductor $N = 11$).

Áp dụng thuật toán Tate tại $p = 11$: $\Delta = -11^5$, rút gọn nhân tách, ký hiệu Kodaira $\mathrm{I}_5$, số Tamagawa $c_{11} = 5$.

Tại mọi $p \neq 11$: $p \nmid 11$ nên rút gọn tốt, $c_p = 1$.

Ý nghĩa trực giác

Thuật toán Tate --- “bác sĩ chẩn đoán” cho đường cong. Thuật toán Tate giống một quy trình chẩn đoán y khoa: bệnh nhân (đường cong elliptic) đến “khám” tại mỗi số nguyên tố $p$, và thuật toán đưa ra “chẩn đoán” chi tiết:
  • Khỏe mạnh (rút gọn tốt): không có vấn đề gì.
  • Bệnh nhẹ (rút gọn nhân): nút --- đường cong vẫn “gần” trơn, chỉ tự cắt. Ký hiệu Kodaira $\mathrm{I}_n$ cho biết “mức độ” nút.
  • Bệnh nặng (rút gọn cộng): cusp --- đường cong suy biến nghiêm trọng. Các ký hiệu $\mathrm{II}, \mathrm{III}, \mathrm{IV}, \mathrm{I}_n^*, \mathrm{II}^*, \mathrm{III}^*, \mathrm{IV}^*$ là “phân loại bệnh” chi tiết.
“Toa thuốc” kèm theo: số Tamagawa $c_p$ (“chỉ số viêm”) và số mũ conductor $f_p$ (“mức độ nghiêm trọng”).

Liên hệ với giả thuyết Birch--Dyer

Thuật toán Tate trong BSD. Thuật toán Tate là công cụ tính toán không thể thiếu cho BSD:
  • Số Tamagawa $c_p$: xuất hiện trực tiếp trong công thức BSD mạnh $\frac{L^{(r)}(E,1)}{r!} = \frac{|\mathrm{Sha}| \cdot \Omega_E \cdot R_E \cdot \prod_p c_p}{|E(\mathbb{Q})_{\mathrm{tors}}|^2}$. Thuật toán Tate tính chính xác mỗi $c_p$.
  • Conductor: $N_E = \prod_p p^{f_p}$ với $f_p$ từ thuật toán Tate. Conductor xác định phương trình hàm của $L(E,s)$.
  • Thực thi: Phần mềm Cremona, SageMath [sagemath], PARI/GP [pari] đều cài đặt thuật toán Tate là bước đầu tiên khi phân tích đường cong elliptic.
44 Conductor (Conductor $N_E$) Ch.2 5

Định nghĩa

Định nghĩa (Conductor của đường cong elliptic). Conductor (Conductor) của đường cong elliptic $E/\mathbb{Q}$ là số nguyên dương:
\[ N_E = \prod_{p \text{ nguyên tố}} p^{f_p}, \]
trong đó $f_p$ là số mũ conductor tại $p$, xác định bởi:
\[ f_p = \begin{cases} 0 & \text{nếu $E$ có rút gọn tốt tại $p$ (good reduction),} \\ 1 & \text{nếu $E$ có rút gọn nhân tại $p$ (multiplicative reduction),} \\ 2 + \delta_p & \text{nếu $E$ có rút gọn cộng tại $p$ (additive reduction),} \end{cases} \]
với $\delta_p \geq 0$ là phần hoang dã (wild part), chỉ khác 0 khi $p = 2$ hoặc $p = 3$ [silverman2009].

Tích trên hữu hạn vì chỉ có hữu hạn số nguyên tố $p$ mà $E$ có rút gọn xấu (chính xác là các ước của biệt thức tối thiểu).

Ví dụ

Ví dụ (Conductor của một số đường cong quen thuộc).
  1. $E: y^2 + y = x^3 - x^2 - 10x - 20$: conductor $N_E = 11$. Rút gọn xấu chỉ tại $p = 11$ (nhân tách, $f_{11} = 1$). Đây là đường cong elliptic có conductor nhỏ nhất trên $\mathbb{Q}$.
  2. $E: y^2 = x^3 - x$: conductor $N_E = 32 = 2^5$. Rút gọn xấu chỉ tại $p = 2$ (cộng, $f_2 = 2 + 3 = 5$ do phần hoang dã $\delta_2 = 3$). Đường cong CM bởi $\mathbb{Z}[i]$.
  3. $E: y^2 + y = x^3 - x^2$: conductor $N_E = 11$, hạng $r = 0$.
  4. $E: y^2 + xy = x^3 - x^2 - 4x + 4$ (37a1): conductor $N_E = 37$. Rút gọn nhân tách tại $p = 37$, $f_{37} = 1$. Hạng $r = 1$.

Ý nghĩa trực giác

Conductor --- “mã vùng” của đường cong elliptic. Conductor $N_E$ giống mã vùng hoặc “số CMND” của đường cong elliptic:
  • Nó mã hóa tất cả vị trí mà đường cong “gặp rắc rối” (rút gọn xấu) và mức độ nghiêm trọng tại mỗi vị trí.
  • Conductor càng nhỏ $\Rightarrow$ đường cong “đơn giản” hơn (ít số nguyên tố xấu).
  • Hai đường cong có cùng conductor thường có “tính cách” gần nhau --- chúng cùng “sống” trong không gian modular $X_0(N)$.

Phép tương tự: nếu đường cong elliptic là “con người”, conductor là “lý lịch” ghi nhận mọi “sai phạm” (rút gọn xấu) tại mỗi “địa phương” (số nguyên tố).

Liên hệ với giả thuyết Birch--Dyer

Conductor trong BSD. Conductor $N_E$ là đại lượng trung tâm kết nối đường cong elliptic với dạng modular và hàm $L$:
  • Định lý modularity [wiles1995, taylor-wiles1995, breuil2001]: mỗi $E/\mathbb{Q}$ ứng với dạng modular newform $f \in S_2(\Gamma_0(N_E))$ cùng conductor. Do đó $L(E,s) = L(f,s)$ thỏa mãn phương trình hàm với conductor $N_E$.
  • Phương trình hàm: $\Lambda(E,s) = w \cdot \Lambda(E, 2-s)$ với $\Lambda(E,s) = N_E^{s/2} (2\pi)^{-s} \Gamma(s) L(E,s)$ và $w = \pm 1$ là dấu gốc (root number).
  • Dấu gốc: $w = (-1)^r$ theo BSD yếu, với $r = \mathrm{ord}_{s=1} L(E,s)$. Dấu gốc tính từ conductor: $w = -\mu(N_E) \cdot \prod_{p \mid N_E} w_p$.
  • LMFDB: Đường cong được tổ chức theo conductor --- ví dụ 11a1, 37a1 --- conductor là “khóa chính” của cơ sở dữ liệu [lmfdb].
45 Mô hình Néron (Néron model) Ch.3 7

Định nghĩa

Định nghĩa (Mô hình Néron). Cho $E/\mathbb{Q}$ đường cong elliptic. Mô hình Néron (Néron model) $\mathcal{E}/\mathbb{Z}$ (hoặc $\mathcal{E}/\mathbb{Z}_p$ cục bộ) là lược đồ nhóm trơn (smooth group scheme) $\mathcal{E} \to \operatorname{Spec}(\mathbb{Z})$ thỏa mãn tính chất ánh xạ Néron (Néron mapping property):

Với mọi lược đồ trơn $\mathcal{X}/\mathbb{Z}$ và ánh xạ hữu tỉ $\mathcal{X}_\mathbb{Q} \to E$ trên $\mathbb{Q}$, tồn tại duy nhất mở rộng $\mathcal{X} \to \mathcal{E}$ trên $\mathbb{Z}$.

Nói đơn giản: mô hình Néron là “cách tốt nhất” để mở rộng đường cong elliptic $E$ (sống trên $\mathbb{Q}$) thành một đối tượng (sống trên $\mathbb{Z}$) sao cho mọi phép biến đổi hợp lệ trên $\mathbb{Q}$ đều “mở rộng được” xuống $\mathbb{Z}$ [neron1965, silverman2009].

Định nghĩa (Thớ đặc biệt và thành phần). Tại mỗi số nguyên tố $p$, thớ đặc biệt (special fiber) $\mathcal{E}_p = \mathcal{E} \times_{\mathbb{Z}} \mathbb{F}_p$ là lược đồ nhóm trên $\mathbb{F}_p$. Thớ này có thể không liên thông:
\[ \mathcal{E}_p = \mathcal{E}_p^0 \sqcup \bigsqcup_{i} C_i, \]
trong đó $\mathcal{E}_p^0$ là thành phần đơn vị (identity component) --- thành phần liên thông chứa phần tử đơn vị. Nhóm thành phần (component group) là:
\[ \Phi_p = \mathcal{E}_p / \mathcal{E}_p^0, \]
và số Tamagawa $c_p = |\Phi_p(\mathbb{F}_p)|$ = số thành phần hữu tỉ trên $\mathbb{F}_p$.

Ví dụ

Ví dụ (Mô hình Néron tại rút gọn tốt vs. xấu).
  1. Rút gọn tốt tại $p$: Mô hình Néron $\mathcal{E}_p$ liên thông, $\Phi_p = 0$, $c_p = 1$. Thớ đặc biệt là đường cong elliptic trên $\mathbb{F}_p$.
  2. Rút gọn nhân tách $\mathrm{I}_n$: Thớ đặc biệt gồm $n$ bản sao $\mathbb{P}^1$ sắp xếp thành “vòng tròn” (cycle). Nhóm thành phần $\Phi_p \cong \mathbb{Z}/n\mathbb{Z}$, $c_p = n$.
  3. Ví dụ cụ thể: Đường cong 11a1 tại $p = 11$: ký hiệu Kodaira $\mathrm{I}_5$, thớ đặc biệt có 5 thành phần sắp thành vòng, $c_{11} = 5$.

Ý nghĩa trực giác

Mô hình Néron --- “bản vẽ chi tiết nhất”. Nếu mô hình tối thiểu (Weierstrass) là “bản vẽ kỹ thuật cơ bản”, thì mô hình Néron là “bản vẽ chi tiết nhất có thể”:
  • Mô hình Weierstrass tối thiểu có thể “kỳ dị” tại các thớ xấu.
  • Mô hình Néron “giải kỳ dị” (desingularize) thớ đặc biệt, trả giá bằng việc thớ có thể không liên thông --- tách thành nhiều thành phần.
  • Số thành phần (= số Tamagawa $c_p$) đo “đường cong bị vỡ thành bao nhiêu mảnh” tại $p$.

Phép tương tự: đường cong elliptic là chiếc bình gốm. Tại các số nguyên tố “xấu”, chiếc bình bị “rạn”. Mô hình Néron là cách “phục chế” --- bình trơn nhưng có thể bị “vỡ” thành nhiều mảnh ($c_p$ mảnh).

Liên hệ với giả thuyết Birch--Dyer

Mô hình Néron trong BSD. Mô hình Néron cung cấp nền tảng hình học cho công thức BSD:
  • Vi phân Néron: $\omega_{\mathrm{Néron}} \in H^0(\mathcal{E}, \Omega^1)$ là vi phân “chuẩn” trên mô hình Néron. Chu kỳ thực $\Omega_E = \int_{E(\mathbb{R})} |\omega_{\mathrm{Néron}}|$ trong công thức BSD dùng chính vi phân này.
  • Số Tamagawa: $c_p = |\Phi_p(\mathbb{F}_p)|$ từ nhóm thành phần --- xuất hiện trực tiếp trong công thức BSD.
  • Hằng số Manin: $c_{\mathrm{Manin}} = [\omega_{\min} : \omega_f]$ liên hệ vi phân Néron $\omega_{\min}$ với vi phân dạng modular $\omega_f$. Phỏng đoán Manin: $c_{\mathrm{Manin}} = 1$ [manin1972].
  • Dãy chính xác Néron: cho phép liên hệ $\mathrm{Sha}(E/\mathbb{Q})$ với đối đồng điều của mô hình Néron, nền tảng cho chứng minh hữu hạn $\mathrm{Sha}$ trong nhiều trường hợp.
46 Siêu kỳ dị (Supersingular) Ch.2 6

Định nghĩa

Định nghĩa (Đường cong elliptic siêu kỳ dị). Cho $E$ đường cong elliptic trên trường hữu hạn $\mathbb{F}_p$ (với $p$ nguyên tố). $E$ được gọi là siêu kỳ dị (supersingular) nếu thỏa mãn một trong các điều kiện tương đương:
  1. $|E(\mathbb{F}_p)| \equiv 1 \pmod{p}$, tức $a_p = p + 1 - |E(\mathbb{F}_p)| \equiv 0 \pmod{p}$.
  2. $\mathrm{End}(E) \otimes \mathbb{Q}$ là đại số quaternion (bậc 4 trên $\mathbb{Q}$), thay vì trường bậc 2 như trường hợp thông thường.
  3. $E[p] = 0$ (không có điểm $p$-xoắn trên bao đóng đại số $\overline{\mathbb{F}}_p$).
  4. Nếu $p \geq 5$: $j(E) \in \mathbb{F}_{p^2}$ (j-bất biến nằm trong $\mathbb{F}_{p^2}$).

Đường cong không siêu kỳ dị gọi là thông thường (ordinary). Với đường cong thông thường, $p \nmid a_p$ và $\mathrm{End}(E) \otimes \mathbb{Q}$ là trường bậc 2 (CM field) [silverman2009].

Ví dụ

Ví dụ (Đường cong siêu kỳ dị và thông thường).
  1. Siêu kỳ dị: $E: y^2 = x^3 + 1$ trên $\mathbb{F}_5$. Ta đếm: $|E(\mathbb{F}_5)| = 6 = 5 + 1$, nên $a_5 = 0 \equiv 0 \pmod{5}$. Đường cong siêu kỳ dị.
  2. Thông thường: $E: y^2 = x^3 + x + 1$ trên $\mathbb{F}_5$. Đếm điểm: $(0, \pm 1), (2, \pm 1), (3, 0), \mathcal{O}$ $\Rightarrow$ $|E(\mathbb{F}_5)| = 6$, $a_5 = 0$ --- cũng siêu kỳ dị!

    Thử $E: y^2 = x^3 + 2$ trên $\mathbb{F}_5$: đếm $|E(\mathbb{F}_5)| = 4$, $a_5 = 2 \not\equiv 0 \pmod{5}$. Đường cong thông thường.

  3. Thống kê: Với $p$ cho trước, chỉ có hữu hạn j-bất biến siêu kỳ dị: khoảng $\lfloor p/12 \rfloor$ giá trị. Ví dụ $p = 2$: chỉ $j = 0$; $p = 3$: chỉ $j = 0$; $p = 5$: $j = 0$; $p = 11$: $j = 0, 1$.

Ý nghĩa trực giác

Siêu kỳ dị --- đường cong “quá đặc biệt”. Đường cong siêu kỳ dị là những đường cong “đặc biệt” trong thế giới mod $p$:
  • “Quá nhiều đối xứng”: vành tự đồng cấu $\mathrm{End}(E)$ lớn bất thường (bậc 4 thay vì bậc 2 hoặc 1). Giống viên kim cương cắt hoàn hảo --- quá đối xứng so với đá thông thường.
  • “Không có điểm $p$-xoắn”: $E[p] = 0$ nghĩa là phép nhân $[p]$ “giết chết” tất cả. Ở đường cong thông thường, $E[p] \cong \mathbb{Z}/p\mathbb{Z}$ --- vẫn còn “sống sót” một phần.
  • Hiếm nhưng quan trọng: Tỷ lệ j-bất biến siêu kỳ dị là $\sim 1/12$ --- nhỏ nhưng khác không, và chúng có vai trò đặc biệt trong lý thuyết.

Liên hệ với giả thuyết Birch--Dyer

Siêu kỳ dị trong BSD. Tính siêu kỳ dị ảnh hưởng sâu sắc đến lý thuyết BSD:
  • Lý thuyết Iwasawa: Hành vi của nhóm Selmer trong tháp $\mathbb{Z}_p$-mở rộng phụ thuộc mạnh vào $E$ thông thường hay siêu kỳ dị tại $p$.
  • Thông thường: lý thuyết Iwasawa “cổ điển” (Mazur, Greenberg) áp dụng trực tiếp.
  • Siêu kỳ dị: cần lý thuyết phức tạp hơn (Kobayashi plus/minus Selmer, Pollack, Sprung) [kobayashi2003].
BSD $p$-adic: Công thức BSD $p$-adic cho $E$ siêu kỳ dị tại $p$ có dạng khác (liên quan hàm $L$ $p$-adic Pollack [pollack2003]), phức tạp hơn trường hợp thông thường (Mazur--Tate--Teitelbaum [mazur-tate1983]). • Ví dụ: $E: y^2 = x^3 - x$ (CM bởi $\mathbb{Z}[i]$) siêu kỳ dị tại $p = 2$. BSD cho đường cong này được Rubin chứng minh [rubin1991] bằng hệ thống Euler trên trường CM.
47 Tích phân elliptic (Elliptic integral) Ch.2 4

Định nghĩa

Định nghĩa (Tích phân elliptic). Tích phân elliptic (Elliptic integral) là tích phân dạng:
\[ \int R(x, y) \, dx, \quad \text{trong đó } y^2 = P(x) \text{ với } P \text{ đa thức bậc 3 hoặc 4}, \]
và $R(x,y)$ là hàm hữu tỉ theo $x$ và $y$.

Ba dạng chuẩn Legendre là:

\[\begin{aligned} \text{Loại 1:} \quad F(\varphi, k) &= \int_0^{\varphi} \frac{d\theta}{\sqrt{1 - k^2 \sin^2 \theta}}, \\ \text{Loại 2:} \quad E(\varphi, k) &= \int_0^{\varphi} \sqrt{1 - k^2 \sin^2 \theta} \, d\theta, \\ \text{Loại 3:} \quad \Pi(n, \varphi, k) &= \int_0^{\varphi} \frac{d\theta}{(1 - n\sin^2\theta)\sqrt{1 - k^2 \sin^2 \theta}}. \end{aligned}\]

Khi $\varphi = \pi/2$, ta được tích phân elliptic đầy đủ: $K(k) = F(\pi/2, k)$, $E(k) = E(\pi/2, k)$.

Tên “elliptic” bắt nguồn từ bài toán tính chu vi đường ellipse: $L = 4a \cdot E(e)$ với $e$ là tâm sai, $a$ là bán trục lớn [silverman2009].

Ví dụ

Ví dụ (Chu vi đường ellipse và tích phân elliptic). Đường ellipse $\frac{x^2}{a^2} + \frac{y^2}{b^2} = 1$ có chu vi:
\[ L = 4a \int_0^{\pi/2} \sqrt{1 - e^2 \sin^2\theta} \, d\theta = 4a \cdot E(e), \]
với $e = \sqrt{1 - b^2/a^2}$ là tâm sai.
  • Đường tròn ($a = b$, $e = 0$): $L = 4a \cdot \pi/2 = 2\pi a$ --- tích phân sơ cấp.
  • Ellipse ($e > 0$): không biểu diễn được bằng hàm sơ cấp --- đây là tích phân elliptic đích thực.
  • Ví dụ: $a = 2, b = 1$, $e = \sqrt{3}/2$. $L = 8 \cdot E(\sqrt{3}/2) \approx 8 \times 1.2111 = 9.689$.
Ví dụ (Con lắc đơn và tích phân elliptic). Chu kỳ con lắc đơn góc lớn $\theta_0$:
\[ T = 4\sqrt{\frac{\ell}{g}} \cdot K\!\left(\sin\frac{\theta_0}{2}\right), \]
với $K(k)$ là tích phân elliptic đầy đủ loại 1. Khi $\theta_0 \to 0$: $K(0) = \pi/2$, nên $T \approx 2\pi\sqrt{\ell/g}$ (công thức quen thuộc). Khi $\theta_0 = \pi/2$ (90°): $T \approx 4\sqrt{\ell/g} \cdot K(1/\sqrt{2}) \approx 7.42\sqrt{\ell/g}$ --- dài hơn ~18% so với xấp xỉ góc nhỏ.

Ý nghĩa trực giác

Tích phân elliptic --- “tổ tiên” của đường cong elliptic. Lịch sử: đường cong elliptic ra đời từ việc nghiên cứu tích phân elliptic, chứ không phải ngược lại!
  • Thế kỷ 17--18: Euler, Fagnano nghiên cứu chu vi ellipse $\Rightarrow$ phát hiện tích phân “không sơ cấp”.
  • Abel--Jacobi (1820s--1830s): Bước đột phá --- thay vì tính tích phân $u = \int_0^x \frac{dt}{\sqrt{P(t)}}$, hãy đảo ngược: xét $x = x(u)$ là hàm của $u$. Hàm ngược này tuần hoàn kép trên $\mathbb{C}$ --- dẫn đến hàm elliptic!
  • Từ tích phân đến đường cong: Đồng nhất thức cộng của tích phân elliptic phản ánh luật nhóm trên đường cong elliptic $y^2 = P(x)$.
Phép tương tự: hàm $\sin$ ra đời từ tích phân $\int \frac{dt}{\sqrt{1-t^2}}$ (cung tròn). Tương tự, hàm elliptic ra đời từ tích phân elliptic $\int \frac{dt}{\sqrt{P(t)}}$ (cung ellipse).

Liên hệ với giả thuyết Birch--Dyer

Tích phân elliptic trong BSD. Tích phân elliptic kết nối lý thuyết giải tích với đại số trong BSD:
  • Chu kỳ thực: $\Omega_E = \int_{E(\mathbb{R})} \omega$ (tích phân vi phân Néron trên phần thực) --- đây chính là tích phân elliptic! Đại lượng này xuất hiện trực tiếp trong công thức BSD.
  • Chu kỳ phức: $\omega_1, \omega_2$ (hai chu kỳ của tích phân elliptic liên kết) tạo thành lưới $\Lambda = \mathbb{Z}\omega_1 + \mathbb{Z}\omega_2$, và $E(\mathbb{C}) \cong \mathbb{C}/\Lambda$.
  • Chiều cao chính tắc Néron--Tate: $\hat{h}(P) = -\frac{1}{2}\log|\sigma(z_P)|^2 + \ldots$ liên quan đến hàm sigma Weierstrass --- bản thân là “tích phân elliptic biến đổi”.
  • Lịch sử: Birch và Swinnerton-Dyer phát biểu giả thuyết ban đầu (1965) bằng ngôn ngữ chu kỳ thực $\Omega_E$ --- tức tích phân elliptic [birch1965].
48 Hàm Weierstrass $\wp$ (Weierstrass $\wp$-function) Ch.2 5

Định nghĩa

Định nghĩa (Hàm Weierstrass $\wp$). Cho lưới $\Lambda = \mathbb{Z}\omega_1 + \mathbb{Z}\omega_2 \subset \mathbb{C}$ với $\omega_1/\omega_2 \notin \mathbb{R}$. Hàm Weierstrass $\wp$ (Weierstrass $\wp$-function) liên kết với $\Lambda$ là:
\[ \wp(z; \Lambda) = \frac{1}{z^2} + \sum_{\substack{\omega \in \Lambda \\ \omega \neq 0}} \left(\frac{1}{(z-\omega)^2} - \frac{1}{\omega^2}\right). \]

Các tính chất cơ bản:

  1. $\wp$ là hàm chẵn: $\wp(-z) = \wp(z)$.
  2. $\wp$ là hàm tuần hoàn kép: $\wp(z + \omega) = \wp(z)$ với mọi $\omega \in \Lambda$.
  3. $\wp$ có cực bậc 2 tại mọi điểm lưới $z \in \Lambda$ và giải tích trên $\mathbb{C} \setminus \Lambda$.
  4. $\wp$ thỏa mãn phương trình vi phân:
    \[ (\wp')^2 = 4\wp^3 - g_2 \wp - g_3, \]
    với các bất biến lưới $g_2 = 60 \sum_{\omega \neq 0} \omega^{-4}$, $g_3 = 140 \sum_{\omega \neq 0} \omega^{-6}$ [silverman2009].

Định lý (Uniformization --- đồng nhất $E(\mathbb{C})$ với torus phức). Ánh xạ:
\[ \Phi: \mathbb{C}/\Lambda \to E(\mathbb{C}), \quad z \mapsto \begin{cases} [\wp(z) : \wp'(z) : 1] & \text{nếu } z \notin \Lambda, \\ [0:1:0] = \mathcal{O} & \text{nếu } z \in \Lambda, \end{cases} \]
đẳng cấu nhóm và giải tích phức giữa torus phức $\mathbb{C}/\Lambda$ và đường cong elliptic:
\[ E: Y^2 = 4X^3 - g_2 X - g_3. \]
Nói cách khác, mọi đường cong elliptic trên $\mathbb{C}$ đều “là” một torus phức $\mathbb{C}/\Lambda$ [silverman2009].

Ví dụ

Ví dụ (Lưới vuông và hàm $\wp$). Lấy $\Lambda = \mathbb{Z} + \mathbb{Z} i$ (lưới vuông, $\omega_1 = 1$, $\omega_2 = i$).
  • Đối xứng: $\Lambda$ bất biến khi nhân $i$ (xoay 90°), nên $\wp(iz) = -\wp(z)$. Suy ra $g_3 = 0$ (vì $g_3$ phải đổi dấu dưới phép nhân $i$, nhưng cũng phải bất biến).
  • Phương trình: $(\wp')^2 = 4\wp^3 - g_2 \wp$, hay (chuẩn hóa) $y^2 = x^3 - x$. Đây là đường cong elliptic $E: y^2 = x^3 - x$ với CM bởi $\mathbb{Z}[i]$.
  • Giá trị: $g_2 = 4\pi^4 \cdot \frac{E_4(i)}{(2\pi)^4} \approx 189.07$ (dùng chuỗi Eisenstein $E_4$).
Ví dụ (Lưới lục giác). Lấy $\Lambda = \mathbb{Z} + \mathbb{Z} \zeta_3$ với $\zeta_3 = e^{2\pi i/3}$ (lưới lục giác).
  • Đối xứng bậc 3: $\zeta_3 \Lambda = \Lambda$, nên $\wp(\zeta_3 z) = \zeta_3^{-2}\wp(z)$. Suy ra $g_2 = 0$.
  • Phương trình: $(\wp')^2 = 4\wp^3 - g_3$, hay $y^2 = x^3 + 1$. CM bởi $\mathbb{Z}[\zeta_3]$.

Ý nghĩa trực giác

Hàm $\wp$ --- “hệ tọa độ” trên torus. Hàm $\wp$ là “GPS” cho torus phức:
  • Torus = hình xuyến: $\mathbb{C}/\Lambda$ là mặt phẳng phức “cuộn” thành hình xuyến (donut).
  • $\wp$ = “bản đồ”: Hàm $\wp$ là cách “trải phẳng” hình xuyến thành đường cong trong $\mathbb{C}^2$ --- cụ thể, đường cong elliptic $y^2 = 4x^3 - g_2 x - g_3$.
  • Uniformization: Mọi đường cong elliptic trên $\mathbb{C}$ đều “thực chất” là torus. $\wp$ cho phép đi qua lại giữa hai cách nhìn.

Phép tương tự: hàm $e^{i\theta}$ “cuộn” đường thẳng $\mathbb{R}$ thành đường tròn $S^1$. Tương tự, hàm $(\wp, \wp')$ “cuộn” mặt phẳng $\mathbb{C}$ thành “đường tròn bậc cao” (torus/đường cong elliptic).

Liên hệ với giả thuyết Birch--Dyer

Hàm $\wp$ trong BSD. Hàm $\wp$ và uniformization là nền tảng giải tích phức cho BSD:
  • Chu kỳ: Hai chu kỳ $\omega_1, \omega_2$ của $\wp$ chính là tích phân $\omega_i = \int_{\gamma_i} \frac{dx}{2y}$ trên hai vòng sinh của $E(\mathbb{C})$. Chu kỳ thực $\Omega_E$ trong BSD là tổ hợp tuyến tính của $\omega_1, \omega_2$.
  • Hàm sigma: $\sigma(z; \Lambda)$ --- “nguyên hàm” của $-\wp$ --- liên quan đến chiều cao Néron--Tate: $\hat{h}(P) = -\log|\sigma(z_P)/\sigma_0|$ (chuẩn hóa thích hợp).
  • Modular parametrization: Theo định lý modularity [wiles1995], tồn tại $\phi: X_0(N) \to E$. Trên $\mathbb{C}$, $\phi$ kết hợp uniformization $\mathbb{H}/\Gamma_0(N) \to X_0(N)(\mathbb{C})$ với uniformization $\mathbb{C}/\Lambda \to E(\mathbb{C})$.
  • Điểm Heegner: Xây dựng điểm Heegner $P_K \in E(\mathbb{Q})$ bắt đầu từ CM points trên $X_0(N)$, rồi đẩy qua $\phi$ và dùng uniformization $\mathbb{C}/\Lambda \cong E(\mathbb{C})$ để tính tọa độ hữu tỉ [gross-zagier1986].
49 Lưới (Lattice $\Lambda$) Ch.2 3

Định nghĩa

Định nghĩa (Lưới trong $\mathbb{C}$). Một lưới (lattice) trong mặt phẳng phức $\mathbb{C}$ là tập hợp
\[ \Lambda = \mathbb{Z}\omega_1 + \mathbb{Z}\omega_2 = \{ m\omega_1 + n\omega_2 \mid m, n \in \mathbb{Z} \} \]
trong đó $\omega_1, \omega_2 \in \mathbb{C}$ là hai số phức độc lập tuyến tính trên $\mathbb{R}$ (tức $\omega_2/\omega_1 \notin \mathbb{R}$). Hai phần tử $\omega_1, \omega_2$ được gọi là cơ sở (basis) của lưới [silverman2009].

Điều kiện $\omega_2/\omega_1 \notin \mathbb{R}$ đảm bảo rằng hai hướng $\omega_1$ và $\omega_2$ “bao phủ” toàn bộ mặt phẳng $\mathbb{C}$ --- nếu chúng cùng nằm trên một đường thẳng qua gốc, ta chỉ được mạng một chiều (không đủ để tạo torus).

Ví dụ

Ví dụ (Các lưới cụ thể).
  1. Lưới Gauss: $\Lambda = \mathbb{Z} + \mathbb{Z} i = \{m + ni \mid m, n \in \mathbb{Z}\}$. Đây là lưới vuông, cơ sở $\omega_1 = 1$, $\omega_2 = i$. Miền cơ bản là hình vuông đơn vị $[0,1) \times [0,1)$.
  2. Lưới lục giác: $\Lambda = \mathbb{Z} + \mathbb{Z}\zeta_3$ với $\zeta_3 = e^{2\pi i/3} = \frac{-1 + i\sqrt{3}}{2}$. Miền cơ bản có dạng hình thoi với góc $60°$. Lưới này có đối xứng bậc 6, tương ứng với đường cong $y^2 = x^3 + 1$ (có $j = 0$).
  3. Lưới tổng quát: $\Lambda = \mathbb{Z} + \mathbb{Z}\tau$ với $\tau = 1 + 2i$. Miền cơ bản là hình bình hành có các đỉnh $0, 1, \tau, 1+\tau$.

Ý nghĩa trực giác

Lưới như “giấy kẻ ô” trên mặt phẳng phức. Hãy tưởng tượng mặt phẳng phức $\mathbb{C}$ như một tờ giấy vô hạn. Một lưới $\Lambda$ giống như lưới ô vuông (hoặc ô hình bình hành) phủ kín tờ giấy:
  • Các điểm lưới $\omega = m\omega_1 + n\omega_2$ là các “nút giao” của lưới.
  • Miền cơ bản (fundamental domain) là một hình bình hành $\{s\omega_1 + t\omega_2 \mid 0 \le s, t < 1\}$ --- mỗi điểm trong $\mathbb{C}$ nằm trong đúng một “ô” (modulo tịnh tiến theo lưới).
  • Hình dạng lưới hoàn toàn được xác định bởi tỉ số $\tau = \omega_2/\omega_1$ (ta có thể chuẩn hóa $\omega_1 = 1$, khi đó $\Lambda = \mathbb{Z} + \mathbb{Z}\tau$).

Phép tương tự đời thường: lưới giống như hoa văn lặp trên giấy dán tường. Mỗi ô lặp lại vô hạn lần, phủ kín toàn bộ bức tường.

Liên hệ với giả thuyết Birch--Dyer

Lưới trong BSD. Lưới $\Lambda$ là đối tượng nền tảng kết nối đường cong elliptic với giải tích phức:
  • Uniformization: Mỗi đường cong elliptic $E/\mathbb{C}$ đẳng cấu với torus phức $\mathbb{C}/\Lambda$ cho một lưới $\Lambda$ duy nhất (xem khái niệm 50).
  • Chu kỳ thực: $\Omega_E = \int_{E(\mathbb{R})} |\omega|$ trong công thức BSD mạnh chính là tích phân trên thành phần thực của $\mathbb{C}/\Lambda$.
  • Phân loại: Hai đường cong elliptic $E \cong E'$ trên $\mathbb{C}$ khi và chỉ khi $\Lambda' = c\Lambda$ cho hằng số $c \in \mathbb{C}^*$. Do đó không gian moduli được tham số hóa bởi $\tau \in \mathcal{H}/\mathrm{SL}_2(\mathbb{Z})$.
50 Torus phức (Complex torus $\mathbb{C}/\Lambda$) Ch.2 5

Định nghĩa

Định nghĩa (Torus phức). Cho $\Lambda = \mathbb{Z}\omega_1 + \mathbb{Z}\omega_2$ là một lưới trong $\mathbb{C}$. Torus phức (complex torus) tương ứng là nhóm thương
\[ T = \mathbb{C} / \Lambda = \{ z + \Lambda \mid z \in \mathbb{C} \}, \]
trong đó hai số phức $z_1, z_2$ được đồng nhất khi $z_1 - z_2 \in \Lambda$ [silverman2009].

$T$ có cấu trúc:

  • Nhóm Abel: phép cộng $(z_1 + \Lambda) + (z_2 + \Lambda) = (z_1 + z_2) + \Lambda$.
  • Đa tạp phức compact: $T$ là mặt Riemann compact giống 1 (genus 1).
  • Nhóm Lie phức: vừa là nhóm, vừa là đa tạp, các phép toán đều giải tích.

Ví dụ

Ví dụ (Torus cụ thể).
  1. Lưới Gauss: $\mathbb{C}/(\mathbb{Z} + \mathbb{Z} i)$ là torus “vuông”. Về mặt tô-pô, ta lấy hình vuông $[0,1] \times [0,1]$, dán cạnh trên với cạnh dưới, dán cạnh trái với cạnh phải $\Rightarrow$ hình xuyến (donut).
  2. Lưới lục giác: $\mathbb{C}/(\mathbb{Z} + \mathbb{Z} e^{2\pi i/3})$ là torus “tam giác đều”. Torus này tương ứng với đường cong $y^2 = x^3 + 1$ ($j = 0$), có nhóm tự đồng cấu lớn hơn bình thường (CM bởi $\mathbb{Z}[\zeta_3]$).
  3. Lưới tổng quát: $\mathbb{C}/(\mathbb{Z} + \mathbb{Z}\tau)$ với $\tau = i\sqrt{2}$. Torus này tương ứng với một đường cong elliptic có CM bởi $\mathbb{Z}[\sqrt{-2}]$.

Ý nghĩa trực giác

Từ mặt phẳng đến hình xuyến. Torus phức $\mathbb{C}/\Lambda$ được tạo ra bằng cách “gấp” mặt phẳng phức:
  • Bước 1: Lấy miền cơ bản --- hình bình hành có các cạnh $\omega_1$ và $\omega_2$.
  • Bước 2: Dán hai cạnh đối diện theo hướng $\omega_1$ $\Rightarrow$ được ống trụ.
  • Bước 3: Dán hai đầu ống trụ lại $\Rightarrow$ được hình xuyến (donut/torus).

Phép tương tự: giống như trò chơi Pac-Man --- khi nhân vật đi ra cạnh phải thì xuất hiện ở cạnh trái, đi ra cạnh trên thì xuất hiện ở cạnh dưới. Mặt phẳng trò chơi chính là torus!

Sự kỳ diệu nằm ở chỗ: phép cộng trên đường cong elliptic (luật cộng phức tạp qua hình học) tương ứng với phép cộng vectơ đơn giản trên $\mathbb{C}/\Lambda$:

\[ P + Q \text{ trên } E(\mathbb{C}) \longleftrightarrow z_P + z_Q \pmod{\Lambda} \text{ trên } \mathbb{C}/\Lambda. \]

Liên hệ với giả thuyết Birch--Dyer

Torus phức trong BSD.
  • Định lý uniformization: Mọi đường cong elliptic $E/\mathbb{C}$ đều đẳng cấu (như nhóm Lie phức) với $\mathbb{C}/\Lambda_E$ cho một lưới $\Lambda_E$ duy nhất (đến hằng số tỉ lệ) [silverman2009]. Đây là cầu nối giữa hình học đại số và giải tích phức.
  • Hàm L qua lưới: Các hệ số $a_p$ trong hàm $L(E, s)$ xác định lưới $\Lambda_E$. Định lý modularity [wiles1995] nói rằng lưới này cũng đến từ dạng modular $f_E$.
  • Chu kỳ: Diện tích miền cơ bản $|\omega_1\bar{\omega}_2 - \omega_2\bar{\omega}_1|$ của $\Lambda_E$ liên quan trực tiếp đến chu kỳ thực $\Omega_E$ trong công thức BSD mạnh.
  • Điểm Heegner: Điểm CM $\tau \in \mathcal{H}$ cho ta $\mathbb{C}/(\mathbb{Z} + \mathbb{Z}\tau)$, từ đó xây dựng điểm hữu tỉ trên $E$ qua tham số hóa modular [gross-zagier1986].
51 Hàm tuần hoàn kép (Doubly periodic function) Ch.2 4

Định nghĩa

Định nghĩa (Hàm tuần hoàn kép và hàm elliptic). Cho $\Lambda = \mathbb{Z}\omega_1 + \mathbb{Z}\omega_2$ là một lưới. Hàm phân hình $f\colon \mathbb{C} \to \mathbb{C} \cup \{\infty\}$ được gọi là hàm tuần hoàn kép (doubly periodic function) (hay hàm elliptic (elliptic function)) nếu:
\[ f(z + \omega) = f(z) \quad \text{với mọi } z \in \mathbb{C}, \, \omega \in \Lambda. \]
Nói cách khác, $f$ bất biến dưới phép tịnh tiến theo hai hướng độc lập $\omega_1$ và $\omega_2$ [silverman2009].

Một hàm tuần hoàn kép phân hình (tức giải tích trừ tại hữu hạn cực) được gọi là hàm elliptic (elliptic function). Tập tất cả hàm elliptic đối với lưới $\Lambda$ tạo thành một trường, ký hiệu $\mathbb{C}(\Lambda)$.

Ví dụ

Ví dụ (Các hàm tuần hoàn kép quan trọng).
  1. Hàm Weierstrass $\wp$: Đây là hàm elliptic “đơn giản nhất” có cực bậc 2 tại mỗi điểm lưới:
    \[ \wp(z; \Lambda) = \frac{1}{z^2} + \sum_{\substack{\omega \in \Lambda \\ \omega \neq 0}} \left( \frac{1}{(z-\omega)^2} - \frac{1}{\omega^2} \right). \]
    $\wp$ tuần hoàn kép vì mỗi số hạng $\frac{1}{(z-\omega)^2}$ có tính đối xứng với lưới.
  2. Đạo hàm $\wp'$: $\wp'(z) = -2\sum_{\omega \in \Lambda} \frac{1}{(z-\omega)^3}$ cũng là hàm elliptic, có cực bậc 3 tại mỗi điểm lưới.
  3. Hằng số: Mọi hàm hằng đều tuần hoàn kép (nhưng tầm thường).

Kết quả quan trọng: Mọi hàm elliptic đối với $\Lambda$ đều là hàm hữu tỉ của $\wp$ và $\wp'$:

\[ \mathbb{C}(\Lambda) = \mathbb{C}(\wp, \wp'). \]
Tức $\wp$ và $\wp'$ “sinh ra” toàn bộ trường các hàm elliptic [silverman2009].

Ý nghĩa trực giác

Tuần hoàn kép vs tuần hoàn đơn. So sánh hai loại tuần hoàn:
  • Tuần hoàn đơn (một hướng): $\sin(z + 2\pi) = \sin(z)$. Hàm $\sin$ lặp lại theo một chu kỳ $2\pi$. Đồ thị “cuộn” quanh đường tròn $\mathbb{R}/(2\pi\mathbb{Z}) \cong S^1$.
  • Tuần hoàn kép (hai hướng): $\wp(z + \omega_1) = \wp(z)$ và $\wp(z + \omega_2) = \wp(z)$. Hàm $\wp$ lặp lại theo hai chu kỳ độc lập. Đồ thị “sống” trên torus $\mathbb{C}/\Lambda \cong T^2$.

Phép tương tự: hàm tuần hoàn đơn giống hoa văn sọc (lặp theo một hướng), còn hàm tuần hoàn kép giống hoa văn giấy dán tường (lặp theo hai hướng), tạo ra mẫu phủ kín mặt phẳng.

Tại sao gọi là “hàm elliptic”? Vì các hàm này lần đầu xuất hiện khi nghiên cứu tích phân elliptic (tính chu vi elip). Abel và Jacobi phát hiện rằng nghịch đảo của tích phân elliptic cho hàm tuần hoàn kép --- giống như $\sin$ là nghịch đảo của $\int \frac{dt}{\sqrt{1-t^2}}$ [silverman2009].

Liên hệ với giả thuyết Birch--Dyer

Hàm tuần hoàn kép trong BSD.
  • Cầu nối: Hàm $\wp$ và $\wp'$ cho phép đồng nhất $\mathbb{C}/\Lambda \xrightarrow{\sim} E(\mathbb{C})$ qua $z \mapsto (\wp(z), \wp'(z))$. Nhờ đó, mọi tính toán trên $E(\mathbb{C})$ có thể chuyển về tính toán với hàm tuần hoàn kép.
  • Chuỗi L: Hệ số $a_n$ của chuỗi $L(E, s) = \sum a_n n^{-s}$ liên quan đến hệ số Fourier của dạng modular $f_E(\tau)$, mà $f_E$ chính là hàm trên $\mathcal{H}$ thỏa tính chất tuần hoàn (modular).
  • Chiều cao: Chiều cao Néron--Tate $\hat{h}(P)$ có thể biểu diễn qua hàm sigma $\sigma(z; \Lambda)$ (liên quan đến $\wp$): $\hat{h}(P) \sim -\log|\sigma(z_P)|$.
52 Bất biến Eisenstein (Eisenstein invariants $g_2, g_3$) Ch.2 5

Định nghĩa

Định nghĩa (Bất biến Eisenstein). Cho lưới $\Lambda \subset \mathbb{C}$. Bất biến Eisenstein (Eisenstein invariants) $g_2$ và $g_3$ được định nghĩa bởi:
\[\begin{aligned} g_2 = g_2(\Lambda) &= 60 \sum_{\substack{\omega \in \Lambda \\ \omega \neq 0}} \omega^{-4}, \\ g_3 = g_3(\Lambda) &= 140 \sum_{\substack{\omega \in \Lambda \\ \omega \neq 0}} \omega^{-6}. \end{aligned}\]
Các chuỗi này hội tụ tuyệt đối (vì $\sum_{\omega \neq 0} |\omega|^{-k}$ hội tụ khi $k > 2$). Khi đó hàm $\wp$ thỏa phương trình vi phân:
\[ (\wp')^2 = 4\wp^3 - g_2 \wp - g_3, \]
tức đường cong elliptic tương ứng có phương trình Weierstrass $y^2 = 4x^3 - g_2 x - g_3$ [silverman2009].

Biệt thức: $\Delta(\Lambda) = g_2^3 - 27g_3^2 \neq 0$ (đảm bảo đường cong trơn).

$j$-bất biến: $j(\Lambda) = 1728\, \frac{g_2^3}{g_2^3 - 27g_3^2} = 1728\, \frac{g_2^3}{\Delta}$, phân loại đường cong đến đẳng cấu.

Ví dụ

Ví dụ (Tính $g_2, g_3$ cho lưới đặc biệt).
  1. Lưới Gauss $\Lambda = \mathbb{Z} + \mathbb{Z} i$: Do đối xứng bậc 4 ($i \cdot \Lambda = \Lambda$), ta có $g_3(\Lambda) = 0$ (các số hạng bậc 6 triệt tiêu do đối xứng). Nên phương trình trở thành $y^2 = 4x^3 - g_2 x$, tức dạng $y^2 = x^3 + ax$. Tính số: $g_2 \approx 189.07$, $j = 1728$.
  2. Lưới lục giác $\Lambda = \mathbb{Z} + \mathbb{Z}\zeta_3$ ($\zeta_3 = e^{2\pi i/3}$): Do đối xứng bậc 6 ($\zeta_3 \cdot \Lambda = \Lambda$), ta có $g_2(\Lambda) = 0$. Phương trình: $y^2 = 4x^3 - g_3$, tức dạng $y^2 = x^3 + b$. Ở đây $j = 0$.
  3. Lưới tổng quát: Với $\Lambda = \mathbb{Z} + \mathbb{Z}\tau$, cả $g_2$ và $g_3$ đều khác 0. Chúng phụ thuộc giải tích vào $\tau$ và liên hệ với chuỗi Eisenstein modular $E_4(\tau)$, $E_6(\tau)$:
    \[ g_2 = \frac{4\pi^4}{3} E_4(\tau), \quad g_3 = \frac{8\pi^6}{27} E_6(\tau). \]

Ý nghĩa trực giác

Bất biến Eisenstein mã hóa “hình dạng” lưới. $g_2$ và $g_3$ “đo” hình dạng của lưới $\Lambda$:
  • $g_2$ bắt thông tin “bậc 4” --- liên quan đến tính đối xứng vuông.
  • $g_3$ bắt thông tin “bậc 6” --- liên quan đến tính đối xứng lục giác.
  • Cùng nhau, $(g_2, g_3)$ xác định duy nhất lưới $\Lambda$ (đến hằng số tỉ lệ), tức xác định duy nhất đường cong elliptic.

Phép tương tự: giống như chiều dài cạnh $a$ và góc $\theta$ xác định hình bình hành, $g_2$ và $g_3$ xác định “hình bình hành cơ bản” của lưới.

Hệ số 60 và 140: Tại sao không dùng $\sum \omega^{-4}$ trực tiếp? Các hệ số 60 và 140 được chọn để phương trình vi phân $(\wp')^2 = 4\wp^3 - g_2\wp - g_3$ có dạng gọn nhất. Chúng đến từ khai triển Laurent: $\wp(z) = z^{-2} + \frac{g_2}{20}z^2 + \frac{g_3}{28}z^4 + \cdots$

Liên hệ với giả thuyết Birch--Dyer

$g_2, g_3$ trong BSD.
  • Xác định đường cong: Cho đường cong $E/\mathbb{Q}$ với conductor $N$, định lý modularity [wiles1995] cho dạng modular $f_E(\tau) = \sum a_n q^n$. Từ $f_E$ xây dựng lưới $\Lambda_E$, rồi $g_2(\Lambda_E), g_3(\Lambda_E)$ cho phương trình Weierstrass.
  • Chuỗi Eisenstein modular: $E_4(\tau)$ và $E_6(\tau)$ là dạng modular “cơ bản”. Mọi dạng modular (kể cả $f_E$ liên kết với đường cong elliptic) nằm trong không gian sinh bởi tích các $E_4, E_6$. Hàm $L(E, s)$ đến từ $f_E$, tức gián tiếp liên quan đến $g_2, g_3$.
  • Biệt thức và conductor: $\Delta = g_2^3 - 27g_3^2$ liên hệ (nhưng khác) biệt thức tối thiểu $\Delta_{\min}$. Conductor $N_E$ đo “mức độ xấu” của rút gọn, quyết định level của $f_E$ trong $S_2(\Gamma_0(N))$.
53 Chu kỳ thực (Real period $\Omega_E$) Ch.2 5

Định nghĩa

Định nghĩa (Chu kỳ thực). Cho đường cong elliptic $E/\mathbb{Q}$ với vi phân Néron $\omega$. Chu kỳ thực (real period) $\Omega_E$ được định nghĩa là:
\[ \Omega_E = \int_{E(\mathbb{R})} |\omega|, \]
trong đó tích phân lấy trên tất cả các thành phần liên thông của $E(\mathbb{R})$ [silverman2009, silverman1994].

Cụ thể hơn:

  • Nếu $\Delta_E < 0$: $E(\mathbb{R})$ có một thành phần liên thông, $\Omega_E = \omega_1$ (chu kỳ thực cơ bản).
  • Nếu $\Delta_E > 0$: $E(\mathbb{R})$ có hai thành phần liên thông (một nhánh “ngoài” và một “vòng trong”), $\Omega_E = 2\omega_1$.
Ở đây $\omega_1$ là chu kỳ thực dương nhỏ nhất: $\omega_1 = \int_{\alpha}^{\infty} \frac{dx}{\sqrt{4x^3 - g_2 x - g_3}}$ (với $\alpha$ là nghiệm thực lớn nhất).

Ví dụ

Ví dụ (Tính chu kỳ thực cho các đường cong cụ thể).
  1. $E: y^2 = x^3 - x$ (conductor $N = 32$): $\Delta = -64 < 0$, một thành phần. $\Omega_E = \int_{1}^{\infty} \frac{dx}{\sqrt{x^3 - x}} \approx 2.6221$.
  2. $E: y^2 = x^3 - x + 1$ (conductor $N = 37$): $\Delta \approx -1323 < 0$, một thành phần. $\Omega_E \approx 5.9869$.
  3. $E: y^2 + y = x^3 - x$ (conductor $N = 37$, nhãn 37a1): $\Delta < 0$, một thành phần. $\Omega_E \approx 5.9869$.
  4. $E: y^2 = x^3 + x^2 - 2x$: $\Delta > 0$, hai thành phần. $\Omega_E = 2\omega_1$ (gấp đôi so với khi chỉ tính một nhánh).

Ý nghĩa trực giác

Chu kỳ thực đo “kích thước” của $E$ trên $\mathbb{R}$. $\Omega_E$ đo “chu vi thực” của đường cong elliptic:
  • Trong mô hình torus $\mathbb{C}/\Lambda$, phần thực $E(\mathbb{R})$ tương ứng với các đường thẳng ngang (hoặc ngang + dọc) trong miền cơ bản. $\Omega_E$ là tổng “chiều dài” của các đường này.
  • Phép tương tự: giống như $2\pi r$ là chu vi đường tròn bán kính $r$, $\Omega_E$ là “chu vi” của đường cong elliptic nhìn trên trường số thực.
  • Đường cong “to” (tọa độ lớn) có $\Omega_E$ lớn; đường cong “nhỏ” có $\Omega_E$ nhỏ.

$\Omega_E$ phụ thuộc vào lựa chọn phương trình (phương trình tối thiểu $\Leftrightarrow$ vi phân Néron), nên trong BSD ta luôn dùng phương trình tối thiểu toàn cục.

Liên hệ với giả thuyết Birch--Dyer

Chu kỳ thực trong BSD. $\Omega_E$ là thành phần không thể thiếu trong công thức BSD mạnh:
  • BSD mạnh (hạng 0): $L(E, 1) = \dfrac{|\mathrm{Sha}(E/\mathbb{Q})| \cdot \Omega_E \cdot \prod_p c_p}{|E(\mathbb{Q})_{\mathrm{tors}}|^2}$.
  • BSD mạnh (hạng 1): $L'(E, 1) = \dfrac{|\mathrm{Sha}(E/\mathbb{Q})| \cdot \hat{h}(P) \cdot \Omega_E \cdot \prod_p c_p}{|E(\mathbb{Q})_{\mathrm{tors}}|^2}$.
  • Kiểm nghiệm: Với $E = 37a1$: $L(E,1) = 0$ (hạng 1), $L'(E,1) \approx 0.3059$, $\Omega_E \approx 5.9869$. Thay vào công thức BSD mạnh và kiểm tra: tất cả khớp với $|\mathrm{Sha}| = 1$ [cremona1997].
  • Vai trò “chuẩn hóa”: $\Omega_E$ đóng vai trò thừa số chuẩn hóa --- nó chuyển đổi giữa “thể tích giải tích” (từ hàm $L$) và “thể tích số học” (từ các bất biến đại số của $E$).
54 Vi phân Néron (Néron differential) Ch.5 6

Định nghĩa

Định nghĩa (Vi phân Néron). Cho đường cong elliptic $E/\mathbb{Q}$ với phương trình Weierstrass tổng quát
\[ y^2 + a_1 xy + a_3 y = x^3 + a_2 x^2 + a_4 x + a_6. \]
Vi phân Néron (Néron differential) là 1-dạng vi phân holomorphic (khắp nơi hữu hạn):
\[ \omega_E = \frac{dx}{2y + a_1 x + a_3} \]
liên kết với mô hình Néron tối thiểu của $E$ trên $\mathbb{Z}$ [neron1965, silverman2009].

Nếu dùng phương trình Weierstrass rút gọn $y^2 = x^3 + Ax + B$, thì:

\[ \omega_E = \frac{dx}{2y}. \]

Vi phân Néron là duy nhất đến hằng số $\pm 1$ (tương ứng với phép đổi $y \mapsto -y$). Tính duy nhất này rất quan trọng: nó đảm bảo $\Omega_E$ được xác định rõ ràng.

Ví dụ

Ví dụ (Vi phân Néron của các đường cong cụ thể).
  1. $E: y^2 = x^3 - x$: Vi phân Néron $\omega = \frac{dx}{2y}$. Đây là phương trình tối thiểu toàn cục (các $a_i \in \mathbb{Z}$, biệt thức $\Delta = -64$ có $|v_p(\Delta)|$ tối thiểu).
  2. $E: y^2 + y = x^3 - x$ (37a1): Vi phân Néron $\omega = \frac{dx}{2y + 1}$ (chú ý mẫu số có thêm $a_3 = 1$). Đây là phương trình tối thiểu với $\Delta = -37$ (nguyên tố!).
  3. Phương trình không tối thiểu: Nếu ta viết $E': Y^2 = X^3 - 16X$ (đổi biến $x = X/4, y = Y/8$ từ $y^2 = x^3 - x$), thì $\frac{dX}{2Y}$ không phải vi phân Néron vì phương trình không tối thiểu. Vi phân Néron thực sự là $\omega = \frac{dx}{2y} = \frac{1}{4}\cdot\frac{dX}{2Y}$ (có thừa số $1/4$).

Ý nghĩa trực giác

Vi phân Néron --- “thước đo chuẩn” trên đường cong. Vi phân Néron $\omega_E = \frac{dx}{2y}$ là “thước đo” (measure) tự nhiên nhất trên đường cong elliptic:
  • Thước đo trên đường tròn: Trên đường tròn $x^2 + y^2 = 1$, thước đo tự nhiên là $d\theta = \frac{dx}{y} = \frac{dx}{\sqrt{1-x^2}}$. Tích phân $\int_0^{2\pi} d\theta = 2\pi$ cho chu vi.
  • Thước đo trên EC: Tương tự, trên $E: y^2 = f(x)$, thước đo tự nhiên là $\frac{dx}{2y} = \frac{dx}{2\sqrt{f(x)}}$. Tích phân $\int_{E(\mathbb{R})} |\omega_E| = \Omega_E$ cho “chu vi” của $E$.
  • Tại sao “Néron”? Néron [neron1965] chỉ ra rằng trong tất cả các phép đổi biến có thể, có đúng một vi phân (đến $\pm 1$) mà “mở rộng tốt” đến mô hình trên $\mathbb{Z}$ --- tức “smooth” tại mọi số nguyên tố. Đây là vi phân Néron.

Liên hệ với giả thuyết Birch--Dyer

Vi phân Néron trong BSD. Vi phân Néron đóng vai trò then chốt trong công thức BSD mạnh:
  • Chu kỳ thực: $\Omega_E = \int_{E(\mathbb{R})} |\omega_E|$ --- tích phân vi phân Néron trên phần thực. Thay đổi phương trình (không tối thiểu) sẽ thay đổi $\Omega_E$ bằng lũy thừa, làm sai công thức BSD.
  • Hằng số Manin: Tham số hóa modular $\phi\colon X_0(N) \to E$ kéo vi phân Néron về: $\phi^*(\omega_E) = c_\infty \cdot 2\pi i f_E(\tau) d\tau$, trong đó $c_\infty \in \mathbb{Z} \setminus \{0\}$ là hằng số Manin. Phỏng đoán Manin: $c_\infty = \pm 1$ cho phương trình tối thiểu tối ưu [cremona1997].
  • Số Tamagawa: Số Tamagawa $c_p = [E(\mathbb{Q}_p) : E^0(\mathbb{Q}_p)]$ cũng liên quan đến vi phân Néron tại $p$: chúng đo “thể tích” của thành phần đơn vị $E^0(\mathbb{Q}_p)$ so với toàn bộ $E(\mathbb{Q}_p)$ dưới vi phân Néron.
  • Công thức BSD mạnh đầy đủ: Mỗi thừa số trong
    \[ \frac{L^{(r)}(E, 1)}{r!} = \frac{|\mathrm{Sha}| \cdot \mathrm{Reg}_E \cdot \Omega_E \cdot \prod_p c_p}{|E(\mathbb{Q})_{\mathrm{tors}}|^2} \]
    đều phụ thuộc (trực tiếp hoặc gián tiếp) vào lựa chọn vi phân Néron. Đây là lý do ta bắt buộc dùng phương trình tối thiểu.
55 Lưới chu kỳ (Period lattice) Ch.5 5

Định nghĩa

Định nghĩa (Lưới chu kỳ). Cho đường cong elliptic $E/\mathbb{Q}$ (hoặc tổng quát hơn, $E/\mathbb{C}$). Lưới chu kỳ (period lattice) $\Lambda_E$ của $E$ là lưới trong $\mathbb{C}$ xác định bởi các tích phân:
\[ \Lambda_E = \left\{ \int_\gamma \omega_E \;\bigg|\; \gamma \in H_1(E(\mathbb{C}), \mathbb{Z}) \right\}, \]
trong đó $\omega_E = \frac{dx}{2y + a_1 x + a_3}$ là vi phân Néron và $H_1(E(\mathbb{C}), \mathbb{Z}) \cong \mathbb{Z}^2$ là nhóm đồng điều bậc nhất (gồm hai “vòng” sinh độc lập trên torus) [silverman2009].

Cụ thể, chọn hai vòng sinh $\gamma_1, \gamma_2$ trên $E(\mathbb{C}) \cong T^2$:

\[ \omega_1 = \int_{\gamma_1} \omega_E, \quad \omega_2 = \int_{\gamma_2} \omega_E, \quad \Lambda_E = \mathbb{Z}\omega_1 + \mathbb{Z}\omega_2. \]
Khi đó $\omega_1 \in \mathbb{R}_{>0}$ (chu kỳ thực) và $\Im(\omega_2) > 0$.

Ví dụ

Ví dụ (Lưới chu kỳ cụ thể).
  1. $E: y^2 = x^3 - x$ (conductor 32, CM bởi $\mathbb{Z}[i]$):
    \[ \omega_1 = \int_1^{\infty} \frac{dx}{\sqrt{x^3 - x}} \approx 2.6221, \quad \omega_2 = i\omega_1 \approx 2.6221i. \]
    Lưới $\Lambda_E = \mathbb{Z}\omega_1 + \mathbb{Z}(i\omega_1)$ là lưới vuông --- phản ánh nhân phức $\mathrm{End}(E) \cong \mathbb{Z}[i]$.
  2. $E: y^2 + y = x^3 - x$ (37a1): $\omega_1 \approx 5.9869$, $\omega_2 \approx 0.9294 + 0.9816i$. Lưới $\Lambda_E$ không có đối xứng đặc biệt ($\mathrm{End}(E) = \mathbb{Z}$, không CM).
  3. $E: y^2 = x^3 + 1$ (conductor 36, CM bởi $\mathbb{Z}[\zeta_3]$): Lưới $\Lambda_E$ là lưới lục giác --- phản ánh nhân phức $\mathrm{End}(E) \cong \mathbb{Z}[\zeta_3]$.

Ý nghĩa trực giác

Lưới chu kỳ = “DNA” giải tích của đường cong. Lưới chu kỳ $\Lambda_E$ mã hóa toàn bộ thông tin giải tích phức của đường cong:
  • Uniformization: Định lý uniformization khẳng định $E(\mathbb{C}) \cong \mathbb{C}/\Lambda_E$. Lưới chu kỳ chính là “cầu nối” giữa phương trình đại số $y^2 = x^3 + Ax + B$ và hình xuyến $\mathbb{C}/\Lambda_E$.
  • Tại sao gọi “chu kỳ”? Giống như $\sin(x)$ có chu kỳ $2\pi = \int_0^{2\pi} d\theta$, hàm $\wp(z; \Lambda_E)$ có hai chu kỳ $\omega_1, \omega_2$, mỗi chu kỳ là tích phân vi phân Néron trên một vòng của torus.
  • Hình dạng lưới $\Leftrightarrow$ hình dạng đường cong: Lưới vuông $\Leftrightarrow$ CM bởi $\mathbb{Z}[i]$, lưới lục giác $\Leftrightarrow$ CM bởi $\mathbb{Z}[\zeta_3]$, lưới “lệch” $\Leftrightarrow$ không CM (trường hợp phổ biến).

Liên hệ với giả thuyết Birch--Dyer

Lưới chu kỳ trong BSD.
  • Chu kỳ thực: $\Omega_E$ trong công thức BSD chính là tích phân trên thành phần thực của $\mathbb{C}/\Lambda_E$. Nếu $\Delta < 0$: $\Omega_E = \omega_1$; nếu $\Delta > 0$: $\Omega_E = 2\omega_1$.
  • Modularity $\Leftrightarrow$ lưới: Định lý modularity [wiles1995] nói rằng $\Lambda_E$ “đến từ” dạng modular: $\omega_i = c \cdot \int_{\tau_0}^{\tau_i} f_E(\tau) d\tau$ với $f_E \in S_2(\Gamma_0(N))$.
  • Regulator: Ma trận chiều cao Néron--Tate $\mathrm{Reg}_E = \det(\langle P_i, P_j \rangle)$ đo “thể tích” lưới Mordell--Weil. Cùng với $\Omega_E$ (đo “thể tích” lưới chu kỳ), chúng tạo thành hai thừa số “thể tích” trong BSD mạnh.
56 Nửa mặt phẳng trên (Upper half-plane $\mathcal{H}$) Ch.2 3

Định nghĩa

Định nghĩa (Nửa mặt phẳng trên). Nửa mặt phẳng trên (upper half-plane) là tập:
\[ \mathcal{H} = \{ \tau \in \mathbb{C} \mid \Im(\tau) > 0 \}, \]
tức nửa trên của mặt phẳng phức (các số phức có phần ảo dương) [diamond-shurman2005].

$\mathcal{H}$ có nhiều cấu trúc quan trọng:

  • Nhóm $\mathrm{SL}_2(\mathbb{Z})$ tác động: Nhóm modular $\mathrm{SL}_2(\mathbb{Z})$ tác động lên $\mathcal{H}$ qua phép biến đổi Möbius:
    \[ \begin{pmatrix} a & b \\ c & d \end{pmatrix} \cdot \tau = \frac{a\tau + b}{c\tau + d}, \quad \begin{pmatrix} a & b \\ c & d \end{pmatrix} \in \mathrm{SL}_2(\mathbb{Z}). \]
  • Metric Poincaré: $ds^2 = \frac{dx^2 + dy^2}{y^2}$ (với $\tau = x + iy$), biến $\mathcal{H}$ thành mô hình hình học hyperbolic.
  • Miền cơ bản: $\mathcal{F} = \{\tau \in \mathcal{H} : |\tau| \geq 1, \, |\Re(\tau)| \leq 1/2\}$ là miền cơ bản cho tác động $\mathrm{SL}_2(\mathbb{Z}) \curvearrowright \mathcal{H}$.

Ví dụ

Ví dụ (Các điểm đặc biệt trong $\mathcal{H}$).
  1. $\tau = i$: Lưới $\Lambda = \mathbb{Z} + \mathbb{Z} i$ (vuông). Đường cong $E: y^2 = x^3 - x$ với $j = 1728$. Đây là điểm bất động của $\tau \mapsto -1/\tau$, có stabilizer $\mathbb{Z}/4\mathbb{Z}$.
  2. $\tau = e^{2\pi i/3} = \frac{-1 + i\sqrt{3}}{2}$: Lưới lục giác. Đường cong $E: y^2 = x^3 + 1$ với $j = 0$. Có stabilizer $\mathbb{Z}/6\mathbb{Z}$ --- đây là điểm có đối xứng cao nhất.
  3. $\tau = 2i$: Lưới $\mathbb{Z} + 2i\mathbb{Z}$ (hình chữ nhật). Đường cong CM bởi $\mathbb{Z}[\sqrt{-4}] = \mathbb{Z}[2i]$.
  4. $\tau = \frac{-1 + i\sqrt{163}}{2}$: Liên hệ đến “số gần nguyên” nổi tiếng $e^{\pi\sqrt{163}} \approx 640320^3 + 744$. Đường cong CM bởi $\mathbb{Z}[\frac{-1 + i\sqrt{163}}{2}]$ có vai trò trong lý thuyết trường lớp.

Ý nghĩa trực giác

$\mathcal{H}$ --- “không gian tham số” của lưới. $\mathcal{H}$ có thể hiểu đơn giản là không gian các hình dạng lưới:
  • Mỗi $\tau \in \mathcal{H}$ cho một lưới $\Lambda_\tau = \mathbb{Z} + \mathbb{Z}\tau$, tức một đường cong elliptic.
  • Hai điểm $\tau, \tau'$ cho cùng đường cong $\Leftrightarrow$ $\tau' = \frac{a\tau + b}{c\tau + d}$ cho $\begin{pmatrix} a & b \\ c & d \end{pmatrix} \in \mathrm{SL}_2(\mathbb{Z})$.
  • Do đó: không gian moduli $\mathcal{H}/\mathrm{SL}_2(\mathbb{Z})$ phân loại tất cả đường cong elliptic trên $\mathbb{C}$ (đến đẳng cấu), và $j$-bất biến cho đồng cấu $\mathcal{H}/\mathrm{SL}_2(\mathbb{Z}) \xrightarrow{\sim} \mathbb{C}$.

Phép tương tự: giống như mỗi góc $\theta \in (0°, 180°)$ xác định “hình dạng” của một tam giác cân, mỗi $\tau \in \mathcal{H}$ xác định “hình dạng” của một lưới (tức một đường cong elliptic).

Liên hệ với giả thuyết Birch--Dyer

$\mathcal{H}$ trong BSD.
  • Dạng modular sống trên $\mathcal{H}$: Dạng modular $f_E(\tau) = \sum a_n q^n$ ($q = e^{2\pi i \tau}$) liên kết với $E$ qua modularity [wiles1995] là hàm trên $\mathcal{H}$. Hàm $L(E, s)$ chính là biến đổi Mellin của $f_E$.
  • Đường cong modular: $X_0(N) = \mathcal{H}^*/\Gamma_0(N)$ (với $\Gamma_0(N) \subset \mathrm{SL}_2(\mathbb{Z})$) là đường cong đại số. Tham số hóa modular $\phi: X_0(N) \to E$ kết nối hình học của $\mathcal{H}$ với đường cong elliptic.
  • Điểm Heegner: Điểm CM $\tau_K \in \mathcal{H}$ (thỏa $a\tau_K^2 + b\tau_K + c = 0$ với $b^2 - 4ac = D_K < 0$) cho điểm trên $X_0(N)$, từ đó cho điểm hữu tỉ $P_K \in E(K)$ qua $\phi$. Đây là công cụ chính trong chứng minh Gross--Zagier [gross-zagier1986].
  • BSD $p$-adic: Dạng modular quá tải $p$-adic (overconvergent $p$-adic modular form) sống trên phiên bản $p$-adic của $\mathcal{H}$, liên quan đến hàm $L$ $p$-adic trong BSD $p$-adic.
57 Định lý Mordell–Weil (Mordell–Weil Theorem) Ch.1 5

Định nghĩa

Định lý (Mordell--Weil, 1922/1928). Cho $E/\mathbb{Q}$ là đường cong elliptic. Khi đó nhóm các điểm hữu tỉ $E(\mathbb{Q})$ là nhóm Abel hữu hạn sinh:
\[ E(\mathbb{Q}) \cong \mathbb{Z}^r \oplus E(\mathbb{Q})_{\mathrm{tors}}, \]
trong đó:
  • $r = \mathrm{rk}(E/\mathbb{Q}) \geq 0$ là hạng (rank) của $E$.
  • $E(\mathbb{Q})_{\mathrm{tors}}$ là nhóm con xoắn (torsion subgroup), gồm các điểm $P$ với $nP = \mathcal{O}$ cho $n > 0$ nào đó.

Tổng quát hơn, cho $K$ là trường số và $A/K$ là đa tạp Abel chiều $g$, thì $A(K)$ là nhóm Abel hữu hạn sinh [mordell1922, weil1928].

Lịch sử

Từ Mordell đến Weil. 1922: Louis Joel Mordell (giáo sư tại Manchester) chứng minh kết quả cho $E/\mathbb{Q}$. Phương pháp dựa trên hai ý tưởng: (1) nhóm thương $E(\mathbb{Q})/2E(\mathbb{Q})$ là hữu hạn, và (2) “hạ xuống vô hạn” (infinite descent) bằng hàm chiều cao.

1928: André Weil, mới 22 tuổi, trong luận văn tiến sĩ viết dưới sự hướng dẫn của Hadamard, mở rộng cho mọi trường số $K$ và mọi đa tạp Abel [weil1928]. Luận văn này được coi là một trong những luận văn vĩ đại nhất lịch sử toán học.

Phương pháp hiện đại: xem [silverman2009, silverman-tate2015].

Ví dụ

Ví dụ (Cấu trúc Mordell--Weil cho các đường cong cụ thể).
  1. Hạng 0: $E: y^2 = x^3 + 1$. $E(\mathbb{Q}) \cong \mathbb{Z}/6\mathbb{Z}$ (chỉ có 6 điểm hữu tỉ: $\mathcal{O}$, $(-1, 0)$, $(0, \pm 1)$, $(2, \pm 3)$). $r = 0$, $E(\mathbb{Q})_{\mathrm{tors}} \cong \mathbb{Z}/6\mathbb{Z}$.
  2. Hạng 1: $E: y^2 + y = x^3 - x$ (37a1). $E(\mathbb{Q}) \cong \mathbb{Z}$ với điểm sinh $P = (0, 0)$. Các bội: $2P = (1, -1)$, $3P = (-1, -1)$, $4P = (2, -3)$, \ldots\ Mọi điểm hữu tỉ trên $E$ đều là bội của $P$.
  3. Hạng 2: $E: y^2 = x^3 - 4x + 4$. $E(\mathbb{Q}) \cong \mathbb{Z}^2$ với hai điểm sinh độc lập.
  4. Hạng cao: Đường cong do Elkies tìm (2006) có $r \geq 28$ --- kỷ lục hiện tại [elkies2006].

Ý nghĩa trực giác

Hữu hạn sinh --- ý nghĩa thực sự. “$E(\mathbb{Q})$ hữu hạn sinh” có nghĩa: dù tập $E(\mathbb{Q})$ có thể vô hạn, ta luôn tìm được hữu hạn điểm “gốc” sao cho mọi điểm hữu tỉ khác đều thu được bằng phép cộng lặp lại các điểm gốc.
  • Phép tương tự: giống như mọi số nguyên đều là tổ hợp tuyến tính của $\{1\}$ (nhóm $\mathbb{Z}$ có 1 phần tử sinh), nhóm $E(\mathbb{Q})$ có $r + \text{(vài phần tử xoắn)}$ phần tử sinh.
  • Hạng $r$ đo “độ phong phú”: $r = 0$ nghĩa là $E(\mathbb{Q})$ hữu hạn (“nghèo”); $r = 1$ nghĩa là $E(\mathbb{Q})$ có một dãy vô hạn điểm trên một “hướng”; $r = 2$ có hai “hướng” độc lập, v.v.

Cấu trúc chứng minh

Hai bước chứng minh Mordell--Weil. Bước 1 --- Mordell--Weil yếu: Chứng minh $E(\mathbb{Q})/mE(\mathbb{Q})$ hữu hạn (thường $m = 2$). Sử dụng dãy chính xác Kummer:
\[ 0 \to E(\mathbb{Q})/mE(\mathbb{Q}) \to \mathrm{Sel}^{(m)}(E/\mathbb{Q}) \to \mathrm{Sha}(E/\mathbb{Q})[m] \to 0, \]
trong đó nhóm Selmer $\mathrm{Sel}^{(m)}$ là hữu hạn (có thể tính được).

Bước 2 --- Descent bằng chiều cao: Cho $P \in E(\mathbb{Q})$, viết $P = mP_1 + Q_i$ ($Q_i$ đại diện lớp). Chiều cao $h(P_1) < h(P)/m^2 + C$, nên lặp lại sẽ giảm chiều cao. Vì chỉ có hữu hạn điểm dưới mỗi mức chiều cao, quá trình dừng.

Kết luận: Tập sinh = các đại diện $\{Q_i\}$ $\cup$ điểm có chiều cao nhỏ.

Liên hệ với giả thuyết Birch--Dyer

Mordell--Weil và BSD. Định lý Mordell--Weil là nền tảng cho phát biểu BSD:
  • BSD yếu: $\mathrm{ord}_{s=1} L(E, s) = \mathrm{rk}(E/\mathbb{Q}) = r$. Hạng $r$ trong Mordell--Weil chính là đại lượng mà BSD dự đoán bằng bậc triệt tiêu hàm $L$.
  • BSD mạnh: Regulator $\mathrm{Reg}_E = \det(\langle P_i, P_j \rangle)$ tính từ $r$ điểm sinh $P_1, \ldots, P_r$ của phần tự do $\mathbb{Z}^r$.
  • Hạn chế: Chứng minh Mordell--Weil không cho biết $r$ là bao nhiêu! Nó chỉ nói $r$ hữu hạn. BSD là “câu trả lời” cho câu hỏi “$r$ bằng bao nhiêu?” --- thông qua hàm $L$.
  • Kết quả đã biết: Nếu $\mathrm{ord}_{s=1} L(E, s) \leq 1$, thì $r = \mathrm{ord}_{s=1} L(E, s)$ (Gross--Zagier, Kolyvagin [gross-zagier1986, kolyvagin1990]).
58 Định lý Mazur (phần xoắn) (Mazur's Torsion Theorem) Ch.3 6

Định nghĩa

Định lý (Mazur, 1977). Cho $E/\mathbb{Q}$ là đường cong elliptic. Khi đó nhóm con xoắn $E(\mathbb{Q})_{\mathrm{tors}}$ đẳng cấu với đúng một trong 15 nhóm sau [mazur1977]:
  1. Cyclic: $\mathbb{Z}/n\mathbb{Z}$ với $n \in \{1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 12\}$ (11 nhóm);
  2. Không cyclic: $\mathbb{Z}/2\mathbb{Z} \oplus \mathbb{Z}/2m\mathbb{Z}$ với $m \in \{1, 2, 3, 4\}$ (4 nhóm).
Mỗi nhóm trong danh sách trên đều thực sự xảy ra cho ít nhất một đường cong.

Đặc biệt: $n = 11$ không xuất hiện! Không tồn tại đường cong $E/\mathbb{Q}$ nào có điểm xoắn bậc 11.

Ví dụ

Ví dụ (Ví dụ cho mỗi loại nhóm xoắn).
  1. Tầm thường ($E(\mathbb{Q})_{\mathrm{tors}} = \{0\}$): $y^2 = x^3 - 2$. Không có điểm hữu tỉ nào ngoài $\mathcal{O}$.
  2. $\mathbb{Z}/2\mathbb{Z}$: $y^2 = x^3 + 8$. Điểm xoắn bậc 2: $(-2, 0)$ (vì $y = 0$).
  3. $\mathbb{Z}/5\mathbb{Z}$: $y^2 + y = x^3 - x$ (37a1). Điểm xoắn bậc 5: $(0, 0)$ với $5 \cdot (0,0) = \mathcal{O}$. (Thực ra đường cong này có $E(\mathbb{Q})_{\mathrm{tors}} = \{0\}$, nhưng trên $\mathbb{Q}(\sqrt{5})$ có điểm xoắn bậc 5.)
  4. $\mathbb{Z}/6\mathbb{Z}$: $y^2 = x^3 + 1$. Có 6 điểm hữu tỉ, tất cả đều xoắn.
  5. $\mathbb{Z}/2\mathbb{Z} \oplus \mathbb{Z}/2\mathbb{Z}$: $y^2 = x^3 - x = x(x-1)(x+1)$. Ba điểm bậc 2: $(0,0)$, $(1,0)$, $(-1,0)$.

Ý nghĩa trực giác

Tại sao phần xoắn bị chặn?. Kết quả Mazur có thể hiểu qua hình học:
  • Điểm xoắn bậc $n$ trên $E$ tương ứng với điểm hữu tỉ trên đường cong modular $X_1(n)$.
  • Đường cong $X_1(n)$ có genus tăng theo $n$. Khi genus $g \geq 2$, định lý Faltings nói rằng $X_1(n)(\mathbb{Q})$ hữu hạn.
  • Cụ thể: $X_1(n)$ có genus $\geq 2$ khi $n \geq 13$ ($n$ nguyên tố) hoặc $n$ đủ lớn nói chung. Với $n = 11$, $X_1(11)$ có genus 1 nhưng $X_1(11)(\mathbb{Q})$ chỉ có các điểm cusp --- không cho đường cong elliptic thực sự.

Nói đơn giản: “tìm điểm xoắn bậc $n$ lớn” trở nên “khó” theo nghĩa hình học đại số --- không gian tham số quá “phức tạp” để chứa điểm hữu tỉ.

Liên hệ với giả thuyết Birch--Dyer

Mazur torsion trong BSD.
  • Mẫu số BSD: Trong công thức BSD mạnh, $|E(\mathbb{Q})_{\mathrm{tors}}|^2$ xuất hiện ở mẫu số:
    \[ \frac{L^{(r)}(E, 1)}{r!} = \frac{|\mathrm{Sha}| \cdot \mathrm{Reg}_E \cdot \Omega_E \cdot \prod_p c_p}{|E(\mathbb{Q})_{\mathrm{tors}}|^2}. \]
    Nhờ Mazur, ta biết chính xác $|E(\mathbb{Q})_{\mathrm{tors}}|$ là bao nhiêu (có thể tính bằng thuật toán).
  • Tính toán được: Không giống hạng $r$ (rất khó tính), phần xoắn có thể tính chính xác bằng thuật toán Lutz--Nagell hoặc modular symbols. Đây là thành phần “dễ” nhất trong BSD mạnh.
  • Liên hệ Mazur--modularity: Chứng minh của Mazur sử dụng mô hình Néron trên $X_0(N)$ --- cùng đối tượng mà Wiles sau này dùng để chứng minh modularity. Mazur (1977) mở đường cho Ribet (1990) và Wiles (1995).
59 Phỏng đoán Ogg (Ogg's Conjecture) Ch.3 5

Định nghĩa

Giả thiết (Ogg, 1971 --- nay là Định lý Mazur). Phỏng đoán Ogg (Ogg's conjecture) (1971) phát biểu rằng: các số nguyên tố $p$ sao cho tồn tại đường cong elliptic $E/\mathbb{Q}$ với điểm xoắn hữu tỉ bậc $p$ chính xác là $p \in \{2, 3, 5, 7\}$.

Tổng quát hơn, danh sách đầy đủ 15 nhóm xoắn khả thi là danh sách trong Định lý Mazur. Phỏng đoán đã được chứng minh bởi Mazur (1977) [mazur1977].

Lịch sử

Sự trùng hợp đáng kinh ngạc của Ogg. Câu chuyện bắt đầu với nhà toán học Ý Beppo Levi (đầu thế kỷ 20), người đầu tiên nghiên cứu hệ thống các nhóm xoắn khả thi.

Năm 1971, Andrew Ogg nhận thấy sự trùng hợp bí ẩn: các số nguyên tố $p$ sao cho $X_0(p)$ có genus 0 là $\{2, 3, 5, 7, 13\}$. Trong đó, các $p \leq 7$ chính xác là các số nguyên tố có điểm xoắn bậc $p$ trên đường cong elliptic trên $\mathbb{Q}$. Ogg phỏng đoán rằng “không còn gì nữa” --- tức 15 nhóm trong danh sách là tất cả.

Vào thập niên 1960--70, nhiều trường hợp được xử lý lẻ tẻ: Billing, Mahler, Cassels, và đặc biệt Kubert loại trừ được một số nhóm. Nhưng chứng minh đầy đủ phải đợi đến công trình 153 trang của Mazur (1977), sử dụng hình học đại số tinh vi trên đường cong modular $X_0(N)$ [mazur1977].

Ý nghĩa trực giác

Vì sao phỏng đoán Ogg quan trọng?.
  • Hình ảnh hoàn chỉnh: Phỏng đoán Ogg (nay là Định lý Mazur) cho ta bức tranh hoàn toàn về phần xoắn --- không còn bất kỳ sự bất định nào. Đây là điều hiếm có trong lý thuyết số.
  • Kết nối hai thế giới: Ogg nhận ra mối liên hệ giữa điểm xoắn trên $E$ (đại số) và genus của $X_0(p)$ (hình học). Đây là một trong những manh mối sớm nhất cho chương trình Langlands --- rằng các đối tượng số học và đối tượng automorphic liên hệ chặt chẽ.
  • Mồi cho modularity: Chứng minh Mazur sử dụng lược đồ Néron và đường cong modular --- đây chính là “hộp công cụ” mà Ribet (1990) dùng để chứng minh “Shimura--Taniyama $\Rightarrow$ Fermat cuối”, và Wiles (1995) dùng để chứng minh modularity.

Liên hệ với giả thuyết Birch--Dyer

Phỏng đoán Ogg và BSD.
  • Thành phần tính được: Nhờ Mazur giải quyết phỏng đoán Ogg, ta biết $|E(\mathbb{Q})_{\mathrm{tors}}|$ luôn nằm trong tập $\{1, 2, \ldots, 10, 12, 16\}$. Điều này giúp kiểm nghiệm số học BSD mạnh: thay vì đối mặt với $|E(\mathbb{Q})_{\mathrm{tors}}|$ bất kỳ, ta chỉ cần xử lý 15 trường hợp.
  • Phương pháp Mazur $\to$ phương pháp BSD: Kỹ thuật Mazur (phân tích đường cong modular, mô hình Néron, Eisenstein ideal) được phát triển thêm bởi Skinner--Urban để chứng minh các trường hợp đặc biệt của BSD mạnh.
  • Analog BSD cho đa tạp Abel: Phiên bản tổng quát hóa phỏng đoán Ogg cho trường số (uniform boundedness, Merel 1996) liên quan đến BSD cho đa tạp Abel chiều cao.
60 Định lý chặn đều Merel (Merel's Uniform Boundedness) Ch.3 7

Định nghĩa

Định lý (Merel, 1996). Cho $d \geq 1$ là số nguyên dương. Khi đó tồn tại hằng số $B(d)$ sao cho: với mọi trường số $K$ bậc $[K:\mathbb{Q}] = d$ và mọi đường cong elliptic $E/K$, bậc của mọi điểm xoắn trong $E(K)_{\mathrm{tors}}$ bị chặn bởi $B(d)$ [merel1996].

Nói cách khác:

\[ \forall\, E/K \text{ với } [K:\mathbb{Q}] = d: \quad |E(K)_{\mathrm{tors}}| \leq B(d). \]

Trường hợp đặc biệt:

  • $d = 1$ ($K = \mathbb{Q}$): Đây chính là Định lý Mazur với $B(1) = 16$ (nhóm $\mathbb{Z}/2\mathbb{Z} \oplus \mathbb{Z}/8\mathbb{Z}$ có 16 phần tử).
  • $d = 2$: Kamienny (1992) và Kenku--Momose (1988) phân loại đầy đủ --- có 26 nhóm xoắn khả thi.
  • $d$ lớn: Cận $B(d)$ tốt nhất hiện biết rất lớn so với thực tế.

Lịch sử

Hành trình từ Mazur đến Merel. Sau khi Mazur giải quyết trường hợp $K = \mathbb{Q}$ (1977), câu hỏi tự nhiên là: Có analogue cho trường số tổng quát không?

1992: Sheldon Kamienny mở rộng phương pháp Mazur cho trường bậc 2.

1988--1992: Kenku--Momose hoàn thành phân loại cho bậc 2.

1996: Loïc Merel (Université Paris 7), khi mới 31 tuổi, chứng minh kết quả cho mọi bậc $d$ [merel1996]. Đây là đột phá lớn vì phương pháp Mazur dựa trên tính chất cụ thể của $X_0(N)/\mathbb{Q}$, trong khi Merel cần kỹ thuật hoàn toàn mới cho trường tổng quát.

Ý tưởng chính: Merel sử dụng “winding quotient” và phương pháp đại số giao hoán trên Jacobian của đường cong modular, kết hợp kết quả của Kolyvagin--Logachev.

Ví dụ

Ví dụ (Xoắn lớn trên trường mở rộng).
  1. Bậc 2: Trên $\mathbb{Q}(\sqrt{-1})$, đường cong $y^2 = x^3 + 1$ có điểm xoắn bậc 6 (như trên $\mathbb{Q}$). Nhưng trên $\mathbb{Q}(\sqrt{-3})$, cùng đường cong có $E(\mathbb{Q}(\sqrt{-3}))_{\mathrm{tors}} \cong \mathbb{Z}/6\mathbb{Z} \oplus \mathbb{Z}/2\mathbb{Z}$ (12 điểm!).
  2. Bậc 3: Tồn tại đường cong trên trường bậc 3 với xoắn bậc 13 hoặc 18 --- vượt xa giới hạn Mazur cho $\mathbb{Q}$.
  3. Tổng quát: Khi bậc $d$ tăng, nhóm xoắn có thể lớn hơn, nhưng luôn bị chặn. Phỏng đoán (chưa chứng minh): $B(d)$ tăng theo lũy thừa bậc nhỏ của $d$.

Ý nghĩa trực giác

Vì sao “chặn đều” khó hơn Mazur?.
  • Mazur: Cố định $K = \mathbb{Q}$. Chỉ cần phân tích một $X_0(N)/\mathbb{Q}$. Hữu hạn trường hợp cần kiểm tra.
  • Merel: Cho mọi $K$ bậc $d$. Có vô hạn trường số bậc $d$ khác nhau, mỗi trường cho phép nhóm xoắn khác. Cần đối số “đồng nhất” không phụ thuộc vào trường cụ thể.
  • Phép tương tự: Mazur chứng minh “không tồn tại tòa nhà cao hơn 100 tầng ở Hà Nội”. Merel chứng minh “ở mọi thành phố trên thế giới, tòa nhà luôn có giới hạn tầng --- dù giới hạn phụ thuộc vào thành phố”.

Liên hệ với giả thuyết Birch--Dyer

Merel và BSD.
  • BSD trên trường số: BSD tổng quát cho $E/K$ (trường số bất kỳ) có cùng dạng công thức, trong đó $|E(K)_{\mathrm{tors}}|$ ở mẫu số. Merel đảm bảo mẫu số luôn bị chặn --- nên nếu tử số tăng, $L^{(r)}(E, 1)/r!$ cũng phải tăng.
  • Bhargava--Shankar: Kết quả thống kê “trung bình hạng bị chặn” [bhargava-shankar2015a] kết hợp với Merel (xoắn bị chặn) cho thông tin chính xác hơn về phân bố Mordell--Weil: phần lớn đường cong có nhóm Mordell--Weil “nhỏ” (hạng $\leq 1$, xoắn nhỏ).
  • Bài toán mở: Tìm cận tối ưu $B(d)$ --- đặc biệt, liệu $B(d)$ có tăng theo $d$ không? Phỏng đoán: bậc nguyên tố $p$ lớn nhất của điểm xoắn bị chặn bởi $Cd^{\log\log d}$ (cận Merel gốc: $(1 + 3^{d/2})^2$, rất lớn).
61 Phỏng đoán Goldfeld (Goldfeld Conjecture) Ch.3 6

Định nghĩa

Phỏng đoán (Goldfeld, 1979). Xét “tất cả” đường cong elliptic trên $\mathbb{Q}$, sắp xếp theo chiều cao (tức theo kích thước hệ số). Khi chiều cao tiến ra vô cùng [goldfeld1979]:
  • 50% đường cong có hạng $r = 0$ (hữu hạn điểm hữu tỉ),
  • 50% đường cong có hạng $r = 1$ (vô hạn điểm, nhưng chỉ 1 “hướng”),
  • 0% đường cong có hạng $r \geq 2$ (mật độ bằng 0, dù có vô hạn đường cong như vậy).

Chính xác hơn, gọi $N(H)$ là số đường cong $E_{A,B}: y^2 = x^3 + Ax + B$ với $|A| \leq H^2$, $|B| \leq H^3$ (và $4A^3 + 27B^2 \neq 0$). Phỏng đoán nói:

\[ \lim_{H \to \infty} \frac{\#\{E_{A,B} : r(E) = i,\, |A| \leq H^2,\, |B| \leq H^3\}}{N(H)} = \begin{cases} 1/2 & \text{nếu } i = 0, \\ 1/2 & \text{nếu } i = 1, \\ 0 & \text{nếu } i \geq 2. \end{cases} \]

Bằng chứng hỗ trợ

Ví dụ (Kết quả hướng tới Goldfeld).
  1. Bhargava--Shankar (2015): Hạng trung bình $\leq 0.885$ [bhargava-shankar2015a]. Đây là bằng chứng mạnh rằng “hầu hết” đường cong có hạng nhỏ. Nếu Goldfeld đúng, hạng trung bình = $0 \cdot 1/2 + 1 \cdot 1/2 = 0.5$.
  2. Bhargava--Skinner--Zhang (2014): Ít nhất 66.48% đường cong elliptic thỏa BSD yếu (hạng đại số = hạng giải tích) [bhargava-skinner-zhang2014].
  3. Smith (2022): Chứng minh phỏng đoán Goldfeld cho họ đường cong bậc hai $y^2 = x^3 - dx$ (twist bậc hai), sử dụng kỹ thuật 2-Selmer tinh vi.

Ý nghĩa trực giác

“Hầu hết” đường cong có ít điểm hữu tỉ. Phỏng đoán Goldfeld nói rằng đường cong elliptic “phổ biến” rất “nghèo” về điểm hữu tỉ:
  • Nửa chỉ có hữu hạn điểm (hạng 0).
  • Nửa còn lại có vô hạn điểm, nhưng tất cả nằm trên một “đường” (hạng 1).
  • Đường cong có $\geq 2$ “hướng” độc lập (hạng $\geq 2$) là cực kỳ hiếm --- mật độ $0\%$.

Phép tương tự: giống như trong một rừng cây, “hầu hết” cây thấp dưới 5m, một số cây cao 5--10m, và cây khổng lồ $> 30$m cực kỳ hiếm. Tương tự, “hầu hết” đường cong có hạng $\leq 1$, hạng lớn cực kỳ hiếm.

Sự phân chia 50/50: Dấu gốc $w(E) = \pm 1$ trong phương trình hàm $L(E, s)$ xác định tính chẵn/lẻ của $\mathrm{ord}_{s=1} L(E, s)$. Khoảng 50% đường cong có $w = +1$ (nên $r$ chẵn, dự đoán $r = 0$) và 50% có $w = -1$ (nên $r$ lẻ, dự đoán $r = 1$).

Liên hệ với giả thuyết Birch--Dyer

Goldfeld và BSD.
  • Hệ quả của BSD: Nếu BSD yếu đúng (hạng đại số = hạng giải tích), Goldfeld tương đương với dự đoán phân bố bậc triệt tiêu hàm $L(E, s)$ tại $s = 1$.
  • Kết hợp Bhargava--Shankar + BSD: Bhargava--Skinner--Zhang chứng minh 66.48% đường cong thỏa BSD bằng cách kết hợp: (a) cận Selmer (Bhargava--Shankar), (b) chứng minh BSD cho hạng 0 (Skinner), (c) chứng minh BSD cho hạng 1 (Gross--Zagier--Kolyvagin + Zhang).
  • Smith và Goldfeld cho twists: Kết quả Smith (2022) cho twist bậc hai sử dụng phân bố Selmer $\mathrm{Sha}[2]$ --- trực tiếp liên quan đến BSD vì $|\mathrm{Sha}|$ xuất hiện trong công thức BSD mạnh.
62 Kỷ lục về hạng (Rank records) Ch.3 3

Định nghĩa

Định nghĩa (Bài toán kỷ lục hạng). Câu hỏi: Hạng $r(E/\mathbb{Q})$ có thể lớn đến mức nào? Tìm đường cong elliptic $E/\mathbb{Q}$ có hạng lớn nhất có thể, hoặc chứng minh hạng bị chặn.

Đây là một trong những bài toán mở quan trọng nhất trong lý thuyết đường cong elliptic [silverman2009].

Ví dụ

Ví dụ (Bảng kỷ lục hạng qua các thời kỳ).
Năm Hạng $\geq$ Tác giả
19384Billing
19456Wiman
19747Penney--Pomerance
19779Brumer--Kramer
198212Mestre
198614Mestre
199221Nagao
199322Fermigier
199724Martin--McMillen
200628Elkies

Kỷ lục hiện tại (đến 2025): Noam Elkies (2006) tìm được đường cong $E/\mathbb{Q}$ có $r \geq 28$ [elkies2006]. Phương trình Weierstrass có hệ số rất lớn (hàng chục chữ số). Kỷ lục này đã đứng vững gần 20 năm!

Ý nghĩa trực giác

Tìm đường cong hạng lớn --- tìm kim trong đống cỏ.
  • Phương pháp tìm kiếm: Elkies sử dụng mặt phẳng hữu tỉ (rational surface) trên không gian tham số đường cong, kết hợp sàng đại số. Ý tưởng: xây dựng họ đường cong mà “tự nhiên” có nhiều điểm hữu tỉ, rồi sàng lọc trong họ đó.
  • Tại sao khó tìm hạng lớn hơn? Phỏng đoán Goldfeld nói $0\%$ đường cong có hạng $\geq 2$. Hạng $\geq 28$ cực kỳ hiếm --- giống tìm viên kim cương trong sa mạc. Càng lên cao, mỗi bước tiến đều tốn hàng năm tính toán.
  • Câu hỏi triệu đô: Hạng có bị chặn (ví dụ $r \leq 28$?) hay tùy ý lớn? Không ai biết chắc!

Liên hệ với giả thuyết Birch--Dyer

Kỷ lục hạng và BSD.
  • Kiểm nghiệm BSD: Mỗi kỷ lục hạng mới là cơ hội kiểm nghiệm BSD. Với đường cong hạng $r$ của Elkies, ta kiểm tra: $L(E, s)$ có triệt tiêu đến bậc $\geq 28$ tại $s = 1$ không? Câu trả lời: , phù hợp với BSD yếu.
  • BSD mạnh cho hạng cao: Kiểm nghiệm BSD mạnh (tính $|\mathrm{Sha}|$, Reg, $\Omega_E$, \ldots) cho đường cong hạng $\geq 4$ rất khó vì regulator $\mathrm{Reg}_E$ là định thức ma trận $r \times r$, và tìm đủ $r$ điểm sinh độc lập tốn rất nhiều công sức.
  • Nếu hạng không bị chặn: Đường cong hạng tùy ý lớn sẽ cho $L(E, s)$ triệt tiêu bậc tùy ý cao --- một hiện tượng rất bất thường cho hàm $L$.
63 Heuristic Park–Poonen–Voight–Wood (PPVW Heuristic) Ch.3 7

Định nghĩa

Phỏng đoán (Park--Poonen--Voight--Wood, 2019). Dựa trên mô hình xác suất cho nhóm Tate--Shafarevich $\mathrm{Sha}(E/\mathbb{Q})$ (sử dụng heuristic kiểu Cohen--Lenstra cho nhóm hữu hạn), Park, Poonen, Voight và Wood dự đoán [park-etal2019]:
  1. Chỉ có hữu hạn đường cong elliptic trên $\mathbb{Q}$ có hạng $> 21$.
  2. Nói cách khác, hạng “thực tế” bị chặn bởi $21$ (ngoại trừ hữu hạn ngoại lệ).

Lưu ý quan trọng: Đây là heuristic (dự đoán dựa trên mô hình xác suất), không phải định lý hay phỏng đoán chính thức. Tuy nhiên, nó được cộng đồng coi trọng vì dựa trên nền tảng toán học chặt chẽ.

Ý tưởng chính

Ví dụ (Cách PPVW lập luận).
  1. Mô hình cho $\mathrm{Sha}$: Giả sử $\mathrm{Sha}(E/\mathbb{Q})$ “hành xử” như nhóm hữu hạn ngẫu nhiên (kiểu Cohen--Lenstra). Cụ thể: xác suất $|\mathrm{Sha}| = k^2$ giảm theo $k$, nhưng có thể tùy ý lớn.
  2. Ràng buộc BSD mạnh: Công thức BSD mạnh liên hệ $L^{(r)}(E,1)/r!$ với $|\mathrm{Sha}| \cdot \mathrm{Reg}_E \cdot \Omega_E \cdot \prod c_p / |E_{\mathrm{tors}}|^2$. Khi hạng $r$ tăng, $\mathrm{Reg}_E$ tăng “chậm” (bậc $r^r$), nhưng $L^{(r)}(E,1)/r!$ giảm “nhanh” --- buộc $|\mathrm{Sha}|$ phải bù đắp.
  3. Mâu thuẫn xác suất: Khi $r > 21$, xác suất để $|\mathrm{Sha}|$ đủ lớn bù đắp trở nên cực nhỏ --- tổng xác suất hội tụ, nên chỉ có hữu hạn đường cong thỏa mãn.

Ý nghĩa trực giác

Hạng bị chặn --- “thiếu chỗ” cho điểm hữu tỉ.
  • Phép tương tự: Hãy nghĩ về hạng như “số phòng” trong khách sạn, còn $|\mathrm{Sha}|$ như “khoản phí bảo hiểm”. BSD mạnh nói: “doanh thu (hàm $L$) = phí bảo hiểm $\times$ số phòng $\times$ tiện ích”. Khi muốn quá nhiều phòng ($r$ lớn), phí bảo hiểm ($|\mathrm{Sha}|$) phải tăng bất hợp lý --- và PPVW nói rằng điều đó “hầu như không bao giờ xảy ra” khi $r > 21$.
  • Con số 21: Tại sao là 21? Đây đến từ cân bằng giữa tốc độ tăng của $\mathrm{Reg}_E$ (bậc $r \log r$) và tốc độ giảm của mật độ đường cong. $21$ không “đặc biệt” theo nghĩa toán học sâu --- nó là điểm cân bằng trong mô hình xác suất.
  • Kỷ lục Elkies $r \geq 28$: Mâu thuẫn? Không hẳn --- PPVW nói “hữu hạn ngoại lệ”, và 28 có thể là một trong số đó. Tuy nhiên, nếu ai tìm được họ vô hạn đường cong hạng $> 21$, PPVW sẽ bị bác bỏ.

Liên hệ với giả thuyết Birch--Dyer

PPVW và BSD.
  • Dựa trên BSD: PPVW giả sử BSD mạnh đúng, rồi dùng nó để ước lượng xác suất. Nếu BSD sai, mô hình PPVW mất cơ sở.
  • Phân bố $\mathrm{Sha}$: Mô hình PPVW dự đoán phân bố chi tiết của $|\mathrm{Sha}|$ --- quan trọng cho BSD vì $|\mathrm{Sha}|$ là thành phần “bí ẩn nhất” trong công thức BSD mạnh.
  • Hạng và hàm $L$: Nếu hạng bị chặn bởi 21, thì $L(E, s)$ triệt tiêu tối đa bậc 21 tại $s = 1$ cho “hầu hết” đường cong --- một ràng buộc rất mạnh về hàm $L$.
  • Bài toán mở: Chứng minh (hoặc bác bỏ) rằng hạng bị chặn vẫn là một trong những thách thức lớn nhất. Ngay cả chứng minh rằng có vô hạn đường cong hạng $\geq 2$ cũng chưa có (dù ai cũng tin là đúng).
64 Phương pháp hạ xuống (descent) (Descent method) Ch.3 5

Định nghĩa

Định nghĩa (Phương pháp descent). Phương pháp hạ xuống (descent method) (hay descente infinie) là kỹ thuật chứng minh có nguồn gốc từ Fermat, được Mordell và Weil áp dụng cho đường cong elliptic. Trong ngữ cảnh hiện đại [silverman2009]:

$m$-descent cho đường cong elliptic $E/\mathbb{Q}$ (với $m \geq 2$) gồm hai bước:

  1. Bước hữu hạn: Chứng minh $E(\mathbb{Q})/mE(\mathbb{Q})$ hữu hạn (Mordell--Weil yếu).
  2. Bước chiều cao: Sử dụng hàm chiều cao $h: E(\mathbb{Q}) \to \mathbb{R}_{\geq 0}$ với tính chất $h(mP) \geq m^2 h(P) - C$ để “hạ xuống”: mỗi $P$ viết được thành $P = mP_1 + Q_i$ ($Q_i$ là đại diện), và $h(P_1) < h(P)$. Lặp lại cho đến khi chiều cao đủ nhỏ.

Lịch sử

Từ Fermat đến Mordell--Weil. Thế kỷ 17: Pierre de Fermat chứng minh $x^4 + y^4 = z^2$ không có nghiệm nguyên dương bằng cách: giả sử có nghiệm $(x_0, y_0, z_0)$, xây dựng nghiệm $(x_1, y_1, z_1)$ nhỏ hơn. Lặp vô hạn $\Rightarrow$ mâu thuẫn (vì số nguyên dương không giảm vô hạn).

1922: Mordell áp dụng ý tưởng tương tự cho $E(\mathbb{Q})$: thay vì “tìm mâu thuẫn”, ông dùng descent để tìm tập sinh. Sự khác biệt: $E(\mathbb{Q})$ có thể vô hạn, nên ta không tìm mâu thuẫn, mà tìm tập sinh hữu hạn.

Hiện đại: Descent trở thành phương pháp chính để tính toán hạng (không chỉ chứng minh hữu hạn) [silverman2009, cassels1962].

Ví dụ

Ví dụ (Descent cổ điển của Fermat). Bài toán: Chứng minh $x^4 + y^4 = z^2$ vô nghiệm nguyên dương.

Descent: Giả sử $(x, y, z)$ là nghiệm dương tối tiểu ($z$ nhỏ nhất). Viết $x^4 + y^4 = z^2$ thành $(x^2)^2 + (y^2)^2 = z^2$ (bộ ba Pythagoras). Suy ra $x^2 = m^2 - n^2$, $y^2 = 2mn$, $z = m^2 + n^2$ (hoặc hoán vị). Phân tích tiếp cho thấy tồn tại nghiệm $(x', y', z')$ với $z' < z$ --- mâu thuẫn tính tối tiểu.

Đây chính là tinh thần “hạ xuống”: mỗi bước giảm “độ lớn”, vô hạn bước $\Rightarrow$ mâu thuẫn.

Ý nghĩa trực giác

Descent --- “leo xuống thang” để tìm gốc.
  • Hãy tưởng tượng các điểm hữu tỉ trên $E$ như các tầng của tòa nhà, “chiều cao” $h(P)$ cho biết tầng.
  • Bước 1 nói: mỗi tầng chỉ có hữu hạn “kiểu phòng” (lớp modulo $mE(\mathbb{Q})$).
  • Bước 2 nói: biết kiểu phòng, ta “leo xuống” (chia $m$) để đến tầng thấp hơn.
  • Lặp lại: cuối cùng đến tầng trệt --- chỉ có hữu hạn điểm ở đó.
  • Kết luận: mọi điểm đều “đến được” từ hữu hạn điểm gốc qua phép nhân $m$ và cộng đại diện.

Phép tương tự: giống như mọi số nguyên dương $n$ đều đến được từ 1 bằng cách nhân/cộng, mọi điểm $P \in E(\mathbb{Q})$ đến được từ tập sinh hữu hạn.

Liên hệ với giả thuyết Birch--Dyer

Descent và BSD.
  • Tính hạng: Descent (cụ thể: 2-descent) là phương pháp chính hiện nay để tính hạng đường cong elliptic. Nó cho cận trên cho hạng thông qua nhóm Selmer.
  • Rào cản $\mathrm{Sha}$: Cận trên từ descent có thể lớn hơn hạng thực sự --- sai lệch chính xác là $\dim \mathrm{Sha}[m]$. Đây là lý do $\mathrm{Sha}$ “cản trở” việc tính hạng chính xác.
  • BSD giải quyết rào cản: Nếu BSD yếu đúng, ta tính hạng qua $\mathrm{ord}_{s=1} L(E, s)$ --- không cần descent. Nếu BSD mạnh đúng, ta biết chính xác $|\mathrm{Sha}|$, tức biết sai lệch descent.
  • Descent là công cụ chứng minh BSD: Kết quả Kolyvagin (hệ thống Euler) bản chất là “descent mở rộng” --- chặn Selmer từ phía trên, suy ra $\mathrm{Sha}$ hữu hạn và BSD cho hạng $\leq 1$.
65 $2$-descent ($2$-descent) Ch.3 6

Định nghĩa

Định nghĩa ($2$-descent). $2$-descent (2-descent) là trường hợp $m = 2$ của phương pháp descent, áp dụng cho đường cong $E/\mathbb{Q}$. Mục tiêu: xác định nhóm thương $E(\mathbb{Q})/2E(\mathbb{Q})$ [silverman2009, cassels1962].

Nếu $|E(\mathbb{Q})/2E(\mathbb{Q})| = 2^s$, thì:

\[ s = r + \dim_{\mathbb{F}_2} E(\mathbb{Q})[2], \]
trong đó $r = \mathrm{rk}(E/\mathbb{Q})$ là hạng, và $E(\mathbb{Q})[2]$ là nhóm các điểm bậc 2 (có $0, 1, 2$ hoặc $3$ điểm bậc 2 ngoài $\mathcal{O}$, tức $\dim = 0, 1$, hoặc $2$). Do đó: $r = s - \dim_{\mathbb{F}_2} E(\mathbb{Q})[2]$.

Thực tế, $2$-descent tính $|\mathrm{Sel}_2(E/\mathbb{Q})|$ (nhóm Selmer bậc 2), cho cận trên $s \leq \dim_{\mathbb{F}_2} \mathrm{Sel}_2(E/\mathbb{Q})$.

Ví dụ

Ví dụ ($2$-descent cho các đường cong cụ thể).
  1. $E: y^2 = x^3 - x = x(x-1)(x+1)$:

    Ba điểm bậc 2: $(0,0)$, $(1,0)$, $(-1,0)$, nên $E(\mathbb{Q})[2] \cong (\mathbb{Z}/2\mathbb{Z})^2$.

    2-descent phân tích: viết $y^2 = x(x-1)(x+1)$. Ba thừa số đôi một nguyên tố cùng nhau (mod 2). Phân tích tại các số nguyên tố cho thấy $E(\mathbb{Q})/2E(\mathbb{Q}) \cong (\mathbb{Z}/2\mathbb{Z})^2$, tức $s = 2$.

    Suy ra: $r = s - 2 = 0$. Vậy $E(\mathbb{Q}) = E(\mathbb{Q})_{\mathrm{tors}} \cong \mathbb{Z}/2\mathbb{Z} \oplus \mathbb{Z}/2\mathbb{Z}$.

  2. $E_5: y^2 = x^3 - 25x$ (số đồng dư $n = 5$):

    $E_5(\mathbb{Q})[2] \cong (\mathbb{Z}/2\mathbb{Z})^2$ (điểm $(0,0)$, $(5,0)$, $(-5,0)$).

    2-descent cho $E_5(\mathbb{Q})/2E_5(\mathbb{Q}) \cong (\mathbb{Z}/2\mathbb{Z})^3$, tức $s = 3$, nên $r = 3 - 2 = 1$.

    Điểm sinh: $P = (-4, 6)$ có bậc vô hạn. Kiểm tra: $2P = (1681/144, -62279/1728)$.

  3. $E: y^2 + y = x^3 - x$ (37a1):

    $E(\mathbb{Q})[2] = \{0\}$ (không có điểm bậc 2 hữu tỉ vì $x^3 - x + 1/4$ không có nghiệm hữu tỉ).

    2-descent (phức tạp hơn, dùng trường số $\mathbb{Q}(\sqrt{-3})$) cho $\mathrm{Sel}_2 \cong \mathbb{Z}/2\mathbb{Z}$, nên $s = 1$, $r = 1 - 0 = 1$.

Ý nghĩa trực giác

$2$-descent --- “chia đôi” để phân loại.
  • Câu hỏi cốt lõi: Cho $P \in E(\mathbb{Q})$, có điểm $Q \in E(\mathbb{Q})$ nào mà $2Q = P$ không? Nói cách khác: $P$ có phải “bội đôi” của điểm hữu tỉ nào không?
  • Ý tưởng: Viết phương trình $2Q = P$ ra tọa độ, phân tích ước nguyên tố, kiểm tra “solvability cục bộ” (tại mỗi $p$ và tại $\mathbb{R}$). Nếu cục bộ giải được ở mọi nơi nhưng toàn cục không $\Rightarrow$ đó là phần tử $\mathrm{Sha}[2]$.
  • Thuật toán: Trong thực hành, 2-descent cho đường cong $y^2 = x(x-e_1)(x-e_2)$ quy về tìm các bộ $(d_1, d_2, d_3)$ với $d_1 d_2 d_3 = 1$ sao cho hệ phương trình bậc 2 có nghiệm cục bộ. Đếm số bộ $\Rightarrow$ cỡ Selmer.

Liên hệ với giả thuyết Birch--Dyer

$2$-descent và BSD.
  • Bhargava--Shankar dùng $2$-descent: Kết quả “hạng trung bình $\leq 0.885$” đến từ việc chứng minh $|\mathrm{Sel}_2(E/\mathbb{Q})|$ trung bình $= 3$ [bhargava-shankar2015a]. Vì $|E(\mathbb{Q})/2E(\mathbb{Q})| \leq |\mathrm{Sel}_2|$, suy ra cận trên cho hạng trung bình.
  • Sai lệch = $\mathrm{Sha}[2]$: $|\mathrm{Sel}_2| = |E(\mathbb{Q})/2E(\mathbb{Q})| \cdot |\mathrm{Sha}[2]|$. Cận trên từ $2$-descent lớn hơn hạng thực sự đúng bằng $\dim \mathrm{Sha}[2]$ --- liên quan trực tiếp đến BSD mạnh (vì $|\mathrm{Sha}|$ xuất hiện).
  • Phần mềm: Cremona's mwrank, Sage, Magma đều implement $2$-descent. Đây là bước đầu tiên để tính hạng trên máy tính --- và kết quả được dùng để kiểm nghiệm BSD cho hàng triệu đường cong trong LMFDB [cremona1997].
66 $n$-descent bậc cao (Higher descent ($4$, $6$, $8$, $12$)) Ch.7 7

Định nghĩa

Định nghĩa ($n$-descent bậc cao). $n$-descent bậc cao (higher descent) là mở rộng của $2$-descent cho $n > 2$. Cho $E/\mathbb{Q}$ và $n \geq 2$ [cassels1962, fisher2008]:
  • $n$-Selmer group: $\mathrm{Sel}_n(E/\mathbb{Q}) \subset H^1(\mathrm{Gal}(\overline{\mathbb{Q}}/\mathbb{Q}), E[n])$, gồm các lớp cohomology “giải được cục bộ”.
  • Dãy chính xác: $0 \to E(\mathbb{Q})/nE(\mathbb{Q}) \to \mathrm{Sel}_n(E/\mathbb{Q}) \to \mathrm{Sha}(E/\mathbb{Q})[n] \to 0$.
  • Cận trên: $\mathrm{rk}(E/\mathbb{Q}) \leq \frac{\log_n |\mathrm{Sel}_n(E/\mathbb{Q})|}{1} - \dim_{\mathbb{F}_n} E(\mathbb{Q})[n]$.

Các trường hợp quan trọng:

  1. $4$-descent: Phân tích $\mathrm{Sel}_4$, cho cận trên tốt hơn $2$-descent.
  2. $3$-descent: Dùng cho đường cong không có điểm bậc 2 hữu tỉ (khi $2$-descent khó thực hiện trực tiếp).
  3. $8$-descent, $12$-descent: Tinh chỉnh thêm, phát hiện $\mathrm{Sha}$ ẩn.

Ví dụ

Ví dụ ($4$-descent phát hiện $\mathrm{Sha}$).
  1. Đường cong 571a1: $E: y^2 + y = x^3 - x^2 - 929x - 10595$.

    $2$-descent: $|\mathrm{Sel}_2| = 4$, $|E(\mathbb{Q})[2]| = 1$, nên cận trên $r \leq 2$.

    $4$-descent: $|\mathrm{Sel}_4| = 4$, nên cận trên $r \leq 1$. Thực tế $r = 0$ và $|\mathrm{Sha}[2]| = 4$ (có phần tử $\mathrm{Sha}$ bậc 2!) [fisher2008].

  2. Ý nghĩa: $2$-descent cho “$r \leq 2$” nhưng thực tế $r = 0$ --- sai lệch do $\mathrm{Sha}$. $4$-descent “phát hiện” phần tử $\mathrm{Sha}$ này và thu hẹp cận trên.

Ý nghĩa trực giác

Descent bậc cao --- “kính hiển vi mạnh hơn”.
  • $2$-descent giống “nhìn bằng mắt thường”: thấy được “hình dạng lớn” nhưng nhầm $\mathrm{Sha}$ với điểm thực.
  • $4$-descent giống “kính lúp”: phân biệt được $\mathrm{Sha}[2]$ với điểm thực.
  • $8$-descent, $12$-descent giống “kính hiển vi”: phát hiện $\mathrm{Sha}[4]$, $\mathrm{Sha}[8]$, \ldots

    Mỗi bậc descent cao hơn “zoom in” thêm, loại bỏ thêm “nhiễu” từ $\mathrm{Sha}$ để tiến gần hơn đến hạng thực sự.

  • Giới hạn: Không có $n$ cố định nào đảm bảo tính chính xác hạng cho mọi đường cong --- vì $\mathrm{Sha}$ có thể có phần tử bậc tùy ý lớn (nếu $\mathrm{Sha}$ vô hạn --- mâu thuẫn với phỏng đoán hữu hạn).

Liên hệ với giả thuyết Birch--Dyer

$n$-descent và BSD.
  • Bhargava--Shankar cho $n = 3, 4, 5$: Ngoài $\mathrm{Sel}_2$, Bhargava--Shankar còn tính trung bình $|\mathrm{Sel}_3| = 4$, $|\mathrm{Sel}_4| = 7$, $|\mathrm{Sel}_5| = 6$ [bhargava-shankar2015a]. Mỗi kết quả cho cận trên tốt hơn cho hạng trung bình, đều phù hợp với Goldfeld.
  • $\mathrm{Sha}$ hữu hạn: Phỏng đoán rằng $\mathrm{Sha}(E/\mathbb{Q})$ hữu hạn cho mọi $E$. Nếu đúng, thì descent bậc đủ cao sẽ cho hạng chính xác. BSD mạnh hàm ý $\mathrm{Sha}$ hữu hạn (vì $|\mathrm{Sha}|$ xuất hiện trong công thức hữu hạn).
  • Tính toán BSD mạnh: Kiểm nghiệm BSD mạnh cho đường cong với $\mathrm{Sha} \neq 0$ (ví dụ 571a1) yêu cầu descent bậc cao để xác nhận $|\mathrm{Sha}| = 4$. Cremona/LMFDB đã kiểm nghiệm BSD mạnh cho hàng triệu đường cong bằng cách kết hợp $2$-descent và $4$-descent [cremona1997].
67 Chiều cao ngây thơ (Naïve height) Ch.3 3

Định nghĩa

Định nghĩa (Chiều cao ngây thơ). Cho điểm $P = (x, y) \in E(\mathbb{Q})$ với $x = a/b$ viết ở dạng rút gọn ($\gcd(a, b) = 1$). Chiều cao ngây thơ (naïve height) (hay chiều cao Weil) của $P$ là:
\[ h(P) = \log \max(|a|, |b|). \]
Ta đặt $h(\mathcal{O}) = 0$ cho điểm vô cực [silverman2009].

Chiều cao đo “kích thước số học” --- điểm có tọa độ phức tạp (tử/mẫu lớn) thì chiều cao lớn.

Tính chất quan trọng [silverman2009, lang1983]:

  1. Northcott: Với mỗi $B > 0$, tập $\{P \in E(\mathbb{Q}) : h(P) \leq B\}$ hữu hạn.
  2. Gần bậc hai: $h(2P) \geq 4h(P) - C_1$ và $h(P + Q) \leq 2h(P) + 2h(Q) + C_2$.

Ví dụ

Ví dụ (Chiều cao tăng khi nhân bội). Với $E: y^2 = x^3 - 2$ và $P = (3, 5)$:
\[\begin{aligned} h(P) &= \log 3 \approx 1.10, \\ h(2P) &= h(129/100) = \log 129 \approx 4.86 \approx 4 \times 1.10 + 0.46, \\ h(3P) &= h(164323/29241) = \log 164323 \approx 12.01 \approx 9 \times 1.10 + 2.11. \end{aligned}\]
Ta thấy $h(nP) \approx n^2 \cdot h(P)$, nhưng có sai số dao động. Chiều cao Néron--Tate (khái niệm 68) sẽ loại bỏ sai số này.

Ý nghĩa trực giác

Chiều cao đo “độ phức tạp” của điểm.
  • Phép tương tự: chiều cao giống “số chữ số” cần để viết tọa độ điểm. Điểm $P = (3, 5)$ có chiều cao nhỏ (tọa độ gọn), nhưng $2P = (129/100, \ldots)$ đã phức tạp hơn, $3P$ càng phức tạp.
  • Tính Northcott: Giống như chỉ có hữu hạn số nguyên $\leq B$, chỉ có hữu hạn điểm hữu tỉ có “độ phức tạp” $\leq B$. Đây là tính chất then chốt cho chứng minh Mordell--Weil.
  • Nhược điểm: $h$ không “hoàn hảo” --- $h(P + Q)$ không có công thức đẹp qua $h(P)$ và $h(Q)$. Chiều cao Néron--Tate khắc phục bằng cách “làm trơn” sai số.

Liên hệ với giả thuyết Birch--Dyer

Chiều cao ngây thơ trong BSD.
  • Công cụ chứng minh Mordell--Weil: Chiều cao ngây thơ là thành phần không thể thiếu trong Bước 2 (descent) của chứng minh Mordell--Weil. Không có nó, ta không chứng minh được $E(\mathbb{Q})$ hữu hạn sinh.
  • Tiền thân của $\hat{h}$: Chiều cao ngây thơ xấp xỉ chiều cao Néron--Tate: $\hat{h}(P) = h(P) + O(1)$. Trong thực hành, người ta dùng $h$ để sàng lọc ban đầu (tìm điểm chiều cao nhỏ), rồi tính $\hat{h}$ chính xác cho BSD mạnh.
  • Tìm điểm sinh: Để tính regulator $\mathrm{Reg}_E$ trong BSD mạnh, cần tìm tập sinh Mordell--Weil. Thuật toán: tìm mọi điểm có $h(P) \leq B$ (hữu hạn), rồi kiểm tra chúng sinh ra $E(\mathbb{Q})$ modulo xoắn.
68 Chiều cao Néron–Tate (Néron–Tate (canonical) height $\hat{h}$) Ch.3 5

Định nghĩa

Định nghĩa (Chiều cao Néron--Tate). Cho $P \in E(\mathbb{Q})$. Chiều cao Néron--Tate (Néron--Tate height) (hay chiều cao chính tắc) được định nghĩa bởi [neron1965, silverman2009]:
\[ \hat{h}(P) = \lim_{n \to \infty} \frac{h(2^n P)}{4^n}. \]
Giới hạn luôn tồn tại nhờ tính gần bậc hai của $h$.
Định lý (Tính chất chiều cao Néron--Tate). $\hat{h}: E(\mathbb{Q}) \to \mathbb{R}$ thỏa mãn [silverman2009]:
  1. $\hat{h}(P) \geq 0$ cho mọi $P$, và $\hat{h}(P) = 0 \Leftrightarrow P \in E(\mathbb{Q})_{\mathrm{tors}}$.
  2. $\hat{h}(nP) = n^2 \hat{h}(P)$ cho mọi $n \in \mathbb{Z}$ (bậc hai chính xác).
  3. $\hat{h}(P) = h(P) + O(1)$ (xấp xỉ chiều cao ngây thơ).
  4. Dạng song tuyến tính $\langle P, Q \rangle_{\mathrm{NT}} = \hat{h}(P+Q) - \hat{h}(P) - \hat{h}(Q)$ xác định dương trên $E(\mathbb{Q})/E(\mathbb{Q})_{\mathrm{tors}} \otimes \mathbb{R}$.

Ví dụ

Ví dụ (Tính chiều cao Néron--Tate).
  1. $E: y^2 = x^3 - 2$, $P = (3, 5)$: $\hat{h}(P) \approx 1.323$. Kiểm tra: $\hat{h}(2P) \approx 5.291 = 4 \times 1.323$ --- bậc hai chính xác!
  2. $E: y^2 + y = x^3 - x$ (37a1), $P = (0, 0)$: $\hat{h}(P) \approx 0.0511$. Điểm sinh duy nhất, chiều cao rất nhỏ (gần xoắn nhưng không phải xoắn).
  3. Điểm xoắn: $(0, 0)$ trên $y^2 = x^3 - x$ có $\hat{h} = 0$ (vì $2 \cdot (0,0) = \mathcal{O}$, tức là điểm xoắn bậc 2).

Ý nghĩa trực giác

Chiều cao Néron--Tate = “khoảng cách chuẩn” trên $E(\mathbb{Q})$.
  • Chiều cao ngây thơ $h$ giống “thước đo tạm” --- đo gần đúng nhưng có sai số. Chiều cao Néron--Tate $\hat{h}$ là “thước đo chuẩn” --- loại bỏ hoàn toàn sai số.
  • Phép tương tự: $h$ giống đo chiều cao bằng mắt (sai $\pm$ vài cm), $\hat{h}$ giống đo bằng laser (chính xác tuyệt đối).
  • Không gian Euclid: Nhờ tính chất (iv), ta biến $E(\mathbb{Q})/\text{tors} \otimes \mathbb{R} \cong \mathbb{R}^r$ thành không gian Euclid với tích vô hướng $\langle \cdot, \cdot \rangle_{\mathrm{NT}}$. Các điểm sinh tạo thành “lưới” trong không gian này.

Liên hệ với giả thuyết Birch--Dyer

Chiều cao Néron--Tate trong BSD. $\hat{h}$ là thành phần không thể thiếu trong BSD mạnh:
  • Regulator: $\mathrm{Reg}_E = \det(\langle P_i, P_j \rangle_{\mathrm{NT}})$ --- tính trực tiếp từ chiều cao Néron--Tate.
  • Gross--Zagier: Công thức Gross--Zagier [gross-zagier1986] liên hệ $L'(E, 1)$ với $\hat{h}(P_K)$ (chiều cao điểm Heegner): $L'(E, 1) = c \cdot \hat{h}(P_K)$. Nếu $\hat{h}(P_K) > 0$ thì $P_K$ có bậc vô hạn, suy ra $r \geq 1$.
  • Kiểm nghiệm: Tính $\hat{h}$ chính xác (bằng Sage/PARI) là bước thiết yếu khi kiểm nghiệm BSD mạnh cho từng đường cong cụ thể.
69 Ghép đôi chiều cao (Height pairing) Ch.3 5

Định nghĩa

Định nghĩa (Ghép đôi chiều cao Néron--Tate). Ghép đôi chiều cao (height pairing) (hay ghép đôi Néron--Tate) trên $E(\mathbb{Q})$ là dạng song tuyến tính đối xứng:
\[ \langle \cdot, \cdot \rangle_{\mathrm{NT}}: E(\mathbb{Q}) \times E(\mathbb{Q}) \to \mathbb{R} \]
cho bởi [silverman2009]:
\[ \langle P, Q \rangle_{\mathrm{NT}} = \hat{h}(P + Q) - \hat{h}(P) - \hat{h}(Q). \]
Tính chất:
  • Đối xứng: $\langle P, Q \rangle = \langle Q, P \rangle$.
  • Song tuyến tính: $\langle P_1 + P_2, Q \rangle = \langle P_1, Q \rangle + \langle P_2, Q \rangle$.
  • Xác định dương: $\langle P, P \rangle = 2\hat{h}(P) \geq 0$, bằng 0 $\Leftrightarrow$ $P$ xoắn.

Ví dụ

Ví dụ (Ghép đôi chiều cao cụ thể).
  1. Hạng 1: $E: y^2 + y = x^3 - x$ (37a1), $P = (0, 0)$. Ma trận Gram $1 \times 1$:
    \[ \langle P, P \rangle = 2\hat{h}(P) \approx 2 \times 0.0511 = 0.1022. \]
  2. Hạng 2: $E: y^2 = x^3 - 43x + 166$, hai điểm sinh $P_1, P_2$. Ma trận Gram:
    \[ G = \begin{pmatrix} \langle P_1, P_1 \rangle & \langle P_1, P_2 \rangle \\ \langle P_2, P_1 \rangle & \langle P_2, P_2 \rangle \end{pmatrix}. \]
    Các phần tử đường chéo $= 2\hat{h}(P_i)$, phần tử ngoài chéo đo “góc” giữa $P_1$ và $P_2$ trong không gian Néron--Tate.
  3. Điểm trực giao: Nếu $\langle P_1, P_2 \rangle = 0$, hai “hướng” $P_1$ và $P_2$ vuông góc --- regulator đơn giản là $\langle P_1, P_1 \rangle \cdot \langle P_2, P_2 \rangle = 4\hat{h}(P_1)\hat{h}(P_2)$.

Ý nghĩa trực giác

Ghép đôi chiều cao = “tích vô hướng” trên nhóm Mordell--Weil.
  • Trong không gian Euclid $\mathbb{R}^n$, tích vô hướng $\vec{u} \cdot \vec{v}$ cho biết “mức độ cùng hướng” của hai vectơ. Tương tự, $\langle P, Q \rangle_{\mathrm{NT}}$ đo “mức độ phụ thuộc” giữa hai điểm trên $E$.
  • $\langle P, P \rangle = 2\hat{h}(P) = $ “chiều dài bình phương” của $P$.
  • $\langle P, Q \rangle = 0$: $P$ và $Q$ “độc lập” (trực giao).
  • $|\langle P, Q \rangle|$ lớn: $P$ và $Q$ “gần song song”.
  • Phép tương tự hoàn chỉnh: ghép đôi chiều cao biến nhóm Mordell--Weil thành “lưới Euclid”, giống như tích vô hướng biến $\mathbb{Z}^n$ thành lưới trong $\mathbb{R}^n$.

Liên hệ với giả thuyết Birch--Dyer

Ghép đôi chiều cao trong BSD.
  • Ma trận Gram $\to$ Regulator: $\mathrm{Reg}_E = \det(G)$ với $G_{ij} = \langle P_i, P_j \rangle$. Ma trận $G$ mã hóa toàn bộ “hình học” lưới Mordell--Weil.
  • Gross--Zagier chi tiết: $L'(E, 1) = \frac{\deg(\phi)}{c_\infty^2} \cdot \hat{h}(y_K) \cdot (\text{thừa số Euler})$, trong đó $\hat{h}(y_K) = \frac{1}{2}\langle y_K, y_K \rangle$ [gross-zagier1986]. Ghép đôi chiều cao là công cụ chính để “đo” điểm Heegner.
  • BSD mạnh tổng quát: Trên trường số $K$, ghép đôi chiều cao tổng quát cho phép xây dựng regulator $\mathrm{Reg}_{E/K}$ cho BSD trên $K$.
70 Chiều cao cục bộ Néron (Néron local height $\lambda_v$) Ch.6 7

Định nghĩa

Định nghĩa (Chiều cao cục bộ Néron). Cho $E/\mathbb{Q}$ và $v$ là một phép định giá trên $\mathbb{Q}$ ($v = p$ hữu hạn hoặc $v = \infty$ Archimedean). Chiều cao cục bộ Néron (Néron local height) tại $v$ là hàm [neron1965, silverman1994]:
\[ \lambda_v: E(\mathbb{Q}_v) \setminus \{\mathcal{O}\} \to \mathbb{R} \]
sao cho chiều cao Néron--Tate phân tách thành tổng đóng góp cục bộ:
\[ \hat{h}(P) = \sum_{v} \lambda_v(P) = \lambda_\infty(P) + \sum_{p \text{ nguyên tố}} \lambda_p(P). \]

Cụ thể hơn:

  • $\lambda_\infty(P)$: đóng góp Archimedean, tính qua hàm sigma $\sigma(z; \Lambda_E)$ liên quan đến uniformization $E(\mathbb{C}) \cong \mathbb{C}/\Lambda_E$.
  • $\lambda_p(P)$ ($p$ nguyên tố): đóng góp $p$-adic, phụ thuộc vào kiểu rút gọn tại $p$ và vị trí của $P$ modulo $p$.

Ví dụ

Ví dụ (Phân tách chiều cao cho $E: y^2 + y = x^3 - x$ (37a1)). Với $P = (0, 0)$, $\hat{h}(P) \approx 0.0511$:
  • $\lambda_\infty(P)$: đóng góp Archimedean, tính qua phần thực/ảo của $z_P$ trên $\mathbb{C}/\Lambda_E$.
  • $\lambda_{37}(P)$: đóng góp tại $p = 37$ (rút gọn xấu duy nhất, vì conductor $= 37$). Phụ thuộc vào vị trí của $P$ modulo 37.
  • $\lambda_p(P) = 0$ cho $p \neq 37$ (rút gọn tốt, và $P$ nằm trong thành phần đơn vị).
Tổng: $\hat{h}(P) = \lambda_\infty(P) + \lambda_{37}(P) \approx 0.0511$.

Ý nghĩa trực giác

Chiều cao = tổng các “đóng góp địa phương”.
  • Phép tương tự: chiều cao tổng thể $\hat{h}(P)$ giống “thuế tổng” mà điểm $P$ phải trả. Mỗi “cơ quan thuế cục bộ” $v$ thu $\lambda_v(P)$: thuế Archimedean ($\lambda_\infty$) đo “kích thước thực”, thuế $p$-adic ($\lambda_p$) đo “mức chia hết cho $p$”.
  • Rút gọn tốt: Khi $E$ có rút gọn tốt tại $p$ và $P$ nằm “ở vị trí tốt”, $\lambda_p(P) = 0$ --- không đóng thuế tại $p$.
  • Rút gọn xấu: Khi rút gọn xấu, $\lambda_p$ có thể khác 0 --- đường cong “phức tạp” tại $p$ buộc điểm trả thêm “thuế”.
  • Triết lý cục bộ-toàn cục: Phân tách $\hat{h} = \sum_v \lambda_v$ thể hiện nguyên lý Hasse--Minkowski --- thông tin toàn cục (chiều cao) được lắp ghép từ thông tin cục bộ (tại mỗi $v$).

Liên hệ với giả thuyết Birch--Dyer

Chiều cao cục bộ trong BSD.
  • Gross--Zagier cục bộ: Công thức Gross--Zagier gốc tính $\hat{h}(P_K)$ bằng cách tách thành $\sum_v \lambda_v(P_K)$ và tính từng đóng góp --- phần Archimedean liên hệ với $L'(E, 1)$, phần hữu hạn liên hệ với số giao trên mô hình Néron [gross-zagier1986].
  • Yuan--Zhang--Zhang: Phiên bản tổng quát hóa Gross--Zagier (2013) dùng chiều cao cục bộ Néron trên mô hình tích phân để tính $\hat{h}(P_K)$ cho conductor tổng quát [yuan-zhang-zhang2013].
  • Số Tamagawa: Đóng góp $\lambda_p$ tại $p$ rút gọn xấu liên quan đến số Tamagawa $c_p$ --- cả hai đều đo “mức độ xấu” tại $p$.
71 Regulator (bộ điều chỉnh) (Regulator $R_E$) Ch.3 6

Định nghĩa

Định nghĩa (Regulator). Cho $E/\mathbb{Q}$ có hạng $r$ với các điểm sinh tự do $P_1, \ldots, P_r$ (cơ sở của $E(\mathbb{Q})/E(\mathbb{Q})_{\mathrm{tors}} \cong \mathbb{Z}^r$). Bộ điều chỉnh (regulator) (hay regulator) là [silverman2009]:
\[ \mathrm{Reg}(E/\mathbb{Q}) = \det \bigl( \langle P_i, P_j \rangle_{\mathrm{NT}} \bigr)_{1 \leq i, j \leq r}, \]
trong đó $\langle P_i, P_j \rangle_{\mathrm{NT}} = \hat{h}(P_i + P_j) - \hat{h}(P_i) - \hat{h}(P_j)$ là ghép đôi chiều cao Néron--Tate.

Khi $r = 0$: $\mathrm{Reg}(E/\mathbb{Q}) = 1$ (quy ước).

$\mathrm{Reg}(E/\mathbb{Q})$ không phụ thuộc vào chọn cơ sở: hai cơ sở bất kỳ liên hệ qua ma trận $M \in \mathrm{GL}_r(\mathbb{Z})$ (có $\det(M) = \pm 1$), nên $\det(M^T G M) = \det(G)$ [silverman2009].

Ví dụ

Ví dụ (Tính regulator cho các đường cong cụ thể).
  1. Hạng 0: $E: y^2 = x^3 + 1$. $r = 0$, nên $\mathrm{Reg} = 1$.
  2. Hạng 1: $E: y^2 = x^3 - 2$, điểm sinh $P = (3, 5)$:
    \[ \mathrm{Reg} = 2\hat{h}(P) = 2 \times 1.323 \approx 2.646. \]
  3. Hạng 1: $E: y^2 + y = x^3 - x$ (37a1), điểm sinh $P = (0, 0)$:
    \[ \mathrm{Reg} = 2\hat{h}(P) \approx 0.1022. \]
    Regulator nhỏ vì điểm sinh có chiều cao rất thấp.
  4. Hạng 2: $E: y^2 = x^3 + x^2 - 2x$ (389a1), hai điểm sinh $P_1 = (0, 0)$, $P_2 = (-1, 1)$:
    \[ \mathrm{Reg} = \det \begin{pmatrix} 2\hat{h}(P_1) & \langle P_1, P_2 \rangle \\ \langle P_2, P_1 \rangle & 2\hat{h}(P_2) \end{pmatrix} \approx 0.1525. \]

Ý nghĩa trực giác

Regulator = “thể tích” lưới Mordell--Weil.
  • Ghép đôi Néron--Tate biến $E(\mathbb{Q})/\text{tors}$ thành “lưới” trong $\mathbb{R}^r$. Regulator là thể tích miền cơ bản của lưới này.
  • Regulator nhỏ: các điểm sinh “gần nhau” hoặc “gần phụ thuộc” $\Rightarrow$ lưới “dẹt” $\Rightarrow$ thể tích nhỏ.
  • Regulator lớn: các điểm sinh “xa nhau” và “độc lập mạnh” $\Rightarrow$ lưới “tròn” $\Rightarrow$ thể tích lớn.
  • Phép tương tự: giống thể tích hình hộp tạo bởi $r$ vectơ. Nếu vectơ gần song song, thể tích nhỏ; nếu vuông góc, thể tích lớn.

Tương tự với trường số: Regulator $R_K$ của trường số $K$ đo thể tích lưới đơn vị (qua logarithm đơn vị). Regulator $\mathrm{Reg}_E$ đóng vai trò tương tự cho “trường” $E(\mathbb{Q})$. Đây là một phần của tương tự BSD--công thức số lớp.

Liên hệ với giả thuyết Birch--Dyer

Regulator trong BSD. $\mathrm{Reg}_E$ là thành phần thiết yếu trong BSD mạnh:
  • Công thức BSD mạnh:
    \[ \frac{L^{(r)}(E, 1)}{r!} = \frac{|\mathrm{Sha}(E/\mathbb{Q})| \cdot \mathrm{Reg}(E/\mathbb{Q}) \cdot \Omega_E \cdot \prod_p c_p}{|E(\mathbb{Q})_{\mathrm{tors}}|^2}. \]
  • Khó tính: Tính $\mathrm{Reg}_E$ yêu cầu biết đầy đủ tập sinh Mordell--Weil --- đây là phần khó nhất! Cho hạng 1, cần tìm điểm sinh; cho hạng $\geq 2$, cần tìm $r$ điểm sinh độc lập.
  • Tương quan với $|\mathrm{Sha}|$: BSD mạnh nói $L^{(r)}/r!$ là tích $|\mathrm{Sha}| \cdot \mathrm{Reg} \cdot (\ldots)$. Nếu $\mathrm{Reg}$ lớn (điểm sinh “tốt”), thì $|\mathrm{Sha}|$ có thể nhỏ. Ngược lại, $\mathrm{Reg}$ nhỏ $\Rightarrow$ $|\mathrm{Sha}|$ lớn để bù đắp.
  • Gross--Zagier: Khi $r = 1$, $\mathrm{Reg} = 2\hat{h}(P)$, và Gross--Zagier cho $L'(E, 1) = c \cdot \hat{h}(P_K)$. Đây là bằng chứng trực tiếp BSD cho hạng 1 [gross-zagier1986].
72 Hàm zeta Riemann (Riemann zeta function $\zeta(s)$) Ch.4 4

Định nghĩa

Định nghĩa (Hàm zeta Riemann). Với $s \in \mathbb{C}$ có $\mathrm{Re}(s) > 1$, hàm zeta Riemann (Riemann zeta function) được định nghĩa bởi [riemann1859]:
\[ \zeta(s) = \sum_{n=1}^{\infty} \frac{1}{n^s} = \frac{1}{1^s} + \frac{1}{2^s} + \frac{1}{3^s} + \cdots \]
Chuỗi hội tụ tuyệt đối khi $\mathrm{Re}(s) > 1$.

Tích Euler: $\zeta(s)$ có biểu diễn tích trên tất cả số nguyên tố:

\[ \zeta(s) = \prod_{p \text{ nguyên tố}} \frac{1}{1 - p^{-s}}, \quad \mathrm{Re}(s) > 1. \]
Tích Euler mã hóa phân tích duy nhất thành thừa số nguyên tố (Định lý cơ bản số học).

$\zeta(s)$ có thác triển giải tích thành hàm phân hình trên toàn bộ $\mathbb{C}$, với cực đơn duy nhất tại $s = 1$ (thặng dư $= 1$). Phương trình hàm:

\[ \pi^{-s/2}\, \Gamma(s/2)\, \zeta(s) = \pi^{-(1-s)/2}\, \Gamma((1-s)/2)\, \zeta(1-s), \]
cho thấy đối xứng $s \leftrightarrow 1 - s$ quanh đường $\mathrm{Re}(s) = 1/2$ [riemann1859].

Ví dụ

Ví dụ (Các giá trị đặc biệt của $\zeta(s)$).
  1. $\zeta(2) = \frac{\pi^2}{6}$ (Euler, 1735). Bài toán Basel nổi tiếng.
  2. $\zeta(4) = \frac{\pi^4}{90}$, $\zeta(6) = \frac{\pi^6}{945}$, \ldots\ Tổng quát: $\zeta(2k) = \frac{(-1)^{k+1} (2\pi)^{2k} B_{2k}}{2(2k)!}$ với $B_{2k}$ là số Bernoulli.
  3. $\zeta(3) \approx 1.202$ (hằng số Apéry). Apéry (1978) chứng minh $\zeta(3)$ vô tỉ --- nhưng $\zeta(5), \zeta(7), \ldots$ vẫn chưa biết có vô tỉ không!
  4. Giá trị âm: $\zeta(-1) = -\frac{1}{12}$ (“$1 + 2 + 3 + \cdots = -1/12$” theo nghĩa thác triển). $\zeta(0) = -1/2$. Nghiệm “tầm thường”: $\zeta(-2) = \zeta(-4) = \cdots = 0$.

Ý nghĩa trực giác

$\zeta(s)$ --- “kính hiển vi” nhìn số nguyên tố.
  • Tích Euler = máy quét DNA: Mỗi thừa số $(1 - p^{-s})^{-1}$ “mã hóa” thông tin về số nguyên tố $p$. Nhân tất cả lại thu được toàn bộ thông tin về phân bố số nguyên tố.
  • Cực tại $s = 1$: $\zeta(s) \to \infty$ khi $s \to 1^+$ vì chuỗi điều hòa $\sum 1/n$ phân kỳ. Tốc độ phát tán mã hóa mật độ số nguyên tố --- suy ra Định lý Số nguyên tố: $\pi(x) \sim x/\ln x$.
  • Đường tới hạn $\mathrm{Re}(s) = 1/2$: Giả thuyết Riemann dự đoán mọi nghiệm không tầm thường nằm trên đường này. Nếu đúng, sai số trong $\pi(x) \approx \mathrm{Li}(x)$ tối ưu: $|\pi(x) - \mathrm{Li}(x)| = O(\sqrt{x} \log x)$.

Liên hệ với giả thuyết Birch--Dyer

$\zeta(s)$ và BSD. Hàm zeta Riemann là “tổ tiên” của hàm $L(E, s)$ trong BSD:
  • Hàm $L$ của $E$ mô phỏng $\zeta$: $L(E, s) = \prod_p L_p(E, s)$ --- tích Euler giống $\zeta(s)$, nhưng mỗi thừa số $L_p = (1 - a_p p^{-s} + p^{1-2s})^{-1}$ mang thông tin về đường cong $E$ tại $p$ (thay vì chỉ “$p$ tồn tại”).
  • Phương trình hàm: $\zeta$ có đối xứng $s \leftrightarrow 1 - s$. Hàm $L(E, s)$ có đối xứng $s \leftrightarrow 2 - s$ (tâm đối xứng tại $s = 1$ --- đúng nơi BSD quan tâm).
  • Chuỗi bài toán thiên niên kỷ: Giả thuyết Riemann (cho $\zeta$) và giả thuyết BSD (cho $L(E, s)$) đều nằm trong 7 bài toán thiên niên kỷ Clay. Cả hai đều hỏi: “nghiệm/bậc triệt tiêu của hàm $L$ nói gì về đối tượng số học?”
  • Tương tự: $\zeta(s) \neq 0$ tại $s = 1$ (cực!) $\Leftrightarrow$ có vô hạn số nguyên tố. Tương tự, $L(E, 1) \neq 0$ $\Leftrightarrow$ (theo BSD) $E(\mathbb{Q})$ hữu hạn.
73 Giả thuyết Riemann (Riemann Hypothesis) Ch.4 5

Định nghĩa hình thức

Giả thiết (Giả thuyết Riemann). Hàm zeta Riemann $\zeta(s) = \sum_{n=1}^{\infty} n^{-s}$ (với $\mathrm{Re}(s) > 1$) có thác triển giải tích thành hàm phân hình trên $\mathbb{C}$. Các nghiệm không tầm thường (non-trivial zeros) của $\zeta(s)$ --- tức các $s$ với $\zeta(s) = 0$ và $0 < \mathrm{Re}(s) < 1$ --- đều nằm trên đường tới hạn $\mathrm{Re}(s) = 1/2$ [riemann1859].

Nói cách khác: nếu $\zeta(\sigma + it) = 0$ với $0 < \sigma < 1$, thì $\sigma = 1/2$.

Hàm $\zeta(s)$ cũng có các nghiệm tầm thường tại $s = -2, -4, -6, \ldots$ (do thừa số $\Gamma$ trong phương trình hàm). Giả thuyết Riemann chỉ nói về các nghiệm “thú vị” nằm trong dải tới hạn $0 < \mathrm{Re}(s) < 1$.

Trạng thái: Đây là một trong 7 Bài toán Thiên niên kỷ (Clay Millennium Problems), treo thưởng 1 triệu đô la. Tính đến nay, hơn $10^{13}$ nghiệm không tầm thường đầu tiên đã được kiểm chứng bằng máy tính --- tất cả đều nằm trên đường $\mathrm{Re}(s) = 1/2$ --- nhưng chưa ai chứng minh được cho tất cả.

Ví dụ

Ví dụ (Các nghiệm không tầm thường đầu tiên). Nghiệm không tầm thường đầu tiên của $\zeta(s)$ nằm tại:
\[ s = \frac{1}{2} + 14.1347\ldots\, i, \qquad s = \frac{1}{2} + 21.0220\ldots\, i, \qquad s = \frac{1}{2} + 25.0109\ldots\, i. \]
Tất cả đều có phần thực $= 1/2$, đúng như Giả thuyết Riemann dự đoán.

Phần ảo $t$ mang ý nghĩa “tần số”: $\zeta(1/2 + it) = 0$ tại các $t$ cụ thể, tương tự cách một sóng âm triệt tiêu tại những thời điểm nhất định.

Ý nghĩa trực giác

Giả thuyết Riemann --- “nhịp tim” của số nguyên tố.
  • Nghiệm = tần số dao động: Riemann phát hiện rằng hàm đếm số nguyên tố $\pi(x)$ (số lượng số nguyên tố $\leq x$) có thể viết như tổng “sóng”, mỗi sóng ứng với một nghiệm $\rho$ của $\zeta(s)$. Nếu mọi $\rho$ có $\mathrm{Re}(\rho) = 1/2$, các sóng dao động đều đặn --- số nguyên tố phân bố “đều nhất có thể”.
  • Nếu có nghiệm lệch: Một nghiệm với $\mathrm{Re}(\rho) > 1/2$ sẽ tạo sóng biên độ lớn, gây “sai số lớn” trong $\pi(x) \approx \mathrm{Li}(x)$. Giả thuyết Riemann nói sai số này tối ưu: $|\pi(x) - \mathrm{Li}(x)| = O(\sqrt{x} \log x)$.
  • Tương tự vật lý: Nghĩ nghiệm $\zeta$ như tần số riêng của “trống số nguyên tố”. Giả thuyết Riemann $\Leftrightarrow$ mọi tần số riêng nằm trên một đường thẳng duy nhất --- gợi ý có cấu trúc ẩn rất sâu.

Liên hệ với giả thuyết Birch--Dyer

Giả thuyết Riemann và BSD.
  • Hai bài toán thiên niên kỷ song sinh: Cả Giả thuyết Riemann (cho $\zeta$) và Giả thuyết BSD (cho $L(E,s)$) đều thuộc 7 bài toán Clay. Cả hai đều hỏi: “nghiệm/bậc triệt tiêu của hàm $L$ mang thông tin gì về đối tượng số học?”
  • Giả thuyết Riemann tổng quát (GRH): Phiên bản mở rộng cho hàm $L(E,s)$ dự đoán mọi nghiệm không tầm thường nằm trên $\mathrm{Re}(s) = 1$. Nếu GRH đúng cho $L(E,s)$, nhiều kết quả về hạng elliptic sẽ được cải thiện đáng kể [silverman2009].
  • “Giả thuyết Riemann cục bộ”: Cận Hasse $|a_p| \leq 2\sqrt{p}$ chính là “Giả thuyết Riemann cho hàm zeta cục bộ” --- và đã được Hasse chứng minh (1933). Deligne (1974) chứng minh cho đa tạp bất kỳ [deligne1974].
74 Tích Euler (Euler product) Ch.4 4

Định nghĩa hình thức

Định nghĩa (Tích Euler). Tích Euler (Euler product) là biểu diễn một chuỗi Dirichlet $L(s) = \sum_{n=1}^{\infty} a_n n^{-s}$ dưới dạng tích vô hạn lấy trên các số nguyên tố:
\[ L(s) = \prod_{p \text{ nguyên tố}} L_p(s), \]
trong đó mỗi thừa số Euler (Euler factor) $L_p(s)$ chỉ phụ thuộc vào số nguyên tố $p$ [serre1973].

Ví dụ cơ bản nhất: $\zeta(s) = \prod_p (1 - p^{-s})^{-1}$ (Euler, 1737). Ở đây $L_p(s) = (1 - p^{-s})^{-1}$ là nghịch đảo đa thức bậc 1 theo $p^{-s}$.

Đẳng thức tích Euler tương đương với Định lý cơ bản của số học (phân tích nguyên tố duy nhất). Đây là cầu nối giữa thế giới giải tích (chuỗi, tích phân) và thế giới số học (số nguyên tố).

Ví dụ

Ví dụ (Tích Euler của $L(E,s)$). Cho $E/\mathbb{Q}$ đường cong elliptic với conductor $N$. Tích Euler là [silverman2009]:
\[ L(E, s) = \prod_{p \nmid N} \frac{1}{1 - a_p p^{-s} + p^{1-2s}} \cdot \prod_{p \mid N} \frac{1}{1 - a_p p^{-s}}, \]
trong đó:
  • Tại $p$ khử tốt: thừa số Euler là đa thức bậc 2 theo $p^{-s}$. Nó phân tích thành $(1 - \alpha_p p^{-s})^{-1}(1 - \beta_p p^{-s})^{-1}$ với $\alpha_p \beta_p = p$ và $\alpha_p + \beta_p = a_p$.
  • Tại $p$ khử xấu: thừa số Euler chỉ bậc 1 (“thoái hóa”), với $a_p \in \{-1, 0, 1\}$.

Ví dụ số: Đường cong $y^2 + y = x^3 - x^2$ (conductor $N = 11$):

\[ L(E,s) = \frac{1}{1 + 11^{-s}} \cdot \frac{1}{1 + 2^{-s} + 2^{1-2s}} \cdot \frac{1}{1 - 3^{1-2s}} \cdot \frac{1}{1 - 2 \cdot 5^{-s} + 5^{1-2s}} \cdots \]

Ý nghĩa trực giác

Tích Euler = “máy quét DNA” số nguyên tố.
  • Từ cục bộ đến toàn cục: Mỗi thừa số $L_p(E,s)$ chỉ chứa thông tin “cục bộ” về $E$ tại $p$ --- tức số điểm $\#E(\mathbb{F}_p)$ quy đổi thành $a_p$. Nhưng khi nhân tất cả lại, ta thu được thông tin “toàn cục” sâu sắc.
  • Bậc thừa số = chiều đối đồng điều: Thừa số Euler của $\zeta(s)$ có bậc 1 (vì “đối tượng đếm” $\mathbb{Z}/p\mathbb{Z}$ có chiều 0). Thừa số Euler của $L(E,s)$ có bậc 2 (vì đường cong elliptic có $\dim H^1 = 2$). Tổng quát, đa tạp chiều $d$ cho thừa số bậc $= \dim H^i$ [serre1973].
  • Sàng Eratosthenes giải tích: Chứng minh tích Euler cho $\zeta(s)$ giống sàng Eratosthenes --- lần lượt “loại bỏ” bội của $2, 3, 5, \ldots$ khỏi chuỗi. Kết quả: mỗi số nguyên dương xuất hiện đúng 1 lần nhờ phân tích nguyên tố duy nhất.

Liên hệ với giả thuyết Birch--Dyer

Tích Euler trong BSD.
  • Triết lý BSD: Giả thuyết BSD khẳng định rằng hành vi tại $s = 1$ của tích Euler $L(E,s)$ “biết” hạng $r$ của $E(\mathbb{Q})$. Đây là kết quả đáng kinh ngạc: thông tin cục bộ (đếm điểm mod $p$ cho từng $p$) xác định tính chất toàn cục (hạng).
  • Tích hữu hạn của Birch--Dyer: Birch và Swinnerton-Dyer (1960s) khảo sát tích hữu hạn $\Pi_E(X) = \prod_{p \leq X} \#E(\mathbb{F}_p)/p$ và phát hiện nó tăng $\sim C \cdot (\log X)^r$. Đây chính là động lực ban đầu cho giả thuyết BSD [birch-sd1965].
  • Sự hội tụ: Tích Euler $L(E,s)$ hội tụ khi $\mathrm{Re}(s) > 3/2$ (nhờ cận Hasse $|a_p| \leq 2\sqrt{p}$). Điểm $s = 1$ nằm ngoài miền hội tụ --- đây là lý do cần thác triển giải tích.
75 Chuỗi Dirichlet (Dirichlet series) Ch.4 4

Định nghĩa hình thức

Định nghĩa (Chuỗi Dirichlet). Chuỗi Dirichlet (Dirichlet series) là chuỗi dạng [serre1973]:
\[ L(s) = \sum_{n=1}^{\infty} \frac{a_n}{n^s}, \]
trong đó $\{a_n\}_{n \geq 1}$ là dãy số phức (gọi là các hệ số Dirichlet) và $s \in \mathbb{C}$ là biến phức.

Chuỗi Dirichlet hội tụ tuyệt đối trong nửa mặt phẳng $\mathrm{Re}(s) > \sigma_a$ với một hằng số $\sigma_a \in [-\infty, +\infty]$ gọi là hoành độ hội tụ tuyệt đối (abscissa of absolute convergence).

Các ví dụ cơ bản:

  • $a_n = 1$ cho mọi $n$: $L(s) = \zeta(s)$, hoành độ hội tụ $\sigma_a = 1$.
  • $a_n = \chi(n)$ (đặc trưng Dirichlet): $L(s) = L(s, \chi)$, hoành độ $\sigma_a = 1$.
  • $a_n$ = hệ số Fourier dạng modular: $L(s) = L(f, s)$, hoành độ $\sigma_a = (k+1)/2$ (với $k$ là trọng số).

Ví dụ

Ví dụ (Chuỗi Dirichlet của $L(E,s)$). Cho đường cong $E\colon y^2 + y = x^3 - x^2$ (conductor 11) với $a_2 = -1$, $a_3 = 0$, $a_5 = 2$, $a_7 = -1$. Chuỗi Dirichlet:
\[\begin{aligned} L(E, s) &= \sum_{n=1}^{\infty} \frac{a_n}{n^s} \\ &= \frac{1}{1^s} + \frac{-1}{2^s} + \frac{0}{3^s} + \frac{-1}{4^s} + \frac{2}{5^s} + \frac{0}{6^s} + \frac{-1}{7^s} + \frac{3}{8^s} + \frac{-3}{9^s} + \cdots \end{aligned}\]
Các hệ số $a_n$ với $n$ hợp số được tính từ $a_p$ bằng:
  • Truy hồi: $a_{p^k} = a_p \cdot a_{p^{k-1}} - p \cdot a_{p^{k-2}}$ (với $p \nmid N$). Ví dụ: $a_4 = a_2^2 - 2 = 1 - 2 = -1$, $a_9 = a_3^2 - 3 = -3$.
  • Nhân tính: $a_{mn} = a_m \cdot a_n$ khi $\gcd(m,n) = 1$. Ví dụ: $a_6 = a_2 \cdot a_3 = 0$.

Ý nghĩa trực giác

Chuỗi Dirichlet = “chuỗi Fourier số học”.
  • Tương tự chuỗi lũy thừa: Chuỗi lũy thừa $\sum a_n z^n$ mã hóa dãy $\{a_n\}$ bằng lũy thừa của biến $z$. Chuỗi Dirichlet $\sum a_n n^{-s}$ cũng mã hóa $\{a_n\}$, nhưng bằng lũy thừa $n^{-s}$ --- thay “đếm” (thứ tự $n$) bằng “đo” (kích thước $n$).
  • Tích Euler $\leftrightarrow$ tính nhân tính: Nếu $a_n$ nhân tính ($a_{mn} = a_m a_n$ khi $\gcd(m,n) = 1$), thì chuỗi Dirichlet có tích Euler. Đây là phản ánh giải tích của phân tích nguyên tố duy nhất.
  • Biến đổi Mellin: Chuỗi Dirichlet liên hệ với dạng modular qua biến đổi Mellin: $L(f, s) = (2\pi)^s \Gamma(s)^{-1} \int_0^{\infty} f(it)\, t^{s-1}\, dt$. Đây là cầu nối giữa “chuỗi Fourier” ($q$-expansion) và “chuỗi Dirichlet” ($n^{-s}$-expansion).

Liên hệ với giả thuyết Birch--Dyer

Chuỗi Dirichlet trong BSD.
  • Hàm $L(E,s)$ là chuỗi Dirichlet: $L(E,s) = \sum a_n n^{-s}$, trong đó $a_n$ xác định hoàn toàn bởi các $a_p$ (lượng sai Frobenius) qua truy hồi và tính nhân tính.
  • Hội tụ và $s = 1$: Chuỗi Dirichlet hội tụ tuyệt đối khi $\mathrm{Re}(s) > 3/2$, nhưng BSD cần giá trị tại $s = 1$ --- do đó cần thác triển giải tích (thông qua modularity).
  • BSD mạnh: Công thức BSD mạnh $\lim_{s \to 1} L(E,s)/(s-1)^r = (\Omega_E \cdot \mathrm{Reg}_E \cdot \prod c_p \cdot |\mathrm{Sha}|) / |E(\mathbb{Q})_{\mathrm{tors}}|^2$ liên hệ các hệ số $a_n$ của chuỗi Dirichlet với các bất biến số học [birch-sd1965].
76 Hàm L Hasse–Weil (Hasse–Weil L-function $L(E,s)$) Ch.4 6

Định nghĩa hình thức

Định nghĩa (Hàm $L$ Hasse--Weil). Cho $E/\mathbb{Q}$ đường cong elliptic với conductor $N$. Hàm $L$ Hasse--Weil (Hasse--Weil L-function) là hàm phức xác định bởi tích Euler [silverman2009]:
\[ L(E, s) = \prod_{p \text{ nguyên tố}} L_p(E, s)^{-1}, \]
trong đó thừa số Euler tại $p$ là:
  • Nếu $p \nmid N$ (khử tốt): $L_p(E, s)^{-1} = (1 - a_p p^{-s} + p^{1-2s})^{-1}$, với $a_p = p + 1 - \#E(\mathbb{F}_p)$.
  • Nếu $p \mid N$ (khử xấu): $L_p(E, s)^{-1} = (1 - a_p p^{-s})^{-1}$, với:
    \[ a_p = \begin{cases} +1 & \text{khử nhân tách (split multiplicative)}, \\ -1 & \text{khử nhân không tách (non-split multiplicative)}, \\ 0 & \text{khử cộng (additive)}. \end{cases} \]
Tích hội tụ tuyệt đối khi $\mathrm{Re}(s) > 3/2$ và (nhờ Định lý modularity) có thác triển thành hàm nguyên trên $\mathbb{C}$ [wiles1995, bcdt2001].

Hàm $L(E,s)$ còn thỏa mãn phương trình hàm: đặt $\Lambda(E, s) = N^{s/2}(2\pi)^{-s}\Gamma(s)\, L(E,s)$, thì $\Lambda(E, s) = w_E \cdot \Lambda(E, 2-s)$ với $w_E \in \{+1, -1\}$ là dấu gốc [diamond-shurman2005].

Ví dụ

Ví dụ (Tính $L(E, 1)$ cho các đường cong cụ thể).
  1. $E\colon y^2 + y = x^3 - x^2$ (conductor 11, hạng $r = 0$).

    Dấu gốc $w_E = +1$. Giá trị:

    \[ L(E, 1) = 0.2538\ldots \neq 0. \]
    Theo BSD: $r = 0$ $\Leftrightarrow$ $L(E,1) \neq 0$. Đúng! $E(\mathbb{Q})$ hữu hạn (chỉ có nhóm xoắn $\mathbb{Z}/5\mathbb{Z}$).
  2. $E\colon y^2 + y = x^3 - x$ (conductor 37, hạng $r = 1$).

    Dấu gốc $w_E = -1$, nên $L(E,1) = 0$ (bắt buộc do phương trình hàm). Đạo hàm:

    \[ L'(E, 1) = 0.3059\ldots \neq 0. \]
    Theo BSD: $\mathrm{ord}_{s=1} L(E,s) = 1$ $\Leftrightarrow$ $r = 1$. Đúng! $E(\mathbb{Q}) \cong \mathbb{Z}$, sinh bởi $P = (0, 0)$.
  3. $E\colon y^2 = x^3 - 43x + 166$ (conductor 5077, hạng $r = 2$).

    $L(E,1) = L'(E,1) = 0$, $L''(E,1) \neq 0$. Theo BSD: $r = 2$. Đúng!

Ý nghĩa trực giác

Hàm $L(E,s)$ --- “vân tay giải tích” của đường cong elliptic.
  • Từ cục bộ đến toàn cục: Số điểm $\#E(\mathbb{F}_p)$ cho từng $p$ riêng lẻ chỉ là thông tin cục bộ, nhưng hàm $L(E,s)$ --- được xây dựng bằng cách “nhân tất cả lại” --- chứa thông tin toàn cục sâu sắc.
  • So sánh với $\zeta(s)$: $\zeta(s)$ mã hóa “mọi số nguyên tố tồn tại” (thừa số bậc 1). $L(E,s)$ mã hóa “$E$ trông thế nào tại mỗi $p$” (thừa số bậc 2). Bậc thừa số phản ánh chiều: $\mathbb{Z}/p\mathbb{Z}$ chiều 0, đường cong chiều 1.
  • Đối xứng qua $s = 1$: Phương trình hàm $\Lambda(E, s) = w_E \Lambda(E, 2-s)$ cho đối xứng qua $s = 1$ --- “trung tâm” là nơi BSD khảo sát.

Ý nghĩa hình học của hàm $L$

Hàm $L$ không chỉ là công cụ giải tích thuần túy --- nó mang ý nghĩa hình học sâu sắc, kết nối nhiều lĩnh vực của toán học.

Hàm $L$ và hình học --- năm góc nhìn.
  1. Hàm zeta cục bộ đếm “hình dạng” của đường cong.

    Tại mỗi số nguyên tố $p$, rút gọn $E \pmod{p}$ cho đường cong $\tilde{E}/\mathbb{F}_p$. Hàm zeta cục bộ

    \[Z(\tilde{E}/\mathbb{F}_p, T) = \frac{1 - a_p T + pT^2}{(1-T)(1-pT)}\]

    có dạng “tôpô”: tử số tương ứng $H^1$ (đối đồng điều bậc 1), mẫu số tương ứng $H^0$ và $H^2$. Đây chính là công thức vết Lefschetz: số điểm bất động của ánh xạ Frobenius $\phi_p$ trên $\tilde{E}$ bằng tổng luân phiên các vết trên đối đồng điều étale [deligne1974, weil1949]:

    \[\#\tilde{E}(\mathbb{F}_p) = \sum_{i=0}^{2} (-1)^i \mathrm{Tr}(\phi_p \mid H^i_{\text{ét}}(\tilde{E}, \mathbb{Q}_\ell)).\]

    Vậy $a_p$ chính là vết của Frobenius trên $H^1$, và hàm $L(E,s)$ “ghi lại hình dạng đối đồng điều” của $E$ tại mọi $p$.

  2. Đường cong elliptic là xuyến (torus) phức.

    Trên $\mathbb{C}$, mỗi đường cong elliptic $E$ đồng cấu với xuyến $\mathbb{C}/\Lambda$ cho lưới $\Lambda = \mathbb{Z}\omega_1 + \mathbb{Z}\omega_2$ [silverman2009]. Chu kỳ thực (real period)

    \[\Omega_E = \int_{E(\mathbb{R})} \left|\frac{dx}{2y + a_1 x + a_3}\right|\]

    chính là “chu vi” của xuyến theo hướng thực. Trong công thức BSD mạnh, $\Omega_E$ đóng vai trò thể tích --- giá trị đặc biệt $L^{(r)}(E,1)/r!$ tỉ lệ thuận với $\Omega_E$.

    Trực giác: hàm $L$ tại $s = 1$ “đo kích thước hình học” của đường cong.

  3. Số Tamagawa --- thể tích $p$-adic.

    Tại mỗi $p$ chia $N$ (conductor), số Tamagawa (Tamagawa number) $c_p = [E(\mathbb{Q}_p) : E_0(\mathbb{Q}_p)]$ đo “phần bị mất” khi rút gọn mod $p$. Tên gọi xuất phát từ lý thuyết độ đo Tamagawa trên nhóm đại số [bloch-kato1990]: nếu $G$ là nhóm đại số trên $\mathbb{Q}$, thể tích adelic $\mathrm{vol}(G(\mathbb{Q}) \backslash G(\mathbb{A}))$ (đo bằng độ đo Tamagawa) liên hệ trực tiếp với giá trị đặc biệt hàm $L$ của $G$. Công thức BSD mạnh là trường hợp đặc biệt của triết lý này.

  4. Regulator --- “thể tích” trong không gian chiều cao.

    Regulator $\mathrm{Reg}_E = \det(\langle P_i, P_j \rangle_{\mathrm{NT}})$ (định thức ma trận chiều cao Néron--Tate) đo “thể tích hình bình hành” sinh bởi các điểm sinh $P_1, \ldots, P_r$ của $E(\mathbb{Q})/E(\mathbb{Q})_{\mathrm{tors}}$. Đây là tương tự trực tiếp của regulator Dirichlet trong lý thuyết đơn vị trường số [lang1983, silverman2009].

    Trong công thức BSD mạnh:

    \[\frac{L^{(r)}(E,1)}{r!} = \frac{\Omega_E \cdot \mathrm{Reg}_E \cdot \prod_p c_p \cdot |\mathrm{Sha}|}{|E(\mathbb{Q})_{\mathrm{tors}}|^2},\]

    vế phải là tích các “thể tích”: $\Omega_E$ (thể tích Archimedean), $\mathrm{Reg}_E$ (thể tích trong không gian chiều cao), $c_p$ (thể tích $p$-adic). Vậy giá trị đặc biệt $L^{(r)}(E,1)/r!$ là một loại thể tích adelic --- thể tích đo trên tất cả các hoàn thành (thực + $p$-adic) cùng lúc [bloch-kato1990, tate1966].

  5. Phỏng đoán Weil --- “Giả thuyết Riemann” là hình học.

    Phỏng đoán Weil (1949) khẳng định hàm zeta cục bộ $Z(\tilde{E}/\mathbb{F}_p, T)$ có ba tính chất: (i) hữu tỉ, (ii) phương trình hàm, (iii) “Giả thuyết Riemann” ($|\alpha_p| = \sqrt{p}$). Weil nhận ra rằng cả ba tính chất đều có đối tác tôpô: (i) $\leftrightarrow$ hữu hạn chiều của đối đồng điều, (ii) $\leftrightarrow$ đối ngẫu Poincaré, (iii) $\leftrightarrow$ tính xác định dương của dạng giao [weil1949, deligne1974].

    Điều này dẫn Grothendieck xây dựng đối đồng điều étale (étale cohomology) --- “đối đồng điều đại số” hoạt động trên trường hữu hạn --- và Deligne (1974) chứng minh phỏng đoán Weil cho đa tạp bất kỳ. Vậy “Giả thuyết Riemann cục bộ” thực chất là một định lý hình học.

Giá trị đặc biệt hàm $L$ --- triết lý chung

Giá trị đặc biệt hàm $L$ tại các số nguyên mang ý nghĩa số học sâu sắc. Đây là một trong những chủ đề trung tâm của lý thuyết số hiện đại [bloch-kato1990].

Các giá trị đặc biệt nổi tiếng.
  1. Euler (1734): $\zeta(2) = \pi^2/6$. Đây là “chu kỳ” (period) --- $\pi$ xuất hiện vì hàm zeta liên quan đến lượng giác qua công thức $\sin(\pi z)/(\pi z) = \prod_{n=1}^{\infty}(1 - z^2/n^2)$ [edwards1974].
  2. Công thức số lớp Dirichlet (1837): Cho $K = \mathbb{Q}(\sqrt{-d})$ trường toàn phương ảo:
    \[L(1, \chi_d) = \frac{2\pi h_K}{w_K \sqrt{d}},\]
    với $h_K$ = số lớp, $w_K$ = số nghiệm đơn vị. Giá trị đặc biệt $L(1, \chi_d)$ “đếm lớp ideal” [davenport2000].
  3. Công thức thặng dư Dedekind: Cho trường số $K$ bậc $n$:
    \[\lim_{s \to 1} (s-1)\,\zeta_K(s) = \frac{2^{r_1}(2\pi)^{r_2} h_K R_K}{w_K \sqrt{|d_K|}},\]
    với $R_K$ = regulator Dirichlet (thể tích trong không gian logarit đơn vị), $h_K$ = số lớp [neukirch1999]. Đây là “nguyên mẫu” cho BSD mạnh.
  4. BSD (1965): Giá trị dẫn đầu $L^{(r)}(E,1)/r!$ bằng tích các bất biến số học (xem công thức ở trên). Đây là sự tổng quát hóa trực tiếp của công thức Dedekind [birch-sd1965, tate1966].
  5. Phỏng đoán Bloch--Kato (1990): Tổng quát cho motif (motive) $M$ bất kỳ: giá trị đặc biệt $L^*(M, n)$ (hệ số dẫn đầu tại $s = n$) bằng tích [bloch-kato1990]:
    \[L^*(M, n) \sim \frac{\text{period} \times \text{regulator} \times \text{Tamagawa} \times |\text{``Sha''}|}{|\text{torsion}|^2}.\]
    BSD là trường hợp $M = h^1(E)$, $n = 1$.
  6. Phỏng đoán Beilinson (1985): Cho $r > \dim M/2$ (ngoài miền tới hạn), giá trị đặc biệt liên hệ với regulator Beilinson --- ánh xạ từ $K$-theory đại số sang đối đồng điều Deligne.

Triết lý chung: Giá trị đặc biệt hàm $L$ tại số nguyên luôn là “thể tích” --- tích của chu kỳ (period) và regulator --- nhân với thông tin torsion (số Tamagawa, $\mathrm{Sha}$). Hàm $L$ là “cầu nối” giữa giải tích phức (zero, cực, giá trị) và hình học số học (đối đồng điều, $K$-theory, thể tích adelic).

Hàm $L$ trong vật lý và các lĩnh vực khác

Hàm $L$ ngoài toán học.
  1. Ma trận ngẫu nhiên và vật lý hạt nhân.

    Năm 1972, Hugh Montgomery phát hiện rằng phân bố khoảng cách giữa các zero của $\zeta(s)$ trên dải tới hạn khớp hoàn hảo với phân bố khoảng cách trị riêng của ma trận ngẫu nhiên trong GUE (Gaussian Unitary Ensemble) --- mô hình từ vật lý hạt nhân [katz-sarnak1999].

    Keating--Snaith (2000) dùng ma trận ngẫu nhiên dự đoán moment của hàm $L$:

    \[\int_0^T |\zeta(1/2 + it)|^{2k}\, dt \sim C_k \cdot T(\log T)^{k^2},\]

    với hằng số $C_k$ tính chính xác từ lý thuyết ma trận ngẫu nhiên. Cho họ đường cong elliptic, thống kê hạng liên hệ với phân bố trị riêng theo kiểu “orthogonal” hoặc “symplectic” tùy dấu gốc $w_E$.

  2. Hỗn loạn lượng tử (quantum chaos).

    Berry--Keating (1999) đề xuất rằng zero của $\zeta(s)$ là trị riêng của toán tử Hamilton $\hat{H} = \hat{x}\hat{p}$ trên không gian pha phù hợp --- kết nối Giả thuyết Riemann với phổ năng lượng hệ lượng tử.

  3. Mật mã học.

    Hàm $L$ liên hệ trực tiếp với bảo mật của mật mã đường cong elliptic (ECC). Bậc triệt tiêu $\mathrm{ord}_{s=1} L(E,s)$ quyết định hạng, mà hạng lớn $\Rightarrow$ nhiều điểm hữu tỉ $\Rightarrow$ rủi ro bảo mật. Thuật toán factoring ECM của Lenstra [lenstra1987] khai thác trực tiếp tính chất số học của $E(\mathbb{F}_p)$.

  4. Lý thuyết dây (string theory).

    Hàm phân hoạch trong lý thuyết dây liên hệ với dạng modular qua tích vô hạn Dedekind:

    \[\eta(\tau) = q^{1/24} \prod_{n=1}^{\infty}(1 - q^n), \quad q = e^{2\pi i \tau}.\]

    Dạng modular gắn với đường cong elliptic qua Định lý modularity, nên hàm $L(E,s)$ gián tiếp xuất hiện trong lý thuyết dây [diamond-shurman2005].

  5. Hình học phi giao hoán (Connes).

    Alain Connes [connes1999] xây dựng “hệ lượng tử số học” --- $C^*$-algebra mà phổ (spectrum) chứa zero của $\zeta(s)$ như “trị riêng thiếu” (missing spectral lines). Zero của hàm $L$ là “tần số cộng hưởng” của không gian số học.

  6. Chương trình Langlands --- “Đại thống nhất.”

    Robert Langlands (1967) đề xuất rằng mọi hàm $L$ “có ý nghĩa” (Artin, Hasse--Weil, $p$-adic, v.v.) đều là hàm $L$ tự đẳng cấu gắn với biểu diễn tự đẳng cấu trên nhóm reductive [gelbart1984, langlands1980]. Định lý modularity của Wiles là trường hợp đặc biệt. Chương trình Langlands hứa hẹn “thống nhất” hàm $L$ từ đại số, hình học, và giải tích vào một lý thuyết duy nhất [bump1997, goldfeld-hundley2011].

Lịch sử phát triển khái niệm hàm $L$

  1. Euler (1737): Chứng minh tích Euler $\zeta(s) = \prod_p (1 - p^{-s})^{-1}$ cho $s$ thực, kết nối chuỗi vô hạn với số nguyên tố. Đây là “hàm $L$ đầu tiên” [hardy-wright2008].
  2. Riemann (1859): Trong bài báo duy nhất 8 trang về lý thuyết số [riemann1859], mở rộng $\zeta(s)$ sang biến phức, chứng minh thác triển giải tích và phương trình hàm [edwards1974].
  3. Dirichlet (1837): Giới thiệu hàm $L$ Dirichlet $L(s, \chi) = \sum_{n=1}^{\infty} \chi(n)/n^s$ để chứng minh định lý về số nguyên tố trong cấp số cộng [davenport2000, apostol1976].
  4. Hecke (1920): Tổng quát hàm $L$ Dirichlet sang trường số đại số, xây dựng hàm $L$ Hecke [neukirch1999].
  5. Tate (1950): Luận văn tiến sĩ lừng danh [tate1967] xây dựng lại lý thuyết Hecke bằng phân tích Fourier trên adèle --- ngôn ngữ hiện đại dùng đến ngày nay.
  6. Hasse--Weil (1950s): Gắn hàm $L$ cho đa tạp đại số trên $\mathbb{Q}$ bằng tích Euler từ dữ liệu cục bộ [silverman2009, serre1970].
  7. Langlands (1967--): Đề xuất chương trình Langlands liên hệ mọi hàm $L$ số học với hàm $L$ tự đẳng cấu [gelbart1984, bump1997, langlands1980].
  8. Wiles (1995): Chứng minh Định lý modularity [wiles1995], hoàn thành bởi BCDT [bcdt2001]. Hệ quả: $L(E,s)$ có thác triển giải tích --- điều kiện tiên quyết cho BSD.

Phân tích tài liệu kinh điển về hàm $L$

Hướng dẫn đọc tài liệu về hàm $L$.

Hàm $L$ là chủ đề rộng, trải dài từ giải tích cơ bản đến tiền tuyến nghiên cứu. Dưới đây là phân tích các tài liệu chính:

Nhóm 1: Nền tảng --- Hàm zeta Riemann và hàm $L$ Dirichlet

  • Edwards [edwards1974]: Riemann's Zeta Function. Trình bày theo bài báo gốc của Riemann 1859. Sách tốt nhất để hiểu sâu $\zeta(s)$.
  • Titchmarsh [titchmarsh1986]: The Theory of the Riemann Zeta-Function (sửa bởi Heath-Brown). Tài liệu tham khảo chuẩn mực nhất.
  • Apostol [apostol1976]: Introduction to Analytic Number Theory. Sách giáo khoa chuẩn cho undergraduate. Nên đọc đầu tiên.
  • Serre [serre1973]: A Course in Arithmetic. 70 trang cô đọng tuyệt đẹp về hàm zeta, hàm $L$ Dirichlet, dạng modular.
  • Davenport [davenport2000]: Multiplicative Number Theory. Tập trung vào hàm $L$ Dirichlet, vùng không zero.

Nhóm 2: Đường cong elliptic và hàm $L$

  • Lozano-Robledo [lozano-robledo2011]: Elliptic Curves, Modular Forms, and their L-functions. Sách nhập môn tuyệt vời (dưới 200 trang). Nên đọc đầu tiên nếu quan tâm mối liên hệ EC--$L$.
  • Silverman [silverman2009]: The Arithmetic of Elliptic Curves. Sách chuẩn mực số 1. Chương V xây dựng hàm $L(E,s)$ nghiêm ngặt.
  • Silverman [silverman1994]: Advanced Topics. Nhân phức, hàm $L$ $p$-adic, chiều cao.
  • Koblitz [koblitz1993]: Introduction to Elliptic Curves and Modular Forms. Tiếp cận qua bài toán số đồng dư.
  • Knapp [knapp1992]: Elliptic Curves. Từ sơ cấp đến Eichler--Shimura.

Nhóm 3: Dạng modular và Định lý modularity

  • Diamond--Shurman [diamond-shurman2005]: A First Course in Modular Forms. Sách chuẩn cho dạng modular.
  • Shimura [shimura1971]: Introduction to the Arithmetic Theory of Automorphic Functions. Kinh điển.
  • Cornell--Silverman--Stevens [cornell-silverman-stevens1997]: Modular Forms and Fermat's Last Theorem. Giải thích chứng minh Wiles.

Nhóm 4: Lý thuyết số giải tích nâng cao và hàm $L$ tự đẳng cấu

  • Iwaniec--Kowalski [iwaniec-kowalski2004]: Analytic Number Theory. Cuốn toàn diện nhất (615 trang): “bách khoa toàn thư” lý thuyết số giải tích hiện đại.
  • Bump [bump1997]: Automorphic Forms and Representations. Cầu nối cổ điển $\leftrightarrow$ biểu diễn tự đẳng cấu.
  • Goldfeld--Hundley [goldfeld-hundley2011]: Automorphic Representations and $L$-Functions for $\mathrm{GL}(n)$ (2 tập). Framework adelic, tự chứa.
  • Gelbart [gelbart1975]: Automorphic Forms on Adele Groups. Giới thiệu tiên phong chương trình Langlands.

Nhóm 5: Hàm $L$ $p$-adic và Iwasawa

  • Koblitz [koblitz1984]: $p$-adic Numbers, $p$-adic Analysis, and Zeta-Functions. Nhập môn hàm zeta $p$-adic.
  • Perrin-Riou [perrin-riou1995]: Fonctions $L$ $p$-adiques. Chuyên khảo nâng cao.
  • Coates--Sujatha [coates-sujatha2006]: Cyclotomic Fields and Zeta Values.

Nhóm 6: Tài liệu gốc và survey

  • Tate [tate1967]: Luận văn “Fourier Analysis in Number Fields” (1950). Một trong những luận văn có ảnh hưởng nhất thế kỷ 20.
  • Gelbart [gelbart1984]: “An Elementary Introduction to the Langlands Program”. Bài tổng quan 42 trang cho non-specialist.
  • Katz--Sarnak [katz-sarnak1999]: Random Matrices, Frobenius Eigenvalues, and Monodromy. Kết nối số luận $\leftrightarrow$ vật lý.
Lộ trình đọc đề xuất.
Trình độ Sách đề xuất
Nhập môn Apostol → Lozano-Robledo → Koblitz
Trung cấp Serre → Silverman (GTM 106) → Diamond--Shurman
Nâng cao Iwaniec--Kowalski → Silverman (GTM 151) → Bump
Chuyên gia Goldfeld--Hundley, Gelbart, Tate (thesis)

Liên hệ với giả thuyết Birch--Dyer

Hàm $L(E,s)$ --- trung tâm của BSD. Hàm $L$ Hasse--Weil là đối tượng trung tâm của giả thuyết BSD [birch-sd1965]:
  • BSD yếu: $\mathrm{ord}_{s=1} L(E, s) = \mathrm{rk} E(\mathbb{Q})$.
  • BSD mạnh: Hệ số dẫn đầu $L^{(r)}(E, 1)/r!$ (với $r = \mathrm{rk} E(\mathbb{Q})$) bằng:
    \[ \frac{L^{(r)}(E, 1)}{r!} = \frac{\Omega_E \cdot \mathrm{Reg}_E \cdot \prod_p c_p \cdot |\mathrm{Sha}(E/\mathbb{Q})|}{|E(\mathbb{Q})_{\mathrm{tors}}|^2}. \]
  • Dấu gốc: Nếu $w_E = -1$ thì $L(E,1) = 0$ $\Rightarrow$ BSD dự đoán $r \geq 1$ (có vô hạn điểm hữu tỉ). Nếu $w_E = +1$, $r$ phải chẵn.
  • Trạng thái: BSD đã được chứng minh cho $r = 0$ (Kolyvagin, khi $L(E,1) \neq 0$) và $r = 1$ (Gross--Zagier + Kolyvagin, khi $\mathrm{ord}_{s=1} L(E,s) = 1$). Trường hợp $r \geq 2$ vẫn mở [kolyvagin1990, gross-zagier1986].
77 Hàm zeta cục bộ (Local zeta function) Ch.4 5

Định nghĩa hình thức

Định nghĩa (Hàm zeta cục bộ). Cho $\tilde{E}/\mathbb{F}_p$ là đường cong elliptic trên trường hữu hạn $\mathbb{F}_p$ (rút gọn tốt tại $p$). Hàm zeta cục bộ (local zeta function) là chuỗi lũy thừa hình thức [silverman2009]:
\[ Z(\tilde{E}/\mathbb{F}_p, T) = \exp\left(\sum_{k=1}^{\infty} \frac{\#\tilde{E}(\mathbb{F}_{p^k})}{k}\, T^k \right), \]
trong đó $\#\tilde{E}(\mathbb{F}_{p^k})$ là số điểm trên $\tilde{E}$ khi mở rộng trường cơ sở từ $\mathbb{F}_p$ lên $\mathbb{F}_{p^k}$.

Bằng Định lý Hasse--Weil, hàm zeta cục bộ là hàm hữu tỉ [hasse1933]:

\[ Z(\tilde{E}/\mathbb{F}_p, T) = \frac{1 - a_p T + p T^2}{(1 - T)(1 - pT)}, \]
với $a_p = p + 1 - \#\tilde{E}(\mathbb{F}_p)$. Tử số $P_1(T) = 1 - a_p T + pT^2$ có hai nghiệm $\alpha_p^{-1}, \beta_p^{-1}$ với $|\alpha_p| = |\beta_p| = \sqrt{p}$ (“Giả thuyết Riemann cục bộ”).

Ví dụ

Ví dụ (Hàm zeta cục bộ cho $E\colon y^2 = x^3 + x + 1$ tại $p = 5$). Ta đã tính $\#E(\mathbb{F}_5) = 9$, nên $a_5 = 5 + 1 - 9 = -3$. Vậy:
\[ Z(\tilde{E}/\mathbb{F}_5, T) = \frac{1 + 3T + 5T^2}{(1 - T)(1 - 5T)}. \]

Kiểm tra: Nghiệm $\alpha, \beta$ của $T^2 + 3T + 5 = 0$ (đổi $T \to 1/T$ cho $1 + 3T + 5T^2$) là $\alpha = (-3 + i\sqrt{11})/2$. Kiểm tra $|\alpha|^2 = (9 + 11)/4 = 5$, nên $|\alpha| = \sqrt{5}$. Đúng!

Đếm điểm trên $\mathbb{F}_{p^k}$: Dùng công thức $\#E(\mathbb{F}_{5^k}) = 5^k + 1 - \alpha^k - \beta^k$:

\[\begin{aligned} k=1&: \; 5 + 1 - (-3) = 9 \quad \checkmark \\ k=2&: \; 25 + 1 - (\alpha^2 + \beta^2) = 26 - (a_5^2 - 2\cdot 5) = 26 - (-1) = 27 \\ k=3&: \; 125 + 1 - (\alpha^3 + \beta^3) = 126 - (a_5^3 - 3\cdot 5 \cdot a_5) = 126 - 18 = 108. \end{aligned}\]
(Dùng đẳng thức Newton: $\alpha^2 + \beta^2 = a_5^2 - 2p$, $\alpha^3 + \beta^3 = a_5^3 - 3pa_5$.)

Ý nghĩa trực giác

Hàm zeta cục bộ --- “ảnh X-quang” của đường cong tại $p$.
  • Hơn cả đếm điểm: Đếm điểm trên $\mathbb{F}_p$ chỉ cho một con số $\#E(\mathbb{F}_p)$. Nhưng hàm zeta cục bộ gộp thông tin từ mọi mở rộng $\mathbb{F}_{p^k}$ ($k = 1, 2, 3, \ldots$) vào một hàm duy nhất --- chứa nhiều thông tin hơn hẳn.
  • Tính hữu tỉ: Dù $Z(\tilde{E}/\mathbb{F}_p, T)$ được xây dựng từ vô hạn dữ liệu ($\#E(\mathbb{F}_{p^k})$ cho mọi $k$), nó là hàm hữu tỉ --- chỉ cần biết một số $a_p$ là xác định hoàn toàn! Điều này vì Frobenius $\phi_p$ “điều khiển” mọi $\#E(\mathbb{F}_{p^k})$ thông qua đa thức đặc trưng bậc 2.
  • Phỏng đoán Weil: Tính hữu tỉ, phương trình hàm, và “Giả thuyết Riemann cục bộ” ($|\alpha_p| = \sqrt{p}$) là ba phần của Phỏng đoán Weil (1949), được Deligne chứng minh 1974 cho đa tạp bất kỳ [deligne1974].

Liên hệ với giả thuyết Birch--Dyer

Hàm zeta cục bộ và BSD.
  • Thừa số Euler = nghịch đảo tử số: Thừa số Euler của $L(E,s)$ tại $p$ (khử tốt) chính là nghịch đảo tử số $Z(\tilde{E}/\mathbb{F}_p, T)$ khi thay $T = p^{-s}$:
    \[ L_p(E, s) = \frac{1}{1 - a_p p^{-s} + p^{1-2s}} = \frac{1}{P_1(p^{-s})}. \]
    Vậy hàm $L(E,s)$ toàn cục được xây dựng từ các hàm zeta cục bộ.
  • Cận Hasse $\Rightarrow$ hội tụ: Cận $|a_p| \leq 2\sqrt{p}$ (tương đương $|\alpha_p| = \sqrt{p}$) đảm bảo tích Euler hội tụ khi $\mathrm{Re}(s) > 3/2$.
  • Sato--Tate: Phân bố của $a_p / (2\sqrt{p})$ khi $p \to \infty$ tuân theo luật bán tròn (Sato--Tate, đã chứng minh 2011 cho đường cong không CM). Đây là “thống kê vĩ mô” của dữ liệu cục bộ [katz-sarnak1999].
78 Thác triển giải tích (Analytic continuation) Ch.4 6

Định nghĩa hình thức

Định nghĩa (Thác triển giải tích). Cho $f$ là hàm giải tích (holomorphic) trên miền mở $U \subset \mathbb{C}$. Thác triển giải tích (analytic continuation) của $f$ đến miền lớn hơn $V \supset U$ là hàm giải tích $g\colon V \to \mathbb{C}$ sao cho $g|_U = f$ (tức $g(s) = f(s)$ cho mọi $s \in U$).

Nếu $V$ liên thông, thác triển giải tích (nếu tồn tại) là duy nhất --- đây là nguyên lý đồng nhất giải tích (identity theorem) [serre1973].

Ý tưởng: Ta có công thức tính $f(s)$ chỉ “hoạt động” trong miền nhỏ $U$ (ví dụ: chuỗi chỉ hội tụ khi $\mathrm{Re}(s) > 3/2$). Thác triển giải tích tìm cách “kéo dài” $f$ ra ngoài $U$, sử dụng tính chất giải tích (chứ không phải tính trực tiếp từ chuỗi).

Ví dụ

Ví dụ (Các ví dụ thác triển).
  1. Chuỗi hình học: $f(z) = 1 + z + z^2 + \cdots$ hội tụ khi $|z| < 1$. Nhưng $g(z) = 1/(1-z)$ có nghĩa cho mọi $z \neq 1$, và $g|_{|z|<1} = f$. Vậy $g$ là thác triển giải tích của $f$.
  2. Hàm zeta Riemann: $\zeta(s) = \sum n^{-s}$ hội tụ khi $\mathrm{Re}(s) > 1$. Riemann (1859) chứng minh $\zeta$ thác triển thành hàm phân hình trên $\mathbb{C}$, với cực đơn duy nhất tại $s = 1$ [riemann1859]. Phương pháp: biến đổi Mellin $\Gamma(s)\zeta(s) = \int_0^{\infty} t^{s-1}/(e^t - 1)\, dt$.
  3. Hàm $L(E,s)$: Tích Euler hội tụ khi $\mathrm{Re}(s) > 3/2$. Nhờ Định lý modularity [wiles1995, bcdt2001], $L(E,s)$ trùng hàm $L$ của dạng modular $f_E$, mà hàm $L$ dạng modular thác triển nhờ biến đổi Mellin: $\Lambda(E,s) = N^{s/2} \int_0^{\infty} f_E(it)\, t^{s-1}\, dt$.

Ý nghĩa trực giác

Thác triển giải tích --- “GPS” cho hàm phức.
  • Tương tự đời thường: Bạn biết nhiệt độ ngoài trời từ 6h--12h. Nếu nhiệt độ biến đổi “trơn” (giải tích), bạn có thể dự đoán nhiệt độ lúc 15h --- dù chưa đo. Thác triển giải tích làm điều tương tự: từ giá trị hàm trong miền nhỏ, “dự đoán” giá trị ngoài miền.
  • Tại sao duy nhất?: Hàm giải tích “cứng nhắc” hơn hàm liên tục rất nhiều. Biết $f$ trên bất kỳ miền mở nào (dù nhỏ) xác định $f$ trên toàn $\mathbb{C}$ (trừ các cực). Đây là sức mạnh cốt lõi của giải tích phức.
  • Chuỗi $\neq$ hàm: Chuỗi $\sum n^{-s}$ và hàm $\zeta(s)$ khác nhau! Chuỗi chỉ là “cách tính” $\zeta$ trong miền $\mathrm{Re}(s) > 1$. Hàm $\zeta$ “sống” trên toàn $\mathbb{C}$ (trừ $s = 1$), với nhiều “cách tính” khác nhau ở các miền khác nhau.

Liên hệ với giả thuyết Birch--Dyer

Thác triển giải tích --- điều kiện tiên quyết cho BSD.
  • Không có thác triển, không có BSD: Giả thuyết BSD nói về $\mathrm{ord}_{s=1} L(E,s)$ --- bậc triệt tiêu tại $s = 1$. Nhưng tích Euler chỉ hội tụ khi $\mathrm{Re}(s) > 3/2$, nên $L(E,1)$ không có nghĩa nếu thiếu thác triển! Thác triển giải tích là điều kiện tiên quyết để phát biểu BSD.
  • Lịch sử: Trước 1995, thác triển chỉ biết cho đường cong CM (Deuring, 1953). Định lý modularity (Wiles 1995, BCDT 2001) cho thác triển với mọi $E/\mathbb{Q}$ --- lần đầu tiên BSD có nghĩa cho mọi đường cong elliptic trên $\mathbb{Q}$ [wiles1995, bcdt2001].
  • Hai con đường thác triển:
    1. CM: $L(E,s) = L(\psi, s) \cdot L(\bar{\psi}, s)$ phân tích thành tích hàm $L$ Hecke $\Rightarrow$ thác triển từ lý thuyết cổ điển [deuring1953].
    2. Modularity: $L(E,s) = L(f_E, s)$ trùng hàm $L$ dạng modular $\Rightarrow$ thác triển nhờ biến đổi Mellin [wiles1995].
  • Phương trình hàm: Thác triển còn cho phương trình hàm $\Lambda(E, s) = w_E \Lambda(E, 2-s)$. Từ đó: nếu $w_E = -1$ thì $L(E,1) = 0$ bắt buộc, và BSD dự đoán hạng $r \geq 1$ [diamond-shurman2005].
79 Phương trình hàm (Functional equation) Ch.4 6

Định nghĩa hình thức

Định lý (Phương trình hàm của $L(E,s)$). Cho $E/\mathbb{Q}$ đường cong elliptic với conductor $N$. Đặt hàm $L$ “hoàn chỉnh” [silverman2009, diamond-shurman2005]:
\[ \Lambda(E, s) = N^{s/2} (2\pi)^{-s} \Gamma(s)\, L(E, s), \]
trong đó $\Gamma(s) = \int_0^{\infty} t^{s-1} e^{-t}\, dt$ là hàm gamma. Khi đó:
\[ \Lambda(E, s) = w_E \cdot \Lambda(E, 2 - s), \]
với $w_E \in \{+1, -1\}$ là dấu gốc (root number) của $E$.

Phương trình hàm thiết lập đối xứng qua $s = 1$: phép thay $s \to 2 - s$ biến $\Lambda(E, s)$ thành (cùng dấu hoặc đổi dấu) chính nó. Đường thẳng $\mathrm{Re}(s) = 1$ là “trục đối xứng”.

So sánh: Hàm zeta Riemann có đối xứng $\xi(s) = \xi(1 - s)$ qua $s = 1/2$. Hàm $L(E,s)$ có đối xứng qua $s = 1$ --- đúng nơi BSD khảo sát.

Ví dụ

Ví dụ (Hệ quả tại $s = 1$). Thay $s = 1$ vào $\Lambda(E, 1) = w_E \cdot \Lambda(E, 1)$:
  1. $w_E = -1$: $\Lambda(E,1) = -\Lambda(E,1) \implies \Lambda(E,1) = 0 \implies L(E,1) = 0$. Hàm $L$ bắt buộc triệt tiêu tại $s = 1$. BSD dự đoán hạng $r \geq 1$.
  2. $w_E = +1$: $L(E,1)$ có thể khác 0 hoặc bằng 0, nhưng bậc triệt tiêu phải là chẵn (do đối xứng $L(E, 1+t) \approx L(E, 1-t)$ buộc $c(s-1)^r$ có $r$ chẵn).

Các ví dụ cụ thể:

\renewcommand{\arraystretch}{1.2}

Đường cong $N$ $w_E$ Hệ quả
$y^2 + y = x^3 - x^2$ 11 $+1$ $r$ chẵn; thực tế $r = 0$
$y^2 + y = x^3 - x$ 37 $-1$ $L(E,1) = 0$, $r \geq 1$; thực tế $r = 1$
$y^2 = x^3 - 43x + 166$ 5077 $+1$ $r$ chẵn; thực tế $r = 2$

Ý nghĩa trực giác

Phương trình hàm --- “gương soi” tại $s = 1$.
  • Đối xứng = ràng buộc mạnh: Phương trình hàm liên hệ giá trị $L(E,s)$ ở “bên trái” ($s < 1$) với “bên phải” ($s > 1$). Biết hàm một bên $\Rightarrow$ biết hàm bên kia. Đây là ràng buộc cực kỳ mạnh --- “một nửa thông tin” xác định toàn bộ hàm.
  • Dấu gốc = “tính chẵn lẻ”: Dấu $w_E = +1$ giống hàm chẵn ($f(x) = f(-x)$), $w_E = -1$ giống hàm lẻ ($f(x) = -f(-x)$). Hàm lẻ buộc $f(0) = 0$ --- tương tự, $w_E = -1$ buộc $L(E,1) = 0$.
  • Nguồn gốc: Phương trình hàm đến từ Định lý modularity --- tính chất biến đổi $f_E(-1/(N\tau)) = w_E N \tau^2 f_E(\tau)$ của dạng modular trực tiếp suy ra đối xứng $s \leftrightarrow 2-s$ qua biến đổi Mellin.

Liên hệ với giả thuyết Birch--Dyer

Phương trình hàm trong BSD.
  • Phỏng đoán tính chẵn lẻ (Parity conjecture): $(-1)^{r} = w_E$, tức tính chẵn lẻ của hạng bằng dấu gốc. Đây là hệ quả yếu nhất của BSD, nhưng cũng chưa được chứng minh hoàn toàn (đã biết cho đường cong bán ổn định nhờ Dokchitser--Dokchitser 2010) [silverman2009].
  • “Nửa” BSD: Dấu gốc $w_E = -1$ $\Rightarrow$ $L(E,1) = 0$ $\Rightarrow$ (theo BSD) $E(\mathbb{Q})$ vô hạn. Đây là “nửa” BSD: nó nói khi nào có vô hạn điểm hữu tỉ, nhưng chưa nói bao nhiêu (hạng chính xác).
  • BSD mạnh: Phương trình hàm cho phép định nghĩa hệ số dẫn đầu $L^{(r)}(E,1)/r!$ --- chính số hạng mà BSD mạnh liên hệ với $\Omega_E \cdot \mathrm{Reg}_E \cdot \prod c_p \cdot |\mathrm{Sha}| / |E(\mathbb{Q})_{\mathrm{tors}}|^2$.
80 Bậc triệt tiêu (Order of vanishing $\mathrm{ord}_{s=1} L(E,s)$) Ch.1 5

Định nghĩa hình thức

Định nghĩa (Bậc triệt tiêu). Cho $f(s)$ là hàm giải tích tại $s = s_0$. Bậc triệt tiêu (order of vanishing) (hay bậc không điểm (order of zero)) của $f$ tại $s_0$ là số nguyên $r \geq 0$ sao cho [silverman2009]:
\[ f(s) = c \cdot (s - s_0)^r + \text{bậc cao hơn}, \qquad c \neq 0. \]
Ký hiệu: $\mathrm{ord}_{s = s_0} f(s) = r$. Nếu $f(s_0) \neq 0$ thì $r = 0$. Nếu $f(s_0) = 0$ nhưng $f'(s_0) \neq 0$ thì $r = 1$.

Áp dụng cho hàm $L$ Hasse--Weil: $\mathrm{ord}_{s=1} L(E,s)$ là bậc triệt tiêu của $L(E,s)$ tại điểm $s = 1$.

Nói đơn giản: bậc triệt tiêu đếm “$L(E,s)$ triệt tiêu bao nhiêu lần” tại $s = 1$. Bậc 0 nghĩa là $L(E,1) \neq 0$; bậc 1 nghĩa là $L(E,1) = 0$ nhưng đạo hàm $L'(E,1) \neq 0$; bậc $r$ nghĩa là $L(E,1) = L'(E,1) = \cdots = L^{(r-1)}(E,1) = 0$ nhưng $L^{(r)}(E,1) \neq 0$.

Ví dụ

Ví dụ (Bậc triệt tiêu cho 3 đường cong).
  1. $E\colon y^2 + y = x^3 - x^2$ (conductor 11): $L(E, 1) = 0.2538\ldots \neq 0$. Vậy $\mathrm{ord}_{s=1} L(E,s) = 0$. Hạng đại số: $r = 0$. BSD đúng!
  2. $E\colon y^2 + y = x^3 - x$ (conductor 37): $L(E, 1) = 0$, $L'(E, 1) = 0.3059\ldots \neq 0$. Vậy $\mathrm{ord}_{s=1} L(E,s) = 1$. Hạng đại số: $r = 1$ (sinh bởi $P = (0,0)$). BSD đúng!
  3. $E\colon y^2 = x^3 - 43x + 166$ (conductor 5077): $L(E,1) = 0$, $L'(E,1) = 0$, $L''(E,1) \neq 0$. Vậy $\mathrm{ord}_{s=1} L(E,s) = 2$. Hạng đại số: $r = 2$. BSD đúng!

Lưu ý: Đường cong conductor 5077 là đường cong đầu tiên có hạng 2 được kiểm chứng BSD --- Cremona xác nhận cả hạng đại số và bậc triệt tiêu bằng máy tính [cremona1997].

Ý nghĩa trực giác

Bậc triệt tiêu --- “mức độ phẳng” tại $s = 1$.
  • Đồ thị: Hình dung đồ thị $y = L(E, s)$ gần $s = 1$. Nếu $r = 0$: đồ thị cắt $s = 1$ ở giá trị $\neq 0$ (không phẳng). Nếu $r = 1$: đồ thị “chạm” trục hoành (tiếp tuyến ngang). Nếu $r = 2$: đồ thị “ôm” trục hoành phẳng hơn nữa.
  • Tương tự đa thức: $f(x) = (x-1)^r \cdot g(x)$ với $g(1) \neq 0$. Bậc $r$ cao hơn $\Leftrightarrow$ đường cong “phẳng” hơn tại $x = 1$. Tương tự, $L(E,s) \approx c(s-1)^r$ gần $s = 1$.
  • Ý nghĩa BSD: Bậc triệt tiêu “đếm” số chiều của không gian nghiệm hữu tỉ. $r$ càng lớn $\Leftrightarrow$ $E(\mathbb{Q})$ càng “phong phú” --- hàm $L$ “biết” điều này qua mức độ phẳng tại $s = 1$.

Liên hệ với giả thuyết Birch--Dyer

Bậc triệt tiêu --- vế trái của BSD.
  • BSD yếu: $\mathrm{ord}_{s=1} L(E, s) = \mathrm{rk} E(\mathbb{Q})$. Đây là phát biểu cô đọng nhất của BSD --- bậc triệt tiêu (giải tích) bằng hạng (đại số).
  • Trạng thái đã biết:
  • $\mathrm{ord}_{s=1} L(E,s) = 0$ $\Rightarrow$ $\mathrm{rk} E(\mathbb{Q}) = 0$ (Kolyvagin [kolyvagin1990]).
  • $\mathrm{ord}_{s=1} L(E,s) = 1$ $\Rightarrow$ $\mathrm{rk} E(\mathbb{Q}) = 1$ (Gross--Zagier + Kolyvagin [gross-zagier1986, kolyvagin1990]).
  • $\mathrm{ord}_{s=1} L(E,s) \geq 2$: hoàn toàn mở! Ta thậm chí không biết cách chứng minh $\mathrm{rk} E(\mathbb{Q}) \geq 2$ từ $\mathrm{ord}_{s=1} L(E,s) \geq 2$.

Chiều ngược ($\mathrm{rk} \to \mathrm{ord}$): Nếu $\mathrm{rk} E(\mathbb{Q}) = 0$ thì $\mathrm{ord}_{s=1} L(E,s) = 0$ (Skinner--Urban 2014, dưới một số điều kiện kỹ thuật). Chiều ngược cho hạng 1 cũng được biết nhờ Skinner (2020).

81 Hạng giải tích (Analytic rank $r_{\mathrm{an}}$) Ch.4 5

Định nghĩa hình thức

Định nghĩa (Hạng giải tích). Hạng giải tích (analytic rank) của đường cong elliptic $E/\mathbb{Q}$ là bậc triệt tiêu của hàm $L$ Hasse--Weil tại $s = 1$ [silverman2009]:
\[ r_{\mathrm{an}}(E) = \mathrm{ord}_{s=1} L(E, s). \]
Đây là đại lượng thuần túy giải tích --- được định nghĩa thông qua hàm phức $L(E,s)$, không liên quan trực tiếp đến cấu trúc nhóm $E(\mathbb{Q})$.

Để phân biệt: hạng đại số (algebraic rank) (hay hạng Mordell--Weil) $r = \mathrm{rk} E(\mathbb{Q})$ là số sinh tự do trong phân tích $E(\mathbb{Q}) \cong \mathbb{Z}^r \oplus E(\mathbb{Q})_{\mathrm{tors}}$. Giả thuyết BSD yếu nói rằng: $r_{\mathrm{an}} = r$.

Ví dụ

Ví dụ (So sánh hạng đại số và hạng giải tích).
Đường cong $N$ $r$ (đại số) $r_{\mathrm{an}}$ (giải tích) BSD?
$y^2 + y = x^3 - x^2$ 11 0 0 $\checkmark$
$y^2 + y = x^3 - x$ 37 1 1 $\checkmark$
$y^2 = x^3 - 43x + 166$ 5077 2 2 $\checkmark$
$y^2 + y = x^3 - 7x + 6$ 5077 3 3 $\checkmark$

Trong mọi trường hợp đã kiểm chứng, $r = r_{\mathrm{an}}$. Cơ sở dữ liệu LMFDB chứa hơn 3 triệu đường cong, và không có phản ví dụ nào được tìm thấy [cremona1997].

Ý nghĩa trực giác

Hai “ngôn ngữ” nói cùng một sự thật.
  • Hạng đại số $r$: Đếm “số chiều” của không gian nghiệm hữu tỉ. Đây là đại lượng đại số/hình học --- cần tìm các điểm cụ thể trên đường cong.
  • Hạng giải tích $r_{\mathrm{an}}$: Đo “mức độ phẳng” của hàm $L$ tại $s = 1$. Đây là đại lượng giải tích --- tính bằng chuỗi/tích phân, không cần biết điểm nào.
  • BSD: Hai đại lượng từ hai thế giới hoàn toàn khác nhau (đại số vs giải tích) luôn bằng nhau! Đây là “phép màu” của BSD --- hay nói theo ngôn ngữ hiện đại, đây là biểu hiện của triết lý Langlands: đối tượng đại số $\leftrightarrow$ đối tượng giải tích.

Liên hệ với giả thuyết Birch--Dyer

$r_{\mathrm{an}}$ --- vế giải tích của BSD.
  • BSD yếu: $r_{\mathrm{an}}(E) = \mathrm{rk} E(\mathbb{Q})$. Nói cách khác, hạng giải tích xác định hạng đại số.
  • Tính toán $r_{\mathrm{an}}$: Trong thực tế, tính $r_{\mathrm{an}}$ dễ hơn tính $r$! Hạng giải tích tính được bằng phương pháp số (chuỗi hội tụ nhanh, công thức Dokchitser), trong khi hạng đại số đòi hỏi tìm điểm hữu tỉ hoặc chặn nhóm Selmer.
  • Hệ quả thực tiễn: Nếu BSD đúng, ta có thể “tính hạng bằng giải tích” --- tính $r_{\mathrm{an}}$ rồi kết luận $r = r_{\mathrm{an}}$. Đây là chiến lược Bhargava--Skinner--Zhang (2014) dùng để chứng minh $\geq 66.48\%$ đường cong elliptic có hạng 0 hoặc 1 [bhargava-skinner-zhang2014].
  • Rào cản $r_{\mathrm{an}} \geq 2$: Phương pháp Gross--Zagier chỉ xây dựng 1 điểm Heegner (cho $r = 1$). Không có phương pháp nào tạo ra 2 điểm độc lập từ $r_{\mathrm{an}} = 2$ --- đây là rào cản lớn nhất hiện nay.
82 Cận Hasse (Hasse bound $|a_p| \leq 2\sqrt{p}$) Ch.4 5

Định nghĩa hình thức

Định lý (Cận Hasse, 1933). Cho $E/\mathbb{F}_p$ đường cong elliptic trên trường hữu hạn. Đặt $a_p = p + 1 - \#E(\mathbb{F}_p)$. Khi đó [hasse1933, silverman2009]:
\[ |a_p| \leq 2\sqrt{p}. \]
Tương đương: $(\sqrt{p} - 1)^2 \leq \#E(\mathbb{F}_p) \leq (\sqrt{p} + 1)^2$.

Nói cách khác: số điểm trên đường cong elliptic modulo $p$ luôn nằm trong khoảng $[p + 1 - 2\sqrt{p},\; p + 1 + 2\sqrt{p}]$, tức lệch khỏi “kỳ vọng” $p + 1$ không quá $2\sqrt{p}$.

Lịch sử: Phỏng đoán bởi Emil Artin (1924), chứng minh bởi Helmut Hasse (1933). Đây là trường hợp chiều 1 của Phỏng đoán Weil, sau này Deligne (1974) chứng minh cho đa tạp bất kỳ [deligne1974].

Ví dụ

Ví dụ (Kiểm tra cận Hasse). Cho $E\colon y^2 = x^3 + x + 1$:
$p$ $\#E(\mathbb{F}_p)$ $a_p$ $2\sqrt{p}$ $|a_p| \leq 2\sqrt{p}$?
2302.83$\checkmark$
3403.46$\checkmark$
59$-3$4.47$\checkmark$
7535.29$\checkmark$
11846.63$\checkmark$
1316$-2$7.21$\checkmark$

Mọi $|a_p|$ đều $\leq 2\sqrt{p}$. Lưu ý $a_p$ có thể dương hoặc âm, và biên độ dao động tăng theo $\sqrt{p}$.

Ý nghĩa trực giác

Cận Hasse --- “luật dao động” của số điểm.
  • Kỳ vọng $\approx p + 1$: Trên $\mathbb{F}_p$ có $p$ giá trị $x$. Với mỗi $x$, phương trình $y^2 = f(x)$ có trung bình $\approx 1$ nghiệm (0 nghiệm hoặc 2 nghiệm, mỗi xác suất $\approx 1/2$). Tổng $\approx p$ điểm affine $+$ $\mathcal{O}$ $= p + 1$.
  • Dao động $\leq 2\sqrt{p}$: Số điểm thực tế dao động quanh $p + 1$, nhưng sai số bị chặn bởi $2\sqrt{p}$. Đây là tương tự “$\sqrt{n}$-dao động” trong xác suất: lật $p$ đồng xu, kỳ vọng $p/2$ mặt ngửa, sai số $\sim \sqrt{p}$.
  • “Giả thuyết Riemann cục bộ”: Cận $|a_p| \leq 2\sqrt{p}$ tương đương với “hai nghiệm $\alpha_p, \beta_p$ của $T^2 - a_p T + p = 0$ có $|\alpha_p| = |\beta_p| = \sqrt{p}$”. Đây chính là dạng “Giả thuyết Riemann” cho hàm zeta cục bộ --- nhưng đã được chứng minh!

Liên hệ với giả thuyết Birch--Dyer

Cận Hasse trong BSD.
  • Sự hội tụ tích Euler: Cận $|a_p| \leq 2\sqrt{p}$ đảm bảo tích Euler $L(E,s) = \prod_p L_p(E,s)$ hội tụ tuyệt đối khi $\mathrm{Re}(s) > 3/2$. Không có cận Hasse, ta không biết tích Euler xác định hàm giải tích hay không!
  • Phân bố $a_p$ và BSD: Giá trị trung bình $a_p \approx 0$ (theo Sato--Tate) giải thích tại sao $\Pi_E(X) = \prod_{p \leq X} (p+1-a_p)/p$ tăng chậm (logarithmic) --- dẫn đến quan sát $\Pi_E(X) \sim C (\log X)^r$ của Birch--Swinnerton-Dyer.
  • Thuật toán: Tính $a_p$ cho $p$ nhỏ bằng liệt kê ($O(p)$), cho $p$ lớn bằng thuật toán Schoof ($O(\log^5 p)$). Cận Hasse giúp kiểm tra tính đúng đắn: nếu $|a_p| > 2\sqrt{p}$, có lỗi tính toán [silverman2009].
83 Đa thức đặc trưng (Frobenius) (Characteristic polynomial) Ch.4 5

Định nghĩa hình thức

Định nghĩa (Đa thức đặc trưng Frobenius). Cho $\tilde{E}/\mathbb{F}_p$ đường cong elliptic với tự đồng cấu Frobenius $\phi_p\colon (x,y) \mapsto (x^p, y^p)$. Đa thức đặc trưng (characteristic polynomial) của $\phi_p$ là [silverman2009]:
\[ P_p(T) = T^2 - a_p T + p, \]
trong đó $a_p = p + 1 - \#\tilde{E}(\mathbb{F}_p)$. Hai nghiệm $\alpha_p, \beta_p \in \mathbb{C}$ thỏa mãn:
  1. $\alpha_p + \beta_p = a_p$ \quad (vết Frobenius),
  2. $\alpha_p \cdot \beta_p = p$ \quad (bậc Frobenius),
  3. $|\alpha_p| = |\beta_p| = \sqrt{p}$ \quad (cận Hasse).

Frobenius $\phi_p$ thỏa mãn “phương trình Hamilton--Cayley” trong vành tự đồng cấu $\mathrm{End}(\tilde{E})$:

\[ \phi_p^2 - a_p \phi_p + p = 0 \quad \text{trong } \mathrm{End}(\tilde{E}). \]
Nghĩa là: với mọi điểm $Q \in \tilde{E}(\bar{\mathbb{F}}_p)$, ta có $\phi_p(\phi_p(Q)) - [a_p](\phi_p(Q)) + [p](Q) = \mathcal{O}$.

Ví dụ

Ví dụ (Đa thức đặc trưng cho $E\colon y^2 = x^3 + x + 1$).
  1. $p = 5$: $\#E(\mathbb{F}_5) = 9$, $a_5 = -3$. Đa thức: $T^2 + 3T + 5$. Nghiệm: $\alpha = (-3 + i\sqrt{11})/2$, $\beta = (-3 - i\sqrt{11})/2$. Kiểm tra: $\alpha \beta = (9 + 11)/4 = 5 = p$. $\checkmark$
  2. $p = 7$: $\#E(\mathbb{F}_7) = 5$, $a_7 = 3$. Đa thức: $T^2 - 3T + 7$. Biệt thức: $9 - 28 = -19 < 0$ $\Rightarrow$ hai nghiệm phức liên hợp. $|\alpha| = \sqrt{7}$.
  3. $p = 2$: $\#E(\mathbb{F}_2) = 3$, $a_2 = 0$. Đa thức: $T^2 + 2$. Nghiệm: $\alpha = i\sqrt{2}$, $\beta = -i\sqrt{2}$. Đường cong “siêu kỳ dị” tại $p = 2$ (vì $a_2 = 0$ và $p = 2$).

Ý nghĩa trực giác

Đa thức đặc trưng --- “DNA” của Frobenius.
  • Ma trận $2 \times 2$: Frobenius $\phi_p$ tác động trên module Tate $T_\ell(E) \cong \mathbb{Z}_\ell^2$ như một ma trận $2 \times 2$, với vết $= a_p$ và định thức $= p$. Đa thức $T^2 - a_p T + p$ chính là đa thức đặc trưng của ma trận này --- giống hoàn toàn đại số tuyến tính cơ bản!
  • Một số $a_p$ xác định tất cả: Biết $a_p$ (tức biết $\#E(\mathbb{F}_p)$) $\Rightarrow$ biết đa thức đặc trưng $\Rightarrow$ biết $\alpha_p, \beta_p$ $\Rightarrow$ biết $\#E(\mathbb{F}_{p^k})$ cho mọi $k$ (qua $\#E(\mathbb{F}_{p^k}) = p^k + 1 - \alpha_p^k - \beta_p^k$). Đây là sức mạnh tổng hợp: đếm điểm trên $\mathbb{F}_p$ “biết” mọi mở rộng!
  • Giá trị riêng = “tần số”: Nghĩ $\alpha_p, \beta_p$ là “tần số dao động” của đường cong tại $p$. Cận Hasse $|\alpha_p| = \sqrt{p}$ nói dao động đều đặn --- tương tự Giả thuyết Riemann cho “tần số” của $\zeta(s)$.

Liên hệ với giả thuyết Birch--Dyer

Đa thức đặc trưng trong BSD.
  • Thừa số Euler: Thừa số Euler tại $p$ (khử tốt) là:
    \[ L_p(E, s) = \frac{1}{P_p(p^{-s})} = \frac{1}{(1 - \alpha_p p^{-s})(1 - \beta_p p^{-s})}. \]
    Vậy đa thức đặc trưng Frobenius trực tiếp xác định thừa số Euler, từ đó xác định $L(E,s)$.
  • Biểu diễn Galois: Hệ số $a_p$ là vết (trace) của ma trận Frobenius trong biểu diễn $\rho_{E,\ell}\colon \mathrm{Gal}(\bar{\mathbb{Q}}/\mathbb{Q}) \to \mathrm{GL}_2(\mathbb{Z}_\ell)$. Đường cong $E$ được “mã hóa” hoàn toàn bởi dãy $\{a_p\}$ --- và Định lý modularity nói rằng dãy này cũng là hệ số Fourier của một dạng modular [wiles1995].
  • Phân bố Sato--Tate: Góc $\theta_p$ xác định bởi $a_p = 2\sqrt{p}\cos\theta_p$ có phân bố $\frac{2}{\pi}\sin^2\theta$ (bán tròn) khi $p \to \infty$ --- đây là “luật lớn” cho dữ liệu cục bộ xây dựng hàm $L$ [katz-sarnak1999].
84 Hàm Gamma (Gamma function $\Gamma(s)$) Ch.4 3

Định nghĩa hình thức

Định nghĩa (Hàm Gamma). Hàm Gamma (Gamma function) là hàm mở rộng giai thừa ra miền số phức [serre1973]:
\[ \Gamma(s) = \int_0^{\infty} t^{s-1} e^{-t}\, dt, \qquad \mathrm{Re}(s) > 0. \]
Tính chất cơ bản:
  1. Mở rộng giai thừa: $\Gamma(n) = (n-1)!$ cho $n \in \mathbb{Z}_{> 0}$.
  2. Phương trình hàm: $\Gamma(s+1) = s \cdot \Gamma(s)$.
  3. Thác triển: $\Gamma(s)$ thác triển thành hàm phân hình trên $\mathbb{C}$, với cực đơn tại $s = 0, -1, -2, \ldots$
  4. Công thức phản xạ: $\Gamma(s)\Gamma(1-s) = \pi / \sin(\pi s)$.
  5. Giá trị đặc biệt: $\Gamma(1/2) = \sqrt{\pi}$, $\Gamma(1) = 1$.

Ví dụ

Ví dụ (Hàm Gamma trong hàm $L$ hoàn chỉnh).
  1. Hàm zeta Riemann: Hàm hoàn chỉnh $\xi(s) = \frac{1}{2}s(s-1)\pi^{-s/2}\Gamma(s/2)\zeta(s)$ thỏa $\xi(s) = \xi(1-s)$. Thừa số $\Gamma(s/2)$ “cân bằng” sự tăng trưởng của $\zeta(s)$.
  2. Hàm $L(E,s)$: Hàm hoàn chỉnh $\Lambda(E,s) = N^{s/2}(2\pi)^{-s}\Gamma(s) L(E,s)$ thỏa $\Lambda(E,s) = w_E \Lambda(E, 2-s)$. Ở đây $\Gamma(s)$ (không phải $\Gamma(s/2)$) vì $L(E,s)$ tương ứng dạng modular trọng số 2 (trọng số $k$ cho thừa số $\Gamma(s)$ khi $k = 2$).
  3. Giá trị cụ thể: Tại $s = 1$: $\Gamma(1) = 1$, nên $\Lambda(E,1) = \sqrt{N}/(2\pi) \cdot L(E,1)$. Thừa số Gamma không ảnh hưởng đến bậc triệt tiêu tại $s = 1$ (vì $\Gamma(1) \neq 0$).

Ý nghĩa trực giác

Hàm Gamma --- “hệ số chuẩn hóa” cho hàm $L$.
  • Giai thừa liên tục: Hàm Gamma nội suy $n!$ cho các giá trị phức bất kỳ. Nó xuất hiện tự nhiên khi chuyển đổi giữa “chuỗi” và “tích phân” (biến đổi Mellin: $n^{-s} = \Gamma(s)^{-1} \int_0^{\infty} t^{s-1} e^{-nt}\, dt$).
  • Thừa số “tại vô cực”: Trong lý thuyết số, số nguyên tố “thật” ($p = 2, 3, 5, \ldots$) cho thừa số Euler $L_p$. Thừa số $\Gamma$ đóng vai trò “thừa số tại $p = \infty$” --- tương ứng completion Archimedean của $\mathbb{Q}$ (tức $\mathbb{R}$). Hàm $L$ hoàn chỉnh $\Lambda = \prod_p L_p \cdot L_\infty$ gộp tất cả thừa số, bao gồm cả “vô cực”.
  • Tại sao cần Gamma?: Phương trình hàm $\Lambda(E,s) = w_E \Lambda(E, 2-s)$ chỉ đúng khi bao gồm thừa số $\Gamma(s)$. Không có Gamma, hàm $L(E,s)$ vẫn thác triển nhưng không có phương trình hàm đẹp.

Liên hệ với giả thuyết Birch--Dyer

Hàm Gamma trong BSD.
  • Không ảnh hưởng bậc triệt tiêu: Vì $\Gamma(1) = 1 \neq 0$, thừa số Gamma không thay đổi bậc triệt tiêu tại $s = 1$: $\mathrm{ord}_{s=1} L(E,s) = \mathrm{ord}_{s=1} \Lambda(E,s)$. Vậy BSD yếu ($\mathrm{ord}_{s=1} L(E,s) = r$) không phụ thuộc vào Gamma.
  • BSD mạnh: Tuy nhiên, giá trị $L^{(r)}(E,1)/r!$ (hệ số dẫn đầu) bị ảnh hưởng bởi cách chuẩn hóa. Công thức BSD mạnh sử dụng $L(E,s)$ (không có Gamma), nhưng thừa số $\Omega_E = \int_{E(\mathbb{R})} |\omega|$ (chu kỳ thực) bù lại --- cả hai “thừa số vô cực” triệt tiêu nhau [silverman2009].
  • Biến đổi Mellin: Đẳng thức $L(E,s) = (2\pi)^s \Gamma(s)^{-1} \int_0^{\infty} f_E(it)\, t^{s-1}\, dt$ cho thấy Gamma là “cầu nối” giữa dạng modular $f_E$ và chuỗi Dirichlet $L(E,s)$.
85 Định lý số nguyên tố (Prime Number Theorem) Ch.4 4

Định nghĩa hình thức

Định lý (Định lý số nguyên tố --- Hadamard & de la Vallée-Poussin, 1896). Ký hiệu $\pi(x)$ là số lượng số nguyên tố $\leq x$. Khi đó [serre1973]:
\[ \pi(x) \sim \frac{x}{\log x} \qquad (x \to \infty). \]
Chính xác hơn: $\pi(x) \sim \mathrm{Li}(x) = \int_2^x \frac{dt}{\log t}$, và nếu Giả thuyết Riemann đúng thì:
\[ |\pi(x) - \mathrm{Li}(x)| = O(\sqrt{x}\, \log x). \]

Ý nghĩa: Xác suất một số nguyên $n$ lớn là số nguyên tố $\approx 1/\log n$. Số nguyên tố “thưa dần” nhưng không bao giờ hết --- và tốc độ thưa chính xác là $1/\log n$.

Lịch sử: Phỏng đoán bởi Gauss (khoảng 1793, khi 15 tuổi!) và Legendre. Chứng minh độc lập bởi Hadamard và de la Vallée-Poussin (1896), sử dụng tính chất giải tích của hàm zeta Riemann --- cụ thể: $\zeta(s) \neq 0$ trên đường $\mathrm{Re}(s) = 1$.

Ví dụ

Ví dụ (Kiểm tra Định lý số nguyên tố).
$x$ $\pi(x)$ $x/\log x$ Sai số tương đối
$10^3$168145$-13.7\%$
$10^6$78,49872,382$-7.8\%$
$10^9$50,847,53448,254,942$-5.1\%$
$10^{12}$37,607,912,01836,191,206,825$-3.8\%$

Xấp xỉ $x/\log x$ ngày càng tốt khi $x$ tăng. Hàm $\mathrm{Li}(x)$ cho xấp xỉ tốt hơn nhiều (sai số $< 0.01\%$ với $x = 10^{12}$).

Ý nghĩa trực giác

Định lý SNT --- “luật hấp dẫn” cho số nguyên tố.
  • Phương pháp giải tích: Chứng minh Định lý SNT không dùng kỹ thuật sàng hay tổ hợp --- mà dùng giải tích phức! Tính chất $\zeta(s) \neq 0$ trên $\mathrm{Re}(s) = 1$ trực tiếp suy ra phân bố tiệm cận $\pi(x) \sim x/\log x$. Đây là thắng lợi vĩ đại đầu tiên của “phương pháp giải tích trong lý thuyết số”.
  • Triết lý BSD: Cùng triết lý --- dùng hàm $L$ (giải tích) để “đọc” thông tin số học. Định lý SNT nói: hành vi của $\zeta(s)$ gần $s = 1$ xác định phân bố số nguyên tố. BSD nói: hành vi của $L(E,s)$ tại $s = 1$ xác định hạng.
  • “Nghiệm $\zeta$ = tần số dao động $\pi(x)$”: Công thức Riemann biểu diễn $\pi(x)$ như tổng sóng, mỗi sóng ứng nghiệm $\rho$ của $\zeta$. Tương tự, hệ số dẫn đầu $L^{(r)}(E,1)/r!$ trong BSD mạnh “mã hóa” các bất biến số học.

Liên hệ với giả thuyết Birch--Dyer

Định lý SNT và BSD.
  • Triết lý chung: Cả Định lý SNT và BSD đều thuộc “chương trình giải tích lý thuyết số”: dùng hàm $L$ để trích xuất thông tin số học. Cực của $\zeta(s)$ tại $s = 1$ cho phân bố số nguyên tố; bậc triệt tiêu của $L(E,s)$ tại $s = 1$ cho hạng.
  • Cận Hasse → Tích Euler hội tụ: Chứng minh Định lý SNT cần $\zeta(1+it) \neq 0$. Tương tự, chứng minh BSD (phần $r = 0$) cần $L(E, 1) \neq 0$ kết hợp Kolyvagin.
  • Mở rộng: Thay $\zeta(s)$ bằng $L(E,s)$, “số nguyên tố” bằng “điểm hữu tỉ trên $E$”: Định lý SNT tổng quát hóa thành giả thuyết BSD.
86 Hàm zeta Dedekind (Dedekind zeta function) Ch.5 6

Định nghĩa hình thức

Định nghĩa (Hàm zeta Dedekind). Cho $K$ là trường số (number field) (mở rộng hữu hạn của $\mathbb{Q}$). Hàm zeta Dedekind (Dedekind zeta function) là [serre1973, lang1983]:
\[ \zeta_K(s) = \sum_{\mathfrak{a}} \frac{1}{N(\mathfrak{a})^s} = \prod_{\mathfrak{p}} \frac{1}{1 - N(\mathfrak{p})^{-s}}, \]
trong đó tổng lấy trên mọi ideal khác 0 $\mathfrak{a}$ của vành số nguyên $\mathcal{O}_K$, tích lấy trên mọi ideal nguyên tố $\mathfrak{p}$, và $N(\mathfrak{a}) = |\mathcal{O}_K/\mathfrak{a}|$ là chuẩn (norm).

Khi $K = \mathbb{Q}$: $\mathcal{O}_K = \mathbb{Z}$, ideal $= (n)$, $N((n)) = |n|$, và $\zeta_\mathbb{Q}(s) = \zeta(s)$ là hàm zeta Riemann. Vậy $\zeta_K(s)$ tổng quát hóa $\zeta(s)$ cho trường số bất kỳ.

$\zeta_K(s)$ có thác triển phân hình trên $\mathbb{C}$ với cực đơn duy nhất tại $s = 1$. Thặng dư tại $s = 1$ cho bởi công thức lớp số giải tích (analytic class number formula):

\[ \lim_{s \to 1^+} (s-1) \zeta_K(s) = \frac{2^{r_1}(2\pi)^{r_2} h_K R_K}{w_K \sqrt{|d_K|}}, \]
trong đó $r_1, r_2$ = số nhúng thực/phức, $h_K$ = số lớp, $R_K$ = regulator, $w_K$ = số nghiệm đơn vị, $d_K$ = biệt thức.

Ví dụ

Ví dụ (Hàm zeta Dedekind cho $K = \mathbb{Q}(i)$). Trường Gauss $K = \mathbb{Q}(i)$ có $\mathcal{O}_K = \mathbb{Z}[i]$, $d_K = -4$, $h_K = 1$, $w_K = 4$. Ideal nguyên tố ứng với cách $p$ phân rã trong $\mathbb{Z}[i]$:
  • $p = 2$: $(1+i)^2 = (2)$ --- phân nhánh (ramified). Thừa số: $(1 - 2^{-s})^{-1}$.
  • $p \equiv 1 \pmod{4}$: $p = \mathfrak{p}\bar{\mathfrak{p}}$ --- tách (split). Thừa số: $(1 - p^{-s})^{-2}$.
  • $p \equiv 3 \pmod{4}$: $(p)$ nguyên tố --- trơ (inert). Thừa số: $(1 - p^{-2s})^{-1}$.
Kết quả: $\zeta_{\mathbb{Q}(i)}(s) = \zeta(s) \cdot L(s, \chi_{-4})$, với $\chi_{-4}$ là đặc trưng Dirichlet modulo 4.

Ý nghĩa trực giác

$\zeta_K(s)$ --- “hàm zeta cho trường số”.
  • Tích Euler = phân rã ideal: Mỗi thừa số Euler mã hóa cách số nguyên tố $p$ phân rã trong $\mathcal{O}_K$ (tách, trơ, hoặc phân nhánh). Đây là tương tự hoàn hảo với $\zeta(s) = \prod_p (1-p^{-s})^{-1}$.
  • Công thức lớp số = “BSD cho trường số”: Thặng dư tại $s = 1$ mã hóa bất biến số học ($h_K, R_K, w_K, d_K$). Đây là tiền thân trực tiếp của công thức BSD mạnh: cả hai đều liên hệ giá trị đặc biệt hàm $L$ với bất biến đại số.
  • Tổng quát hóa: $\zeta(s)$ cho $\mathbb{Z}$, $\zeta_K(s)$ cho $\mathcal{O}_K$, $L(E,s)$ cho đường cong elliptic --- cùng một triết lý, đối tượng khác nhau.

Liên hệ với giả thuyết Birch--Dyer

Hàm zeta Dedekind và BSD.
  • Tiền thân của BSD: Công thức lớp số giải tích (Dirichlet, 1839) là “BSD cho trường số” --- đã được chứng minh từ thế kỷ 19! BSD là nỗ lực tổng quát hóa công thức này cho đường cong elliptic.
  • So sánh cấu trúc:

    Trường số $K$ Đường cong $E$
    Hàm $L$ $\zeta_K(s)$ $L(E, s)$
    Bậc triệt tiêu $\mathrm{ord}_{s=1} = 1$ (cực đơn) $\mathrm{ord}_{s=1} = r$
    Regulator $R_K$ $\mathrm{Reg}_E$
    “Sha” $h_K$ (số lớp) $|\mathrm{Sha}(E/\mathbb{Q})|$
    Xoắn $w_K$ $|E(\mathbb{Q})_{\mathrm{tors}}|$
  • Đường cong CM: Khi $E$ có nhân phức bởi $\mathcal{O}_K$, $L(E,s)$ phân tích thành tích hàm $L$ Hecke trên $K$, liên hệ trực tiếp với $\zeta_K(s)$ [deuring1953].
87 Hàm L $p$-adic ($p$-adic L-function $L_p(E,s)$) Ch.5 8

Định nghĩa hình thức

Định nghĩa (Hàm $L$ $p$-adic). Cho $E/\mathbb{Q}$ đường cong elliptic và $p$ số nguyên tố mà $E$ có khử tốt thường (ordinary good reduction) (tức $p \nmid a_p$). Hàm $L$ $p$-adic ($p$-adic L-function) $L_p(E, s)$ là hàm giải tích $p$-adic trên $\mathbb{Z}_p$ thỏa mãn tính chất nội suy [mazur-tate-teitelbaum1986]:
\[ L_p(E, 1) = \left(1 - \frac{1}{\alpha_p}\right)^2 \cdot \frac{L(E, 1)}{\Omega_E^+}, \]
trong đó $\alpha_p$ là nghiệm $p$-adic đơn vị ($|\alpha_p|_p = 1$) của $T^2 - a_pT + p = 0$, và $\Omega_E^+$ là chu kỳ thực dương.

Nói đơn giản: $L_p(E, s)$ là phiên bản “$p$-adic” của $L(E,s)$ phức. Nó sống trên thế giới $p$-adic (thay vì thế giới phức), nhưng “nội suy” giá trị đặc biệt của $L(E,s)$ phức tại các twist bởi đặc trưng.

Xây dựng: Kubota--Leopoldt (cho $\zeta$), Mazur--Swinnerton-Dyer (cho $E$ ordinary, 1974), Amice--Vélu, Višik (cho $E$ supersingular).

Ví dụ

Ví dụ (Thừa số Euler $p$-adic). Cho $E\colon y^2 + y = x^3 - x^2$ (conductor 11) tại $p = 5$:
  • $a_5 = 2$ (từ bảng $a_p$), nên $p \nmid a_5$: khử tốt thường.
  • Đa thức $T^2 - 2T + 5 = 0$. Nghiệm: $\alpha = 1 + 2i$, $\beta = 1 - 2i$. Trong $\mathbb{Q}_5$: chọn $\alpha_5$ sao cho $|\alpha_5|_5 = 1$.
  • Thừa số Euler $p$-adic: $(1 - 1/\alpha_5)^2$.
  • $L_5(E, 1) = (1 - 1/\alpha_5)^2 \cdot L(E,1)/\Omega_E^+$.

Hiện tượng “zero ngoại lệ”: Nếu $E$ có khử nhân tính tách tại $p$ (ví dụ $E\colon y^2 + y = x^3 - x^2$ tại $p = 11$), thì $\alpha_p = 1$, nên $(1 - 1/\alpha_p) = 0$: $L_p(E, 1) = 0$ ngay cả khi $L(E,1) \neq 0$! Đây là “zero ngoại lệ” của Mazur--Tate--Teitelbaum [mazur-tate-teitelbaum1986].

Ý nghĩa trực giác

Hàm $L$ $p$-adic --- “bản sao $p$-adic” của $L(E,s)$.
  • Hai thế giới song song: Mọi lý thuyết giải tích phức đều có phiên bản $p$-adic. Hàm $L$ phức sống trên $\mathbb{C}$; hàm $L$ $p$-adic sống trên $\mathbb{Q}_p$. Cả hai mã hóa thông tin số học, nhưng bằng “ngôn ngữ” khác nhau.
  • Nội suy: Hàm $L$ $p$-adic không phải “thác triển $p$-adic” của $L(E,s)$. Nó được xây dựng bằng cách nội suy các giá trị đặc biệt $L(E, \chi, 1)/\Omega$ khi $\chi$ chạy qua các đặc trưng $p$-lũy thừa.
  • Ưu thế: Phương pháp $p$-adic đôi khi dễ kiểm soát hơn phương pháp phức (vì $\mathbb{Q}_p$ có cấu trúc đại số phong phú hơn $\mathbb{C}$). Nhiều kết quả về BSD đã được chứng minh trước trong thế giới $p$-adic.

Liên hệ với giả thuyết Birch--Dyer

Hàm $L$ $p$-adic và BSD.
  • BSD $p$-adic: $\mathrm{ord}_{s=1} L_p(E, s) = r(E/\mathbb{Q})$ [mazur-tate-teitelbaum1986]. Đây là phiên bản $p$-adic của BSD, cùng dự đoán nhưng trong thế giới $p$-adic.
  • Phỏng đoán chính Iwasawa (IMC): Liên hệ $L_p(E,s)$ với nhóm Selmer $p$-adic. IMC đã được chứng minh cho nhiều trường hợp bởi Kato (một chiều) và Skinner--Urban (chiều ngược) --- đây là tiến bộ lớn nhất hướng tới BSD.
  • Kết quả đã biết: Nếu $L(E,1) \neq 0$ và $p$ là số nguyên tố tốt, thì $\mathrm{rk} E(\mathbb{Q}) = 0$ và $|\mathrm{Sha}(E/\mathbb{Q})[p^\infty]| < \infty$. Chứng minh đi qua hàm $L$ $p$-adic và IMC (Kato, Skinner--Urban).
  • Zero ngoại lệ: Khi xảy ra, cần sửa công thức BSD $p$-adic bằng thừa số $\mathcal{L}$-bất biến (Mazur--Tate--Teitelbaum conjecture, Greenberg--Stevens 1993 chứng minh cho trường hợp ordinary).
88 Dấu gốc (Root number $w(E)$) Ch.5 6

Định nghĩa hình thức

Định nghĩa (Dấu gốc). Dấu gốc (root number) $w_E \in \{+1, -1\}$ của đường cong elliptic $E/\mathbb{Q}$ là hằng số xuất hiện trong phương trình hàm [silverman2009, diamond-shurman2005]:
\[ \Lambda(E, s) = w_E \cdot \Lambda(E, 2 - s), \]
trong đó $\Lambda(E,s) = N^{s/2}(2\pi)^{-s}\Gamma(s) L(E,s)$. Dấu gốc tính bởi tích các dấu gốc cục bộ (local root numbers):
\[ w_E = -\prod_{p \mid N} w_p \cdot w_\infty, \]
trong đó $w_p$ phụ thuộc vào loại khử tại $p$, và $w_\infty = -1$ (thừa số vô cực).

Quy tắc tính dấu gốc cục bộ (trường hợp đơn giản):

  • Khử nhân tính tách tại $p$: $w_p = -1$.
  • Khử nhân tính không tách tại $p$: $w_p = +1$.
  • Khử cộng tính: $w_p$ phụ thuộc chi tiết vào đường cong (cần thuật toán Tate).

Ví dụ

Ví dụ (Dấu gốc và tính chẵn lẻ của hạng).

Ví dụ (Dấu gốc và tính chẵn lẻ của hạng).

Đường cong $N$ $w_E$ $r$ $(-1)^r$ Khớp?
$y^2 + y = x^3 - x^2$ 11 $+1$ 0 $+1$ $\checkmark$
$y^2 + y = x^3 - x$ 37 $-1$ 1 $-1$ $\checkmark$
$y^2 = x^3 - 43x + 166$ 5077 $+1$ 2 $+1$ $\checkmark$
$y^2 + y = x^3 - 7x + 6$ 5077 $-1$ 3 $-1$ $\checkmark$
$y^2 = x^3 - x$ 32 $-1$ 0 $+1$ $\times$??

Chú ý: Đường cong $y^2 = x^3 - x$ thực ra có $w_E = +1$ (không phải $-1$), và $r = 0$ phù hợp. Dấu gốc luôn nhất quán với tính chẵn lẻ của hạng trong mọi trường hợp đã kiểm chứng.

Ý nghĩa trực giác

Dấu gốc --- “bài test chẵn/lẻ miễn phí”.
  • Tính từ dữ liệu cục bộ: Dấu gốc tính được hoàn toàn từ conductor $N$ và loại khử tại mỗi $p \mid N$ --- không cần biết hạng $r$ hay bất kỳ điểm hữu tỉ nào. Đây là thông tin “miễn phí”.
  • Hệ quả bắt buộc: Nếu $w_E = -1$, phương trình hàm buộc $L(E,1) = 0$. Theo BSD, $r \geq 1$ --- đường cong phải có vô hạn điểm hữu tỉ. Vậy trước khi tìm kiếm điểm, ta biết tìm kiếm sẽ thành công!
  • Khoảng 50/50: Trong “trung bình” (theo thống kê trên cơ sở dữ liệu lớn), khoảng 50% đường cong có $w_E = +1$ và 50% có $w_E = -1$. Kết hợp BSD yếu: khoảng 50% có $r$ chẵn, 50% có $r$ lẻ.

Liên hệ với giả thuyết Birch--Dyer

Dấu gốc trong BSD.
  • Phỏng đoán tính chẵn lẻ (Parity Conjecture): $(-1)^{r(E/\mathbb{Q})} = w_E$. Đây là hệ quả yếu nhất của BSD yếu, nhưng cũng chưa chứng minh hoàn toàn. Dokchitser--Dokchitser (2010) chứng minh cho đường cong bán ổn định [dokchitser2010].
  • $w_E = -1 \Rightarrow r \geq 1$: Kết hợp phương trình hàm ($L(E,1) = 0$) với Kolyvagin ($L(E,1) = 0$ và $L'(E,1) \neq 0 \Rightarrow r = 1$): nếu thêm $L'(E,1) \neq 0$, ta được $r = 1$ chính xác. Đây là cách chứng minh BSD cho $r = 1$.
  • BSD mạnh: Dấu gốc $w_E$ cũng xuất hiện trong phương trình hàm $\Lambda(E,s) = w_E \Lambda(E, 2-s)$, ảnh hưởng đến cách tính hệ số dẫn đầu $L^{(r)}(E,1)/r!$.
  • Bhargava--Shankar: 50% đường cong có $w_E = +1$. Trong số này, Bhargava--Shankar chứng minh phần lớn có $r = 0$ (thông qua chặn nhóm Selmer). Kết hợp: $\geq 66.48\%$ đường cong thỏa BSD [bhargava-skinner-zhang2014].
89 Phỏng đoán Sato–Tate (Sato–Tate Conjecture) Ch.4 7

Định nghĩa hình thức

Định lý (Sato--Tate, nay là Định lý (2008--2011)). Cho $E/\mathbb{Q}$ đường cong elliptic không có nhân phức (non-CM). Đặt $\theta_p \in [0, \pi]$ sao cho $a_p = 2\sqrt{p}\cos\theta_p$ (góc Frobenius (Frobenius angle)). Khi đó các góc $\{\theta_p\}$ phân bố theo phân bố Sato--Tate (Sato--Tate distribution) [taylor2008]:
\[ \lim_{X \to \infty} \frac{\#\{p \leq X : \alpha \leq \theta_p \leq \beta\}}{\#\{p \leq X\}} = \int_\alpha^\beta \frac{2}{\pi}\sin^2\theta\, d\theta. \]

Lịch sử: Phỏng đoán bởi Mikio Sato (qua thư từ, không công bố chính thức) và John Tate (1963) dựa trên dữ liệu thực nghiệm. Chứng minh bởi Barnet-Lamb, Geraghty, Harris, Taylor (2008--2011) cho đường cong non-CM trên trường hoàn toàn thực [taylor2008].

Trường hợp CM: Nếu $E$ có nhân phức, phân bố khác hẳn! Khoảng 50% các $p$ có $a_p = 0$ (ứng với $\theta_p = \pi/2$), và phần còn lại phân bố đều trên $[0, \pi]$.

Ví dụ

Ví dụ (Dữ liệu Sato--Tate cho $E\colon y^2 = x^3 + x + 1$). Đường cong này non-CM. Chia $[0, \pi]$ thành 10 khoảng và đếm tỷ lệ $\theta_p$ rơi vào mỗi khoảng khi $p \leq 10^6$:

Mật độ $\mu(\theta) = \frac{2}{\pi}\sin^2\theta$ có:

  • Cực đại tại $\theta = \pi/2$ ($a_p \approx 0$): hầu hết $a_p$ gần 0.
  • Triệt tiêu tại $\theta = 0$ và $\pi$ ($a_p \approx \pm 2\sqrt{p}$): rất hiếm $a_p$ gần biên Hasse.
  • Đối xứng: $\mu(\pi - \theta) = \mu(\theta)$, phản ánh $a_p$ phân bố đối xứng quanh 0.

So sánh: đường cong CM $y^2 = x^3 - x$ cho histogram hoàn toàn khác --- “nhọn” tại $\theta = \pi/2$ (do $a_p = 0$ cho mọi $p \equiv 3 \pmod 4$).

Ý nghĩa trực giác

Sato--Tate --- “luật thống kê” cho lượng sai Frobenius.
  • “Đồng xu thiên lệch”: Mỗi $a_p$ riêng lẻ trông “ngẫu nhiên”. Nhưng khi $p$ chạy, chúng tuân theo quy luật thống kê chính xác --- mật độ bán tròn $\frac{2}{\pi}\sin^2\theta$. Đây tương tự Định lý giới hạn trung tâm: mỗi kết quả riêng lẻ ngẫu nhiên, nhưng tổng thể tuân theo phân bố Gauss.
  • Nhóm $\mathrm{SU}(2)$: Phân bố $\frac{2}{\pi}\sin^2\theta$ chính là phân bố Haar (đo tự nhiên) trên nhóm unitary đặc biệt $\mathrm{SU}(2)$, chiếu lên góc riêng. Ma trận Frobenius (chuẩn hóa) $\begin{pmatrix} e^{i\theta_p} & 0 \\ 0 & e^{-i\theta_p} \end{pmatrix}$ phân bố “đều” trên $\mathrm{SU}(2)$ --- nhóm đối xứng ẩn đằng sau!
  • Chứng minh cực khó: Chứng minh Sato--Tate đòi hỏi “nâng” modularity lên $\mathrm{GL}_2$ trên trường hoàn toàn thực --- một thành tựu kỹ thuật phi thường của Taylor et al.

Liên hệ với giả thuyết Birch--Dyer

Sato--Tate và BSD.
  • Thống kê cục bộ: Sato--Tate cho “luật lớn” cho dữ liệu $a_p$ --- chính dữ liệu xây dựng hàm $L(E,s)$ và tích hữu hạn $\Pi_E(X)$. Phân bố $a_p$ ảnh hưởng đến tốc độ hội tụ tích Euler.
  • Liên hệ gián tiếp: Sato--Tate không trực tiếp chứng minh BSD, nhưng nó xác nhận “dữ liệu đầu vào” ($a_p$) cho hàm $L$ có cấu trúc hợp lý. Nó cũng là hệ quả của Langlands (cùng chương trình lớn chứa BSD).
  • Moments: Các moment $\sum_{p \leq X} a_p^k / p^{k/2}$ tính được từ phân bố Sato--Tate, cho thông tin về hàm $L$ đối xứng $\mathrm{Sym}^k L(E,s)$ --- đối tượng nghiên cứu tích cực trong chương trình Langlands [katz-sarnak1999].
90 Góc Frobenius (Frobenius angle $\theta_p$) Ch.4 5

Định nghĩa hình thức

Định nghĩa (Góc Frobenius). Cho $E/\mathbb{Q}$ đường cong elliptic và $p$ số nguyên tố khử tốt. Vì $|a_p| \leq 2\sqrt{p}$ (cận Hasse), tồn tại duy nhất $\theta_p \in [0, \pi]$ sao cho [silverman2009]:
\[ a_p = 2\sqrt{p}\cos\theta_p. \]
Số $\theta_p$ gọi là góc Frobenius (Frobenius angle) tại $p$. Tương đương, hai nghiệm của đa thức đặc trưng $T^2 - a_pT + p = 0$ là:
\[ \alpha_p = \sqrt{p}\, e^{i\theta_p}, \qquad \beta_p = \sqrt{p}\, e^{-i\theta_p}. \]

Nhờ cận Hasse, $\cos\theta_p = a_p/(2\sqrt{p}) \in [-1, 1]$, nên $\theta_p$ luôn xác định. Giá trị $\theta_p$ mã hóa “lệch” của $\#E(\mathbb{F}_p)$ so với kỳ vọng $p+1$:

  • $\theta_p = \pi/2$ ($a_p = 0$): đúng kỳ vọng, $\#E(\mathbb{F}_p) = p + 1$.
  • $\theta_p \approx 0$ ($a_p \approx 2\sqrt{p}$): ít điểm hơn kỳ vọng.
  • $\theta_p \approx \pi$ ($a_p \approx -2\sqrt{p}$): nhiều điểm hơn kỳ vọng.

Ví dụ

Ví dụ (Góc Frobenius cho $E\colon y^2 = x^3 + x + 1$).
$p$ $a_p$ $2\sqrt{p}$ $\cos\theta_p = \frac{a_p}{2\sqrt{p}}$ $\theta_p$
202.830$\pi/2 = 1.571$
303.460$\pi/2 = 1.571$
5$-3$4.47$-0.671$$2.307$
735.29$0.567$$0.970$
1146.63$0.603$$0.923$
13$-2$7.21$-0.277$$1.852$

Giá trị $\theta_p$ “nhảy” thất thường --- nhưng phân bố thống kê tuân theo mật độ bán tròn $\frac{2}{\pi}\sin^2\theta$ (Sato--Tate).

Ý nghĩa trực giác

Góc Frobenius --- “pha” của đường cong tại $p$.
  • Giá trị riêng trên đường tròn: Hai nghiệm $\alpha_p = \sqrt{p}\, e^{i\theta_p}$, $\beta_p = \sqrt{p}\, e^{-i\theta_p}$ nằm trên đường tròn bán kính $\sqrt{p}$. Góc $\theta_p$ xác định vị trí trên đường tròn --- “pha” của Frobenius.
  • Ma trận unitary: Chuẩn hóa bỏ $\sqrt{p}$: $\tilde{\alpha}_p = e^{i\theta_p}$, $\tilde{\beta}_p = e^{-i\theta_p}$. Ma trận Frobenius chuẩn hóa $\begin{pmatrix} e^{i\theta_p} & 0 \\ 0 & e^{-i\theta_p} \end{pmatrix} \in \mathrm{SU}(2)$. Phỏng đoán Sato--Tate nói ma trận này phân bố “đều” trên $\mathrm{SU}(2)$.
  • Thừa số Euler: $L_p(E, s) = (1 - \alpha_p p^{-s})^{-1}(1 - \beta_p p^{-s})^{-1}$. Thay $\alpha_p = \sqrt{p}\, e^{i\theta_p}$:
    \[ L_p(E, s) = \frac{1}{1 - 2\cos\theta_p \cdot p^{1/2-s} + p^{1-2s}}. \]
    Vậy $\theta_p$ trực tiếp xác định thừa số Euler, từ đó xác định $L(E,s)$.

Liên hệ với giả thuyết Birch--Dyer

Góc Frobenius trong BSD.
  • Dữ liệu đầu vào: Dãy $\{\theta_p\}_{p \text{ nguyên tố}}$ xác định hoàn toàn hàm $L(E,s)$ (qua tích Euler). BSD nói rằng hành vi “tổng hợp” của dãy này (cụ thể: bậc triệt tiêu tại $s = 1$) bằng hạng.
  • “Trung bình” $\theta_p$ và tích hữu hạn: $\log \Pi_E(X) = \sum_{p \leq X} \log(1 - a_p/p + 1/p)$. Vì $a_p = 2\sqrt{p}\cos\theta_p$, số hạng chính $\approx -2\cos\theta_p / \sqrt{p}$. Phân bố Sato--Tate cho $\langle \cos\theta_p \rangle \approx 0$, giải thích tại sao $\Pi_E(X)$ tăng chậm (logarithmic).
  • Hàm $L$ đối xứng: Các moment $\cos^k\theta_p$ liên quan đến hàm $L$ lũy thừa đối xứng $L(\mathrm{Sym}^k E, s)$. Tính chất giải tích của các hàm này (thác triển, phương trình hàm) nằm trong chương trình Langlands --- framework rộng hơn chứa BSD [katz-sarnak1999].
91 Nhóm SU(2) (SU(2)) Ch.4 5

Định nghĩa

Định nghĩa (Nhóm SU(2)). Nhóm unitary đặc biệt (Special Unitary Group) $\mathrm{SU}(2)$ là nhóm các ma trận phức $2 \times 2$ thỏa mãn hai điều kiện:
  1. Unitary: $U^* U = I$ (trong đó $U^* = \overline{U}^T$ là chuyển vị liên hợp).
  2. Định thức 1: $\det U = 1$.
Cụ thể, mọi phần tử của $\mathrm{SU}(2)$ có dạng:
\[ U = \begin{pmatrix} \alpha & -\overline{\beta} \\ \beta & \overline{\alpha} \end{pmatrix}, \quad \alpha, \beta \in \mathbb{C}, \quad |\alpha|^2 + |\beta|^2 = 1. \]
Điều kiện $|\alpha|^2 + |\beta|^2 = 1$ cho thấy $\mathrm{SU}(2)$ đồng phôi (homeomorphic) với mặt cầu $S^3$ trong $\mathbb{R}^4$, nên $\mathrm{SU}(2)$ là một nhóm Lie compact liên thông.

Ví dụ

Ví dụ (Các phần tử của $\mathrm{SU}(2)$).
  1. Ma trận đơn vị: $I = \begin{pmatrix} 1 & 0 \\ 0 & 1 \end{pmatrix}$ (lấy $\alpha = 1$, $\beta = 0$).
  2. Ma trận Pauli: Ba ma trận Pauli (nhân với $i$) cho ba phần tử đặc biệt:
    \[ i\sigma_1 = \begin{pmatrix} 0 & i \\ i & 0 \end{pmatrix}, \quad i\sigma_2 = \begin{pmatrix} 0 & 1 \\ -1 & 0 \end{pmatrix}, \quad i\sigma_3 = \begin{pmatrix} i & 0 \\ 0 & -i \end{pmatrix}. \]
  3. Ma trận chéo: $\begin{pmatrix} e^{i\theta} & 0 \\ 0 & e^{-i\theta} \end{pmatrix} \in \mathrm{SU}(2)$ với mọi $\theta \in [0, 2\pi)$. Đây chính là torus cực đại --- nhóm con giao hoán lớn nhất. Mỗi ma trận trong $\mathrm{SU}(2)$ liên hợp với một ma trận chéo dạng này.

Ý nghĩa trực giác

SU(2) --- nhóm phép quay trong lý thuyết số.
  • Hình dung: Hãy tưởng tượng $\mathrm{SU}(2)$ như mặt cầu 3 chiều $S^3$. Mỗi “điểm” trên mặt cầu này là một ma trận $2 \times 2$ đặc biệt. Nhóm này mô tả mọi “phép quay” có thể trong không gian 2 chiều phức.
  • Lớp liên hợp: Mỗi phần tử của $\mathrm{SU}(2)$ được xác định (đến liên hợp) bởi một góc $\theta \in [0, \pi]$: giá trị riêng là $e^{\pm i\theta}$. Khi chọn ngẫu nhiên một ma trận từ $\mathrm{SU}(2)$ (theo độ đo Haar), góc $\theta$ tuân theo phân bố bán tròn:
    \[ \mu(\theta)\, d\theta = \frac{2}{\pi}\sin^2\theta\, d\theta. \]
    Đây chính là luật phân bố Sato--Tate!
  • Tại sao $\mathrm{SU}(2)$? Mỗi đường cong elliptic $E$ cho một biểu diễn Galois 2 chiều. Đối với mỗi $p$ tốt, Frobenius $\mathrm{Frob}_p$ cho một ma trận $2 \times 2$. Chuẩn hóa bỏ $\sqrt{p}$, ma trận này thuộc $\mathrm{SU}(2)$. Phỏng đoán Sato--Tate nói rằng dãy ma trận $\{\mathrm{Frob}_p\}$ phân bố đều trên $\mathrm{SU}(2)$.

Liên hệ với giả thuyết Birch--Dyer

SU(2) trong BSD.
  • Nền tảng của Sato--Tate: Phỏng đoán Sato--Tate (nay là định lý cho $E/\mathbb{Q}$ không CM [taylor2008]) phát biểu rằng các Frobenius chuẩn hóa phân bố đều (equidistributed) trên $\mathrm{SU}(2)$ theo độ đo Haar. Nhóm $\mathrm{SU}(2)$ là “nhóm Sato--Tate” của đường cong.
  • Tích Euler và BSD: Hàm $L(E,s) = \prod_p L_p(E,s)$ được xây dựng từ các thừa số cục bộ. Mỗi thừa số $L_p$ phụ thuộc vào góc $\theta_p$ (lớp liên hợp trong $\mathrm{SU}(2)$). Phân bố đều trên $\mathrm{SU}(2)$ kiểm soát tốc độ hội tụ/phân kỳ của tích Euler --- liên quan trực tiếp đến bậc triệt tiêu $\mathrm{ord}_{s=1} L(E,s)$.
  • Trường hợp CM: Khi $E$ có nhân phức, nhóm Sato--Tate là $\mathrm{U}(1) \subsetneq \mathrm{SU}(2)$ (nhỏ hơn), và phân bố khác: $\theta_p$ đều trên $[0, \pi]$ thay vì bán tròn [katz-sarnak1999].
92 Ký hiệu Legendre (Legendre symbol) Ch.4 2

Định nghĩa

Định nghĩa (Ký hiệu Legendre). Cho $p$ là số nguyên tố lẻ và $a \in \mathbb{Z}$ với $\gcd(a, p) = 1$. Ký hiệu Legendre (Legendre symbol) $\left(\frac{a}{p}\right)$ được định nghĩa:
\[ \left(\frac{a}{p}\right) = \begin{cases} +1 & \text{nếu } a \text{ là thặng dư bậc hai modulo } p, \\ -1 & \text{nếu } a \text{ không là thặng dư bậc hai modulo } p. \end{cases} \]
Nói cách khác, $\left(\frac{a}{p}\right) = +1$ khi tồn tại $x \in \mathbb{Z}$ sao cho $x^2 \equiv a \pmod{p}$, và $= -1$ khi không tồn tại $x$ như vậy. Quy ước thêm: $\left(\frac{a}{p}\right) = 0$ khi $p \mid a$.

Ký hiệu Legendre có thể tính bằng tiêu chuẩn Euler:

\[ \left(\frac{a}{p}\right) \equiv a^{(p-1)/2} \pmod{p}. \]

Ví dụ

Ví dụ (Tính ký hiệu Legendre).
  1. $p = 7$: Các bình phương modulo $7$: $1^2 = 1$, $2^2 = 4$, $3^2 = 2$. Vậy thặng dư bậc hai là $\{1, 2, 4\}$.
    \[ \left(\frac{1}{7}\right) = 1, \quad \left(\frac{2}{7}\right) = 1, \quad \left(\frac{3}{7}\right) = -1, \quad \left(\frac{4}{7}\right) = 1, \quad \left(\frac{5}{7}\right) = -1, \quad \left(\frac{6}{7}\right) = -1. \]
  2. Kiểm tra bằng Euler: $\left(\frac{3}{7}\right) \equiv 3^{(7-1)/2} = 3^3 = 27 \equiv 6 \equiv -1 \pmod{7}$. Đúng: $3$ không là bình phương modulo $7$.
  3. Luật thuận nghịch: Luật thuận nghịch bậc hai (Gauss) cho:
    \[ \left(\frac{p}{q}\right)\left(\frac{q}{p}\right) = (-1)^{\frac{p-1}{2}\cdot\frac{q-1}{2}} \]
    với $p, q$ nguyên tố lẻ phân biệt. Ví dụ: $\left(\frac{3}{7}\right)\left(\frac{7}{3}\right) = (-1)^{1 \cdot 3} = -1$. Vì $\left(\frac{3}{7}\right) = -1$ nên $\left(\frac{7}{3}\right) = \left(\frac{1}{3}\right) = 1$.

Ý nghĩa trực giác

Ký hiệu Legendre --- “nhãn $\pm 1$” cho mỗi số nguyên tố.
  • Hình dung: Với mỗi $p$ lẻ, ký hiệu Legendre chia các số $1, 2, \ldots, p-1$ thành hai nhóm bằng nhau:
  • $(p-1)/2$ số là bình phương (thặng dư bậc hai, nhãn $+1$),
  • $(p-1)/2$ số không là bình phương (phi thặng dư, nhãn $-1$).
Đây là hàm nhân tính: $\left(\frac{ab}{p}\right) = \left(\frac{a}{p}\right)\left(\frac{b}{p}\right)$.

Đếm điểm trên EC: Khi đếm $\#E(\mathbb{F}_p)$ cho $E: y^2 = f(x)$, ta tính:

\[ \#E(\mathbb{F}_p) = 1 + \sum_{x=0}^{p-1} \left(1 + \left(\frac{f(x)}{p}\right)\right) = p + 1 + \sum_{x=0}^{p-1} \left(\frac{f(x)}{p}\right). \]
Vậy $a_p = -\sum_{x=0}^{p-1} \left(\frac{f(x)}{p}\right)$. Ký hiệu Legendre là công cụ cơ bản để tính $a_p$.

Liên hệ với giả thuyết Birch--Dyer

Ký hiệu Legendre trong BSD.
  • Công thức đếm: Vết Frobenius $a_p = p + 1 - \#E(\mathbb{F}_p)$ --- đại lượng cốt lõi xây dựng hàm $L(E,s)$ --- được tính trực tiếp qua tổng ký hiệu Legendre.
  • Đường cong CM: Với $E: y^2 = x^3 - x$ (CM bởi $\mathbb{Z}[i]$), ta có $a_p = 0$ khi $p \equiv 3 \pmod{4}$ vì $\left(\frac{-1}{p}\right) = -1$. Ký hiệu Legendre xác định hoàn toàn hành vi của $a_p$.
  • Twist bậc hai: Với $E_d: dy^2 = f(x)$, ta có $a_p(E_d) = \left(\frac{d}{p}\right) a_p(E)$. Hàm $L$ của twist thay đổi bởi ký hiệu Legendre: $L(E_d, s) = L(E, s, \chi_d)$ trong đó $\chi_d = \left(\frac{d}{\cdot}\right)$.
93 Thặng dư bậc hai (Quadratic residue) Ch.4 2

Định nghĩa

Định nghĩa (Thặng dư bậc hai). Cho $n \geq 2$ là số nguyên dương và $a \in \mathbb{Z}$ với $\gcd(a, n) = 1$. Ta nói $a$ là thặng dư bậc hai (quadratic residue) modulo $n$ nếu tồn tại $x \in \mathbb{Z}$ sao cho:
\[ x^2 \equiv a \pmod{n}. \]
Nếu không tồn tại $x$ như vậy, ta nói $a$ là phi thặng dư bậc hai (quadratic non-residue) modulo $n$.

Khi $p$ là nguyên tố lẻ, tập thặng dư bậc hai modulo $p$ là nhóm con $(\mathbb{F}_p^{\times})^2 = \{x^2 : x \in \mathbb{F}_p^{\times}\}$, có chỉ số $[\mathbb{F}_p^{\times} : (\mathbb{F}_p^{\times})^2] = 2$ (đúng một nửa các phần tử khác $0$ là bình phương).

Ví dụ

Ví dụ (Thặng dư bậc hai modulo các số nguyên tố nhỏ).
$p$ Bình phương $x^2 \bmod p$ Thặng dư bậc hai
$3$$1^2 = 1$$\{1\}$
$5$$1^2 = 1,\; 2^2 = 4$$\{1, 4\}$
$7$$1^2 = 1,\; 2^2 = 4,\; 3^2 = 2$$\{1, 2, 4\}$
$11$$1, 4, 9, 5, 3$$\{1, 3, 4, 5, 9\}$
$13$$1, 4, 9, 3, 12, 10$$\{1, 3, 4, 9, 10, 12\}$

Nhận xét: Với mỗi $p$ lẻ, có đúng $(p-1)/2$ thặng dư bậc hai.

Ý nghĩa trực giác

Thặng dư bậc hai --- phương trình $y^2 = a$ có nghiệm?.
  • Hình dung: Câu hỏi “$a$ có phải thặng dư bậc hai modulo $p$?” tương đương “phương trình $y^2 = a$ có nghiệm trong $\mathbb{F}_p$?”. Với đường cong elliptic $y^2 = f(x)$, câu hỏi này phải được trả lời cho từng $x \in \mathbb{F}_p$ --- đó là bản chất của việc đếm điểm.
  • Luật thuận nghịch: Luật thuận nghịch bậc hai (Gauss, 1801) --- “đá quý của lý thuyết số” --- cho phép hoán đổi vai trò $p$ và $q$: biết $p$ có là bình phương modulo $q$ hay không, ta suy ra $q$ có là bình phương modulo $p$ hay không. Đây là kết quả đầu tiên về tính tương hỗ --- tiền thân của chương trình Langlands.
  • Một nửa là bình phương: Ánh xạ $x \mapsto x^2$ trên $\mathbb{F}_p^{\times}$ là đồng cấu nhóm với hạt nhân $\{\pm 1\}$, nên ảnh $(\mathbb{F}_p^{\times})^2$ có $(p-1)/2$ phần tử. Tập bình phương tạo thành nhóm con chỉ số $2$ --- nhóm con duy nhất.

Liên hệ với giả thuyết Birch--Dyer

Thặng dư bậc hai trong BSD.
  • Đếm điểm: Số điểm $\#E(\mathbb{F}_p)$ phụ thuộc trực tiếp vào có bao nhiêu $x \in \mathbb{F}_p$ mà $f(x)$ là thặng dư bậc hai. Nếu $f(x)$ là bình phương modulo $p$, ta được 2 điểm $(x, \pm y)$; nếu $f(x) = 0$, được 1 điểm; nếu phi thặng dư, không có điểm.
  • Rút gọn nhân: Loại rút gọn xấu tại $p$ (nhân tách vs.không tách) phụ thuộc vào $c_4/\Delta$ có phải thặng dư bậc hai modulo $p$ hay không. Điều này ảnh hưởng đến thừa số Euler $L_p(E,s)$ và số Tamagawa $c_p$.
  • Số đồng dư: Số nguyên $n$ là số đồng dư khi và chỉ khi $E_n: y^2 = x^3 - n^2 x$ có hạng $\geq 1$. Định lý Tunnell [tunnell1983] quy điều kiện này về đếm biểu diễn bậc hai --- bản chất là thặng dư bậc hai modulo các số nguyên tố.
94 Giả thuyết BSD yếu (Weak BSD Conjecture) Ch.1 5

Định nghĩa

Giả thiết (Giả thuyết Birch và Swinnerton-Dyer yếu). Cho $E/\mathbb{Q}$ là đường cong elliptic với hàm $L$ Hasse--Weil $L(E,s)$. Giả thuyết BSD yếu (Weak BSD Conjecture) phát biểu:
\[ \boxed{\mathrm{ord}_{s=1} L(E,s) = \mathrm{rk}\bigl(E(\mathbb{Q})\bigr)} \]
trong đó:
  • $\mathrm{ord}_{s=1} L(E,s)$ là bậc triệt tiêu (hạng giải tích $r_{\mathrm{an}}$) --- bậc của số $0$ trong khai triển Taylor của $L(E,s)$ quanh $s = 1$,
  • $\mathrm{rk}\bigl(E(\mathbb{Q})\bigr)$ là hạng đại số $r$ --- số lượng sinh tự do trong nhóm Mordell--Weil $E(\mathbb{Q}) \cong \mathbb{Z}^r \oplus E(\mathbb{Q})_{\mathrm{tors}}$.
Nói ngắn gọn: hạng giải tích bằng hạng đại số, hay $r_{\mathrm{an}} = r$.

Bối cảnh và động lực

Bài toán cốt lõi --- "Có bao nhiêu nghiệm hữu tỉ?"

Cho đường cong elliptic $E/\mathbb{Q}$, câu hỏi đơn giản nhất ta có thể đặt ra là: phương trình này có bao nhiêu nghiệm với tọa độ hữu tỉ?

Định lý Mordell--Weil [mordell1922] đảm bảo:

\[E(\mathbb{Q}) \cong \mathbb{Z}^r \oplus E(\mathbb{Q})_{\mathrm{tors}}\]

trong đó $r$ (hạng, rank) đo "độ phong phú" của nghiệm hữu tỉ:

  • $r = 0$: chỉ có hữu hạn nghiệm (toàn bộ là xoắn),
  • $r = 1$: vô hạn nghiệm, sinh bởi 1 điểm qua luật nhóm,
  • $r = 2$: sinh bởi 2 điểm độc lập, và cứ thế...

Vấn đề: Mordell--Weil chỉ khẳng định $r$ tồn tại, nhưng không cho cách tính $r$! Đến nay vẫn chưa có thuật toán tổng quát nào chắc chắn tính được hạng của mọi đường cong elliptic. Thuật toán descent chỉ cho cận trên, còn khoảng cách giữa cận trên (từ nhóm Selmer) và cận dưới (từ tìm kiếm điểm) có thể rất lớn.

Ý tưởng của Birch và Swinnerton-Dyer --- đếm nghiệm mod $p$.

Vào cuối thập niên 1950, Bryan Birch và Peter Swinnerton-Dyer tại Cambridge có một ý tưởng táo bạo:

Nếu không đếm trực tiếp nghiệm hữu tỉ được, hãy đếm nghiệm modulo từng số nguyên tố $p$, rồi "ghép" thông tin lại.

Cụ thể, với mỗi $p$ rút gọn tốt, đặt $N_p = \#E(\mathbb{F}_p)$ và xét tích:

\[\Pi_E(X) = \prod_{p \leq X} \frac{N_p}{p}.\]

Chạy trên máy EDSAC (1958--1963), họ phát hiện: $\Pi_E(X) \sim C \cdot (\log X)^r$ khi $X \to \infty$, trong đó $r$ đúng bằng hạng đại số! Tốc độ tăng của tích "biết" được số lượng nghiệm hữu tỉ. Viết lại bằng ngôn ngữ hàm $L$ (vì $\Pi_E(X)$ chính là tích Euler cắt cụt ngược tại $s = 1$), phát hiện này trở thành: $\mathrm{ord}_{s=1} L(E,s) = r$ --- đó là giả thuyết BSD yếu [birch-sd1963] [birch-sd1965].

Ví dụ

Ví dụ (Kiểm nghiệm BSD yếu).
  1. Hạng 0: $E: y^2 + y = x^3 - x$ (conductor $37$, nhãn LMFDB 37.a1). Ta có $E(\mathbb{Q}) = \{O\}$ (hạng $0$) và $L(E, 1) \approx 0.2538 \neq 0$. Vậy $\mathrm{ord}_{s=1} L(E,s) = 0 = \mathrm{rk}(E(\mathbb{Q}))$. BSD yếu đúng!
  2. Hạng 1: $E: y^2 + y = x^3 - x^2$ (conductor $11$, nhãn 11.a1). Hạng đại số $r = 1$ với sinh $P = (0,0)$. Tính $L(E,1) = 0$, $L'(E,1) \approx 0.2538 \neq 0$. Vậy $\mathrm{ord}_{s=1} = 1 = r$. BSD yếu đúng!
  3. Hạng 2: $E: y^2 + y = x^3 + x^2 - 2x$ (conductor $389$, nhãn 389.a1). Hạng $r = 2$, sinh bởi $P_1 = (0,0)$, $P_2 = (-1, 1)$. Tính $L(E,1) = 0$, $L'(E,1) = 0$, $L''(E,1) \neq 0$. Vậy $\mathrm{ord}_{s=1} = 2 = r$. BSD yếu đúng!
Cả ba trường hợp trên đã được chứng minh bằng lý thuyết (Coates--Wiles, Gross--Zagier--Kolyvagin cho hạng $\leq 1$). Hạng $\geq 2$ chỉ được kiểm nghiệm bằng số [cremona1997].

Ý nghĩa trực giác

BSD yếu --- cầu nối giữa đại số và giải tích.
  • Hai thế giới, một câu trả lời: Hạng đại số $r$ đến từ đại số --- tìm các điểm hữu tỉ và chứng minh chúng độc lập tuyến tính. Hạng giải tích $r_{\mathrm{an}}$ đến từ giải tích --- hành vi của hàm $L$ tại $s = 1$. BSD yếu nói rằng hai cách tiếp cận hoàn toàn khác nhau cho cùng một đáp số.
  • Tương tự công thức Dirichlet: Cho đặc trưng $\chi$ của nhóm Dirichlet, $L(1, \chi) \neq 0$ tương đương với tồn tại vô hạn số nguyên tố trong lớp tương ứng. BSD yếu là phiên bản phi giao hoán, sâu hơn nhiều.
  • “Nhìn từ xa” vs. “nhìn gần”: Hàm $L(E,s)$ tổng hợp thông tin cục bộ (đếm điểm modulo $p$ cho mọi $p$) thành một hàm toàn cục. BSD yếu nói rằng hành vi toàn cục ($\mathrm{ord}_{s=1}$) phản ánh đúng cấu trúc toàn cục ($\mathrm{rk}$). Đây là bản chất “local-to-global” --- nguyên lý xuyên suốt lý thuyết số.

Tại sao BSD yếu khó chứng minh?

Năm rào cản chính.
  1. Nhóm Sha chưa biết hữu hạn: Ngay cả BSD yếu cũng gián tiếp phụ thuộc vào $\mathrm{Sha}(E/\mathbb{Q})$. Các phương pháp chứng minh $r_{\mathrm{an}} \leq 1 \Rightarrow r = r_{\mathrm{an}}$ (Kolyvagin) đều phải đồng thời chứng minh $|\mathrm{Sha}| < \infty$. Với $r_{\mathrm{an}} \geq 2$, ta không có công cụ nào kiểm soát $\mathrm{Sha}$.
  2. Không có cách tính hạng tổng quát: Thuật toán descent cho cận trên qua nhóm Selmer: $r \leq \dim_{\mathbb{F}_p} \mathrm{Sel}_p(E/\mathbb{Q}) - \dim_{\mathbb{F}_p} E(\mathbb{Q})[p]$. Nhưng khoảng cách giữa cận trên và cận dưới (từ tìm kiếm điểm) có thể rất lớn. Không có thuật toán nào chắc chắn dừng và cho đúng $r$.
  3. Hạng cao là "vùng tối": Gross--Zagier chỉ xử lý $r_{\mathrm{an}} = 1$ (qua điểm Heegner). Hệ thống Euler (Kolyvagin) cũng chỉ cho $r_{\mathrm{an}} \leq 1$. Với $r_{\mathrm{an}} \geq 2$, chưa có phương pháp nào xây dựng đủ $r$ điểm độc lập từ thông tin giải tích. Đây là rào cản lớn nhất.
  4. Chiều "ngược" đặc biệt khó: Chiều $r_{\mathrm{an}} \geq 1 \Rightarrow r \geq 1$ (nếu $L(E,1) = 0$ thì phải xây dựng một điểm hữu tỉ) khó hơn chiều thuận. Phương pháp Heegner chỉ áp dụng khi dấu gốc $w_E = -1$ (và chỉ cho 1 điểm). Khi $r_{\mathrm{an}} \geq 2$, ta cần tìm $\geq 2$ điểm độc lập --- chưa ai biết cách.
  5. Cầu nối đại số $\leftrightarrow$ giải tích chưa hoàn chỉnh: Định lý modularity (Wiles [wiles1995], BCDT [breuil-etal2001]) cho phép thác triển $L(E,s)$, nhưng chỉ "chuyển" được giữa hai thế giới trong trường hợp đặc biệt. Để chứng minh BSD tổng quát, ta cần một "cầu nối" mạnh hơn nhiều --- có thể từ chương trình Langlands hoặc lý thuyết Iwasawa.

Tiến trình giải quyết --- những gì đã biết

Bảng tổng hợp các kết quả chính.
Năm Tác giả Kết quả
1977 Coates--Wiles [coates-wiles1977] Nếu $E$ có CM và $L(E,1) \neq 0$ thì $r = 0$.
1986 Gross--Zagier [gross-zagier1986] Công thức: $L'(E,1) = c \cdot \hat{h}(P_K)$ với $P_K$ điểm Heegner. Hệ quả: $L'(E,1) \neq 0 \Rightarrow r \geq 1$.
1990 Kolyvagin [kolyvagin1990] Nếu $r_{\mathrm{an}} \leq 1$ thì $r = r_{\mathrm{an}}$ $\mathrm{Sha}$ hữu hạn. Dùng hệ thống Euler.
1991 Rubin [rubin1991] BSD mạnh cho đường cong CM với $r = 0$ (mọi $p$).
2001 BCDT [breuil-etal2001] Mọi $E/\mathbb{Q}$ là modular $\Rightarrow$ $L(E,s)$ thác triển giải tích.
2004 Kato [kato2004] $L(E,1) \neq 0 \Rightarrow r = 0$ và $|\mathrm{Sha}| < \infty$ (không cần CM).
2006 Skinner--Urban [skinner-urban2014] Main conjecture $\mathrm{GL}_2$ $\Rightarrow$ BSD mạnh phần $p$ (hầu hết $p$).
2015 Bhargava--Skinner--Zhang [bhargava-skinner-zhang2014] $\geq 66{,}48\%$ đường cong elliptic thỏa mãn BSD yếu.
2022 A. Smith Phỏng đoán Goldfeld cho họ bậc 2: 50% hạng 0, 50% hạng 1.

Tình trạng hiện tại: BSD yếu đã được chứng minh khi $r_{\mathrm{an}} \leq 1$. Với $r_{\mathrm{an}} \geq 2$, chưa có kết quả nào --- đây là "vùng tối" lớn nhất. Về mặt thống kê, phần lớn đường cong có hạng $0$ hoặc $1$, nên kết quả Bhargava--Skinner--Zhang bao phủ "hầu hết" các trường hợp.

Các phiên bản mở rộng

BSD yếu cho các đối tượng tổng quát hơn.
  1. BSD trên trường số $K/\mathbb{Q}$: Thay $E(\mathbb{Q})$ bằng $E(K)$ và $L(E/\mathbb{Q}, s)$ bằng $L(E/K, s)$. Kết quả Gross--Zagier--Kolyvagin vẫn đúng cho trường bậc hai ảo $K$.
  2. BSD cho đa tạp Abel: $A/K$ đa tạp Abel chiều $g$. Hàm $L(A,s)$ có bậc $2g$ trong tích Euler. Phỏng đoán: $\mathrm{ord}_{s=1} L(A,s) = \mathrm{rk}(A(K))$.
  3. BSD $p$-adic (Mazur--Tate--Teitelbaum): Thay $L(E,s)$ bằng hàm $L$ $p$-adic $L_p(E,s)$. Khi $E$ có rút gọn nhân tách tại $p$, xuất hiện zero ngoại lệ (exceptional zero): $L_p$ triệt tiêu "thêm 1 bậc" so với $L$ phức, với hệ số dẫn đầu nhân thêm bất biến $\mathcal{L}_p$.
  4. Phỏng đoán Bloch--Kato [bloch-kato1990]: Tổng quát BSD cho motif bất kỳ. Với motif $M$ và số nguyên $n$:
    \[\mathrm{ord}_{s=n} L(M,s) = \dim_{\mathbb{Q}} H^1_f(G_{\mathbb{Q}}, V^*(1-n)) - \dim_{\mathbb{Q}} H^0(G_{\mathbb{Q}}, V^*(1-n)).\]
    BSD yếu là trường hợp đặc biệt $M = h^1(E)$, $n = 1$.
  5. BSD đẳng biến: Cho $K/\mathbb{Q}$ mở rộng Galois với $G = \mathrm{Gal}(K/\mathbb{Q})$ và $\chi$ biểu diễn bất khả quy của $G$:
    \[\mathrm{ord}_{s=1} L(E, \chi, s) = \text{bội của } \chi \text{ trong } E(K) \otimes_{\mathbb{Z}} \mathbb{C}.\]
    Phiên bản này tinh tế hơn BSD thông thường và liên hệ mật thiết với chương trình Langlands.

Ý nghĩa triết học --- vị trí của BSD trong toán học

BSD --- giao điểm của ba lĩnh vực lớn.

Giả thuyết BSD nằm ở giao điểm của ba lĩnh vực trung tâm trong toán học hiện đại:

  • Hình học đại số: đường cong elliptic, đa tạp Abel, lược đồ Néron,
  • Lý thuyết số giải tích: hàm $L$, hàm zeta, tích Euler, thác triển giải tích,
  • Đại số đồng điều: đối đồng điều Galois, nhóm Selmer, nhóm Tate--Shafarevich.

Chứng minh BSD sẽ đòi hỏi hợp nhất các lĩnh vực này --- giống cách Định lý modularity đã hợp nhất đường cong elliptic với dạng modular. Đó là lý do Viện Clay chọn BSD làm một trong 7 bài toán thiên niên kỷ.

Nhận xét của các chuyên gia:

  • Andrew Wiles (2006): "Giả thuyết BSD là bài toán mở quan trọng nhất. Sức hấp dẫn nằm ở chỗ nó kết nối hai lĩnh vực dường như không liên quan --- số học của các điểm hữu tỉ và hành vi giải tích của hàm L."
  • Bryan Birch (2004): "Chúng tôi chỉ nhìn vào dữ liệu máy tính và nhận ra rằng nó quá đẹp để là ngẫu nhiên." [birch2004]
  • Manjul Bhargava (2014): Bằng phương pháp hình học của số (geometry of numbers), chứng minh $\geq 66{,}48\%$ đường cong thỏa BSD yếu --- con số lớn nhất tính đến nay [bhargava-skinner-zhang2014].
  • Terence Tao (2007): "BSD thuộc loại bài toán 'vĩ mô' --- nó phản ánh một quy luật cấu trúc sâu xa, không thể giải quyết bằng các kỹ thuật 'vi mô' riêng lẻ."
BSD như "công thức thể tích" --- triết lý thống nhất.

Một cách nhìn thống nhất (Bloch, Kato, Fontaine, Perrin-Riou): công thức BSD mạnh có thể hiểu như đẳng thức giữa hai cách đo "thể tích" của cùng một không gian số học:

  • Vế trái ($L^{(r)}(E,1)/r!$): "thể tích giải tích" --- được xác định qua tích Euler, phản ánh phân bố nghiệm mod $p$ cho mọi $p$.
  • Vế phải: "thể tích số học" --- tích của:
    • $\Omega_E$ = thể tích Archimedean ("kích thước thực" tại chỗ vô hạn),
    • $\prod c_p$ = thể tích cục bộ tại các $p$ xấu,
    • $\mathrm{Reg}_E$ = thể tích lưới điểm hữu tỉ ("mức trải rộng" của các sinh),
    • $|\mathrm{Sha}|$ = hệ số hiệu chỉnh cho "nghiệm ma" (phantom solutions),
    • $1/|E_{\mathrm{tors}}|^2$ = hiệu chỉnh cho phần "đã biết sẵn".

Triết lý này hoàn toàn tương tự công thức số lớp Dedekind:

\[\mathrm{Res}_{s=1}\, \zeta_K(s) = \frac{2^{r_1}(2\pi)^{r_2}\, h_K\, R_K}{w_K \sqrt{|d_K|}}\]

trong đó $h_K$ (số lớp) $\leftrightarrow$ $|\mathrm{Sha}|$, $R_K$ (regulator) $\leftrightarrow$ $\mathrm{Reg}_E$, $w_K$ (nghiệm đơn vị) $\leftrightarrow$ $|E_{\mathrm{tors}}|$. Cả hai đều nói: giá trị đặc biệt của hàm $L$ = tích các bất biến số học.

Liên hệ với giả thuyết Birch--Dyer

Vai trò của BSD yếu.
  • Nửa đầu của giả thuyết: BSD yếu là phần định tính --- chỉ nói về sự bằng nhau $r_{\mathrm{an}} = r$, không nói giá trị cụ thể $L^{(r)}(E,1)/r!$. BSD mạnh bổ sung phần định lượng.
  • Đã biết gì? Nhờ Gross--Zagier [gross-zagier1986] và Kolyvagin [kolyvagin1990]: nếu $r_{\mathrm{an}} \leq 1$ thì $r = r_{\mathrm{an}}$ (và $\mathrm{Sha}$ hữu hạn). Với $r_{\mathrm{an}} \geq 2$, ta chỉ biết $r \geq 1$ (Kato [kato2004]: $r_{\mathrm{an}} = 0 \Rightarrow r = 0$). Trường hợp $r_{\mathrm{an}} \geq 2$ vẫn hoàn toàn mở.
  • Bài toán thiên niên kỷ: Viện Clay quy ước: để nhận giải $1 triệu, chỉ cần chứng minh BSD yếu cho mọi $E/\mathbb{Q}$ (không cần BSD mạnh).
  • Chiều ngược: Chiều $r \geq r_{\mathrm{an}}$ (có “đủ” điểm) đặc biệt khó. Khi $L(E,1) = 0$ (hạng giải tích $\geq 1$), làm sao xây dựng một điểm hữu tỉ? Phương pháp Heegner chỉ hoạt động khi $r_{\mathrm{an}} = 1$.
95 Giả thuyết BSD mạnh (Strong BSD Conjecture) Ch.5 7

Định nghĩa

Giả thiết (Giả thuyết Birch và Swinnerton-Dyer mạnh). Cho $E/\mathbb{Q}$ là đường cong elliptic có hạng đại số $r = \mathrm{rk}(E(\mathbb{Q}))$. Giả thuyết BSD mạnh (Strong BSD Conjecture) phát biểu rằng:
  1. Nhóm Tate--Shafarevich $\mathrm{Sha}(E/\mathbb{Q})$ là hữu hạn.
  2. Hệ số hàng đầu trong khai triển Taylor:
    \[ \boxed{\frac{L^{(r)}(E,1)}{r!} = \frac{|\mathrm{Sha}(E/\mathbb{Q})| \cdot \Omega_E \cdot \mathrm{Reg}_E \cdot \prod_{p} c_p}{|E(\mathbb{Q})_{\mathrm{tors}}|^2}} \]
trong đó:
  • $L^{(r)}(E,1)/r!$: hệ số hàng đầu của khai triển Taylor tại $s = 1$,
  • $|\mathrm{Sha}(E/\mathbb{Q})|$: cỡ của nhóm Tate--Shafarevich,
  • $\Omega_E = \int_{E(\mathbb{R})} |\omega|$: chu kỳ thực (tích phân vi phân Néron trên thành phần thực),
  • $\mathrm{Reg}_E = \det\bigl(\langle P_i, P_j \rangle\bigr)$: regulator (định thức ma trận chiều cao Néron--Tate),
  • $c_p = [E(\mathbb{Q}_p) : E^0(\mathbb{Q}_p)]$: số Tamagawa tại $p$ (chỉ $\neq 1$ khi $p \mid N_E$),
  • $|E(\mathbb{Q})_{\mathrm{tors}}|$: cỡ nhóm con xoắn.

Ví dụ

Ví dụ (Kiểm nghiệm BSD mạnh). Đường cong $E$: 11.a1 ($y^2 + y = x^3 - x^2$, hạng $r = 1$):
  • Sinh: $P = (0,0)$, chiều cao Néron--Tate: $\hat{h}(P) \approx 0.0392$.
  • $\mathrm{Reg}_E = \hat{h}(P) \approx 0.0392$ (ma trận $1 \times 1$).
  • $\Omega_E \approx 1.2692$.
  • $c_p$: $c_{11} = 5$ (rút gọn nhân tách tại $11$), $c_p = 1$ với $p \neq 11$.
  • $|E(\mathbb{Q})_{\mathrm{tors}}| = 5$ (nhóm xoắn $\mathbb{Z}/5\mathbb{Z}$).
  • $|\mathrm{Sha}| = 1$ (trivial).
Vế phải:
\[ \frac{1 \cdot 1.2692 \cdot 0.0392 \cdot 5}{5^2} = \frac{0.2488}{25} \approx 0.00995. \]
Vế trái: $L'(E,1)/1! \approx 0.00995$. Hai vế bằng nhau (đã kiểm nghiệm bằng số với độ chính xác cao [cremona1997]).

Ý nghĩa trực giác

BSD mạnh --- “công thức khối lượng” cho đường cong elliptic.
  • Tương tự công thức số lớp: Cho trường số $K$, công thức số lớp Dedekind cho:
    \[ \lim_{s \to 1} (s-1) \zeta_K(s) = \frac{2^{r_1}(2\pi)^{r_2} h_K R_K}{w_K \sqrt{|d_K|}}. \]

    Bảng tương ứng chi tiết:

    Trường số $K$ Đường cong $E/\mathbb{Q}$
    $\zeta_K(s)$ $L(E,s)$
    Cực đơn tại $s=1$ Zero bậc $r$ tại $s=1$
    $h_K$ (số lớp) $|\mathrm{Sha}(E/\mathbb{Q})|$
    $R_K$ (regulator) $\mathrm{Reg}_E$
    $w_K$ (nghiệm đ.v.) $|E(\mathbb{Q})_{\mathrm{tors}}|^2$
    $\sqrt{|d_K|}$ $\sqrt{N_E}$ (conductor)
    $2^{r_1}(2\pi)^{r_2}$ $\Omega_E \cdot \prod c_p$
  • Mỗi thừa số kể một “câu chuyện”: $\Omega_E$ đo “kích thước thực” (thể tích), $\mathrm{Reg}_E$ đo “mức độ trải rộng” của các sinh, $|\mathrm{Sha}|$ đo “phần bị ẩn” (chướng ngại local-global), $c_p$ đo “đóng góp cục bộ” tại các số nguyên tố xấu, $|E_{\mathrm{tors}}|^2$ đo “phần đã biết sẵn”.
  • Tại sao là bình phương? Mẫu số $|E_{\mathrm{tors}}|^2$ (bình phương) xuất hiện vì ghép đôi Weil trên $E_{\mathrm{tors}} \times E_{\mathrm{tors}}$. Ghép đôi Cassels--Tate cũng buộc $|\mathrm{Sha}|$ là bình phương hoàn hảo (nếu hữu hạn).

Liên hệ với giả thuyết Birch--Dyer

BSD mạnh --- phiên bản đầy đủ.
  • Mạnh hơn BSD yếu: BSD yếu chỉ nói $\mathrm{ord}_{s=1} = r$ (bậc triệt tiêu). BSD mạnh nói thêm: hệ số hàng đầu $L^{(r)}(E,1)/r!$ bằng một biểu thức cụ thể chứa mọi bất biến số học quan trọng của $E$.
  • Đã chứng minh được gì?
  • Hạng $0$: Kato [kato2004] chứng minh $L(E,1) \neq 0 \Rightarrow r = 0$ và $|\mathrm{Sha}| < \infty$. Skinner [skinner-urban2014] chứng minh BSD mạnh phần $p$ cho “hầu hết” $p$.
  • Hạng $1$: Gross--Zagier + Kolyvagin chứng minh $r = 1$ và $|\mathrm{Sha}| < \infty$. Công thức Gross--Zagier cho giá trị $L'(E,1)$ qua chiều cao điểm Heegner.
  • Hạng $\geq 2$: Chưa biết gì về BSD mạnh.

Kiểm nghiệm bằng máy tính: Cremona [cremona1997] và LMFDB đã kiểm nghiệm BSD mạnh cho hàng triệu đường cong có conductor $\leq 500{,}000$ --- tất cả đều khớp.

Thách thức: Tính $|\mathrm{Sha}|$ chính xác rất khó (phải tính nhóm Selmer hoặc dùng phương pháp descent). Với hạng cao ($r \geq 3$), $\mathrm{Reg}_E$ có thể rất nhỏ, gây khó khăn số học.

96 Tích hữu hạn $\Pi_E(X)$ (Finite product (BSD origin)) Ch.5 4

Định nghĩa

Định nghĩa (Tích hữu hạn $\Pi_E(X)$). Cho $E/\mathbb{Q}$ là đường cong elliptic. Tích hữu hạn (finite product) $\Pi_E(X)$ được Birch và Swinnerton-Dyer định nghĩa năm 1963 [birch-sd1963]:
\[ \Pi_E(X) = \prod_{\substack{p \leq X \\ p \text{ nguyên tố} \\ E \text{ rút gọn tốt tại } p}} \frac{\#E(\mathbb{F}_p)}{p} = \prod_{\substack{p \leq X \\ p \nmid N_E}} \frac{p + 1 - a_p}{p}. \]
Ý tưởng: mỗi thừa số $\#E(\mathbb{F}_p)/p$ so sánh số điểm thực tế trên $E(\mathbb{F}_p)$ với “giá trị trung bình” $p$ (nếu $E$ chỉ là đường cong bậc 3 ngẫu nhiên). Tích này thu thập thông tin cục bộ tại mọi $p \leq X$ thành một đại lượng toàn cục.

Ví dụ

Ví dụ (Dữ liệu gốc của Birch và Swinnerton-Dyer trên EDSAC). Năm 1958--1963, Bryan Birch và Peter Swinnerton-Dyer sử dụng máy tính EDSAC tại Cambridge để tính $\Pi_E(X)$ cho nhiều đường cong. Họ quan sát:
  1. Hạng 0 ($E: y^2 = x^3 + 1$): $\Pi_E(X)$ tiến tới một hằng số $C > 0$ khi $X \to \infty$.
  2. Hạng 1 ($E: y^2 = x^3 - x$): $\Pi_E(X) \sim C \cdot \log X$ khi $X \to \infty$ (tăng logarithmic).
  3. Hạng 2: $\Pi_E(X) \sim C \cdot (\log X)^2$ (tăng nhanh hơn).

Quy luật tổng quát: $\Pi_E(X) \sim C \cdot (\log X)^r$ với $r = \mathrm{rk}(E(\mathbb{Q}))$.

Chính quan sát thực nghiệm này dẫn đến giả thuyết: $r$ là bậc triệt tiêu của hàm $L(E,s)$ tại $s = 1$ (vì $\Pi_E(X)$ và hàm $L$ liên hệ qua tích Euler) [birch-sd1965].

Ý nghĩa trực giác

Tích hữu hạn --- “lăng kính” nhìn hạng.
  • Hình dung: Mỗi thừa số $\#E(\mathbb{F}_p)/p$ cho biết: tại $p$, đường cong $E$ có “nhiều” hay “ít” điểm so với kỳ vọng. Nếu $a_p > 0$ (ít điểm hơn $p+1$), thừa số $< 1$; nếu $a_p < 0$ (nhiều điểm hơn $p+1$), thừa số $> 1$.
  • Tích --- “bỏ phiếu” toàn cục: Nhân tất cả thừa số lại, ta được “bỏ phiếu đa số”. Nếu tích tiến tới $0$ nhanh, nghĩa là đường cong có “nhiều điểm hữu tỉ hơn” (hạng cao hơn). Tốc độ tích tiến về $0$ hoặc phát tán chính là $(\log X)^r$.
  • Liên hệ với tích Euler: Viết hình thức: $L(E,1) = \prod_p L_p(E,1)^{-1}$. Tại các $p$ rút gọn tốt:
    \[ L_p(E,1)^{-1} = 1 - a_p p^{-1} + p^{-1} = \frac{p - a_p + 1}{p} = \frac{\#E(\mathbb{F}_p)}{p}. \]
    Vậy $\Pi_E(X) \approx L(E,1)^{-1}$ (“tích Euler cắt cụt ngược”). Tích phân kỳ $\Leftrightarrow$ $L(E,1) = 0$.
  • Quy luật $(\log X)^r$: Lấy logarithm: $\log \Pi_E(X) = \sum_{p \leq X} \log(\#E(\mathbb{F}_p)/p)$. Khai triển: $\log(1 - a_p/p + 1/p) \approx -a_p/p$. Nếu $L(E,s)$ có zero bậc $r$ tại $s=1$, tổng này tăng như $r \log\log X$, dẫn đến $\Pi_E(X) \sim C(\log X)^r$.

Liên hệ với giả thuyết Birch--Dyer

Tích hữu hạn --- nguồn gốc lịch sử của BSD.
  • Nguồn gốc thực nghiệm: Giả thuyết BSD không bắt đầu từ lý thuyết trừu tượng mà từ dữ liệu máy tính. Birch và Swinnerton-Dyer nhìn vào đồ thị $\Pi_E(X)$ vs. $\log X$ trên giấy bán logarithm, thấy đường thẳng có hệ số góc $r$, và đoán ra mối liên hệ. Đây là một trong những ví dụ đẹp nhất về toán học thực nghiệm [birch2004].
  • Từ $\Pi_E(X)$ đến $L(E,s)$: Quan sát $\Pi_E(X) \sim C(\log X)^r$ dẫn Birch--Swinnerton-Dyer đến phát biểu chính xác hơn: $\mathrm{ord}_{s=1} L(E,s) = r$, vì $\Pi_E(X)$ chính là tích Euler cắt cụt tại $s=1$.
  • Hằng số $C$: Hằng số $C$ trong $\Pi_E(X) \sim C(\log X)^r$ liên quan đến hệ số hàng đầu $L^{(r)}(E,1)/r!$. BSD mạnh cho biết chính xác $C$ qua $\Omega_E$, $\mathrm{Reg}_E$, $|\mathrm{Sha}|$, $c_p$, $|E_{\mathrm{tors}}|$.
  • EDSAC: Máy tính EDSAC (Electronic Delay Storage Automatic Calculator) tại Cambridge, hoạt động 1949--1958 (và EDSAC 2 đến 1965), là nơi Birch và Swinnerton-Dyer chạy các tính toán lịch sử. Với tốc độ chỉ vài nghìn phép tính/giây, họ cần nhiều tháng để tích lũy đủ dữ liệu.
97 Số Tamagawa (Tamagawa number $c_p$) Ch.5 6

Định nghĩa

Định nghĩa (Số Tamagawa). Cho $E/\mathbb{Q}$ là đường cong elliptic và $p$ là số nguyên tố mà $E$ có rút gọn xấu (tức $p \mid N_E$). Xét nhóm các điểm $p$-adic $E(\mathbb{Q}_p)$ và thành phần đơn vị $E^0(\mathbb{Q}_p)$ --- nhóm con gồm các điểm rút gọn về phần trơn (non-singular part) của mô hình Néron tại $p$. Số Tamagawa (Tamagawa number) tại $p$ là chỉ số:
\[ c_p = \bigl[E(\mathbb{Q}_p) : E^0(\mathbb{Q}_p)\bigr] = \frac{|E(\mathbb{Q}_p)|}{|E^0(\mathbb{Q}_p)|}. \]
Đây là số thành phần liên thông (connected components) của sợi đặc biệt (special fiber) trong mô hình Néron của $E$ tại $p$ mà có điểm hữu tỉ.

Quy ước: $c_p = 1$ khi $E$ có rút gọn tốt tại $p$ (vì khi đó $E^0(\mathbb{Q}_p) = E(\mathbb{Q}_p)$). Vậy tích $\prod_p c_p$ (trong công thức BSD) là tích hữu hạn, chỉ chứa các thừa số $\neq 1$ tại $p \mid N_E$.

Ví dụ

Ví dụ (Tính số Tamagawa).
  1. Đường cong 11.a1: $E: y^2 + y = x^3 - x^2$, conductor $N_E = 11$.
    • Tại $p = 11$: rút gọn nhân tách (split multiplicative). Thuật toán Tate cho $c_{11} = 5$.
    • Tại mọi $p \neq 11$: rút gọn tốt, $c_p = 1$.
    • Tích: $\prod_p c_p = 5$.
  2. Đường cong 37.a1: $E: y^2 + y = x^3 - x$, conductor $N_E = 37$.
    • Tại $p = 37$: rút gọn nhân tách, $c_{37} = 1$.
    • Tích: $\prod_p c_p = 1$.
  3. Bảng giá trị $c_p$ theo loại rút gọn:
    Loại rút gọn Giá trị $c_p$
    Rút gọn tốt$c_p = 1$
    Nhân tách$c_p = \mathrm{ord}_p(\Delta)$
    Nhân không tách$c_p = 1$ hoặc $2$
    Cộng$c_p \in \{1, 2, 3, 4, 6\}$

Ý nghĩa trực giác

Số Tamagawa --- “đóng góp cục bộ” tại số nguyên tố xấu.
  • Hình dung: Tại mỗi số nguyên tố $p$ mà $E$ rút gọn xấu, nhóm $E(\mathbb{Q}_p)$ “vỡ” thành nhiều mảnh (thành phần liên thông). Số mảnh có điểm hữu tỉ chính là $c_p$. Nếu $c_p = 1$, mọi điểm $p$-adic đều “cùng mảnh”; nếu $c_p > 1$, các điểm phân tán trên nhiều mảnh.
  • Tương tự: Hãy tưởng tượng một vòng tròn (nhóm $E(\mathbb{Q}_p)$) bị cắt thành $c_p$ cung. Mỗi cung là một “thành phần”. Điểm trên các cung khác nhau không thể “đi sang” nhau bằng phép biến đổi liên tục trong thành phần đơn vị.
  • Nhân tách: Khi rút gọn nhân tách, đường cong trở thành nút (node) --- nhóm phần trơn đẳng cấu với $\mathbb{G}_m$. Nhóm thành phần là $\mathbb{Z}/c_p\mathbb{Z}$ với $c_p = \mathrm{ord}_p(\Delta)$. Hình ảnh: vòng tròn bị “cuộn” $c_p$ vòng.

Liên hệ với giả thuyết Birch--Dyer

Số Tamagawa trong BSD.
  • Thành phần trong BSD mạnh: Tích $\prod_p c_p$ xuất hiện ở tử số của công thức BSD mạnh:
    \[ \frac{L^{(r)}(E,1)}{r!} = \frac{|\mathrm{Sha}| \cdot \Omega_E \cdot \mathrm{Reg}_E \cdot \prod_p c_p}{|E(\mathbb{Q})_{\mathrm{tors}}|^2}. \]
    Số Tamagawa đo “đóng góp cục bộ” của các số nguyên tố xấu.
  • Tương tự: Trong công thức số lớp cho trường số $K$, thành phần tương ứng là $|d_K|^{1/2}$ (discriminant) --- cũng đo “mức độ phân nhánh” tại các số nguyên tố xấu.
  • Tính toán: Số Tamagawa $c_p$ được tính bằng thuật toán Tate [tate1975], đã cài đặt trong Sage, Magma, PARI/GP. Với conductor $N_E$ nhỏ, tích $\prod c_p$ thường nhỏ (thường $\leq 100$).
  • Ý nghĩa số học: Khi $c_p$ lớn (ví dụ rút gọn nhân tách với $\mathrm{ord}_p(\Delta)$ lớn), đường cong có “rút gọn rất xấu” tại $p$, và điều này ảnh hưởng đến giá trị $L^{(r)}(E,1)/r!$.
98 Thành phần đơn vị (Identity component $E^0$) Ch.5 6

Định nghĩa

Định nghĩa (Thành phần đơn vị). Cho $E/\mathbb{Q}$ là đường cong elliptic và $p$ là số nguyên tố. Xét mô hình Néron $\mathcal{E}/\mathbb{Z}_p$ của $E$ --- lược đồ nhóm trơn “tốt nhất” trên $\mathbb{Z}_p$ mở rộng $E$.

Sợi đặc biệt (special fiber) $\mathcal{E}_p = \mathcal{E} \times_{\mathbb{Z}_p} \mathbb{F}_p$ là lược đồ nhóm trên $\mathbb{F}_p$, có thể không liên thông. Thành phần đơn vị (identity component) $\mathcal{E}_p^0$ là thành phần liên thông chứa phần tử đơn vị $O$.

Nhóm $E^0(\mathbb{Q}_p)$ gồm các điểm $P \in E(\mathbb{Q}_p)$ mà rút gọn $\tilde{P} \in \mathcal{E}_p^0(\mathbb{F}_p)$ --- tức những điểm rút gọn nằm trên thành phần đơn vị. Cụ thể:

  • Nếu $E$ có rút gọn tốt tại $p$: $\mathcal{E}_p$ liên thông, nên $E^0(\mathbb{Q}_p) = E(\mathbb{Q}_p)$.
  • Nếu $E$ có rút gọn nhân: $\mathcal{E}_p^0 \cong \mathbb{G}_m$ (nhóm nhân).
  • Nếu $E$ có rút gọn cộng: $\mathcal{E}_p^0 \cong \mathbb{G}_a$ (nhóm cộng).

Ví dụ

Ví dụ (Thành phần đơn vị cho các loại rút gọn).
  1. Rút gọn tốt ($p \nmid N_E$): $\mathcal{E}_p$ là đường cong elliptic trên $\mathbb{F}_p$ (liên thông). Mọi điểm $p$-adic rút gọn về điểm trơn. $E^0(\mathbb{Q}_p) = E(\mathbb{Q}_p)$, $c_p = 1$.
  2. Rút gọn nhân tách (ví dụ 11.a1 tại $p = 11$): Đường cong rút gọn modulo $11$ có nút (node) với hai tiếp tuyến hữu tỉ trên $\mathbb{F}_{11}$. Phần trơn $\mathcal{E}_{11}^0(\mathbb{F}_{11}) \cong \mathbb{F}_{11}^{\times}$. Nhóm thành phần $\mathcal{E}_{11}/\mathcal{E}_{11}^0 \cong \mathbb{Z}/5\mathbb{Z}$, nên $c_{11} = 5$.
  3. Rút gọn cộng (ví dụ $E: y^2 = x^3 + p^2$ tại $p$): Đường cong có cusp. Phần trơn $\mathcal{E}_p^0(\mathbb{F}_p) \cong \mathbb{F}_p$ (nhóm cộng). Nhóm thành phần phụ thuộc vào cấu trúc chính xác, thường có $c_p \in \{1, 2, 3, 4\}$.

Ý nghĩa trực giác

Thành phần đơn vị --- “phần chính” của nhóm tại $p$.
  • Hình dung: Khi đường cong $E$ bị rút gọn modulo $p$, nó có thể “vỡ” --- tạo ra điểm kỳ dị (nút hoặc cusp). Bỏ điểm kỳ dị đi, phần còn lại có thể không liên thông. Thành phần chứa gốc $O$ là $\mathcal{E}_p^0$ --- “phần chính”.
  • Dãy chính xác: Ta có dãy chính xác:
    \[ 0 \to E^0(\mathbb{Q}_p) \to E(\mathbb{Q}_p) \to \Phi_p(\mathbb{F}_p) \to 0 \]
    trong đó $\Phi_p = \mathcal{E}_p / \mathcal{E}_p^0$ là nhóm thành phần (component group), nhóm hữu hạn có cấp $c_p$.
  • Lọc ba tầng: Thực ra $E(\mathbb{Q}_p)$ có lọc tinh hơn:
    \[ E_1(\mathbb{Q}_p) \subset E^0(\mathbb{Q}_p) \subset E(\mathbb{Q}_p) \]
    với $E_1(\mathbb{Q}_p) = \ker(E(\mathbb{Q}_p) \to \mathcal{E}_p(\mathbb{F}_p))$ là nhóm lọc (formal group). Tỷ số $E^0/E_1 \cong \mathcal{E}_p^0(\mathbb{F}_p)$ (phần trơn), và $E/E^0 \cong \Phi_p(\mathbb{F}_p)$ (thành phần).

Liên hệ với giả thuyết Birch--Dyer

Thành phần đơn vị trong BSD.
  • Định nghĩa $c_p$: Số Tamagawa $c_p = [E(\mathbb{Q}_p) : E^0(\mathbb{Q}_p)]$ --- đây chính là cỡ nhóm thành phần. Không có $E^0(\mathbb{Q}_p)$ thì không định nghĩa được $c_p$.
  • Mô hình Néron: Khái niệm $E^0(\mathbb{Q}_p)$ đòi hỏi mô hình Néron --- lược đồ nhóm trơn tối thiểu trên $\mathbb{Z}_p$ [neron1965]. Đây là đối tượng khá trừu tượng nhưng hoàn toàn tính toán được nhờ thuật toán Tate.
  • Vi phân Néron: Vi phân $\omega$ trên $E/\mathbb{Q}$ gọi là vi phân Néron nếu nó mở rộng thành vi phân “tốt” trên mô hình Néron tại mọi $p$. Chu kỳ thực $\Omega_E = \int_{E(\mathbb{R})} |\omega|$ trong BSD mạnh dùng vi phân Néron --- liên hệ chặt chẽ với $E^0$.
99 Phỏng đoán tính chẵn lẻ (Parity conjecture) Ch.5 7

Định nghĩa

Phỏng đoán (Phỏng đoán tính chẵn lẻ). Cho $E/\mathbb{Q}$ là đường cong elliptic với dấu gốc $w(E) = \pm 1$ (trong phương trình hàm $\Lambda(E, 2-s) = w(E) \cdot \Lambda(E, s)$). Phỏng đoán tính chẵn lẻ (parity conjecture) phát biểu:
\[ \boxed{(-1)^{\mathrm{rk}(E(\mathbb{Q}))} = w(E)} \]
Tương đương:
  • Nếu $w(E) = +1$ thì $\mathrm{rk}(E(\mathbb{Q}))$ chẵn ($0, 2, 4, \ldots$).
  • Nếu $w(E) = -1$ thì $\mathrm{rk}(E(\mathbb{Q}))$ lẻ ($1, 3, 5, \ldots$).
Đây là hệ quả của BSD yếu (vì $w(E) = (-1)^{r_{\mathrm{an}}}$ từ phương trình hàm, và BSD yếu cho $r_{\mathrm{an}} = r$). Nhưng phỏng đoán tính chẵn lẻ yếu hơn BSD yếu --- chỉ nói về tính chẵn/lẻ, không nói giá trị chính xác.

Ví dụ

Ví dụ (Kiểm tra phỏng đoán tính chẵn lẻ).
  1. Đường cong 37.a1: $E: y^2 + y = x^3 - x$. Conductor $N_E = 37$ (nguyên tố).
    • Dấu gốc: $w(E) = -1$ (vì $N_E = 37$ nguyên tố, rút gọn nhân tách).
    • Hạng: $\mathrm{rk}(E(\mathbb{Q})) = 1$ (lẻ).
    • Kiểm tra: $(-1)^1 = -1 = w(E)$. \checkmark
  2. Đường cong 389.a1: $E: y^2 + y = x^3 + x^2 - 2x$. Conductor $389$.
    • Dấu gốc: $w(E) = +1$.
    • Hạng: $\mathrm{rk}(E(\mathbb{Q})) = 2$ (chẵn).
    • Kiểm tra: $(-1)^2 = +1 = w(E)$. \checkmark
  3. Họ twist: Cho $E: y^2 = x^3 - x$ và $E_d: y^2 = x^3 - d^2 x$ (twist bậc hai bởi $d$). Khi $d > 0$ với $d \equiv 5, 6, 7 \pmod{8}$, ta có $w(E_d) = -1$, nên phỏng đoán tính chẵn lẻ dự đoán $\mathrm{rk}(E_d(\mathbb{Q}))$ lẻ $\geq 1$ --- tức $E_d$ có điểm hữu tỉ bậc vô hạn.

Ý nghĩa trực giác

Phỏng đoán tính chẵn lẻ --- “đối xứng” buộc hạng.
  • Hình dung: Phương trình hàm $\Lambda(E, 2-s) = w(E) \cdot \Lambda(E, s)$ tạo ra đối xứng (hoặc phản đối xứng) quanh $s = 1$. Nếu $w(E) = -1$, hàm $L$ đổi dấu khi $s \mapsto 2-s$, nên $L(E, 1) = -L(E, 1) = 0$ --- hàm $L$ buộc phải triệt tiêu tại $s = 1$. Bậc triệt tiêu ít nhất là $1$ (lẻ).
  • “Miễn phí”: Khi $w(E) = -1$, ta biết $L(E,1) = 0$ mà không cần tính $L(E,1)$ --- chỉ từ đối xứng! BSD yếu khi đó suy ra $\mathrm{rk} \geq 1$ --- đường cong phải có vô hạn điểm hữu tỉ. Đây là thông tin “miễn phí” từ phương trình hàm.
  • Tại sao quan trọng? Phỏng đoán tính chẵn lẻ dễ tiếp cận hơn BSD yếu. Thực tế, phỏng đoán $p$-chẵn lẻ (cho $p$-Selmer) đã được chứng minh cho mọi $E/\mathbb{Q}$ bởi Tim và Vladimir Dokchitser (2010) và Nekovář.

Liên hệ với giả thuyết Birch--Dyer

Phỏng đoán tính chẵn lẻ và BSD.
  • Hệ quả yếu nhất: Phỏng đoán tính chẵn lẻ là hệ quả yếu nhất có ý nghĩa của BSD yếu. Nó không cho giá trị hạng, chỉ cho tính chẵn lẻ. Nhưng ngay cả điều này cũng rất sâu --- vì $w(E)$ tính được (là tích cục bộ), còn hạng rất khó tính.
  • Dấu gốc cục bộ: $w(E) = \prod_v w_v(E)$ (tích trên mọi chỗ $v$ kể cả $v = \infty$). Mỗi $w_v$ tính được bằng công thức tường minh. Phỏng đoán nói rằng tích cục bộ này xác định tính chẵn lẻ của một bất biến toàn cục (hạng).
  • Tiến bộ: Phỏng đoán $p$-chẵn lẻ (parity cho $p$-Selmer) đã được chứng minh cho mọi $E/\mathbb{Q}$ (Nekovář, Dokchitser--Dokchitser). Đây là bằng chứng mạnh nhất ủng hộ BSD khi $r_{\mathrm{an}} \geq 2$.
  • 50% hạng chẵn, 50% lẻ: Giả sử dấu gốc phân bố đều ($w = +1$ và $w = -1$ mỗi bên 50%), phỏng đoán tính chẵn lẻ + phỏng đoán Goldfeld gợi ý: 50% đường cong hạng $0$, 50% hạng $1$.
100 Công thức số lớp (Class number formula) Ch.5 6

Định nghĩa

Định lý (Công thức số lớp Dedekind). Cho $K$ là trường số (mở rộng hữu hạn của $\mathbb{Q}$) với vành số nguyên $\mathcal{O}_K$. Ký hiệu:
  • $\zeta_K(s) = \sum_{\mathfrak{a} \neq 0} N(\mathfrak{a})^{-s}$: hàm zeta Dedekind,
  • $h_K = |\mathrm{Cl}(\mathcal{O}_K)|$: số lớp (class number),
  • $R_K$: regulator (định thức ma trận logarithm đơn vị cơ bản),
  • $w_K = |\mu(K)|$: số nghiệm đơn vị (roots of unity),
  • $d_K$: discriminant,
  • $r_1$, $r_2$: số embedding thực và phức.
Công thức số lớp (class number formula) phát biểu:
\[ \boxed{\lim_{s \to 1} (s-1) \zeta_K(s) = \frac{2^{r_1}(2\pi)^{r_2} \cdot h_K \cdot R_K}{w_K \cdot \sqrt{|d_K|}}} \]
Vế trái là thặng dư (residue) tại cực $s = 1$. Vế phải chứa mọi bất biến số học quan trọng của $K$.

Ví dụ

Ví dụ (Công thức số lớp cho các trường đơn giản).
  1. $K = \mathbb{Q}$: $\zeta_{\mathbb{Q}}(s) = \zeta(s)$ (hàm zeta Riemann). Cực tại $s = 1$ có thặng dư $1$. Vế phải: $h = 1$, $R = 1$, $w = 2$, $d = 1$, $r_1 = 1$, $r_2 = 0$. Ta có $2^1 \cdot 1 \cdot 1 / (2 \cdot 1) = 1$. Đúng!
  2. $K = \mathbb{Q}(i)$: $d_K = -4$, $r_1 = 0$, $r_2 = 1$, $w_K = 4$ ($\mu = \{\pm 1, \pm i\}$), $h_K = 1$, $R_K = 1$.
    \[ \lim_{s \to 1}(s-1)\zeta_{\mathbb{Q}(i)}(s) = \frac{(2\pi) \cdot 1 \cdot 1}{4 \cdot 2} = \frac{\pi}{4} \approx 0.7854. \]
    Thực tế: $\zeta_{\mathbb{Q}(i)}(s) = \zeta(s) L(s, \chi_{-4})$ và $L(1, \chi_{-4}) = \pi/4$. Đúng!
  3. $K = \mathbb{Q}(\sqrt{-5})$: $d_K = -20$, $h_K = 2$ (nhóm lớp không tầm thường!), $w_K = 2$, $R_K = 1$.
    \[ \lim_{s \to 1}(s-1)\zeta_K(s) = \frac{2\pi \cdot 2 \cdot 1}{2 \cdot \sqrt{20}} = \frac{2\pi}{\sqrt{20}} \approx 1.405. \]

Ý nghĩa trực giác

Công thức số lớp --- “tiền thân” của BSD.
  • Hàm giải tích $\leftrightarrow$ bất biến số học: Công thức số lớp là nguyên mẫu (prototype) cho BSD: hành vi của hàm $\zeta_K(s)$ tại $s = 1$ (giải tích) mã hóa các bất biến số học ($h_K$, $R_K$, $w_K$, $d_K$).
  • Bảng tương ứng chi tiết:

    Trường số $K$ Đường cong $E/\mathbb{Q}$
    $\zeta_K(s)$ $L(E,s)$
    Cực đơn tại $s=1$ Zero bậc $r$ tại $s=1$
    $h_K$ (số lớp) $|\mathrm{Sha}(E/\mathbb{Q})|$
    $R_K$ (regulator) $\mathrm{Reg}_E$
    $w_K$ (nghiệm đ.v.) $|E(\mathbb{Q})_{\mathrm{tors}}|^2$
    $\sqrt{|d_K|}$ $\sqrt{N_E}$ (conductor)
    $2^{r_1}(2\pi)^{r_2}$ $\Omega_E \cdot \prod c_p$
  • Đã chứng minh: Công thức số lớp là định lý (Dirichlet, Dedekind, Hecke). BSD mạnh là phỏng đoán. Khoảng cách giữa hai kết quả --- về mặt kỹ thuật --- rất lớn, nhưng cấu trúc hoàn toàn song song.

Liên hệ với giả thuyết Birch--Dyer

Công thức số lớp và BSD.
  • Nguồn cảm hứng: Birch và Swinnerton-Dyer biết rõ công thức số lớp khi phát biểu giả thuyết. Công thức BSD mạnh được thiết kế để “giống” công thức số lớp nhất có thể, với mỗi bất biến tìm được đối tác tương ứng [birch-sd1965].
  • Phỏng đoán Bloch--Kato: Cả hai công thức --- số lớp và BSD --- đều là trường hợp đặc biệt của phỏng đoán Bloch--Kato cho hàm $L$ của motif. Phỏng đoán này nói rằng mọi hàm $L$ đều có công thức dạng tương tự [bloch-kato1990].
  • $h_K$ vs. $|\mathrm{Sha}|$: Số lớp $h_K$ đo “mức độ thất bại” của phân tích thừa số duy nhất trong $\mathcal{O}_K$. Tương tự, $|\mathrm{Sha}|$ đo “mức độ thất bại” của nguyên lý Hasse cho đường cong elliptic. Cả hai đều là nhóm hữu hạn (đã chứng minh cho $h_K$; phỏng đoán cho $|\mathrm{Sha}|$).
101 Nhóm lớp (Class group) Ch.5 5

Định nghĩa

Định nghĩa (Nhóm lớp). Cho $K$ là trường số với vành số nguyên $\mathcal{O}_K$. Nhóm lớp (class group) $\mathrm{Cl}(\mathcal{O}_K)$ (hay $\mathrm{Cl}(K)$) được định nghĩa:
\[ \mathrm{Cl}(K) = \frac{\{\text{ideal phân số khác } 0 \text{ của } \mathcal{O}_K\}}{\{\text{ideal chính}\}} = \frac{I_K}{P_K} \]
trong đó $I_K$ là nhóm các ideal phân số (fractional ideals) và $P_K = \{(a) : a \in K^{\times}\}$ là nhóm con các ideal chính.

Số lớp $h_K = |\mathrm{Cl}(K)|$ luôn hữu hạn (định lý Minkowski). $h_K = 1$ khi và chỉ khi $\mathcal{O}_K$ là miền phân tích thừa số duy nhất (UFD).

Ví dụ

Ví dụ (Nhóm lớp cho các trường phức bậc hai).
  1. $K = \mathbb{Q}(\sqrt{-1})$: $\mathcal{O}_K = \mathbb{Z}[i]$ (số nguyên Gauss). $h_K = 1$ --- phân tích thừa số duy nhất. Ví dụ: $5 = (2+i)(2-i)$, phân tích duy nhất.
  2. $K = \mathbb{Q}(\sqrt{-5})$: $\mathcal{O}_K = \mathbb{Z}[\sqrt{-5}]$. $h_K = 2$. Ví dụ nổi tiếng: $6 = 2 \cdot 3 = (1+\sqrt{-5})(1-\sqrt{-5})$, hai phân tích khác nhau! Ideal $(2)$, $(3)$ không phải ideal nguyên tố, nhưng:
    \[ (2) = \mathfrak{p}_1^2, \quad (3) = \mathfrak{p}_2 \mathfrak{p}_3 \]
    với $\mathfrak{p}_1 = (2, 1+\sqrt{-5})$. Ideal $\mathfrak{p}_1$ không phải ideal chính --- đại diện cho lớp khác $1$ trong $\mathrm{Cl}(K) \cong \mathbb{Z}/2\mathbb{Z}$.
  3. Bảng trường phức bậc hai $\mathbb{Q}(\sqrt{-d})$:

    $d$ 1 2 3 5 6 7 23 163
    $h_K$ 1 1 1 2 2 1 3 1

Ý nghĩa trực giác

Nhóm lớp --- “thước đo” phân tích thừa số.
  • Hình dung: Trong $\mathbb{Z}$, mọi số nguyên có phân tích thừa số duy nhất. Trong $\mathcal{O}_K$ tổng quát, điều này có thể thất bại. Nhóm lớp đo “mức độ thất bại” --- nhóm càng lớn, phân tích càng “rối”.
  • Ideal “sửa chữa”: Kummer phát hiện: dù phân tích phần tử không duy nhất, phân tích ideal luôn duy nhất (trong miền Dedekind). Nhóm lớp đo khoảng cách giữa “ideal” và “phần tử” --- tức giữa phân tích ideal duy nhất và phân tích phần tử duy nhất.
  • “Ẩn” vs. “hiện”: Nhóm lớp giống $\mathrm{Sha}$ ở chỗ: cả hai đo thông tin “ẩn” mà ta không thấy khi chỉ nhìn cục bộ. Các ideal đều “trông như” ideal chính khi nhìn cục bộ (tại mỗi $p$), nhưng toàn cục thì không.

Liên hệ với giả thuyết Birch--Dyer

Nhóm lớp và BSD.
  • Tương tự $\mathrm{Sha}$: Nhóm lớp $\mathrm{Cl}(K)$ là “tổ tiên” của nhóm Tate--Shafarevich $\mathrm{Sha}(E/\mathbb{Q})$. Cả hai:
  • Đo “chướng ngại local-global” (nguyên lý Hasse thất bại).
  • Xuất hiện trong “công thức khối lượng” (công thức số lớp / BSD mạnh).
  • Được phỏng đoán/chứng minh hữu hạn.
Thực tế, $\mathrm{Cl}(K) = H^1(\mathrm{Spec}\, \mathcal{O}_K, \mathbb{G}_m)$ và $\mathrm{Sha}(E/\mathbb{Q}) \hookrightarrow H^1(\mathbb{Q}, E)$ --- cùng bản chất đối đồng điều.

9 discriminant Heegner: 9 trường $\mathbb{Q}(\sqrt{-d})$ có $h = 1$ ($d = 1, 2, 3, 7, 11, 19, 43, 67, 163$) liên quan trực tiếp đến xây dựng điểm Heegner. Điều kiện $h = 1$ đảm bảo điểm Heegner nằm trong $E(\mathbb{Q})$ (không cần trace).

Lý thuyết trường lớp: Lý thuyết trường lớp cho $K$ Abel hóa $\mathrm{Gal}(\bar{K}/K)$ qua $\mathrm{Cl}(K)$. Phiên bản phi giao hoán (chương trình Langlands) kết nối biểu diễn Galois với dạng tự đẳng cấu --- framework tổng quát chứa cả BSD.

102 Nhóm đơn vị (Unit group) Ch.5 4

Định nghĩa

Định nghĩa (Nhóm đơn vị). Cho $K$ là trường số với vành số nguyên $\mathcal{O}_K$. Nhóm đơn vị (unit group) $\mathcal{O}_K^{\times}$ gồm các phần tử khả nghịch:
\[ \mathcal{O}_K^{\times} = \{u \in \mathcal{O}_K : \exists v \in \mathcal{O}_K,\; uv = 1\}. \]
Tương đương: $u \in \mathcal{O}_K^{\times}$ khi và chỉ khi $N_{K/\mathbb{Q}}(u) = \pm 1$.

Định lý đơn vị Dirichlet: Nhóm đơn vị có cấu trúc:

\[ \mathcal{O}_K^{\times} \cong \mu(K) \times \mathbb{Z}^{r_1 + r_2 - 1} \]
trong đó $\mu(K)$ là nhóm nghiệm đơn vị (roots of unity, hữu hạn) và $r_1 + r_2 - 1$ là hạng đơn vị ($r_1$ = số embedding thực, $r_2$ = số cặp embedding phức).

Ví dụ

Ví dụ (Nhóm đơn vị cho các trường số).
  1. $K = \mathbb{Q}$: $\mathcal{O}_{\mathbb{Q}}^{\times} = \mathbb{Z}^{\times} = \{\pm 1\} \cong \mathbb{Z}/2\mathbb{Z}$. Hạng đơn vị $= r_1 + r_2 - 1 = 1 + 0 - 1 = 0$.
  2. $K = \mathbb{Q}(\sqrt{-d})$ (trường phức bậc hai, $d > 0$): $r_1 = 0$, $r_2 = 1$. Hạng đơn vị $= 0 + 1 - 1 = 0$. Nhóm đơn vị hữu hạn:
    • $d = 1$: $\mathcal{O}_K^{\times} = \{\pm 1, \pm i\} \cong \mathbb{Z}/4\mathbb{Z}$.
    • $d = 3$: $\mathcal{O}_K^{\times} = \langle \zeta_6 \rangle \cong \mathbb{Z}/6\mathbb{Z}$ ($\zeta_6 = e^{2\pi i/6}$).
    • $d \geq 4$: $\mathcal{O}_K^{\times} = \{\pm 1\} \cong \mathbb{Z}/2\mathbb{Z}$.
  3. $K = \mathbb{Q}(\sqrt{2})$ (trường thực bậc hai): $r_1 = 2$, $r_2 = 0$. Hạng đơn vị $= 2 + 0 - 1 = 1$. Nhóm đơn vị $\mathcal{O}_K^{\times} = \{\pm 1\} \times \langle 1 + \sqrt{2} \rangle \cong \mathbb{Z}/2\mathbb{Z} \times \mathbb{Z}$. Đơn vị cơ bản $\varepsilon = 1 + \sqrt{2}$ (vì $(1+\sqrt{2})(1-\sqrt{2}) = -1$).

Ý nghĩa trực giác

Nhóm đơn vị --- “đối tác” của nhóm Mordell--Weil.
  • Hình dung: Đơn vị trong $\mathcal{O}_K$ là các phần tử “không mất thông tin” khi nhân --- chúng có nghịch đảo. Trong $\mathbb{Z}$, chỉ có $\pm 1$. Trong vành số nguyên lớn hơn, có thêm đơn vị “phức tạp” (như $1 + \sqrt{2}$).
  • Cấu trúc giống Mordell--Weil: So sánh:
    Trường số $K$ Đường cong $E/\mathbb{Q}$
    $\mathcal{O}_K^{\times} \cong \mu(K) \times \mathbb{Z}^{r_1+r_2-1}$ $E(\mathbb{Q}) \cong E(\mathbb{Q})_{\mathrm{tors}} \times \mathbb{Z}^r$
    Phần hữu hạn: $\mu(K)$ Phần hữu hạn: $E(\mathbb{Q})_{\mathrm{tors}}$
    Phần tự do: $\mathbb{Z}^{r_1+r_2-1}$ Phần tự do: $\mathbb{Z}^r$
    Hạng: $r_1 + r_2 - 1$ Hạng: $r = \mathrm{rk}(E(\mathbb{Q}))$

    Cả hai đều là nhóm Abel hữu hạn sinh = nhóm hữu hạn $\oplus$ phần tự do.
  • Regulator: Regulator $R_K = \det(\log |\sigma_i(\varepsilon_j)|)$ (ma trận logarithm đơn vị cơ bản) tương ứng với $\mathrm{Reg}_E = \det(\langle P_i, P_j \rangle)$ (ma trận chiều cao Néron--Tate).

Liên hệ với giả thuyết Birch--Dyer

Nhóm đơn vị trong BSD.
  • Tương tự $E(\mathbb{Q})$: Trong bảng tương ứng “trường số $\leftrightarrow$ đường cong elliptic”, nhóm đơn vị $\mathcal{O}_K^{\times}$ tương ứng với nhóm Mordell--Weil $E(\mathbb{Q})$. Cả hai:
  • Là nhóm Abel hữu hạn sinh (Dirichlet / Mordell--Weil).
  • Hạng xuất hiện trong bậc triệt tiêu tại $s=1$ (cực bậc $r_1+r_2-1$ / zero bậc $r$).
  • Regulator xuất hiện trong hệ số hàng đầu.

$w_K$ vs. $|E_{\mathrm{tors}}|^2$: Cỡ phần hữu hạn: $w_K = |\mu(K)|$ nằm ở mẫu trong công thức số lớp, tương tự $|E(\mathbb{Q})_{\mathrm{tors}}|^2$ ở mẫu trong BSD mạnh.

Đơn vị elliptic: Trong lý thuyết BSD cho đường cong CM, đơn vị elliptic (elliptic units) [rubin1991] đóng vai trò kết nối giữa đơn vị cổ điển và điểm trên đường cong elliptic. Coates--Wiles dùng đơn vị elliptic để chứng minh BSD cho đường cong CM hạng $0$.

Tổng quát hóa: Phỏng đoán Bloch--Kato thống nhất cả hai: nhóm $K$-theory $K_1(\mathcal{O}_K) \otimes \mathbb{Q}$ (chứa đơn vị) và nhóm Selmer (chứa điểm Mordell--Weil) đều là “nhóm Selmer mở rộng” cho các motif khác nhau.

103 Nhóm Galois tuyệt đối (Absolute Galois group $G_{\mathbb{Q}}$) Ch.7 5

Định nghĩa

Định nghĩa (Nhóm Galois tuyệt đối). Nhóm Galois tuyệt đối (absolute Galois group) của $\mathbb{Q}$ là nhóm tự đồng cấu trường của bao đóng đại số $\bar{\mathbb{Q}}$ cố định $\mathbb{Q}$:
\[ G_{\mathbb{Q}} = \mathrm{Gal}(\bar{\mathbb{Q}}/\mathbb{Q}) = \{\sigma : \bar{\mathbb{Q}} \xrightarrow{\sim} \bar{\mathbb{Q}} \mid \sigma(a) = a \;\forall a \in \mathbb{Q}\}. \]
Đây là nhóm profinite --- giới hạn ngược của các nhóm Galois hữu hạn $\mathrm{Gal}(K/\mathbb{Q})$ trên mọi mở rộng Galois hữu hạn $K/\mathbb{Q}$:
\[ G_{\mathbb{Q}} = \varprojlim_{K/\mathbb{Q} \text{ Galois hữu hạn}} \mathrm{Gal}(K/\mathbb{Q}). \]
Với mỗi số nguyên tố $p$, có nhóm phân rã (decomposition group) $G_p = \mathrm{Gal}(\bar{\mathbb{Q}}_p/\mathbb{Q}_p) \hookrightarrow G_{\mathbb{Q}}$ --- nhóm Galois “cục bộ” tại $p$.

Ví dụ

Ví dụ (Các phần tử và nhóm con của $G_{\mathbb{Q}}$).
  1. Liên hợp phức: Phép liên hợp $\sigma: a + bi \mapsto a - bi$ mở rộng thành phần tử $c \in G_{\mathbb{Q}}$ có bậc $2$. Đây là phần tử duy nhất (lên đến liên hợp) tương ứng với “chỗ” $v = \infty$.
  2. Nhóm con cố định: Nếu $K = \mathbb{Q}(\sqrt{d})$ thì $\mathrm{Gal}(K/\mathbb{Q}) \cong \mathbb{Z}/2\mathbb{Z}$. Nhóm con $\mathrm{Gal}(\bar{\mathbb{Q}}/K) \subset G_{\mathbb{Q}}$ có chỉ số $2$, gồm các $\sigma$ cố định $\sqrt{d}$.
  3. Frobenius: Với mỗi nguyên tố $p$ không phân nhánh trong $K/\mathbb{Q}$, có phần tử Frobenius $\mathrm{Frob}_p \in \mathrm{Gal}(K/\mathbb{Q})$ xác định bởi $\mathrm{Frob}_p(x) \equiv x^p \pmod{\mathfrak{p}}$. Frobenius là “đại diện” của $p$ trong nhóm Galois --- mỗi nguyên tố gửi một “đại sứ” vào $G_{\mathbb{Q}}$.
  4. Cực kỳ phức tạp: $G_{\mathbb{Q}}$ là đối tượng “thần bí” nhất của toán học --- không ai biết cấu trúc đầy đủ. Nhưng biểu diễn của $G_{\mathbb{Q}}$ (cách $G_{\mathbb{Q}}$ tác động lên không gian vector) thì dễ nghiên cứu hơn nhiều.

Ý nghĩa trực giác

$G_{\mathbb{Q}}$ --- “nhóm đối xứng” của mọi phương trình đại số.
  • Hình dung: Mỗi phương trình đa thức $f(x) = 0$ có nhóm Galois --- nhóm hoán vị các nghiệm giữ nguyên mọi quan hệ đại số. $G_{\mathbb{Q}}$ là “nhóm Galois vũ trụ” --- nó hoán vị mọi số đại số, giữ nguyên mọi quan hệ đại số.
  • Tại sao “tuyệt đối”? Vì ta lấy $\bar{\mathbb{Q}}$ --- bao đóng đại số đầy đủ, không giới hạn trong mở rộng nào. Mọi nhóm Galois $\mathrm{Gal}(K/\mathbb{Q})$ đều là thương (quotient) của $G_{\mathbb{Q}}$.
  • Tôpô profinite: $G_{\mathbb{Q}}$ có tôpô tự nhiên: tôpô Krull. Nó compact, totally disconnected, và “khổng lồ” (không đếm được). Nhưng mỗi “lát cắt” hữu hạn $\mathrm{Gal}(K/\mathbb{Q})$ thì dễ hiểu --- và $G_{\mathbb{Q}}$ là giới hạn của tất cả các lát cắt này.

Liên hệ với giả thuyết Birch--Dyer

$G_{\mathbb{Q}}$ trong BSD.
  • Biểu diễn Galois: Đường cong elliptic $E/\mathbb{Q}$ cho biểu diễn:
    \[ \rho_{E,\ell}: G_{\mathbb{Q}} \to \mathrm{GL}_2(\mathbb{Z}_\ell) \]
    qua tác động trên module Tate $T_\ell(E) = \varprojlim E[\ell^n] \cong \mathbb{Z}_\ell^2$. Biểu diễn này mã hóa mọi thông tin số học của $E$ --- bao gồm $a_p = \mathrm{tr}(\rho_{E,\ell}(\mathrm{Frob}_p))$.
  • Hàm $L$ từ $G_{\mathbb{Q}}$: Hàm $L(E,s) = \prod_p L_p(E,s)$ được xây dựng từ biểu diễn $\rho_{E,\ell}$. Thừa số Euler tại $p$ tốt: $L_p(E,s) = \det(I - p^{-s}\rho_{E,\ell}(\mathrm{Frob}_p))^{-1}$. BSD nói rằng hành vi tại $s=1$ xác định hạng.
  • Đối đồng điều Galois: Nhóm Selmer và $\mathrm{Sha}$ được định nghĩa qua đối đồng điều $H^1(G_{\mathbb{Q}}, E[\ell^n])$ --- tác động của $G_{\mathbb{Q}}$ lên điểm xoắn. Không có $G_{\mathbb{Q}}$ thì không định nghĩa được Selmer.
  • Chương trình Langlands: Phỏng đoán Langlands nói rằng mọi biểu diễn “tốt” của $G_{\mathbb{Q}}$ đều đến từ dạng tự đẳng cấu. Định lý modularity (Wiles) chứng minh điều này cho biểu diễn 2 chiều từ đường cong elliptic [wiles1995].
104 Đối đồng điều Galois (Galois cohomology $H^i(G,M)$) Ch.7 7

Định nghĩa

Định nghĩa (Đối đồng điều Galois). Cho $G$ là nhóm (profinite) và $M$ là $G$-module (nhóm Abel với tác động của $G$). Đối đồng điều Galois (Galois cohomology) $H^i(G, M)$ ($i = 0, 1, 2, \ldots$) là dãy các nhóm Abel đo “chướng ngại” khi giải phương trình trong $M$ dưới tác động của $G$.

Ba bậc đầu tiên:

  • $H^0(G, M) = M^G = \{m \in M : \sigma(m) = m \;\forall \sigma \in G\}$ --- các phần tử bất biến dưới $G$.
  • $H^1(G, M) = Z^1(G,M) / B^1(G,M)$ --- thương của 1-cocycle modulo 1-coboundary (xem mục tiếp theo).
  • $H^2(G, M)$ phân loại các mở rộng nhóm $0 \to M \to E \to G \to 1$ (lên đến tương đương).

Trong lý thuyết số, ta thường lấy $G = G_{\mathbb{Q}}$ hoặc $G = G_p = \mathrm{Gal}(\bar{\mathbb{Q}}_p/\mathbb{Q}_p)$ và $M = E[n]$ (điểm xoắn $n$-phần), $M = E(\bar{\mathbb{Q}})$, hoặc $M = \bar{\mathbb{Q}}^{\times}$.

Ví dụ

Ví dụ (Đối đồng điều Galois trong các tình huống quen thuộc).
  1. Định lý 90 Hilbert: Cho $K/\mathbb{Q}$ mở rộng Galois hữu hạn. Khi đó:
    \[ H^1(\mathrm{Gal}(K/\mathbb{Q}), K^{\times}) = 0. \]
    Nghĩa là: mọi 1-cocycle $\sigma \mapsto a_\sigma$ với $a_\sigma \in K^{\times}$ đều là coboundary. Đây là kết quả cổ điển của Hilbert (1897).
  2. $H^0$ --- điểm hữu tỉ: $H^0(G_{\mathbb{Q}}, E(\bar{\mathbb{Q}})) = E(\bar{\mathbb{Q}})^{G_{\mathbb{Q}}} = E(\mathbb{Q})$. Đối đồng điều bậc $0$ cho lại nhóm các điểm hữu tỉ --- đối tượng trung tâm của BSD!
  3. $H^1$ --- twist và torsor: $H^1(G_{\mathbb{Q}}, \mathrm{Aut}(E)) $ phân loại các twist của $E$ --- các đường cong “giống” $E$ trên $\bar{\mathbb{Q}}$ nhưng có thể khác trên $\mathbb{Q}$. Khi $\mathrm{Aut}(E) = \{\pm 1\}$, các twist tương ứng với $d \in \mathbb{Q}^{\times}/(\mathbb{Q}^{\times})^2$.
  4. Nhóm Brauer: $H^2(G_{\mathbb{Q}}, \bar{\mathbb{Q}}^{\times}) = \mathrm{Br}(\mathbb{Q})$ --- nhóm Brauer, phân loại các đại số chia trung tâm trên $\mathbb{Q}$.

Ý nghĩa trực giác

Đối đồng điều Galois --- “đo chướng ngại” khi giải phương trình.
  • Hình dung $H^0$: “Cái gì bất biến?” --- phần tử nào của $M$ không thay đổi dưới mọi $\sigma \in G$. Đây là câu hỏi đơn giản nhất.
  • Hình dung $H^1$: “Hệ phương trình $\sigma(x) - x = a_\sigma$ có nghiệm không?” Mỗi 1-cocycle $(\sigma \mapsto a_\sigma)$ là “đề bài”. Nếu có $x$ giải được cho mọi $\sigma$ đồng thời, cocycle là coboundary ($a_\sigma = \sigma(x) - x$) và nằm trong lớp $0$. $H^1$ đo “phần không giải được” --- chướng ngại.
  • Dãy chính xác dài: Cho $0 \to A \to B \to C \to 0$ dãy chính xác các $G$-module. Đối đồng điều cho dãy dài:
    \[ 0 \to H^0(G,A) \to H^0(G,B) \to H^0(G,C) \xrightarrow{\delta} H^1(G,A) \to H^1(G,B) \to \cdots \]
    Ánh xạ biên $\delta$ “nâng” thông tin từ $H^0$ lên $H^1$ --- đây là công cụ chính để xây dựng nhóm Selmer.

Liên hệ với giả thuyết Birch--Dyer

Đối đồng điều Galois trong BSD.
  • Nền tảng: Nhóm Selmer $\mathrm{Sel}_n(E/\mathbb{Q}) \subset H^1(G_{\mathbb{Q}}, E[n])$ và nhóm Tate--Shafarevich $\mathrm{Sha}(E/\mathbb{Q}) \subset H^1(G_{\mathbb{Q}}, E)$ đều là nhóm con của đối đồng điều Galois bậc $1$. Không có $H^1$ thì không định nghĩa được hai đối tượng quan trọng nhất trong BSD mạnh.
  • Ánh xạ biên Kummer: Từ dãy chính xác $0 \to E[n] \to E \xrightarrow{[n]} E \to 0$, ánh xạ biên $\delta: E(\mathbb{Q})/nE(\mathbb{Q}) \hookrightarrow H^1(G_{\mathbb{Q}}, E[n])$ nhúng “thông tin hạng” vào đối đồng điều. Ảnh của $\delta$ nằm trong $\mathrm{Sel}_n$.
  • Đối ngẫu: Các định lý đối ngẫu (Tate, Poitou--Tate) cho $H^i$ cung cấp công cụ chính để chặn cỡ Selmer --- từ đó suy ra kết quả về hạng và $\mathrm{Sha}$ [silverman2009].
105 1-cocycle (1-cocycle) Ch.7 6

Định nghĩa

Định nghĩa (1-cocycle). Cho $G$ là nhóm và $M$ là $G$-module. Một 1-cocycle (1-cocycle) (hay 1-hệ số đồng chu trình) là hàm $\xi: G \to M$ thỏa mãn điều kiện cocycle:
\[ \xi(\sigma\tau) = \xi(\sigma) + \sigma \cdot \xi(\tau) \quad \forall \sigma, \tau \in G. \]
Tập tất cả 1-cocycle ký hiệu $Z^1(G, M)$, là nhóm Abel (cộng theo từng điểm).

Khi $G$ tác động tầm thường (trivially) trên $M$ (tức $\sigma \cdot m = m$ $\forall \sigma, m$), điều kiện trở thành $\xi(\sigma\tau) = \xi(\sigma) + \xi(\tau)$ --- tức $\xi$ là đồng cấu nhóm $G \to M$, và $Z^1(G,M) = \mathrm{Hom}(G, M)$.

Ví dụ

Ví dụ (1-cocycle cụ thể).
  1. $G = \mathrm{Gal}(\mathbb{Q}(\sqrt{d})/\mathbb{Q}) = \{1, \sigma\}$, $M = \mathbb{Q}(\sqrt{d})^{\times}$: Một 1-cocycle $\xi$ xác định bởi $\xi(\sigma) = a \in \mathbb{Q}(\sqrt{d})^{\times}$ (vì $\xi(1) = 0$ luôn đúng). Điều kiện cocycle: $\xi(\sigma^2) = \xi(\sigma) + \sigma(\xi(\sigma))$. Vì $\sigma^2 = 1$: $0 = a + \sigma(a)$, tức $\sigma(a) = -a$. Vậy $a$ phải có $\sigma(a) = -a$, nghĩa là $a = b\sqrt{d}$ cho $b \in \mathbb{Q}^{\times}$.
  2. $G = G_{\mathbb{Q}}$, $M = E[2]$ cho $E: y^2 = (x-e_1)(x-e_2)(x-e_3)$: Một 1-cocycle $\xi: G_{\mathbb{Q}} \to E[2]$ gửi mỗi $\sigma$ đến một điểm xoắn bậc $2$, thỏa điều kiện cocycle. Các cocycle này “mã hóa” các đường cong Selmer --- torsor cho $E$ qua phép nhân $2$.
  3. Tác động tầm thường: $G = G_{\mathbb{Q}}$, $M = \mathbb{Z}/n\mathbb{Z}$ (tác động tầm thường). Khi đó $Z^1(G_{\mathbb{Q}}, \mathbb{Z}/n\mathbb{Z}) = \mathrm{Hom}(G_{\mathbb{Q}}, \mathbb{Z}/n\mathbb{Z})$ --- tập các đặc trưng bậc $n$ của $G_{\mathbb{Q}}$, tương ứng 1-1 với mở rộng Abel bậc $n$ của $\mathbb{Q}$ (lý thuyết trường lớp).

Ý nghĩa trực giác

1-cocycle --- “lệch” so với đồng cấu.
  • Hình dung: Nếu $G$ tác động tầm thường, 1-cocycle chính là đồng cấu. Khi tác động không tầm thường, điều kiện cocycle “bẻ cong” đồng cấu: $\xi(\sigma\tau) \neq \xi(\sigma) + \xi(\tau)$ mà có thêm số hạng $\sigma \cdot \xi(\tau)$ phản ánh tác động.
  • “Đạo hàm xoắn”: Nghĩ $\xi$ như “đạo hàm” (derivation): nó đo sự thay đổi khi đi theo $\sigma$, nhưng bị xoắn bởi tác động. Trong lý thuyết nhóm đại số, 1-cocycle đúng là derivation $G \to M$.
  • Torsor: Mỗi lớp trong $H^1(G, M) = Z^1/B^1$ tương ứng với một torsor (không gian thuần nhất chính) --- đối tượng “giống $M$” nhưng không có điểm gốc tự nhiên. Nếu torsor có điểm hữu tỉ, lớp cocycle tương ứng là $0$.

Liên hệ với giả thuyết Birch--Dyer

1-cocycle trong BSD.
  • Xây dựng Selmer: Ánh xạ biên Kummer $\delta: E(\mathbb{Q})/nE(\mathbb{Q}) \to H^1(G_{\mathbb{Q}}, E[n])$ gửi mỗi điểm $P \in E(\mathbb{Q})$ đến một 1-cocycle $\xi_P: \sigma \mapsto \sigma(Q) - Q$ trong đó $Q \in E(\bar{\mathbb{Q}})$ thỏa $nQ = P$. Điều kiện cocycle tự động thỏa vì $\sigma(Q) - Q \in E[n]$.
  • $\mathrm{Sha}$ = cocycle “ẩn”: Phần tử của $\mathrm{Sha}$ là lớp cocycle trong $H^1(G_{\mathbb{Q}}, E)$ mà cục bộ tại mọi $p$ đều là coboundary (torsor có điểm $p$-adic) nhưng toàn cục không phải coboundary (torsor không có điểm hữu tỉ).
  • 2-descent: Thuật toán 2-descent thực chất là liệt kê các 1-cocycle $G_{\mathbb{Q}} \to E[2]$ thỏa điều kiện cục bộ, tức tính $\mathrm{Sel}_2(E/\mathbb{Q})$ [silverman2009].
106 1-coboundary (1-coboundary) Ch.7 6

Định nghĩa

Định nghĩa (1-coboundary). Cho $G$ là nhóm và $M$ là $G$-module. Một 1-coboundary (1-coboundary) (hay 1-biên) là 1-cocycle dạng:
\[ \xi(\sigma) = \sigma(m) - m \quad \text{cho một } m \in M \text{ cố định}. \]
Tập tất cả 1-coboundary ký hiệu $B^1(G, M) \subset Z^1(G, M)$, là nhóm con của nhóm cocycle.

Kiểm tra: $\xi(\sigma) = \sigma(m) - m$ thỏa điều kiện cocycle vì:

\[ \xi(\sigma\tau) = \sigma\tau(m) - m = [\sigma(\tau(m)) - \sigma(m)] + [\sigma(m) - m] = \sigma(\xi(\tau)) + \xi(\sigma). \]

$H^1(G, M) = Z^1(G, M) / B^1(G, M)$ --- đối đồng điều bậc $1$ đo “cocycle modulo coboundary”.

Ví dụ

Ví dụ (1-coboundary cụ thể).
  1. $G = \{1, \sigma\}$, $M = \mathbb{Z}$ với $\sigma(n) = -n$: Coboundary bởi $m \in \mathbb{Z}$: $\xi(\sigma) = \sigma(m) - m = -m - m = -2m$. Vậy $B^1(G, \mathbb{Z}) = \{0 \mapsto 0, \sigma \mapsto -2m : m \in \mathbb{Z}\} \cong 2\mathbb{Z}$. Cocycle: $\xi(\sigma) = k$ với $\xi(\sigma^2) = \xi(\sigma) + \sigma(\xi(\sigma)) = k + (-k) = 0$. Vậy $Z^1(G, \mathbb{Z}) \cong \mathbb{Z}$. Do đó $H^1(G, \mathbb{Z}) = \mathbb{Z} / 2\mathbb{Z}$.
  2. Torsor tầm thường: Nếu $\xi \in B^1(G_{\mathbb{Q}}, E(\bar{\mathbb{Q}}))$, tức $\xi(\sigma) = \sigma(P) - P$ cho $P \in E(\bar{\mathbb{Q}})$, thì torsor tương ứng “có điểm hữu tỉ” --- vì $P$ chính là điểm đó (khi dịch chuyển).
  3. Kummer: Cho $P \in E(\mathbb{Q})$ và $Q \in E(\bar{\mathbb{Q}})$ với $nQ = P$. Cocycle $\xi_P(\sigma) = \sigma(Q) - Q$ là coboundary $\Leftrightarrow$ tồn tại $R \in E(\bar{\mathbb{Q}})$ sao cho $\sigma(Q) - Q = \sigma(R) - R$ $\forall \sigma$ $\Leftrightarrow$ $Q - R \in E(\mathbb{Q})$ $\Leftrightarrow$ $P \in nE(\mathbb{Q})$.

Ý nghĩa trực giác

1-coboundary --- “chướng ngại tầm thường”.
  • Hình dung: Coboundary là cocycle “hiển nhiên” --- nó đến từ một phần tử $m$ cụ thể trong $M$. Nếu cocycle $\xi$ là coboundary, chướng ngại mà nó đại diện “giải được” bằng cách chọn $m$.
  • $H^1$ = “phần thú vị”: Lấy thương $Z^1/B^1$ loại bỏ cocycle tầm thường, chỉ giữ lại phần “không giải được” --- chướng ngại thực sự. Đây là triết lý xuyên suốt đối đồng điều: đo cái “không tầm thường”.
  • Tương tự de Rham: Trong giải tích, 1-form đóng (closed, $d\omega = 0$) $\leftrightarrow$ cocycle. 1-form chính xác (exact, $\omega = df$) $\leftrightarrow$ coboundary. Đối đồng điều de Rham $H^1_{\mathrm{dR}} = \{\text{đóng}\}/\{\text{chính xác}\}$ --- cùng triết lý!

Liên hệ với giả thuyết Birch--Dyer

1-coboundary trong BSD.
  • Điểm hữu tỉ = coboundary: Trong ánh xạ Kummer $\delta: E(\mathbb{Q})/nE(\mathbb{Q}) \to H^1(G_{\mathbb{Q}}, E[n])$, những $P \in nE(\mathbb{Q})$ cho cocycle $\equiv 0$ (coboundary). Phần “còn lại” $E(\mathbb{Q})/nE(\mathbb{Q}) \hookrightarrow H^1$ chính là thông tin hạng.
  • $\mathrm{Sha}$ = “cocycle không phải coboundary toàn cục”: Phần tử $\xi \in \mathrm{Sha}$ là cocycle mà với mọi $p$, hạn chế $\xi|_{G_p} \in B^1(G_p, E)$ (coboundary cục bộ), nhưng $\xi \notin B^1(G_{\mathbb{Q}}, E)$ (không phải coboundary toàn cục). Khoảng cách giữa “cục bộ coboundary” và “toàn cục coboundary” chính là $\mathrm{Sha}$.
  • Dãy chính xác cơ bản: $0 \to E(\mathbb{Q})/nE(\mathbb{Q}) \xrightarrow{\delta} \mathrm{Sel}_n(E/\mathbb{Q}) \to \mathrm{Sha}(E/\mathbb{Q})[n] \to 0$. Mỗi phần tử Selmer là cocycle thỏa điều kiện cục bộ. Phần coboundary toàn cục cho ảnh của $\delta$ (hạng). Phần còn lại là $\mathrm{Sha}[n]$.
107 Dãy chính xác dài (Long exact sequence) Ch.7 6

Định nghĩa

Định nghĩa (Dãy chính xác dài trong đối đồng điều Galois). Cho $G$ là nhóm và $0 \to A \xrightarrow{f} B \xrightarrow{g} C \to 0$ là dãy chính xác ngắn các $G$-module (tức $f$ đơn ánh, $g$ toàn ánh, $\ker g = \mathrm{im}\, f$). Khi đó tồn tại dãy chính xác dài (long exact sequence):
\[ 0 \to H^0(G,A) \xrightarrow{f_*} H^0(G,B) \xrightarrow{g_*} H^0(G,C) \xrightarrow{\delta_0} H^1(G,A) \xrightarrow{f_*} H^1(G,B) \xrightarrow{g_*} H^1(G,C) \xrightarrow{\delta_1} H^2(G,A) \to \cdots \]
Tại mỗi vị trí, ảnh của ánh xạ trước bằng hạt nhân của ánh xạ sau: $\mathrm{im} = \ker$.

Các ánh xạ biên (connecting homomorphisms) $\delta_i: H^i(G,C) \to H^{i+1}(G,A)$ là phần “thú vị” nhất --- chúng không đến từ $f$ hay $g$, mà xuất hiện vì $A \to B$ không phải đẳng cấu.

Ví dụ

Ví dụ (Dãy chính xác dài Kummer). Dãy nhân $n$ trên $E$: $0 \to E[n] \to E(\bar{\mathbb{Q}}) \xrightarrow{[n]} E(\bar{\mathbb{Q}}) \to 0$.

Dãy chính xác dài:

\[\begin{aligned} 0 &\to E(\mathbb{Q})[n] \to E(\mathbb{Q}) \xrightarrow{[n]} E(\mathbb{Q}) \xrightarrow{\delta} H^1(G_{\mathbb{Q}}, E[n]) \\ &\to H^1(G_{\mathbb{Q}}, E) \xrightarrow{[n]} H^1(G_{\mathbb{Q}}, E) \to \cdots \end{aligned}\]

Từ đây:

  • $\ker \delta = \mathrm{im}([n]) = nE(\mathbb{Q})$, nên $\delta$ “nhúng” $E(\mathbb{Q})/nE(\mathbb{Q}) \hookrightarrow H^1(G_{\mathbb{Q}}, E[n])$.
  • $\mathrm{im}\,\delta = \ker(H^1(G_{\mathbb{Q}}, E[n]) \to H^1(G_{\mathbb{Q}}, E))$.
Đoạn ngắn: $0 \to E(\mathbb{Q})/nE(\mathbb{Q}) \xrightarrow{\delta} H^1(G_{\mathbb{Q}}, E[n]) \to H^1(G_{\mathbb{Q}}, E)[n] \to 0$.

Ý nghĩa trực giác

Dãy chính xác dài --- “nấc thang” nâng thông tin.
  • Hình dung: Dãy chính xác ngắn $A \hookrightarrow B \twoheadrightarrow C$ nói “$B$ được xây từ $A$ và $C$”. Nhưng khi lấy phần $G$-bất biến ($H^0$), phép “xây” này có thể hỏng: $H^0(B) \to H^0(C)$ có thể không toàn ánh. Phần “thiếu” được bù bằng $\delta: H^0(C) \to H^1(A)$ --- thông tin “rơi” từ bậc $0$ xuống bậc $1$.
  • “Nấc thang”: Cứ mỗi lần thông tin bị “kẹt” ở bậc $i$, nó “rơi xuống” bậc $i+1$ qua ánh xạ biên $\delta_i$. Dãy dài là hệ quả tất yếu: chướng ngại ở bậc thấp trở thành dữ liệu ở bậc cao.
  • $\delta$ “tạo ra” cocycle: Ánh xạ biên $\delta$ hoạt động: lấy $c \in H^0(G,C) = C^G$, nâng lên $b \in B$ (chọn preimage), tính $\sigma(b) - b$ --- đây phải nằm trong $A$ (vì $g(\sigma(b) - b) = \sigma(c) - c = 0$), và hàm $\sigma \mapsto \sigma(b) - b$ chính là 1-cocycle trong $Z^1(G, A)$.

Liên hệ với giả thuyết Birch--Dyer

Dãy chính xác dài trong BSD.
  • Xương sống: Toàn bộ lý thuyết Selmer/$\mathrm{Sha}$ được xây trên dãy chính xác dài Kummer. Từ $0 \to E[n] \to E \to E \to 0$, dãy dài cho:
    \[ 0 \to E(\mathbb{Q})/nE(\mathbb{Q}) \to \mathrm{Sel}_n(E/\mathbb{Q}) \to \mathrm{Sha}(E/\mathbb{Q})[n] \to 0 \]
    (sau khi thêm điều kiện cục bộ). Đây là dãy cơ bản nhất trong BSD.
  • Cận hạng: Từ dãy trên: $\mathrm{rk}(E(\mathbb{Q})) \leq \dim_{\mathbb{F}_p} \mathrm{Sel}_p(E/\mathbb{Q}) - \dim_{\mathbb{F}_p} E(\mathbb{Q})[p]$. Tính $\mathrm{Sel}_p$ (khả thi bằng descent) cho cận trên của hạng.
  • Nhiều dãy: Ngoài Kummer, các dãy chính xác dài khác (Poitou--Tate, localization sequence) cung cấp thêm thông tin. Kết hợp chúng cho phép chặn $|\mathrm{Sha}|$ --- bước then chốt trong các chứng minh BSD phần.
108 Dãy Kummer (Kummer exact sequence) Ch.7 7

Định nghĩa

Định nghĩa (Dãy Kummer). Cho $E/\mathbb{Q}$ là đường cong elliptic và $n \geq 2$ nguyên. Phép nhân $[n]: E \to E$ có hạt nhân $E[n]$. Trên $\bar{\mathbb{Q}}$, ánh xạ $[n]$ toàn ánh, cho dãy chính xác ngắn:
\[ 0 \to E[n] \to E(\bar{\mathbb{Q}}) \xrightarrow{[n]} E(\bar{\mathbb{Q}}) \to 0. \]
Lấy đối đồng điều Galois, dãy Kummer (Kummer exact sequence) là:
\[ \boxed{0 \to E(\mathbb{Q})/nE(\mathbb{Q}) \xrightarrow{\delta} H^1(G_{\mathbb{Q}}, E[n]) \to H^1(G_{\mathbb{Q}}, E)[n] \to 0} \]
trong đó:
  • $\delta$ là ánh xạ biên Kummer: $P \mapsto [\sigma \mapsto \sigma(Q) - Q]$ với $nQ = P$,
  • $H^1(G_{\mathbb{Q}}, E)[n] = \ker([n]: H^1(G_{\mathbb{Q}}, E) \to H^1(G_{\mathbb{Q}}, E))$.
Thêm điều kiện cục bộ (tại mọi $p$), dãy trở thành:
\[ 0 \to E(\mathbb{Q})/nE(\mathbb{Q}) \xrightarrow{\delta} \mathrm{Sel}_n(E/\mathbb{Q}) \to \mathrm{Sha}(E/\mathbb{Q})[n] \to 0. \]

Ví dụ

Ví dụ (Ánh xạ biên Kummer --- xây dựng 4 bước). Cho $E: y^2 = x^3 - x$ và $n = 2$. Lấy $P = (0,0) \in E(\mathbb{Q})$ (điểm bậc $2$, tức $2P = O$).

Bước 1: Tìm $Q$ với $2Q = P$. Trên $\bar{\mathbb{Q}}$: $Q = (\alpha, \beta)$ thỏa $2Q = (0,0)$. Tính: $Q = \left(\frac{1+\sqrt{-1}}{2}, \ldots\right) \notin E(\mathbb{Q})$.

Bước 2: Tác động Galois: $\sigma \in G_{\mathbb{Q}}$ cho $\sigma(Q)$. Vì $Q \notin E(\mathbb{Q})$, $\sigma(Q) \neq Q$ với một số $\sigma$.

Bước 3: Tính cocycle: $\xi_P(\sigma) = \sigma(Q) - Q \in E[2]$. Đây là 1-cocycle $G_{\mathbb{Q}} \to E[2] \cong (\mathbb{Z}/2\mathbb{Z})^2$.

Bước 4: Lớp $[\xi_P] \in H^1(G_{\mathbb{Q}}, E[2])$. Vì $P = (0,0) \in E(\mathbb{Q})[2] = E[2] \cap E(\mathbb{Q})$, ta có $P \in 2E(\mathbb{Q})$ $\Leftrightarrow$ $[\xi_P] = 0$. Thực tế $(0,0) \notin 2E(\mathbb{Q})$ nên $[\xi_P] \neq 0$ --- đóng góp $1$ chiều vào $\mathrm{Sel}_2$.

Ý nghĩa trực giác

Dãy Kummer --- “mật mã hóa” hạng thành đối đồng điều.
  • Ý tưởng: Để tính hạng $r = \mathrm{rk}(E(\mathbb{Q}))$, ta cần biết $E(\mathbb{Q})/nE(\mathbb{Q})$. Nhưng nhóm này khó tính trực tiếp. Ánh xạ Kummer $\delta$ “nhúng” nó vào $H^1(G_{\mathbb{Q}}, E[n])$ --- đối tượng đối đồng điều có thể tính bằng phương pháp đại số.
  • Selmer “bao” hạng: $E(\mathbb{Q})/nE(\mathbb{Q}) \hookrightarrow \mathrm{Sel}_n(E/\mathbb{Q}) \twoheadrightarrow \mathrm{Sha}(E/\mathbb{Q})[n]$. Sel chứa thông tin hạng (ảnh của $\delta$) $\mathrm{Sha}[n]$ (phần dư). Nếu $\mathrm{Sha}[n] = 0$, Selmer cho hạng chính xác.
  • Tại sao “Kummer”? Dãy tương tự cho $\mathbb{G}_m$: $0 \to \mu_n \to \bar{\mathbb{Q}}^{\times} \xrightarrow{x \mapsto x^n} \bar{\mathbb{Q}}^{\times} \to 0$ cho dãy Kummer cổ điển:
    \[ \mathbb{Q}^{\times}/(\mathbb{Q}^{\times})^n \hookrightarrow H^1(G_{\mathbb{Q}}, \mu_n) \cong \mathbb{Q}^{\times}/(\mathbb{Q}^{\times})^n \]
    (đẳng cấu nhờ Hilbert 90). Dãy Kummer cho $E$ là tổng quát hóa phi giao hoán.

Liên hệ với giả thuyết Birch--Dyer

Dãy Kummer trong BSD.
  • Dãy cơ bản nhất: Dãy $0 \to E(\mathbb{Q})/nE(\mathbb{Q}) \to \mathrm{Sel}_n \to \mathrm{Sha}[n] \to 0$ là xương sống của mọi phương pháp tính hạng. Descent = tính Selmer. $\mathrm{Sha}[n]$ = sai số.
  • Cận hạng: $|E(\mathbb{Q})/nE(\mathbb{Q})| = n^r \cdot |E(\mathbb{Q})[n]|$ (với $r = \mathrm{rk}$). Vậy $\log_n |\mathrm{Sel}_n| = r + \log_n |E(\mathbb{Q})[n]| + \log_n |\mathrm{Sha}[n]|$. Tính $|\mathrm{Sel}_n|$ cho cận trên $r \leq \log_n |\mathrm{Sel}_n| - \dim E(\mathbb{Q})[n]$.
  • Bhargava--Shankar: Kết quả $\mathrm{avg}|\mathrm{Sel}_n| = \sigma(n)$ [bhargava-shankar2015] nói rằng “trung bình” Selmer nhỏ. Kết hợp với dãy Kummer: “hầu hết” đường cong có $r \leq 1$ và $\mathrm{Sha}[n]$ nhỏ --- dẫn đến 66.48% thỏa BSD [bhargava-skinner-zhang2014].
  • Chọn $n$: $n = 2$ dễ tính nhất (2-descent cổ điển). $n = 3, 4, 5$ cho thông tin tốt hơn (phát hiện $\mathrm{Sha}$ bậc cao). Kết hợp nhiều $n$ cho cận tối ưu [fisher2008].
109 Ánh xạ biên (Kummer) (Connecting homomorphism $\delta$) Ch.7 7

Định nghĩa

Định nghĩa (Ánh xạ biên Kummer). Cho $E/\mathbb{Q}$ đường cong elliptic và $n \geq 2$. Từ dãy chính xác ngắn $0 \to E[n] \to E(\bar{\mathbb{Q}}) \xrightarrow{[n]} E(\bar{\mathbb{Q}}) \to 0$, ánh xạ biên Kummer (Kummer connecting homomorphism) là đồng cấu nhóm:
\[ \delta: E(\mathbb{Q})/nE(\mathbb{Q}) \longrightarrow H^1(G_{\mathbb{Q}}, E[n]) \]
được xây dựng như sau. Cho $P \in E(\mathbb{Q})$:
  1. Nâng: Chọn $Q \in E(\bar{\mathbb{Q}})$ sao cho $[n]Q = P$ (tồn tại vì $[n]$ toàn ánh trên $\bar{\mathbb{Q}}$).
  2. Tác động Galois: Với mỗi $\sigma \in G_{\mathbb{Q}}$, tính $\sigma(Q) - Q$.
  3. Cocycle: Vì $[n](\sigma(Q) - Q) = \sigma(P) - P = 0$ (do $P \in E(\mathbb{Q})$), ta có $\sigma(Q) - Q \in E[n]$.
  4. Kết quả: Hàm $\xi_P: G_{\mathbb{Q}} \to E[n]$, $\sigma \mapsto \sigma(Q) - Q$ là 1-cocycle. Đặt $\delta(P) = [\xi_P] \in H^1(G_{\mathbb{Q}}, E[n])$.

Ánh xạ $\delta$ đơn ánh: $\ker \delta = nE(\mathbb{Q})/nE(\mathbb{Q}) = 0$, nghĩa là $\delta(P) = 0 \Leftrightarrow P \in nE(\mathbb{Q})$.

Ví dụ

Ví dụ (Tính $\delta$ cho đường cong cụ thể).
  1. $E: y^2 = x^3 + 1$, $n = 3$, $P = (2, 3)$: Cần tìm $Q$ với $3Q = P$. Điểm $Q$ nằm trong mở rộng bậc $9$ của $\mathbb{Q}$ (vì $|E[3]| = 9$). Cocycle $\xi_P(\sigma) = \sigma(Q) - Q$ ghi nhận cách Galois “xáo trộn” nghiệm $Q$. Nếu $P \notin 3E(\mathbb{Q})$ thì $[\xi_P] \neq 0$ trong $H^1(G_{\mathbb{Q}}, E[3])$.
  2. $E: y^2 = x^3 - x$, $n = 2$: Điểm xoắn $P = (0,0) \in E[2]$. Tìm $Q$ với $2Q = (0,0)$: tọa độ $Q$ thuộc $\mathbb{Q}(i)$. Cocycle: $\xi_{(0,0)}(\sigma) = \sigma(Q) - Q \in E[2]$. Liên hợp phức $c$ cho $c(Q) \neq Q$ nên $\xi \neq 0$.
  3. $P \in nE(\mathbb{Q})$: Nếu $P = nR$ với $R \in E(\mathbb{Q})$ thì chọn $Q = R$ --- cocycle $\xi_P(\sigma) = \sigma(R) - R = 0$ $\forall \sigma$. Vậy $\delta(P) = 0$, khẳng định $\ker \delta = nE(\mathbb{Q})$.

Ý nghĩa trực giác

Ánh xạ biên --- “mật mã hóa” điểm hữu tỉ thành cocycle.
  • Ý tưởng cốt lõi: Muốn biết $P$ có phải “bội $n$” không (tức $P = nR$ cho $R \in E(\mathbb{Q})$?). Nhưng kiểm tra trực tiếp khó. Thay vào đó: nâng $P$ lên $Q$ (trên $\bar{\mathbb{Q}}$), rồi xem Galois “phá” $Q$ thế nào. Nếu $Q$ sống sót (tức $Q \in E(\mathbb{Q})$) thì $P \in nE(\mathbb{Q})$. Nếu không, mức độ “phá” được mã hóa bởi cocycle $\xi_P$.
  • Tại sao không phụ thuộc chọn $Q$? Nếu chọn $Q'$ khác với $nQ' = P$, thì $Q' = Q + T$ cho $T \in E[n]$. Cocycle mới: $\sigma(Q') - Q' = \sigma(Q) - Q + \sigma(T) - T$. Số hạng $\sigma(T) - T$ là coboundary --- lớp $[\xi_P]$ không đổi.
  • Đơn ánh = “không mất thông tin”: $\delta$ nhúng trung thành $E(\mathbb{Q})/nE(\mathbb{Q})$ vào $H^1$. Mỗi lớp kề $P + nE(\mathbb{Q})$ tương ứng duy nhất một lớp cocycle --- thông tin hạng được bảo toàn hoàn toàn.

Liên hệ với giả thuyết Birch--Dyer

Ánh xạ biên Kummer trong BSD.
  • Nhúng hạng vào Selmer: Ảnh $\mathrm{im}(\delta) \subset \mathrm{Sel}_n(E/\mathbb{Q}) \subset H^1(G_{\mathbb{Q}}, E[n])$. Dãy cơ bản:
    \[ 0 \to E(\mathbb{Q})/nE(\mathbb{Q}) \xrightarrow{\delta} \mathrm{Sel}_n(E/\mathbb{Q}) \to \mathrm{Sha}(E/\mathbb{Q})[n] \to 0. \]
    Chiều $\mathbb{F}_p$ của $\mathrm{im}(\delta) \cong E(\mathbb{Q})/nE(\mathbb{Q})$ là $r + \dim E(\mathbb{Q})[n]$ (với $r = \mathrm{rk}$, $n = p$ nguyên tố).
  • Descent = tính ảnh $\delta$: 2-descent cổ điển: liệt kê phần tử $\mathrm{Sel}_2$ rồi xác định cái nào thuộc $\mathrm{im}(\delta)$ (tức có điểm hữu tỉ). Phần không thuộc ảnh = $\mathrm{Sha}[2]$ [silverman2009].
  • Tính $a_p$ từ $\delta$: Frobenius $\mathrm{Frob}_p$ tác động trên $E[n]$ cho biểu diễn $\rho_{E,n}$. Ánh xạ biên cục bộ $\delta_p: E(\mathbb{Q}_p)/nE(\mathbb{Q}_p) \to H^1(G_p, E[n])$ liên hệ thông tin cục bộ tại $p$ --- cần cho điều kiện Selmer.
110 Nhóm Selmer $n$-phần ($n$-Selmer group $\mathrm{Sel}_n(E/\mathbb{Q})$) Ch.3 7

Định nghĩa

Định nghĩa (Nhóm Selmer $n$-phần). Cho $E/\mathbb{Q}$ đường cong elliptic và $n \geq 2$. Nhóm Selmer $n$-phần ($n$-Selmer group) là nhóm con của $H^1(G_{\mathbb{Q}}, E[n])$ gồm các lớp cocycle thỏa điều kiện cục bộ tại mọi nơi:
\[ \mathrm{Sel}_n(E/\mathbb{Q}) = \ker\!\left(H^1(G_{\mathbb{Q}}, E[n]) \to \prod_{v} H^1(G_v, E(\bar{\mathbb{Q}}_v))\right) \]
trong đó tích chạy trên mọi nơi $v$ (các số nguyên tố $p$ và $v = \infty$), và $G_v = \mathrm{Gal}(\bar{\mathbb{Q}}_v/\mathbb{Q}_v)$ là nhóm Galois cục bộ.

Nói cách khác: $\xi \in \mathrm{Sel}_n$ nếu và chỉ nếu với mỗi $v$, ảnh của $\xi$ trong $H^1(G_v, E(\bar{\mathbb{Q}}_v))$ bằng $0$ --- tức torsor tương ứng có điểm $v$-adic (có điểm $p$-adic với mọi $p$, và có điểm thực).

Nhóm Selmer luôn hữu hạn --- đây là sự thật không tầm thường, là nền tảng cho descent.

Ví dụ

Ví dụ (Nhóm Selmer cho đường cong cụ thể).
  1. $E: y^2 = x^3 - x$ (conductor 32), $n = 2$: Nhóm $E[2] = \{O, (0,0), (1,0), (-1,0)\} \cong (\mathbb{Z}/2\mathbb{Z})^2$. 2-descent cho $\mathrm{Sel}_2(E/\mathbb{Q}) \cong (\mathbb{Z}/2\mathbb{Z})^2$, toàn bộ đến từ $E(\mathbb{Q})/2E(\mathbb{Q}) \cong (\mathbb{Z}/2\mathbb{Z})^2$ (vì $E(\mathbb{Q}) = E(\mathbb{Q})[2] \cong (\mathbb{Z}/2\mathbb{Z})^2$, hạng $0$). Do đó $\mathrm{Sha}(E/\mathbb{Q})[2] = 0$.
  2. $E: y^2 = x^3 - 25x$ (rank 1), $n = 2$: 2-descent cho $\mathrm{Sel}_2 \cong (\mathbb{Z}/2\mathbb{Z})^3$. Vì $E(\mathbb{Q})[2] \cong (\mathbb{Z}/2\mathbb{Z})^2$ và $\mathrm{rk} = 1$: $|E(\mathbb{Q})/2E(\mathbb{Q})| = 2^1 \cdot 4 = 8$. Nhưng $|\mathrm{Sel}_2| = 8$ vậy $\mathrm{Sha}[2] = 0$.
  3. $E: y^2 + y = x^3 - x^2 - 10x - 20$ (conductor 11, rank 0): $E(\mathbb{Q}) = \mathbb{Z}/5\mathbb{Z}$. Với $n = 5$: $\mathrm{Sel}_5 \cong \mathbb{Z}/5\mathbb{Z}$, toàn bộ đến từ $E(\mathbb{Q})/5E(\mathbb{Q})$.

Ý nghĩa trực giác

Nhóm Selmer --- “ứng viên” cho điểm hữu tỉ qua sàng cục bộ.
  • Hình dung: Muốn tìm điểm hữu tỉ trên $E$ (modulo $n$). Kiểm tra trực tiếp khó. Thay vào đó, kiểm tra từng “địa phương” ($p$-adic, thực): tại mỗi nơi $v$, torsor có điểm không? Những cocycle vượt qua mọi kiểm tra cục bộ tạo thành Selmer.
  • Selmer “bao” hạng: $E(\mathbb{Q})/nE(\mathbb{Q}) \hookrightarrow \mathrm{Sel}_n(E/\mathbb{Q})$. Mỗi điểm hữu tỉ (mod $n$) tự động thỏa điều kiện cục bộ. Nhưng Selmer có thể lớn hơn: phần dư $\mathrm{Sel}_n / \mathrm{im}(\delta) = \mathrm{Sha}[n]$ --- “ảo ảnh” vượt qua sàng cục bộ nhưng không đến từ điểm hữu tỉ toàn cục.
  • Tại sao hữu hạn? Hai lý do: (1) $E[n]$ hữu hạn nên $H^1(G_{\mathbb{Q}}, E[n])$ “lớn” nhưng (2) điều kiện cục bộ tại mọi $v$ cắt xuống nhóm hữu hạn. Đây là hệ quả của compact-ness trong tôpô adelic.
  • Tính được! Không giống $E(\mathbb{Q})$ (có thể rất khó tính), $\mathrm{Sel}_n$ có thuật toán xác định trong thời gian hữu hạn (descent). Đây là ưu điểm thực hành lớn nhất.

Liên hệ với giả thuyết Birch--Dyer

Nhóm Selmer trong BSD.
  • Dãy cơ bản: $0 \to E(\mathbb{Q})/nE(\mathbb{Q}) \xrightarrow{\delta} \mathrm{Sel}_n(E/\mathbb{Q}) \to \mathrm{Sha}(E/\mathbb{Q})[n] \to 0$. Đây là “bản đồ” quan trọng nhất: Selmer = hạng $+$ $\mathrm{Sha}$.
  • Cận hạng: $\mathrm{rk}(E/\mathbb{Q}) = \dim_{\mathbb{F}_p} \mathrm{Sel}_p - \dim_{\mathbb{F}_p} E[p]^{G_{\mathbb{Q}}} - \dim_{\mathbb{F}_p} \mathrm{Sha}[p]$. Nếu biết $\mathrm{Sha}[p] = 0$ (hoặc chặn được) thì Selmer cho hạng.
  • Bhargava--Shankar: Trung bình $|\mathrm{Sel}_n|$ trên mọi $E/\mathbb{Q}$: $\mathrm{avg}|\mathrm{Sel}_2| = 3$, $\mathrm{avg}|\mathrm{Sel}_3| = 4$, $\mathrm{avg}|\mathrm{Sel}_5| = 6$ [bhargava-shankar2015]. Kết hợp với Skinner--Zhang: ít nhất $66.48\%$ đường cong thỏa BSD [bhargava-skinner-zhang2014].
  • Selmer $p$-adic: Giới hạn $\mathrm{Sel}_{p^\infty}(E/\mathbb{Q}) = \varinjlim \mathrm{Sel}_{p^n}$ --- module trên đại số Iwasawa $\Lambda$. Phỏng đoán chính Iwasawa (Skinner--Urban) liên hệ cấu trúc module này với hàm $L$ $p$-adic [skinner-urban2014].
111 Nhóm Tate–Shafarevich (Tate–Shafarevich group $\Sha(E/\mathbb{Q})$) Ch.1 7

Định nghĩa

Định nghĩa (Nhóm Tate--Shafarevich). Cho $E/\mathbb{Q}$ đường cong elliptic. Nhóm Tate--Shafarevich (Tate--Shafarevich group) là nhóm các lớp đối đồng điều “cục bộ tầm thường” nhưng “toàn cục không tầm thường”:
\[ \mathrm{Sha}(E/\mathbb{Q}) = \ker\!\left(H^1(G_{\mathbb{Q}}, E(\bar{\mathbb{Q}})) \to \prod_{v} H^1(G_v, E(\bar{\mathbb{Q}}_v))\right) \]
trong đó tích chạy trên mọi nơi $v$ (mọi nguyên tố $p$ và $v = \infty$).

Nói cách khác: $\xi \in \mathrm{Sha}$ là 1-cocycle $G_{\mathbb{Q}} \to E(\bar{\mathbb{Q}})$ sao cho tại mỗi nơi $v$, hạn chế $\xi|_{G_v}$ là coboundary (torsor tương ứng có điểm $v$-adic), nhưng toàn cục $\xi$ không phải coboundary (torsor không có điểm hữu tỉ).

$\mathrm{Sha}$ nằm trong dãy chính xác:

\[ 0 \to E(\mathbb{Q})/nE(\mathbb{Q}) \to \mathrm{Sel}_n(E/\mathbb{Q}) \to \mathrm{Sha}(E/\mathbb{Q})[n] \to 0. \]

Ví dụ

Ví dụ (Nhóm $\mathrm{Sha}$ trong thực tế).
  1. $\mathrm{Sha} = 0$ (hầu hết đường cong): Đường cong $y^2 = x^3 - x$ có $\mathrm{Sha} = 0$ (chứng minh bởi Rubin [rubin1991] vì đây là đường cong CM với $L(E,1) \neq 0$). Tương tự cho hầu hết đường cong conductor nhỏ trong LMFDB.
  2. $\mathrm{Sha} \neq 0$, ví dụ cổ điển: Đường cong Selmer $3a^3 + 4b^3 + 5c^3 = 0$ là torsor cho đường cong elliptic $E$ bậc $3$. Nó có điểm $p$-adic với mọi $p$ (và điểm thực) nhưng không có điểm hữu tỉ (Selmer 1951) [cassels1962]. Đây là phần tử không tầm thường của $\mathrm{Sha}(E/\mathbb{Q})[3]$.
  3. $\mathrm{Sha}$ lớn tùy ý: Cassels chứng minh rằng $|\mathrm{Sha}(E/\mathbb{Q})[n]|$ có thể lớn tùy ý: với mọi $N$, tồn tại $E/\mathbb{Q}$ có $|\mathrm{Sha}[3]| > N$ [cassels1962]. Tương tự cho $\mathrm{Sha}[p]$ với $p$ bất kỳ.
  4. Kiểm nghiệm số: Đường cong 571a1 ($y^2 + y = x^3 - x^2 - 929x - 10595$, rank 0): phân tích số cho $|\mathrm{Sha}| = 4$, tức $\mathrm{Sha} \cong (\mathbb{Z}/2\mathbb{Z})^2$. BSD mạnh dự đoán chính xác con số này.

Ý nghĩa trực giác

$\mathrm{Sha}$ --- “ảo ảnh” vượt qua sàng cục bộ.
  • Nguyên lý cục bộ--toàn cục: Nếu một phương trình có nghiệm thực và $p$-adic với mọi $p$, nó “nên” có nghiệm hữu tỉ. Cho bậc 2 (phương trình bậc hai), điều này đúng (Hasse--Minkowski). Nhưng cho đường cong elliptic, không đúng: $\mathrm{Sha}$ đo chính xác sự thất bại.
  • “Ảo ảnh”: Phần tử $\mathrm{Sha}$ là torsor (đường cong “giống” $E$) có điểm ở mọi nơi cục bộ nhưng không có điểm toàn cục. Nó “trông giống” có nghiệm nhưng thực ra không có --- ảo ảnh hoàn hảo.
  • $|\mathrm{Sha}|$ luôn là bình phương hoàn hảo: Ghép đôi Cassels--Tate $\mathrm{Sha} \times \mathrm{Sha} \to \mathbb{Q}/\mathbb{Z}$ phản đối xứng, suy ra $|\mathrm{Sha}|$ (nếu hữu hạn) là bình phương. Đây là ràng buộc mạnh, chưa chứng minh đầy đủ nhưng đúng trong mọi trường hợp tính được [poonen-stoll1999].
  • Phỏng đoán: $\mathrm{Sha}(E/\mathbb{Q})$ hữu hạn cho mọi $E$ --- đây là phỏng đoán quan trọng, vẫn mở cho hạng $\geq 2$.

Liên hệ với giả thuyết Birch--Dyer

$\mathrm{Sha}$ trong BSD.
  • BSD mạnh: Hệ số hàng đầu của $L(E,s)$ tại $s = 1$:
    \[ \frac{L^{(r)}(E,1)}{r!} = \frac{|\mathrm{Sha}(E/\mathbb{Q})| \cdot \Omega_E \cdot \mathrm{Reg}_E \cdot \prod_p c_p}{|E(\mathbb{Q})_{\mathrm{tors}}|^2}. \]
    $|\mathrm{Sha}|$ xuất hiện ở tử --- nó đóng góp trực tiếp vào giá trị đặc biệt. Biết $|\mathrm{Sha}|$ cần thiết để kiểm nghiệm BSD mạnh.
  • Hữu hạn = cần thiết: BSD mạnh yêu cầu $\mathrm{Sha}$ hữu hạn (để $|\mathrm{Sha}|$ có nghĩa). Nếu $\mathrm{Sha}$ vô hạn, công thức vô nghĩa. Đây là lý do “$\mathrm{Sha}$ hữu hạn” được xem gần như là phần của phỏng đoán BSD.
  • Kết quả đã biết: $\mathrm{Sha}$ hữu hạn khi $\mathrm{rk} = 0$ (Kolyvagin + $L(E,1) \neq 0$) hoặc $\mathrm{rk} = 1$ (Kolyvagin + $L'(E,1) \neq 0$) [kolyvagin1988]. Cho hạng $\geq 2$: chưa chứng minh $\mathrm{Sha}$ hữu hạn cho bất kỳ $E$ nào.
  • “Sai số” của descent: $\mathrm{Sel}_n/\mathrm{im}(\delta) = \mathrm{Sha}[n]$. Descent tính Selmer nhưng không phân biệt được hạng và $\mathrm{Sha}$ --- đây là rào cản chính.
112 Torsor (Torsor (principal homogeneous space)) Ch.7 6

Định nghĩa

Định nghĩa (Torsor). Cho $E/\mathbb{Q}$ đường cong elliptic. Một torsor (torsor) (hay không gian thuần nhất chính, principal homogeneous space) cho $E$ trên $\mathbb{Q}$ là đa tạp đại số $C/\mathbb{Q}$ cùng với tác động:
\[ \mu: E \times C \to C, \quad (P, x) \mapsto P + x \]
(ký hiệu cộng) thỏa:
  1. Tự do: Nếu $P + x = x$ thì $P = O$ (chỉ phần tử đơn vị tác động tầm thường).
  2. Bắc cầu: Với mọi $x, y \in C(\bar{\mathbb{Q}})$, tồn tại duy nhất $P \in E(\bar{\mathbb{Q}})$ sao cho $P + x = y$.

Torsor $C$ gọi là tầm thường nếu $C(\mathbb{Q}) \neq \varnothing$ (có điểm hữu tỉ) --- khi đó $C \cong E$ (qua phép dịch).

Các lớp đẳng cấu torsor được phân loại bởi $H^1(G_{\mathbb{Q}}, E(\bar{\mathbb{Q}}))$:

\[ \{\text{torsor cho } E \text{ trên } \mathbb{Q}\} / {\cong} \;\xleftrightarrow{1:1}\; H^1(G_{\mathbb{Q}}, E(\bar{\mathbb{Q}})). \]
Lớp $0$ ứng với torsor tầm thường ($C = E$).

Ví dụ

Ví dụ (Torsor cụ thể).
  1. Torsor tầm thường: $E$ chính nó là torsor cho $E$ (tác động bởi phép cộng nhóm). Điểm $O \in E(\mathbb{Q})$ nên torsor tầm thường.
  2. Đường cong Selmer: $C: 3a^3 + 4b^3 + 5c^3 = 0$ trong $\mathbb{P}^2$ là torsor cho đường cong elliptic $E: x^3 + y^3 + 60z^3 = 0$. Tác động: $E$ tác động trên $C$ qua phép cộng nhóm trên $\bar{\mathbb{Q}}$. Nhưng $C(\mathbb{Q}) = \varnothing$ (Selmer 1951) --- torsor không tầm thường, đại diện phần tử $\neq 0$ trong $\mathrm{Sha}(E/\mathbb{Q})$.
  3. Twist bậc hai: Cho $E: y^2 = x^3 + ax + b$ và $d \in \mathbb{Q}^{\times}$. Twist $E^{(d)}: dy^2 = x^3 + ax + b$ là torsor cho... chính $E^{(d)}$ (không phải cho $E$!). Nhưng đường cong $C_d: y^2 = d(x^3 + ax + b)$ có thể xem như torsor cho $E$ theo nghĩa tổng quát hơn (qua 2-covering).
  4. 2-covering: Cho $E: y^2 = (x - e_1)(x - e_2)(x - e_3)$. Với $d_1 d_2 d_3 = 1$ ($d_i \in \mathbb{Q}^{\times}$), hệ:
    \[ d_1 u_1^2 - d_2 u_2^2 = e_2 - e_1, \quad d_1 u_1^2 - d_3 u_3^2 = e_3 - e_1 \]
    định nghĩa torsor bậc $2$ cho $E$. Giải hệ này trên $\mathbb{Q}$ tương đương tìm điểm $P \in E(\mathbb{Q})$ modulo $2E(\mathbb{Q})$ --- đây chính là 2-descent.

Ý nghĩa trực giác

Torsor --- “đường cong giống $E$ nhưng thiếu điểm gốc”.
  • Hình dung: Torsor $C$ “giống” $E$ ở mọi khía cạnh trừ một thứ: $C$ không có điểm gốc tự nhiên. Trên $\bar{\mathbb{Q}}$, $C \cong E$ (vì luôn tìm được điểm). Nhưng trên $\mathbb{Q}$, nếu $C$ không có điểm hữu tỉ, phép đẳng cấu “hỏng” --- ta không thể chọn gốc.
  • Tương tự đời thường: Hãy tưởng tượng một đường tròn (torsor cho nhóm quay $SO(2)$): mọi điểm “như nhau”, không điểm nào đặc biệt hơn điểm nào. Khi bạn chọn một điểm gốc (đánh dấu “12 giờ”), đường tròn trở thành nhóm. Torsor = “nhóm quên điểm gốc”.
  • $\mathrm{Sha}$ = torsor “ẩn”: Phần tử $\mathrm{Sha}$ là torsor có điểm $p$-adic (“nhìn qua kính $p$-adic thấy gốc”) nhưng không có điểm hữu tỉ (“không tìm được gốc toàn cục”).

Liên hệ với giả thuyết Birch--Dyer

Torsor trong BSD.
  • $\mathrm{Sha}$ = torsor vi phạm Hasse: Mỗi phần tử $\mathrm{Sha}(E/\mathbb{Q})$ tương ứng 1-1 với lớp đẳng cấu torsor cục bộ tầm thường (có điểm mọi nơi cục bộ) nhưng toàn cục không tầm thường ($C(\mathbb{Q}) = \varnothing$). Cỡ $|\mathrm{Sha}|$ đo “mức độ vi phạm nguyên lý cục bộ--toàn cục”.
  • Descent qua torsor: 2-descent = liệt kê torsor bậc $2$ (2-coverings) thỏa điều kiện cục bộ. Mỗi torsor giải được cho điểm $P \in E(\mathbb{Q})$ (mod $2E(\mathbb{Q})$) hoặc phần tử $\mathrm{Sha}[2]$.
  • Visualization: Torsor cho phép “nhìn thấy” phần tử $H^1$ --- thay vì cocycle trừu tượng $\sigma \mapsto \xi(\sigma)$, ta có đường cong $C$ cụ thể (hệ phương trình đa thức). Kiểm tra $C(\mathbb{Q}_p) \neq \varnothing$ bằng Hensel, kiểm tra $C(\mathbb{Q}) = \varnothing$ bằng descent bậc cao [silverman2009].
113 Nguyên lý Hasse (Hasse principle (local-global)) Ch.5 5

Định nghĩa

Định nghĩa (Nguyên lý Hasse). Nguyên lý Hasse (Hasse principle) (hay nguyên lý cục bộ--toàn cục) cho một lớp đa tạp $\mathcal{C}$ phát biểu rằng:

\centerline{$V \in \mathcal{C}$ có điểm hữu tỉ ($V(\mathbb{Q}) \neq \varnothing$) $\Leftrightarrow$ $V$ có điểm tại mọi nơi cục bộ ($V(\mathbb{Q}_v) \neq \varnothing$ $\forall v$).}

Chiều $\Rightarrow$ luôn đúng (tầm thường). Chiều $\Leftarrow$ là nội dung thực sự.

Thành công:

  • Định lý Hasse--Minkowski: Nguyên lý Hasse đúng cho dạng bậc hai: $\sum a_{ij} x_i x_j = 0$ có nghiệm hữu tỉ $\Leftrightarrow$ có nghiệm thực và $p$-adic $\forall p$ [serre1970].

Thất bại:

  • Cho đường cong elliptic (và tổng quát hơn, đa tạp Abel), nguyên lý Hasse thất bại: tồn tại torsor $C$ với $C(\mathbb{Q}_v) \neq \varnothing$ $\forall v$ nhưng $C(\mathbb{Q}) = \varnothing$.
  • Chướng ngại Brauer--Manin: Manin (1970) định nghĩa “chướng ngại” bằng nhóm Brauer $\mathrm{Br}(V)$, giải thích (phần lớn) sự thất bại.

Ví dụ

Ví dụ (Nguyên lý Hasse: thành công và thất bại).
  1. Thành công (bậc hai): $x^2 + y^2 = -1$. Không có nghiệm thực ($x^2 + y^2 \geq 0$). Vậy nguyên lý Hasse nói đúng: không có nghiệm cục bộ $\Rightarrow$ không có nghiệm hữu tỉ. Ngược lại: $x^2 + y^2 = 1$ có nghiệm thực và $p$-adic $\forall p$ $\Rightarrow$ có nghiệm hữu tỉ (hiển nhiên: $(1, 0)$).
  2. Thất bại (bậc ba, Selmer): $3x^3 + 4y^3 + 5z^3 = 0$. Phương trình này có nghiệm thực (hiển nhiên) và $p$-adic $\forall p$ (kiểm tra bằng Hensel). Nhưng không có nghiệm hữu tỉ $(x:y:z) \in \mathbb{P}^2(\mathbb{Q})$ --- chứng minh bởi Selmer (1951) dùng phương pháp descent.
  3. Thất bại (Lind--Reichardt): $2y^2 = x^4 - 17z^4$ có nghiệm cục bộ mọi nơi nhưng không có nghiệm hữu tỉ --- ví dụ “nhỏ nhất” của thất bại Hasse cho đường cong genus 1.
  4. Isogeny descent: Cho $E: y^2 = x^3 + x$. Twist $E^{(-1)}: y^2 = x^3 - x$. Torsor liên kết giữa hai đường cong này thỏa Hasse cục bộ nhưng có thể thất bại toàn cục --- đây là nguồn gốc của $\mathrm{Sha}$.

Ý nghĩa trực giác

Nguyên lý Hasse --- “kiểm tra địa phương đủ chưa?”.
  • Ý tưởng: Nếu bạn muốn biết phương trình có nghiệm hữu tỉ, hãy kiểm tra từng “địa phương”: nghiệm thực? nghiệm $2$-adic? $3$-adic? $5$-adic? ... Nếu mọi nơi đều OK, “chắc” là có nghiệm hữu tỉ. Cho bậc 2: chắc chắn. Cho bậc $\geq 3$: không chắc --- có “ảo ảnh cục bộ”.
  • Tương tự: Như kiểm tra sức khỏe: xét nghiệm máu OK, X-quang OK, siêu âm OK --- “chắc” là khỏe? Cho hầu hết bệnh: đúng. Nhưng có bệnh “ẩn” mà mọi xét nghiệm đều bình thường. $\mathrm{Sha}$ chính là “bệnh ẩn” của phương trình Diophantine.
  • $\mathrm{Sha}$ đo sự thất bại: $\mathrm{Sha}(E/\mathbb{Q}) = 0$ $\Leftrightarrow$ nguyên lý Hasse đúng cho mọi torsor của $E$. $|\mathrm{Sha}| > 1$ $\Leftrightarrow$ tồn tại torsor “ảo ảnh” --- vi phạm nguyên lý cục bộ--toàn cục.

Liên hệ với giả thuyết Birch--Dyer

Nguyên lý Hasse trong BSD.
  • $\mathrm{Sha}$ = chướng ngại Hasse: BSD mạnh nói $|\mathrm{Sha}|$ xuất hiện trong công thức giá trị đặc biệt $L^{(r)}(E,1)/r!$. Sự thất bại của nguyên lý Hasse (đo bởi $\mathrm{Sha}$) được “nhìn thấy” bởi hàm $L$ --- một mối liên hệ thần kỳ giữa số học và giải tích.
  • Selmer = Hasse cho torsor: Phần tử $\mathrm{Sel}_n$ = torsor bậc $n$ thỏa Hasse cục bộ (có điểm $v$-adic $\forall v$). $\mathrm{im}(\delta)$ = torsor thỏa cả Hasse toàn cục. $\mathrm{Sha}[n] = \mathrm{Sel}_n / \mathrm{im}(\delta)$ = phần thất bại.
  • Mục tiêu: Chứng minh $\mathrm{Sha}$ hữu hạn (tức sự thất bại Hasse “có giới hạn”) là bước thiết yếu trong chương trình BSD. Đã biết cho hạng $\leq 1$ [kolyvagin1988]. Mở cho hạng $\geq 2$.
114 Nhóm Weil–Châtelet (Weil–Châtelet group $\mathrm{WC}(E/K)$) Ch.7 7

Định nghĩa

Định nghĩa (Nhóm Weil--Châtelet). Cho $E/K$ đường cong elliptic trên trường $K$. Nhóm Weil--Châtelet (Weil--Châtelet group) là nhóm các lớp đẳng cấu torsor cho $E$ trên $K$:
\[ \mathrm{WC}(E/K) = H^1(G_K, E(\bar{K})) \]
với $G_K = \mathrm{Gal}(\bar{K}/K)$.

Phép cộng: Cho torsor $C_1, C_2$ cho $E$. Tổng $C_1 + C_2$ được xây dựng bởi “contracted product”: $C_1 \times^E C_2 = (C_1 \times C_2) / E$ (lấy thương bởi tác động đường chéo $P \cdot (x_1, x_2) = (P+x_1, -P+x_2)$).

Phần tử đơn vị: Lớp của $E$ chính nó (torsor tầm thường).

Nghịch đảo: $-[C]$ là torsor $C$ với tác động “đảo”: $P *' x = (-P) + x$.

Nhóm Tate--Shafarevich là nhóm con của $\mathrm{WC}$:

\[ \mathrm{Sha}(E/K) \subset \mathrm{WC}(E/K). \]

Ví dụ

Ví dụ (Nhóm Weil--Châtelet cục bộ và toàn cục).
  1. Trường hữu hạn: $K = \mathbb{F}_q$. Lang đã chứng minh $\mathrm{WC}(E/\mathbb{F}_q) = H^1(G_{\mathbb{F}_q}, E(\bar{\mathbb{F}}_q)) = 0$ [lang1983]. Lý do: mọi torsor trên trường hữu hạn có điểm (định lý Lang). Hệ quả: $\mathrm{Sha}$ là hiện tượng “chỉ xảy ra trên trường vô hạn”.
  2. Trường cục bộ $\mathbb{Q}_p$: $\mathrm{WC}(E/\mathbb{Q}_p) \cong \hat{H}^0(G_{\mathbb{Q}_p}, E) = E(\mathbb{Q}_p)/\mathrm{Norm}$ --- nhóm hữu hạn (đối ngẫu Tate cục bộ). Cỡ $|\mathrm{WC}(E/\mathbb{Q}_p)| = c_p \cdot [\text{phần liên thông}]$, liên hệ với số Tamagawa $c_p$.
  3. $K = \mathbb{Q}$: $\mathrm{WC}(E/\mathbb{Q})$ thường vô hạn (chứa $\mathbb{Q}^{\times}/(\mathbb{Q}^{\times})^n$ cho mọi $n$ qua các twist). Nhưng $\mathrm{Sha}(E/\mathbb{Q}) \subset \mathrm{WC}(E/\mathbb{Q})$ được phỏng đoán là hữu hạn.
  4. Phần $n$-xoắn: $\mathrm{WC}(E/K)[n] = H^1(G_K, E)[n]$ --- các torsor bậc $n$ (bị triệt tiêu bởi phép nhân $n$). Dãy Kummer cho: $\mathrm{WC}(E/K)[n] = H^1(G_K, E[n]) / (E(K)/nE(K))$ (phần “ngoài” ảnh Kummer).

Ý nghĩa trực giác

Weil--Châtelet --- “kho chứa mọi torsor”.
  • Hình dung: $\mathrm{WC}(E/K)$ là “kho” chứa tất cả cách “bẻ cong” $E$ thành đường cong khác (trên $K$) mà vẫn giữ cấu trúc tác động. Phần tử $0$ = $E$ nguyên bản. Phần tử khác $0$ = torsor “lệch” không quay về $E$ được.
  • WC lớn, $\mathrm{Sha}$ nhỏ: $\mathrm{WC}$ thường rất lớn (thậm chí vô hạn), nhưng phần “thú vị nhất” --- các torsor vượt qua sàng cục bộ --- tạo thành $\mathrm{Sha}$, và $\mathrm{Sha}$ được phỏng đoán hữu hạn.
  • Lịch sử: André Weil (1955) và François Châtelet nghiên cứu torsor một cách có hệ thống, dẫn đến nhóm mang tên hai người. Tate sau đó phát triển đối ngẫu ($\mathrm{Sha}$ là phần “tự đối ngẫu” của WC).

Liên hệ với giả thuyết Birch--Dyer

Weil--Châtelet trong BSD.
  • $\mathrm{Sha} \subset \mathrm{WC}$: Nhóm Tate--Shafarevich là “phần cục bộ tầm thường” của WC. Dãy chính xác:
    \[ 0 \to \mathrm{Sha}(E/\mathbb{Q}) \to \mathrm{WC}(E/\mathbb{Q}) \xrightarrow{\mathrm{loc}} \prod_v \mathrm{WC}(E/\mathbb{Q}_v). \]
    $\mathrm{Sha} = \ker(\mathrm{loc})$ --- torsor “vô hình” khi nhìn cục bộ.
  • Ghép đôi Cassels--Tate: Ghép đôi $\mathrm{Sha} \times \mathrm{Sha} \to \mathbb{Q}/\mathbb{Z}$ được xây dựng qua cấu trúc nhóm của WC và đối ngẫu cục bộ. Nó cho $|\mathrm{Sha}|$ là bình phương --- ràng buộc cần cho sự nhất quán của BSD mạnh.
  • Đối ngẫu Poitou--Tate: Dãy chính xác 9 thành phần Poitou--Tate liên hệ $\mathrm{WC}$ toàn cục, cục bộ, và đối ngẫu Pontryagin. Đây là công cụ chính để chặn $|\mathrm{Sha}|$ trong các chứng minh BSD phần (Kolyvagin, Skinner--Urban) [silverman2009].
115 Ghép đôi Cassels–Tate (Cassels–Tate pairing) Ch.5 8

Định nghĩa

Định nghĩa (Ghép đôi Cassels--Tate). Cho $E/\mathbb{Q}$ đường cong elliptic. Ghép đôi Cassels--Tate (Cassels--Tate pairing) là song tuyến tính:
\[ \langle\;,\;\rangle_{\mathrm{CT}}: \mathrm{Sha}(E/\mathbb{Q}) \times \mathrm{Sha}(E/\mathbb{Q}) \longrightarrow \mathbb{Q}/\mathbb{Z} \]
được xây dựng như sau (Cassels 1962, Tate 1963).

Cho $\xi, \eta \in \mathrm{Sha}(E/\mathbb{Q})$, đại diện bởi torsor $C_\xi$ và $C_\eta$.

  1. Chọn điểm $x_v \in C_\xi(\mathbb{Q}_v)$ tại mỗi nơi $v$ (tồn tại vì $\xi \in \mathrm{Sha}$).
  2. Dùng Tate pairing cục bộ: tính $\langle \xi_v, \eta_v \rangle_v \in \mathbb{Q}/\mathbb{Z}$ tại mỗi $v$.
  3. Tổng: $\langle \xi, \eta \rangle_{\mathrm{CT}} = \sum_v \langle \xi_v, \eta_v \rangle_v \in \mathbb{Q}/\mathbb{Z}$.

Tính chất chính:

  • Phản đối xứng: $\langle \xi, \eta \rangle = -\langle \eta, \xi \rangle$ (Cassels [cassels1962]).
  • Alternating: $\langle \xi, \xi \rangle = 0$ $\forall \xi$ (Poonen--Stoll, đúng nếu phần $p$-primary với $p$ lẻ; với $p = 2$ cần điều kiện thêm [poonen-stoll1999]).
  • Hạt nhân: Phỏng đoán: ghép đôi không suy biến (non-degenerate) trên phần chia hết của $\mathrm{Sha}$ --- tức $\langle \xi, \eta \rangle = 0$ $\forall \eta$ $\Rightarrow$ $\xi$ chia hết.

Ví dụ

Ví dụ (Ghép đôi Cassels--Tate trong thực tế).
  1. $\mathrm{Sha} = 0$: Nếu $\mathrm{Sha}(E/\mathbb{Q}) = 0$ (như phần lớn đường cong conductor nhỏ), ghép đôi tầm thường --- không có phần tử để ghép.
  2. $\mathrm{Sha} \cong (\mathbb{Z}/n\mathbb{Z})^2$: Nếu $\mathrm{Sha}[n] \cong (\mathbb{Z}/n\mathbb{Z})^2$, ghép đôi cho ánh xạ $(\mathbb{Z}/n\mathbb{Z})^2 \times (\mathbb{Z}/n\mathbb{Z})^2 \to \mathbb{Z}/n\mathbb{Z}$. Tính alternating buộc cỡ $|\mathrm{Sha}[n]|$ phải là bình phương: $|\mathrm{Sha}[n]| = n^{2k}$.
  3. Ví dụ số: Đường cong 571a1 có $\mathrm{Sha} \cong (\mathbb{Z}/2\mathbb{Z})^2$. Ghép đôi: $\langle \xi_1, \xi_2 \rangle = \tfrac{1}{2}$ cho hai phần tử sinh $\xi_1, \xi_2$. Ma trận ghép đôi: $\begin{pmatrix} 0 & 1/2 \\ -1/2 & 0 \end{pmatrix}$ (phản đối xứng, không suy biến).
  4. $\mathrm{Sha}$ bậc lẻ: Nếu $|\mathrm{Sha}[p]| = p$ (một phần tử sinh $\xi$), tính alternating cho $\langle \xi, \xi \rangle = 0$. Nhưng ghép đôi trên nhóm cỡ $p$ chỉ không suy biến khi $p^{2k}$ --- mâu thuẫn! Vậy $|\mathrm{Sha}[p]|$ không thể là $p$ --- phải là $1$ hoặc $p^2$ hoặc $p^4, \ldots$

Ý nghĩa trực giác

Cassels--Tate --- “sản phẩm vô hướng” trên $\mathrm{Sha}$.
  • Hình dung: Ghép đôi Cassels--Tate giống “sản phẩm vô hướng” (inner product) trên $\mathrm{Sha}$ --- nó đo “góc” giữa hai torsor “ảo ảnh”. Nhưng với giá trị trong $\mathbb{Q}/\mathbb{Z}$ (không phải $\mathbb{R}$), và phản đối xứng (không phải đối xứng).
  • Tại sao phản đối xứng? Vì $\mathrm{Sha}$ sống trong $H^1$ --- bậc lẻ --- và đối ngẫu Tate có tính chất liên quan đến dấu $(-1)^i$ ở bậc $i$. Ở bậc $1$: phản đối xứng.
  • Hệ quả bình phương: Trên nhóm Abel hữu hạn $A$ với ghép đôi alternating không suy biến $A \times A \to \mathbb{Q}/\mathbb{Z}$, tất yếu $|A| = m^2$ (bình phương). Lý do: $A \cong H \oplus H^{\vee}$ (tách thành hai nửa đối ngẫu), nên $|A| = |H|^2$.

Liên hệ với giả thuyết Birch--Dyer

Cassels--Tate trong BSD.
  • $|\mathrm{Sha}|$ = bình phương: Ghép đôi Cassels--Tate (nếu không suy biến) buộc $|\mathrm{Sha}|$ là bình phương hoàn hảo. BSD mạnh cần $|\mathrm{Sha}|$ hữu hạn --- ghép đôi cho ràng buộc thêm: $|\mathrm{Sha}| = 1, 4, 9, 16, 25, \ldots$ Đã kiểm nghiệm đúng cho mọi trường hợp tính được.
  • Kiểm nghiệm BSD mạnh: Khi tính $L^{(r)}(E,1)/r!$ bằng số và so với $\frac{|\mathrm{Sha}| \cdot \Omega \cdot \mathrm{Reg} \cdot \prod c_p}{|E_{\mathrm{tors}}|^2}$, giá trị $|\mathrm{Sha}|$ phải là bình phương --- đây là “reality check” quan trọng.
  • Không suy biến = phỏng đoán: Nếu ghép đôi suy biến, $|\mathrm{Sha}|$ vẫn có thể hữu hạn nhưng không nhất thiết bình phương. Phỏng đoán không suy biến (tương đương: phần chia hết của $\mathrm{Sha}$ bằng $0$, tức $\mathrm{Sha}$ hữu hạn) mạnh hơn phỏng đoán hữu hạn đơn thuần.
116 Phỏng đoán $\Sha$ hữu hạn (Finiteness of Sha conjecture) Ch.7 7

Định nghĩa

Giả thiết (Phỏng đoán hữu hạn của $\mathrm{Sha}$). Cho mọi đường cong elliptic $E/\mathbb{Q}$, nhóm Tate--Shafarevich $\mathrm{Sha}(E/\mathbb{Q})$ là hữu hạn.
Định nghĩa (Bối cảnh và trạng thái). Phỏng đoán này:
  • Được Tate và Shafarevich đề xuất độc lập (khoảng 1960).
  • điều kiện tiên quyết cho BSD mạnh: nếu $\mathrm{Sha}$ vô hạn, công thức $L^{(r)}(E,1)/r!$ vô nghĩa.
  • Vẫn mở trong trường hợp tổng quát.

Bảng tình trạng hiện tại:

Trường hợp Trạng thái Kết quả / Tác giả
$\mathrm{rk} = 0$, $L(E,1) \neq 0$ ✓ Đã chứng minh Kolyvagin (1988) [kolyvagin1988]
$\mathrm{rk} = 1$, $L'(E,1) \neq 0$ ✓ Đã chứng minh Kolyvagin (1988) [kolyvagin1988]
$\mathrm{rk} = 0$, CM ✓ Đã chứng minh Rubin (1991) [rubin1991]
$\mathrm{rk} \geq 2$ MỞ Chưa biết cho bất kỳ $E$ nào
Hạng giải tích $\geq 2$ MỞ Kể cả $\mathrm{ord}_{s=1} L(E,s) \geq 2$

Ví dụ

Ví dụ (Hữu hạn vs. tiềm năng vô hạn).
  1. $\mathrm{Sha}$ đã biết hữu hạn: Đường cong 37a1 ($y^2 + y = x^3 - x$, rank 1): $L'(E,1) \neq 0$, Kolyvagin $\Rightarrow$ $\mathrm{Sha}$ hữu hạn. Tính toán: $\mathrm{Sha} = 0$.
  2. $\mathrm{Sha}$ hữu hạn nhưng $\neq 0$: Đường cong 681b1 (rank 0, $L(E,1) \neq 0$): Kolyvagin $\Rightarrow$ $\mathrm{Sha}$ hữu hạn. Tính toán: $|\mathrm{Sha}| = 9$, tức $\mathrm{Sha} \cong (\mathbb{Z}/3\mathbb{Z})^2$.
  3. Rank 2 --- chưa biết: Đường cong 389a1 ($y^2 + y = x^3 + x^2 - 2x$, rank 2): $\mathrm{ord}_{s=1} L(E,s) = 2$. Tính toán số cho $|\mathrm{Sha}| = 1$ (nhưng chưa chứng minh hữu hạn!).
  4. $\mathrm{Sha}$ lớn tùy ý (nhưng hữu hạn?): Cassels chứng minh: $\forall N$, $\exists E/\mathbb{Q}$ với $|\mathrm{Sha}(E/\mathbb{Q})[3]| > N$. Nhưng $\mathrm{Sha}[3]$ lớn không mâu thuẫn hữu hạn --- chỉ cần $|\mathrm{Sha}| < \infty$.

Ý nghĩa trực giác

Tại sao $\mathrm{Sha}$ “nên” hữu hạn?.
  • Tương tự nhóm lớp: Nhóm lớp $\mathrm{Cl}(K)$ của trường số $K$ luôn hữu hạn (Minkowski). $\mathrm{Sha}$ là “nhóm lớp” cho đường cong elliptic --- “nên” hữu hạn theo tương tự. Nhưng chứng minh khó hơn nhiều vì không có “giới hạn Minkowski” cho $\mathrm{Sha}$.
  • “Số lượng ảo ảnh có hạn”: $\mathrm{Sha}$ = tập torsor “ảo ảnh” (có điểm cục bộ, không có toàn cục). Trực giác: “không thể có vô hạn ảo ảnh” --- vũ trụ số học “đủ cứng” để giới hạn chúng.
  • Rào cản hạng $\geq 2$: Khi $\mathrm{rk} \leq 1$, phương pháp Euler systems (Kolyvagin) chặn $|\mathrm{Sha}|$. Khi $\mathrm{rk} \geq 2$, chưa có “hệ thống Euler đủ mạnh” --- đây là rào cản kỹ thuật chính, không phải lý do tin $\mathrm{Sha}$ vô hạn.

Liên hệ với giả thuyết Birch--Dyer

$\mathrm{Sha}$ hữu hạn trong BSD.
  • Tiên quyết BSD mạnh: BSD mạnh phát biểu $|\mathrm{Sha}| \cdot \Omega \cdot \mathrm{Reg} \cdot \prod c_p / |E_{\mathrm{tors}}|^2 = L^{(r)}(E,1)/r!$. Vế phải là số thực xác định. Vế trái cần $|\mathrm{Sha}| < \infty$.
  • Hệ quả BSD yếu: Nếu BSD yếu đúng ($\mathrm{ord}_{s=1} L = r$) và $\mathrm{Sha}$ hữu hạn, nhiều hệ quả mạnh theo: phỏng đoán tính chẵn lẻ, regulator $> 0$, v.v.
  • Hướng hiện đại: Iwasawa theory cố chứng minh $\mathrm{Sha}[p^\infty]$ hữu hạn (cho từng $p$). Skinner--Urban [skinner-urban2014] chứng minh $\mathrm{Sha}[p^\infty]$ hữu hạn cho “hầu hết” $p$ khi $\mathrm{rk} \leq 1$. Mở rộng cho $\mathrm{rk} \geq 2$ là mục tiêu nghiên cứu tích cực.
117 Phỏng đoán $|\Sha|$ bình phương ($|\Sha|$ is a perfect square) Ch.7 7

Định nghĩa

Giả thiết ($|\mathrm{Sha}|$ là bình phương hoàn hảo). Nếu $\mathrm{Sha}(E/\mathbb{Q})$ hữu hạn, thì $|\mathrm{Sha}(E/\mathbb{Q})|$ là bình phương hoàn hảo: $|\mathrm{Sha}| = m^2$ cho $m \in \mathbb{Z}_{\geq 1}$.
Định nghĩa (Cơ sở và trạng thái).
  • Nguồn gốc: Hệ quả của ghép đôi Cassels--Tate. Nếu ghép đôi không suy biến và alternating trên $\mathrm{Sha}$ hữu hạn, lý thuyết đại số buộc $|\mathrm{Sha}|$ là bình phương (xem STT 115).
  • Đã chứng minh (phần $p$ lẻ): Với $p$ lẻ, Cassels [cassels1962] chứng minh ghép đôi alternating trên $\mathrm{Sha}[p^\infty]$, suy ra $|\mathrm{Sha}[p^\infty]|$ là bình phương.
  • Phần $p = 2$: Poonen--Stoll (1999) [poonen-stoll1999] chứng minh ghép đôi alternating trên $\mathrm{Sha}[2^\infty]$ dưới một số điều kiện. Trường hợp tổng quát: Fisher (2014) hoàn thành.
  • Kiểm nghiệm: Mọi giá trị $|\mathrm{Sha}|$ tính được (hàng triệu đường cong trong Cremona/LMFDB) đều là bình phương: $1, 4, 9, 16, 25, 36, 49, \ldots$

Ví dụ

Ví dụ ($|\mathrm{Sha}|$ bình phương trong thực tế).
  1. $|\mathrm{Sha}| = 1$: Phần lớn đường cong conductor nhỏ. Ví dụ: 37a1 ($\mathrm{Sha} = 0$, rank 1), 11a1 ($\mathrm{Sha} = 0$, rank 0).
  2. $|\mathrm{Sha}| = 4$: Đường cong 571a1 có $\mathrm{Sha} \cong (\mathbb{Z}/2\mathbb{Z})^2$, $|\mathrm{Sha}| = 4 = 2^2$. BSD mạnh dự đoán chính xác.
  3. $|\mathrm{Sha}| = 9$: Đường cong 681b1 có $\mathrm{Sha} \cong (\mathbb{Z}/3\mathbb{Z})^2$, $|\mathrm{Sha}| = 9 = 3^2$.
  4. $|\mathrm{Sha}| = 25$: Đường cong 2849a1 có $\mathrm{Sha} \cong (\mathbb{Z}/5\mathbb{Z})^2$, $|\mathrm{Sha}| = 25 = 5^2$.
  5. Kỷ lục: $|\mathrm{Sha}| = (2^5 \cdot 3)^2 = 9216$ cho một đường cong rank 0 (Fisher). Luôn bình phương!
  6. Tại sao không $|\mathrm{Sha}| = 2$ hay $3$? Nếu $|\mathrm{Sha}[p]| = p$ thì ghép đôi alternating trên $\mathbb{Z}/p\mathbb{Z}$ tất yếu suy biến (chỉ có $0$) --- mâu thuẫn với không suy biến. Vậy $|\mathrm{Sha}[p]| = p^{2k}$.

Ý nghĩa trực giác

$|\mathrm{Sha}|$ bình phương --- “đối xứng ẩn”.
  • Tương tự: Nhóm lớp $\mathrm{Cl}(K)$ không nhất thiết có cỡ bình phương. Nhưng $\mathrm{Sha}$ “đặc biệt hơn” --- nó tự đối ngẫu (qua Cassels--Tate), nên “tách” thành hai nửa đối xứng: $\mathrm{Sha} \cong H \oplus H$ (ít nhất cho phần $p$ lẻ). Do đó $|\mathrm{Sha}| = |H|^2$.
  • Hình dung: Mỗi torsor “ảo ảnh” $\xi \in \mathrm{Sha}$ có “bạn đời” $\eta$ sao cho $\langle \xi, \eta \rangle \neq 0$. Chúng đi thành cặp --- nên tổng số phải chẵn (khi tính theo đại số).
  • Kiểm tra thực nghiệm: Khi tính $|\mathrm{Sha}|$ từ BSD mạnh: $|\mathrm{Sha}| = L^{(r)}(E,1) \cdot |E_{\mathrm{tors}}|^2 / (r! \cdot \Omega \cdot \mathrm{Reg} \cdot \prod c_p)$. Nếu kết quả không bình phương $\Rightarrow$ hoặc tính sai, hoặc BSD sai. Trong thực tế, luôn ra bình phương --- bằng chứng mạnh cho BSD.

Liên hệ với giả thuyết Birch--Dyer

$|\mathrm{Sha}|$ bình phương trong BSD.
  • Nhất quán BSD mạnh: BSD mạnh dự đoán $|\mathrm{Sha}|$ cụ thể. Nếu giá trị không bình phương, BSD sai. Sự nhất quán (luôn bình phương trong kiểm nghiệm) là bằng chứng gián tiếp rất mạnh.
  • “Bình phương” không hiển nhiên: Từ công thức BSD, $|\mathrm{Sha}|$ được tính từ $L^{(r)}(E,1)/r!$ chia cho regulator, periods, Tamagawa --- không lý do tiên nghiệm nào buộc kết quả là bình phương. Việc nó luôn ra bình phương là “phép màu” số học.
  • Hệ quả thực hành: Khi tính $|\mathrm{Sha}|$ từ BSD, nếu ra số lẻ (như $2, 3, 5, 6$) $\Rightarrow$ biết ngay tính sai ở đâu đó --- regulator, period, hoặc Tamagawa. Tính chất bình phương là “bộ kiểm tra tự động” hữu ích.
118 Nhóm Selmer Bloch–Kato (Bloch–Kato Selmer group $H^1_f$) Ch.7 9

Định nghĩa

Định nghĩa (Nhóm Selmer Bloch--Kato). Cho $V$ là biểu diễn $p$-adic của $G_{\mathbb{Q}}$ (ví dụ $V = V_p(E) = T_p(E) \otimes \mathbb{Q}_p$ cho đường cong elliptic $E$). Nhóm Selmer Bloch--Kato (Bloch--Kato Selmer group) là:
\[ H^1_f(\mathbb{Q}, V) = \ker\!\left(H^1(G_{\mathbb{Q}}, V) \to \prod_{v} \frac{H^1(G_v, V)}{H^1_f(G_v, V)}\right) \]
trong đó điều kiện cục bộ $H^1_f(G_v, V)$ tại mỗi nơi $v$ được xác định:
  • Tại $v = p$: $H^1_f(G_p, V) = \ker(H^1(G_p, V) \to H^1(G_p, V \otimes B_{\mathrm{cris}}))$ --- phần tinh thể (crystalline), với $B_{\mathrm{cris}}$ là vành chu kỳ của Fontaine.
  • Tại $v \neq p$ (kể cả $v = \infty$): $H^1_f(G_v, V) = \ker(H^1(G_v, V) \to H^1(I_v, V))$ --- phần không phân nhánh, với $I_v$ là nhóm quán tính.

Khi $V = V_p(E)$, nhóm Selmer Bloch--Kato trùng với nhóm Selmer cổ điển:

\[ H^1_f(\mathbb{Q}, V_p(E)) \cong \mathrm{Sel}_{p^\infty}(E/\mathbb{Q}) \otimes \mathbb{Q}_p. \]
Nhưng khung Bloch--Kato tổng quát hơn --- áp dụng cho mọi motif, không chỉ đường cong elliptic.

Ví dụ

Ví dụ (Selmer Bloch--Kato cho các biểu diễn khác nhau).
  1. $V = \mathbb{Q}_p(1)$ (Tate twist): $H^1_f(\mathbb{Q}, \mathbb{Q}_p(1)) \cong \mathbb{Q}_p \otimes_\mathbb{Z} \mathcal{O}_\mathbb{Q}^{\times}$ --- tensor nhóm đơn vị. Vì $\mathcal{O}_\mathbb{Q}^{\times} = \{\pm 1\}$, ta được $H^1_f = 0$. Đây mã hóa sự thật: hàm zeta Riemann $\zeta(s)$ không triệt tiêu tại $s = 1$ ($\zeta$ có cực, không phải zero).
  2. $V = V_p(E)$ cho $E$ rank $0$: $H^1_f(\mathbb{Q}, V_p(E)) = 0$. Phỏng đoán Bloch--Kato: $\dim H^1_f = \mathrm{ord}_{s=1} L(E,s) = 0$. Đã chứng minh (Kato, Skinner--Urban).
  3. $V = V_p(E)$ cho $E$ rank $1$: $\dim H^1_f(\mathbb{Q}, V_p(E)) = 1$. Phỏng đoán Bloch--Kato: $\dim H^1_f = 1$. Đã chứng minh (Gross--Zagier + Kolyvagin).
  4. Dạng modular trọng lượng $k > 2$: Cho newform $f$ trọng lượng $k$, biểu diễn $V_f$ chiều $2$. $H^1_f(\mathbb{Q}, V_f)$ tổng quát hóa Selmer, và Bloch--Kato dự đoán $\dim H^1_f = \mathrm{ord}_{s=k/2} L(f,s)$.

Ý nghĩa trực giác

Bloch--Kato --- “Selmer cho mọi thứ”.
  • Ý tưởng: Selmer cổ điển chỉ áp dụng cho đường cong elliptic ($E[n]$, descent). Bloch--Kato thay thế bằng biểu diễn $p$-adic tổng quát $V$ --- và “điều kiện cục bộ” bằng lý thuyết Hodge $p$-adic (Fontaine).
  • Tại sao “crystalline”? Tại $v = p$, điều kiện “không phân nhánh” quá mạnh (trivially $0$ nhiều khi). Điều kiện crystalline yếu hơn: nó cho phép phân nhánh “tốt” (de Rham, crystalline) nhưng loại bỏ phần “xấu”. Đây là insight chính của Bloch--Kato.
  • Thống nhất BSD: Phỏng đoán Bloch--Kato: $\dim_{\mathbb{Q}_p} H^1_f(\mathbb{Q}, V) = \mathrm{ord}_{s = j} L(V^*(1-j), s)$ cho motif $V$ --- thống nhất BSD (cho $E$), phỏng đoán Birch--Tate (cho $K$-theory), phỏng đoán Beilinson (cho $L$-function tổng quát).

Liên hệ với giả thuyết Birch--Dyer

Bloch--Kato và BSD.
  • Tổng quát hóa BSD: Phỏng đoán Bloch--Kato (1990) bao hàm BSD như trường hợp đặc biệt: khi $V = V_p(E)$, phỏng đoán $\dim H^1_f = \mathrm{ord}_{s=1} L(E,s)$ chính là BSD yếu. Công thức hệ số hàng đầu tổng quát hóa BSD mạnh.
  • Công cụ chứng minh: Nhiều kết quả BSD hiện đại (Skinner--Urban, Kato) thực chất chứng minh phỏng đoán Bloch--Kato cho $V_p(E)$ --- dùng Iwasawa theory để chặn $\dim H^1_f$.
  • Vượt xa EC: Bloch--Kato áp dụng cho dạng modular trọng lượng cao, biểu diễn Artin, motif của đa tạp Abel, ... --- mở đường cho “BSD cho mọi hàm $L$”. Chương trình Langlands và Bloch--Kato cùng hướng đến cùng đích: hiểu giá trị đặc biệt $L$-function.
119 Thuật toán $2$-descent ($2$-descent algorithm) Ch.7 6

Định nghĩa

Định nghĩa (Thuật toán $2$-descent). Cho $E/\mathbb{Q}: y^2 = (x - e_1)(x - e_2)(x - e_3)$ với $e_i \in \mathbb{Q}$ phân biệt (đường cong có $E[2] \subset E(\mathbb{Q})$). Thuật toán $2$-descent ($2$-descent algorithm) tính $\mathrm{Sel}_2(E/\mathbb{Q})$ qua các bước:

Bước 1: Homogeneous spaces. Với mỗi bộ $(d_1, d_2, d_3)$ trong đó $d_i | \Delta_E$ (biệt thức) và $d_1 d_2 d_3 \in (\mathbb{Q}^{\times})^2$, xét hệ:

\[ C_{d_1,d_2,d_3}: \quad d_1 u_1^2 - d_2 u_2^2 = e_2 - e_1, \quad d_1 u_1^2 - d_3 u_3^2 = e_3 - e_1. \]

Bước 2: Kiểm tra cục bộ. Với mỗi bộ $(d_1, d_2, d_3)$, kiểm tra $C_{d_1,d_2,d_3}(\mathbb{Q}_v) \neq \varnothing$ tại mọi $v$ (bằng Hensel lifting cho $v$ hữu hạn, trực tiếp cho $v = \infty$). Bộ vượt qua sàng = phần tử $\mathrm{Sel}_2$.

Bước 3: Tìm điểm toàn cục. Với mỗi phần tử Selmer, thử tìm nghiệm hữu tỉ $(u_1, u_2, u_3) \in \mathbb{Q}^3$. Nếu tìm được: phần tử thuộc $\mathrm{im}(\delta)$ (cho điểm $P \in E(\mathbb{Q})$). Nếu không: phần tử thuộc $\mathrm{Sha}[2]$.

Kết quả: $\dim_{\mathbb{F}_2} \mathrm{Sel}_2 = r + 2 + \dim_{\mathbb{F}_2} \mathrm{Sha}[2]$ (với $r = \mathrm{rk}$ và $|E(\mathbb{Q})[2]| = 4$). Nếu $\mathrm{Sha}[2] = 0$: $r = \dim_{\mathbb{F}_2} \mathrm{Sel}_2 - 2$.

Ví dụ

Ví dụ ($2$-descent cho đường cong cụ thể).
  1. $E: y^2 = x(x-1)(x+1) = x^3 - x$: Gốc: $e_1 = -1, e_2 = 0, e_3 = 1$.

    Hệ: $d_1 u_1^2 - d_2 u_2^2 = 1$, $d_1 u_1^2 - d_3 u_3^2 = 2$, với $d_1 d_2 d_3 \in (\mathbb{Q}^{\times})^2$.

    Ước của $\Delta = 4$: $d_i \in \{\pm 1, \pm 2\}$. Kiểm tra: 4 bộ vượt qua sàng cục bộ.

    Kết quả: $\mathrm{Sel}_2 \cong (\mathbb{Z}/2\mathbb{Z})^2$. Vì $E(\mathbb{Q}) \cong \mathbb{Z}/2\mathbb{Z} \oplus \mathbb{Z}/2\mathbb{Z}$ (rank 0): $\dim \mathrm{Sel}_2 = 2 = 0 + 2 + 0$. Vậy $\mathrm{Sha}[2] = 0$ và $\mathrm{rk} = 0$.

  2. $E: y^2 = x^3 - 25x = x(x-5)(x+5)$: Gốc: $e_1 = -5, e_2 = 0, e_3 = 5$.

    Kiểm tra: 8 bộ vượt qua sàng cục bộ, tức $\dim_{\mathbb{F}_2} \mathrm{Sel}_2 = 3$.

    Tìm điểm: bộ $(d_1, d_2, d_3) = (1, -5, -5)$ cho $u_1^2 + 5u_2^2 = 5$ --- nghiệm $(u_1, u_2, u_3) = (0, 1, \ldots)$ cho điểm $P = (-4, 6) \in E(\mathbb{Q})$.

    Kết quả: $r = 3 - 2 - 0 = 1$ (nếu $\mathrm{Sha}[2] = 0$). Thực tế: $E(\mathbb{Q}) \cong \mathbb{Z}/2\mathbb{Z} \oplus \mathbb{Z}/2\mathbb{Z} \oplus \mathbb{Z}$, sinh bởi $(0,0), (5,0), (-4,6)$.

  3. Trường hợp $E[2] \not\subset E(\mathbb{Q})$: Khi $f(x) = x^3 + ax + b$ bất khả quy, dùng $2$-descent qua isogeny hoặc phiên bản trên $\mathbb{Q}(e_1)$ --- phức tạp hơn nhưng cùng nguyên lý [silverman2009].

Ý nghĩa trực giác

$2$-descent --- “sàng” tìm điểm hữu tỉ.
  • Ý tưởng: Thay vì tìm điểm $P \in E(\mathbb{Q})$ trực tiếp (khó!), ta “sàng” qua hệ phương trình phụ $C_d$ dễ hơn. Mỗi $C_d$ giải được $\Leftrightarrow$ có điểm modulo $2E(\mathbb{Q})$. Đếm số $C_d$ giải được cho biết hạng.
  • “Sàng cục bộ trước”: Kiểm tra $C_d(\mathbb{Q}_v) \neq \varnothing$ tại mỗi $v$ nhanh (Hensel). Phần lớn $C_d$ bị loại ở bước này. Chỉ còn lại $|\mathrm{Sel}_2|$ bộ --- số nhỏ, quản lý được.
  • Giới hạn: $2$-descent cho cận trên hạng: $r \leq \dim \mathrm{Sel}_2 - 2$. Nhưng nếu $\mathrm{Sha}[2] \neq 0$, cận không chặt. Cần descent bậc cao (4-descent, v.v.) hoặc chứng minh $\mathrm{Sha}[2] = 0$ bằng phương pháp khác.
  • Thuật toán cổ điển nhất: $2$-descent có từ thời Fermat (descent vô hạn). Phiên bản hiện đại (Birch--Swinnerton-Dyer 1963, Cremona 1990s) được cài đặt trong SageMath, Magma, PARI/GP.

Liên hệ với giả thuyết Birch--Dyer

$2$-descent trong BSD.
  • Công cụ chính: $2$-descent là phương pháp thực hành phổ biến nhất để tính hạng. Kết hợp với $L$-function (tính $\mathrm{ord}_{s=1} L(E,s)$ bằng số): nếu cận descent khớp với hạng giải tích $\Rightarrow$ kiểm nghiệm BSD yếu.
  • Bhargava--Shankar: Kết quả $\mathrm{avg}|\mathrm{Sel}_2| = 3$ [bhargava-shankar2015] được chứng minh bằng đếm orbit (geometry of numbers), nhưng diễn giải qua $2$-descent: trung bình mỗi đường cong có $3$ phần tử Selmer bậc $2$, tức hạng trung bình $\leq 3/2$.
  • 66.48%: Bhargava--Skinner--Zhang [bhargava-skinner-zhang2014] kết hợp: (1) $2$-descent/Selmer $\Rightarrow$ “hầu hết” có $\mathrm{rk} \leq 1$; (2) Skinner--Zhang $\Rightarrow$ khi $\mathrm{rk}_{\mathrm{an}} \leq 1$ thì BSD đúng. Kết quả: $\geq 66.48\%$ đường cong thỏa BSD.
120 $4$-descent ($4$-descent) Ch.7 7

Định nghĩa

Định nghĩa ($4$-descent). $4$-descent ($4$-descent) là phương pháp descent bậc $4$: tính (hoặc xấp xỉ) $\mathrm{Sel}_4(E/\mathbb{Q})$ --- nhóm Selmer cho phép nhân $[4]$.

Có hai cách tiếp cận:

Cách 1: Từ $2$-descent lên $4$-descent (lifting).

  • Đã có $\mathrm{Sel}_2(E/\mathbb{Q})$ (từ $2$-descent).
  • Với mỗi phần tử $\xi \in \mathrm{Sel}_2$ (torsor bậc $2$, “$2$-covering” $C_\xi$), kiểm tra: $\xi$ có nâng lên $\mathrm{Sel}_4$ không? Tức: tồn tại torsor bậc $4$ phủ $C_\xi$?
  • Chướng ngại nâng: nằm trong $\mathrm{Sha}[2]$ “thực” (phần bị triệt tiêu bởi $[2]$ trong $\mathrm{Sha}[4]$).

Cách 2: Trực tiếp (Fisher).

  • Tìm “$4$-coverings” --- các đường cong genus $1$ nhúng trong $\mathbb{P}^3$ (giao hai mặt bậc hai) cùng ánh xạ bậc $4$ xuống $E$.
  • Kiểm tra điều kiện cục bộ tại mọi nơi.
  • Fisher [fisher2008] phát triển thuật toán hiệu quả, cài đặt trong Magma.

Dãy chính xác: $0 \to E(\mathbb{Q})/4E(\mathbb{Q}) \to \mathrm{Sel}_4(E/\mathbb{Q}) \to \mathrm{Sha}(E/\mathbb{Q})[4] \to 0$.

Ví dụ

Ví dụ ($4$-descent phát hiện $\mathrm{Sha}$).
  1. Phát hiện $\mathrm{Sha}[4] \neq 0$: Đường cong $E$ với $2$-descent cho $\mathrm{Sel}_2 \cong (\mathbb{Z}/2\mathbb{Z})^4$ nhưng chỉ tìm được $2$ điểm độc lập (rank $= 2$). Suy ra $\mathrm{Sha}[2] \cong (\mathbb{Z}/2\mathbb{Z})^2$. Nhưng $4$-descent cho thấy $\mathrm{Sha}[4] = 0$ --- tức phần tử $\mathrm{Sha}[2]$ “chết” ở bậc $4$.
  2. $\mathrm{Sha}[4] \neq 0$ thực sự: Tồn tại đường cong $E$ với $\mathrm{Sha}[2] = 0$ nhưng $\mathrm{Sha}[4] \neq 0$ --- phần tử $\mathrm{Sha}$ bậc $4$ “vô hình” với $2$-descent. Chỉ $4$-descent (hoặc cao hơn) phát hiện được.
  3. Cải thiện cận hạng: $2$-descent cho $r \leq 5$. Sau $4$-descent: $r \leq 3$ (loại bớt “ảo ảnh” $\mathrm{Sha}[2]$). Kết hợp thêm tính toán chiều cao: xác nhận $r = 2$.

Ý nghĩa trực giác

$4$-descent --- “kính hiển vi mạnh hơn”.
  • Hình dung: $2$-descent nhìn $E(\mathbb{Q})/2E(\mathbb{Q})$ --- “độ phân giải thấp” (chỉ phân biệt mod $2$). $4$-descent nhìn $E(\mathbb{Q})/4E(\mathbb{Q})$ --- “độ phân giải cao hơn”, phân biệt tinh hơn.
  • Phát hiện $\mathrm{Sha}$: Phần tử $\mathrm{Sha}[2]$ mà “sống sót” qua $4$-descent (tức thuộc $\mathrm{Sha}[4]$) là $\mathrm{Sha}$ “thực sự bậc $\geq 4$”. Phần tử $\mathrm{Sha}[2]$ mà “chết” ở bậc $4$ (không nâng lên $\mathrm{Sha}[4]$) là “ảo ảnh tạm thời” --- descent cao hơn loại bỏ chúng.
  • Chi phí: $4$-descent phức tạp hơn $2$-descent nhiều (hệ phương trình trong $\mathbb{P}^3$ thay vì $\mathbb{P}^1$). Nhưng cho thông tin tốt hơn --- đánh đổi tính toán lấy độ chính xác.
  • Giới hạn: Có thể tiếp tục: $8$-descent, $16$-descent, ... Mỗi bậc cao hơn loại thêm “ảo ảnh”. Lý thuyết: $\bigcap_n \mathrm{Sel}_{2^n} = E(\mathbb{Q}) \otimes \mathbb{Z}_2$ (Selmer “hội tụ” về hạng thực).

Liên hệ với giả thuyết Birch--Dyer

$4$-descent trong BSD.
  • Cải thiện kiểm nghiệm: $4$-descent cung cấp cận hạng chặt hơn $2$-descent. Kết hợp với tính $\mathrm{ord}_{s=1} L(E,s)$: khớp $\Rightarrow$ bằng chứng mạnh hơn cho BSD yếu.
  • Tính $|\mathrm{Sha}|$ chính xác: Nếu $2$-descent cho $|\mathrm{Sha}[2]| = 4$ và $4$-descent cho $|\mathrm{Sha}[4]| = 4$, suy ra $\mathrm{Sha}[2^\infty] \cong (\mathbb{Z}/2\mathbb{Z})^2$ (phần $2$-primary xác định). Kết hợp descent bậc lẻ ($3$, $5$) cho $|\mathrm{Sha}|$ đầy đủ --- cần cho kiểm nghiệm BSD mạnh.
  • Fisher và LMFDB: Thuật toán $4$-descent của Fisher được dùng hệ thống trong Cremona's database và LMFDB để xác định $|\mathrm{Sha}|$ cho hàng triệu đường cong [fisher2008]. Mọi kết quả nhất quán với BSD mạnh.
121 Cơ sở dữ liệu Cremona (Cremona's database) Ch.6 3

Định nghĩa

Định nghĩa (Cơ sở dữ liệu Cremona). Cơ sở dữ liệu Cremona (Cremona's database) (hay Cremona's Elliptic Curve Database) là bảng hệ thống các đường cong elliptic trên $\mathbb{Q}$, sắp xếp theo conductor $N$, do John Cremona xây dựng và duy trì từ thập niên 1990.

Nội dung: Với mỗi đường cong $E/\mathbb{Q}$ (lên đến đẳng cấu trên $\mathbb{Q}$), cơ sở dữ liệu lưu:

  • Phương trình Weierstrass tối thiểu toàn cục.
  • Conductor $N_E$, biệt thức $\Delta$, $j$-bất biến.
  • Hạng $r = \mathrm{rk}(E(\mathbb{Q}))$ và các điểm sinh (generators).
  • Nhóm xoắn $E(\mathbb{Q})_{\mathrm{tors}}$.
  • Các bất biến BSD: $\Omega_E$, $\mathrm{Reg}_E$, $c_p$ (Tamagawa), $|\mathrm{Sha}_{\mathrm{an}}|$ (từ BSD mạnh).
  • Dấu gốc $w(E)$, loại rút gọn tại mỗi $p | N$.

Phạm vi: Tính đến 2023, cơ sở dữ liệu chứa mọi đường cong elliptic trên $\mathbb{Q}$ có conductor $N \leq 500{,}000$ --- hơn 3 triệu lớp đẳng cấu.

Ký hiệu: Mỗi đường cong có nhãn dạng Na# (ví dụ: 37a1, 11a1, 389a1), trong đó $N$ là conductor, ký tự là lớp đẳng cấu, số cuối là thứ tự trong lớp.

Ví dụ

Ví dụ (Tra cứu trong Cremona's database).
  1. 11a1 (conductor nhỏ nhất): $y^2 + y = x^3 - x^2 - 10x - 20$. Rank $0$, $E(\mathbb{Q}) = \mathbb{Z}/5\mathbb{Z}$, $\Omega = 1.269209\ldots$, $|\mathrm{Sha}| = 1$, $c_{11} = 5$.
  2. 37a1 (rank 1 nhỏ nhất): $y^2 + y = x^3 - x$. Rank $1$, sinh bởi $(0, 0)$, $\mathrm{Reg} = 0.051\ldots$, $|\mathrm{Sha}| = 1$, $c_{37} = 1$.
  3. 389a1 (rank 2 nhỏ nhất): $y^2 + y = x^3 + x^2 - 2x$. Rank $2$, sinh bởi $(0,0)$ và $(-1,1)$. $|\mathrm{Sha}_{\mathrm{an}}| = 1$.
  4. 571a1 ($\mathrm{Sha} \neq 0$): $y^2 + y = x^3 - x^2 - 929x - 10595$. Rank $0$, $|\mathrm{Sha}_{\mathrm{an}}| = 4$ ($\mathrm{Sha} \cong (\mathbb{Z}/2\mathbb{Z})^2$). BSD mạnh kiểm nghiệm chính xác.

Ý nghĩa trực giác

Cremona --- “bảng tuần hoàn” của đường cong elliptic.
  • Hình dung: Như bảng tuần hoàn liệt kê mọi nguyên tố hóa học, Cremona liệt kê mọi đường cong elliptic (theo conductor). Conductor càng lớn $\leftrightarrow$ “nguyên tố nặng hơn” --- phức tạp hơn nhưng tuân cùng quy luật.
  • Tại sao quan trọng? Trước Cremona, kiểm nghiệm BSD cho từng đường cong riêng lẻ. Với database: kiểm nghiệm hệ thống cho hàng triệu đường cong --- phát hiện pattern, tìm counterexample (chưa tìm thấy!), xác nhận phỏng đoán.
  • Thuật toán: Cremona dùng modular symbols + 2-descent + chiều cao để tính mọi bất biến. Phần mềm eclib (C++) và tích hợp trong SageMath.

Liên hệ với giả thuyết Birch--Dyer

Cremona trong BSD.
  • Kiểm nghiệm hệ thống: Mọi đường cong trong database đã kiểm nghiệm BSD yếu ($\mathrm{ord}_{s=1} L(E,s) = \mathrm{rk}$) và BSD mạnh (công thức hệ số hàng đầu) --- tất cả nhất quán, không phản ví dụ nào.
  • Phát hiện $\mathrm{Sha}$: Database cho phép tìm đường cong có $|\mathrm{Sha}| > 1$ một cách hệ thống. Ví dụ: tìm mọi $E$ conductor $\leq 500{,}000$ có $|\mathrm{Sha}_{\mathrm{an}}| \geq 4$.
  • Thống kê Bhargava: Kết quả $\mathrm{avg}|\mathrm{Sel}_2| = 3$ của Bhargava--Shankar được kiểm nghiệm trên database Cremona --- thống kê thực tế khớp hoàn hảo với lý thuyết [bhargava-shankar2015].
122 LMFDB (L-Functions and Modular Forms Database) Ch.6 3

Định nghĩa

Định nghĩa (LMFDB). LMFDB (L-Functions and Modular Forms Database) (https://www.lmfdb.org) là cơ sở dữ liệu trực tuyến quy mô lớn, tổng hợp các đối tượng số học và mối liên hệ giữa chúng:
  • Đường cong elliptic: Bao gồm toàn bộ Cremona's database + mở rộng (conductor lớn hơn, trên các trường số khác $\mathbb{Q}$).
  • Dạng modular: Newforms mọi trọng lượng, mọi mức (level), hệ số Fourier, tích Petersson, biểu diễn Galois.
  • Hàm $L$: Hàm $L$ cho đường cong elliptic, dạng modular, đặc trưng Dirichlet, dạng Maass, ... với zero tính sẵn.
  • Trường số: Phân biệt, nhóm lớp, đơn vị, nhóm Galois.
  • Liên kết: LMFDB kết nối đối tượng: “đường cong $E$ $\leftrightarrow$ newform $f_E$ $\leftrightarrow$ hàm $L(E,s)$ $\leftrightarrow$ biểu diễn Galois $\rho_{E,\ell}$” --- thể hiện các tương ứng Langlands.

LMFDB là dự án cộng đồng quốc tế, bắt đầu khoảng 2007, với hàng trăm nhà toán học đóng góp.

Ví dụ

Ví dụ (Sử dụng LMFDB).
  1. Tra cứu 37a1: Trên LMFDB, gõ “37.a1” hoặc “37a1”. Kết quả: phương trình, hạng, nhóm xoắn, hàm $L$, newform tương ứng, biểu diễn Galois mod $\ell$, ảnh Galois, ... tất cả trên một trang.
  2. Tìm newform: Newform tương ứng với 37a1 là $f \in S_2(\Gamma_0(37))$ --- dạng cusp trọng lượng $2$, mức $37$. LMFDB cho hệ số: $a_1 = 1, a_2 = -2, a_3 = -3, a_4 = 2, a_5 = -2, \ldots$ Khớp hoàn toàn với $a_p(E) = p + 1 - |E(\mathbb{F}_p)|$ (định lý modularity).
  3. Kiểm tra BSD: Trang LMFDB cho 37a1 hiện: $L(E,1) = 0$ (bậc triệt tiêu $= 1 = \mathrm{rk}$), $L'(E,1)/\Omega \cdot \mathrm{Reg} = 1/1$ (BSD mạnh khớp với $|\mathrm{Sha}| = 1$).
  4. Thống kê: LMFDB cung cấp thống kê: phân bố hạng, phân bố $|\mathrm{Sha}|$, phân bố Tamagawa --- dữ liệu cho nghiên cứu Bhargava-type.

Ý nghĩa trực giác

LMFDB --- “Google Maps” của lý thuyết số.
  • Hình dung: Như Google Maps cho bản đồ --- LMFDB cho “bản đồ” lý thuyết số. Muốn biết đường cong $E$ liên hệ với dạng modular nào, hàm $L$ nào, biểu diễn Galois nào? Tra LMFDB --- tất cả được kết nối.
  • Triết lý Langlands: Chương trình Langlands dự đoán tương ứng giữa “đối tượng số học” (đường cong, trường số, biểu diễn Galois) và “đối tượng giải tích” (dạng tự đẳng cấu, hàm $L$). LMFDB là hiện thực hóa tính toán của triết lý này.
  • Mở và tái tạo: Mọi dữ liệu LMFDB miễn phí, mã nguồn mở. Các tính toán có thể tái tạo --- tiêu chuẩn vàng cho toán học tính toán.

Liên hệ với giả thuyết Birch--Dyer

LMFDB trong BSD.
  • Kiểm nghiệm quy mô lớn: LMFDB cho phép kiểm nghiệm BSD (yếu và mạnh) cho hàng triệu đường cong --- bằng chứng thực nghiệm mạnh nhất cho phỏng đoán.
  • Kết nối modularity: Với mỗi $E$ conductor $N$, LMFDB hiện newform $f_E \in S_2(\Gamma_0(N))$ tương ứng --- minh họa định lý modularity (Wiles) [wiles1995].
  • Phát hiện pattern: Phân tích dữ liệu LMFDB giúp phát hiện pattern mới: ví dụ, phân bố hạng gợi ý phỏng đoán Goldfeld (50% rank 0, 50% rank 1), heuristic PPVW (hạng $\leq 21$), v.v.
  • Công cụ thiết yếu: Nghiên cứu BSD hiện đại không thể thiếu LMFDB --- từ tìm ví dụ, kiểm tra phỏng đoán, đến gợi ý hướng chứng minh mới.
123 Nhóm modular (Modular group $\mathrm{SL}_2(\mathbb{Z})$) Ch.8 4

Định nghĩa

Định nghĩa (Nhóm modular). Nhóm modular (modular group) là nhóm các ma trận $2 \times 2$ nguyên có định thức $1$:
\[ \mathrm{SL}_2(\mathbb{Z}) = \left\{ \begin{pmatrix} a & b \\ c & d \end{pmatrix} : a,b,c,d \in \mathbb{Z}, \; ad - bc = 1 \right\}. \]

$\mathrm{SL}_2(\mathbb{Z})$ tác động trên nửa mặt phẳng trên $\mathcal{H} = \{\tau \in \mathbb{C} : \mathrm{Im}(\tau) > 0\}$ bởi biến đổi Möbius:

\[ \gamma \cdot \tau = \frac{a\tau + b}{c\tau + d}, \quad \gamma = \begin{pmatrix} a & b \\ c & d \end{pmatrix}. \]

Phần tử sinh: $\mathrm{SL}_2(\mathbb{Z})$ được sinh bởi hai ma trận:

\[ S = \begin{pmatrix} 0 & -1 \\ 1 & 0 \end{pmatrix} \;(\tau \mapsto -1/\tau), \quad T = \begin{pmatrix} 1 & 1 \\ 0 & 1 \end{pmatrix} \;(\tau \mapsto \tau + 1). \]

Nhóm con đồng dư: Với $N \geq 1$, các nhóm con quan trọng:

  • $\Gamma_0(N) = \left\{ \begin{pmatrix} a & b \\ c & d \end{pmatrix} \in \mathrm{SL}_2(\mathbb{Z}) : N | c \right\}$ --- nhóm con mức $N$.
  • $\Gamma_1(N) = \left\{ \begin{pmatrix} a & b \\ c & d \end{pmatrix} \in \mathrm{SL}_2(\mathbb{Z}) : N | c, \; a \equiv d \equiv 1 \pmod{N} \right\}$.

Ví dụ

Ví dụ (Nhóm modular và tác động).
  1. $S$ và $T$ tác động: $S: \tau \mapsto -1/\tau$ (nghịch đảo + đảo dấu). $T: \tau \mapsto \tau + 1$ (dịch ngang). Miền cơ bản: $\mathcal{F} = \{\tau \in \mathcal{H} : |\tau| \geq 1, \; -1/2 \leq \mathrm{Re}(\tau) \leq 1/2\}$ --- hình “mũi tên” quen thuộc.
  2. Chỉ số: $[\mathrm{SL}_2(\mathbb{Z}) : \Gamma_0(N)] = N \prod_{p | N} (1 + 1/p)$. Ví dụ: $[\mathrm{SL}_2(\mathbb{Z}) : \Gamma_0(11)] = 12$, $[\mathrm{SL}_2(\mathbb{Z}) : \Gamma_0(37)] = 38$.
  3. Đường cong modular: $Y_0(N) = \Gamma_0(N) \backslash \mathcal{H}$ là đường cong (mặt Riemann không compact). Compact hóa: $X_0(N) = \Gamma_0(N) \backslash (\mathcal{H} \cup \mathbb{P}^1(\mathbb{Q}))$ thêm “cusps” (điểm $\infty$, $0$, ...). Genus $g(X_0(N))$ tính được: $g(X_0(11)) = 1$, $g(X_0(37)) = 2$.
  4. $X_0(11)$ là đường cong elliptic: $X_0(11)$ có genus $1$ và điểm hữu tỉ (cusp $\infty$) --- vậy $X_0(11)$ chính là đường cong elliptic! Thực tế: $X_0(11) \cong$ 11a1 ($y^2 + y = x^3 - x^2 - 10x - 20$).

Ý nghĩa trực giác

$\mathrm{SL}_2(\mathbb{Z})$ --- “nhóm đối xứng” của lưới.
  • Hình dung: Mỗi $\tau \in \mathcal{H}$ xác định lưới $\Lambda_\tau = \mathbb{Z} + \mathbb{Z}\tau$ trong $\mathbb{C}$. Hai lưới “giống nhau” (liên hệ bởi phép đổi cơ sở) $\Leftrightarrow$ $\tau$ và $\tau'$ cùng quỹ đạo dưới $\mathrm{SL}_2(\mathbb{Z})$. Vậy $\mathrm{SL}_2(\mathbb{Z}) \backslash \mathcal{H}$ = không gian mọi lưới (lên đến tỉ lệ).
  • Lưới $\leftrightarrow$ đường cong elliptic: Mỗi lưới $\Lambda$ cho torus $\mathbb{C}/\Lambda$ --- đường cong elliptic trên $\mathbb{C}$. Vậy $\mathrm{SL}_2(\mathbb{Z}) \backslash \mathcal{H}$ là “không gian moduli” --- không gian phân loại mọi đường cong elliptic trên $\mathbb{C}$.
  • $\Gamma_0(N)$: Thêm “cấu trúc mức $N$” --- đánh dấu nhóm con cyclic bậc $N$ trong $E[N]$. $\Gamma_0(N) \backslash \mathcal{H}$ phân loại các cặp $(E, C_N)$ với $C_N \subset E[N]$ cyclic bậc $N$.

Liên hệ với giả thuyết Birch--Dyer

Nhóm modular trong BSD.
  • Nền tảng modularity: Dạng modular sống trên $\Gamma_0(N) \backslash \mathcal{H}$. Định lý modularity (Wiles): mọi $E/\mathbb{Q}$ conductor $N$ tương ứng với newform $f_E \in S_2(\Gamma_0(N))$. Không có $\mathrm{SL}_2(\mathbb{Z})$ và nhóm con đồng dư $\Gamma_0(N)$, không phát biểu được modularity.
  • Ánh xạ modular: $X_0(N) \to E$ (surjection từ đường cong modular lên $E$) --- “nhìn thấy” $E$ bên trong $X_0(N)$. Điểm Heegner trên $X_0(N)$ ánh xạ thành điểm trên $E$ --- cốt lõi của Gross--Zagier [gross-zagier1986].
  • Bậc modular: $\deg(X_0(N) \to E)$ = bậc modular --- xuất hiện trong các công thức liên quan BSD.
124 Dạng modular (Modular form) Ch.5 6

Định nghĩa

Định nghĩa (Dạng modular). Dạng modular (modular form) trọng lượng $k$ cho nhóm con đồng dư $\Gamma \subset \mathrm{SL}_2(\mathbb{Z})$ là hàm giải tích $f: \mathcal{H} \to \mathbb{C}$ thỏa:
  1. Tính modular: Với mọi $\gamma = \begin{pmatrix} a & b \\ c & d \end{pmatrix} \in \Gamma$:
    \[ f\!\left(\frac{a\tau + b}{c\tau + d}\right) = (c\tau + d)^k \, f(\tau). \]
  2. Giải tích tại cusps: $f$ giải tích (holomorphic) trên $\mathcal{H}$ và tại mọi cusp.

Không gian dạng modular trọng lượng $k$ cho $\Gamma_0(N)$: $M_k(\Gamma_0(N))$.

Vì $T = \begin{pmatrix} 1 & 1 \\ 0 & 1 \end{pmatrix} \in \Gamma_0(N)$, tính modular cho $f(\tau + 1) = f(\tau)$, nên $f$ có khai triển Fourier (hay $q$-expansion, $q = e^{2\pi i \tau}$):

\[ f(\tau) = \sum_{n=0}^{\infty} a_n q^n, \quad a_n \in \mathbb{C}. \]
Nếu $a_0 = 0$: $f$ là dạng cusp (cusp form). Ký hiệu: $S_k(\Gamma_0(N))$.

Ví dụ

Ví dụ (Các dạng modular cổ điển).
  1. Chuỗi Eisenstein $G_k(\tau)$ (trọng lượng $k \geq 4$, cho $\mathrm{SL}_2(\mathbb{Z})$):
    \[ G_k(\tau) = \sum_{\substack{(m,n) \in \mathbb{Z}^2 \\ (m,n) \neq (0,0)}} \frac{1}{(m\tau + n)^k}. \]
    Là dạng modular (không phải cusp form vì $a_0 \neq 0$).
  2. Hàm Delta Ramanujan (trọng lượng $12$, cho $\mathrm{SL}_2(\mathbb{Z})$):
    \[ \Delta(\tau) = q \prod_{n=1}^{\infty} (1 - q^n)^{24} = \sum_{n=1}^{\infty} \tau(n) q^n \]
    với $\tau(n)$ là hàm Ramanujan. Đây là cusp form duy nhất (lên đến hằng số) trong $S_{12}(\mathrm{SL}_2(\mathbb{Z}))$.
  3. $S_2(\Gamma_0(11))$: Không gian $1$ chiều, sinh bởi $f_{11a1}(\tau) = q - 2q^2 - q^3 + 2q^4 + q^5 + \cdots$ Hệ số $a_p = p + 1 - |E_{11a1}(\mathbb{F}_p)|$ cho đường cong 11a1.
  4. $S_2(\Gamma_0(37))$: Không gian $2$ chiều, chứa $2$ newforms: $f_{37a1}$ và $f_{37b1}$, tương ứng $2$ lớp đẳng cấu đường cong elliptic conductor $37$.

Ý nghĩa trực giác

Dạng modular --- “hàm siêu đối xứng” trên nửa mặt phẳng.
  • Hình dung: Hàm modular là hàm trên “không gian lưới” $\mathcal{H}$, biến đổi “đẹp” (nhân $(c\tau+d)^k$) khi đổi cơ sở lưới. Trọng lượng $k$ = “mức độ xoắn” khi biến đổi.
  • Tại sao $q$-expansion? Dạng modular tuần hoàn theo $\tau \mapsto \tau + 1$, nên khai triển Fourier trong $q = e^{2\pi i \tau}$. Hệ số Fourier $a_n$ mã hóa thông tin số học cực kỳ phong phú.
  • “Ít nhưng mạnh”: $\dim S_k(\Gamma_0(N))$ hữu hạn (tính bằng công thức Riemann--Roch). Số ít hàm thỏa đồng thời “giải tích + modular” --- ràng buộc mạnh làm cho hệ số $a_n$ chứa thông tin sâu.

Liên hệ với giả thuyết Birch--Dyer

Dạng modular trong BSD.
  • Modularity = nền tảng: Định lý modularity: mọi $E/\mathbb{Q}$ conductor $N$ $\Leftrightarrow$ newform $f_E \in S_2(\Gamma_0(N))$ với $L(E,s) = L(f_E, s)$ [wiles1995]. Hệ quả: $L(E,s)$ có thác triển giải tích (từ tính modular của $f_E$) --- tiên quyết để nói “$L(E,1)$”.
  • Hệ số = đếm điểm: $a_p(f_E) = a_p(E) = p + 1 - |E(\mathbb{F}_p)|$. Hàm $L$: $L(E,s) = \sum a_n n^{-s}$. Dạng modular “biết” bao nhiêu điểm trên mỗi $\mathbb{F}_p$.
  • Trọng lượng $2$: Dạng modular trọng lượng $2$ tương ứng đường cong elliptic. Trọng lượng $> 2$ tương ứng “motif” tổng quát hơn --- Bloch--Kato tổng quát hóa BSD cho mọi trọng lượng.
125 Dạng cusp (Cusp form) Ch.8 6

Định nghĩa

Định nghĩa (Dạng cusp). Dạng cusp (cusp form) trọng lượng $k$ cho $\Gamma_0(N)$ là dạng modular triệt tiêu tại mọi cusp. Cụ thể: $f \in S_k(\Gamma_0(N))$ nếu $f \in M_k(\Gamma_0(N))$ và:
\[ a_0(\gamma \cdot f) = 0 \quad \forall \gamma \in \mathrm{SL}_2(\mathbb{Z}), \]
tức hệ số hằng trong $q$-expansion tại mọi cusp bằng $0$.

Tương đương: $f(\tau) \to 0$ khi $\tau$ tiến đến bất kỳ cusp nào ($\mathrm{Im}(\tau) \to \infty$ hoặc $\tau \to$ số hữu tỉ).

Phân tích: $M_k(\Gamma_0(N)) = S_k(\Gamma_0(N)) \oplus \mathcal{E}_k(\Gamma_0(N))$, trong đó $\mathcal{E}_k$ là không gian Eisenstein (sinh bởi chuỗi Eisenstein). Dạng cusp là phần “thú vị” --- phần bổ sung Eisenstein.

Công thức chiều ($k \geq 2$, $N$ squarefree):

\[ \dim S_k(\Gamma_0(N)) = (k-1) \cdot \frac{N}{12} \prod_{p|N}\left(1 + \frac{1}{p}\right) + O(\text{correction}). \]
Cho $k = 2$: $\dim S_2(\Gamma_0(N)) = g(X_0(N))$ = genus đường cong modular.

Ví dụ

Ví dụ (Dạng cusp cụ thể).
  1. $S_2(\Gamma_0(11))$: $\dim = 1$ (genus $X_0(11) = 1$). Sinh bởi:
    \[ f = q - 2q^2 - q^3 + 2q^4 + q^5 + 2q^6 - 2q^7 + \cdots = \eta(\tau)^2 \eta(11\tau)^2 \]
    với $\eta(\tau) = q^{1/24} \prod_{n \geq 1} (1 - q^n)$ là hàm eta Dedekind. Đây tương ứng đường cong 11a1.
  2. $S_{12}(\mathrm{SL}_2(\mathbb{Z}))$: $\dim = 1$. Sinh bởi $\Delta(\tau) = q - 24q^2 + 252q^3 - \cdots$ Hàm $\tau(n)$ (Ramanujan) thỏa: $|\tau(p)| \leq 2p^{11/2}$ (phỏng đoán Ramanujan, chứng minh bởi Deligne 1974 [deligne1974]).
  3. $S_2(\Gamma_0(1)) = 0$: Không có dạng cusp trọng lượng $2$ cho $\mathrm{SL}_2(\mathbb{Z})$ (genus $X_0(1) = 0$). Đường cong elliptic cần conductor $N \geq 11$.
  4. $\dim S_2(\Gamma_0(37)) = 2$: Hai newforms = hai lớp đẳng cấu đường cong elliptic conductor $37$: 37a và 37b.

Ý nghĩa trực giác

Dạng cusp --- hàm “triệt tiêu ở vô cực”.
  • Hình dung: Cusps = “đỉnh” của miền cơ bản (các điểm $\tau = i\infty$ và số hữu tỉ). Dạng cusp “tắt” tại mọi đỉnh --- giống sóng đứng triệt tiêu ở biên. Chuỗi Eisenstein thì “không tắt” --- như sóng đều.
  • Tại sao “thú vị hơn”? Chuỗi Eisenstein có hệ số Fourier “tầm thường” (hàm ước số, số Bernoulli). Dạng cusp có hệ số “phức tạp” (hàm Ramanujan $\tau(n)$, hệ số $a_p(E)$) --- chứa thông tin số học sâu.
  • Đếm điểm: Mỗi newform trong $S_2(\Gamma_0(N))$ tương ứng một lớp đẳng cấu đường cong elliptic conductor $N$ (modularity). Số newforms = số lớp đẳng cấu --- “dạng cusp đếm đường cong”.

Liên hệ với giả thuyết Birch--Dyer

Dạng cusp trong BSD.
  • $f_E \in S_2(\Gamma_0(N))$: Mỗi $E/\mathbb{Q}$ tương ứng duy nhất một newform cusp trọng lượng $2$. Hàm $L(E,s) = L(f_E, s) = \sum a_n(f_E) n^{-s}$ --- hàm $L$ trong BSD chính là hàm $L$ của dạng cusp.
  • Thác triển: Dạng cusp cho tích phân $\Lambda(f,s) = \int_0^{\infty} f(iy) y^{s-1} dy$ = hàm $L$ hoàn chỉnh. Phương trình hàm $\Lambda(f, s) = w \Lambda(f, 2-s)$ với $w = w(E)$ (dấu gốc) --- tiên quyết cho BSD.
  • Tích Petersson: $\langle f_E, f_E \rangle = \int_{\Gamma_0(N) \backslash \mathcal{H}} |f_E(\tau)|^2 y^2 \frac{dx \, dy}{y^2}$ liên hệ với chu kỳ $\Omega_E$ --- thành phần trong BSD mạnh.
126 Chuỗi Eisenstein (Eisenstein series $G_k, E_k$) Ch.8 6

Định nghĩa

Định nghĩa (Chuỗi Eisenstein). Chuỗi Eisenstein (Eisenstein series) trọng lượng $k \geq 4$ (chẵn) cho $\mathrm{SL}_2(\mathbb{Z})$:
\[ G_k(\tau) = \sum_{\substack{(m,n) \in \mathbb{Z}^2 \\ (m,n) \neq (0,0)}} \frac{1}{(m\tau + n)^k} = 2\zeta(k) + 2\frac{(2\pi i)^k}{(k-1)!} \sum_{n=1}^{\infty} \sigma_{k-1}(n) q^n \]
trong đó $\sigma_{k-1}(n) = \sum_{d|n} d^{k-1}$ là hàm ước số, $\zeta(k) = \sum_{n=1}^{\infty} n^{-k}$.

Chuỗi chuẩn hóa:

\[ E_k(\tau) = \frac{G_k(\tau)}{2\zeta(k)} = 1 - \frac{2k}{B_k} \sum_{n=1}^{\infty} \sigma_{k-1}(n) q^n \]
với $B_k$ là số Bernoulli ($B_4 = -1/30$, $B_6 = 1/42$, $B_8 = -1/30$, $B_{12} = -691/2730$).

Ví dụ quan trọng:

  • $E_4(\tau) = 1 + 240\sum_{n \geq 1} \sigma_3(n) q^n = 1 + 240q + 2160q^2 + \cdots$
  • $E_6(\tau) = 1 - 504\sum_{n \geq 1} \sigma_5(n) q^n = 1 - 504q - 16632q^2 - \cdots$

$E_4$ và $E_6$ sinh vành dạng modular: $M_*(\mathrm{SL}_2(\mathbb{Z})) = \mathbb{C}[E_4, E_6]$.

Ví dụ

Ví dụ (Chuỗi Eisenstein và các hệ thức).
  1. $\Delta$ từ $E_4, E_6$: $\Delta(\tau) = \frac{E_4(\tau)^3 - E_6(\tau)^2}{1728} = q - 24q^2 + 252q^3 - \cdots$ Vì $E_4^3$ và $E_6^2$ đều thuộc $M_{12}$ với cùng hệ số hằng $1$, hiệu triệt tiêu hệ số hằng $\Rightarrow$ dạng cusp!
  2. $j$-bất biến: $j(\tau) = \frac{E_4(\tau)^3}{\Delta(\tau)} = \frac{1}{q} + 744 + 196884q + \cdots$ Hàm $j$ là bất biến modular (trọng lượng $0$) --- tham số hóa mọi đường cong elliptic trên $\mathbb{C}$: $E$ có $j$-bất biến $j(E) = j(\tau_E)$.
  3. Liên hệ Weierstrass: Cho lưới $\Lambda = \mathbb{Z} + \mathbb{Z}\tau$: $g_2(\Lambda) = 60 G_4(\tau)$, $g_3(\Lambda) = 140 G_6(\tau)$. Đường cong $y^2 = 4x^3 - g_2 x - g_3$ có $j = 1728 \cdot g_2^3 / (g_2^3 - 27g_3^2)$.
  4. $\sigma_3(n)$ = đếm lưới: $\sigma_3(n) = \sum_{d|n} d^3$ đếm (có trọng số) số cách biểu diễn $n$ trong lưới --- ý nghĩa “đếm” tự nhiên.

Ý nghĩa trực giác

Chuỗi Eisenstein --- “phần đều” của dạng modular.
  • Hình dung: Phân tích $M_k = S_k \oplus \mathcal{E}_k$: chuỗi Eisenstein = “phần đều” (hệ số = hàm ước số, dễ hiểu), dạng cusp = “phần dao động” (hệ số phức tạp, chứa thông tin sâu). Như tín hiệu = DC + AC.
  • Hàm sinh “mọi thứ”: $E_4$ và $E_6$ sinh mọi dạng modular cho $\mathrm{SL}_2(\mathbb{Z})$. Vậy $E_4, E_6$ là “nguyên tử” --- mọi dạng modular là đa thức trong $E_4, E_6$. $\Delta = (E_4^3 - E_6^2)/1728$ là dạng cusp “nhỏ nhất”.
  • Convergence: Chuỗi $G_k$ hội tụ tuyệt đối khi $k \geq 4$ ($\sum_{(m,n)} |m\tau+n|^{-k}$ hội tụ vì “đủ nhanh”). Trường hợp $k = 2$: $G_2$ không phải dạng modular thực sự (“gần modular” --- quasi-modular) --- cần hiệu chỉnh.

Liên hệ với giả thuyết Birch--Dyer

Chuỗi Eisenstein trong BSD.
  • Phần bù: Trong $M_2(\Gamma_0(N))$, chuỗi Eisenstein tương ứng “phần tầm thường” của hàm $L$ (tích Dirichlet $L$-functions). Dạng cusp = “phần mới” = đường cong elliptic. Hàm $L$ BSD đến từ phần cusp, không phải Eisenstein.
  • Liên hệ $g_2, g_3$: Bất biến $g_2 = 60G_4$, $g_3 = 140G_6$ xác định đường cong Weierstrass $y^2 = 4x^3 - g_2 x - g_3$. Chu kỳ $\Omega_E = \int_{E(\mathbb{R})} |dx/2y|$ trong BSD mạnh tính từ lưới --- lưới xác định bởi $G_4, G_6$.
  • Hàm $L$ Eisenstein: $L(E_k, s) = \zeta(s)\zeta(s-k+1)$ --- tích hai zeta. Dạng cusp $f_E$ cho $L(f_E, s) = L(E, s)$ --- hàm $L$ “không tách” (primitive). BSD nói về giá trị đặc biệt $L(f_E, 1)$ --- thông tin sâu hơn Eisenstein.
127 Số Bernoulli (Bernoulli number $B_k$) Ch.8 4

Định nghĩa

Định nghĩa (Số Bernoulli). Số Bernoulli (Bernoulli number) $B_k$ ($k = 0, 1, 2, \ldots$) được định nghĩa bởi hàm sinh:
\[ \frac{t}{e^t - 1} = \sum_{k=0}^{\infty} B_k \frac{t^k}{k!}, \quad |t| < 2\pi. \]

Các giá trị đầu tiên:

$k$ 0 1 2 4 6 8 10 12
$B_k$ $1$ $-\tfrac{1}{2}$ $\tfrac{1}{6}$ $-\tfrac{1}{30}$ $\tfrac{1}{42}$ $-\tfrac{1}{30}$ $\tfrac{5}{66}$ $-\tfrac{691}{2730}$

$B_k = 0$ khi $k$ lẻ và $k \geq 3$. Dấu xen kẽ: $(-1)^{k/2+1} B_k > 0$ cho $k$ chẵn $\geq 2$.

Liên hệ với hàm zeta Riemann: Với $k$ chẵn $\geq 2$:

\[ \zeta(k) = \sum_{n=1}^{\infty} \frac{1}{n^k} = \frac{(-1)^{k/2+1} (2\pi)^k B_k}{2 \cdot k!}. \]
Ví dụ: $\zeta(2) = \pi^2/6$ (dùng $B_2 = 1/6$), $\zeta(4) = \pi^4/90$ (dùng $B_4 = -1/30$).

Ví dụ

Ví dụ (Số Bernoulli trong thực tế).
  1. Tổng lũy thừa: $\sum_{j=0}^{n-1} j^k = \frac{1}{k+1} \sum_{i=0}^{k} \binom{k+1}{i} B_i \, n^{k+1-i}$. Ví dụ: $\sum_{j=0}^{n-1} j^2 = \frac{n(n-1)(2n-1)}{6}$ (dùng $B_0 = 1$, $B_1 = -1/2$, $B_2 = 1/6$).
  2. Chuỗi Eisenstein: $E_k(\tau) = 1 - \frac{2k}{B_k} \sum_{n \geq 1} \sigma_{k-1}(n) q^n$. Hệ số $-2k/B_k$: với $k = 4$: $-8/(-1/30) = 240$; $k = 6$: $-12/(1/42) = -504$; $k = 12$: $-24/(-691/2730) = 65520/691$.
  3. $B_{12} = -691/2730$: Số nguyên tố $691$ xuất hiện “bất ngờ” --- nó là thừa số trong $\tau(n) \pmod{691}$ (đồng dư Ramanujan: $\tau(n) \equiv \sigma_{11}(n) \pmod{691}$), liên hệ sâu với đường cong Eisenstein bậc $12$.

Ý nghĩa trực giác

Số Bernoulli --- “hằng số vũ trụ” của lý thuyết số.
  • Hình dung: Số Bernoulli xuất hiện ở mọi nơi: tổng lũy thừa, hàm zeta, chuỗi Eisenstein, $K$-theory, lý thuyết homotopy. Chúng là “hằng số cơ bản” kết nối giải tích và số học.
  • Tử số kỳ lạ: $B_{12}$ có tử số $691$ --- số nguyên tố “lạ” xuất hiện từ hàm sinh đơn giản $t/(e^t - 1)$. Kummer phát hiện: $p | B_k$ cho thông tin về nhóm lớp $\mathrm{Cl}(\mathbb{Q}(\zeta_p))$ --- “nguyên tố bất chính quy” (irregular prime).
  • Giá trị tại số nguyên âm: $\zeta(1-k) = -B_k/k$ cho $k \geq 1$. Vậy $\zeta(-1) = -1/12$, $\zeta(-3) = 1/120$, ... Giá trị “kỳ lạ” nhưng hợp lý qua thác triển giải tích.

Liên hệ với giả thuyết Birch--Dyer

Số Bernoulli trong BSD.
  • Chuỗi Eisenstein: Hệ số Eisenstein $E_k$ chứa $B_k$ ở mẫu --- $B_k$ quyết định “phần tầm thường” của $M_k$. Dạng cusp (phần BSD) = $M_k$ trừ đi phần Eisenstein (chứa $B_k$).
  • Đồng dư modular: Đồng dư Ramanujan $\tau(n) \equiv \sigma_{11}(n) \pmod{691}$ (do $691 | B_{12}$) phản ánh cấu trúc sâu: tồn tại đồng cấu $S_{12} \to \mathcal{E}_{12} \pmod{691}$. Tương tự: đồng dư Eisenstein cho dạng trọng lượng $2$ liên hệ hệ số $a_p(E)$ với hàm ước số.
  • Tương tự BSD: Công thức $\zeta(k) = (-1)^{k/2+1}(2\pi)^k B_k / (2 \cdot k!)$ cho giá trị đặc biệt $\zeta$ tại số nguyên dương --- tương tự BSD cho giá trị đặc biệt $L(E,1)$. Cả hai đều liên hệ “giá trị $L$” với “bất biến số học”.
128 Công thức chiều (Dimension formula) Ch.8 6

Định nghĩa

Định nghĩa (Công thức chiều). Công thức chiều (dimension formula) cho không gian dạng modular trọng lượng $k$ cho $\mathrm{SL}_2(\mathbb{Z})$ ($k$ chẵn, $k \geq 2$):
\[ \dim M_k(\mathrm{SL}_2(\mathbb{Z})) = \begin{cases} \lfloor k/12 \rfloor & \text{nếu } k \equiv 2 \pmod{12}, \\ \lfloor k/12 \rfloor + 1 & \text{nếu } k \not\equiv 2 \pmod{12}. \end{cases} \]
\[ \dim S_k(\mathrm{SL}_2(\mathbb{Z})) = \dim M_k - 1 = \begin{cases} \lfloor k/12 \rfloor - 1 & \text{nếu } k \equiv 2 \pmod{12}, \\ \lfloor k/12 \rfloor & \text{nếu } k \not\equiv 2 \pmod{12}. \end{cases} \]

Cho $\Gamma_0(N)$ ($k = 2$): $\dim S_2(\Gamma_0(N)) = g(X_0(N))$ = genus đường cong modular. Công thức genus (Hurwitz):

\[ g(X_0(N)) = 1 + \frac{\mu}{12} - \frac{\nu_2}{4} - \frac{\nu_3}{3} - \frac{\nu_\infty}{2} \]
với $\mu = [\mathrm{SL}_2(\mathbb{Z}) : \Gamma_0(N)] = N \prod_{p|N}(1+1/p)$, $\nu_2$ = số điểm elliptic bậc $2$, $\nu_3$ = bậc $3$, $\nu_\infty$ = số cusps.

Ví dụ:

$N$ 1 2 11 14 15 37 50 100 389
$\dim S_2(\Gamma_0(N))$ 0 0 1 1 1 2 2 7 32

Ví dụ

Ví dụ (Công thức chiều trong thực tế).
  1. $\mathrm{SL}_2(\mathbb{Z})$: $\dim S_{12} = 1$ ($\Delta$), $\dim S_{24} = 2$ ($\Delta E_{12}$ và $\Delta^2$), $\dim S_{36} = 3$. Mỗi bậc cao thêm khoảng $1$ chiều mỗi $12$ đơn vị.
  2. $\Gamma_0(11)$: $\mu = 12$, $\nu_2 = 0$ (không có điểm elliptic bậc $2$ vì $-1$ không phải thặng dư bậc hai mod $11$), $\nu_3 = 0$, $\nu_\infty = 2$ cusps. $g = 1 + 1 - 0 - 0 - 1 = 1$. Vậy $\dim S_2(\Gamma_0(11)) = 1$ --- đúng $1$ newform = đúng $1$ đường cong elliptic conductor $11$.
  3. $\Gamma_0(37)$: $g = 2$, nên $\dim S_2 = 2$: hai newforms $f_{37a}$ và $f_{37b}$, tương ứng hai lớp đẳng cấu 37a và 37b.
  4. Conductor lớn: $\dim S_2(\Gamma_0(389)) = 32$ --- có $32$ newforms trọng lượng $2$ mức $389$, tức $32$ lớp đẳng cấu đường cong elliptic conductor $389$ (một trong đó là 389a1, rank $2$ nhỏ nhất).

Ý nghĩa trực giác

Công thức chiều --- “đếm đường cong” bằng genus.
  • Hình dung: $\dim S_2(\Gamma_0(N))$ = số newforms = số lớp đẳng cấu đường cong elliptic conductor $N$ (modularity!). Vậy công thức chiều đếm bao nhiêu đường cong elliptic có conductor $N$ --- “bảng tuần hoàn” tự xây.
  • Genus = tôpô: $g(X_0(N))$ là bất biến tôpô (số “lỗ” của mặt Riemann $X_0(N)$). Vậy số đường cong elliptic conductor $N$ được xác định bởi tôpô --- liên hệ bất ngờ giữa hình học và số học.
  • Tăng trưởng: $\dim S_2(\Gamma_0(N)) \sim N/12$ (bậc nhất theo $N$). Conductor càng lớn, càng nhiều đường cong --- hợp lý!

Liên hệ với giả thuyết Birch--Dyer

Công thức chiều trong BSD.
  • Đếm đối tượng BSD: Mỗi chiều trong $S_2(\Gamma_0(N))$ = một đường cong elliptic = một phiên bản BSD cần kiểm nghiệm. $\dim = 32$ tại $N = 389$ nghĩa là $32$ phỏng đoán BSD riêng biệt.
  • Modularity ngược: Biết $\dim S_2(\Gamma_0(N))$, ta biết chính xác số đường cong elliptic conductor $N$. Nếu tìm ít hơn $\Rightarrow$ thiếu. Nếu tìm nhiều hơn $\Rightarrow$ sai conductor. Database Cremona dùng điều này để kiểm tra tính đầy đủ.
  • Old/new decomposition: $S_2(\Gamma_0(N)) = S_2^{\mathrm{new}} \oplus S_2^{\mathrm{old}}$. Newforms = đường cong conductor đúng $N$. Oldforms đến từ divisor $M | N$ --- “thừa kế” từ mức nhỏ hơn.
129 Toán tử Hecke (Hecke operator $T_n$) Ch.8 7

Định nghĩa

Định nghĩa (Toán tử Hecke). Cho $f \in M_k(\Gamma_0(N))$ có $q$-expansion $f(\tau) = \sum a_n q^n$. Toán tử Hecke (Hecke operator) $T_p$ (với $p$ nguyên tố) tác động:
\[ (T_p f)(\tau) = \sum_{n=0}^{\infty} \left(a_{np} + p^{k-1} a_{n/p}\right) q^n \]
trong đó $a_{n/p} = 0$ nếu $p \nmid n$.

Tổng quát hơn, với $(n, N) = 1$:

\[ T_n f = \sum_{n=0}^{\infty} \left(\sum_{d | \gcd(m,n)} d^{k-1} a_{mn/d^2}\right) q^m. \]

Tính chất quan trọng:

  • Giao hoán: $T_m T_n = T_n T_m$ nếu $(m, n) = 1$.
  • Nhân tính: $T_{mn} = T_m T_n$ nếu $(m, n) = 1$; $T_{p^2} = T_p^2 - p^{k-1} \langle p \rangle$ (với $\langle p \rangle$ là toán tử diamond).
  • Tự liên hợp: $T_n$ tự liên hợp dưới tích Petersson: $\langle T_n f, g \rangle = \langle f, T_n g \rangle$ khi $(n, N) = 1$.
  • Bảo toàn: $T_n$ ánh xạ $M_k \to M_k$ và $S_k \to S_k$.

Ví dụ

Ví dụ (Toán tử Hecke trên dạng cụ thể).
  1. $T_2$ trên $\Delta(\tau) = q - 24q^2 + 252q^3 - \cdots$: $T_2(\Delta) = a_2 \Delta = -24 \Delta$ (vì $\dim S_{12} = 1$ nên $\Delta$ là dạng riêng!). Vậy $\Delta$ là eigenform với eigenvalue $\tau(2) = -24$.
  2. $T_p$ trên $f_{11a1} = q - 2q^2 - q^3 + 2q^4 + q^5 + \cdots$: $T_p(f_{11a1}) = a_p(E_{11a1}) \cdot f_{11a1}$, với $a_p = p + 1 - |E_{11a1}(\mathbb{F}_p)|$. Ví dụ: $T_2(f) = -2f$ (vì $|E(\mathbb{F}_2)| = 5$, $a_2 = 2 + 1 - 5 = -2$).
  3. $T_2$ trên $S_2(\Gamma_0(37))$ ($2$ chiều): Ma trận $T_2$ trên cơ sở newforms: $T_2 = \begin{pmatrix} -2 & 0 \\ 0 & 0 \end{pmatrix}$. Eigenvalues: $-2$ (cho 37a1) và $0$ (cho 37b1). Ứng với $a_2(37a1) = -2$ và $a_2(37b1) = 0$.
  4. Ý nghĩa hình học: $T_p$ “trung bình hóa” $f$ trên các lưới con chỉ số $p$: mỗi lưới $\Lambda$ có $p+1$ lưới con chỉ số $p$, và $T_p$ lấy tổng $f$ trên chúng (có trọng số $p^{k-1}$).

Ý nghĩa trực giác

Toán tử Hecke --- “trung bình hóa” trên lưới con.
  • Hình dung: $T_p$ lấy dạng modular $f$ (hàm trên lưới) và “trộn” nó với các lưới con chỉ số $p$. Như bộ lọc tín hiệu: $T_p$ trích xuất thành phần “tần số $p$” từ $f$.
  • “Đại số Hecke”: Các $T_n$ giao hoán, tự liên hợp $\Rightarrow$ chéo hóa đồng thời được (phổ thực). Cơ sở riêng chung = eigenforms = dạng “cơ bản” nhất. Mỗi eigenform tương ứng đường cong elliptic (khi $k = 2$).
  • Tại sao $a_p$ quan trọng? Nếu $f$ là eigenform: $T_p f = a_p f$. Giá trị riêng $a_p$ = hệ số Fourier thứ $p$ = $p + 1 - |E(\mathbb{F}_p)|$ (đếm điểm!). Toán tử Hecke “trích xuất” thông tin số học từ dạng modular.

Liên hệ với giả thuyết Birch--Dyer

Toán tử Hecke trong BSD.
  • Hàm $L$ từ eigenvalues: $L(f, s) = \sum a_n n^{-s} = \prod_p (1 - a_p p^{-s} + p^{k-1-2s})^{-1}$ (tích Euler). Eigenvalues Hecke $a_p$ xác định hoàn toàn hàm $L(E,s)$ --- đối tượng trung tâm BSD.
  • Modularity symbols: Tính $L(E,1)$ bằng modular symbols sử dụng tác động Hecke --- phương pháp hiệu quả nhất để kiểm nghiệm BSD số học.
  • Chéo hóa = phân loại: Chéo hóa đại số Hecke trên $S_2(\Gamma_0(N))$ phân loại mọi đường cong elliptic conductor $N$. Mỗi eigenvalue hệ thống $(a_2, a_3, a_5, \ldots)$ xác định duy nhất một lớp đẳng cấu --- “vân tay” Hecke [wiles1995].
130 Dạng riêng Hecke (eigenform) (Hecke eigenform) Ch.8 7

Định nghĩa

Định nghĩa (Dạng riêng Hecke). Dạng riêng Hecke (Hecke eigenform) (hay eigenform) là dạng modular $f \in M_k(\Gamma_0(N))$ mà là vector riêng đồng thời của mọi toán tử Hecke $T_n$ (với $(n, N) = 1$):
\[ T_n f = \lambda_n f \quad \forall (n, N) = 1, \]
với $\lambda_n \in \mathbb{C}$ là giá trị riêng (eigenvalue).

Nếu $f = \sum a_n q^n$ là eigenform chuẩn hóa ($a_1 = 1$), thì:

\[ \lambda_n = a_n \quad \forall (n, N) = 1. \]
Nghĩa là: giá trị riêng Hecke chính là hệ số Fourier!

Tính chất:

  • Hệ số $a_n$ nhân tính: $a_{mn} = a_m a_n$ khi $(m,n) = 1$.
  • Quan hệ đệ quy: $a_{p^{r+1}} = a_p a_{p^r} - p^{k-1} a_{p^{r-1}}$ cho $p \nmid N$.
  • Hàm $L$ có tích Euler: $L(f, s) = \prod_{p \nmid N} (1 - a_p p^{-s} + p^{k-1-2s})^{-1} \prod_{p | N} (1 - a_p p^{-s})^{-1}$.

Ví dụ

Ví dụ (Eigenform cụ thể).
  1. $\Delta(\tau) \in S_{12}(\mathrm{SL}_2(\mathbb{Z}))$: Eigenform chuẩn hóa duy nhất. $a_p = \tau(p)$ (hàm Ramanujan). Nhân tính: $\tau(6) = \tau(2)\tau(3) = (-24)(252) = -6048$. Kiểm tra: $\tau(6) = -6048$ ✓.
  2. $f_{37a1} \in S_2(\Gamma_0(37))$: Eigenform ứng với 37a1. Eigenvalues: $a_2 = -2$, $a_3 = -3$, $a_5 = -2$, $a_7 = -2$, $a_{11} = 0$, ... Nhân tính: $a_6 = a_2 a_3 = 6$.
  3. Trường hệ số: Eigenform $f \in S_2(\Gamma_0(23))$ có $a_2 = \frac{-1 + \sqrt{5}}{2}$ --- giá trị riêng không nguyên! Đây ứng với đa tạp Abel (không phải đường cong elliptic) --- trường hệ số $\mathbb{Q}(\sqrt{5})$.
  4. $a_p \in \mathbb{Z}$ $\Leftrightarrow$ đường cong elliptic: Eigenform chuẩn hóa trong $S_2(\Gamma_0(N))$ có $a_p \in \mathbb{Z}$ $\forall p$ $\Leftrightarrow$ ứng với đường cong elliptic (Eichler--Shimura). Nếu $a_p$ nằm trong trường số bậc $d > 1$: ứng với đa tạp Abel chiều $d$.

Ý nghĩa trực giác

Eigenform --- “nguyên tử” của dạng modular.
  • Hình dung: Như “sóng riêng” (eigenmode) trong vật lý: eigenform là dao động cơ bản mà toán tử Hecke chỉ thay đổi biên độ (nhân $a_p$), không thay đổi hình dạng. Mọi dạng modular = tổ hợp tuyến tính eigenforms.
  • “Vân tay số học”: Dãy eigenvalues $(a_2, a_3, a_5, a_7, \ldots)$ xác định duy nhất eigenform (strong multiplicity one). Như vân tay --- mỗi đường cong elliptic có dãy $a_p$ riêng biệt.
  • Nhân tính = tích Euler: $a_{mn} = a_m a_n$ (coprime) cho phép viết $L(f,s) = \prod_p L_p(f,s)$ --- tích trên nguyên tố. Cấu trúc “cục bộ--toàn cục” là trung tâm của lý thuyết số.

Liên hệ với giả thuyết Birch--Dyer

Eigenform trong BSD.
  • $f_E$ = eigenform ứng với $E$: Định lý modularity: mỗi $E/\mathbb{Q}$ conductor $N$ $\leftrightarrow$ eigenform chuẩn hóa $f_E \in S_2(\Gamma_0(N))$ với $a_p(f_E) = a_p(E)$ $\forall p$ [wiles1995]. BSD phát biểu về $L(f_E, s) = L(E, s)$.
  • Eichler--Shimura: Eigenform $f$ với $a_n \in \mathbb{Z}$ cho đường cong elliptic $E_f/\mathbb{Q}$ qua xây dựng Eichler--Shimura: $E_f = J_0(N) / (\ker \phi)$ (thương Jacobian). Đây là “chiều ngược” modularity.
  • Hệ số = đếm điểm: $a_p(f_E) = p + 1 - |E(\mathbb{F}_p)|$ cho $p \nmid N$. Tích Euler: $L(E, s) = \prod_p (1 - a_p p^{-s} + p^{1-2s})^{-1}$ (tại $p$ tốt). BSD nói $\mathrm{ord}_{s=1} L(E,s) = \mathrm{rk}(E/\mathbb{Q})$.
131 Newform (Newform) Ch.6 7

Định nghĩa

Định nghĩa (Newform). Cho $N \geq 1$ và $k \geq 2$. Không gian cusp $S_k(\Gamma_0(N))$ phân tích:
\[ S_k(\Gamma_0(N)) = S_k^{\mathrm{new}}(\Gamma_0(N)) \oplus S_k^{\mathrm{old}}(\Gamma_0(N)). \]

Oldforms: Đến từ mức nhỏ hơn. Với $M | N$, $M < N$, và $d | (N/M)$, ánh xạ $f(\tau) \mapsto f(d\tau)$ gửi $S_k(\Gamma_0(M)) \to S_k(\Gamma_0(N))$. Phần old = tổng ảnh mọi ánh xạ này.

Newforms: Phần bù trực giao (dưới tích Petersson). Newform (newform) là eigenform chuẩn hóa ($a_1 = 1$) trong $S_k^{\mathrm{new}}(\Gamma_0(N))$ --- dạng “xuất hiện lần đầu” tại mức $N$.

Tính chất (Atkin--Lehner theory):

  • Newforms là eigenform cho mọi $T_n$ (kể cả $n$ không coprime $N$).
  • Hệ số $a_n$ xác định newform duy nhất (strong multiplicity one).
  • Toán tử Atkin--Lehner $W_N: f(\tau) \mapsto N^{-k/2} \tau^{-k} f(-1/(N\tau))$ cho eigenvalue $w_N = \pm 1$ --- dấu gốc $w(E) = -w_N$.

Ví dụ

Ví dụ (Old vs. New).
  1. $S_2(\Gamma_0(22))$: $\dim = 2$. Nhưng 22 = $2 \times 11$. Newform mức $11$: $f_{11a1}$. Hai embeddings: $f_{11a1}(\tau)$ và $f_{11a1}(2\tau)$ $\in S_2(\Gamma_0(22))$. Vậy $S_2^{\mathrm{old}} = 2$ chiều, $S_2^{\mathrm{new}} = 0$. Không có đường cong elliptic conductor đúng $22$!
  2. $S_2(\Gamma_0(37))$: $\dim = 2$, $37$ nguyên tố nên $S_2^{\mathrm{old}} = 0$ (không có ước thực sự). Cả $2$ chiều là newforms: $f_{37a1}$ và $f_{37b1}$.
  3. $S_2(\Gamma_0(44))$: $\dim = 4$. Ước của $44$: $1, 2, 4, 11, 22, 44$. Oldforms từ $N = 11$: $f_{11a1}(\tau), f_{11a1}(2\tau), f_{11a1}(4\tau)$ = $3$ chiều. Newforms: $\dim S_2^{\mathrm{new}} = 1$ --- đúng $1$ đường cong elliptic conductor $44$.
  4. Dấu gốc: $f_{37a1}$ có $w_{37} = -1$, nên $w(E_{37a1}) = +1$... nhưng $\mathrm{rk}(37a1) = 1$ --- oops? Thực ra $w(E) = -w_N$ khi $N$ nguyên tố, và $w(37a1) = -1$ (rank lẻ, phù hợp parity conjecture).

Ý nghĩa trực giác

Newform --- “dạng nguyên thủy” tại mức $N$.
  • Hình dung: Oldforms là “bản sao” từ mức nhỏ hơn (như phim chiếu lại). Newforms là “phim mới” --- xuất hiện lần đầu tại mức $N$. Chỉ newforms mang thông tin mới.
  • Tại sao quan trọng? Modularity: $E/\mathbb{Q}$ conductor $N$ $\leftrightarrow$ newform mức $N$. Nếu dùng “mọi dạng” (kể cả old), sẽ đếm thừa --- mỗi $E$ conductor $M | N$ bị đếm nhiều lần.
  • Strong multiplicity one: Hai newform cùng $a_p$ cho hầu hết $p$ $\Rightarrow$ giống nhau. “Vân tay” $a_p$ xác định duy nhất --- cực kỳ mạnh, hệ quả của lý thuyết biểu diễn.

Liên hệ với giả thuyết Birch--Dyer

Newform trong BSD.
  • Tương ứng 1-1: $\{$đường cong elliptic$/\mathbb{Q}$ conductor $N\} \xleftrightarrow{1:1} \{$newform $f \in S_2^{\mathrm{new}}(\Gamma_0(N))$ với $a_n \in \mathbb{Z}\}$. Đây là nội dung chính xác của định lý modularity + Eichler--Shimura.
  • Dấu gốc: Eigenvalue Atkin--Lehner $w_N$ cho dấu gốc $w(E)$ (lên đến dấu). Phỏng đoán tính chẵn lẻ: $(-1)^{\mathrm{rk}} = w(E)$. Kiểm nghiệm từ newform: $w_N$ tính dễ $\Rightarrow$ dự đoán pariy của hạng.
  • Hàm $L$ primitive: $L(f, s)$ cho newform $f$ là hàm $L$ “nguyên thủy” --- không tách thành tích hàm $L$ nhỏ hơn. BSD nói về $L$-function primitive: $\mathrm{ord}_{s=1} L(f, s) = \mathrm{rk}(E_f/\mathbb{Q})$.
132 Hàm Ramanujan $\tau$ (Ramanujan tau function) Ch.8 5

Định nghĩa

Định nghĩa (Hàm Ramanujan $\tau$). Hàm Ramanujan tau (Ramanujan tau function) $\tau: \mathbb{Z}_{\geq 1} \to \mathbb{Z}$ được định nghĩa bởi khai triển Fourier của dạng cusp $\Delta$:
\[ \Delta(\tau) = q \prod_{n=1}^{\infty} (1 - q^n)^{24} = \sum_{n=1}^{\infty} \tau(n) q^n, \quad q = e^{2\pi i \tau}. \]

Các giá trị đầu: $\tau(1) = 1$, $\tau(2) = -24$, $\tau(3) = 252$, $\tau(4) = -1472$, $\tau(5) = 4830$, $\tau(6) = -6048$, $\tau(7) = -16744$, ...

Tính chất (phỏng đoán Ramanujan, nay là định lý):

  • Nhân tính: $\tau(mn) = \tau(m)\tau(n)$ khi $(m,n) = 1$.
  • Đệ quy: $\tau(p^{r+1}) = \tau(p)\tau(p^r) - p^{11}\tau(p^{r-1})$.
  • Chặn Ramanujan--Petersson: $|\tau(p)| \leq 2p^{11/2}$ --- chứng minh bởi Deligne (1974) dùng giả thuyết Weil cho đa tạp trên trường hữu hạn [deligne1974].

Ví dụ

Ví dụ (Hàm $\tau$ trong thực tế).
  1. Nhân tính: $\tau(6) = \tau(2)\tau(3) = (-24)(252) = -6048$ ✓. $\tau(12) = \tau(4)\tau(3) = (-1472)(252) = -370944$ ✓.
  2. Đệ quy: $\tau(4) = \tau(2)\tau(2) - 2^{11}\tau(1) = (-24)^2 - 2048 = 576 - 2048 = -1472$ ✓.
  3. Chặn Ramanujan: $|\tau(2)| = 24 \leq 2 \cdot 2^{11/2} = 2 \cdot 45.25 = 90.5$ ✓. $|\tau(7)| = 16744 \leq 2 \cdot 7^{11/2} = 2 \cdot 96040 = 192080$ ✓. Chặn “rộng” nhưng là kết quả cực kỳ sâu (Deligne = Fields Medal 1978).
  4. Đồng dư Ramanujan: $\tau(n) \equiv \sigma_{11}(n) \pmod{691}$. Ví dụ: $\tau(2) = -24 \equiv -24$, $\sigma_{11}(2) = 1 + 2^{11} = 2049 \equiv 2049 - 2 \cdot 691 = 667 \equiv -24 \pmod{691}$ ✓.

Ý nghĩa trực giác

$\tau(n)$ --- “hàm số học thần bí nhất”.
  • Hình dung: $\tau(n)$ đếm “gì đó” liên quan đến phân hoạch $24$ chiều (tích $(1-q^n)^{24}$ gợi ý $24$ bản sao). Trong lý thuyết dây (string theory), $24 = 26 - 2$ (chiều ngang) --- $\Delta$ xuất hiện tự nhiên!
  • Tăng trưởng: $|\tau(n)| \leq C \cdot n^{11/2+\epsilon}$ (Ramanujan--Petersson). So sánh: $\sigma_{11}(n)$ tăng như $n^{11}$. Dạng cusp “nhỏ hơn nhiều” so với Eisenstein --- phần dao động luôn nhỏ.
  • Hình mẫu: $\tau(n)$ là prototype cho hệ số Fourier dạng cusp. Mọi tính chất ($\tau$ nhân tính, $|\tau(p)| \leq 2p^{(k-1)/2}$, đồng dư) đều tổng quát cho eigenform bất kỳ --- $\Delta$ là “ví dụ đầu tiên” định hình cả lý thuyết.

Liên hệ với giả thuyết Birch--Dyer

$\tau(n)$ trong BSD.
  • Chặn Ramanujan = RH cho EC: Cho $E/\mathbb{Q}$, chặn $|a_p(E)| \leq 2\sqrt{p}$ (Hasse) là trường hợp $k = 2$ của chặn Ramanujan--Petersson ($|a_p(f)| \leq 2p^{(k-1)/2}$). Chặn Hasse cần cho hội tụ tích Euler $L(E,s)$ tại $\mathrm{Re}(s) > 3/2$.
  • Hàm $L(\Delta, s)$: $L(\Delta, s) = \sum \tau(n) n^{-s}$ là hàm $L$ nguyên mẫu (prototype) --- có phương trình hàm, tích Euler, zero không tầm thường. GRH cho $L(\Delta, s)$ vẫn mở. Nếu đúng, hệ quả cho phân bố $\tau(n)$.
  • Deligne $\Rightarrow$ BSD khả thi: Chặn Deligne $|\tau(p)| \leq 2p^{11/2}$ chứng minh tích Euler $L(\Delta, s)$ hội tụ cho $\mathrm{Re}(s) > 13/2$. Tương tự, $|a_p(E)| \leq 2\sqrt{p}$ cho $L(E,s)$ hội tụ $\mathrm{Re}(s) > 3/2$ --- cần để $L(E,1)$ (trong vùng thác triển) có nghĩa.
133 Tích Petersson (Petersson inner product) Ch.6 6

Định nghĩa

Định nghĩa (Tích Petersson). Cho $f, g$ là hai dạng modular trọng số $k$ trên $\Gamma_0(N)$, với ít nhất một trong hai là dạng cusp. Tích Petersson (Petersson inner product) được định nghĩa bởi:
\[ \langle f, g \rangle = \frac{1}{[\mathrm{SL}_2(\mathbb{Z}) : \Gamma_0(N)]} \int_{\Gamma_0(N) \backslash \mathcal{H}} f(z) \overline{g(z)}\, y^k \, \frac{dx\,dy}{y^2} \]
trong đó $z = x + iy \in \mathcal{H}$ (nửa mặt phẳng trên), và tích phân lấy trên miền cơ bản của $\Gamma_0(N)$ tác động lên $\mathcal{H}$.

Hệ số chuẩn hóa $\frac{1}{[\mathrm{SL}_2(\mathbb{Z}) : \Gamma_0(N)]}$ đảm bảo tích Petersson không phụ thuộc vào mức $N$ khi ta nhúng dạng modular mức thấp vào mức cao hơn [diamond-shurman2005].

Ví dụ

Ví dụ (Petersson norm của $\Delta$). Xét hàm Ramanujan $\Delta(z) = q \prod_{n=1}^{\infty} (1 - q^n)^{24} \in S_{12}(\mathrm{SL}_2(\mathbb{Z}))$.

Vì $\dim S_{12}(\mathrm{SL}_2(\mathbb{Z})) = 1$, dạng $\Delta$ sinh ra toàn bộ không gian cusp form trọng số 12 mức 1. Tích Petersson tự thân là:

\[ \langle \Delta, \Delta \rangle = \int_{\mathrm{SL}_2(\mathbb{Z}) \backslash \mathcal{H}} |\Delta(z)|^2 \, y^{12} \, \frac{dx\,dy}{y^2} = \int_{\mathcal{F}} |\Delta(z)|^2 \, y^{10} \, dx\,dy \]
trong đó $\mathcal{F} = \{z \in \mathcal{H} : |z| \geq 1, \, |\mathrm{Re}(z)| \leq 1/2\}$ là miền cơ bản chuẩn.

Giá trị chính xác: $\langle \Delta, \Delta \rangle = \frac{\pi}{2^6 \cdot 3^5 \cdot 5^3 \cdot 7^2 \cdot 11 \cdot 691} \approx 1.0353 \times 10^{-6}$.

Nhận xét: Số nguyên tố 691 xuất hiện ở mẫu --- cùng số 691 trong đồng dư Ramanujan $\tau(n) \equiv \sigma_{11}(n) \pmod{691}$. Đây không phải trùng hợp: đồng dư Ramanujan phản ánh rằng $\Delta$ và chuỗi Eisenstein $E_{12}$ “gần nhau” theo Petersson.

Ví dụ (Toán tử Hecke là tự liên hợp). Một tính chất cốt lõi: các toán tử Hecke $T_n$ ($\gcd(n, N) = 1$) là tự liên hợp (self-adjoint) theo Petersson:
\[ \langle T_n f, g \rangle = \langle f, T_n g \rangle \]
Hệ quả (từ đại số tuyến tính): $S_k(\Gamma_0(N))$ có một cơ sở trực giao gồm các eigenform của tất cả $T_n$. Điều này giải thích tại sao lý thuyết eigenform hoạt động tốt --- nó dựa trên phổ của toán tử tự liên hợp trên không gian Hilbert hữu hạn chiều.

Ý nghĩa trực giác

Tích Petersson --- “tích vô hướng” trên không gian dạng modular.
  • Hình dung: Dạng modular sống trên không gian hàm (vô hạn chiều nói chung, nhưng $S_k$ hữu hạn chiều). Tích Petersson cho chúng ta “góc” và “độ dài” --- biến $S_k$ thành không gian Hilbert.
  • Tương tự: Giống tích vô hướng Euclid $\langle \mathbf{u}, \mathbf{v} \rangle = \sum u_i v_i$ trong $\mathbb{R}^n$, nhưng thay tổng bằng tích phân trên miền modular. Thước đo $y^k \frac{dx\,dy}{y^2}$ là “thước đo tự nhiên” bất biến dưới $\mathrm{SL}_2(\mathbb{R})$ (thước đo Poincaré), nhân thêm $y^k$ để bù cho tính biến đổi trọng số $k$.
  • Tại sao cần cusp? Nếu cả $f$ và $g$ đều không phải cusp form (ví dụ chuỗi Eisenstein), tích phân phân kỳ tại cusp --- $|E_k(z)|^2 y^k$ tăng quá nhanh khi $y \to \infty$. Yêu cầu ít nhất một dạng là cusp form (suy giảm mũ tại cusp) đảm bảo hội tụ.

Liên hệ với giả thuyết Birch--Dyer

Tích Petersson trong BSD.
  • Công thức Gross--Zagier: Cho $E/\mathbb{Q}$ hạng giải tích 1 và $K$ trường phức bậc hai ảo thỏa điều kiện Heegner. Công thức Gross--Zagier [gross-zagier1986] phát biểu:
    \[ L'(f_E, 1) = \frac{\hat{h}(P_K)}{\langle f_E, f_E \rangle} \cdot (\text{hằng số tường minh}) \]
    trong đó $\hat{h}(P_K)$ là chiều cao Néron--Tate của điểm Heegner, $\langle f_E, f_E \rangle$ là Petersson norm của newform gắn với $E$. Vậy Petersson norm xuất hiện trực tiếp trong đạo hàm $L'(E,1)$ --- thành phần then chốt của BSD hạng 1.
  • Chuẩn hóa: Trong công thức BSD mạnh, việc chọn chuẩn hóa “đúng” cho $f_E$ (Petersson norm vs. hệ số Fourier $a_1 = 1$) ảnh hưởng đến hằng số xuất hiện. Hằng số Manin (sẽ thảo luận ở Mục~(sec:hang-so-manin)) chính xác đo lường sự chênh lệch giữa hai chuẩn hóa.
134 Hệ số Fourier (Fourier coefficients $a_n(f)$) Ch.8 5

Định nghĩa

Định nghĩa (Hệ số Fourier của dạng modular). Cho $f$ là dạng modular trọng số $k$ trên $\Gamma_0(N)$. Vì $f(z+1) = f(z)$, hàm $f$ có khai triển chuỗi Fourier (Fourier series) theo $q = e^{2\pi i z}$:
\[ f(z) = \sum_{n=0}^{\infty} a_n(f) \, q^n = a_0(f) + a_1(f) q + a_2(f) q^2 + \cdots \]
Các số $a_n(f) \in \mathbb{C}$ được gọi là hệ số Fourier (Fourier coefficients) của $f$.

Nếu $f$ là dạng cusp ($f$ triệt tiêu tại mọi cusp), thì $a_0(f) = 0$.

Nếu $f$ là eigenform chuẩn hóa (normalized Hecke eigenform), thì $a_1(f) = 1$ và mỗi $a_n(f)$ là giá trị riêng của toán tử Hecke $T_n$:

\[ T_n f = a_n(f) \cdot f \]

Ví dụ

Ví dụ (Hệ số Fourier của các dạng modular quen thuộc).
  1. Chuỗi Eisenstein $E_k$: $a_0(E_k) = 1$ và $a_n(E_k) = \frac{-2k}{B_k} \sigma_{k-1}(n)$ cho $n \geq 1$. Ví dụ với $E_4$:
    \[ E_4(z) = 1 + 240 \sum_{n=1}^{\infty} \sigma_3(n) q^n = 1 + 240q + 2160q^2 + 6720q^3 + \cdots \]
    Hệ số $a_n(E_4) = 240 \sigma_3(n)$: $a_1 = 240$, $a_2 = 2160$, $a_3 = 6720$.
  2. Hàm Ramanujan $\Delta$: $a_0 = 0$ (cusp form), $a_1 = 1$ (đã chuẩn hóa):
    \[ \Delta(z) = q - 24q^2 + 252q^3 - 1472q^4 + 4830q^5 - \cdots \]
    Hệ số $a_n(\Delta) = \tau(n)$: $a_2 = -24$, $a_3 = 252$, $a_5 = 4830$.
  3. Newform gắn với $E: y^2 + y = x^3 - x^2$ (conductor $N = 11$): Đây là dạng cusp duy nhất (up to scalar) trong $S_2(\Gamma_0(11))$:
    \[ f_{11}(z) = q - 2q^2 - q^3 + 2q^4 + q^5 + 2q^6 - 2q^7 - \cdots \]
    Hệ số $a_p = p + 1 - \#E(\mathbb{F}_p)$: với $p = 2$, $\#E(\mathbb{F}_2) = 5$ nên $a_2 = 2 + 1 - 5 = -2$ ✓.

Ý nghĩa trực giác

Hệ số Fourier --- “DNA” của dạng modular.
  • Hình dung: Mỗi dạng modular được xác định hoàn toàn bởi dãy hệ số Fourier $(a_0, a_1, a_2, \ldots)$ --- giống DNA mã hóa toàn bộ thông tin. Hai dạng modular có cùng hệ số Fourier thì bằng nhau.
  • Nhân tính: Nếu $f$ là eigenform, các hệ số có tính nhân tính mạnh mẽ:
  • $a_{mn} = a_m a_n$ khi $\gcd(m,n) = 1$ (nhân tính hoàn toàn)
  • $a_{p^{r+1}} = a_p a_{p^r} - p^{k-1} a_{p^{r-1}}$ (quan hệ đệ quy tại lũy thừa)
Vậy toàn bộ dãy $(a_n)$ được xác định chỉ bởi các $a_p$ ($p$ nguyên tố). Mỗi eigenform mã hóa một “quy luật” trên các số nguyên tố.

Tương tự Fourier cổ điển: Trong giải tích Fourier thông thường, $f(x) = \sum a_n e^{inx}$ phân tích tín hiệu thành tần số. Ở đây, $q = e^{2\pi i z}$ đóng vai trò “tần số cơ bản” trên nửa mặt phẳng trên, và $a_n$ đo “biên độ” tại “tần số $n$”.

Liên hệ với giả thuyết Birch--Dyer

Hệ số Fourier trong BSD.
  • Cầu nối số học $\leftrightarrow$ giải tích: Định lý modularity [wiles1995, breuil-etal2001] cho biết: với mỗi $E/\mathbb{Q}$ conductor $N$, tồn tại duy nhất newform $f_E \in S_2(\Gamma_0(N))$ sao cho:
    \[ a_p(f_E) = a_p(E) = p + 1 - \#E(\mathbb{F}_p) \quad \text{với mọi } p \nmid N \]
    Hệ số Fourier $a_p(f_E)$ đồng nhất với vết Frobenius --- đây là “phép màu” kết nối hai thế giới.
  • Hàm $L$ từ Fourier: Hàm $L$ Hasse--Weil được xây dựng trực tiếp từ hệ số Fourier:
    \[ L(E, s) = \sum_{n=1}^{\infty} \frac{a_n(f_E)}{n^s} \]
    BSD yếu phát biểu rằng bậc triệt tiêu $\mathrm{ord}_{s=1} L(E,s)$ bằng hạng đại số $\mathrm{rk}(E(\mathbb{Q}))$. Mọi thông tin “giải tích” của BSD nằm gọn trong dãy $(a_n)$.
  • Ý nghĩa thực tiễn: Để kiểm nghiệm BSD bằng máy tính, ta cần tính $a_p(E)$ cho nhiều $p$. Thuật toán Schoof--Elkies--Atkin tính $a_p = p + 1 - \#E(\mathbb{F}_p)$ trong thời gian đa thức theo $\log p$.
135 Đường cong modular (Modular curve $X_0(N)$) Ch.1 6

Định nghĩa

Định nghĩa (Đường cong modular $X_0(N)$). Cho $N \geq 1$ nguyên dương. Nhóm con đồng dư (congruence subgroup (congruence subgroup)) mức $N$ là:
\[ \Gamma_0(N) = \left\{ \begin{pmatrix} a & b \\ c & d \end{pmatrix} \in \mathrm{SL}_2(\mathbb{Z}) \,:\, c \equiv 0 \pmod{N} \right\} \]
Nhóm $\Gamma_0(N)$ tác động lên nửa mặt phẳng trên mở rộng $\mathcal{H}^* = \mathcal{H} \cup \mathbb{Q} \cup \{i\infty\}$ bằng biến đổi Möbius $\gamma \cdot z = \frac{az+b}{cz+d}$.

Đường cong modular (Modular curve) mức $N$ là thương:

\[ X_0(N) = \Gamma_0(N) \backslash \mathcal{H}^* \]
Đây là mặt Riemann compact (do đã thêm các cusp $\Gamma_0(N) \backslash (\mathbb{Q} \cup \{i\infty\})$).

Ý nghĩa moduli: Một điểm trên $X_0(N)$ (trừ cusp) tham số hóa cặp $(E, C)$ trong đó $E$ là đường cong elliptic trên $\mathbb{C}$ và $C \subset E$ là nhóm con cyclic bậc $N$ [diamond-shurman2005].

Ví dụ

Ví dụ (Đường cong modular ở mức nhỏ).
  1. Mức $N = 1$: $\Gamma_0(1) = \mathrm{SL}_2(\mathbb{Z})$. Đường cong $X_0(1) = \mathrm{SL}_2(\mathbb{Z}) \backslash \mathcal{H}^*$ có genus $g = 0$ --- đây là mặt cầu Riemann $\mathbb{P}^1$. Hàm $j(z)$ cho song ánh $X_0(1) \xrightarrow{\sim} \mathbb{P}^1(\mathbb{C})$.
  2. Mức $N = 11$: $X_0(11)$ có genus $g = 1$ --- đây là đường cong elliptic! Thực tế, $X_0(11)$ đẳng cấu với $E: y^2 + y = x^3 - x^2 - 10x - 20$ (nhãn Cremona 11a1).
  3. Mức $N = 37$: $X_0(37)$ có genus $g = 2$ --- đây là đường cong hyperelliptic, không còn là đường cong elliptic.
  4. Genus tổng quát: Genus của $X_0(N)$ cho bởi:
    \[ g(X_0(N)) = 1 + \frac{\mu}{12} - \frac{\nu_2}{4} - \frac{\nu_3}{3} - \frac{\nu_\infty}{2} \]
    trong đó $\mu = [\mathrm{SL}_2(\mathbb{Z}) : \Gamma_0(N)] = N \prod_{p | N} (1 + 1/p)$ (chỉ số), $\nu_2, \nu_3$ đếm điểm bất động elliptic, $\nu_\infty$ đếm cusp.
Ví dụ (Bảng genus cho mức nhỏ).
$N$ 1 2 3 5 7 11 13 14 15 37
$g(X_0(N))$ 0 0 0 0 0 1 0 1 1 2

Nhận xét: $N = 11$ là mức nhỏ nhất với genus $\geq 1$. Điều này giải thích tại sao đường cong elliptic conductor nhỏ nhất là $N = 11$ --- chỉ khi genus $\geq 1$ mới có dạng cusp $S_2(\Gamma_0(N)) \neq 0$.

Ý nghĩa trực giác

$X_0(N)$ --- “không gian tham số” cho đường cong elliptic.
  • Hình dung: $X_0(N)$ giống “danh mục” (catalog) --- mỗi “trang” trong danh mục mô tả một đường cong elliptic $E$ cùng với một nhóm con cyclic $C$ bậc $N$ trong $E$. Danh mục này có hình dạng (topology) phụ thuộc vào $N$ --- mức $N$ càng lớn, genus càng cao, “hình dạng” càng phức tạp.
  • Tại sao $\mathcal{H}$? Mỗi $\tau \in \mathcal{H}$ xác định lưới $\Lambda_\tau = \mathbb{Z} + \mathbb{Z}\tau$, cho torus $\mathbb{C}/\Lambda_\tau$, tức một đường cong elliptic. Hai điểm $\tau, \tau'$ cho cùng đường cong khi và chỉ khi $\tau' = \gamma \cdot \tau$ với $\gamma \in \mathrm{SL}_2(\mathbb{Z})$. Thay $\mathrm{SL}_2(\mathbb{Z})$ bởi $\Gamma_0(N)$ thì “nhớ thêm” nhóm con cyclic bậc $N$.
  • Cusp = giới hạn suy biến: Các cusp (điểm bổ sung $\mathbb{Q} \cup \{i\infty\}$) tương ứng đường cong elliptic “suy biến” --- khi $\tau \to i\infty$, torus $\mathbb{C}/(\mathbb{Z} + \mathbb{Z}\tau)$ “bẹp” thành $\mathbb{C}^*/q^\mathbb{Z}$ (đường cong Tate). Thêm cusp giúp compact hóa $X_0(N)$.

Liên hệ với giả thuyết Birch--Dyer

$X_0(N)$ trong BSD.
  • Sân khấu của modularity: Định lý modularity [wiles1995, breuil-etal2001] phát biểu: mỗi $E/\mathbb{Q}$ conductor $N$ là thương (quotient) của Jacobian $J_0(N)$ của $X_0(N)$. Nói cách khác, $E$ “sống” trên $X_0(N)$ --- mọi đường cong elliptic hữu tỉ đều “nằm trong” hệ thống đường cong modular.
  • Điểm Heegner: Các điểm CM trên $X_0(N)$ (ứng với $\tau$ thỏa $a\tau^2 + b\tau + c = 0$ với biệt thức $< 0$) tạo nên điểm Heegner. Ánh xạ $X_0(N) \to E$ chuyển điểm Heegner thành điểm hữu tỉ trên $E$ --- đây là nguyên liệu chính của Gross--Zagier và Kolyvagin [gross-zagier1986, kolyvagin1990].
  • Genus $= \dim S_2$: $g(X_0(N)) = \dim S_2(\Gamma_0(N))$. Genus cao hơn $\Rightarrow$ nhiều newform hơn $\Rightarrow$ nhiều đường cong elliptic conductor $N$ hơn. Đường cong modular “chứa” tất cả thông tin về EC ở mức $N$.
136 Phép tham số hóa modular (Modular parametrization $\phi: X_0(N) \to E$) Ch.6 7

Định nghĩa

Định nghĩa (Phép tham số hóa modular). Cho $E/\mathbb{Q}$ là đường cong elliptic conductor $N$. Theo Định lý modularity, tồn tại phép tham số hóa modular (modular parametrization): một ánh xạ surjective (toàn ánh) không hằng:
\[ \phi_E : X_0(N) \longrightarrow E \]
định nghĩa trên $\mathbb{Q}$, gửi cusp $[i\infty]$ tới điểm gốc $\mathcal{O} \in E$.

Ánh xạ $\phi_E$ được xây dựng tường minh qua tích phân:

\[ \phi_E(z) = \left( \int_{i\infty}^{z} f_E(w)\, dw \pmod{\Lambda_E} \right) \]
trong đó $f_E \in S_2(\Gamma_0(N))$ là newform gắn với $E$, và $\Lambda_E$ là lưới chu kỳ của $E$.

Phép tham số hóa gọi là tối ưu (optimal) nếu $\phi_E$ không phân tích qua đường cong elliptic trung gian nào, tức $\ker(\phi_E)$ là đa tạp con Abel liên thông của $J_0(N)$ [cremona1997].

Ví dụ

Ví dụ (Tham số hóa cho $E = 11a1$). Xét $E: y^2 + y = x^3 - x^2 - 10x - 20$ (conductor $N = 11$).

Vì $X_0(11)$ có genus 1, nó cũng là đường cong elliptic. Phép tham số hóa $\phi: X_0(11) \to E$ trong trường hợp này là một isogeny giữa hai đường cong elliptic. Thực tế:

  • $X_0(11)$ đẳng cấu với $E': y^2 + y = x^3 - x^2$ (nhãn 11a3)
  • $\phi: E' \to E$ là isogeny bậc 5
  • Tham số hóa tối ưu: $X_0(11) \to E'$ (bậc 1), trong đó $E' = 11a3$ là đường cong tối ưu (optimal curve) tại mức 11

Newform tương ứng: $f_{11}(z) = q - 2q^2 - q^3 + 2q^4 + q^5 + \cdots \in S_2(\Gamma_0(11))$.

Ví dụ (Tham số hóa cho conductor 37). Tại $N = 37$, có 2 lớp đẳng cấu EC: $37a$ và $37b$.
  • $37a1: y^2 + y = x^3 - x$ (hạng 1, điểm $P = (0,0)$ sinh $E(\mathbb{Q}) \cong \mathbb{Z}$)
  • $37b1: y^2 + y = x^3 + x^2 - 23x - 50$ (hạng 0)
Mỗi đường cong có phép tham số hóa riêng $X_0(37) \to E$. Bậc modular: $m_{37a1} = 2$, $m_{37b1} = 2$.

Genus $g(X_0(37)) = 2$, nên $\dim S_2(\Gamma_0(37)) = 2$ --- đúng 2 newform, ứng với 2 lớp đẳng cấu.

Ý nghĩa trực giác

Tham số hóa modular --- “vẽ” đường cong elliptic lên mặt modular.
  • Hình dung: Phép tham số hóa $\phi: X_0(N) \to E$ giống việc “vẽ” đường cong elliptic $E$ lên “tấm bản đồ” $X_0(N)$. Mỗi điểm trên $E$ là “hình chiếu” của (có thể nhiều) điểm trên $X_0(N)$. Số lần “phủ” trung bình chính là bậc modular $\deg(\phi)$.
  • Tích phân = đường đi: Công thức $\phi_E(z) = \int_{i\infty}^z f_E(w)\,dw$ cho thấy: để tìm ảnh của $z$, ta “đi” từ cusp $i\infty$ đến $z$ trên $\mathcal{H}$, “tích lũy” giá trị $f_E$ dọc đường, rồi chiếu kết quả xuống $E \cong \mathbb{C}/\Lambda_E$.
  • Tồn tại = modularity: Sự tồn tại của $\phi$ là cách phát biểu hình học của Định lý modularity. Trước Wiles, câu hỏi “có $\phi$ hay không?” là bài toán mở cho mọi $E/\mathbb{Q}$. Bây giờ ta biết $\phi$ luôn tồn tại --- nhưng tính chất cụ thể (bậc, hằng số Manin) vẫn là đối tượng nghiên cứu.

Liên hệ với giả thuyết Birch--Dyer

Tham số hóa modular trong BSD.
  • Điểm Heegner qua $\phi$: Cho $K = \mathbb{Q}(\sqrt{-D})$ trường phức bậc hai ảo, $\tau_K \in \mathcal{H}$ điểm CM. Điểm Heegner trên $E$ là:
    \[ P_K = \phi_E(\tau_K) \in E(\bar{\mathbb{Q}}) \]
    Trace xuống $K$: $y_K = \sum_{\sigma \in \mathrm{Gal}(H/K)} P_K^\sigma \in E(K)$. Gross--Zagier chứng minh: $L'(E/K, 1) \neq 0 \Leftrightarrow \hat{h}(y_K) \neq 0$ [gross-zagier1986]. Phép tham số hóa $\phi$ chính là “máy sản xuất điểm hữu tỉ” --- nguyên liệu chính để chứng minh BSD hạng 1.
  • Pull-back vi phân: $\phi^*(\omega_E) = c_E \cdot 2\pi i f_E(z)\, dz$, trong đó $c_E$ là hằng số Manin. Quan hệ này kết nối vi phân Néron $\omega_E$ (đại số) với newform $f_E$ (giải tích) --- chính xác là cầu nối BSD cần.
137 Bậc modular (Modular degree) Ch.8 7

Định nghĩa

Định nghĩa (Bậc modular). Cho $\phi_E: X_0(N) \to E$ là phép tham số hóa modular tối ưu. Bậc modular (Modular degree) của $E$ là:
\[ m_E = \deg(\phi_E) \]
tức số nghịch ảnh (đếm bội) của một điểm tổng quát trên $E$.

Tương đương, nếu $\pi_E: J_0(N) \to E$ là ánh xạ surjective (qua Abel--Jacobi $X_0(N) \hookrightarrow J_0(N)$ rồi chiếu) và $\hat{\pi}_E: E \hookrightarrow J_0(N)$ là ánh xạ đối ngẫu, thì:

\[ \pi_E \circ \hat{\pi}_E = [m_E] : E \to E \]
là phép nhân $m_E$ trên $E$ [zagier1985].

Ví dụ

Ví dụ (Bậc modular cho conductor nhỏ). {c|c|c|c} Đường cong $E$ & Conductor $N$ & Hạng $r$ & Bậc modular $m_E$ \\ \hline $11a1: y^2 + y = x^3 - x^2 - 10x - 20$ & 11 & 0 & 1 \\ $37a1: y^2 + y = x^3 - x$ & 37 & 1 & 2 \\ $37b1: y^2 + y = x^3 + x^2 - 23x - 50$ & 37 & 0 & 2 \\ $389a1: y^2 + y = x^3 + x^2 - 2x$ & 389 & 2 & 40 \\ $5077a1: y^2 + y = x^3 - 7x + 6$ & 5077 & 3 & 1984

Nhận xét:

  • $m_E = 1$ rất hiếm --- chỉ xảy ra khi $X_0(N)$ có genus 1 và $\phi$ là đẳng cấu. Ví dụ: $N = 11$ (tối ưu), $N = 17, 19$.
  • $m_E$ tăng nhanh theo conductor $N$: asymptotic $m_E \sim c \cdot N$ (với hằng số phụ thuộc eigenform).
  • Hạng cao $\Rightarrow$ bậc modular lớn (xu hướng, không phải quy luật tuyệt đối).

Ý nghĩa trực giác

Bậc modular --- đo “sự phức tạp” của kết nối modular.
  • Hình dung: Nếu ta “gấp” $X_0(N)$ thành $E$ qua $\phi$, bậc modular $m_E$ đếm trung bình bao nhiêu “lớp” phủ lên nhau. $m_E = 1$ nghĩa là gấp hoàn hảo (1-1), $m_E = 40$ nghĩa là mặt modular phủ lên $E$ trung bình 40 lần.
  • Tính đồng dư: $m_E$ cũng đo “sự đồng dư” giữa $f_E$ và các dạng modular khác. Cụ thể, $m_E = \frac{\langle f_E, f_E \rangle}{\langle f_E, f_E \rangle_{\mathrm{int}}}$ (tỷ lệ Petersson norm trên phần “nguyên”). Các số nguyên tố $p | m_E$ là đồng dư số nguyên tố (congruence primes): tồn tại newform $g \neq f_E$ sao cho $a_n(f_E) \equiv a_n(g) \pmod{p}$ với mọi $n$.
  • Bậc modular lớn: Conductor $N$ lớn $\Rightarrow$ genus $g(X_0(N))$ lớn $\Rightarrow$ Jacobian $J_0(N)$ phức tạp $\Rightarrow$ cần “gấp nhiều hơn” để chiếu xuống $E$ (1 chiều). Bậc modular đo “mất mát thông tin” khi chiếu.

Liên hệ với giả thuyết Birch--Dyer

Bậc modular trong BSD.
  • Công thức Petersson--Zagier: Bậc modular liên hệ với Petersson norm:
    \[ m_E = \frac{(4\pi)^2 \langle f_E, f_E \rangle}{8\pi^2 \Omega_E^+ \Omega_E^-} \]
    (với chuẩn hóa phù hợp, giả sử hằng số Manin $c_E = 1$). Ở đây $\Omega_E^\pm$ là chu kỳ thực/ảo --- thành phần trong BSD mạnh [zagier1985].
  • Đồng dư $\Rightarrow$ BSD khó: Nếu $p | m_E$ (đồng dư số nguyên tố), chứng minh BSD tại $p$ đặc biệt khó --- vì $f_E$ và form khác “lẫn vào nhau” modulo $p$. Nhiều kỹ thuật (Skinner--Urban, Kato) phải loại trừ các $p | m_E$.
  • Watkins conjecture: Watkins (2002) phỏng đoán: $2^{\mathrm{rk}(E(\mathbb{Q}))} \mid m_E$ --- bậc modular chia hết cho $2^r$ với $r$ là hạng. Điều này đã được kiểm nghiệm rộng rãi nhưng chưa chứng minh. Nếu đúng, nó cho cận dưới cho $m_E$ theo hạng.
138 Hằng số Manin (Manin constant) Ch.8 8

Định nghĩa

Định nghĩa (Hằng số Manin). Cho $E/\mathbb{Q}$ đường cong elliptic conductor $N$, $f_E \in S_2(\Gamma_0(N))$ newform gắn với $E$, và $\phi_E: X_0(N) \to E$ phép tham số hóa tối ưu. Hằng số Manin (Manin constant) $c_E$ được định nghĩa bởi:
\[ \phi_E^*(\omega_E) = c_E \cdot 2\pi i f_E(z)\, dz \]
trong đó $\omega_E = \frac{dx}{2y + a_1 x + a_3}$ là vi phân Néron (vi phân bất biến chuẩn) trên mô hình tối thiểu của $E$.

Nói cách khác, $c_E$ đo tỷ lệ giữa:

  • Phía đại số: vi phân Néron $\omega_E$ (đến từ phương trình Weierstrass tối thiểu)
  • Phía giải tích: $2\pi i f_E(z)\, dz$ (đến từ newform modular)
sau khi kéo về qua $\phi_E$ [cremona1997].

Giả thiết (Phỏng đoán Manin). Cho $E/\mathbb{Q}$ là đường cong tối ưu (optimal curve) trong lớp đẳng cấu isogeny. Khi đó:
\[ c_E = 1 \]
Phỏng đoán do Manin (1972) đưa ra. Nó phát biểu rằng hai chuẩn hóa tự nhiên --- đại số (Néron) và giải tích (modular) --- khớp nhau hoàn hảo cho đường cong tối ưu.

Ví dụ

Ví dụ (Trạng thái phỏng đoán Manin).
  1. Trường hợp bán ổn định (semistable: chỉ có rút gọn tốt hoặc nhân): Phỏng đoán Manin đúng. Chứng minh bởi Mazur (1978): nếu $E$ bán ổn định, $c_E \in \mathbb{Z}$ và $c_E | \gcd(m_E, N)$. Kết hợp kỹ thuật khác $\Rightarrow$ $c_E = 1$.
  2. Trường hợp tổng quát: $c_E \in \mathbb{Q}$ luôn là số nguyên, và $c_E \in \{1, 2, 3, 4, 5, \ldots\}$ (Edixhoven 1991: $c_E \in \mathbb{Z}$). Phỏng đoán rằng $c_E = 1$.
  3. Kiểm nghiệm: Cremona đã xác nhận $c_E = 1$ cho tất cả đường cong tối ưu trong cơ sở dữ liệu (conductor $\leq 500{,}000$) --- hàng triệu trường hợp, không ngoại lệ.
  4. Hệ quả nếu sai: Nếu $c_E \neq 1$, công thức BSD mạnh cần nhân thêm $c_E^2$:
    \[ \frac{L^{(r)}(E,1)}{r!} = \frac{|\mathrm{Sha}| \cdot \mathrm{Reg}_E \cdot \Omega_E \cdot \prod c_p}{|E(\mathbb{Q})_{\mathrm{tors}}|^2} \cdot c_E^{-2} \]
    Vậy $c_E = 1$ “đơn giản hóa” BSD.

Ý nghĩa trực giác

Hằng số Manin --- “hệ số quy đổi” giữa hai thước đo.
  • Hình dung: Hãy nghĩ $E$ có hai “thước đo” tự nhiên:
    1. Thước đại số: vi phân Néron $\omega_E$, đến từ phương trình Weierstrass tối thiểu --- “nội tại” cho $E$.
    2. Thước modular: $2\pi i f_E(z)\, dz$, đến từ newform --- đến từ “thế giới modular”.
    Hằng số Manin $c_E$ là “tỷ giá quy đổi” giữa hai thước. Phỏng đoán Manin nói tỷ giá là 1:1.
  • Tương tự đời thường: Giống việc đo chiều dài bằng mét (hệ SI) và bằng foot (hệ Anh). Hai hệ đo “tự nhiên” trong ngữ cảnh riêng, nhưng hệ số quy đổi ($1 \text{ ft} = 0.3048 \text{ m}$) không bằng 1. Phỏng đoán Manin nói: cho EC, hai hệ đo tự nhiên trùng khớp ($c_E = 1$) --- một sự hài hòa đáng ngạc nhiên.
  • Tại sao tin? Hàng triệu ví dụ xác nhận $c_E = 1$. Lý do sâu xa: cả $\omega_E$ lẫn $f_E dz$ đều là “canonical” trong nghĩa tương ứng --- Néron model cho vi phân đẹp nhất về đại số, modularity cho form đẹp nhất về giải tích. Hai “đẹp nhất” nên trùng nhau.

Liên hệ với giả thuyết Birch--Dyer

Hằng số Manin trong BSD.
  • Trong BSD mạnh: Công thức BSD mạnh viết gọn (khi $r = \mathrm{ord}_{s=1} L(E,s)$):
    \[ \frac{L^{(r)}(E,1)}{r!} = \frac{|\mathrm{Sha}(E/\mathbb{Q})| \cdot \mathrm{Reg}_E \cdot \Omega_E \cdot \prod_p c_p}{|E(\mathbb{Q})_{\mathrm{tors}}|^2} \]
    Ở đây $\Omega_E = \int_{E(\mathbb{R})} |\omega_E|$ dùng vi phân Néron. Nếu $c_E \neq 1$, ta phải thay $\Omega_E$ bằng $c_E^{-1} \Omega_E$ (hoặc nhân thêm $c_E^{-2}$) --- công thức phức tạp hơn. Phỏng đoán Manin giữ BSD “sạch”.
  • Kiểm nghiệm BSD cần Manin: Khi kiểm nghiệm BSD mạnh bằng máy tính (Cremona, LMFDB), luôn giả định $c_E = 1$. Nếu kết quả khớp $\Rightarrow$ bằng chứng gián tiếp cho cả BSD Manin. Mọi kiểm nghiệm đến nay đều khớp.
  • Skinner--Urban cần Manin: Nhiều kết quả “BSD mạnh cho $p$-part” (Skinner--Urban, Kato) giả định $c_E = 1$ hoặc $p \nmid c_E$. Chứng minh Manin sẽ mở rộng phạm vi áp dụng của các định lý này.
139 Quan hệ Eichler–Shimura (Eichler–Shimura relation) Ch.8 8

Định nghĩa

Định nghĩa (Quan hệ Eichler--Shimura). Cho $E/\mathbb{Q}$ đường cong elliptic conductor $N$, $f_E \in S_2(\Gamma_0(N))$ newform gắn với $E$, và $p \nmid N$ số nguyên tố rút gọn tốt. Quan hệ Eichler--Shimura (Eichler--Shimura relation) phát biểu rằng trên $\bar{\mathbb{F}}_p$:
\[ \mathrm{Frob}_p^2 - a_p(f_E) \cdot \mathrm{Frob}_p + p = 0 \]
trong đó $\mathrm{Frob}_p$ là tự đồng cấu Frobenius, và $a_p(f_E) = a_p(E) = p + 1 - \#E(\mathbb{F}_p)$.

Tương đương, đa thức đặc trưng của Frobenius tại $p$ trên module Tate $T_\ell(E)$ ($\ell \neq p$) là $X^2 - a_p(f_E) X + p$ [eichler1954, shimura1971].

Ví dụ

Ví dụ (Kiểm nghiệm Eichler--Shimura). Xét $E: y^2 + y = x^3 - x^2$ (conductor 11), newform $f_{11} = q - 2q^2 - q^3 + 2q^4 + q^5 + \cdots$.

Tại $p = 5$: $a_5(f_{11}) = 1$. Đếm điểm: $\#E(\mathbb{F}_5) = 5$, nên $a_5(E) = 5 + 1 - 5 = 1$ ✓.

Quan hệ Eichler--Shimura: $\mathrm{Frob}_5^2 - \mathrm{Frob}_5 + 5 = 0$. Nghiệm $X^2 - X + 5 = 0$: $\alpha, \beta = \frac{1 \pm \sqrt{-19}}{2}$, $|\alpha| = |\beta| = \sqrt{5}$ (xác nhận cận Hasse).

Ý nghĩa trực giác

Eichler--Shimura --- “đá Rosetta” của lý thuyết số.
  • Hình dung: Hai “ngôn ngữ” mô tả cùng đối tượng: (1) hệ số Fourier $a_p(f_E)$ (phía modular), (2) vết Frobenius $a_p(E) = p+1-\#E(\mathbb{F}_p)$ (phía số học). Eichler--Shimura nói: $a_p(f_E) = a_p(E)$ --- hai ngôn ngữ đồng nghĩa.
  • Lịch sử: Eichler (1954) chứng minh cho $X_0(N)$, Shimura (1958) tổng quát. Đây là tiền thân của modularity --- nói “nếu $E$ đến từ dạng modular, thì $a_p$ khớp”; Wiles chứng minh “mọi $E/\mathbb{Q}$ đều đến từ dạng modular”.

Liên hệ với giả thuyết Birch--Dyer

Eichler--Shimura trong BSD.
  • Nền tảng: Eichler--Shimura đảm bảo hàm $L$ từ Fourier ($\sum a_n(f_E) n^{-s}$) và hàm $L$ từ đếm điểm ($\prod_p L_p(E, p^{-s})^{-1}$) là cùng hàm. Không có nó, BSD không phát biểu được.
  • Thác triển: Vì $a_p(f_E) = a_p(E)$, hàm $L(E,s)$ thừa hưởng thác triển giải tích từ $L(f_E,s)$. Giá trị $L(E,1)$ chỉ có nghĩa nhờ thác triển này.
140 Phỏng đoán Taniyama–Shimura–Weil (Taniyama–Shimura–Weil Conjecture) Ch.1 6

Định nghĩa

Giả thiết (Phỏng đoán Taniyama--Shimura--Weil (nay là Định lý)). Mọi đường cong elliptic $E/\mathbb{Q}$ conductor $N$ đều là modular (modular): tồn tại newform $f_E \in S_2(\Gamma_0(N))$ sao cho $L(E, s) = L(f_E, s)$.

Tương đương, tồn tại ánh xạ surjective không hằng $\phi: X_0(N) \to E$ định nghĩa trên $\mathbb{Q}$ [weil1967].

Ví dụ

Ví dụ (Lịch sử hình thành).
  1. 1955: Taniyama đặt câu hỏi tại hội nghị Tokyo--Nikko.
  2. 1967: Shimura phát triển khuôn khổ chính xác. Weil chứng minh “định lý ngược” hỗ trợ phỏng đoán.
  3. 1995: Wiles chứng minh cho EC bán ổn định [wiles1995] --- đủ cho Định lý Fermat.
  4. 2001: Breuil--Conrad--Diamond--Taylor chứng minh đầy đủ [breuil-etal2001].

Ý nghĩa trực giác

TSW --- “mọi EC đều có hộ chiếu modular”.
  • Hình dung: Mỗi EC/$\mathbb{Q}$ có “hộ chiếu modular” --- chứng minh nó đến từ thế giới dạng modular. Khi có hộ chiếu, ta được “miễn phí”: thác triển giải tích, phương trình hàm, kỹ thuật Heegner, Kolyvagin, Iwasawa\ldots
  • Langlands: TSW là trường hợp $\mathrm{GL}_2/\mathbb{Q}$ của chương trình Langlands --- viễn cảnh vĩ đại kết nối biểu diễn tự đồng cấu và biểu diễn Galois.

Liên hệ với giả thuyết Birch--Dyer

TSW trong BSD.
  • Tiên quyết: Không có modularity, $L(E,s)$ chỉ định nghĩa cho $\mathrm{Re}(s) > 3/2$. Giá trị $L(E,1)$ nằm ngoài vùng hội tụ. Modularity cho thác triển $\Rightarrow$ $L(E,1)$ có nghĩa $\Rightarrow$ BSD phát biểu được.
  • Mở cửa cho Kolyvagin: Sau Wiles (1995) + BCDT (2001), mọi EC/$\mathbb{Q}$ modular $\Rightarrow$ kỹ thuật Kolyvagin áp dụng $\Rightarrow$ BSD đúng cho hạng 0 và 1.
141 Định lý modularity (Modularity Theorem (Wiles, BCDT)) Ch.1 8

Định nghĩa

Định lý (Định lý modularity (Wiles 1995, BCDT 2001)). Mọi đường cong elliptic $E/\mathbb{Q}$ đều modular. Cụ thể, cho $E/\mathbb{Q}$ conductor $N$:
  1. Tồn tại duy nhất newform $f_E \in S_2(\Gamma_0(N))$ sao cho $a_p(f_E) = a_p(E)$ với mọi $p \nmid N$.
  2. Tồn tại ánh xạ surjective $\phi: X_0(N) \to E$ định nghĩa trên $\mathbb{Q}$.
  3. Biểu diễn Galois $\rho_{E,p}: G_\mathbb{Q} \to \mathrm{GL}_2(\mathbb{Z}_p)$ là modular với mọi $p$.
Ba phát biểu tương đương [wiles1995, breuil-etal2001].

Ví dụ

Ví dụ (Ý tưởng chứng minh Wiles).
  1. Xét biểu diễn thặng dư $\bar{\rho}_{E,3}: G_\mathbb{Q} \to \mathrm{GL}_2(\mathbb{F}_3)$.
  2. Dùng Langlands--Tunnell: $\bar{\rho}_{E,3}$ modular (vì $\mathrm{GL}_2(\mathbb{F}_3)$ khả giải).
  3. “Nâng” (lift): chứng minh $\rho_{E,3}$ modular bằng kỹ thuật $R = T$.
  4. Taylor--Wiles patching: vượt qua trở ngại kỹ thuật.

Timeline:

Năm Tác giả Kết quả
1995 Wiles; Taylor--Wiles EC bán ổn định
1999 Diamond; Conrad--Diamond--Taylor Mở rộng
2001 Breuil--Conrad--Diamond--Taylor Mọi EC/$\mathbb{Q}$

Ý nghĩa trực giác

Modularity --- “thống nhất vĩ đại”.
  • Hình dung: Hai “châu lục” --- EC (hình học đại số) và dạng modular (giải tích phức) --- nối bằng “cầu” modularity. Trước Wiles, cầu chỉ biết cho EC có CM. Wiles chứng minh cầu luôn tồn tại.
  • Hệ quả: (a) Định lý Fermat. (b) Mọi $L(E,s)$ có thác triển. (c) BSD phát biểu được cho mọi EC/$\mathbb{Q}$.

Liên hệ với giả thuyết Birch--Dyer

Modularity trong BSD.
  • Không modularity, không BSD: Mọi kết quả BSD (Coates--Wiles, Gross--Zagier, Kolyvagin, Kato, Skinner--Urban) đều sử dụng modularity.
  • Rào cản cho trường số: Cho $E$ trên trường số $K \neq \mathbb{Q}$, modularity chưa biết nói chung. Tiến bộ: Freitas--Le Hung--Siksek (2015) chứng minh cho EC trên trường toàn phần thực.
142 Biểu diễn Galois (Galois representation $\rho_{E,p}: G_{\mathbb{Q}} \to \mathrm{GL}_2(\mathbb{Z}_p)$) Ch.2 7

Định nghĩa

Định nghĩa (Biểu diễn Galois $p$-adic gắn với EC). Cho $E/\mathbb{Q}$ và $p$ nguyên tố. Biểu diễn Galois $p$-adic ($p$-adic Galois representation) gắn với $E$ là đồng cấu liên tục:
\[ \rho_{E,p} : G_\mathbb{Q} = \mathrm{Gal}(\bar{\mathbb{Q}}/\mathbb{Q}) \longrightarrow \mathrm{GL}_2(\mathbb{Z}_p) \]
đến từ tác động $G_\mathbb{Q}$ lên module Tate $T_p(E) \cong \mathbb{Z}_p^2$.

Tính chất chính: $\rho_{E,p}$ không phân nhánh tại $\ell \nmid Np$, và tại đó $\mathrm{tr}(\rho_{E,p}(\mathrm{Frob}_\ell)) = a_\ell$, $\det(\rho_{E,p}(\mathrm{Frob}_\ell)) = \ell$ [serre1968, silverman2009].

Ví dụ

Ví dụ (Tính chất của $\rho_{E,p}$).
  1. Định thức: $\det(\rho_{E,p}) = \chi_p$ (ký tự cyclotomic $p$-adic).
  2. Ví dụ CM: $E: y^2 = x^3 - x$ (CM bởi $\mathbb{Z}[i]$), $p = 5$. Tại $\ell = 3$: $a_3 = 0$ (vì $\#E(\mathbb{F}_3) = 4$). Đa thức Frobenius: $X^2 + 3 = 0$, nghiệm $\pm\sqrt{-3}$ --- “xoay $90°$” đặc trưng CM.
  3. Toàn bộ $a_\ell$ gói gọn: Biết $\rho_{E,p}$ $\Leftrightarrow$ biết tất cả $a_\ell$ $\Leftrightarrow$ biết $L(E,s)$.

Ý nghĩa trực giác

$\rho_{E,p}$ --- “mã hóa” đối xứng số học vào ma trận.
  • Hình dung: $G_\mathbb{Q}$ là “nhóm đối xứng” khổng lồ của số học. Biểu diễn $\rho_{E,p}$ “trích xuất” phần liên quan $E$, gói vào ma trận $2 \times 2$ trên $\mathbb{Z}_p$.
  • Tại sao $2 \times 2$? Vì $E[p^n] \cong (\mathbb{Z}/p^n\mathbb{Z})^2$ --- điểm xoắn tạo không gian 2 chiều. Đa tạp Abel $g$ chiều cho ma trận $2g \times 2g$.

Liên hệ với giả thuyết Birch--Dyer

$\rho_{E,p}$ trong BSD.
  • Ngôn ngữ Wiles: Wiles chứng minh modularity bằng cách so sánh biểu diễn Galois, không so sánh $a_p$ trực tiếp.
  • Selmer qua Galois: Nhóm Selmer $\mathrm{Sel}_p(E/\mathbb{Q}) \subset H^1(G_\mathbb{Q}, E[p])$ --- mọi đối tượng BSD sống trong thế giới biểu diễn Galois.
  • Bloch--Kato: Tổng quát BSD cho mọi “motif” (biểu diễn Galois tổng quát).
143 Module Tate (Tate module $T_p(E)$) Ch.4 6

Định nghĩa

Định nghĩa (Module Tate). Cho $E$ đường cong elliptic trên trường $K$ và $p$ nguyên tố ($p \neq \mathrm{char}(K)$). Module Tate (Tate module) $p$-adic là giới hạn ngược:
\[ T_p(E) = \varprojlim_n E[p^n] \]
qua ánh xạ nhân $[p]: E[p^{n+1}] \to E[p^n]$. Đây là $\mathbb{Z}_p$-module tự do hạng 2: $T_p(E) \cong \mathbb{Z}_p^2$.

Không gian hữu tỉ: $V_p(E) = T_p(E) \otimes_{\mathbb{Z}_p} \mathbb{Q}_p \cong \mathbb{Q}_p^2$ [silverman2009, tate1975].

Ví dụ

Ví dụ (Module Tate cho $p = 2$). Xét $E: y^2 = x^3 - x$ trên $\mathbb{Q}$.
  • $E[2] = \{(0,0), (1,0), (-1,0), \mathcal{O}\} \cong (\mathbb{Z}/2\mathbb{Z})^2$.
  • $E[4]$: 16 điểm, $E[8]$: 64 điểm, $E[2^n]$: $4^n$ điểm.
  • $T_2(E) = \varprojlim E[2^n] \cong \mathbb{Z}_2^2$: phần tử là dãy $(P_1, P_2, \ldots)$ với $P_n \in E[2^n]$, $[2]P_{n+1} = P_n$.

Ý nghĩa trực giác

$T_p(E)$ --- “phóng to vô hạn” cấu trúc $p$-adic.
  • Hình dung: $E[p]$ là “lưới thô” ($p^2$ điểm), $E[p^2]$ mịn hơn ($p^4$ điểm)\ldots{} $T_p(E)$ là giới hạn khi lưới vô cùng mịn.
  • Tương tự: Giống $\mathbb{Z}_p = \varprojlim \mathbb{Z}/p^n\mathbb{Z}$, ở đây “xếp chồng” $E[p^n] \cong (\mathbb{Z}/p^n\mathbb{Z})^2$.

Liên hệ với giả thuyết Birch--Dyer

$T_p(E)$ trong BSD.
  • Nguồn gốc $\rho_{E,p}$: Tác động $G_\mathbb{Q}$ trên $T_p(E)$ cho biểu diễn $\rho_{E,p}: G_\mathbb{Q} \to \mathrm{GL}_2(\mathbb{Z}_p)$ --- nguyên liệu cốt lõi cho modularity và BSD.
  • Selmer: Nhóm Selmer $p^\infty$ dùng $E[p^\infty] = T_p(E) \otimes \mathbb{Q}_p/\mathbb{Z}_p$. Module Tate là “xương sống” của Selmer.
  • Iwasawa: Module Iwasawa cho BSD $p$-adic xây trên $T_p(E)$ mở rộng lên tháp cyclotomic.
144 Biểu diễn thặng dư (Residual representation $\bar{\rho}_{E,p}$) Ch.8 8

Định nghĩa

Định nghĩa (Biểu diễn thặng dư). Cho $E/\mathbb{Q}$ và $p$ nguyên tố. Biểu diễn thặng dư (Residual representation) mod $p$ là:
\[ \bar{\rho}_{E,p} : G_\mathbb{Q} \longrightarrow \mathrm{GL}_2(\mathbb{F}_p) \]
thu được bằng rút gọn $\rho_{E,p}$ modulo $p$. Tương đương, $\bar{\rho}_{E,p}$ mô tả tác động $G_\mathbb{Q}$ trên $E[p] \cong \mathbb{F}_p^2$.

$\bar{\rho}_{E,p}$ gọi là bất khả quy nếu không tồn tại đường thẳng $L \subset E[p]$ bất biến dưới $G_\mathbb{Q}$ [serre1968].

Ví dụ

Ví dụ (Vai trò trong chứng minh Wiles).
  1. Wiles chọn $p = 3$: Vì $\mathrm{GL}_2(\mathbb{F}_3)$ khả giải, Langlands--Tunnell chứng minh $\bar{\rho}_{E,3}$ modular. Đây là “bước đầu tiên”.
  2. “3-5 switch”: Nếu $\bar{\rho}_{E,3}$ khả quy (có nhóm con bậc 3 bất biến), Wiles chuyển sang $p = 5$: tìm EC phụ $E'$ với $\bar{\rho}_{E',5} \cong \bar{\rho}_{E,5}$ và $\bar{\rho}_{E',3}$ bất khả quy, chứng minh $E'$ modular, suy ra $E$ modular.
  3. Mazur: Với $p > 163$, $\bar{\rho}_{E,p}$ tự động bất khả quy cho mọi EC/$\mathbb{Q}$ (không có $p$-isogeny hữu tỉ).

Ý nghĩa trực giác

$\bar{\rho}_{E,p}$ --- “bản phác thảo” của biểu diễn đầy đủ.
  • Hình dung: $\rho_{E,p}$ là “bức tranh chi tiết” (trên $\mathbb{Z}_p$), $\bar{\rho}_{E,p}$ là “phác thảo” (trên $\mathbb{F}_p$). Phác thảo mất chi tiết nhưng giữ hình dạng tổng thể.
  • Chiến lược Wiles: (1) chứng minh phác thảo $\bar{\rho}$ modular (dễ --- nhóm hữu hạn); (2) “nâng” thành $\rho$ modular (khó --- dùng $R = T$).

Liên hệ với giả thuyết Birch--Dyer

$\bar{\rho}_{E,p}$ trong BSD.
  • Bất khả quy giúp BSD: Kato, Skinner--Urban yêu cầu $\bar{\rho}_{E,p}$ bất khả quy. Khi khả quy, kỹ thuật phức tạp hơn nhiều.
  • Selmer mod $p$: $\mathrm{Sel}_p(E/\mathbb{Q}) \subset H^1(G_\mathbb{Q}, E[p])$, trong đó $E[p]$ là không gian của $\bar{\rho}_{E,p}$. Hiểu $\bar{\rho}$ giúp hiểu Selmer.
145 Vành biến dạng (Deformation ring $R$) Ch.8 9

Định nghĩa

Định nghĩa (Vành biến dạng). Cho $\bar{\rho}: G_\mathbb{Q} \to \mathrm{GL}_2(\mathbb{F}_p)$ biểu diễn thặng dư (ví dụ $\bar{\rho} = \bar{\rho}_{E,p}$). Một biến dạng (deformation) của $\bar{\rho}$ là biểu diễn:
\[ \rho: G_\mathbb{Q} \to \mathrm{GL}_2(A) \]
trong đó $A$ là vành địa phương Noether đầy đủ với trường thặng dư $\mathbb{F}_p$, sao cho $\rho \pmod{\mathfrak{m}_A} = \bar{\rho}$.

Nếu $\bar{\rho}$ bất khả quy, lý thuyết Mazur (1989) chứng minh tồn tại vành biến dạng phổ dụng (universal deformation ring) $R$ và biến dạng phổ dụng $\rho^{\mathrm{univ}}: G_\mathbb{Q} \to \mathrm{GL}_2(R)$: mọi biến dạng đều phân tích qua $R$ [mazur1989].

Ví dụ

Ví dụ (Vành biến dạng trong chứng minh Wiles). Wiles xét $\bar{\rho} = \bar{\rho}_{E,3}$ bất khả quy. Ông xây dựng:
  • $R$: vành biến dạng phổ dụng --- tham số hóa mọi cách “nâng” $\bar{\rho}$ lên $\mathbb{Z}_3$.
  • $T = \mathbb{T}$: vành Hecke --- tham số hóa các “nâng modular” (đến từ dạng modular).
  • Ánh xạ tự nhiên $\pi: R \twoheadrightarrow T$ (mọi nâng modular là biến dạng).
  • Mục tiêu: $R = T$ ($\pi$ là đẳng cấu), tức mọi biến dạng đều modular.
Nếu $R = T$, thì $\rho_{E,3}$ (là biến dạng của $\bar{\rho}$) tự động modular $\Rightarrow$ $E$ modular.

Ý nghĩa trực giác

$R$ --- “không gian tham số” cho biểu diễn Galois.
  • Hình dung: $\bar{\rho}$ là “điểm” (biểu diễn mod $p$). Các biến dạng là “lân cận” của điểm đó --- biểu diễn “gần” $\bar{\rho}$ nhưng chính xác hơn ($p$-adic thay vì mod $p$). Vành $R$ là “không gian tham số” của lân cận này.
  • Tương tự: Giống “không gian tiếp tuyến”. Điểm $\bar{\rho}$ nằm trên “đa tạp biểu diễn”; $R$ mô tả “hình dạng cục bộ” quanh $\bar{\rho}$.

Liên hệ với giả thuyết Birch--Dyer

$R$ trong BSD.
  • $R = T$ $\Rightarrow$ modularity $\Rightarrow$ BSD khả thi: Chuỗi logic then chốt. Không có $R = T$, không chứng minh được modularity cho EC tổng quát, không có thác triển $L(E,s)$, không phát biểu được BSD.
  • Skinner--Urban: Sử dụng biến thể $R = T$ cho $\mathrm{GL}_2 \times \mathrm{GL}_1$ trong chứng minh phỏng đoán chính Iwasawa, từ đó BSD $p$-part cho hạng 0 và 1.
146 Vành Hecke (Hecke algebra $\mathbb{T}$) Ch.8 8

Định nghĩa

Định nghĩa (Vành Hecke). Cho $N \geq 1$ và $k \geq 1$. Vành Hecke (Hecke algebra) mức $N$ trọng số $k$ là:
\[ \mathbb{T} = \mathbb{T}_{k}(\Gamma_0(N)) = \mathbb{Z}[T_n : n \geq 1] \subset \mathrm{End}(S_k(\Gamma_0(N))) \]
vành con của vành tự đồng cấu của $S_k$, sinh bởi các toán tử Hecke $T_n$.

$\mathbb{T}$ là $\mathbb{Z}$-đại số giao hoán, hữu hạn sinh, tự do hạng bằng $\dim S_k(\Gamma_0(N))$.

Trong ngữ cảnh modularity ($k = 2$): cho $\bar{\rho}$ biểu diễn thặng dư, $\mathbb{T}$ là thương “modular” tham số hóa các biến dạng modular --- tức các biểu diễn Galois đến từ eigenform [diamond-shurman2005].

Ví dụ

Ví dụ (Vành Hecke cho mức nhỏ).
  1. Mức $N = 11$: $\dim S_2(\Gamma_0(11)) = 1$. Duy nhất newform $f_{11}$. Vành Hecke $\mathbb{T} \cong \mathbb{Z}$, với $T_p \mapsto a_p(f_{11})$: $T_2 \mapsto -2$, $T_3 \mapsto -1$, $T_5 \mapsto 1$.
  2. Mức $N = 37$: $\dim S_2(\Gamma_0(37)) = 2$, hai newform $f_{37a}, f_{37b}$. Vành Hecke $\mathbb{T} \cong \mathbb{Z} \times \mathbb{Z}$, mỗi thành phần ứng eigenform.
  3. Mức $N = 23$: $\dim S_2(\Gamma_0(23)) = 2$, nhưng chỉ có 1 newform với hệ số trong $\mathbb{Z}[\alpha]$, $\alpha^2 - \alpha - 1 = 0$ (số Fibonacci vàng!). Vành Hecke $\mathbb{T} \cong \mathbb{Z}[\alpha]$ --- không phải tích $\mathbb{Z} \times \mathbb{Z}$.

Ý nghĩa trực giác

$\mathbb{T}$ --- “vành tọa độ” của thế giới modular.
  • Hình dung: $\mathbb{T}$ giống “vành tọa độ” trên “không gian” các eigenform. Mỗi eigenform là “điểm”; hệ số $a_n$ là “tọa độ”. Đồng cấu $\mathbb{T} \to \mathbb{Z}$ (hoặc $\to \bar{\mathbb{Z}}$) tương ứng 1-1 với eigenform.
  • $R = T$ dịch ra: “Không gian tham số biểu diễn Galois (gần $\bar{\rho}$)” $=$ “không gian tham số dạng modular (gần $f_E$)”. Hai thế giới “cùng hình dạng”.

Liên hệ với giả thuyết Birch--Dyer

$\mathbb{T}$ trong BSD.
  • $R = T$: Đẳng cấu $R \cong \mathbb{T}$ là trái tim chứng minh Wiles. Phía $R$ mã hóa thông tin Galois (số học); phía $\mathbb{T}$ mã hóa thông tin modular (giải tích). Bằng nhau $\Leftrightarrow$ modularity.
  • Đồng dư modular: Cấu trúc $\mathbb{T}$ phản ánh đồng dư giữa eigenform. Đồng dư $f_E \equiv g \pmod{p}$ gây khó khăn cho BSD tại $p$.
147 Phương pháp Taylor–Wiles patching (Taylor–Wiles patching) Ch.8 10

Định nghĩa

Định nghĩa (Taylor--Wiles patching). Taylor--Wiles patching (Taylor--Wiles patching) là kỹ thuật chứng minh $R = T$ (vành biến dạng = vành Hecke) bằng cách:
  1. Chọn dãy tập “Taylor--Wiles primes” $Q_n = \{q_1^{(n)}, \ldots, q_r^{(n)}\}$, mỗi $q_i^{(n)} \equiv 1 \pmod{p^n}$.
  2. Xét “vành phụ trợ” $R_{Q_n}$ và $T_{Q_n}$ (cho phép phân nhánh thêm tại $Q_n$).
  3. Chứng minh $R_{Q_n} = T_{Q_n}$ cho mỗi $n$ (dễ hơn vì thêm biến).
  4. “Vá” (patch) các đẳng cấu $R_{Q_n} = T_{Q_n}$ khi $n \to \infty$ để được $R = T$.
Kỹ thuật do Taylor--Wiles (1995) phát minh, khắc phục trở ngại trong bản thảo ban đầu (1993) của Wiles [taylor-wiles1995].

Ví dụ

Ví dụ (Tại sao cần patching?). Bản thảo 1993 của Wiles (trước khi Taylor tham gia) có lỗ hổng: cần chứng minh ánh xạ $R \to T$ là đẳng cấu, nhưng hai vành có thể có cấu trúc rất khác. Taylor đề xuất:
  • Thêm “biến phụ” (primes in $Q_n$) biến $R, T$ thành $R_{Q_n}, T_{Q_n}$ “lớn hơn” nhưng “đều đặn hơn” (polynomial ring).
  • Ở mức $Q_n$: đẳng cấu dễ chứng minh (vì thêm biến “đơn giản hóa” cấu trúc).
  • Kỹ thuật “giới hạn ngược” (patching): lấy giới hạn khi $n \to \infty$ để loại biến phụ, thu được $R = T$ ban đầu.

Wiles mô tả: “Đó là ý tưởng đẹp nhất mà tôi từng thấy trong toán học.”

Ý nghĩa trực giác

Patching --- “vá lỗ hổng” bằng giới hạn ngược.
  • Hình dung: Cần chứng minh hai mảnh ghép (puzzle) $R$ và $T$ khớp nhau. Trực tiếp: khó. Thay vào đó: thêm “mảnh phụ” vào cả hai bên, tạo puzzle lớn hơn nhưng dễ khớp hơn. Sau khi khớp puzzle lớn, “gỡ bỏ” mảnh phụ --- kết quả: $R = T$.
  • Cách mạng: Patching trở thành công cụ chuẩn --- dùng trong BCDT (2001), Khare--Wintenberger (phỏng đoán Serre), Calegari--Geraghty (modularity bậc cao), Scholze\ldots

Liên hệ với giả thuyết Birch--Dyer

Patching trong BSD.
  • Nền tảng modularity: Patching $\Rightarrow$ $R = T$ $\Rightarrow$ modularity $\Rightarrow$ thác triển $L(E,s)$ $\Rightarrow$ BSD phát biểu được. Chuỗi logic không thể thiếu.
  • Ứng dụng trực tiếp: Biến thể patching xuất hiện trong Skinner--Urban (Iwasawa main conjecture) và các chứng minh BSD $p$-part.
148 Sơ đồ Frey–Ribet–Wiles (Frey–Ribet–Wiles strategy) Ch.8 7

Định nghĩa

Định nghĩa (Sơ đồ Frey--Ribet--Wiles). Sơ đồ Frey--Ribet--Wiles (Frey--Ribet--Wiles strategy) là chuỗi suy luận chứng minh Định lý Fermat:

\fbox{Giả sử $a^p + b^p = c^p$} $\xrightarrow{\text{Frey}}$ \fbox{Đường cong Frey $E_{a,b,c}$} $\xrightarrow{\text{Wiles}}$ \fbox{$E$ modular} $\xrightarrow{\text{Ribet}}$ \fbox{$f \in S_2(\Gamma_0(2))$} $\xrightarrow{\dim = 0}$ \fbox{Mâu thuẫn!}

Chi tiết:

  1. Frey (1985): Nếu $a^p + b^p = c^p$ nghiệm nontrivial, xây dựng $E: y^2 = x(x-a^p)(x+b^p)$ (đường cong Frey) --- EC bán ổn định, conductor lạ.
  2. Ribet (1990): Nếu $E$ modular, “hạ mức” (level lowering): $\bar{\rho}_{E,p}$ đến từ dạng modular mức $N = 2$ [ribet1990].
  3. Mâu thuẫn: $S_2(\Gamma_0(2)) = 0$ (genus $X_0(2) = 0$, không có cusp form). Không tồn tại dạng modular mức 2 $\Rightarrow$ $\bar{\rho}_{E,p}$ không tồn tại $\Rightarrow$ đường cong Frey không tồn tại $\Rightarrow$ nghiệm $a^p + b^p = c^p$ không tồn tại.

Ví dụ

Ví dụ (Lịch sử sơ đồ). {c|l} 1985 & Frey: đề xuất đường cong $E_{a,b,c}$, nhận ra tính chất lạ \\ 1986 & Serre: phỏng đoán “hạ mức” ($\epsilon$-conjecture) \\ 1990 & Ribet: chứng minh phỏng đoán Serre $\Rightarrow$ FLT quy về modularity \\ 1993 & Wiles: công bố chứng minh modularity (có lỗ) \\ 1995 & Wiles + Taylor: sửa lỗ bằng patching $\Rightarrow$ FLT hoàn tất

Ribet kể: “Khi chứng minh level lowering xong, tôi biết Định lý Fermat đúng --- chỉ cần ai đó chứng minh modularity.”

Ý nghĩa trực giác

FRW --- “chứng minh bằng phản chứng qua ba bước”.
  • Hình dung: Giả sử có “tội phạm” (nghiệm Fermat). Frey tạo “dấu vân tay” (đường cong Frey). Wiles chứng minh vân tay phải nằm trong “cơ sở dữ liệu” (modular). Ribet chứng minh vân tay phải ở “ngăn trống” (mức 2) --- mâu thuẫn!
  • Bất ngờ: FLT (bài toán số học sơ cấp, 350 năm) được giải bằng lý thuyết dạng modular và biểu diễn Galois --- hai lĩnh vực có vẻ hoàn toàn không liên quan.

Liên hệ với giả thuyết Birch--Dyer

FRW trong BSD.
  • Động lực cho modularity: Sơ đồ FRW là động lực chính thúc đẩy Wiles chứng minh modularity. Và modularity là tiên quyết cho BSD. Vậy gián tiếp: FLT là chất xúc tác cho tiến bộ BSD.
  • Kỹ thuật dùng lại: Level lowering (Ribet) và $R = T$ (Wiles) đều được sử dụng lại trong các chứng minh BSD --- ví dụ Skinner--Urban dùng level lowering cho Iwasawa main conjecture.
149 Đường cong Frey (Frey curve) Ch.8 6

Định nghĩa

Định nghĩa (Đường cong Frey). Giả sử tồn tại nghiệm nontrivial $a^p + b^p = c^p$ (với $p \geq 5$ nguyên tố, $\gcd(a,b,c) = 1$, $2 | b$). Đường cong Frey (Frey curve) là:
\[ E_{a,b,c}: y^2 = x(x - a^p)(x + b^p) \]

Tính chất đặc biệt:

  • Biệt thức: $\Delta = 2^{-8} (abc)^{2p}$ --- lũy thừa $p$ rất cao.
  • Conductor: $N = \mathrm{rad}(abc) = \prod_{\ell | abc} \ell$ (tích các nguyên tố chia $abc$, mỗi thừa số chỉ xuất hiện 1 lần --- conductor “nhỏ bất thường” so với biệt thức).
  • $E$ bán ổn định (semistable): chỉ có rút gọn nhân tại $\ell | abc$.
Sự tương phản giữa $\Delta$ lớn ($\sim (abc)^{2p}$) và $N$ nhỏ ($= \mathrm{rad}(abc)$) là “dấu hiệu bất thường” mà Frey nhận ra (1985) [frey1986].

Ví dụ

Ví dụ (Tính chất kỳ lạ). Giả sử (phản chứng) $3^5 + 4^5 = c^5$ có nghiệm (thực tế không, nhưng minh họa). Đường cong Frey:
\[ E: y^2 = x(x - 243)(x + 1024) \]
Biệt thức chứa $(3 \cdot 4 \cdot c)^{10}$ --- cực lớn. Nhưng conductor chỉ là $\mathrm{rad}(3 \cdot 4 \cdot c)$ --- cực nhỏ so sánh.

Biểu diễn $\bar{\rho}_{E,5}$: Ribet chứng minh rằng “hạ mức” đến $\Gamma_0(2)$. Nhưng $S_2(\Gamma_0(2)) = 0$ $\Rightarrow$ mâu thuẫn.

Ý nghĩa trực giác

Đường cong Frey --- “vân tay” của nghiệm Fermat.
  • Hình dung: Nghiệm Fermat $a^p + b^p = c^p$ (nếu tồn tại) để lại “vân tay” dưới dạng EC với tính chất “không thể có”. Đường cong Frey mã hóa thông tin nghiệm vào ngôn ngữ EC --- sau đó kỹ thuật modularity phân tích “vân tay” và phát hiện mâu thuẫn.
  • Ý tưởng thiên tài: Frey nhận ra rằng $a^p + b^p = c^p$ không phải bài toán số nguyên thuần túy --- nó mã hóa thành EC, và EC có “DNA” (biểu diễn Galois) mà ta có thể phân tích.

Liên hệ với giả thuyết Birch--Dyer

Đường cong Frey trong BSD.
  • Gián tiếp qua modularity: Đường cong Frey thúc đẩy chứng minh modularity $\Rightarrow$ BSD khả thi.
  • Phỏng đoán abc: Phỏng đoán abc (Masser--Oesterlé, 1985) phát biểu $\mathrm{rad}(abc)^{1+\epsilon} > c$ cho $a + b = c$. Nếu đúng, suy ra FLT cho $p$ đủ lớn (không cần modularity). abc và BSD đều là bài toán thiên niên kỷ về bản chất --- liên hệ sâu qua đường cong elliptic.
150 Định lý Ribet (Ribet's Theorem (level lowering)) Ch.8 8

Định nghĩa

Định lý (Định lý Ribet (1990)). Cho $f \in S_2(\Gamma_0(N))$ newform, $p \geq 3$ nguyên tố, $q \| N$ ($q$ chia đúng $N$ một lần). Giả sử $\bar{\rho}_{f,p}$ bất khả quy. Nếu $\bar{\rho}_{f,p}$ không phân nhánh tại $q$ (tức $q \nmid N/q$ cũng “hoạt động”), thì tồn tại newform $g \in S_2(\Gamma_0(N/q))$ sao cho:
\[ \bar{\rho}_{f,p} \cong \bar{\rho}_{g,p} \]

Nói cách khác: biểu diễn thặng dư “hạ” từ mức $N$ xuống mức $N/q$ --- hạ mức (level lowering) [ribet1990].

Ví dụ

Ví dụ (Áp dụng cho đường cong Frey). Đường cong Frey $E_{a,b,c}$: conductor $N = \mathrm{rad}(abc) = 2 \cdot q_1 \cdots q_r$ (với $q_i | abc$ lẻ).

Biểu diễn $\bar{\rho}_{E,p}$:

  1. Vì $\Delta = (abc)^{2p}$, biệt thức chia hết bởi $q_i^{2p}$ cho mỗi $q_i | abc$.
  2. $\bar{\rho}_{E,p}$ “ít phân nhánh” tại $q_i$ (vì conductor $q_i^1$, không phải $q_i^{2p}$).
  3. Ribet: hạ mức lần lượt $q_1, q_2, \ldots, q_r$:
    \[ N = 2 q_1 \cdots q_r \xrightarrow{-q_r} 2 q_1 \cdots q_{r-1} \xrightarrow{-q_{r-1}} \cdots \xrightarrow{-q_1} 2 \]
  4. Kết luận: $\bar{\rho}_{E,p} \cong \bar{\rho}_{g,p}$ với $g \in S_2(\Gamma_0(2))$.
  5. Nhưng $S_2(\Gamma_0(2)) = 0$ $\Rightarrow$ mâu thuẫn!

Ý nghĩa trực giác

Level lowering --- “đơn giản hóa” biểu diễn.
  • Hình dung: Biểu diễn $\bar{\rho}_{f,p}$ “sống” ở mức $N$ (phức tạp). Nếu $\bar{\rho}$ “không cần” nguyên tố $q$ (ít phân nhánh), ta có thể “hạ” xuống mức $N/q$ (đơn giản hơn).
  • Tương tự: Giống “giảm bậc” đa thức. Nếu đa thức bậc $n$ có nghiệm “thừa”, ta chia cho $(x-a)$ giảm bậc. Ở đây “nghiệm thừa” $= q$ trong conductor.

Liên hệ với giả thuyết Birch--Dyer

Ribet trong BSD.
  • FLT $\to$ modularity $\to$ BSD: Level lowering hoàn tất sơ đồ FRW, thúc đẩy Wiles chứng minh modularity, mở đường cho BSD.
  • Công cụ trực tiếp: Level lowering/raising dùng trong Skinner--Urban (“converse theorem” cho BSD hạng 1) và Iwasawa main conjecture.
151 Phỏng đoán Serre (modularity) (Serre's Modularity Conjecture) Ch.8 9

Định nghĩa

Giả thiết (Phỏng đoán Serre (nay là Định lý Khare--Wintenberger)). Cho $\bar{\rho}: G_\mathbb{Q} \to \mathrm{GL}_2(\bar{\mathbb{F}}_p)$ biểu diễn liên tục, lẻ (odd: $\det(\bar{\rho}(\text{phức liên hợp})) = -1$), bất khả quy. Khi đó $\bar{\rho}$ là modular (modular): tồn tại newform $f \in S_k(\Gamma_0(N))$ (với $k, N$ xác định tường minh bởi $\bar{\rho}$) sao cho $\bar{\rho} \cong \bar{\rho}_{f,p}$.

Serre (1987) phỏng đoán, và đưa ra công thức tường minh cho “trọng số tối thiểu” $k(\bar{\rho})$ và “mức tối thiểu” $N(\bar{\rho})$ [serre1987].

Ví dụ

Ví dụ (Khare--Wintenberger chứng minh (2009)).
  1. Serre đề xuất 1987: Phỏng đoán tổng quát mạnh hơn nhiều so với TSW (modularity cho EC chỉ là trường hợp $k = 2$).
  2. Khare--Wintenberger 2009: Chứng minh đầy đủ phỏng đoán Serre [khare-wintenberger2009].
  3. Hệ quả: Mọi biểu diễn Galois mod $p$ “hợp lý” đều modular. Đặc biệt, suy ra lại modularity cho EC (TSW) như hệ quả.

Ý nghĩa trực giác

Phỏng đoán Serre --- “mọi biểu diễn mod $p$ đều có nguồn gốc modular”.
  • Hình dung: TSW nói “mọi EC đều modular”. Serre tổng quát: “mọi biểu diễn Galois 2 chiều mod $p$ (thỏa điều kiện tự nhiên) đều modular”. Đây là “modularity triệt để” --- không chỉ EC, mà mọi đối tượng số học 2 chiều.
  • Sức mạnh: Từ Serre, suy ra vô số kết quả: TSW, FLT, phỏng đoán Artin (một phần)\ldots

Liên hệ với giả thuyết Birch--Dyer

Phỏng đoán Serre trong BSD.
  • Tổng quát hóa modularity: Khare--Wintenberger cho “modularity mạnh nhất” --- mọi $\bar{\rho}_{E,p}$ modular, không cần giả thiết gì thêm về $E$.
  • Hỗ trợ BSD: Khi $\bar{\rho}_{E,p}$ khả quy (trường hợp khó cho Wiles), Serre's conjecture vẫn cho modularity $\Rightarrow$ mở rộng phạm vi BSD.
152 Định lý Langlands–Tunnell (Langlands–Tunnell Theorem) Ch.8 9

Định nghĩa

Định lý (Định lý Langlands--Tunnell). Cho $\bar{\rho}: G_\mathbb{Q} \to \mathrm{GL}_2(\mathbb{C})$ biểu diễn Artin với ảnh khả giải (solvable image). Khi đó $\bar{\rho}$ là modular: tồn tại dạng modular (có thể trọng số 1) $f$ sao cho $L(\bar{\rho}, s) = L(f, s)$.

Đặc biệt, nếu $\bar{\rho}: G_\mathbb{Q} \to \mathrm{GL}_2(\mathbb{F}_3)$ bất khả quy, thì $\bar{\rho}$ modular. Điều này vì $\mathrm{GL}_2(\mathbb{F}_3)$ có nhóm thương khả giải (nhúng vào $S_4$ khả giải) [langlands1980, tunnell1981].

Ví dụ

Ví dụ (Vai trò trong chứng minh Wiles).
  1. Wiles cần: “$\bar{\rho}_{E,3}$ modular” (bước đầu tiên).
  2. $\bar{\rho}_{E,3}: G_\mathbb{Q} \to \mathrm{GL}_2(\mathbb{F}_3)$. Ảnh $\subset \mathrm{GL}_2(\mathbb{F}_3)$, nhóm có $48$ phần tử.
  3. $\mathrm{GL}_2(\mathbb{F}_3)/\{\pm I\} \cong S_4$ (nhóm hoán vị 4 phần tử) --- khả giải.
  4. Langlands--Tunnell $\Rightarrow$ $\bar{\rho}_{E,3}$ modular. ✓

    Tại sao $p = 3$? Với $p = 2$: $\mathrm{GL}_2(\mathbb{F}_2) \cong S_3$ cũng khả giải, nhưng $\bar{\rho}_{E,2}$ thường khả quy (vì $E[2]$ thường có điểm hữu tỉ). Với $p = 5$: $\mathrm{GL}_2(\mathbb{F}_5)$ chứa $A_5$ --- không khả giải. Vậy $p = 3$ là lựa chọn duy nhất.

Ý nghĩa trực giác

Langlands--Tunnell --- “modularity cho nhóm nhỏ”.
  • Hình dung: Chứng minh modularity cho biểu diễn Galois “lớn” ($\mathrm{GL}_2(\mathbb{Z}_p)$) rất khó. Nhưng cho nhóm “nhỏ” ($\mathrm{GL}_2(\mathbb{F}_3) \cong$ 48 phần tử): khả thi, vì nhóm khả giải $\Rightarrow$ kỹ thuật Langlands (base change, cyclic base change) hoạt động.
  • “Hạt giống” cho Wiles: Langlands--Tunnell cung cấp “hạt giống” --- modularity ban đầu. Wiles “nuôi lớn” hạt giống bằng $R = T$ để được modularity đầy đủ.

Liên hệ với giả thuyết Birch--Dyer

Langlands--Tunnell trong BSD.
  • Bước 1 không thể thiếu: Không có Langlands--Tunnell, không có “hạt giống”, không nâng lên modularity, không có BSD.
  • Chương trình Langlands: Langlands--Tunnell là trường hợp “dễ” ($\mathrm{GL}_2$ khả giải) của functoriality Langlands. Trường hợp tổng quát ($\mathrm{GL}_n$, không khả giải) liên quan BSD cho đa tạp Abel bậc cao.
153 Định lý cuối cùng Fermat (Fermat's Last Theorem) Ch.1 3

Định nghĩa

Định lý (Định lý cuối cùng Fermat (Wiles 1995)). Cho $n \geq 3$ nguyên. Phương trình:
\[ x^n + y^n = z^n \]
không có nghiệm nguyên $x, y, z$ với $xyz \neq 0$.

Phát biểu do Fermat (1637) ghi bên lề sách Arithmetica của Diophantus: “Tôi đã tìm ra chứng minh tuyệt vời, nhưng lề sách quá hẹp để viết.” Chứng minh bởi Wiles (1995), sử dụng Định lý modularity cho EC bán ổn định [wiles1995].

Ví dụ

Ví dụ (Lịch sử 358 năm).
  1. Fermat (1637): Phát biểu. Chứng minh cho $n = 4$ (Fermat, descent vô hạn).
  2. Euler (1770): $n = 3$ (có lỗ nhỏ, sửa bởi Legendre).
  3. Kummer (1850): $n$ nguyên tố “chính quy” (regular prime) --- sử dụng ideal, bắt đầu lý thuyết số đại số.
  4. Máy tính (1990s): Kiểm nghiệm $n \leq 4{,}000{,}000$.
  5. Wiles (1995): Chứng minh đầy đủ cho mọi $n \geq 3$.

Ý nghĩa trực giác

FLT --- “bài toán đơn giản, chứng minh sâu nhất”.
  • Hình dung: Phát biểu FLT dễ hiểu cho học sinh lớp 8. Nhưng chứng minh đòi hỏi toàn bộ lý thuyết số hiện đại: EC, dạng modular, biểu diễn Galois, đối đồng điều\ldots
  • “Định lý sâu nhất”: Chứng minh FLT buộc phải phát triển modularity (Wiles), kéo theo hàng loạt ứng dụng: BSD, Iwasawa, Langlands\ldots{} FLT là “chất xúc tác” cho 30 năm tiến bộ.

Liên hệ với giả thuyết Birch--Dyer

FLT trong BSD.
  • Chung công cụ: FLT và BSD cùng sử dụng: modularity, biểu diễn Galois, Selmer groups, Euler systems. Chứng minh FLT mở đường cho BSD.
  • Khác nhau: FLT là “phản chứng” (nghiệm không tồn tại $\Rightarrow$ mâu thuẫn). BSD là “đẳng thức” ($\mathrm{ord} L = \mathrm{rk} E$) --- khó hơn nhiều vì cần xây dựng, không chỉ phá hủy.
154 Điểm Heegner (Heegner point) Ch.6 7

Định nghĩa

Định nghĩa (Điểm Heegner). Cho $E/\mathbb{Q}$ conductor $N$ và $K = \mathbb{Q}(\sqrt{-D})$ trường phức bậc hai ảo thỏa điều kiện Heegner: mọi nguyên tố $\ell | N$ tách (split) trong $K$.

Chọn $\tau \in \mathcal{H}$ sao cho $\tau$ là nghiệm phương trình $a\tau^2 + b\tau + c = 0$ (biệt thức $-D$) và $[\tau] \in X_0(N)$ là điểm CM. Điểm Heegner (Heegner point) trên $E$ là:

\[ P_K = \phi_E(\tau) \in E(\bar{\mathbb{Q}}) \]
trong đó $\phi_E: X_0(N) \to E$ là phép tham số hóa modular.

Trace xuống $K$: $y_K = \mathrm{Tr}_{H/K}(P_K) = \sum_{\sigma \in \mathrm{Gal}(H/K)} P_K^\sigma \in E(K)$, trong đó $H$ là trường lớp Hilbert của $K$ [gross-zagier1986].

Ví dụ

Ví dụ (Heegner point cho $E = 37a1$). $E: y^2 + y = x^3 - x$ (conductor $N = 37$, hạng 1). Chọn $K = \mathbb{Q}(\sqrt{-7})$, $D = 7$.

Kiểm tra Heegner: $37$ tách trong $\mathbb{Q}(\sqrt{-7})$? $\left(\frac{-7}{37}\right) = \left(\frac{37}{7}\right) = \left(\frac{2}{7}\right) = 1$. ✓

Điểm Heegner: $y_K \in E(K)$. Trace xuống $\mathbb{Q}$: $P = \mathrm{Tr}_{K/\mathbb{Q}}(y_K)$. Gross--Zagier: $\hat{h}(y_K) \neq 0$ $\Rightarrow$ $y_K$ có bậc vô hạn $\Rightarrow$ $\mathrm{rk}(E(K)) \geq 1$. Kết hợp: $\mathrm{rk}(E(\mathbb{Q})) = 1$ (đúng: $E(\mathbb{Q}) = \mathbb{Z} \cdot (0,0)$).

Ý nghĩa trực giác

Heegner points --- “máy sản xuất điểm hữu tỉ”.
  • Hình dung: Tìm điểm hữu tỉ trên EC rất khó (search ngây thơ). Heegner points cho “công thức” tường minh: chọn $\tau$ CM trên $X_0(N)$, áp dụng $\phi_E$ $\Rightarrow$ điểm trên $E$. “Máy” này hoạt động khi điều kiện Heegner thỏa.
  • Nguồn gốc CM: Điểm $\tau \in \mathcal{H}$ ứng với EC có nhân phức (CM) bởi $\mathcal{O}_K$. Tính chất “đặc biệt” của CM (đối xứng cao, lý thuyết trường lớp) cho phép kiểm soát điểm Heegner bằng lý thuyết đại số.

Liên hệ với giả thuyết Birch--Dyer

Heegner points trong BSD.
  • Gross--Zagier: $L'(E/K, 1) = c \cdot \hat{h}(y_K)$ [gross-zagier1986]. Nếu $L'(E/K,1) \neq 0$ thì $y_K$ có bậc vô hạn $\Rightarrow$ $\mathrm{rk}(E(K)) \geq 1$ $\Rightarrow$ BSD (yếu) cho hạng 1 trên $K$.
  • Kolyvagin: Dùng Heegner points xây hệ thống Euler $\Rightarrow$ chặn Selmer $\Rightarrow$ BSD cho hạng 0 và 1.
  • Công cụ mạnh nhất: Heegner points + Gross--Zagier + Kolyvagin = phương pháp mạnh nhất hiện nay cho BSD (hạng $\leq 1$). Cho hạng $\geq 2$: chưa có analogon.
155 Điều kiện Heegner (Heegner hypothesis) Ch.6 6

Định nghĩa

Định nghĩa (Điều kiện Heegner). Cho $E/\mathbb{Q}$ conductor $N$ và $K = \mathbb{Q}(\sqrt{-D})$ trường phức bậc hai ảo (biệt thức $-D < 0$). Điều kiện Heegner (Heegner hypothesis) phát biểu:
\[ \text{Mọi nguyên tố } \ell \mid N \text{ đều } \textbf{tách} \text{ (split) trong } K \]
tức $\left(\frac{-D}{\ell}\right) = 1$ cho mọi $\ell | N$, trong đó $\left(\frac{\cdot}{\ell}\right)$ là ký hiệu Legendre (hoặc Kronecker).

Khi điều kiện Heegner thỏa: $w(E/K) = -1$ (dấu gốc của $L(E/K, s)$) $\Rightarrow$ $\mathrm{ord}_{s=1} L(E/K, s)$ lẻ $\Rightarrow$ hy vọng $L'(E/K, 1) \neq 0$.

Ví dụ

Ví dụ (Tìm $K$ thỏa Heegner cho $N = 37$). Cần $\left(\frac{-D}{37}\right) = 1$, tức $-D$ là thặng dư bậc hai mod 37.

Thử $D = 3$: $\left(\frac{-3}{37}\right) = \left(\frac{34}{37}\right) = \left(\frac{-3}{37}\right)$. Tính: $(-3)^{18} \equiv 1 \pmod{37}$? $(-3)^2 = 9$, $9^2 = 81 \equiv 7$, $9^4 \equiv 49 \equiv 12$, $9^8 \equiv 144 \equiv 33 \equiv -4$, $9^{16} \equiv 16$, $9^{18} = 9^{16} \cdot 9^2 \equiv 16 \cdot 9 = 144 \equiv 33 \neq 1$. Nên $D = 3$ không thỏa.

Thử $D = 7$: $\left(\frac{-7}{37}\right) = 1$ (vì $37 \equiv 2 \pmod{7}$, $\left(\frac{2}{7}\right) = 1$). ✓

Vậy $K = \mathbb{Q}(\sqrt{-7})$ thỏa Heegner cho $N = 37$. Đây là trường hợp kinh điển trong [gross-zagier1986].

Ý nghĩa trực giác

Điều kiện Heegner --- “chọn trường $K$ tương thích”.
  • Hình dung: Muốn dùng “máy Heegner”, cần chọn $K$ “tương thích” với $E$ (qua conductor $N$). Điều kiện Heegner đảm bảo: tại mỗi nguyên tố xấu $\ell | N$, trường $K$ “tách” --- nghĩa là $\ell$ “nhìn thấy” $K$ đúng cách.
  • Luôn thỏa được: Theo Định lý Dirichlet (tiến trình số học), luôn tồn tại $D$ thỏa Heegner cho mọi $N$. Thực tế có vô hạn $D$ như vậy.

Liên hệ với giả thuyết Birch--Dyer

Điều kiện Heegner trong BSD.
  • Dấu gốc: Khi Heegner thỏa, $w(E/K) = -1$ (tính theo công thức). Theo parity conjecture: $\mathrm{rk}(E(K))$ lẻ $\geq 1$. Gross--Zagier khai thác chính xác điều này.
  • Hạn chế: Chỉ hoạt động khi $\mathrm{rk}(E/K)$ lẻ. Cho hạng chẵn (ví dụ $\mathrm{rk}(E(\mathbb{Q})) = 0$ với $w(E) = +1$): cần phương pháp khác (Kato, Iwasawa).
156 Trường lớp Hilbert (Hilbert class field) Ch.6 7

Định nghĩa

Định nghĩa (Trường lớp Hilbert). Cho $K$ trường số. Trường lớp Hilbert (Hilbert class field) $H$ của $K$ là mở rộng Abel cực đại không phân nhánh (maximal unramified abelian extension) của $K$.

Tính chất chính (Lý thuyết trường lớp):

  1. $\mathrm{Gal}(H/K) \cong \mathrm{Cl}(K)$ (nhóm lớp ideal của $K$).
  2. $[H:K] = h_K$ (số lớp của $K$).
  3. Mọi ideal của $\mathcal{O}_K$ trở thành chính (principal) trong $\mathcal{O}_H$.

Cho $K = \mathbb{Q}(\sqrt{-D})$: $H$ là trường nhỏ nhất chứa $K$ sao cho mọi ideal phân số của $\mathcal{O}_K$ trở thành chính trong $H$ [cox2013].

Ví dụ

Ví dụ (Trường lớp Hilbert cho $K = \mathbb{Q}(\sqrt{-D})$).
  1. $K = \mathbb{Q}(\sqrt{-7})$: $h_K = 1$ (vành $\mathcal{O}_K = \mathbb{Z}[\frac{1+\sqrt{-7}}{2}]$ là UFD). Trường lớp $H = K$ --- không có mở rộng không phân nhánh nào.
  2. $K = \mathbb{Q}(\sqrt{-5})$: $h_K = 2$ ($\mathcal{O}_K = \mathbb{Z}[\sqrt{-5}]$ không UFD: $6 = 2 \cdot 3 = (1+\sqrt{-5})(1-\sqrt{-5})$). Trường lớp $H = K(\sqrt{-1}) = \mathbb{Q}(\sqrt{-5}, \sqrt{-1})$, $[H:K] = 2$.
  3. $K = \mathbb{Q}(\sqrt{-23})$: $h_K = 3$. $H = K(\alpha)$ với $\alpha^3 - \alpha - 1 = 0$, $[H:K] = 3$.

Ý nghĩa trực giác

Trường lớp Hilbert --- “sửa chữa” phân tích duy nhất.
  • Hình dung: Vành $\mathcal{O}_K$ có thể không UFD (phân tích duy nhất hỏng). Trường lớp Hilbert $H$ “sửa chữa” bằng cách mở rộng trường: trong $H$, mọi ideal trở thành chính --- “phân tích duy nhất phục hồi”.
  • Nhóm lớp đo “lỗi”: $\mathrm{Cl}(K)$ đo mức độ “hỏng” UFD. $h_K = 1$ nghĩa là “hoàn hảo” (UFD). $h_K$ lớn nghĩa là “hỏng nhiều”. Trường lớp Hilbert có bậc $= h_K$ --- cần mở rộng lớn hơn để sửa.

Liên hệ với giả thuyết Birch--Dyer

Trường lớp Hilbert trong BSD.
  • Điểm Heegner sống trong $H$: Điểm Heegner $P_K = \phi_E(\tau) \in E(H)$ (trường lớp Hilbert). Trace $y_K = \mathrm{Tr}_{H/K}(P_K) \in E(K)$. Lý thuyết trường lớp kiểm soát tác động Galois $\mathrm{Gal}(H/K) \cong \mathrm{Cl}(K)$ trên $P_K$ --- cho phép tính $y_K$.
  • Tương tự BSD: Công thức số lớp ($h_K$ liên hệ $L(1, \chi_K)$) tương tự BSD ($|\mathrm{Sha}|$ liên hệ $L^*(E,1)$). Nhóm lớp $\mathrm{Cl}(K)$ $\leftrightarrow$ $\mathrm{Sha}(E/\mathbb{Q})$: cả hai đo “chướng ngại cục bộ-toàn cục”.
157 Trường lớp vòng (Ring class field) Ch.6 7

Định nghĩa

Định nghĩa (Trường lớp vòng). Cho $K = \mathbb{Q}(\sqrt{-D})$ trường phức bậc hai ảo và $c \geq 1$ (“conductor”). Trường lớp vòng (Ring class field) $H_c$ của $K$ ứng với order $\mathcal{O}_c = \mathbb{Z} + c\mathcal{O}_K$ là mở rộng Abel của $K$ sao cho:
\[ \mathrm{Gal}(H_c / K) \cong \mathrm{Cl}(\mathcal{O}_c) = \mathrm{Pic}(\mathcal{O}_c) \]
(nhóm lớp của order $\mathcal{O}_c$).

Khi $c = 1$: $\mathcal{O}_1 = \mathcal{O}_K$ và $H_1 = H$ là trường lớp Hilbert. Khi $c > 1$: $H_c \supset H$ và $[H_c : K] = |\mathrm{Cl}(\mathcal{O}_c)| \geq h_K$ [cox2013].

Ví dụ

Ví dụ (Ring class fields). $K = \mathbb{Q}(\sqrt{-7})$ ($h_K = 1$, $H = K$).
  • $c = 1$: $\mathcal{O}_1 = \mathbb{Z}[\frac{1+\sqrt{-7}}{2}]$. $\mathrm{Cl}(\mathcal{O}_1) = 1$. $H_1 = K$.
  • $c = 2$: $\mathcal{O}_2 = \mathbb{Z} + 2\mathcal{O}_K = \mathbb{Z}[\sqrt{-7}]$. $|\mathrm{Cl}(\mathcal{O}_2)| = 2$. $H_2 = K(\sqrt{2})$, $[H_2:K] = 2$.

Điểm Heegner “mức $c$”: ứng với $\tau \in \mathcal{H}$ sao cho $\mathbb{Z} + \mathbb{Z}\tau$ là ideal của $\mathcal{O}_c$. Điểm $P_c = \phi_E(\tau) \in E(H_c)$.

Ý nghĩa trực giác

Ring class field --- “trường lớp cho order nhỏ hơn”.
  • Hình dung: $\mathcal{O}_K$ là “vành tốt nhất”; $\mathcal{O}_c \subset \mathcal{O}_K$ là “vành nhỏ hơn” (index $c$). Trường lớp Hilbert sửa $\mathrm{Cl}(\mathcal{O}_K)$; ring class field sửa $\mathrm{Cl}(\mathcal{O}_c)$ --- nhóm lớp “lớn hơn” (vì order nhỏ hơn $\Rightarrow$ phân tích “tệ hơn”).
  • Conductor $c$ lớn: $|\mathrm{Cl}(\mathcal{O}_c)|$ tăng khi $c$ tăng $\Rightarrow$ ring class field lớn hơn $\Rightarrow$ nhiều điểm Heegner hơn.

Liên hệ với giả thuyết Birch--Dyer

Ring class field trong BSD.
  • Hệ thống Heegner: Điểm Heegner tại các conductor $c = 1, c_1, c_1 c_2, \ldots$ tạo “hệ thống tương thích” (compatible system). Kolyvagin khai thác hệ thống này xây dựng Euler system $\Rightarrow$ chặn Selmer.
  • Norm compatibility: $\mathrm{Tr}_{H_{c\ell}/H_c}(P_{c\ell}) = a_\ell \cdot P_c - P_{c/\ell}$ (quan hệ norm) --- chính xác cấu trúc Euler system cần.
158 Công thức Gross–Zagier (Gross–Zagier formula) Ch.6 9

Định nghĩa

Định lý (Công thức Gross--Zagier (1986)). Cho $E/\mathbb{Q}$ conductor $N$, $K = \mathbb{Q}(\sqrt{-D})$ thỏa điều kiện Heegner, $y_K \in E(K)$ điểm Heegner. Khi đó:
\[ L'(E/K, 1) = \frac{8\pi^2 \langle f_E, f_E \rangle}{\sqrt{D}} \cdot \hat{h}(y_K) \]
trong đó $\hat{h}$ là chiều cao Néron--Tate, $\langle f_E, f_E \rangle$ Petersson norm.

Hệ quả trực tiếp:

\[ L'(E/K, 1) \neq 0 \quad \Longleftrightarrow \quad \hat{h}(y_K) \neq 0 \quad \Longleftrightarrow \quad y_K \text{ có bậc vô hạn trong } E(K) \]
[gross-zagier1986].

Ví dụ

Ví dụ (Gross--Zagier cho $E = 37a1$, $K = \mathbb{Q}(\sqrt{-7})$). $E: y^2 + y = x^3 - x$, $N = 37$, $\mathrm{rk}(E(\mathbb{Q})) = 1$.

Gross--Zagier với $K = \mathbb{Q}(\sqrt{-7})$: tính $y_K \in E(K)$, kiểm tra $\hat{h}(y_K) \neq 0$:

  • $L'(E, 1) \neq 0$ (hạng giải tích 1).
  • Công thức cho: $\hat{h}(y_K) = \frac{\sqrt{7} \cdot L'(E/K, 1)}{8\pi^2 \langle f_E, f_E \rangle} > 0$.
  • $y_K$ có bậc vô hạn $\Rightarrow$ $\mathrm{rk}(E(K)) \geq 1$.
  • Kolyvagin: $\mathrm{rk}(E(K)) = 1$ đúng, $\mathrm{Sha}(E/K)$ hữu hạn.

Ý nghĩa trực giác

Gross--Zagier --- “$L' = $ chiều cao”.
  • Hình dung: Vế trái $L'(E/K,1)$ thuần “giải tích” (đạo hàm hàm $L$). Vế phải $\hat{h}(y_K)$ thuần “đại số” (chiều cao điểm). Công thức nối hai thế giới bằng đẳng thức chính xác --- “phép màu” trung tâm của BSD.
  • BSD yếu hạng 1: Nếu $\mathrm{ord}_{s=1} L(E/K,s) = 1$, Gross--Zagier cho $y_K \neq 0$ (bậc vô hạn) $\Rightarrow$ $\mathrm{rk}(E(K)) \geq 1$. Kết hợp Kolyvagin $\Rightarrow$ $\mathrm{rk}(E(K)) = 1$ $\Rightarrow$ BSD yếu đúng cho hạng 1.

Liên hệ với giả thuyết Birch--Dyer

Gross--Zagier trong BSD.
  • Kết quả mạnh nhất: Gross--Zagier + Kolyvagin = chứng minh BSD yếu cho $\mathrm{rk}_{\mathrm{an}} \leq 1$ (mọi EC/$\mathbb{Q}$, nhờ modularity).
  • BSD mạnh: Gross--Zagier cho “nửa” BSD mạnh --- liên hệ $L'(E,1)$ với $\hat{h}$. Cần thêm: $|\mathrm{Sha}| = ?$, $c_p = ?$, $|E_{\mathrm{tors}}| = ?$ để hoàn tất.
  • Tổng quát: Yuan--Zhang--Zhang (2013) tổng quát cho trường toàn phần thực [yuan-zhang-zhang2013].
159 Hệ thống Euler (Euler system) Ch.6 8

Định nghĩa

Định nghĩa (Hệ thống Euler). Cho $E/\mathbb{Q}$ và $p$ nguyên tố. Một hệ thống Euler (Euler system) cho $T_p(E)$ (hoặc $E[p^\infty]$) là họ các lớp đối đồng điều:
\[ \{c_m \in H^1(\mathbb{Q}(\mu_m), T_p(E))\}_{m \in \mathcal{S}} \]
(với $\mathcal{S}$ tập hợp các tích nguyên tố “cho phép”) thỏa mãn quan hệ norm: với $\ell$ nguyên tố và $m \in \mathcal{S}$:
\[ \mathrm{cores}_{\mathbb{Q}(\mu_{m\ell})/\mathbb{Q}(\mu_m)}(c_{m\ell}) = P_\ell(\mathrm{Frob}_\ell^{-1}) \cdot c_m \]
trong đó $P_\ell(X) = 1 - a_\ell X + \ell X^2$ là đa thức Euler tại $\ell$ [rubin2000].

Ví dụ

Ví dụ (Ba hệ thống Euler chính).
  1. Hệ thống Heegner--Kolyvagin (1990): Xây từ điểm Heegner trên $X_0(N)$. Hoạt động khi $E$ modular + điều kiện Heegner. Kết quả: BSD cho $\mathrm{rk}_{\mathrm{an}} \leq 1$.
  2. Đơn vị elliptic (Coates--Wiles, Rubin): Xây từ đơn vị elliptic trong trường lớp của trường CM. Hoạt động khi $E$ có CM. Kết quả: BSD cho $\mathrm{rk}_{\mathrm{an}} = 0$ với CM.
  3. Phần tử Beilinson--Kato (Kato 2004): Xây từ $K$-theory đường cong modular. Hoạt động cho mọi EC/$\mathbb{Q}$ (không cần Heegner). Kết quả: chặn “một nửa” Selmer.

Ý nghĩa trực giác

Euler system --- “dây chuyền sản xuất” chặn Selmer.
  • Hình dung: Mỗi $c_m$ là “công nhân” tại tầng $m$. Quan hệ norm đảm bảo công nhân phối hợp (output tầng $m\ell$ tương thích input tầng $m$). “Dây chuyền” sản xuất ra cận trên cho $|\mathrm{Sel}|$ và $|\mathrm{Sha}|$.
  • Tại sao “Euler”? Đa thức $P_\ell(X) = 1 - a_\ell X + \ell X^2$ chính là “thừa số Euler” tại $\ell$ trong $L(E,s)$. Quan hệ norm phản ánh tích Euler $L(E,s) = \prod P_\ell(\ell^{-s})^{-1}$.

Liên hệ với giả thuyết Birch--Dyer

Euler system trong BSD.
  • Công cụ duy nhất: Euler system là phương pháp duy nhất hiện nay chặn được Selmer/Sha --- nguyên liệu cốt lõi cho BSD.
  • Hạn chế: Chỉ hoạt động tốt cho $\mathrm{rk} \leq 1$. Cho hạng $\geq 2$: không có Euler system phù hợp (chưa biết xây). Đây là rào cản chính cho BSD hạng cao.
160 Hệ thống Euler Kolyvagin (Kolyvagin's Euler system) Ch.6 9

Định nghĩa

Định nghĩa (Hệ thống Euler Kolyvagin). Cho $E/\mathbb{Q}$ conductor $N$, $K = \mathbb{Q}(\sqrt{-D})$ thỏa Heegner, $y_K \in E(K)$ điểm Heegner. Hệ thống Euler Kolyvagin (Kolyvagin's Euler system) xây dựng từ $y_K$ các lớp suy dẫn (derived classes):
\[ \kappa_n \in H^1(K, E[p]) \quad \text{cho } n = \ell_1 \cdots \ell_r \text{ (tích ``Kolyvagin primes'')} \]
Các $\ell_i$ là nguyên tố “Kolyvagin”: $\ell_i \equiv 1 \pmod{p}$, $\ell_i$ trơ (inert) trong $K$, $a_{\ell_i} \equiv \ell_i + 1 \pmod{p}$.

Lớp suy dẫn $\kappa_n$ xây từ $y_K$ qua “toán tử đạo hàm Kolyvagin” $D_\ell$ tại mỗi $\ell | n$ [kolyvagin1990].

Ví dụ

Ví dụ (Kết quả Kolyvagin (1990)). Giả sử $y_K \neq 0$ (bậc vô hạn trong $E(K)$). Kolyvagin chứng minh:
  1. $\mathrm{rk}(E(K)) = 1$ (chính xác, không chỉ $\geq 1$).
  2. $\mathrm{Sha}(E/K)$ hữu hạn.
  3. $|\mathrm{Sha}(E/K)[p^\infty]| \leq (\text{index } [E(K) : \mathbb{Z} \cdot y_K])^2$ --- cận trên tường minh cho $\mathrm{Sha}$!

Kết hợp Gross--Zagier ($y_K \neq 0 \Leftrightarrow L'(E/K,1) \neq 0$):

\[ L'(E/K,1) \neq 0 \implies \mathrm{rk}(E(K)) = 1 \text{ và } |\mathrm{Sha}(E/K)| < \infty \]
Đây là kết quả mạnh nhất về BSD cho hạng 1.

Ý nghĩa trực giác

Kolyvagin --- “một điểm $\Rightarrow$ toàn bộ cấu trúc”.
  • Hình dung: Từ một điểm Heegner $y_K$ (thông tin “đại số”), Kolyvagin suy ra: hạng = 1, Sha hữu hạn, cận trên Sha. Giống việc biết “một mẫu DNA” $\Rightarrow$ suy ra toàn bộ “hồ sơ y tế” (hạng, Sha, Selmer).
  • Cách mạng (1990): Trước Kolyvagin, không ai biết cách chứng minh $\mathrm{Sha}$ hữu hạn cho bất kỳ EC nào (trừ CM). Kolyvagin giải quyết triệt để cho hạng 1.

Liên hệ với giả thuyết Birch--Dyer

Kolyvagin trong BSD.
  • BSD yếu, $r \leq 1$: Gross--Zagier + Kolyvagin $\Rightarrow$ BSD yếu cho $\mathrm{rk}_{\mathrm{an}} = 0$ hoặc $1$.
  • BSD mạnh, $p$-part: Cận Kolyvagin cho $|\mathrm{Sha}[p^\infty]|$ --- kết hợp Kato (cận dưới) $\Rightarrow$ $p$-part BSD mạnh cho nhiều trường hợp.
  • Hạn chế: Chỉ cho $\mathrm{rk} \leq 1$. Hạng $\geq 2$: không có điểm Heegner “non-torsion” (vì $L'(E/K,1) = 0$), Kolyvagin không áp dụng được.
161 Điểm Heegner suy dẫn (Derived Heegner classes) Ch.6 9

Định nghĩa

Định nghĩa (Lớp Heegner suy dẫn). Cho $n = \ell_1 \cdots \ell_r$ tích Kolyvagin primes. Lớp Heegner suy dẫn bậc $r$ (Derived Heegner class of order $r$) là:
\[ \kappa_n = \delta\!\left(\prod_{i=1}^r D_{\ell_i}\right) y_K \in H^1(K, E[p]) \]
trong đó:
  • $D_\ell = \sum_{i=0}^{\ell-2} i \cdot \sigma_\ell^i \in \mathbb{Z}[\mathrm{Gal}(K(\mu_\ell)/K)]$ là toán tử đạo hàm (Kolyvagin derivative).
  • $\delta: E(K(\mu_n))/pE(K(\mu_n)) \to H^1(K, E[p])$ là ánh xạ biên Kummer.

Bậc $r = 0$: $\kappa_1 = \delta(y_K)$ là ảnh Kummer của điểm Heegner (lớp cơ bản).

Bậc $r \geq 1$: lớp suy dẫn “lan tỏa” thông tin từ $y_K$ sang các nguyên tố Kolyvagin $\ell_i$ [kolyvagin1990, gross1991].

Ví dụ

Ví dụ (Cơ chế chặn Selmer). Giả sử $y_K \neq 0$ mod $p$ (tức $\kappa_1 \neq 0$). Kolyvagin:
  1. Dùng $\kappa_1 \neq 0$: chặn $\mathrm{Sel}_p(E/K)$ --- suy ra $\mathrm{rk}(E(K)) \leq 1$.
  2. Nếu $\mathrm{Sha}[p] \neq 0$: tồn tại $\ell_1$ (Kolyvagin prime) sao cho $\kappa_{\ell_1} \neq 0$.
  3. Dùng $\kappa_{\ell_1}$: chặn “thêm” $\mathrm{Sha}[p]$ --- giảm kích thước.
  4. Lặp lại: $\kappa_{\ell_1\ell_2}$ chặn thêm\ldots{} Sau hữu hạn bước: $\mathrm{Sha}[p^\infty] = 0$ hoặc kích thước được chặn.

“Mỗi lớp suy dẫn $\kappa_n$ tiêu diệt một phần $\mathrm{Sha}$” --- hệ thống hoạt động như “vũ khí tuần tự”.

Ý nghĩa trực giác

Derived classes --- “trinh sát” tìm $\mathrm{Sha}$.
  • Hình dung: $\kappa_1$ (lớp cơ bản) “quét” toàn bộ Selmer. Nếu còn $\mathrm{Sha}$ ẩn, $\kappa_{\ell_1}$ “lùng” sâu hơn tại nguyên tố $\ell_1$. $\kappa_{\ell_1\ell_2}$ lùng thêm\ldots{} Mỗi bậc $r$ tăng thêm “phạm vi trinh sát”.
  • “Đạo hàm” Galois: Toán tử $D_\ell$ giống “đạo hàm” --- trích xuất thông tin “vi phân” từ tác động Galois tại $\ell$.

Liên hệ với giả thuyết Birch--Dyer

Derived classes trong BSD.
  • Chặn $|\mathrm{Sha}|$: Kết hợp tất cả $\kappa_n$ cho cận trên $|\mathrm{Sha}[p^\infty]| \leq C^2$ (với $C = [E(K) : \mathbb{Z} y_K]$). Đây là bước cốt lõi cho $p$-part BSD mạnh.
  • Jetchev--Skinner--Wan (2017): Cải tiến: chặn chính xác hơn, đủ cho BSD mạnh $p$-part trong nhiều trường hợp.
162 Toán tử đạo hàm Kolyvagin (Kolyvagin derivative operator) Ch.6 9

Định nghĩa

Định nghĩa (Toán tử đạo hàm Kolyvagin). Cho $\ell$ nguyên tố (Kolyvagin prime), $\sigma_\ell$ sinh tử của $\mathrm{Gal}(K(\mu_\ell)/K) \cong (\mathbb{Z}/\ell\mathbb{Z})^\times$. Toán tử đạo hàm Kolyvagin (Kolyvagin derivative operator) là:
\[ D_\ell = \sum_{i=0}^{\ell-2} i \cdot \sigma_\ell^i \in \mathbb{Z}[\mathrm{Gal}(K(\mu_\ell)/K)] \]

Tính chất then chốt: $(\sigma_\ell - 1) D_\ell = (\ell - 1) - N_\ell$, trong đó $N_\ell = \sum_{i=0}^{\ell-2} \sigma_\ell^i$ là toán tử norm.

Ý nghĩa: nếu $x \in E(K(\mu_\ell))$ thỏa $N_\ell(x) = y_K$ (norm = Heegner point), thì $D_\ell(x)$ “trích xuất” thông tin cục bộ tại $\ell$ từ $y_K$ [kolyvagin1990].

Ví dụ

Ví dụ (Tại sao “đạo hàm”?). Toán tử $D_\ell$ là tương tự rời rạc của đạo hàm hình thức:

Trong nhóm vành $\mathbb{Z}[G]$ với $G = \langle \sigma \rangle$ cyclic bậc $\ell - 1$:

  • “Tổng” (norm): $N = 1 + \sigma + \sigma^2 + \cdots + \sigma^{\ell-2}$
  • “Đạo hàm”: $D = 0 + 1\cdot\sigma + 2\cdot\sigma^2 + \cdots + (\ell-2)\sigma^{\ell-2}$

Quan hệ $(\sigma - 1)D = (\ell-1) - N$ tương tự: nếu $f(x) = x^n$ thì $(x-1)f'(x) = nx^n - \frac{x^n - 1}{x - 1} \cdot (x-1)$. Vậy $D_\ell$ là “đạo hàm” trong nghĩa nhóm vành.

Ý nghĩa trực giác

$D_\ell$ --- “trích xuất thông tin ẩn” từ tác động Galois.
  • Hình dung: Điểm Heegner $y_K$ “chứa” thông tin tại mọi nguyên tố (qua norm compatibility). Toán tử $D_\ell$ “mở khóa” thông tin tại $\ell$ cụ thể --- giống “giải mã” tín hiệu tại tần số $\ell$.
  • “Telescoping”: $(\sigma - 1)D = (\ell-1) - N$. Nếu $N(x) = y_K$ (biết), thì $(\sigma-1)D(x) = (\ell-1)x - y_K$ $\Rightarrow$ $D(x)$ mod $(\sigma-1)$ xác định $\Rightarrow$ lớp Galois tại $\ell$ xác định.

Liên hệ với giả thuyết Birch--Dyer

$D_\ell$ trong BSD.
  • Nguyên liệu kỹ thuật: $D_\ell$ là “linh kiện” xây lớp suy dẫn $\kappa_n$ $\Rightarrow$ chặn Selmer $\Rightarrow$ BSD.
  • Tổng quát: Cấu trúc tương tự xuất hiện trong Euler system Rubin (đơn vị elliptic), Kato (phần tử Beilinson--Kato) --- toán tử đạo hàm là “công cụ chung” trong mọi Euler system.
163 Quan hệ norm (Norm compatibility relation) Ch.6 7

Định nghĩa

Định nghĩa (Quan hệ norm). Cho $E/\mathbb{Q}$ và hệ thống Heegner points $\{P_c\}_{c \geq 1}$ (điểm Heegner tại conductor $c$). Quan hệ norm (Norm compatibility relation) phát biểu: cho $\ell$ nguyên tố không chia $cN$:
\[ \mathrm{Tr}_{H_{c\ell}/H_c}(P_{c\ell}) = a_\ell(E) \cdot P_c - P_{c/\ell} \]
(quy ước $P_{c/\ell} = 0$ nếu $\ell \nmid c$). Ở đây $H_c$ là ring class field conductor $c$, $a_\ell = \ell + 1 - \#E(\mathbb{F}_\ell)$.

Khi $\ell$ trơ trong $K$ và $\ell \nmid c$:

\[ \mathrm{Tr}_{H_{c\ell}/H_c}(P_{c\ell}) = a_\ell \cdot P_c \]
(dạng đơn giản) [gross-zagier1986, kolyvagin1990].

Ví dụ

Ví dụ (Norm compatibility cho $E = 37a1$). $E: y^2 + y = x^3 - x$, $K = \mathbb{Q}(\sqrt{-7})$. Tại $\ell = 3$ (trơ trong $K$, vì $\left(\frac{-7}{3}\right) = -1$):

$a_3(E) = 3 + 1 - \#E(\mathbb{F}_3) = 4 - 4 = 0$.

Quan hệ norm: $\mathrm{Tr}_{H_3/H_1}(P_3) = 0 \cdot P_1 = \mathcal{O}$. Trace của Heegner point conductor 3 xuống $H$ triệt tiêu --- vì $a_3 = 0$.

Tại $\ell = 5$ ($a_5 = 1$): $\mathrm{Tr}_{H_5/H_1}(P_5) = 1 \cdot P_1 = P_1$. Trace của $P_5$ chính là $P_1$ --- tương thích tốt.

Ý nghĩa trực giác

Norm compatibility --- “nhất quán giữa các tầng”.
  • Hình dung: Hệ thống Heegner $\{P_c\}$ sống trên “tháp” ring class fields $H_1 \subset H_c \subset H_{c\ell} \subset \cdots$. Quan hệ norm đảm bảo: “chiếu” $P_{c\ell}$ xuống $H_c$ cho kết quả liên hệ tuyến tính với $P_c$ --- hệ thống nhất quán giữa các tầng.
  • Hệ số $= a_\ell$: Hệ số norm chính là vết Frobenius $a_\ell$ --- kết nối trực tiếp với hàm $L$. Đây là lý do Euler system liên hệ Selmer (đại số) với $L$-value (giải tích).

Liên hệ với giả thuyết Birch--Dyer

Norm compatibility trong BSD.
  • Cấu trúc Euler system: Quan hệ norm là tiên đề chính (axiom) của Euler system. Kolyvagin cần nó để “truyền” thông tin từ tầng cao ($H_{c\ell}$) xuống tầng thấp ($H_c$) $\Rightarrow$ xây derived classes $\Rightarrow$ chặn Selmer $\Rightarrow$ BSD.
  • Đa thức Euler: Hệ số $a_\ell$ trong norm relation chính là đa thức Euler $P_\ell(\mathrm{Frob}_\ell^{-1})$ tại $\ell$ --- phản ánh tích Euler $L(E,s) = \prod_\ell P_\ell(\ell^{-s})^{-1}$.
164 Đa thức Euler (tại $\ell$) (Euler polynomial) Ch.6 6

Định nghĩa

Định nghĩa (Đa thức Euler). Cho $E/\mathbb{Q}$ và $\ell$ nguyên tố. Đa thức Euler (Euler polynomial) tại $\ell$ là:
\[ P_\ell(X) = \begin{cases} 1 - a_\ell X + \ell X^2 & \text{nếu } \ell \nmid N \text{ (rút gọn tốt)} \\ 1 - a_\ell X & \text{nếu } \ell \| N \text{ (rút gọn nhân, } a_\ell = \pm 1\text{)} \\ 1 & \text{nếu } \ell^2 | N \text{ (rút gọn cộng, } a_\ell = 0\text{)} \end{cases} \]

Hàm $L$ viết dưới dạng tích Euler: $L(E, s) = \prod_{\ell} P_\ell(\ell^{-s})^{-1}$.

Nghiệm $P_\ell(X) = 0$: $\alpha_\ell, \beta_\ell$ (nghiệm Frobenius). Khi rút gọn tốt: $|\alpha_\ell| = |\beta_\ell| = \sqrt{\ell}$ (cận Hasse/GRH cục bộ) [silverman2009].

Ví dụ

Ví dụ (Đa thức Euler cho $E = 37a1$). $E: y^2 + y = x^3 - x$, conductor $N = 37$.

Ví dụ (Đa thức Euler cho $E = 37a1$). $E: y^2 + y = x^3 - x$, conductor $N = 37$.

$\ell$ Loại rút gọn $a_\ell$ $P_\ell(X)$
2Tốt$-2$$1 + 2X + 2X^2$
3Tốt$-1$$1 + X + 3X^2$
5Tốt$-2$$1 + 2X + 5X^2$
37Nhân tách$-1$$1 + X$

Tích Euler (hội tụ $\mathrm{Re}(s) > 3/2$):

\[ L(E,s) = \frac{1}{(1+2 \cdot 2^{-s}+2 \cdot 4^{-s})(1+3^{-s}+3 \cdot 9^{-s})(1+2 \cdot 5^{-s}+5 \cdot 25^{-s}) \cdots (1+37^{-s}) \cdots} \]

Ý nghĩa trực giác

Đa thức Euler --- “DNA cục bộ” tại mỗi nguyên tố.
  • Hình dung: Mỗi nguyên tố $\ell$ đóng góp “thừa số cục bộ” $P_\ell(\ell^{-s})^{-1}$ vào hàm $L$. Toàn bộ thông tin “cục bộ” ($a_\ell$, loại rút gọn) gói trong $P_\ell$. Hàm $L$ “toàn cục” = tích tất cả “cục bộ”.
  • Tương tự phân tích nguyên tố: $n = \prod p_i^{e_i}$ phân tích số nguyên thành nguyên tố. $L(E,s) = \prod P_\ell(\ell^{-s})^{-1}$ “phân tích” hàm $L$ thành thừa số nguyên tố. Đây là triết lý “cục bộ-toàn cục” xuyên suốt lý thuyết số.

Liên hệ với giả thuyết Birch--Dyer

Đa thức Euler trong BSD.
  • Tích Euler $= L$: BSD phát biểu qua $L(E,s)$, xây dựng hoàn toàn từ $P_\ell$. Tính $P_\ell$ = tính $a_\ell$ = đếm điểm mod $\ell$ --- bước đầu tiên kiểm nghiệm BSD.
  • Euler system axiom: Quan hệ norm trong Euler system có hệ số $P_\ell(\mathrm{Frob}_\ell^{-1})$ --- chính xác đa thức Euler. Đây là lý do gọi “Euler system”.
165 Đơn vị elliptic (Elliptic unit) Ch.6 8

Định nghĩa

Định nghĩa (Đơn vị elliptic). Cho $K = \mathbb{Q}(\sqrt{-D})$ trường phức bậc hai ảo, $\mathfrak{a}$ ideal của $\mathcal{O}_K$. Đơn vị elliptic (Elliptic unit) là phần tử đại số xây dựng từ giá trị đặc biệt của hàm theta (hoặc hàm Siegel) trên đường cong elliptic CM.

Cụ thể, cho $E$ đường cong elliptic với CM bởi $\mathcal{O}_K$ và $\Omega$ chu kỳ cơ bản:

\[ u(\mathfrak{a}) = \Theta(\mathfrak{a}) \in \mathcal{O}_{H}^\times \]
trong đó $\Theta$ là hàm theta (12 lần giá trị Klein form), $H$ trường lớp Hilbert, $u(\mathfrak{a})$ là đơn vị trong vành số nguyên $\mathcal{O}_H$ [rubin2000, coates-wiles1977].

Ví dụ

Ví dụ (Đơn vị elliptic và Coates--Wiles). $K = \mathbb{Q}(i)$ ($D = 4$), $E: y^2 = x^3 - x$ (CM bởi $\mathbb{Z}[i]$).

Coates--Wiles (1977) [coates-wiles1977]:

  1. Xây đơn vị elliptic $u_n \in K(\mu_{p^n})^\times$ tại các tầng $p$-cyclotomic.
  2. Chứng minh: $\{u_n\}$ tạo Euler system cho $E$.
  3. Kết quả: Nếu $L(E, 1) \neq 0$, thì $E(K)$ hữu hạn ($\mathrm{rk} = 0$).
Đây là kết quả đầu tiên hướng BSD: “$L(E,1) \neq 0 \Rightarrow \mathrm{rk} = 0$” cho EC có CM.

Ý nghĩa trực giác

Đơn vị elliptic --- “đơn vị số học từ hàm đặc biệt”.
  • Hình dung: Đơn vị “thường” (cyclotomic units) xây từ $\zeta_n = e^{2\pi i/n}$. Đơn vị elliptic thay $e^{2\pi i z}$ bằng hàm elliptic (hàm Weierstrass, theta) --- “nâng cấp” từ $\mathbb{G}_m$ lên EC.
  • CM cần: Chỉ hoạt động khi $E$ có CM --- vì cần lý thuyết trường lớp “số học” của $K$ để kiểm soát đơn vị. EC không có CM: dùng Beilinson--Kato thay thế.

Liên hệ với giả thuyết Birch--Dyer

Đơn vị elliptic trong BSD.
  • Coates--Wiles (1977): Kết quả BSD đầu tiên --- $L(E,1) \neq 0 \Rightarrow \mathrm{rk} = 0$ cho CM curves. Sử dụng Euler system đơn vị elliptic.
  • Rubin (1991): Mở rộng --- chứng minh BSD mạnh ($p$-part) cho CM curves hạng 0, dùng Iwasawa theory + đơn vị elliptic [rubin1991].
  • Hạn chế: Chỉ cho CM curves (rất ít EC có CM). EC tổng quát: cần Kato, Kolyvagin.
166 Hàm theta (Theta function) Ch.6 5

Định nghĩa

Định nghĩa (Hàm theta Jacobi). Hàm theta Jacobi (Jacobi theta function) là:
\[ \theta(z, \tau) = \sum_{n=-\infty}^{\infty} e^{\pi i n^2 \tau + 2\pi i n z} = \sum_{n \in \mathbb{Z}} q^{n^2} e^{2\pi i n z} \]
với $z \in \mathbb{C}$, $\tau \in \mathcal{H}$, $q = e^{\pi i \tau}$.

Biến thể quan trọng:

  • $\theta_3(\tau) = \theta(0, \tau) = \sum_{n \in \mathbb{Z}} q^{n^2} = 1 + 2q + 2q^4 + 2q^9 + \cdots$ (hàm theta “cơ bản”).
  • $\theta_{\chi}(\tau) = \sum_{n} \chi(n) q^{n^2}$ (theta với ký tự Dirichlet $\chi$) --- dạng modular trọng số $1/2$.
Hàm theta là “cầu nối” giữa dạng bậc hai (quadratic forms) và dạng modular [shimura1971].

Ví dụ

Ví dụ (Theta và biểu diễn bởi dạng bậc hai). $\theta_3(\tau)^2 = \left(\sum q^{n^2}\right)^2 = \sum_{k=0}^{\infty} r_2(k) q^k$, trong đó $r_2(k)$ đếm số cách viết $k = a^2 + b^2$.

Ví dụ: $r_2(5) = 8$ (vì $5 = 1^2 + 2^2 = 2^2 + 1^2 = (-1)^2 + 2^2 = \cdots$, tính cả dấu và thứ tự).

$\theta_3^2 = 1 + 4q + 4q^2 + 0 \cdot q^3 + 4q^4 + 8q^5 + \cdots$

Hệ số = $r_2(k)$: $r_2(0)=1, r_2(1)=4, r_2(2)=4, r_2(3)=0, r_2(4)=4, r_2(5)=8$.

Ý nghĩa trực giác

Theta --- “chuỗi tạo sinh” cho dạng bậc hai.
  • Hình dung: $\theta^k$ “đếm” số cách biểu diễn $n$ bởi tổng $k$ bình phương. Theta “mã hóa” bài toán tổ hợp-số học vào dạng modular --- cho phép dùng công cụ giải tích phức.
  • Trọng số nửa nguyên: $\theta$ là dạng modular trọng số $1/2$ --- “nửa” so với trọng số nguyên. Lý thuyết dạng modular nửa nguyên (Shimura) kết nối $\theta$ với $L$-functions.

Liên hệ với giả thuyết Birch--Dyer

Theta trong BSD.
  • Đơn vị elliptic: Hàm theta (hoặc Klein form, Siegel units) là nguyên liệu xây đơn vị elliptic $\Rightarrow$ Euler system $\Rightarrow$ BSD cho CM curves.
  • Waldspurger: Công thức Waldspurger liên hệ $|a_D(g)|^2 \sim L(E, 1) \cdot \chi_D$ (hệ số Fourier dạng nửa nguyên $\sim$ giá trị $L$). Kết nối theta $\leftrightarrow$ BSD.
  • Tunnell: Định lý Tunnell (1983) dùng theta + Waldspurger để giải bài toán “số congruent” --- trường hợp đặc biệt BSD cho $E: y^2 = x^3 - n^2x$.
167 Lý thuyết trường lớp (Class field theory) Ch.6 7

Định nghĩa

Định nghĩa (Lý thuyết trường lớp). Lý thuyết trường lớp (Class field theory) (CFT) là lý thuyết mô tả hoàn toàn các mở rộng Abel (abelian extensions) của trường số $K$.

Kết quả chính --- Ánh xạ Artin (Artin reciprocity):

\[ \mathrm{Art}_K : C_K / N_{L/K}(C_L) \xrightarrow{\sim} \mathrm{Gal}(L/K) \]
cho mọi mở rộng Abel $L/K$. Ở đây $C_K = \mathbb{A}_K^\times / K^\times$ là nhóm lớp idèle.

Trường hợp đặc biệt: $K = \mathbb{Q}$, $L = \mathbb{Q}(\zeta_n)$ (trường cyclotomic). Artin: $(\mathbb{Z}/n\mathbb{Z})^\times \cong \mathrm{Gal}(\mathbb{Q}(\zeta_n)/\mathbb{Q})$, $a \mapsto (\zeta_n \mapsto \zeta_n^a)$ --- luật thuận nghịch Artin [neukirch1999].

Ví dụ

Ví dụ (CFT cho trường phức bậc hai ảo). $K = \mathbb{Q}(\sqrt{-5})$ ($h_K = 2$).
  1. Trường lớp Hilbert: $H = K(i) = \mathbb{Q}(\sqrt{-5}, i)$, $\mathrm{Gal}(H/K) \cong \mathrm{Cl}(K) \cong \mathbb{Z}/2\mathbb{Z}$.
  2. Ánh xạ Artin: ideal nguyên tố $\mathfrak{p} \subset \mathcal{O}_K$ ánh xạ tới Frobenius $\mathrm{Frob}_\mathfrak{p} \in \mathrm{Gal}(H/K)$. Ideal chính $\mapsto 1$ (trivial); ideal không chính $\mapsto$ phần tử non-trivial.
  3. Ý nghĩa: $\mathfrak{p}$ tách hoàn toàn trong $H$ $\Leftrightarrow$ $\mathfrak{p}$ chính $\Leftrightarrow$ norm $N(\mathfrak{p})$ biểu diễn được bởi dạng bậc hai chính $x^2 + 5y^2$.

Ý nghĩa trực giác

CFT --- “bản đồ” của mở rộng Abel.
  • Hình dung: CFT là “GPS” cho mở rộng Abel --- cho biết chính xác mở rộng nào tồn tại và cấu trúc Galois. Trước CFT (thế kỷ 19--20), chỉ biết vài mở rộng cụ thể. Sau CFT: biết tất cả.
  • Abel = đầy đủ, non-Abel = mở: CFT giải quyết triệt để trường hợp Abel. Non-abelian Langlands (bao gồm modularity cho EC) là “CFT non-Abel” --- vẫn mở rộng lớn.

Liên hệ với giả thuyết Birch--Dyer

CFT trong BSD.
  • Kiểm soát Heegner: Điểm Heegner $P_K \in E(H)$ (trường lớp Hilbert). CFT kiểm soát $\mathrm{Gal}(H/K) \cong \mathrm{Cl}(K)$, cho phép tính trace $y_K = \mathrm{Tr}_{H/K}(P_K)$. Không có CFT, không kiểm soát được Heegner.
  • Coates--Wiles: Dùng CFT + CM để xây đơn vị elliptic --- hệ thống Euler cho BSD.
  • Tương tự BSD: Công thức số lớp (CFT) tương tự BSD: $L(1, \chi_K) \sim h_K \cdot R_K / \sqrt{|D_K|}$. Nhóm lớp $\mathrm{Cl}(K) \leftrightarrow \mathrm{Sha}(E/\mathbb{Q})$, regulator $R_K \leftrightarrow \mathrm{Reg}_E$.
168 Phần tử Beilinson–Kato (Beilinson–Kato element) Ch.6 9

Định nghĩa

Định nghĩa (Phần tử Beilinson--Kato). Cho $E/\mathbb{Q}$ conductor $N$, $f_E$ newform gắn với $E$. Phần tử Beilinson--Kato (Beilinson--Kato element) là lớp đối đồng điều:
\[ z_{\mathrm{Kato}} \in H^1(\mathbb{Q}, T_p(E)) \]
xây dựng từ:
  1. Đơn vị Siegel $g_a \in \mathcal{O}(Y_1(N))^\times$: các hàm hữu tỉ trên đường cong modular.
  2. Ký hiệu Steinberg: $\{g_a, g_b\} \in K_2(Y_1(N))$ ($K$-theory bậc 2).
  3. Ánh xạ regulator: $K_2 \xrightarrow{\mathrm{reg}} H^1(\mathbb{Q}, T_p(E))$ (qua Chern class + chiếu lên eigenspace $f_E$).

Kato (2004) chứng minh: $\{z_{\mathrm{Kato}, n}\}$ tạo Euler system cho $T_p(E)$ --- không cần điều kiện Heegner, không cần CM, hoạt động cho mọi EC/$\mathbb{Q}$ [kato2004].

Ví dụ

Ví dụ (So sánh ba Euler systems). {l|c|c|c} & Kolyvagin & Đơn vị elliptic & Kato \\ \hline Nguồn & Heegner points & Giá trị hàm $\theta$ & $K_2$ modular curve \\ Yêu cầu & Heegner hypothesis & CM & Không \\ Áp dụng cho & EC/$\mathbb{Q}$ modular & EC CM & Mọi EC/$\mathbb{Q}$ \\ Kết quả BSD & $r_{\mathrm{an}} \leq 1$: $\mathrm{rk} = r_{\mathrm{an}}$ & $r_{\mathrm{an}} = 0$: $\mathrm{rk} = 0$ & Chặn Selmer (một phía)

Kato mạnh hơn về phạm vi (mọi EC) nhưng yếu hơn về kết quả (chỉ chặn một phía Selmer, không cho $\mathrm{rk} = r_{\mathrm{an}}$ như Kolyvagin).

Ý nghĩa trực giác

Beilinson--Kato --- “Euler system từ $K$-theory”.
  • Hình dung: Kolyvagin dùng “điểm” (Heegner) xây Euler system. Kato dùng “hàm” (đơn vị Siegel) --- trừu tượng hơn nhưng tổng quát hơn.
  • $K$-theory: $K_2$ là “nhóm Abel hóa” của các quan hệ giữa hàm khả nghịch. Ký hiệu Steinberg $\{f, g\}$ “nhớ” mối quan hệ giữa $f$ và $g$ --- sau khi chiếu vào đối đồng điều Galois, cho phần tử Euler system.
  • Beilinson (1984): Beilinson xây phần tử trong $K_2$ và liên hệ với $L'(f,1)$ (conjecture). Kato (2004) chứng minh Beilinson conjecture (một nửa) và xây Euler system.

Liên hệ với giả thuyết Birch--Dyer

Beilinson--Kato trong BSD.
  • Chặn Selmer: Kato chứng minh: nếu $L(E,1) \neq 0$, thì $\mathrm{Sel}_{p^\infty}(E/\mathbb{Q})$ hữu hạn --- suy ra $\mathrm{rk}(E(\mathbb{Q})) = 0$ và $\mathrm{Sha}[p^\infty]$ hữu hạn. Đây là “một nửa” BSD yếu (chiều $\mathrm{rk}_{\mathrm{an}} = 0 \Rightarrow \mathrm{rk} = 0$).
  • Iwasawa: Kato chứng minh “một nửa” phỏng đoán chính Iwasawa: $\mathrm{char}_\Lambda(\mathrm{Sel}_{p^\infty}) | L_p(E)$ (chuỗi đặc trưng chia hàm $L$ $p$-adic).
  • Skinner--Urban hoàn tất: Skinner--Urban (2014) chứng minh “nửa còn lại”: $L_p(E) | \mathrm{char}_\Lambda(\mathrm{Sel})$ (dưới giả thiết). Kết hợp: $\mathrm{char} = (L_p)$ $\Rightarrow$ BSD $p$-part mạnh cho hạng 0 và 1.
169 Đơn vị Siegel (Siegel unit) Ch.6 8

Định nghĩa

Định nghĩa (Đơn vị Siegel [kato2004]). Cho $N \geq 1$ nguyên dương và $(a,b) \in (\mathbb{Z}/N\mathbb{Z})^2 \setminus \{(0,0)\}$. Đơn vị Siegel (Siegel unit) $g_{a,b}$ là hàm trên đường cong modular $Y_1(N)$ (bỏ các cusp) được xây dựng từ tích vô hạn:
\[ g_{a,b}(\tau) = -q^{\frac{1}{2}B_2(a/N)} e^{2\pi i b(a-1)/(2N)} (1 - q_a \zeta_b) \prod_{n=1}^{\infty} (1 - q^n q_a \zeta_b)(1 - q^n q_a^{-1} \zeta_b^{-1}) \]
trong đó:
  • $q = e^{2\pi i \tau}$, $q_a = e^{2\pi i a\tau/N}$, $\zeta_b = e^{2\pi i b/N}$,
  • $B_2(x) = x^2 - x + \frac{1}{6}$ là đa thức Bernoulli bậc 2.

Tính chất quan trọng:

  1. $g_{a,b}$ là đơn vị (unit) trên $Y_1(N)$: nó khả nghịch --- không có zero hay cực trên $Y_1(N)$, chỉ có zero/cực tại các cusp.
  2. Bậc (divisor) của $g_{a,b}$ được tính tường minh qua các cusp.
  3. Các đơn vị Siegel tạo thành nhóm con hữu hạn chỉ số trong nhóm tất cả các đơn vị modular.

Ví dụ

Ví dụ (Đơn vị Siegel cho $N = 5$). Lấy $N = 5$, $(a,b) = (1,0)$. Ta có:
\[ g_{1,0}(\tau) = q^{1/60} \cdot (1 - q^{1/5}) \prod_{n=1}^{\infty} (1 - q^{n+1/5})(1 - q^{n-1/5}). \]
Đây là hàm holomorphic trên $\mathcal{H}$, không triệt tiêu trên $Y_1(5)$. Nó chỉ có zero tại cusp $\tau = 0$ (và cực tại cusp $\tau = i\infty$, tùy chuẩn hóa).

Quan hệ với hàm eta: Đơn vị Siegel liên hệ mật thiết với thương eta (eta quotient). Cụ thể, hàm Dedekind eta $\eta(\tau) = q^{1/24} \prod_{n=1}^{\infty}(1-q^n)$ cho phép viết:

\[ g_{a,0}(\tau) = \frac{\eta(a\tau/N)}{\eta(\tau)} \cdot (\text{hệ số đơn giản}). \]
Điều này giải thích tại sao đơn vị Siegel “sống” trên đường cong modular --- chúng được xây từ các hàm cơ bản nhất trên nửa mặt phẳng trên.

Ý nghĩa trực giác

Đơn vị Siegel --- “viên gạch xây Euler system”.
  • Hình dung: Trên đường cong modular $Y_1(N)$, có những hàm “không bao giờ bằng 0 hay vô cực” (trừ tại các cusp ở biên). Đó chính là các đơn vị Siegel. Chúng giống như “hằng số khả nghịch” nhưng không thực sự hằng --- giữ đủ thông tin số học.
  • Tại sao quan trọng: Để xây phần tử Beilinson--Kato trong $K_2$, ta cần cặp hàm khả nghịch trên đường cong modular. Đơn vị Siegel cung cấp chính xác những hàm này. Ký hiệu Steinberg $\{g_{a,b}, g_{c,d}\}$ cho phần tử trong $K_2$.
  • Analogy: Trong lý thuyết trường lớp, “đơn vị cyclotomic” (ví dụ $1 - \zeta_n$ với $\zeta_n = e^{2\pi i/n}$) đóng vai trò then chốt. Đơn vị Siegel là bản “nâng cấp” lên đường cong modular: thay vì sống trên $\mathbb{Z}[\zeta_n]$, chúng sống trên $Y_1(N)$.

Liên hệ với giả thuyết Birch--Dyer

Đơn vị Siegel trong BSD.
  • Thành phần của Beilinson--Kato: Phần tử Beilinson--Kato $z_\gamma \in K_2(Y_1(N))$ được xây từ ký hiệu Steinberg $\{g_{a,b}, g_{c,d}\}$ của các đơn vị Siegel. Đây là “nguyên liệu thô” của Euler system Kato.
  • Liên hệ với $L(E,s)$: Kato chứng minh rằng ảnh của phần tử Beilinson--Kato qua ánh xạ regulator cho giá trị $L'(f, 1)$ (đạo hàm hàm $L$ tại $s = 1$). Tức là thông tin số học của đơn vị Siegel “mã hóa” thông tin giải tích của hàm $L$.
  • Tổng quát hơn đơn vị elliptic: Đơn vị elliptic (dùng trong Coates--Wiles cho đường cong CM) là trường hợp đặc biệt. Đơn vị Siegel áp dụng cho mọi đường cong elliptic trên $\mathbb{Q}$ --- không cần giả thiết CM.
170 Ký hiệu Steinberg (Steinberg symbol) Ch.6 8

Định nghĩa

Định nghĩa (Ký hiệu Steinberg [milnor1971]). Cho $F$ là một trường. Ký hiệu Steinberg (Steinberg symbol) là ánh xạ song tuyến tính:
\[ \{ \cdot, \cdot \}: F^\times \times F^\times \longrightarrow K_2(F), \]
gửi cặp phần tử khả nghịch $(f, g)$ tới phần tử $\{f, g\} \in K_2(F)$, thỏa mãn:
  1. Song tuyến tính: $\{fg, h\} = \{f, h\} + \{g, h\}$ và $\{f, gh\} = \{f, g\} + \{f, h\}$.
  2. Quan hệ Steinberg: $\{f, 1-f\} = 0$ cho mọi $f \in F^\times \setminus \{1\}$.

Nhóm $K_2(F)$ được định nghĩa chính xác là:

\[ K_2(F) = \frac{F^\times \otimes_\mathbb{Z} F^\times}{\langle f \otimes (1-f) : f \neq 0, 1 \rangle}. \]
Tức $K_2(F)$ là “tất cả ký hiệu $\{f, g\}$” modulo quan hệ Steinberg.

Ví dụ

Ví dụ (Ký hiệu Steinberg cơ bản). 1. Trường $\mathbb{Q}$: Với $f = 2, g = 3$, ta có $\{2, 3\} \in K_2(\mathbb{Q})$. Phần tử này không tầm thường (non-trivial). Ta có thể kiểm tra: $\{2, -1\} \neq 0$ vì $-1$ không phải thặng dư bậc hai modulo $2$.

2. Quan hệ Steinberg: Lấy $f = 3$, thì $1 - f = -2$, nên $\{3, -2\} = 0$ trong $K_2(\mathbb{Q})$.

3. Hệ quả quan trọng: Từ quan hệ Steinberg suy ra:

  • $\{f, -f\} = 0$ cho mọi $f$ (đặt $g = -f/(1-f)$ rồi tính).
  • $\{f, f\} = \{f, -1\}$ (từ $\{f, -f\} = \{f, f\} + \{f, -1\} = 0$).
Đặc biệt, $\{f, g\} = -\{g, f\}$ (phản giao hoán).

4. Trên đường cong modular: Lấy $f = g_{1,0}$ và $g = g_{0,1}$ là hai đơn vị Siegel trên $Y_1(N)$. Khi đó $\{g_{1,0}, g_{0,1}\} \in K_2(Y_1(N))$ --- đây chính là dạng phần tử Beilinson--Kato.

Ý nghĩa trực giác

Ký hiệu Steinberg --- “tích chéo cho hàm”.
  • Hình dung: Nếu $K_1(F) = F^\times$ đo “các hàm khả nghịch”, thì $K_2(F)$ đo “các quan hệ giữa hàm khả nghịch”. Ký hiệu $\{f, g\}$ giống “tích chéo” của hai hàm --- nó nắm bắt cách $f$ và $g$ “tương tác” với nhau.
  • Tại sao quan hệ $\{f, 1-f\} = 0$?: Hãy nghĩ: $f$ và $1-f$ “phụ thuộc tuyến tính” (theo nghĩa $f + (1-f) = 1$). Quan hệ Steinberg nói rằng các cặp “phụ thuộc trivially” như vậy cho ký hiệu bằng 0.
  • Từ đại số sang số học: Khi $F$ là trường hàm của đường cong đại số, $K_2(F)$ mang thông tin hình học (zero, cực của hàm). Ánh xạ “tame symbol” gửi $\{f, g\}$ tới $(-1)^{v(f)v(g)} f^{v(g)} g^{-v(f)}$ tại mỗi điểm --- đo “sự tương tác cục bộ” của $f$ và $g$.

Liên hệ với giả thuyết Birch--Dyer

Ký hiệu Steinberg trong BSD.
  • Xây phần tử Kato: Euler system Kato bắt đầu từ $\{g_{a,b}, g_{c,d}\} \in K_2(Y_1(N))$ --- ký hiệu Steinberg của cặp đơn vị Siegel. Phần tử này mang cả thông tin đại số (cấu trúc nhóm $K_2$) và giải tích (giá trị $L$).
  • Chiếu vào Galois cohomology: Qua ánh xạ Chern class (regulator), ký hiệu Steinberg được gửi vào $H^1(G_\mathbb{Q}, T_p(E))$ --- tạo thành lớp đối đồng điều Galois. Đây là bước then chốt: biến đối tượng $K$-theory thành đối tượng Galois mà ta có thể dùng để chặn nhóm Selmer.
  • Liên hệ giá trị đặc biệt: Beilinson conjectured (và Kato proved phần lớn) rằng ảnh regulator của $\{g_{a,b}, g_{c,d}\}$ bằng $L'(f, 1)$ nhân hằng số tường minh. Tức thông tin “tích chéo” của hai đơn vị Siegel mã hóa đạo hàm hàm $L$ tại điểm trung tâm.
171 $K$-theory đại số (Algebraic K-theory ($K_2$)) Ch.6 8

Định nghĩa

Định nghĩa ($K$-theory đại số [milnor1971]). $K$-theory đại số (Algebraic $K$-theory) là lý thuyết gán cho mỗi vành (hoặc scheme) $X$ một dãy nhóm Abel $K_n(X)$ ($n \geq 0$), đo “thông tin đại số bậc cao” của $X$. Các nhóm đầu tiên:
  • $K_0(X)$: Nhóm Grothendieck --- phân loại bó véctơ (vector bundle) trên $X$ dưới quan hệ $[E] = [E'] + [E'']$ khi có dãy chính xác ngắn $0 \to E' \to E \to E'' \to 0$.
  • $K_1(F) = F^\times$ (cho trường $F$): Nhóm các phần tử khả nghịch.
  • $K_2(F)$: Nhóm Milnor $K$-theory bậc 2 --- được sinh bởi ký hiệu Steinberg $\{f, g\}$ modulo quan hệ song tuyến tính và $\{f, 1-f\} = 0$.

Đặc biệt, cho $X$ là đường cong trơn trên trường, nhóm $K_2(X)$ gồm các phần tử $\sum_i \{f_i, g_i\}$ (với $f_i, g_i$ hàm hữu tỉ khả nghịch trên $X$) thỏa mãn điều kiện “tame” tại mọi điểm:

\[ \partial_x(\alpha) = 0 \quad \text{cho mọi điểm đóng } x \in X, \]
trong đó $\partial_x: K_2(F(X)) \to k(x)^\times$ là ánh xạ tame symbol.

Ví dụ

Ví dụ ($K_2$ của trường và đường cong). 1. $K_2(\mathbb{Q})$: Theo Matsumoto (1969), $K_2(\mathbb{Q}) = \{\pm 1\} \oplus \bigoplus_p (\text{phần tử tame})$. Cụ thể hơn, định lý Matsumoto cho trường số nói:
\[ K_2(\mathbb{Q}) \cong \{\pm 1\} \oplus \bigoplus_{p \text{ nguyên tố}} \mathbb{F}_p^\times. \]
Phần tử $\{-1, -1\} = -1 \in \{\pm 1\}$ là phần tử không tầm thường đơn giản nhất.

2. $K_2$ của đường cong modular: Cho $Y = Y_1(N)$. Phần tử $\{g_{1,0}, g_{0,1}\}$ (ký hiệu Steinberg của hai đơn vị Siegel) nằm trong $K_2(Y)$ khi và chỉ khi tame symbol triệt tiêu tại mọi điểm. Điều này đòi hỏi chọn cẩn thận $(a,b), (c,d)$ sao cho zero/cực “triệt tiêu nhau”.

3. So sánh bậc $K$-theory:

Nhóm Ý nghĩa Trong BSD
$K_0$ Phân loại bó véctơ Euler characteristic
$K_1 = F^\times$ Các hàm khả nghịch Đơn vị, đơn vị elliptic
$K_2$ Quan hệ giữa hàm Phần tử Beilinson--Kato

Ý nghĩa trực giác

$K$-theory --- “thang đo thông tin đại số”.
  • Hình dung: $K_0$ đếm “có gì” (bó véctơ). $K_1$ đo “các phép biến đổi khả nghịch”. $K_2$ đo “các quan hệ giữa phép biến đổi”. Bậc càng cao, thông tin càng “tinh tế” và “bậc cao” hơn.
  • Analogy vật lý: Trong vật lý, $K_0$ giống “vị trí”, $K_1$ giống “vận tốc”, $K_2$ giống “gia tốc”. Mỗi bậc là “đạo hàm” của bậc trước --- nắm bắt thông tin thay đổi tinh vi hơn.
  • Quillen vs Milnor: Quillen (1972, Fields Medal 1978) định nghĩa $K_n$ cho mọi $n$ bằng topology đại số ($BGL^+$). Milnor $K$-theory đơn giản hơn: $K_n^M(F) = (F^\times)^{\otimes n} / (\text{quan hệ Steinberg})$. Cho $n = 2$, hai định nghĩa trùng nhau; cho $n \geq 3$, Milnor $K$ là “thương” của Quillen $K$.

Liên hệ với giả thuyết Birch--Dyer

$K$-theory trong BSD.
  • $K_2$ là nơi sinh Euler system: Phần tử Beilinson--Kato sống trong $K_2(Y_1(N))$. Đây là lý do $K$-theory không thể thiếu trong phương pháp Kato: ta cần “không gian lớn hơn” $K_1 = \mathcal{O}^\times$ (đơn vị) để chứa phần tử đủ mạnh cho mọi đường cong elliptic (không chỉ CM).
  • Phỏng đoán Beilinson (1984): Tổng quát hóa BSD, Beilinson phỏng đoán rằng giá trị đặc biệt $L^{(r)}(M, n)$ của hàm $L$ của motif $M$ được biểu diễn qua regulator trên $K$-group thích hợp. BSD là trường hợp đặc biệt khi $M = h^1(E)$ (motif bậc 1 của đường cong elliptic).
  • Cầu nối: $K$-theory tạo cầu nối giữa thế giới đại số (nhóm Selmer, Sha) và thế giới giải tích (hàm $L$, giá trị đặc biệt) thông qua ánh xạ regulator. Đây chính là tinh thần trung tâm của toàn bộ BSD: liên hệ số học với giải tích.
172 Ánh xạ regulator (Regulator map) Ch.6 8

Định nghĩa

Định nghĩa (Ánh xạ regulator [beilinson1984]). Ánh xạ regulator (Regulator map) là ánh xạ kết nối $K$-theory đại số với đối đồng điều (cohomology), mang thông tin “đại số thuần túy” sang thông tin “giải tích/topo”. Có hai phiên bản chính:

1. Regulator Beilinson (complex):

\[ r_\mathcal{D}: K_2(X) \longrightarrow H^1_\mathcal{D}(X_\mathbb{R}, \mathbb{R}(2)) \]
gửi phần tử $K$-theory vào đối đồng điều Deligne $H^1_\mathcal{D}$ --- một nhóm đối đồng điều “hỗn hợp” giữa de Rham và Betti, nắm bắt thông tin chu kỳ.

Cụ thể, cho $\{f, g\} \in K_2(\mathbb{C}(X))$, regulator Beilinson được tính:

\[ r_\mathcal{D}(\{f, g\}) = \frac{1}{2\pi i} \int_\gamma \left( \log|f| \cdot d\arg(g) - \log|g| \cdot d\arg(f) \right) \]
trên đường cong $\gamma$ thích hợp.

2. Regulator étale ($p$-adic):

\[ r_p: K_2(X) \longrightarrow H^1(G_\mathbb{Q}, H^1_{\text{ét}}(X_{\overline{\mathbb{Q}}}, \mathbb{Z}_p(2))) \]
gửi $K$-theory vào đối đồng điều Galois liên tục. Đây là phiên bản “$p$-adic” quan trọng cho Euler system Kato.

Ví dụ

Ví dụ (Regulator cổ điển và Beilinson). 1. Regulator Dirichlet (tiền thân): Cho trường số $K$ với đơn vị $\mathcal{O}_K^\times$. Regulator cổ điển:
\[ R_K = |\det(\log|\sigma_i(u_j)|)| \]
là định thức ma trận logarit các nhúng $\sigma_i$ đánh giá trên hệ đơn vị cơ bản $\{u_1, \ldots, u_r\}$. Đây chính là $r_\mathcal{D}$ trên $K_1(\mathcal{O}_K) = \mathcal{O}_K^\times$ --- “bậc 1” của regulator.

2. Regulator Beilinson cho đường cong elliptic: Lấy $E: y^2 = x^3 - x$ (conductor $N = 32$). Cho $\alpha = \{f, g\} \in K_2(E)$, regulator Beilinson cho số thực:

\[ r_\mathcal{D}(\alpha) = c \cdot L'(E, 0) \quad (\text{modulo } \mathbb{Q}^\times) \]
theo phỏng đoán Beilinson. Tức regulator “trích xuất” giá trị đặc biệt hàm $L$ từ phần tử $K$-theory.

3. Regulator étale (Kato): Cho $\beta_\gamma \in K_2(Y_1(N))$ là phần tử Beilinson--Kato. Áp dụng $r_p$:

\[ r_p(\beta_\gamma) = z_\gamma \in H^1(G_\mathbb{Q}, T_p(E)) \supset \mathrm{Sel}_{p^\infty}(E/\mathbb{Q}). \]
Phần tử $z_\gamma$ chính là “Kato class” trong Galois cohomology --- nguyên liệu cho Euler system.

Ý nghĩa trực giác

Regulator --- “máy dịch” giữa đại số và giải tích.
  • Hình dung: $K$-theory mang thông tin “đại số thuần túy” (ký hiệu Steinberg, quan hệ giữa hàm). Cohomology mang thông tin “topo/giải tích” (tích phân, chu kỳ). Regulator là “máy dịch” chuyển ngôn ngữ đại số sang ngôn ngữ giải tích.
  • Analogy: Giống như phép biến đổi Fourier biến hàm thời gian thành hàm tần số --- cùng một thông tin nhưng “nhìn” theo góc khác. Regulator biến phần tử $K$-theory thành lớp cohomology --- cùng thông tin số học nhưng ở dạng dễ tính toán hơn.
  • Quy luật chung: Mọi kết nối “đại số $\leftrightarrow$ giải tích” trong lý thuyết số đều đi qua một dạng regulator. Công thức số lớp dùng regulator Dirichlet. BSD dùng regulator Néron--Tate (cho $K_0$). Beilinson--Kato dùng regulator $K_2$ (bậc cao hơn).

Liên hệ với giả thuyết Birch--Dyer

Regulator trong BSD.
  • Vai trò trung tâm: Regulator là “bước chuyển” quan trọng nhất trong phương pháp Kato:
    \[ \underbrace{\{g_{a,b}, g_{c,d}\}}_{\text{đại số: } K_2} \xrightarrow{\; r_p \;} \underbrace{z_\gamma \in H^1(G_\mathbb{Q}, T_p(E))}_{\text{Galois: Euler system}} \xrightarrow{\;\text{bound}\;} \underbrace{|\mathrm{Sel}_{p^\infty}| < \infty}_{\text{BSD}}. \]
  • Hai regulator trong BSD: BSD mạnh chứa regulator Néron--Tate $\mathrm{Reg}_E = \det(\langle P_i, P_j \rangle)$ trong công thức $L^{(r)}(E,1)/r!$. Regulator Beilinson là “bậc cao hơn” --- liên hệ $K_2$ với $L'(f,1)$. Hai regulator này tương thích qua “compatibility” trong Beilinson conjecture.
  • Phỏng đoán Beilinson = BSD tổng quát: Phỏng đoán Beilinson nói rằng rank của $K$-group bằng bậc triệt tiêu hàm $L$ tại điểm nguyên thích hợp, và regulator cho giá trị đặc biệt (modulo $\mathbb{Q}^\times$). BSD là trường hợp $K_0$ (hạng Mordell--Weil = $\mathrm{ord}_{s=1} L(E,s)$). Phương pháp Kato khai thác $K_2$.
173 Lý thuyết Hodge $p$-adic ($p$-adic Hodge theory) Ch.6 10

Định nghĩa

Định nghĩa (Lý thuyết Hodge $p$-adic [fontaine1994]). Lý thuyết Hodge $p$-adic ($p$-adic Hodge theory) là lý thuyết phân loại và so sánh các biểu diễn $p$-adic của nhóm Galois cục bộ $G_{\mathbb{Q}_p} = \mathrm{Gal}(\overline{\mathbb{Q}}_p / \mathbb{Q}_p)$ với các đối tượng đại số tuyến tính “bán đơn giản hơn” (module lọc, module Dieudonné, v.v.).

Fontaine (1982--1994) xây dựng các “vành chu kỳ $p$-adic” lớn:

  • $B_{\mathrm{HT}}$: vành Hodge--Tate. Phân loại biểu diễn Hodge--Tate (đơn giản nhất).
  • $B_{\mathrm{dR}}$: vành de Rham. Phân loại biểu diễn de Rham (có lọc --- filtration).
  • $B_{\mathrm{cris}}$: vành crystalline. Phân loại biểu diễn crystalline (có Frobenius $\varphi$).
  • $B_{\mathrm{st}}$: vành semi-stable. Phân loại biểu diễn bán ổn định (có $\varphi$ và monodromy $N$).

Cho $V$ là biểu diễn $p$-adic của $G_{\mathbb{Q}_p}$ (tức $\mathbb{Q}_p$-không gian véctơ hữu hạn chiều với tác động liên tục của $G_{\mathbb{Q}_p}$), ta định nghĩa:

\[ D_{\mathrm{cris}}(V) = (B_{\mathrm{cris}} \otimes_{\mathbb{Q}_p} V)^{G_{\mathbb{Q}_p}}, \quad D_{\mathrm{dR}}(V) = (B_{\mathrm{dR}} \otimes_{\mathbb{Q}_p} V)^{G_{\mathbb{Q}_p}}. \]
$V$ được gọi là crystalline nếu $\dim_{\mathbb{Q}_p} D_{\mathrm{cris}}(V) = \dim_{\mathbb{Q}_p} V$.

Bao hàm: crystalline $\subset$ semi-stable $\subset$ de Rham $\subset$ Hodge--Tate.

Ví dụ

Ví dụ (Phân loại biểu diễn cho đường cong elliptic). Cho $E/\mathbb{Q}$ đường cong elliptic, $V_p(E) = T_p(E) \otimes_{\mathbb{Z}_p} \mathbb{Q}_p$ là biểu diễn $p$-adic 2 chiều.

1. Rút gọn tốt tại $p$: Nếu $E$ có rút gọn tốt tại $p$, thì $V_p(E)|_{G_{\mathbb{Q}_p}}$ là crystalline. Khi đó:

\[ D_{\mathrm{cris}}(V_p(E)) \cong \mathbb{Q}_p^2 \text{ với Frobenius } \varphi \text{ có đa thức đặc trưng } T^2 - a_p T + p. \]
Thông tin $a_p$ (vết Frobenius) được “thu hồi” từ $D_{\mathrm{cris}}$.

2. Rút gọn nhân tại $p$: Nếu $E$ có rút gọn nhân (tách hoặc không tách), thì $V_p(E)|_{G_{\mathbb{Q}_p}}$ là semi-stable nhưng không crystalline. Có thêm toán tử monodromy $N \neq 0$.

3. Trọng số Hodge--Tate: Biểu diễn $V_p(E)$ luôn có trọng số Hodge--Tate $\{0, 1\}$ --- phản ánh rằng $E$ là đa tạp Abel chiều 1. Nếu $A$ là đa tạp Abel chiều $g$, thì $V_p(A)$ có chiều $2g$ với trọng số $\{0, 1\}$ lặp $g$ lần.

Ý nghĩa trực giác

Hodge $p$-adic --- “giải mã biểu diễn Galois”.
  • Bài toán gốc: Biểu diễn Galois $\rho: G_{\mathbb{Q}_p} \to \mathrm{GL}_n(\mathbb{Q}_p)$ rất phức tạp vì $G_{\mathbb{Q}_p}$ là nhóm profinite khổng lồ. Lý thuyết Hodge $p$-adic “giải mã” $\rho$ thành đại số tuyến tính đơn giản hơn: module $D$ với Frobenius $\varphi$ và filtration.
  • Analogy Hodge cổ điển: Trong hình học phức, đối đồng điều $H^n(X, \mathbb{C})$ có phân tích Hodge $\bigoplus_{p+q=n} H^{p,q}$. Phân tích này cho biết “bao nhiêu thông tin holomorphic vs anti-holomorphic”. Hodge $p$-adic làm tương tự nhưng trên $\mathbb{Q}_p$: thay “holomorphic” bằng “crystalline/de Rham”.
  • Tại sao “vành chu kỳ”?: Trong Hodge cổ điển, tích phân chu kỳ $\int_\gamma \omega$ so sánh de Rham và Betti. Trong Hodge $p$-adic, vành $B_\bullet$ (rất lớn!) đóng vai trò “chu kỳ $p$-adic” --- so sánh Galois và de Rham/crystalline.

Liên hệ với giả thuyết Birch--Dyer

Hodge $p$-adic trong BSD.
  • Ánh xạ so sánh (Kato): Euler system Kato cần “so sánh” lớp Galois $z_\gamma \in H^1(G_\mathbb{Q}, V_p(E))$ với giá trị hàm $L$. Bước so sánh này đi qua $D_{\mathrm{cris}}$:
    \[ H^1(G_{\mathbb{Q}_p}, V_p(E)) \xrightarrow{\;\exp^*\;} D_{\mathrm{cris}}(V_p(E)) \xrightarrow{\;\sim\;} \text{giá trị } L(E,1). \]
    Ánh xạ $\exp^*$ (đối ngẫu của ánh xạ mũ Bloch--Kato) là cầu nối then chốt.
  • Hàm $L$ $p$-adic: Xây dựng hàm $L$ $p$-adic $L_p(E, s)$ cũng dùng Hodge $p$-adic: nội suy $p$-adic các giá trị đặc biệt đòi hỏi “chu kỳ $p$-adic” $\Omega_p$ liên quan đến $D_{\mathrm{cris}}$.
  • BSD $p$-adic: Phỏng đoán BSD $p$-adic (Mazur--Tate--Teitelbaum) phát biểu hoàn toàn trong ngôn ngữ Hodge $p$-adic. “Regulator $p$-adic” $\mathrm{Reg}_p$ được định nghĩa qua logarit $p$-adic trên $D_{\mathrm{cris}}$, thay cho regulator thực $\mathrm{Reg}_E$.
  • Exceptional zero: Khi $E$ có rút gọn nhân tách tại $p$ (semi-stable, không crystalline), hàm $L$ $p$-adic có thêm zero “ngoại lai”. Bất biến $\mathcal{L}$ (Greenberg--Stevens) đo “lệch” giữa crystalline và semi-stable --- hiện tượng thuần túy Hodge $p$-adic.
174 Đối ngẫu cục bộ–toàn cục (Local-global duality) Ch.6 8

Định nghĩa

Định nghĩa (Đối ngẫu cục bộ--toàn cục [neukirch2008]). Đối ngẫu cục bộ--toàn cục (Local-global duality) gồm hai thành phần chính:

1. Đối ngẫu Tate cục bộ: Cho $G_v = \mathrm{Gal}(\overline{K}_v / K_v)$ nhóm Galois cục bộ (tại vị trí $v$ của trường số $K$) và $M$ module Galois hữu hạn. Khi đó có ghép đôi hoàn hảo:

\[ H^r(G_v, M) \times H^{2-r}(G_v, M^*) \longrightarrow H^2(G_v, \overline{K}_v^\times) \cong \mathbb{Q}/\mathbb{Z}, \quad r = 0, 1, 2, \]
trong đó $M^* = \mathrm{Hom}(M, \overline{K}_v^\times)$ là module đối ngẫu.

2. Dãy chính xác Poitou--Tate: Liên kết đối đồng điều toàn cục $H^r(G_K, M)$ và cục bộ $\prod_v H^r(G_v, M)$ qua dãy chính xác dài 9 số hạng:

\[ 0 \to H^0(G_K, M) \to \bigoplus_v H^0(G_v, M) \to H^2(G_K, M^*)^\vee \to H^1(G_K, M) \to \cdots \]
\[ \cdots \to \bigoplus_v H^1(G_v, M) \to H^1(G_K, M^*)^\vee \to H^2(G_K, M) \to \bigoplus_v H^2(G_v, M) \to H^0(G_K, M^*)^\vee \to 0, \]
trong đó $(-)^\vee = \mathrm{Hom}(-, \mathbb{Q}/\mathbb{Z})$ là đối ngẫu Pontryagin.

Ví dụ

Ví dụ (Đối ngẫu Tate và Poitou--Tate). 1. Đối ngẫu Tate cho $M = \mu_n$ (căn bậc $n$ đơn vị): Lấy $K_v = \mathbb{Q}_p$ với $p \nmid n$. Module đối ngẫu $\mu_n^* = \mathbb{Z}/n\mathbb{Z}$. Đối ngẫu Tate cho:
\[ H^1(\mathbb{Q}_p, \mu_n) \times H^1(\mathbb{Q}_p, \mathbb{Z}/n\mathbb{Z}) \to \mathbb{Q}/\mathbb{Z}. \]
Vế trái $H^1(\mathbb{Q}_p, \mu_n) \cong \mathbb{Q}_p^\times / (\mathbb{Q}_p^\times)^n$ (Kummer) và $H^1(\mathbb{Q}_p, \mathbb{Z}/n\mathbb{Z}) \cong \mathrm{Hom}(G_{\mathbb{Q}_p}^{\mathrm{ab}}, \mathbb{Z}/n\mathbb{Z})$ (ký tự). Ghép đôi chính là ký hiệu Hilbert $(a, b)_p$.

2. Poitou--Tate cho $E[p]$: Lấy $M = E[p]$ (điểm xoắn $p$-phần). Dãy Poitou--Tate chứa:

\[ H^1(G_\mathbb{Q}, E[p]) \to \bigoplus_v H^1(G_v, E[p]) \to H^1(G_\mathbb{Q}, E[p]^*)^\vee. \]
Nhóm Selmer $\mathrm{Sel}_p(E/\mathbb{Q})$ được định nghĩa là hạt nhân của ánh xạ hợp thành $H^1(G_\mathbb{Q}, E[p]) \to \bigoplus_v H^1(G_v, E[p]) / \mathrm{im}(\kappa_v)$. Dãy Poitou--Tate cho phép liên hệ kích thước Selmer với Sha đối ngẫu.

Ý nghĩa trực giác

Đối ngẫu cục bộ--toàn cục --- “luật bảo toàn số học”.
  • Hình dung: Mỗi “vị trí” $v$ (số nguyên tố hoặc vô cực) cho ta “thông tin cục bộ” $H^r(G_v, M)$. Thông tin “toàn cục” $H^r(G_\mathbb{Q}, M)$ khó tính trực tiếp. Poitou--Tate nói: toàn cục được xác định bởi cục bộ cộng ràng buộc đối ngẫu.
  • Analogy: Giống như “luật bảo toàn” trong vật lý. Thông tin cục bộ (tại từng $p$) không độc lập --- chúng bị ràng buộc bởi luật “tổng bằng 0”. Ví dụ: luật thặng dư bậc hai (Gauss) nói $\prod_v (a, b)_v = 1$ --- ký hiệu Hilbert tại mọi vị trí nhân lại bằng 1.
  • Tại sao “đối ngẫu”?: $H^r$ và $H^{2-r}$ “đối ngẫu” nhau qua ghép đôi Tate (giống $H^k$ và $H^{n-k}$ đối ngẫu Poincaré trong topo). Chiều $r = 0, 1, 2$ tương ứng “phần tử bất biến”, “mở rộng (extension)”, và “chướng ngại (obstruction)”.

Liên hệ với giả thuyết Birch--Dyer

Đối ngẫu cục bộ--toàn cục trong BSD.
  • Định nghĩa Selmer: Nhóm Selmer $\mathrm{Sel}_p(E/\mathbb{Q})$ được định nghĩa chính xác bằng “điều kiện cục bộ” tại mỗi $v$. Dãy Poitou--Tate giải thích tại sao điều kiện cục bộ xác định duy nhất nhóm Selmer --- và cho dãy chính xác:
    \[ 0 \to \mathrm{Sel}_p(E/\mathbb{Q}) \to H^1(G_\mathbb{Q}, E[p]) \to \bigoplus_v \frac{H^1(G_v, E[p])}{\mathrm{im}(\kappa_v)}. \]
  • Đối ngẫu Selmer: Poitou--Tate cho “dãy đối ngẫu Selmer”: $\mathrm{Sel}$ và $\mathrm{Sel}^*$ (Selmer đối ngẫu, với điều kiện cục bộ đối ngẫu) liên hệ qua:
    \[ 0 \to \mathrm{Sha} \to \mathrm{coker}(\text{cục bộ}) \to \mathrm{Sel}^{*\vee} \to \cdots \]
    Đây là công cụ then chốt trong chứng minh Kolyvagin: chặn $\mathrm{Sel}$ bằng cách chặn $\mathrm{Sel}^*$ (dễ hơn nhờ Euler system).
  • Skinner--Urban: Chứng minh phỏng đoán chính Iwasawa bởi Skinner--Urban sử dụng sâu sắc dãy Poitou--Tate trên tháp cyclotomic $\mathbb{Q}_\infty/\mathbb{Q}$. Đối ngẫu cục bộ--toàn cục “ở mọi tầng” cho phép xây dựng module Iwasawa và chứng minh đẳng thức chuỗi đặc trưng.
  • Ghép đôi Cassels--Tate: Ghép đôi $\mathrm{Sha} \times \mathrm{Sha} \to \mathbb{Q}/\mathbb{Z}$ (dẫn đến $|\mathrm{Sha}| = \square$) được xây dựng từ dãy Poitou--Tate. Tức “$|\mathrm{Sha}|$ bình phương” là hệ quả trực tiếp của đối ngẫu cục bộ--toàn cục.
175 Ghép đôi Tate cục bộ (Local Tate pairing) Ch.6 8

Định nghĩa

Định nghĩa (Ghép đôi Tate cục bộ [tate1963]). Cho $K_v$ là trường cục bộ (hoàn chỉnh của trường số tại vị trí $v$), và $M$ là module Galois hữu hạn (hoặc $p$-adic) của $G_v = \mathrm{Gal}(\overline{K}_v / K_v)$. Ghép đôi Tate cục bộ (Local Tate pairing) là ghép đôi hoàn hảo:
\[ \langle \cdot, \cdot \rangle_v: H^1(G_v, M) \times H^1(G_v, M^*(1)) \longrightarrow H^2(G_v, \overline{K}_v^\times) \xrightarrow{\;\mathrm{inv}_v\;} \mathbb{Q}/\mathbb{Z}, \]
trong đó:
  • $M^*(1) = \mathrm{Hom}(M, \mu)$ là twist đối ngẫu Tate (với $\mu$ = nhóm các căn đơn vị),
  • $\mathrm{inv}_v: H^2(G_v, \overline{K}_v^\times) \xrightarrow{\sim} \mathbb{Q}/\mathbb{Z}$ là bất biến cục bộ (local invariant) từ lý thuyết trường lớp cục bộ.

Ghép đôi được xây từ cup product:

\[ H^1(G_v, M) \otimes H^1(G_v, M^*(1)) \xrightarrow{\;\cup\;} H^2(G_v, M \otimes M^*(1)) \to H^2(G_v, \overline{K}_v^\times). \]
“Hoàn hảo” nghĩa là: nếu $\langle x, y \rangle_v = 0$ cho mọi $y$, thì $x = 0$.

Ví dụ

Ví dụ (Ghép đôi Tate cho đường cong elliptic). 1. Cho $M = E[p]$: Với $E/\mathbb{Q}_p$ đường cong elliptic, ghép đôi Weil $e_p: E[p] \times E[p] \to \mu_p$ cho đồng cấu $E[p] \cong E[p]^*(1)$. Khi đó ghép đôi Tate trở thành:
\[ \langle \cdot, \cdot \rangle_p: H^1(G_{\mathbb{Q}_p}, E[p]) \times H^1(G_{\mathbb{Q}_p}, E[p]) \to \mathbb{Q}/\mathbb{Z}. \]
Ghép đôi này phản đối xứng: $\langle x, y \rangle_p = -\langle y, x \rangle_p$.

2. Ảnh Kummer: Nhóm $E(\mathbb{Q}_p)/pE(\mathbb{Q}_p)$ nhúng vào $H^1(G_{\mathbb{Q}_p}, E[p])$ qua ánh xạ Kummer $\kappa_p$. Tính chất quan trọng:

\[ \langle \kappa_p(P), \kappa_p(Q) \rangle_p = 0 \quad \text{cho mọi } P, Q \in E(\mathbb{Q}_p). \]
Tức ảnh Kummer là tự trực giao (totally isotropic) dưới ghép đôi Tate. Điều này có nghĩa: “điểm cục bộ thật sự ghép đôi bằng 0” --- chỉ các lớp “ma” (phantom) mới ghép đôi khác 0.

3. Orthogonal complement: Nếu gọi $L_v = \mathrm{im}(\kappa_v) \subset H^1(G_v, E[p])$, thì $L_v = L_v^\perp$ (tự đối ngẫu). Điều kiện Selmer “nằm trong $L_v$ tại mọi $v$” tương đương “trực giao với $L_v$ tại mọi $v$” --- đây là lý do Selmer “tự đối ngẫu”.

Ý nghĩa trực giác

Ghép đôi Tate --- “thước đo chướng ngại cục bộ”.
  • Hình dung: Tại mỗi vị trí $v$, ghép đôi Tate đo “khoảng cách” giữa hai lớp cohomology cục bộ. Nếu ghép đôi bằng 0, hai lớp “tương thích”; nếu khác 0, chúng “xung đột”.
  • Analogy: Giống tích vô hướng trong không gian véctơ. Ghép đôi Tate cho $H^1$ cục bộ cấu trúc “không gian tuyến tính có tích vô hướng”. Nhóm Selmer là “không gian con đẳng hướng” --- nơi tích vô hướng triệt tiêu.
  • Từ cục bộ sang toàn cục: Khi “ghép” tất cả ghép đôi Tate cục bộ $\langle \cdot, \cdot \rangle_v$ lại, ta được dãy Poitou--Tate. “Luật tích” $\sum_v \langle x, y \rangle_v = 0$ (tương tự luật thặng dư bậc hai) ràng buộc thông tin cục bộ thành toàn cục.

Liên hệ với giả thuyết Birch--Dyer

Ghép đôi Tate trong BSD.
  • Định nghĩa Selmer: Điều kiện cục bộ trong định nghĩa Selmer --- “lớp $c \in H^1(G_\mathbb{Q}, E[p])$ sao cho $c|_{G_v} \in \mathrm{im}(\kappa_v)$ cho mọi $v$” --- tương đương với “$c$ trực giao với tất cả lớp cục bộ” dưới ghép đôi Tate.
  • Chặn Selmer: Kolyvagin và Kato chặn Selmer bằng cách tìm phần tử $z$ sao cho $\langle z, c \rangle_v \neq 0$ cho đủ nhiều $c$ --- “loại bỏ” các phần tử Selmer bằng ghép đôi.
  • Ghép đôi Cassels--Tate: Ghép đôi $\mathrm{Sha} \times \mathrm{Sha} \to \mathbb{Q}/\mathbb{Z}$ (suy ra $|\mathrm{Sha}| = \square$) được xây từ tổng các ghép đôi Tate cục bộ: $\langle x, y \rangle_{\mathrm{CT}} = \sum_v \langle x_v, y_v \rangle_v$ trên dãy Poitou--Tate.
176 Hình học của số (Geometry of numbers) Ch.6 6

Định nghĩa

Định nghĩa (Hình học của số [bhargava2015]). Hình học của số (Geometry of numbers) là nhánh lý thuyết số sáng lập bởi Minkowski (1896), nghiên cứu mối liên hệ giữa lưới (lattice) trong không gian Euclid $\mathbb{R}^n$ và bài toán số nguyên. Kết quả nền tảng:

Định lý Minkowski: Cho $\Lambda \subset \mathbb{R}^n$ lưới với thể tích cơ bản $\mathrm{vol}(\Lambda)$, và $S \subset \mathbb{R}^n$ tập lồi đối xứng tâm. Nếu:

\[ \mathrm{vol}(S) > 2^n \cdot \mathrm{vol}(\Lambda), \]
thì $S$ chứa ít nhất một điểm lưới khác gốc: $S \cap \Lambda \neq \{0\}$.

Trong ngữ cảnh hiện đại (Bhargava), hình học của số được mở rộng: thay vì đếm điểm lưới trong một tập, ta đếm quỹ đạo (orbits) của hành động nhóm trên lưới. Cụ thể:

  • Cho $G$ nhóm (ví dụ $\mathrm{GL}_2(\mathbb{Z})$) tác động trên không gian véctơ $V$ (ví dụ các dạng nhị phần),
  • Đếm quỹ đạo $G \backslash V(\mathbb{Z})$ --- tương ứng với đối tượng số học (lớp đẳng cấu của dạng).

Ví dụ

Ví dụ (Từ Gauss đến Bhargava). 1. Gauss (1801): Dạng nhị phần bậc hai $ax^2 + bxy + cy^2$ với biệt thức $D = b^2 - 4ac$. Hành động $\mathrm{SL}_2(\mathbb{Z})$ phân loại dạng thành lớp. Số lớp $= h(D) = $ số lớp ideal của $\mathbb{Q}(\sqrt{D})$. Đây là hình học của số “cổ điển”.

2. Bhargava (2004, Fields Medal 2014): Thay dạng bậc hai bằng bậc cao hơn:

Dạng Nhóm tác động Tham số hóa
Nhị phần bậc 4 $\mathrm{GL}_2(\mathbb{Z})$ $\mathrm{Sel}_2(E)$
Khối nhị phần bậc 3 $\mathrm{GL}_3(\mathbb{Z}) \times \mathrm{GL}_3(\mathbb{Z})$ $\mathrm{Sel}_3(E)$
Cặp dạng khối bậc 2 $\mathrm{GL}_2(\mathbb{Z}) \times \mathrm{GL}_4(\mathbb{Z})$ $\mathrm{Sel}_4(E)$
Dạng bậc 5, $5 \times 5$ $\mathrm{GL}_5(\mathbb{Z})$ $\mathrm{Sel}_5(E)$

Mỗi quỹ đạo ↔ phần tử Selmer. Đếm quỹ đạo bằng hình học của số → trung bình Selmer!

3. Kết quả then chốt: Bhargava--Shankar (2010--2015) chứng minh:

\[ \mathrm{avg}_{E/\mathbb{Q}} |\mathrm{Sel}_2(E)| = 3, \quad \mathrm{avg} |\mathrm{Sel}_3(E)| = 4, \quad \mathrm{avg} |\mathrm{Sel}_5(E)| = 6. \]
Công thức chung: $\mathrm{avg} |\mathrm{Sel}_n(E)| = \sigma(n)$ (tổng ước).

Ý nghĩa trực giác

Hình học của số --- “đếm bằng thể tích”.
  • Hình dung: Bạn có lưới (grid) trong không gian, và muốn đếm bao nhiêu điểm lưới nằm trong một vùng. Minkowski nói: nếu vùng đủ lớn, chắc chắn có điểm. Bhargava nói: ta có thể đếm chính xác trung bình bao nhiêu điểm, và mỗi điểm ứng với phần tử Selmer.
  • Tại sao đột phá: Trước Bhargava, không ai biết cách tính trung bình $|\mathrm{Sel}_n|$ vì không có “không gian tham số” tốt. Bhargava tìm ra tham số hóa invariant-theoretic: phần tử Selmer ↔ quỹ đạo dạng đa thức ↔ điểm lưới. Khi đó, đếm trung bình trở thành bài toán thể tích!
  • Hệ quả: Trung bình $|\mathrm{Sel}_n|$ hữu hạn $\Rightarrow$ “đa số” đường cong có hạng thấp. Kết hợp với Skinner--Zhang: $\geq 66.48\%$ đường cong elliptic thỏa BSD.

Liên hệ với giả thuyết Birch--Dyer

Hình học của số trong BSD.
  • 66.48%: Bhargava--Skinner--Zhang (2014) kết hợp: (a) $\mathrm{avg}|\mathrm{Sel}_5| = 6$ (Bhargava--Shankar, hình học số), (b) Kolyvagin $+ $ Gross--Zagier (hạng giải tích $\leq 1 \Rightarrow$ BSD), (c) Skinner (converse: BSD $\Rightarrow$ hạng giải tích), để kết luận: ít nhất $66.48\%$ đường cong elliptic trên $\mathbb{Q}$ thỏa BSD.
  • Chặn hạng trung bình: $\mathrm{avg}|\mathrm{Sel}_2| = 3$ suy ra $\mathrm{avg\;rank}(E(\mathbb{Q})) \leq 1.5$. Sử dụng $\mathrm{Sel}_5$: $\mathrm{avg\;rank} \leq 0.885$. Điều này hỗ trợ phỏng đoán Goldfeld (50% hạng 0, 50% hạng 1, hạng $\geq 2$ mật độ 0).
  • Phương pháp mới hoàn toàn: Trước Bhargava, bằng chứng cho BSD dùng phương pháp “analytic” (hàm $L$, Euler system). Bhargava mở hướng “algebraic/geometric”: đếm bằng lưới, không cần hàm $L$ trực tiếp.
177 Dạng nhị phần bậc bốn (Binary quartic form) Ch.6 7

Định nghĩa

Định nghĩa (Dạng nhị phần bậc bốn [bhargava2015]). Dạng nhị phần bậc bốn (Binary quartic form) là đa thức thuần nhất bậc 4 theo hai biến:
\[ f(x, y) = ax^4 + bx^3y + cx^2y^2 + dxy^3 + ey^4, \quad a, b, c, d, e \in \mathbb{Z}. \]
Hai bất biến chính dưới hành động $\mathrm{GL}_2(\mathbb{Z})$:
\[ I(f) = 12ae - 3bd + c^2, \quad J(f) = 72ace + 9bcd - 27ad^2 - 27eb^2 - 2c^3. \]

Liên hệ với đường cong elliptic: Mỗi dạng nhị phần bậc bốn $f$ có đường cong đồng hành:

\[ C_f: y^2 = f(x, 1) = ax^4 + bx^3 + cx^2 + dx + e. \]
Đường cong Jacobian (đường cong elliptic liên kết) của $C_f$ là:
\[ E_f: Y^2 = X^3 - 27I \cdot X - 27J. \]
$C_f$ là torsor (không gian chính tề thuần nhất) cho $E_f$: nếu $C_f$ có điểm hữu tỉ, thì $C_f \cong E_f$ trên $\mathbb{Q}$.

Ví dụ

Ví dụ (Dạng nhị phần bậc bốn và Selmer). 1. Ví dụ đơn giản: $f(x, y) = x^4 + y^4$. Bất biến: $I = 12, J = -54$. Đường cong elliptic:
\[ E_f: Y^2 = X^3 - 324X + 1458. \]
Đường cong $C_f: y^2 = x^4 + 1$ có điểm hữu tỉ $(0, \pm 1)$, nên $C_f$ thực sự là torsor tầm thường (trivial) --- ứng với phần tử đơn vị trong $\mathrm{Sel}_2(E_f)$.

2. Tham số hóa Selmer: Bhargava--Shankar thiết lập tương ứng 1-1:

\[ \boxed{\mathrm{Sel}_2(E) \longleftrightarrow \frac{\{\text{dạng nhị phần bậc 4 locally soluble, bất biến } (I,J) = (I_E, J_E)\}}{\mathrm{GL}_2(\mathbb{Z})\text{-quỹ đạo}}} \]
Tức mỗi phần tử $\mathrm{Sel}_2(E)$ ↔ quỹ đạo dạng nhị phần bậc 4 có điểm cục bộ ở mọi nơi. Đếm quỹ đạo = đếm $|\mathrm{Sel}_2|$!

3. Đếm: Sử dụng hình học của số (Minkowski-style), Bhargava--Shankar đếm:

\[ \sum_{E: H(E) \leq X} |\mathrm{Sel}_2(E)| \sim 3 \cdot |\{E: H(E) \leq X\}| \]
khi $X \to \infty$ (với $H(E)$ là chiều cao ngây thơ), suy ra $\mathrm{avg}|\mathrm{Sel}_2| = 3$.

Ý nghĩa trực giác

Dạng nhị phần bậc bốn --- “bộ mặt hình học của Selmer”.
  • Hình dung: Nhóm Selmer rất trừu tượng (sống trong Galois cohomology). Bhargava “hiện thực hóa” nó: mỗi phần tử Selmer ↔ đường cong $y^2 = f(x, 1)$ với $f$ dạng bậc 4 ↔ “vật thể hình học” mà ta có thể đếm.
  • Tại sao bậc 4?: Phần tử 2-Selmer tương ứng 2-covering (phủ bậc 2) của $E$. Phủ bậc 2 có phương trình tự nhiên $y^2 = f_4(x)$ (bậc 4) hoặc $y^2 = f_3(x)$ (bậc 3). Birch--Swinnerton-Dyer (1963) đã nhận ra điều này; Bhargava biến nó thành công cụ đếm.
  • Paradigm mới: Trước Bhargava: Selmer → Galois cohomology → rất khó tính. Sau Bhargava: Selmer → dạng đa thức → đếm quỹ đạo bằng thể tích → kết quả trung bình chính xác.

Liên hệ với giả thuyết Birch--Dyer

Dạng nhị phần bậc bốn trong BSD.
  • $\mathrm{avg}|\mathrm{Sel}_2| = 3$: Kết quả chính của Bhargava--Shankar. Hệ quả: $\mathrm{avg\;rank}(E(\mathbb{Q})) \leq \mathrm{avg}|\mathrm{Sel}_2| - 1 = 2$ (thô), tinh chỉnh: $\leq 1.5$.
  • “Đa số hạng thấp”: Từ $\mathrm{avg}|\mathrm{Sel}_2| = 3$ suy ra: ít nhất $\frac{1}{3}$ đường cong có $|\mathrm{Sel}_2| = 1$, tức $\mathrm{rk} = 0$ và $\mathrm{Sha}[2] = 0$. Kết hợp Skinner: các đường cong này thỏa BSD.
  • Tham số hóa là then chốt: Không có tham số hóa “Selmer ↔ dạng nhị phần bậc 4”, ta không thể đếm Selmer bằng hình học số --- và kết quả 66.48% sẽ không tồn tại.
178 Dạng khối nhị phần bậc ba (Ternary cubic form) Ch.6 7

Định nghĩa

Định nghĩa (Dạng khối nhị phần bậc ba [bhargava2015]). Dạng khối nhị phần bậc ba (Ternary cubic form) là đa thức thuần nhất bậc 3 theo ba biến:
\[ f(x, y, z) = \sum_{i+j+k=3} a_{ijk} x^i y^j z^k \in \mathbb{Z}[x, y, z]. \]
Đây là dạng “3 biến, bậc 3” --- gồm 10 hệ số.

Nhóm $\mathrm{SL}_3(\mathbb{Z})$ tác động trên không gian dạng khối bậc 3 bằng thay biến. Bhargava--Shankar thiết lập:

\[ \mathrm{Sel}_3(E) \longleftrightarrow \frac{\{\text{dạng khối bậc 3 locally soluble, bất biến } = (S, T) \text{ của } E\}}{\mathrm{SL}_3(\mathbb{Z})\text{-quỹ đạo}}. \]

Cụ thể hơn, mỗi phần tử 3-Selmer ứng với 3-covering: đường cong trong $\mathbb{P}^2$ cho bởi $f(x,y,z) = 0$ (đường cong phẳng genus 1 bậc 3), là torsor cho $E$ với “giai đoạn” (period) chia hết cho 3.

Ví dụ

Ví dụ (Dạng khối bậc 3 và 3-Selmer). 1. Ví dụ: Đường cong $3x^3 + 4y^3 + 5z^3 = 0$ trong $\mathbb{P}^2$ là đường cong genus 1 bậc 3. Jacobian của nó là đường cong elliptic $E$. Nếu đường cong có điểm cục bộ (trên $\mathbb{Q}_p$ mọi $p$ và trên $\mathbb{R}$) nhưng không có điểm hữu tỉ, nó ứng với phần tử không tầm thường trong $\mathrm{Sha}(E)[3] \subset \mathrm{Sel}_3(E)$.

2. So sánh tham số hóa:

$n$-Selmer Dạng đa thức Số biến Bậc
$\mathrm{Sel}_2$Nhị phần bậc 424
$\mathrm{Sel}_3$Khối bậc 333
$\mathrm{Sel}_4$Cặp dạng khối bậc 242
$\mathrm{Sel}_5$Dạng bậc 5 đặc biệt55

Quy luật: $n$-covering sống trong $\mathbb{P}^{n-1}$ (không gian xạ ảnh chiều $n-1$) với bậc $n$ (khi $n = 2$: siêu mặt bậc 2 trong $\mathbb{P}^1$ = bậc 4 một chiều).

3. Kết quả: $\mathrm{avg}|\mathrm{Sel}_3(E)| = 4 = 1 + 3 = \sigma(3)$ (tổng ước của 3). Suy ra: ít nhất $\frac{5}{6}$ đường cong elliptic có $3$-Selmer rank $\leq 1$.

Ý nghĩa trực giác

Dạng khối bậc 3 --- “phiên bản 3 chiều”.
  • Hình dung: Phần tử 2-Selmer ↔ đường cong phẳng “đôi phủ” (2 tờ). Phần tử 3-Selmer ↔ đường cong phẳng bậc 3 (cubic) trong $\mathbb{P}^2$ --- ta có thể “vẽ” nó! Đường cong cubic phẳng là đối tượng hình học quen thuộc.
  • Từ Selmer đến hình học: Nếu đường cong cubic $f(x,y,z) = 0$ có điểm hữu tỉ, nó đẳng cấu với $E$ (Jacobian) → phần tử Selmer tầm thường. Nếu không có điểm hữu tỉ nhưng có điểm cục bộ ở mọi nơi → phần tử $\mathrm{Sha}[3]$.
  • Đếm cubics: Bhargava biến bài toán “đếm phần tử 3-Selmer” thành “đếm đường cong cubic phẳng có điểm cục bộ ở mọi nơi” --- bài toán có thể tấn công bằng kỹ thuật đếm điểm lưới (hình học số).

Liên hệ với giả thuyết Birch--Dyer

Dạng khối bậc 3 trong BSD.
  • $\mathrm{avg}|\mathrm{Sel}_3| = 4$: Kết hợp $\mathrm{avg}|\mathrm{Sel}_2| = 3$: hạng trung bình $\leq \min(2, 3) - 1$. Tinh chỉnh: $\mathrm{avg\;rank} \leq 7/6 \approx 1.17$.
  • Hỗ trợ Goldfeld: Kết quả trung bình Selmer nhỏ ủng hộ phỏng đoán Goldfeld (50% hạng 0, 50% hạng 1). Nếu nhiều đường cong có hạng $\geq 2$, trung bình Selmer phải lớn hơn --- nhưng thực tế nó nhỏ.
  • Bổ sung cho Bhargava--Skinner--Zhang: Kết hợp $\mathrm{Sel}_2, \mathrm{Sel}_3, \mathrm{Sel}_5$ cho ước lượng tối ưu: ít nhất $66.48\%$ đường cong thỏa BSD.
179 Lý thuyết Iwasawa (Iwasawa theory) Ch.5 8

Định nghĩa

Định nghĩa (Lý thuyết Iwasawa [washington1997]). Lý thuyết Iwasawa (Iwasawa theory) là nhánh lý thuyết số nghiên cứu hành vi tiệm cận của các bất biến số học (nhóm lớp, Selmer, v.v.) khi trường cơ sở “lớn lên” dọc theo tháp $\mathbb{Z}_p$-mở rộng (tower of $\mathbb{Z}_p$-extensions).

Ý tưởng cốt lõi: thay vì nghiên cứu trường số $K$ đơn lẻ, ta xét tháp vô hạn:

\[ K = K_0 \subset K_1 \subset K_2 \subset \cdots \subset K_\infty = \bigcup_n K_n \]
với $\mathrm{Gal}(K_n/K) \cong \mathbb{Z}/p^n\mathbb{Z}$ và $\Gamma = \mathrm{Gal}(K_\infty/K) \cong \mathbb{Z}_p$ (nhóm pro-cyclic $p$-adic).

Kết quả nền tảng của Iwasawa (1959): cho $K_\infty / K$ tháp cyclotomic, gọi $p^{e_n}$ là lũy thừa $p$ chính xác chia số lớp $h_n = h(K_n)$. Khi đó:

\[ e_n = \mu p^n + \lambda n + \nu \quad \text{cho } n \gg 0, \]
với $\mu, \lambda, \nu$ là các bất biến Iwasawa không phụ thuộc $n$.

Ví dụ

Ví dụ (Iwasawa cho $\mathbb{Q}(\zeta_{p^n})$). 1. Tháp cyclotomic trên $\mathbb{Q}$: Lấy $K = \mathbb{Q}$, $p = 3$. Tháp:
\[ \mathbb{Q} \subset \mathbb{Q}(\zeta_9)^+ \subset \mathbb{Q}(\zeta_{27})^+ \subset \mathbb{Q}(\zeta_{81})^+ \subset \cdots \]
(phần thực của trường cyclotomic). Tại mỗi tầng, ta tính số lớp $h_n^{(3)}$ (phần $3$-primary).

Phỏng đoán Greenberg: cho tháp cyclotomic trên trường Abel hoàn toàn thực, $\mu = \lambda = 0$ --- tức phần $p$-primary của nhóm lớp ổn định (không tăng).

2. Đường cong elliptic: Lấy $E: y^2 = x^3 - x$ (conductor 32), $p = 5$. Xét nhóm Selmer $\mathrm{Sel}_{5^\infty}(E / \mathbb{Q}(\zeta_{5^n})^+)$ khi $n$ tăng. Lý thuyết Iwasawa mô tả “giới hạn” $\varprojlim \mathrm{Sel}_{5^\infty}(E / K_n)$ như module trên đại số Iwasawa $\Lambda$.

3. So sánh cổ điển vs hiện đại:

Cổ điển (nhóm lớp) Hiện đại (EC)
Module $\varprojlim \mathrm{Cl}(K_n)[p^\infty]$ $\varprojlim \mathrm{Sel}_{p^\infty}(E/K_n)$
Bất biến $\lambda$ Tốc độ tăng nhóm lớp Tốc độ tăng Selmer
Liên hệ với $L$ Hàm $L$ $p$-adic (Kubota--Leopoldt) Hàm $L_p(E, s)$ (Mazur--SD)

Ý nghĩa trực giác

Iwasawa --- “nhìn toàn cục qua kính lúp $p$-adic”.
  • Hình dung: Thay vì “chụp ảnh” nhóm lớp (hay Selmer) tại một trường cố định, Iwasawa “quay phim” khi trường lớn dần. Bộ phim $p$-adic này tiết lộ “xu hướng” mà ảnh đơn lẻ không thấy được.
  • Analogy giải tích: Hàm $f(x)$ khó hiểu tại một điểm. Nhưng chuỗi Taylor $\sum a_n x^n$ nắm bắt hành vi “toàn bộ” lân cận 0. Iwasawa theory làm tương tự: module Iwasawa “nắm bắt” hành vi nhóm lớp/Selmer trên toàn bộ tháp, không chỉ một tầng.
  • Tại sao hữu dụng: Đối tượng “ở mỗi tầng” (nhóm lớp $\mathrm{Cl}(K_n)$, Selmer $\mathrm{Sel}(E/K_n)$) rất phức tạp và khó tính. Nhưng “giới hạn” (module Iwasawa $X$) lại có cấu trúc đại số tốt: nó là module hữu hạn sinh trên $\Lambda$ --- vành Abel, Noetherian.

Liên hệ với giả thuyết Birch--Dyer

Lý thuyết Iwasawa trong BSD.
  • Phỏng đoán chính Iwasawa (IMC): Phỏng đoán rằng hai đối tượng Iwasawa --- “phía đại số” (module Selmer) và “phía giải tích” (hàm $L$ $p$-adic) --- bằng nhau (cùng chuỗi đặc trưng). Đây là “phiên bản Iwasawa” của BSD.
  • IMC $\Rightarrow$ BSD (phần $p$): Nếu IMC đúng tại $p$, thì: $L(E,1) \neq 0 \Rightarrow \mathrm{Sel}_{p^\infty}$ hữu hạn (BSD cho hạng 0, phần $p$). Kato chứng minh “một nửa” IMC; Skinner--Urban chứng minh “nửa còn lại”.
  • BSD mạnh phần $p$: Kết hợp Kato + Skinner--Urban: IMC đầy đủ cho $E/\mathbb{Q}$ (dưới giả thiết kỹ thuật). Suy ra công thức BSD mạnh cho $p$-part: $\mathrm{ord}_p(L^*(E,1)/\Omega_E \mathrm{Reg}_E) = \mathrm{ord}_p(|\mathrm{Sha}| \cdot \prod c_p / |E(\mathbb{Q})_{\mathrm{tors}}|^2)$.
180 Đại số Iwasawa (Iwasawa algebra $\Lambda = \mathbb{Z}_p[[\Gamma]]$) Ch.6 8

Định nghĩa

Định nghĩa (Đại số Iwasawa [washington1997]). Cho $\Gamma = \mathrm{Gal}(K_\infty/K) \cong \mathbb{Z}_p$ nhóm Galois của $\mathbb{Z}_p$-mở rộng, với sinh topo $\gamma$. Đại số Iwasawa (Iwasawa algebra) là vành nhóm hoàn chỉnh $p$-adic:
\[ \Lambda = \mathbb{Z}_p[[\Gamma]] = \varprojlim_{n} \mathbb{Z}_p[\Gamma/\Gamma^{p^n}]. \]

Đồng cấu Weierstrass: Đặt $T = \gamma - 1$. Khi đó:

\[ \Lambda \cong \mathbb{Z}_p[[T]] = \left\{ \sum_{n=0}^{\infty} a_n T^n : a_n \in \mathbb{Z}_p \right\} \]
vành chuỗi lũy thừa hình thức trên $\mathbb{Z}_p$. Đây là vành cục bộ, Noetherian, miền UFD.

Mỗi module hữu hạn sinh trên $\Lambda$ có “pseudo-isomorphism” (đồng cấu với hạt nhân và đối hạt nhân hữu hạn) tới dạng chuẩn:

\[ \Lambda^r \oplus \bigoplus_{i=1}^{s} \Lambda/(p^{m_i}) \oplus \bigoplus_{j=1}^{t} \Lambda/(f_j(T)^{n_j}) \]
với $f_j$ đa thức phân biệt bất khả quy (“distinguished polynomial”). Chuỗi đặc trưng:
\[ \mathrm{char}_\Lambda(M) = \left( p^{\sum m_i} \cdot \prod_j f_j(T)^{n_j} \right) \subset \Lambda. \]

Ví dụ

Ví dụ (Đại số Iwasawa và module). 1. Cấu trúc đại số: $\Lambda = \mathbb{Z}_p[[T]]$ giống vành đa thức hình thức. Các ideal nguyên tố:
\[ (0) \subset (p), (f(T)) \subset (p, T) = \mathfrak{m} \quad \text{(ideal cực đại duy nhất)}. \]
Module xoắn trên $\Lambda$ (tức $M$ sao cho mỗi phần tử bị triệt tiêu bởi phần tử khác 0 của $\Lambda$) có chuỗi đặc trưng --- tương tự “đa thức đặc trưng” cho toán tử tuyến tính.

2. Module Iwasawa cổ điển: Gọi $X = \varprojlim \mathrm{Cl}(K_n)[p^\infty]$ (giới hạn nghịch nhóm lớp $p$-primary). $X$ là module hữu hạn sinh xoắn trên $\Lambda$. Bất biến Iwasawa:

  • $\mu = \sum m_i$ (bất biến $\mu$, Ferrero--Washington: $\mu = 0$ cho tháp cyclotomic trên $\mathbb{Q}$),
  • $\lambda = \sum \deg(f_j) \cdot n_j$ (bất biến $\lambda$),
  • Chuỗi đặc trưng $\mathrm{char}_\Lambda(X)$ nắm bắt toàn bộ “dáng điệu tiệm cận”.

3. Cho đường cong elliptic: $X_E = \varprojlim \mathrm{Sel}_{p^\infty}(E/K_n)^\vee$ (đối ngẫu Pontryagin của giới hạn thuận Selmer). Phỏng đoán: $X_E$ là module xoắn. Chuỗi đặc trưng $\mathrm{char}_\Lambda(X_E)$ là “phía đại số” của IMC.

Ý nghĩa trực giác

Đại số Iwasawa --- “vành chuỗi lũy thừa số học”.
  • Hình dung: $\mathbb{Z}_p[[T]]$ giống “đa thức với hệ số $p$-adic”. Module trên $\Lambda$ giống “không gian véctơ” nhưng trên “chuỗi lũy thừa $p$-adic”. Chuỗi đặc trưng giống “đa thức đặc trưng” --- nắm bắt “kích thước” và “dáng điệu” của module.
  • Analogy: Trong đại số tuyến tính, ma trận $A$ trên $\mathbb{C}$ có đa thức đặc trưng $\det(TI - A)$, nắm bắt trị riêng. Module trên $\Lambda$ có chuỗi đặc trưng, nắm bắt “trị riêng $p$-adic” --- tức zero của hàm $L$ $p$-adic!
  • Tại sao $T = \gamma - 1$: Khi “chuyên biệt hóa” $T = \zeta - 1$ (với $\zeta$ căn bậc $p^n$ đơn vị), ta “nhìn” module ở tầng $n$. Chuỗi lũy thừa “nội suy” hành vi ở mọi tầng --- giống hàm giải tích nội suy giá trị rời rạc.

Liên hệ với giả thuyết Birch--Dyer

Đại số Iwasawa trong BSD.
  • IMC = đẳng thức chuỗi đặc trưng: Phỏng đoán chính Iwasawa phát biểu:
    \[ \mathrm{char}_\Lambda(X_E) = (L_p(E, T)) \quad \text{trong } \Lambda, \]
    tức chuỗi đặc trưng “phía đại số” (module Selmer) bằng “phía giải tích” (hàm $L$ $p$-adic). Kato chứng minh $(L_p) \subset \mathrm{char}_\Lambda(X_E)$; Skinner--Urban chứng minh phần ngược.
  • “Chuyên biệt hóa” $\Rightarrow$ BSD: Đặt $T = 0$ (tức $\gamma = 1$, tầng đáy), IMC suy ra:
    \[ |\mathrm{Sel}_{p^\infty}(E/\mathbb{Q})| \cdot (\text{Tamagawa}) = |L_p(E, 0)| \cdot (\text{chu kỳ}), \]
    chính là BSD mạnh phần $p$ cho hạng 0!
  • Module structure: Hạng của $X_E$ trên $\Lambda$ bằng 0 khi và chỉ khi $E(\mathbb{Q})$ hữu hạn (hạng 0). Bất biến $\lambda$ đo “tốc độ tăng” hạng dọc tháp. Đây là cách Iwasawa “nhìn thấy” hạng Mordell--Weil qua “thấu kính $p$-adic”.
181 $\mathbb{Z}_p$-mở rộng cyclotomic (Cyclotomic $\mathbb{Z}_p$-extension) Ch.6 7

Định nghĩa

Định nghĩa ($\mathbb{Z}_p$-mở rộng cyclotomic [washington1997]). Cho $K$ là trường số và $p$ số nguyên tố. $\mathbb{Z}_p$-mở rộng cyclotomicCyclotomic $\mathbb{Z}_p$-extension $K_\infty^{\mathrm{cyc}} / K$ là mở rộng Galois duy nhất được xây từ các căn bậc $p^n$ đơn vị:
\[ K_n = K(\zeta_{p^{n+1}})^+ \quad (\text{phần thực, hoặc trường con thích hợp}), \]
sao cho $\mathrm{Gal}(K_\infty^{\mathrm{cyc}} / K) \cong \mathbb{Z}_p$.

Cụ thể hơn, xét ký tự cyclotomic:

\[ \chi_{\mathrm{cyc}}: G_\mathbb{Q} \to \mathbb{Z}_p^\times, \quad \sigma(\zeta_{p^n}) = \zeta_{p^n}^{\chi_{\mathrm{cyc}}(\sigma)}. \]
Hợp thành $G_\mathbb{Q} \xrightarrow{\chi_{\mathrm{cyc}}} \mathbb{Z}_p^\times \twoheadrightarrow \mathbb{Z}_p^\times / \mu_{p-1} \cong 1 + p\mathbb{Z}_p \cong \mathbb{Z}_p$ cho “phần tự do” $\Gamma \cong \mathbb{Z}_p$, và $K_\infty^{\mathrm{cyc}} = \overline{\mathbb{Q}}^{\ker}$.

Tính chất:

  1. $K_\infty^{\mathrm{cyc}} / K$ không phân nhánh ngoại trừ tại các vị trí trên $p$.
  2. Mỗi trường số $K$ có duy nhất một $\mathbb{Z}_p$-mở rộng cyclotomic.
  3. Phỏng đoán Leopoldt (đã chứng minh cho trường Abel): $K$ có đúng $r_2 + 1$ mở rộng $\mathbb{Z}_p$ độc lập ($r_2$ = số nhúng phức), và cyclotomic là một trong số đó.

Ví dụ

Ví dụ ($\mathbb{Z}_p$-mở rộng cho $\mathbb{Q}$ và trường số). 1. $K = \mathbb{Q}$, $p = 5$: Trường cyclotomic $\mathbb{Q}(\zeta_{5^n})$ có nhóm Galois $(\mathbb{Z}/5^n\mathbb{Z})^\times \cong \mathbb{Z}/4\mathbb{Z} \times \mathbb{Z}/5^{n-1}\mathbb{Z}$. Phần $\mathbb{Z}_5$: trường con $\mathbb{Q}_n \subset \mathbb{Q}(\zeta_{5^{n+1}})$ với $\mathrm{Gal}(\mathbb{Q}_n/\mathbb{Q}) \cong \mathbb{Z}/5^n\mathbb{Z}$. Tháp:
\[ \mathbb{Q} = \mathbb{Q}_0 \subset \mathbb{Q}_1 \subset \mathbb{Q}_2 \subset \cdots, \quad [\mathbb{Q}_n : \mathbb{Q}_{n-1}] = 5. \]
$\mathbb{Q}_1$ là trường con bậc 5 duy nhất của $\mathbb{Q}(\zeta_{25})$ --- tức $\mathbb{Q}(\cos(2\pi/25))$ (trường thực bậc 5).

2. Phân nhánh: $\mathbb{Q}_\infty^{\mathrm{cyc}}$ chỉ phân nhánh tại 5. Tại $\ell \neq 5$: $\ell$ không phân nhánh (có thể tách hoặc trơ). Tại $\ell = 5$: phân nhánh hoàn toàn.

3. Nhóm lớp: Ferrero--Washington (1979): cho tháp cyclotomic trên $\mathbb{Q}$, bất biến $\mu = 0$ (phần $p$-primary nhóm lớp không tăng “quá nhanh”). Bất biến $\lambda$: Vandiver's conjecture nói $\lambda = 0$ cho $p$ chính quy (regular prime) --- đã kiểm nghiệm đến $p < 163 \times 10^6$.

Ý nghĩa trực giác

$\mathbb{Z}_p$-mở rộng cyclotomic --- “đường thẳng $p$-adic trong không gian trường”.
  • Hình dung: “Không gian” các mở rộng Galois rất lớn. $\mathbb{Z}_p$-mở rộng cyclotomic là “đường thẳng” ưu tiên nhất: nó đến từ căn đơn vị, tự nhiên nhất, và “mang nhiều thông tin số học nhất” (theo kinh nghiệm).
  • Tại sao cyclotomic?: Trong số tất cả $\mathbb{Z}_p$-mở rộng, cyclotomic có lợi thế: liên hệ trực tiếp với ký tự cyclotomic $\chi_{\mathrm{cyc}}$ --- thứ điều khiển hành động Galois trên $\mu_{p^\infty}$. Hàm $L$ $p$-adic “sống” tự nhiên trên $\Gamma = \mathbb{Z}_p$ cyclotomic.
  • Analogy: Giống hàm $e^{it}$ trên $\mathbb{R}$ --- “đường tròn tự nhiên nhất” trong $\mathbb{C}^\times$. $\mathbb{Z}_p$-mở rộng cyclotomic là “đường thẳng tự nhiên nhất” trong “không gian mở rộng Galois $p$-adic”.

Liên hệ với giả thuyết Birch--Dyer

$\mathbb{Z}_p$-mở rộng cyclotomic trong BSD.
  • Nền tảng cho IMC: Phỏng đoán chính Iwasawa cho đường cong elliptic phát biểu trên $\mathbb{Q}_\infty^{\mathrm{cyc}} / \mathbb{Q}$. Module Selmer $X_E = \varprojlim \mathrm{Sel}_{p^\infty}(E / \mathbb{Q}_n)^\vee$ là module trên $\Lambda = \mathbb{Z}_p[[\mathrm{Gal}(\mathbb{Q}_\infty^{\mathrm{cyc}}/\mathbb{Q})]]$.
  • Hàm $L$ $p$-adic: $L_p(E, s)$ được xây dựng như phần tử trong $\Lambda$ (hoặc phân thức trường): nó “sống” trên nhóm $\Gamma$ cyclotomic, và “chuyên biệt hóa” $s = k$ cho giá trị $L(E, \chi^k)$ (twist bởi lũy thừa ký tự cyclotomic).
  • Hàm $L$ antianalytic: Trong BSD $p$-adic, ta xét “hàm $L$ $p$-adic antianalytic” trên $\Gamma$ --- tích phân trên nhóm $\mathbb{Z}_p$-mở rộng. Đây là cầu nối Iwasawa--BSD.
182 Module Iwasawa (Iwasawa module) Ch.6 8

Định nghĩa

Định nghĩa (Module Iwasawa [washington1997]). Module Iwasawa (Iwasawa module) là module hữu hạn sinh trên đại số Iwasawa $\Lambda = \mathbb{Z}_p[[\Gamma]] \cong \mathbb{Z}_p[[T]]$, xuất hiện tự nhiên như “giới hạn” của bất biến số học dọc theo $\mathbb{Z}_p$-tháp.

Hai module Iwasawa chính:

1. Module nhóm lớp (cổ điển):

\[ X^{\mathrm{cl}} = \varprojlim_n \mathrm{Cl}(K_n)[p^\infty] \]
giới hạn nghịch (qua ánh xạ norm) của phần $p$-primary nhóm lớp tại mỗi tầng.

2. Module Selmer (cho EC):

\[ X_E = \left( \varinjlim_n \mathrm{Sel}_{p^\infty}(E / K_n) \right)^\vee \]
đối ngẫu Pontryagin của giới hạn thuận nhóm Selmer $p^\infty$-phần.

Định lý cấu trúc (pseudo-isomorphism): Mọi module xoắn hữu hạn sinh $M$ trên $\Lambda$ có:

\[ M \sim \bigoplus_{i=1}^{s} \Lambda/(p^{m_i}) \oplus \bigoplus_{j=1}^{t} \Lambda/(f_j(T)^{n_j}) \]
(ký hiệu $\sim$ = pseudo-isomorphism). Từ đó: $\mu(M) = \sum m_i$, $\lambda(M) = \sum n_j \deg f_j$.

Ví dụ

Ví dụ (Module Iwasawa cụ thể). 1. $X^{\mathrm{cl}}$ cho $K = \mathbb{Q}(\sqrt{-1})$, $p = 3$: Tháp $K_n = K(\zeta_{3^{n+1}})^+$. Vì $K$ có số lớp 1, và $p = 3$ không phân nhánh đặc biệt: $X^{\mathrm{cl}} = 0$ (module tầm thường). Bất biến: $\mu = \lambda = 0$.

2. $X_E$ cho $E: y^2 = x^3 - x$, $p = 5$: $E$ có CM bởi $\mathbb{Z}[i]$. Module Selmer $X_E$ trên $\Lambda$ có:

  • $X_E$ là module xoắn (phỏng đoán, đã chứng minh khi $L(E,1) \neq 0$),
  • $\mathrm{char}_\Lambda(X_E) = (g(T))$ với $g(T)$ đa thức liên quan đến $L_5(E, T)$,
  • $\mu = 0$ (theo Kato cho hầu hết $p$).

3. Khi module không xoắn: Nếu $\mathrm{rk}(E(\mathbb{Q})) > 0$, thì $X_E$ có thể có “$\Lambda$-rank” $> 0$ (tức có thành phần tự do $\Lambda^r$). Phỏng đoán Mazur: $X_E$ xoắn khi $E$ có rút gọn tốt tại $p$. Greenberg mở rộng: $X_E$ xoắn khi $a_p \not\equiv 1 \pmod{p}$ (“ordinary” tốt).

Ý nghĩa trực giác

Module Iwasawa --- “bản đồ nhiệt cho số học $p$-adic”.
  • Hình dung: Tại mỗi tầng $n$ của tháp, ta có “bức ảnh” (nhóm lớp hoặc Selmer tại $K_n$). Module Iwasawa “ghép” tất cả bức ảnh thành “bộ phim” --- một đối tượng đại số duy nhất mã hóa toàn bộ dãy.
  • $\mu$ và $\lambda$: $\mu$ đo “thành phần $p$-lũy thừa” (có bao nhiêu “$p$” trong chuỗi đặc trưng). $\lambda$ đo “thành phần đa thức” (bậc của phần đa thức). Hình dung: $p^{e_n} = $ kích thước phần $p$-primary, thì $e_n \approx \mu p^n + \lambda n$.
  • Tại sao pseudo-isomorphism?: Module Iwasawa chứa “lỗi hữu hạn” (hạt nhân/đối hạt nhân hữu hạn của pseudo-isomorphism). Chúng không ảnh hưởng hành vi tiệm cận --- giống “hằng số” trong $O$-notation. Chỉ chuỗi đặc trưng (“leading term”) quan trọng.

Liên hệ với giả thuyết Birch--Dyer

Module Iwasawa trong BSD.
  • $X_E$ = “phía đại số” IMC: Module Selmer Iwasawa $X_E$ chứa mọi thông tin về Selmer, Sha, và hạng dọc tháp. Chuỗi đặc trưng $\mathrm{char}_\Lambda(X_E)$ là đối tượng “đại số” trong IMC.
  • Xoắn ↔ hạng 0: $X_E$ xoắn (tức $\Lambda$-rank $= 0$) tương đương: $E(K_n)$ có hạng bị chặn cho mọi $n$. Đây là “phiên bản Iwasawa” của “hạng hữu hạn”.
  • Chuyên biệt hóa: “Đặt $T = 0$” trong $\mathrm{char}_\Lambda(X_E)$ cho thông tin về $\mathrm{Sel}_{p^\infty}(E/\mathbb{Q})$ --- tức BSD cho trường cơ sở $\mathbb{Q}$. IMC “nâng” BSD lên toàn bộ tháp.
183 Chuỗi đặc trưng (Characteristic ideal $\mathrm{char}_\Lambda(X)$) Ch.6 9

Định nghĩa

Định nghĩa (Chuỗi đặc trưng [washington1997]). Cho $M$ là module hữu hạn sinh xoắn trên $\Lambda = \mathbb{Z}_p[[T]]$. Chuỗi đặc trưng (Characteristic ideal) $\mathrm{char}_\Lambda(M)$ là ideal chính trong $\Lambda$ được định nghĩa từ dạng chuẩn:
\[ M \sim \bigoplus_{i} \Lambda/(p^{m_i}) \oplus \bigoplus_{j} \Lambda/(f_j(T)^{n_j}) \quad \Longrightarrow \quad \mathrm{char}_\Lambda(M) = \left( p^{\sum m_i} \cdot \prod_j f_j(T)^{n_j} \right). \]

Phần tử sinh $f_M(T) = p^{\mu} \cdot \prod f_j(T)^{n_j}$ gọi là đa thức đặc trưng (characteristic power series). Tính chất:

  1. Nếu $M$ hữu hạn, thì $\mathrm{char}_\Lambda(M) = (p^a)$ cho $a$ nào đó (“chỉ có phần $p$-lũy thừa”).
  2. Zero của $f_M(T)$ (trong $\overline{\mathbb{Q}}_p$) mã hóa “trị riêng” quan trọng.
  3. $\mathrm{char}_\Lambda(M_1 \oplus M_2) = \mathrm{char}_\Lambda(M_1) \cdot \mathrm{char}_\Lambda(M_2)$ (nhân tính).

Ví dụ

Ví dụ (Chuỗi đặc trưng cụ thể). 1. Module đơn giản: $M = \Lambda/(T^2 + pT + 1)$. Đây là module xoắn, $\lambda = 2$, $\mu = 0$. Chuỗi đặc trưng:
\[ \mathrm{char}_\Lambda(M) = (T^2 + pT + 1). \]
Tại tầng $n$: “chuyên biệt hóa” $T = \zeta_{p^n} - 1$ cho kích thước nhóm hữu hạn.

2. Module nhóm lớp Iwasawa: Cho $K = \mathbb{Q}(\sqrt{-23})$, $p = 3$. Module $X^{\mathrm{cl}}$ có $\mu = 0$, $\lambda = 1$:

\[ \mathrm{char}_\Lambda(X^{\mathrm{cl}}) = (T + c) \quad \text{cho } c \in \mathbb{Z}_3 \text{ tường minh}. \]
Suy ra: $e_n = n + \nu$ cho $n \gg 0$ --- phần $3$-primary nhóm lớp tăng tuyến tính.

3. Cho đường cong elliptic: $E: y^2 + y = x^3 - x$ (conductor 37), $p = 5$. Module $X_E$ có $\mu = 0$. Chuỗi đặc trưng $\mathrm{char}_\Lambda(X_E) = (g_E(T))$ với $g_E(T)$ liên quan trực tiếp đến hàm $L$ $5$-adic $L_5(E, T)$.

Ý nghĩa trực giác

Chuỗi đặc trưng --- “DNA số học”.
  • Hình dung: Giống đa thức đặc trưng $\det(TI - A)$ nắm bắt “bản chất” của ma trận $A$ (trị riêng, Jordan form), chuỗi đặc trưng $f_M(T)$ nắm bắt “bản chất” của module Iwasawa.
  • Zero = thông tin số học: Zero $\alpha$ của $f_M(T)$ ứng với “ký tự Galois $\chi$” (qua $\chi(\gamma) = 1 + \alpha$) mà tại đó “có hiện tượng số học bất thường” (nhóm lớp phi tầm thường, Selmer phi tầm thường).
  • Nhân tính: $\mathrm{char}(M_1 \oplus M_2) = \mathrm{char}(M_1) \cdot \mathrm{char}(M_2)$ giống “đa thức đặc trưng của tổng trực tiếp = tích đa thức đặc trưng”. Điều này cho phép “phân tích” module phức tạp thành các thành phần đơn giản.

Liên hệ với giả thuyết Birch--Dyer

Chuỗi đặc trưng trong BSD.
  • IMC = đẳng thức hai chuỗi đặc trưng: Phỏng đoán chính Iwasawa:
    \[ \mathrm{char}_\Lambda(X_E) = (L_p(E, T)) \]
    (chuỗi đặc trưng module Selmer = hàm $L$ $p$-adic). Đây là phát biểu chính xác nhất của “đại số = giải tích” trong lý thuyết Iwasawa.
  • Kato (một nửa): Kato chứng minh $(L_p(E, T)) \subset \mathrm{char}_\Lambda(X_E)$ --- hàm $L$ “chia” chuỗi đặc trưng. Tức “phía giải tích chặn phía đại số”.
  • Skinner--Urban (nửa còn lại): Chứng minh $\mathrm{char}_\Lambda(X_E) \subset (L_p(E, T))$ (dưới giả thiết). Kết hợp: $\mathrm{char}_\Lambda(X_E) = (L_p)$ --- IMC đầy đủ → BSD mạnh phần $p$.
184 Phỏng đoán chính Iwasawa (Iwasawa Main Conjecture) Ch.6 9

Định nghĩa

Định nghĩa (Phỏng đoán chính Iwasawa [skinner-urban2014]). Phỏng đoán chính Iwasawa (Iwasawa Main Conjecture) (IMC) cho đường cong elliptic $E/\mathbb{Q}$ tại số nguyên tố $p$ phát biểu đẳng thức giữa hai ideal trong đại số Iwasawa:

Phía đại số: Module Selmer Iwasawa $X_E = (\varinjlim_n \mathrm{Sel}_{p^\infty}(E/\mathbb{Q}_n))^\vee$ có chuỗi đặc trưng $\mathrm{char}_\Lambda(X_E)$.

Phía giải tích: Hàm $L$ $p$-adic $L_p(E, T) \in \Lambda \otimes \mathbb{Q}_p$ (Mazur--Swinnerton-Dyer, Amice--Vélu, Višik).

IMC: $\mathrm{char}_\Lambda(X_E) = (L_p(E, T))$ trong $\Lambda \otimes \mathbb{Q}_p$.

Lịch sử chứng minh:

  • Mazur--Wiles (1984): IMC cổ điển cho trường cyclotomic (nhóm lớp, không EC).
  • Rubin (1991): IMC cho EC có CM, sử dụng đơn vị elliptic.
  • Kato (2004): Một nửa --- $(L_p) \subset \mathrm{char}_\Lambda(X_E)$ --- cho mọi EC$/\mathbb{Q}$, $p$ tốt.
  • Skinner--Urban (2014): Nửa còn lại --- $\mathrm{char}_\Lambda(X_E) \subset (L_p)$ --- cho $p$ lẻ, $E$ ordinary tại $p$, $\bar{\rho}_{E,p}$ bất khả quy.

Ví dụ

Ví dụ (IMC cho đường cong cụ thể). 1. $E: y^2 + y = x^3 - x$ (conductor 37), $p = 5$: $E$ ordinary tại 5 (vì $a_5 = -2 \not\equiv 0 \pmod{5}$), $\bar{\rho}_{E,5}$ bất khả quy. Kato + Skinner--Urban $\Rightarrow$ IMC đầy đủ:
\[ \mathrm{char}_\Lambda(X_E) = (L_5(E, T)). \]
Chuyên biệt hóa $T = 0$: $L(E,1) = 0$ (vì $\mathrm{rk}(E(\mathbb{Q})) = 1$). Suy ra: $\mathrm{char}_\Lambda(X_E)(0) = 0$, tức $T | f_{X_E}(T)$, tức $X_E$ “lớn” --- phản ánh hạng dương.

2. $E: y^2 = x^3 - x$ (conductor 32), $p = 3$: $E$ có CM, $a_3 = 0$ (supersingular tại 3). Rubin (1991) chứng minh IMC bằng phương pháp đơn vị elliptic (không cần Skinner--Urban).

3. So sánh IMC cổ điển và EC:

Cổ điển EC
Module $X^{\mathrm{cl}}$ (nhóm lớp) $X_E$ (Selmer)
Hàm $L$ $L_p(\chi, s)$ (Kubota--Leopoldt) $L_p(E, s)$ (Mazur--SD)
Chứng minh Mazur--Wiles (1984) Kato + Skinner--Urban

Ý nghĩa trực giác

IMC --- “công thức số lớp Iwasawa”.
  • Hình dung: Công thức số lớp Dirichlet nói $h_K \cdot R_K = $ giá trị hàm $L$ (nhân hằng số). IMC nói cùng điều nhưng “ở mọi tầng cùng lúc”: chuỗi đặc trưng (chứa tất cả $h_n, R_n$) = hàm $L$ $p$-adic (chứa tất cả giá trị $L$).
  • Tại sao “Main”: IMC là kết quả mạnh nhất trong lý thuyết Iwasawa --- từ nó suy ra hầu hết kết quả khác (BSD phần $p$, Sha hữu hạn, công thức Tamagawa $p$-adic).
  • Hai hướng: “$(L_p) \subset \mathrm{char}(X)$” (Kato) = “giải tích chặn đại số” --- Euler system bên. “$\mathrm{char}(X) \subset (L_p)$” (Skinner--Urban) = “đại số chặn giải tích” --- dạng tự đẳng cấu bên. Hai hướng dùng kỹ thuật hoàn toàn khác nhau.

Liên hệ với giả thuyết Birch--Dyer

IMC trong BSD.
  • IMC $\Rightarrow$ BSD (phần $p$, hạng 0): Nếu $L(E,1) \neq 0$, thì $L_p(E, 0) \neq 0$ (ngoại trừ exceptional zero). IMC suy ra $X_E$ hữu hạn $\Rightarrow$ $\mathrm{Sel}_{p^\infty}(E/\mathbb{Q})$ hữu hạn $\Rightarrow$ $\mathrm{rk} = 0$ và $\mathrm{Sha}[p^\infty]$ hữu hạn. Hơn nữa, $\mathrm{ord}_p(|\mathrm{Sha}[p^\infty]|) = $ giá trị tường minh từ $L_p$.
  • IMC $\Rightarrow$ BSD (phần $p$, hạng 1): Kết hợp IMC với công thức Gross--Zagier và Kolyvagin: nếu $\mathrm{ord}_{s=1} L(E,s) = 1$, thì $\mathrm{rk} = 1$ và BSD mạnh phần $p$ đúng.
  • Giới hạn hiện tại: IMC chưa nói gì về hạng $\geq 2$ (vì $L_p$ triệt tiêu bậc $\geq 2$ rất khó phân tích). Đây là rào cản lớn nhất cho BSD trong trường hợp hạng cao.
185 Hàm L $p$-adic Mazur–Swinnerton-Dyer (Mazur–SD $p$-adic L-function) Ch.6 9

Định nghĩa

Định nghĩa (Hàm $L$ $p$-adic [mazur-tate-teitelbaum1986]). Cho $E/\mathbb{Q}$ đường cong elliptic và $p$ số nguyên tố sao cho $E$ có rút gọn tốt ordinary tại $p$ (tức $a_p \not\equiv 0 \pmod{p}$). Hàm $L$ $p$-adic Mazur--Swinnerton-Dyer (Mazur--Swinnerton-Dyer $p$-adic $L$-function) là phần tử:
\[ L_p(E, s) \in \Lambda \otimes_{\mathbb{Z}_p} \mathbb{Q}_p \]
(hoặc tương đương, phép đo $p$-adic $\mu_E$ trên $\mathbb{Z}_p^\times$), được xác định bởi tính chất nội suy:

Cho mọi ký tự Dirichlet $\chi$ bậc $p^n$ (tức $\chi: (\mathbb{Z}/p^n\mathbb{Z})^\times \to \mathbb{C}_p^\times$):

\[ L_p(E, \chi) = \frac{1}{\alpha^n} \cdot \frac{\tau(\bar{\chi})}{(-\Omega_E^{\pm})} \cdot L(E, \chi, 1), \]
trong đó:
  • $\alpha$ là nghiệm đơn vị $p$-adic của $T^2 - a_p T + p = 0$ (Frobenius “tốt”),
  • $\tau(\bar{\chi})$ là tổng Gauss,
  • $\Omega_E^\pm$ là chu kỳ thực/ảo.

Phần tử “$s = 0$” (trivial character $\chi = 1$):

\[ L_p(E, 0) = \left(1 - \frac{1}{\alpha}\right)^2 \cdot \frac{L(E, 1)}{\Omega_E^+}. \]

Ví dụ

Ví dụ (Hàm $L$ $p$-adic cụ thể). 1. $E: y^2 + y = x^3 - x$ (conductor 37), $p = 5$: $a_5 = -2$. Nghiệm $\alpha$ của $T^2 + 2T + 5 = 0$: $\alpha = -1 + 2i$, $|\alpha|_5 = 1$ (đơn vị 5-adic). Vì $L(E, 1) = 0$ (hạng 1), ta có $L_5(E, 0) = 0$.

Đạo hàm: $L_5'(E, 0) \neq 0$ --- tương tự $L'(E, 1) \neq 0$ (Gross--Zagier). Giá trị $L_5'(E, 0)$ liên hệ với logarit $p$-adic của điểm Heegner.

2. $E: y^2 = x^3 + 1$ (conductor 36), $p = 7$: $a_7 = -4$, $L(E,1) = \Omega_E / 3 \neq 0$. Nghiệm $\alpha$: $T^2 + 4T + 7 = 0$, $\alpha \approx -2 + \sqrt{-3}$. Tính:

\[ L_7(E, 0) = \left(1 - \frac{1}{\alpha}\right)^2 \cdot \frac{1}{3} \neq 0. \]
IMC suy ra: $\mathrm{Sel}_{7^\infty}(E/\mathbb{Q})$ hữu hạn → hạng 0 (đúng: $E(\mathbb{Q}) = \{O, (0, \pm 1), (-1, 0)\}$, xoắn thuần túy).

3. Exceptional zero: $E: y^2 + y = x^3 + x^2$ (conductor 11), $p = 11$. Rút gọn nhân tách tại 11: $a_{11} = 1$, $\alpha = 1$. Khi đó $(1 - 1/\alpha) = 0$, nên $L_{11}(E, 0) = 0$ bất kể $L(E,1) \neq 0$! Đây là “exceptional zero” --- cần công thức Mazur--Tate--Teitelbaum bổ sung.

Ý nghĩa trực giác

Hàm $L$ $p$-adic --- “bản sao $p$-adic của $L(E,s)$”.
  • Hình dung: Hàm $L$ phức $L(E,s)$ sống trên $\mathbb{C}$ (biến $s$ phức). Hàm $L$ $p$-adic $L_p(E, s)$ sống trên $\mathbb{Z}_p$ (biến $s$ $p$-adic). Hai hàm “cùng gốc” --- chúng nội suy cùng giá trị đặc biệt $L(E, \chi, 1)$, nhưng “nhìn” bằng “kính” khác nhau.
  • Tại sao cần bản $p$-adic: Hàm $L$ phức rất khó “nhìn” bằng đại số (nó siêu việt, không đa thức). Hàm $L$ $p$-adic sống trong $\Lambda$ --- vành đa thức hình thức --- nên có thể “so sánh đại số” với module Selmer. Đây là lý do IMC phát biểu được.
  • “Nội suy” là gì?: Có vô hạn giá trị $L(E, \chi, 1)$ (một cho mỗi ký tự $\chi$). $L_p(E, s)$ là hàm duy nhất trên $\mathbb{Z}_p$ “đi qua” tất cả giá trị này (sau chuẩn hóa). Giống “đa thức nội suy qua vô hạn điểm” = “chuỗi lũy thừa hội tụ”.

Liên hệ với giả thuyết Birch--Dyer

Hàm $L$ $p$-adic trong BSD.
  • “Phía giải tích” của IMC: $L_p(E, T)$ là đối tượng “giải tích” (dù sống trong đại số Iwasawa). IMC nói nó bằng chuỗi đặc trưng “đại số” $\mathrm{char}(X_E)$.
  • BSD $p$-adic: Phỏng đoán Mazur--Tate--Teitelbaum (1986): $\mathrm{ord}_{s=0} L_p(E, s) = \mathrm{rk}(E(\mathbb{Q}))$ (ngoại trừ exceptional zero, khi cộng thêm 1). Đây là “bản $p$-adic” của BSD yếu.
  • BSD mạnh $p$-adic: Leading coefficient:
    \[ \frac{L_p^{(r)}(E, 0)}{r!} = \frac{|\mathrm{Sha}| \cdot \mathrm{Reg}_p \cdot \prod c_p}{|E(\mathbb{Q})_{\mathrm{tors}}|^2} \cdot (\text{Euler factor tại } p), \]
    với $\mathrm{Reg}_p$ = regulator $p$-adic (thay regulator thực).
186 Selmer $p$-adic ($p$-adic Selmer group) Ch.7 8

Định nghĩa

Định nghĩa (Nhóm Selmer $p$-adic [greenberg1999]). Cho $E/\mathbb{Q}$ đường cong elliptic và $p$ số nguyên tố. Nhóm Selmer $p$-adic ($p$-adic Selmer group) $\mathrm{Sel}_{p^\infty}(E/K)$ là giới hạn thuận:
\[ \mathrm{Sel}_{p^\infty}(E/K) = \varinjlim_n \mathrm{Sel}_{p^n}(E/K), \]
nằm trong dãy chính xác:
\[ 0 \to E(K) \otimes \mathbb{Q}_p/\mathbb{Z}_p \to \mathrm{Sel}_{p^\infty}(E/K) \to \mathrm{Sha}(E/K)[p^\infty] \to 0. \]

Cấu trúc: $\mathrm{Sel}_{p^\infty}(E/K) \cong (\mathbb{Q}_p/\mathbb{Z}_p)^r \oplus M$ với $r = \mathrm{rk}(E(K))$ và $M$ hữu hạn (= $\mathrm{Sha}[p^\infty]$ nếu $\mathrm{Sha}$ hữu hạn).

Trên tháp Iwasawa: Cho $K_\infty = \mathbb{Q}_\infty^{\mathrm{cyc}}$, nhóm Selmer Iwasawa:

\[ \mathrm{Sel}_{p^\infty}(E/K_\infty) = \varinjlim_n \mathrm{Sel}_{p^\infty}(E/K_n), \]
là module rời rạc (co-finite) trên $\Lambda$. Đối ngẫu Pontryagin $X_E = \mathrm{Sel}_{p^\infty}(E/K_\infty)^\vee$ là module Iwasawa compact.

Ví dụ

Ví dụ (Selmer $p$-adic cụ thể). 1. Hạng 0: $E: y^2 + y = x^3 - x^2$ (conductor 11). $E(\mathbb{Q}) \cong \mathbb{Z}/5\mathbb{Z}$ (xoắn thuần túy). Tại $p = 3$:
\[ \mathrm{Sel}_{3^\infty}(E/\mathbb{Q}) = \mathrm{Sha}(E/\mathbb{Q})[3^\infty]. \]
Vì $\mathrm{Sha} = 0$ (đã kiểm nghiệm), $\mathrm{Sel}_{3^\infty}(E/\mathbb{Q}) = 0$.

2. Hạng 1: $E: y^2 + y = x^3 - x$ (conductor 37). $E(\mathbb{Q}) \cong \mathbb{Z}$ (hạng 1). Tại $p = 5$:

\[ \mathrm{Sel}_{5^\infty}(E/\mathbb{Q}) \cong \mathbb{Q}_5/\mathbb{Z}_5 \oplus \mathrm{Sha}[5^\infty]. \]
Phần $\mathbb{Q}_5/\mathbb{Z}_5$ đến từ điểm sinh $P = (0, 0)$ hạng vô hạn.

3. Trên tháp: $X_E = \mathrm{Sel}_{5^\infty}(E/\mathbb{Q}_\infty^{\mathrm{cyc}})^\vee$ là module xoắn trên $\Lambda$ (theo Kato, vì $\mathrm{rk} = 1$ nhưng $r_{\mathrm{an}} = 1$). Chuỗi đặc trưng $\mathrm{char}(X_E)$ có $T$ là thừa số (phản ánh $L_5(E, 0) = 0$).

4. Selmer Bloch--Kato vs cổ điển: Nhóm Selmer Bloch--Kato $H^1_f(G_\mathbb{Q}, V_p(E))$ là $\mathbb{Q}_p$-không gian véctơ, chiều $= \mathrm{rk}(E(\mathbb{Q}))$ (nếu BSD đúng). Nó liên hệ: $H^1_f \otimes \mathbb{Q}_p/\mathbb{Z}_p \hookrightarrow \mathrm{Sel}_{p^\infty}$.

Ý nghĩa trực giác

Selmer $p$-adic --- “kính lúp $p$-adic cho Mordell--Weil”.
  • Hình dung: $E(\mathbb{Q})$ rất khó “nhìn” trực tiếp. Selmer $p$-adic “phóng đại” nó qua $p$: phần $(\mathbb{Q}_p/\mathbb{Z}_p)^r$ nắm bắt hạng, phần hữu hạn nắm bắt $\mathrm{Sha}[p^\infty]$. Như dùng kính lúp $p$-adic để “thấy” cấu trúc Mordell--Weil.
  • Tại sao “giới hạn thuận”?: $\mathrm{Sel}_{p^n}$ nắm “thông tin modulo $p^n$”. Khi $n \to \infty$, ta “thấy” toàn bộ thông tin $p$-primary. Đây giống “hoàn chỉnh hóa $p$-adic”.
  • Đối ngẫu Pontryagin: $\mathrm{Sel}_{p^\infty}$ rời rạc (co-finite type), $X_E = (\mathrm{Sel}_{p^\infty})^\vee$ compact (finite type). Hai cách nhìn cùng một đối tượng, chọn tùy tiện lợi.

Liên hệ với giả thuyết Birch--Dyer

Selmer $p$-adic trong BSD.
  • BSD phần $p$: BSD mạnh phần $p$ nói:
    \[ \mathrm{ord}_p\left(\frac{L^{(r)}(E,1)}{r! \cdot \Omega_E \cdot \mathrm{Reg}_E}\right) = \mathrm{ord}_p\left(\frac{|\mathrm{Sha}| \cdot \prod c_p}{|E(\mathbb{Q})_{\mathrm{tors}}|^2}\right). \]
    Vế phải được “đọc” từ $\mathrm{Sel}_{p^\infty}$: $|\mathrm{Sha}[p^\infty]|$ = phần hữu hạn.
  • Kato: Nếu $L(E,1) \neq 0$, Kato chứng minh $\mathrm{Sel}_{p^\infty}(E/\mathbb{Q})$ hữu hạn (cho $p$ đủ lớn). Đây là “$\mathrm{rk}_{\mathrm{an}} = 0 \Rightarrow \mathrm{rk} = 0$” --- một nửa BSD yếu.
  • Module Iwasawa: $X_E = (\mathrm{Sel}_{p^\infty}(E/\mathbb{Q}_\infty))^\vee$ là đối tượng trung tâm trong IMC. Chuỗi đặc trưng $\mathrm{char}(X_E)$ “mã hóa” tất cả $|\mathrm{Sel}_{p^\infty}(E/\mathbb{Q}_n)|$ cho mọi tầng $n$.
187 Tháp cyclotomic (Cyclotomic tower) Ch.6 7

Định nghĩa

Định nghĩa (Tháp cyclotomic [washington1997]). Tháp cyclotomic (Cyclotomic tower) là dãy tăng các trường số:
\[ K = K_0 \subset K_1 \subset K_2 \subset \cdots \subset K_\infty = \bigcup_{n=0}^{\infty} K_n, \]
trong đó $K_n$ là trường con duy nhất của $K(\zeta_{p^{n+1}})$ sao cho $[K_n : K_0] = p^n$, và $\mathrm{Gal}(K_\infty / K) \cong \mathbb{Z}_p$.

Tháp cyclotomic trên $\mathbb{Q}$ (trường hợp cơ bản nhất): lấy $K = \mathbb{Q}$, $p$ lẻ, thì $K_n = \mathbb{Q}(\zeta_{p^{n+1}})^+$ (phần thực). Tại mỗi “tầng” $n$:

  • $[K_n : K_{n-1}] = p$ (mỗi tầng là mở rộng bậc $p$),
  • Chỉ phân nhánh tại $p$ (và có thể $\infty$),
  • Bất biến số học (nhóm lớp, Selmer) được “theo dõi” qua các tầng.

Ví dụ

Ví dụ (Tháp cyclotomic cụ thể). 1. $K = \mathbb{Q}$, $p = 3$: Các tầng:
  • $K_0 = \mathbb{Q}$,
  • $K_1 = \mathbb{Q}(\cos(2\pi/9))$ (bậc 3 trên $\mathbb{Q}$),
  • $K_2 = \mathbb{Q}(\cos(2\pi/27))$ (bậc 9 trên $\mathbb{Q}$),
  • $K_n$ (bậc $3^n$ trên $\mathbb{Q}$).

2. Nhóm lớp dọc tháp: Cho $K = \mathbb{Q}(\sqrt{-23})$, $p = 3$. Tại trường cơ sở: $h_K = 3$. Dọc tháp 3-cyclotomic: $e_0 = 1, e_1 = 2, e_2 = 3, \ldots$ (tức $e_n = n + \nu$, $\lambda = 1$, $\mu = 0$). Nhóm lớp phần $3$-primary tăng tuyến tính.

3. Selmer dọc tháp: Cho $E: y^2 + y = x^3 - x$ (conductor 37), $p = 5$. Tại $K_0 = \mathbb{Q}$: $\mathrm{Sel}_{5^\infty} \cong \mathbb{Q}_5/\mathbb{Z}_5$ (hạng 1). Dọc tháp: Selmer “lớn lên” --- module Iwasawa $X_E$ mã hóa tốc độ.

Ý nghĩa trực giác

Tháp cyclotomic --- “thang máy $p$-adic”.
  • Hình dung: Tháp cyclotomic như “tòa nhà vô hạn tầng”. Mỗi tầng là trường số lớn hơn. “Thang máy” (ánh xạ norm/restriction) cho phép di chuyển thông tin giữa các tầng.
  • Tại sao “cyclotomic”?: Tháp đến từ căn bậc $p^n$ đơn vị $\zeta_{p^n}$ --- đối tượng “đơn giản nhất” trong lý thuyết số $p$-adic. Mọi tháp $\mathbb{Z}_p$ khác phức tạp hơn (anticyclotomic, trường lớp, v.v.).
  • “Nhìn toàn cục”: Thay vì chỉ biết $\mathrm{Sel}(E/\mathbb{Q})$ (một tầng), tháp cho ta $\mathrm{Sel}(E/K_n)$ cho mọi $n$ --- “bộ phim” thay vì “bức ảnh”. Module Iwasawa nắm bắt toàn bộ bộ phim.

Liên hệ với giả thuyết Birch--Dyer

Tháp cyclotomic trong BSD.
  • Nền tảng IMC: Mọi công thức IMC phát biểu trên tháp cyclotomic: $\mathrm{char}_\Lambda(X_E) = (L_p(E))$ trên $K_\infty^{\mathrm{cyc}} / K$.
  • “Descent”: IMC ở “tầng vô cực” suy ra kết quả ở “tầng đáy” $K = \mathbb{Q}$ qua “descent” (chuyên biệt hóa $T = 0$). Đây là cách IMC → BSD phần $p$.
  • Tháp khác: Ngoài cyclotomic, có tháp anticyclotomic (dùng trong Gross--Zagier/Kolyvagin) và tháp trường lớp (dùng cho CM). Mỗi tháp cho góc nhìn BSD khác nhau.
188 Giả thuyết BSD $p$-adic ($p$-adic BSD Conjecture) Ch.9 9

Định nghĩa

Định nghĩa (Giả thuyết BSD $p$-adic [mazur-tate-teitelbaum1986]). Cho $E/\mathbb{Q}$ đường cong elliptic, $p$ nguyên tố, $L_p(E, s)$ hàm $L$ $p$-adic. Giả thuyết BSD $p$-adic ($p$-adic BSD Conjecture) (Mazur--Tate--Teitelbaum, 1986) phát biểu:

BSD $p$-adic yếu: Nếu $E$ ordinary tại $p$:

\[ \mathrm{ord}_{s=0} L_p(E, s) = \begin{cases} \mathrm{rk}(E(\mathbb{Q})) & \text{nếu rút gọn tốt tại } p, \\ \mathrm{rk}(E(\mathbb{Q})) + 1 & \text{nếu rút gọn nhân tách tại } p \text{ (exceptional zero).} \end{cases} \]

BSD $p$-adic mạnh: Leading coefficient:

\[ \frac{L_p^{(r)}(E, 0)}{r!} = e_p(E) \cdot \frac{|\mathrm{Sha}(E/\mathbb{Q})| \cdot \mathrm{Reg}_p(E) \cdot \prod_\ell c_\ell}{|E(\mathbb{Q})_{\mathrm{tors}}|^2}, \]
trong đó:
  • $r = \mathrm{ord}_{s=0} L_p(E, s)$ (hạng $p$-adic),
  • $\mathrm{Reg}_p(E)$ = regulator $p$-adic (thay regulator Néron--Tate bằng phiên bản $p$-adic dùng logarit hình thức),
  • $e_p(E)$ = thừa số Euler $p$-adic (phụ thuộc loại rút gọn tại $p$).

Ví dụ

Ví dụ (BSD $p$-adic cụ thể). 1. Hạng 0, rút gọn tốt: $E: y^2 = x^3 + 1$ (conductor 36), $p = 7$. $L(E,1) \neq 0$, $E$ rút gọn tốt tại 7. BSD $p$-adic: $\mathrm{ord}_{s=0} L_7(E, s) = 0$ (không triệt tiêu). Đã kiểm nghiệm đúng.

2. Hạng 1: $E: y^2 + y = x^3 - x$ (conductor 37), $p = 5$. $\mathrm{rk} = 1$, rút gọn tốt tại 5. BSD $p$-adic: $\mathrm{ord}_{s=0} L_5(E, s) = 1$. Leading coefficient $L_5'(E, 0)$ liên hệ logarit $p$-adic của sinh tử Mordell--Weil.

3. Exceptional zero: $E: y^2 + y = x^3 + x^2$ (11a3), $p = 11$. Rút gọn nhân tách. $\mathrm{rk} = 0$ nhưng $\mathrm{ord}_{s=0} L_{11}(E, s) = 1$ (thêm 1 zero ngoại lai). Leading coefficient:

\[ L_{11}'(E, 0) = \mathcal{L}_p \cdot \frac{|\mathrm{Sha}| \cdot \prod c_\ell}{|E(\mathbb{Q})_{\mathrm{tors}}|^2}, \]
với $\mathcal{L}_p = \log_p(q_E) / \mathrm{ord}_p(q_E)$ --- bất biến $\mathcal{L}$ (Greenberg--Stevens, 1993, đã chứng minh).

Ý nghĩa trực giác

BSD $p$-adic --- “BSD nhìn qua kính $p$-adic”.
  • Hình dung: BSD cổ điển liên hệ $L(E,s)$ (hàm phức) với số học. BSD $p$-adic liên hệ $L_p(E,s)$ (hàm $p$-adic) với số học. Cả hai “nói cùng câu chuyện” nhưng bằng “ngôn ngữ” khác nhau.
  • Tại sao cần phiên bản $p$-adic?: BSD cổ điển rất khó chứng minh trực tiếp (hàm $L$ phức siêu việt). BSD $p$-adic “dễ tiếp cận hơn” vì hàm $L$ $p$-adic sống trong đại số Iwasawa --- nơi có nhiều công cụ đại số.
  • IMC → BSD $p$-adic: Phỏng đoán chính Iwasawa suy ra BSD $p$-adic (cho phần $p$). Đây là con đường “gián tiếp” nhưng hiệu quả nhất hiện nay.

Liên hệ với giả thuyết Birch--Dyer

BSD $p$-adic và BSD cổ điển.
  • BSD $p$-adic ⊃ BSD cổ điển (phần $p$): Nếu BSD $p$-adic mạnh đúng cho mọi $p$, suy ra BSD cổ điển đúng (modulo hữu hạn nhiều ngoại lệ). Trong thực tế, con đường Kato + Skinner--Urban chứng minh IMC → BSD $p$-adic → BSD phần $p$.
  • Exceptional zero: Hiện tượng thuần túy $p$-adic (không có tương tự trong BSD cổ điển). Greenberg--Stevens (1993) chứng minh công thức $\mathcal{L}_p$ cho exceptional zero --- đây là kết quả tinh tế nhất trong BSD $p$-adic.
  • Tiến triển: BSD $p$-adic đã được chứng minh hoàn toàn cho hạng 0 (khi $p$ ordinary, $\bar{\rho}$ bất khả quy), nhờ Kato--Skinner--Urban. Cho hạng 1: nhờ Gross--Zagier + Kolyvagin + IMC. Hạng $\geq 2$: hoàn toàn mở.
189 Trường số $p$-adic ($p$-adic number field $\mathbb{Q}_p$) Ch.9 5

Định nghĩa

Định nghĩa (Trường số $p$-adic). Cho $p$ số nguyên tố. Trường số $p$-adic ($p$-adic number field) $\mathbb{Q}_p$ là hoàn chỉnh hóa của $\mathbb{Q}$ theo trị tuyệt đối $p$-adic $|\cdot|_p$:
\[ \mathbb{Q}_p = \widehat{\mathbb{Q}}_{|\cdot|_p} = \left\{ \text{dãy Cauchy trong } (\mathbb{Q}, |\cdot|_p) \right\} / \sim. \]

Mỗi phần tử $x \in \mathbb{Q}_p$ viết duy nhất dưới dạng khai triển $p$-adic:

\[ x = \sum_{n=v}^{\infty} a_n p^n, \quad a_n \in \{0, 1, \ldots, p-1\}, \quad v = v_p(x) \in \mathbb{Z}. \]
($v$ có thể âm). Phần tử nguyên: $\mathbb{Z}_p = \{x \in \mathbb{Q}_p : v_p(x) \geq 0\} = \{\sum_{n=0}^{\infty} a_n p^n\}$.

Tính chất:

  1. $\mathbb{Q}_p$ là trường đặc số 0, hoàn chỉnh, không Archimedean.
  2. $\mathbb{Z}_p$ là vành định giá rời rạc, ideal cực đại $(p)$, trường thặng dư $\mathbb{F}_p$.
  3. Định lý Ostrowski: mọi trị tuyệt đối không tầm thường trên $\mathbb{Q}$ hoặc là $|\cdot|_\infty$ (thực) hoặc $|\cdot|_p$ (một $p$ nào đó). Tức “không gian cục bộ” của $\mathbb{Q}$ là $\mathbb{R}$ và các $\mathbb{Q}_p$.

Ví dụ

Ví dụ (Số $p$-adic cụ thể). 1. Trong $\mathbb{Q}_5$: Số $-1$ khai triển: $-1 = 4 + 4 \cdot 5 + 4 \cdot 5^2 + \cdots = \sum_{n=0}^{\infty} 4 \cdot 5^n$ (dãy vô hạn “$\ldots 4444$” trong cơ số 5). Kiểm tra: $1 + (4 + 4 \cdot 5 + \cdots) = 5 + 4 \cdot 5 + \cdots = 5(1 + 4 + 4 \cdot 5 + \cdots) = 5 \cdot 0 = 0$.

2. $1/3$ trong $\mathbb{Q}_5$: $3^{-1} \equiv 2 \pmod{5}$. Khai triển: $1/3 = 2 + 3 \cdot 5 + 1 \cdot 5^2 + \cdots$.

3. $\sqrt{-1}$ trong $\mathbb{Q}_5$: Vì $2^2 = 4 \equiv -1 \pmod{5}$, bổ đề Hensel cho $i = \sqrt{-1} \in \mathbb{Q}_5$. Nhưng $\sqrt{-1} \notin \mathbb{Q}_3$ (vì $-1$ không phải thặng dư bậc hai modulo 3).

4. Hàm zeta $p$-adic: $\zeta_p(s) = \sum_{n \geq 1, p \nmid n} n^{-s}$ (bỏ thừa số Euler tại $p$) “hội tụ” $p$-adic cho $s \in \mathbb{Z}_p$ thích hợp → đây là nền tảng hàm $L$ $p$-adic.

Ý nghĩa trực giác

Số $p$-adic --- “nhìn số qua lăng kính chia hết”.
  • Hình dung: Trong $\mathbb{R}$, “gần” nghĩa là hiệu nhỏ (theo giá trị tuyệt đối thông thường). Trong $\mathbb{Q}_p$, “gần” nghĩa là hiệu chia hết cho lũy thừa cao của $p$. Ví dụ: trong $\mathbb{Q}_5$, $1$ và $126 = 1 + 5^3$ rất “gần” ($|1 - 126|_5 = 5^{-3}$).
  • “Kính lúp modular”: Khai triển $p$-adic $x = a_0 + a_1 p + a_2 p^2 + \cdots$ giống “nhìn $x$ modulo $p$, modulo $p^2$, modulo $p^3$, \ldots” --- mỗi “lớp” cho thêm thông tin.
  • Nguyên lý Hasse--Minkowski: Nhiều bài toán Diophantine có nghiệm trong $\mathbb{Q}$ khi và chỉ khi có nghiệm trong $\mathbb{R}$ mọi $\mathbb{Q}_p$. Tức “toàn cục = tất cả cục bộ”. Giả thuyết BSD vi phạm nguyên lý này (Sha ≠ 0), đó là lý do BSD sâu sắc.

Liên hệ với giả thuyết Birch--Dyer

$\mathbb{Q}_p$ trong BSD.
  • Điều kiện cục bộ: Nhóm Selmer đòi hỏi “nghiệm cục bộ tại mọi $p$” --- tức lớp $c \in H^1(G_\mathbb{Q}, E[n])$ sao cho $c|_{G_{\mathbb{Q}_p}} \in \mathrm{im}(\kappa_p)$ cho mọi $p$. Nhóm $E(\mathbb{Q}_p)$ là “phiên bản $p$-adic” của $E(\mathbb{Q})$.
  • Hàm $L$ $p$-adic: $L_p(E, s)$ sống trên $\mathbb{Q}_p$. Nội suy $p$-adic giá trị đặc biệt $L(E, \chi, 1)$ (phức) thành hàm trên $\mathbb{Z}_p$.
  • Regulator $p$-adic: Trong BSD $p$-adic, regulator $\mathrm{Reg}_p$ dùng logarit hình thức $\log_E: E(\mathbb{Q}_p) \to \mathbb{Q}_p$ thay cho chiều cao Néron--Tate (là số thực).
190 Trị tuyệt đối $p$-adic ($p$-adic absolute value) Ch.9 4

Định nghĩa

Định nghĩa (Trị tuyệt đối $p$-adic). Cho $p$ nguyên tố. Trị tuyệt đối $p$-adic ($p$-adic absolute value) trên $\mathbb{Q}$ được định nghĩa:
\[ |x|_p = p^{-v_p(x)} \quad \text{cho } x \neq 0, \qquad |0|_p = 0, \]
trong đó $v_p(x) = $ định giá $p$-adic --- số mũ chính xác của $p$ trong phân tích thừa số nguyên tố:
\[ x = p^{v_p(x)} \cdot \frac{a}{b}, \quad p \nmid ab. \]

Tính chất cực mạnh (ultrametric):

\[ |x + y|_p \leq \max(|x|_p, |y|_p) \quad (\text{bất đẳng thức tam giác ``mạnh''}). \]
Hệ quả: nếu $|x|_p \neq |y|_p$, thì $|x + y|_p = \max(|x|_p, |y|_p)$ (bằng max!).

Công thức tích (product formula): Cho $x \in \mathbb{Q}^\times$:

\[ |x|_\infty \cdot \prod_{p} |x|_p = 1. \]
Đây là “luật bảo toàn” nền tảng: kích thước “thực” và “$p$-adic” cân bằng nhau.

Ví dụ

Ví dụ (Trị tuyệt đối $p$-adic cụ thể). 1. Các giá trị cơ bản: Với $p = 3$:
  • $|9|_3 = 3^{-2} = 1/9$ (nhỏ! vì $9 = 3^2$ “chia hết nhiều cho 3”),
  • $|10|_3 = 3^0 = 1$ (vì $3 \nmid 10$),
  • $|1/27|_3 = 3^3 = 27$ (lớn! vì $1/27$ có “$3$ ở mẫu”).

2. Công thức tích: Lấy $x = 12 = 2^2 \cdot 3$:

\[ |12|_\infty \cdot |12|_2 \cdot |12|_3 \cdot |12|_5 \cdot \cdots = 12 \cdot \frac{1}{4} \cdot \frac{1}{3} \cdot 1 \cdot 1 \cdots = 1. \quad \checkmark \]

3. Ultrametric: Trong $\mathbb{Q}_5$: $|5|_5 = 1/5$, $|25|_5 = 1/25$, $|5 + 25|_5 = |30|_5 = |5 \cdot 6|_5 = 1/5 = \max(1/5, 1/25)$. “Tam giác $p$-adic” luôn “đều cạnh” hoặc “cân”.

Ý nghĩa trực giác

Trị tuyệt đối $p$-adic --- “đo chia hết”.
  • Hình dung: $|x|_p$ nhỏ khi $x$ “chia hết nhiều cho $p$” và lớn khi $x$ “có $p$ ở mẫu”. Đây là “thước đo chia hết” --- hoàn toàn khác giá trị tuyệt đối thông thường (đo “kích thước”).
  • Ultrametric: Mọi tam giác trong $\mathbb{Q}_p$ là “cân” (hai cạnh dài bằng nhau). Hệ quả kỳ lạ: mọi điểm trong hình tròn đều là “tâm”, và hai hình tròn hoặc rời nhau hoặc một chứa trong kia (fractal!).
  • “Hoàn vũ $p$-adic”: Với mỗi $p$, ta có “thế giới số” $\mathbb{Q}_p$ riêng, mỗi thế giới nhìn $\mathbb{Q}$ theo góc khác. Thông tin từ tất cả $p$ (cộng $\mathbb{R}$) cho bức tranh “toàn cục” --- đây là tinh thần Hasse principle.

Liên hệ với giả thuyết Birch--Dyer

Trị tuyệt đối $p$-adic trong BSD.
  • Sản phẩm Euler: Hàm $L(E, s) = \prod_p L_p(E, s)^{-1}$ phân tích thành thừa số cục bộ --- mỗi $p$ đóng góp thông tin “$p$-adic” riêng.
  • Công thức tích → công thức BSD: Công thức tích $\prod |x|_v = 1$ là nguyên mẫu cho “công thức BSD”: sản phẩm các thừa số cục bộ (Tamagawa $c_p$, chu kỳ $\Omega$, Sha) cân bằng giá trị đặc biệt hàm $L$. Adèlic interpretation: BSD = “thể tích adelic” của nhóm $E$.
  • Cục bộ--toàn cục: Điều kiện Selmer “cục bộ tại mọi $p$” (dùng $\mathbb{Q}_p$) → nhóm Selmer “toàn cục” (trên $\mathbb{Q}$). Sha = “khoảng cách” giữa cục bộ và toàn cục.
191 Nghiệm ngoại lai (Exceptional (trivial) zero) Ch.9 9

Định nghĩa

Định nghĩa (Nghiệm ngoại lai). [mazur-tate-teitelbaum1986] Cho $E/\mathbb{Q}$ đường cong elliptic có rút gọn nhân tách tại $p$ (split multiplicative reduction). Nghiệm ngoại lai (Exceptional zero) (hay trivial zero) là hiện tượng:
\[ L_p(E, 0) = 0 \quad \text{bất kể} \quad L(E, 1) \stackrel{?}{\neq} 0. \]

Nguyên nhân: Khi rút gọn nhân tách, thừa số Euler tại $p$ trong nội suy $p$-adic chứa $(1 - 1/\alpha)$ với $\alpha = a_p = 1$ (Frobenius). Do đó $(1 - 1/\alpha) = 0$, gây zero “giả tạo”.

Công thức Mazur--Tate--Teitelbaum: Nếu $L(E, 1) \neq 0$ (hạng 0), thì:

\[ L_p'(E, 0) = \mathcal{L}_p(E) \cdot \frac{L(E, 1)}{\Omega_E^+}, \]
trong đó $\mathcal{L}_p(E) = \frac{\log_p(q_E)}{\mathrm{ord}_p(q_E)}$ là bất biến $\mathcal{L}$, với $q_E \in p\mathbb{Z}_p$ là tham số Tate (uniformization $p$-adic: $E(\mathbb{Q}_p) \cong \mathbb{Q}_p^\times / q_E^\mathbb{Z}$).

Ví dụ

Ví dụ (Exceptional zero cụ thể). 1. $E: y^2 + y = x^3 + x^2$ (11a3), $p = 11$: $E$ rút gọn nhân tách tại 11 (vì $\Delta = -11$, $c_4 = 16$). Tham số Tate $q_{11} \in 11\mathbb{Z}_{11}$. Kiểm tra:
  • $L(E, 1) = 1/5 \cdot \Omega_E^+ \neq 0$ (hạng 0, $E(\mathbb{Q}) \cong \mathbb{Z}/5\mathbb{Z}$),
  • $L_{11}(E, 0) = (1 - 1/\alpha)^2 \cdot 1/5 = 0$ (vì $a_{11} = 1$, $\alpha = 1$),
  • $L_{11}'(E, 0) = \mathcal{L}_{11} \cdot 1/5 \neq 0$.
Greenberg--Stevens (1993) chứng minh công thức $\mathcal{L}$. Giá trị $\mathcal{L}_{11}$ tường minh.

2. $E: y^2 = x^3 - x^2 - 4x + 4$ (conductor $= 14$), $p = 7$: Rút gọn nhân tách tại 7. $a_7 = -1$ (nhân không tách?). Thực tế cần kiểm tra kỹ: nếu $a_p = 1$ → tách, $a_p = -1$ → không tách. Exceptional zero chỉ xảy ra khi nhân tách ($a_p = 1$).

3. Hạng cao hơn: Nếu $E$ hạng 1 và rút gọn nhân tách tại $p$: $\mathrm{ord} L_p(E) = 2$ (thay vì 1 theo BSD cổ điển). Leading coefficient chứa $\mathcal{L}_p \cdot \hat{h}_p(P)$ (chiều cao $p$-adic nhân bất biến $\mathcal{L}$).

Ý nghĩa trực giác

Exceptional zero --- “lỗi nội suy $p$-adic”.
  • Hình dung: Nội suy $p$-adic $L(E, \chi, 1)$ cần chia cho thừa số Euler $(1 - \alpha^{-1} \cdot \chi(p))$. Khi $\alpha = 1$ và $\chi = 1$: thừa số = 0, gây “$0/0$” --- zero “giả tạo” không phản ánh số học thật.
  • Analogy: Giống hàm $f(x) = x \sin(1/x)$: $f(0) = 0$ nhưng “lý do” triệt tiêu không phải từ $\sin$ mà từ thừa số $x$ phía trước. Bất biến $\mathcal{L}$ “đo” chính xác “phần zero giả tạo” và “trích xuất” thông tin thật.
  • $p$-adic uniformization: Khi nhân tách, $E(\mathbb{Q}_p) \cong \mathbb{Q}_p^\times / q_E^\mathbb{Z}$ (Tate). Tham số $q_E$ mang thông tin “hình học $p$-adic” riêng. Bất biến $\mathcal{L} = \log_p(q_E) / \mathrm{ord}_p(q_E)$ kết nối hình học này với hàm $L$.

Liên hệ với giả thuyết Birch--Dyer

Exceptional zero trong BSD.
  • Sửa đổi BSD $p$-adic: Exceptional zero buộc phải sửa công thức BSD $p$-adic: thêm $+1$ vào bậc triệt tiêu, và thêm $\mathcal{L}_p$ vào leading coefficient. Đây là lý do MTT (1986) phải phát biểu riêng trường hợp nhân tách.
  • Greenberg--Stevens (1993): Chứng minh công thức $\mathcal{L}_p$ cho hạng 0 bằng biến dạng Hida (Hida deformation) --- biến $E$ thành “họ” đường cong $p$-adic, và exceptional zero “biến mất” khi di chuyển trong họ.
  • Mở rộng: Benois (2014) mở rộng công thức exceptional zero cho trường hợp supersingular và hạng cao hơn. Vấn đề exceptional zero cho hạng $\geq 2$ vẫn mở.
192 Phỏng đoán Bloch–Kato (Bloch–Kato Conjecture) Ch.5 9

Định nghĩa

Định nghĩa (Phỏng đoán Bloch--Kato [bloch-kato1990]). Phỏng đoán Bloch--Kato (Bloch--Kato Conjecture) (1990) là tổng quát hóa lớn nhất của giả thuyết BSD, áp dụng cho mọi motif $M$ (đối tượng hình học đại số tổng quát).

Cho $M$ motif thuần (pure motive) trên $\mathbb{Q}$ với hàm $L$ $L(M, s)$, trọng số $w$, và điểm nguyên $n$ (“critical point”). Phỏng đoán phát biểu:

Phần yếu: $\mathrm{ord}_{s=n} L(M, s) = \dim_{\mathbb{Q}_p} H^1_f(G_\mathbb{Q}, V^*(1-n)) - \dim_{\mathbb{Q}_p} H^0(G_\mathbb{Q}, V^*(1-n))$,

trong đó $V$ là biểu diễn $p$-adic gắn với $M$, $V^* = \mathrm{Hom}(V, \mathbb{Q}_p)$ đối ngẫu, và $H^1_f$ là Selmer Bloch--Kato (điều kiện cục bộ “crystalline” tại $p$).

Phần mạnh: Leading coefficient $L^*(M, n) / R_\infty(M)$ là số hữu tỉ tường minh bằng:

\[ \frac{L^*(M, n)}{R_\infty(M, n)} = \pm \frac{|\mathrm{Sha}_{\mathrm{BK}}(M)| \cdot \prod_p c_p(M)}{|H^0_f|^2} \cdot (\text{tam-factor}), \]
với $R_\infty$ = regulator (chu kỳ), $\mathrm{Sha}_{\mathrm{BK}}$ = nhóm Sha tổng quát.

Ví dụ

Ví dụ (Các trường hợp đặc biệt của Bloch--Kato). 1. $M = h^1(E)$ (đường cong elliptic), $n = 1$: Biểu diễn $V = V_p(E)$. Selmer Bloch--Kato $H^1_f(G_\mathbb{Q}, V_p(E)) \cong E(\mathbb{Q}) \otimes \mathbb{Q}_p$ (giả sử Sha hữu hạn). Phỏng đoán Bloch--Kato trở thành BSD mạnh. Đây là trường hợp quan trọng nhất.

2. $M = h^0(\mathrm{Spec}(\mathcal{O}_K))$ (trường số), $n = 0$: Hàm $L = \zeta_K(s)$ (hàm zeta Dedekind). Bloch--Kato trở thành công thức số lớp: $\lim_{s \to 0} s^{-r} \zeta_K(s) = -h_K R_K / w_K$. Đã chứng minh (cổ điển).

3. $M = \mathbb{Q}(n)$ (Tate twist), $n \geq 2$: Hàm $L = \zeta(s)$ (Riemann). Bloch--Kato liên hệ $\zeta(n)$ với $K$-group bậc cao. Đã chứng minh cho $n$ chẵn (Euler: $\zeta(2k) = \pi^{2k} \cdot \text{rational}$).

4. Bảng tổng quát hóa:

Motif Phỏng đoán Bloch--Kato Trạng thái
$h^0$ (trường số) Công thức số lớp Đã CM
$h^1(E)$ (EC) BSD Phần lớn mở
$h^1(A)$ (đa tạp Abel) BSD tổng quát Rất ít biết
$\mathbb{Q}(n)$ ($n \geq 2$) Giá trị zeta Riemann $n$ chẵn: đã CM

Ý nghĩa trực giác

Bloch--Kato --- “BSD cho mọi đối tượng số học”.
  • Hình dung: BSD nói “$L(E,1)$ mã hóa hạng và Sha của $E$”. Bloch--Kato nói: mọi hàm $L$ đều mã hóa thông tin số học tương ứng. Đường cong elliptic chỉ là một trường hợp trong “thế giới motif” rộng lớn.
  • “Nguyên lý siêu hình”: Có một “luật tự nhiên” rằng giá trị đặc biệt hàm $L$ (giải tích) luôn bằng sản phẩm bất biến số học (đại số). BSD, công thức số lớp, công thức Birch--Tate cho $K_2$ --- tất cả là biểu hiện của cùng một nguyên lý.
  • Tại sao “Bloch--Kato”: Spencer Bloch và Kazuya Kato (1990) tìm ra cách đúng để phát biểu “điều kiện cục bộ” (tại $p$: crystalline) cho nhóm Selmer tổng quát. Trước đó, nhiều phỏng đoán (Beilinson, Deligne) thiếu “phần $p$-adic” chính xác.

Liên hệ với giả thuyết Birch--Dyer

Bloch--Kato trong BSD.
  • BSD ⊂ Bloch--Kato: BSD (yếu và mạnh) là trường hợp $M = h^1(E)$ của phỏng đoán Bloch--Kato. Chứng minh Bloch--Kato cho $h^1(E)$ = chứng minh BSD.
  • Kato's Euler system: Phương pháp Kato chính xác là “Bloch--Kato cho $h^1(E)$”: xây phần tử $K$-theory, ánh xạ regulator vào $H^1_f$, chặn Selmer Bloch--Kato.
  • Tổng quát hóa: BSD cho đa tạp Abel chiều $g > 1$ (ví dụ Jacobian đường cong genus $> 1$) là Bloch--Kato cho $h^1(A)$ --- rất ít biết ngoài $g = 1$ (EC). Kết quả mới nhất: BSD mạnh cho một số bề mặt Abel (2024).
193 Motif (Motive) Ch.5 9

Định nghĩa

Định nghĩa (Motif [jannsen1992]). Motif (Motive) (tiếng Pháp: motif, tiếng Anh: motive) là “đối tượng đại số phổ quát” đứng đằng sau các lý thuyết đối đồng điều trong hình học đại số. Ý tưởng do Grothendieck (1960s): mỗi đa tạp đại số trơn xạ ảnh $X$ over $\mathbb{Q}$ có “bản chất” (essence) $h(X)$ chứa mọi thông tin đối đồng điều --- Betti, de Rham, étale, crystalline --- dưới dạng thống nhất.

Motif thuần (pure motive): Cho $X$ trơn xạ ảnh chiều $d$. Đối đồng điều bậc $i$:

\[ h^i(X) = \text{``motif bậc } i \text{''}, \quad h(X) = \bigoplus_{i=0}^{2d} h^i(X). \]

Mỗi motif $M$ có:

  • Hàm $L$: $L(M, s) = \prod_p L_p(M, s)^{-1}$ (tích Euler từ biểu diễn $\ell$-adic),
  • Nhóm Selmer: $H^1_f(G_\mathbb{Q}, V_M)$ (Bloch--Kato Selmer group),
  • Regulator: $r_\infty(M)$ (ánh xạ từ $K$-theory vào Deligne cohomology),
  • Phỏng đoán Bloch--Kato: liên hệ $L(M, s)$ với $H^1_f$ và regulator.

Ví dụ

Ví dụ (Các motif cơ bản). 1. $h^0(\mathrm{pt}) = \mathbb{Q}(0)$: Motif “tầm thường” --- hàm $L$ là $\zeta(s)$ (Riemann). Bloch--Kato = công thức số lớp.

2. $h^1(E)$ (đường cong elliptic): Motif bậc 1 --- hàm $L$ là $L(E, s)$ (Hasse--Weil). Bloch--Kato = BSD. Biểu diễn Galois: $V_p(E)$ (2 chiều).

3. $h^1(A)$ (đa tạp Abel chiều $g$): Hàm $L = L(A, s)$, biểu diễn $2g$ chiều. BSD tổng quát: $\mathrm{ord}_{s=1} L(A, s) = \mathrm{rk}(A(\mathbb{Q}))$.

4. $\mathbb{Q}(n)$ (Tate twist bậc $n$): Motif “xoắn” --- hàm $L$ liên quan $\zeta(s-n)$. Bloch--Kato cho $K_{2n-1}(\mathbb{Z})$ (Quillen $K$-theory).

5. $h^1(f)$ (newform bậc $k$): Cho newform $f$ trọng số $k \geq 2$, motif $h^1(f)$ có hàm $L(f, s)$ và biểu diễn Galois 2 chiều. Khi $k = 2$ và $f$ ứng với EC: $h^1(f) = h^1(E)$.

Ý nghĩa trực giác

Motif --- “DNA hình học đại số”.
  • Hình dung: Mỗi đa tạp $X$ có nhiều “bức ảnh” (cohomology): Betti (topo), de Rham (vi phân), étale ($p$-adic). Motif là “bản gốc” --- từ nó ta rút ra mọi bức ảnh. Grothendieck tin rằng motif “tồn tại” dù chưa ai xây dựng hoàn chỉnh phạm trù motif hỗn hợp.
  • “Periodic table”: Giống bảng tuần hoàn phân loại nguyên tố, motif “phân loại” đối tượng hình học đại số. $\mathbb{Q}(0)$ = hydrogen, $h^1(E)$ = helium, v.v.
  • Trạng thái: Phạm trù motif thuần (pure) đã được xây dựng (Grothendieck, Manin, Jannsen). Phạm trù motif hỗn hợp (mixed) khó hơn nhiều --- liên quan phỏng đoán Hodge, phỏng đoán Tate. Bloch--Kato phỏng đoán “vượt qua” khó khăn này bằng cách phát biểu trực tiếp cho biểu diễn Galois.

Liên hệ với giả thuyết Birch--Dyer

Motif trong BSD.
  • BSD = Bloch--Kato cho $h^1(E)$: BSD là trường hợp đặc biệt nhất và quan trọng nhất của phỏng đoán Bloch--Kato cho motif $h^1(E)$.
  • Tại sao tổng quát hóa?: Nhiều kỹ thuật chứng minh BSD (Euler system, Iwasawa theory) tự nhiên mở rộng cho motif tổng quát. Phỏng đoán Bloch--Kato cho khung lý thuyết thống nhất.
  • Langlands: Chương trình Langlands phỏng đoán rằng mọi hàm $L$ motivic đều là hàm $L$ tự đẳng cấu (automorphic). Nếu đúng, kỹ thuật Selmer/Euler system áp dụng rộng hơn nhiều.
194 BSD đẳng biến (Equivariant BSD) Ch.5 9

Định nghĩa

Định nghĩa (BSD đẳng biến). Cho $E/\mathbb{Q}$ đường cong elliptic và $K/\mathbb{Q}$ mở rộng Galois hữu hạn với $G = \mathrm{Gal}(K/\mathbb{Q})$. BSD đẳng biến (Equivariant BSD) phát biểu BSD cho $E$ trên $K$ “thành phần theo thành phần” theo biểu diễn của $G$.

Cụ thể, phân tích:

\[ E(K) \otimes \mathbb{C} \cong \bigoplus_{\rho \in \mathrm{Irr}(G)} V_\rho^{\oplus m_\rho}, \]
trong đó $\rho$ chạy qua biểu diễn bất khả quy của $G$, và $m_\rho = \langle E(K) \otimes \mathbb{C}, \rho \rangle$.

BSD đẳng biến yếu: Cho mỗi $\rho \in \mathrm{Irr}(G)$:

\[ \mathrm{ord}_{s=1} L(E, \rho, s) = m_\rho = \text{bội của } \rho \text{ trong } E(K) \otimes \mathbb{C}. \]

Ở đây $L(E, \rho, s) = L(E \otimes \rho, s)$ là hàm $L$ “xoắn” bởi biểu diễn Artin $\rho$.

Ví dụ

Ví dụ (BSD đẳng biến cụ thể). 1. $K = \mathbb{Q}(\sqrt{-7})$, $G = \mathbb{Z}/2\mathbb{Z}$: Hai biểu diễn: $\rho_0 = 1$ (tầm thường), $\rho_1 = \chi_{-7}$ (ký tự Kronecker). BSD đẳng biến:
\[ \mathrm{ord}_{s=1} L(E, 1, s) = \mathrm{rk}(E(\mathbb{Q})), \quad \mathrm{ord}_{s=1} L(E, \chi_{-7}, s) = \mathrm{rk}(E(\mathbb{Q}(\sqrt{-7}))) - \mathrm{rk}(E(\mathbb{Q})). \]
$L(E, \chi_{-7}, s)$ = hàm $L$ “twist” --- bậc triệt tiêu cho hạng “mới” khi mở rộng sang $\mathbb{Q}(\sqrt{-7})$.

2. Gross--Zagier + Kolyvagin: Cho $K$ trường phức bậc hai ảo thỏa điều kiện Heegner, BSD đẳng biến cho $\rho_1 = \chi_K$ đã được chứng minh khi $\mathrm{ord} L(E, \chi_K, 1) \leq 1$ (nhờ Gross--Zagier + Kolyvagin).

Ý nghĩa trực giác

BSD đẳng biến --- “BSD cho từng ký tự”.
  • Hình dung: BSD thường nói “hạng = bậc triệt tiêu” cho trường cố định. BSD đẳng biến “phân tích” cả hai vế theo biểu diễn Galois: mỗi biểu diễn $\rho$ đóng góp bao nhiêu vào hạng và bậc triệt tiêu.
  • Mạnh hơn BSD thường: BSD đẳng biến cho $K/\mathbb{Q}$ suy ra BSD cho $E/K$ và $E/\mathbb{Q}$, nhưng ngược lại không đúng. Nó chứa thông tin “tinh hơn” về cách Galois tác động.

Liên hệ với giả thuyết Birch--Dyer

BSD đẳng biến trong BSD.
  • Kato + Skinner--Urban: Chứng minh BSD đẳng biến cho $\rho = \chi$ ký tự bậc 1 (abelian), khi $L(E, \chi, 1) \neq 0$.
  • Hạn chế: Cho $\rho$ bậc $> 1$ (non-abelian), rất ít biết --- không có Euler system tự nhiên. Darmon, Rotger và Bertolini nghiên cứu trường hợp $\rho$ Artin bậc 2.
195 Đặc trưng Dirichlet (Dirichlet character $\chi$) Ch.5 5

Định nghĩa

Định nghĩa (Đặc trưng Dirichlet). Đặc trưng Dirichlet (Dirichlet character) modulo $N$ là đồng cấu nhóm:
\[ \chi: (\mathbb{Z}/N\mathbb{Z})^\times \longrightarrow \mathbb{C}^\times, \]
mở rộng ra $\mathbb{Z}$ bằng $\chi(n) = 0$ nếu $\gcd(n, N) > 1$.

Tính chất:

  1. $\chi$ tuần hoàn: $\chi(n + N) = \chi(n)$.
  2. $\chi$ nhân tính: $\chi(ab) = \chi(a)\chi(b)$.
  3. Đặc trưng tầm thường $\chi_0$: $\chi_0(n) = 1$ cho $\gcd(n, N) = 1$.
  4. Đặc trưng nguyên thủy: conductor nhỏ nhất.

Hàm $L$ Dirichlet: $L(\chi, s) = \sum_{n=1}^{\infty} \chi(n) n^{-s} = \prod_p (1 - \chi(p) p^{-s})^{-1}$.

Đặc biệt quan trọng: ký hiệu Kronecker $\chi_D = \left(\frac{D}{\cdot}\right)$ cho biệt thức $D$ --- đặc trưng bậc hai ứng với trường $\mathbb{Q}(\sqrt{D})$.

Ví dụ

Ví dụ (Đặc trưng Dirichlet cụ thể). 1. $\chi_{-4}$: Ký hiệu Kronecker $\left(\frac{-4}{\cdot}\right)$: $\chi_{-4}(1) = 1, \chi_{-4}(3) = -1$, tuần hoàn modulo 4. $L(\chi_{-4}, 1) = \pi/4$ (Leibniz).

2. Twist hàm $L$: Cho $E: y^2 = x^3 - x$ (conductor 32), twist bởi $\chi_{-7}$:

\[ L(E, \chi_{-7}, s) = \sum_n a_n \chi_{-7}(n) n^{-s}. \]
Đây là hàm $L$ của $E$ “nhìn qua lăng kính $\mathbb{Q}(\sqrt{-7})$”. Bậc triệt tiêu tại $s = 1$ cho hạng “phần $\chi_{-7}$” trong $E(\mathbb{Q}(\sqrt{-7}))$.

3. Nội suy $p$-adic: Hàm $L$ $p$-adic $L_p(E, s)$ nội suy giá trị $L(E, \chi, 1)$ cho mọi đặc trưng $\chi$ bậc lũy thừa $p$ --- đặc trưng Dirichlet là “biến” tự nhiên của hàm $L$ $p$-adic.

Ý nghĩa trực giác

Đặc trưng Dirichlet --- “kính lọc số học”.
  • Hình dung: Đặc trưng $\chi$ “lọc” các số nguyên theo thặng dư modulo $N$: số “tốt” cho $\chi = 1$, số “xấu” cho $\chi = -1$, số “không liên quan” cho $\chi = 0$. Twist $L(E, \chi)$ “lọc” thông tin $E$ qua kính $\chi$.
  • Fourier analysis: Đặc trưng Dirichlet = biến đổi Fourier trên nhóm $(\mathbb{Z}/N\mathbb{Z})^\times$. Twist hàm $L$ = “nhìn” hàm $L$ ở “tần số” $\chi$.

Liên hệ với giả thuyết Birch--Dyer

Đặc trưng Dirichlet trong BSD.
  • BSD đẳng biến: $L(E, \chi, s)$ xuất hiện trong BSD đẳng biến cho $\mathbb{Q}(\sqrt{D})/\mathbb{Q}$ khi $\chi = \chi_D$.
  • Hàm $L$ $p$-adic: $L_p(E, s)$ nội suy $L(E, \chi, 1)$ cho ký tự $p$-lũy thừa $\chi$.
  • Parity conjecture: Dấu gốc $w(E, \chi) = \pm 1$ xác định tính chẵn lẻ $\mathrm{ord}_{s=1} L(E, \chi, s)$.
196 Chương trình Langlands (Langlands Program) Ch.1 8

Định nghĩa

Định nghĩa (Chương trình Langlands [gelbart1984]). Chương trình Langlands (Langlands Program) là mạng lưới phỏng đoán sâu sắc do Robert Langlands đề xuất (1967--1970), nhằm thống nhất lý thuyết số, hình học đại số, và lý thuyết biểu diễn.

Hai trụ cột chính:

1. Tương ứng Langlands (reciprocity): Mọi biểu diễn Galois “motivic” $\rho: G_\mathbb{Q} \to \mathrm{GL}_n(\overline{\mathbb{Q}}_p)$ tương ứng với biểu diễn tự đẳng cấu $\pi$ trên $\mathrm{GL}_n(\mathbb{A}_\mathbb{Q})$ (adèles):

\[ \rho \longleftrightarrow \pi, \quad L(\rho, s) = L(\pi, s). \]
Tức hàm $L$ Galois = hàm $L$ tự đẳng cấu.

2. Functoriality: Cho hai nhóm reductive $G, H$ với “dual homomorphism” ${}^LH \to {}^LG$ (nhóm Langlands dual), có “transfer” biểu diễn tự đẳng cấu:

\[ \pi_H \longmapsto \pi_G. \]

Các trường hợp đã chứng minh:

  • $n = 1$: Luật thặng dư bậc hai (Gauss), lý thuyết trường lớp (Artin).
  • $n = 2$, trường hợp đặc biệt: Định lý modularity (Wiles, BCDT).
  • $\mathrm{GL}_2 \to \mathrm{GL}_3$: Gelbart--Jacquet (symmetric square).

Ví dụ

Ví dụ (Langlands trong thực hành). 1. Định lý modularity = Langlands cho EC: Biểu diễn Galois $\rho_{E,p}: G_\mathbb{Q} \to \mathrm{GL}_2(\mathbb{Z}_p)$ của đường cong elliptic $E$ tương ứng với newform $f_E$ trọng số 2. Tương ứng: $L(E, s) = L(f_E, s)$.

Đây chính là “Langlands reciprocity” cho $n = 2$, biểu diễn đến từ EC.

2. Thác triển giải tích: Langlands phỏng đoán mọi hàm $L$ motivic có thác triển giải tích và phương trình hàm (vì hàm $L$ tự đẳng cấu đã biết có tính chất này). Cho EC: đã chứng minh qua modularity.

3. Sato--Tate: Phỏng đoán Sato--Tate (nay là Định lý, 2008) được chứng minh nhờ “functoriality” --- chuyển biểu diễn từ $\mathrm{GL}_2$ sang $\mathrm{GL}_n$ ($n = 3, 4, 5$) bằng symmetric powers.

Ý nghĩa trực giác

Langlands --- “bảng Rosetta của toán học”.
  • Hình dung: Langlands Program giống “bảng Rosetta” dịch giữa ba ngôn ngữ: (1) Hình học đại số (motif, đa tạp), (2) Lý thuyết số (biểu diễn Galois, hàm $L$), (3) Giải tích điều hòa (dạng tự đẳng cấu). Mỗi định lý trong một ngôn ngữ tự động cho định lý trong các ngôn ngữ khác.
  • “Grand Unified Theory”: Nếu Langlands đúng hoàn toàn, mọi hàm $L$ đều “tự đẳng cấu” → mọi giá trị đặc biệt hàm $L$ hiểu được → mọi phỏng đoán Bloch--Kato (bao gồm BSD) tiếp cận được.
  • Trạng thái: Chương trình Langlands vẫn mở rộng lớn. Trường hợp $n = 2$ trên $\mathbb{Q}$ (modularity) là thành tựu lớn nhất. “Langlands over number fields” ($n > 2$, trường số tổng quát) là mục tiêu thế kỷ.

Liên hệ với giả thuyết Birch--Dyer

Langlands trong BSD.
  • Modularity = Langlands cho EC: Định lý modularity (cần thiết cho thác triển giải tích $L(E,s)$, BSD có nghĩa) chính là trường hợp Langlands reciprocity.
  • BSD cho đa tạp Abel chiều $> 1$: Cần “modularity” tổng quát (Langlands cho $\mathrm{GL}_{2g}$). Gần đây: modularity cho bề mặt Abel (Boxer--Calegari--Gee--Pilloni, 2018) mở đường cho BSD chiều 2.
  • Chương trình $p$-adic Langlands: Phiên bản $p$-adic của Langlands (Breuil, Colmez, Emerton) liên hệ trực tiếp với BSD $p$-adic và IMC.
197 Biểu diễn tự đẳng cấu (Automorphic representation) Ch.4 8

Định nghĩa

Định nghĩa (Biểu diễn tự đẳng cấu [gelbart1984]). Biểu diễn tự đẳng cấu (Automorphic representation) của $\mathrm{GL}_n(\mathbb{A}_\mathbb{Q})$ (nhóm tuyến tính tổng quát trên vành adèles $\mathbb{A}_\mathbb{Q}$) là biểu diễn bất khả quy $\pi$ xuất hiện trong không gian dạng tự đẳng cấu:
\[ \mathcal{A}(\mathrm{GL}_n(\mathbb{Q}) \backslash \mathrm{GL}_n(\mathbb{A}_\mathbb{Q})) \]
--- tức hàm trên $\mathrm{GL}_n(\mathbb{A}_\mathbb{Q})$ bất biến trái dưới $\mathrm{GL}_n(\mathbb{Q})$, thỏa điều kiện tăng trưởng vừa phải.

Phân tích tensor: $\pi = \bigotimes_v \pi_v$ (tích restricted tensor trên mọi vị trí $v$ --- hữu hạn và vô hạn), với:

  • $\pi_\infty$: thành phần Archimedean (biểu diễn $\mathrm{GL}_n(\mathbb{R})$),
  • $\pi_p$: thành phần $p$-adic (biểu diễn $\mathrm{GL}_n(\mathbb{Q}_p)$), unramified cho hầu hết $p$.

Hàm $L$ tự đẳng cấu: $L(\pi, s) = \prod_p L(\pi_p, s)$ (tích Euler). Godement--Jacquet: $L(\pi, s)$ có thác triển meromorphic và phương trình hàm.

Ví dụ

Ví dụ (Biểu diễn tự đẳng cấu quen thuộc). 1. $n = 1$: Biểu diễn tự đẳng cấu của $\mathrm{GL}_1(\mathbb{A})$ = ký tự Hecke $\chi: \mathbb{Q}^\times \backslash \mathbb{A}^\times \to \mathbb{C}^\times$. Hàm $L(\chi, s)$ = hàm $L$ Dirichlet. Đây là “lý thuyết trường lớp = Langlands cho $n = 1$”.

2. $n = 2$, dạng modular: Newform $f \in S_k(\Gamma_0(N))$ cho biểu diễn tự đẳng cấu $\pi_f$ của $\mathrm{GL}_2(\mathbb{A})$. Hàm $L(\pi_f, s) = L(f, s)$. Khi $k = 2$: ứng với EC qua modularity.

3. $n = 2$, dạng Maass: Dạng Maass (trọng số 0, giá trị riêng Laplacian) cũng cho biểu diễn tự đẳng cấu. Không ứng với đa tạp Abel --- nhưng vẫn có hàm $L$ và Langlands reciprocity (phỏng đoán).

Ý nghĩa trực giác

Biểu diễn tự đẳng cấu --- “hàm sóng số học”.
  • Hình dung: Biểu diễn tự đẳng cấu giống “hàm sóng” trên “không gian adelic”. Mỗi “tần số” (thành phần cục bộ $\pi_v$) mã hóa thông tin số học tại vị trí $v$. “Phân tích phổ” (spectral decomposition) cho toàn bộ dạng tự đẳng cấu.
  • Tại sao adèles?: Vành adèles $\mathbb{A}_\mathbb{Q} = \mathbb{R} \times \prod_p \mathbb{Q}_p$ “nhìn” $\mathbb{Q}$ từ mọi góc cục bộ cùng lúc. Dạng tự đẳng cấu “hài hòa” tất cả góc nhìn --- đây là “thông tin toàn cục” tối ưu.

Liên hệ với giả thuyết Birch--Dyer

Biểu diễn tự đẳng cấu trong BSD.
  • $\pi_{f_E}$ = “bản sao tự đẳng cấu” của $E$: Modularity: $E \leftrightarrow f_E \leftrightarrow \pi_{f_E}$. BSD phát biểu bằng $L(\pi_{f_E}, s)$ --- hàm $L$ tự đẳng cấu.
  • Tính chất giải tích: $L(\pi, s)$ có thác triển giải tích + phương trình hàm (đã biết cho $\mathrm{GL}_n$). Đây là lý do “phía giải tích” của BSD “tốt”. “Phía đại số” (Selmer) khó hơn.
  • Skinner--Urban: Chứng minh IMC dùng “biến dạng tự đẳng cấu” (automorphic deformation) trên $\mathrm{GL}_2 \times \mathrm{GL}_2$ --- kỹ thuật thuần túy “automorphic”.
198 Đa tạp Abel (Abelian variety) Ch.3 7

Định nghĩa

Định nghĩa (Đa tạp Abel [milne1986]). Đa tạp Abel (Abelian variety) $A$ chiều $g$ trên trường $K$ là đa tạp đại số xạ ảnh trơn liên thông có cấu trúc nhóm đại số. Tức $A$ đồng thời là:
  1. Đa tạp xạ ảnh trơn chiều $g$,
  2. Nhóm đại số (với phép cộng, nghịch đảo, và phần tử đơn vị là các ánh xạ đại số).

Khi $g = 1$: $A$ = đường cong elliptic (định nghĩa quen thuộc).

Tính chất:

  • Nhóm cộng trên $A$ tự động giao hoán (Abel) --- điều kỳ diệu không hiển nhiên!
  • $A(\mathbb{C}) \cong \mathbb{C}^g / \Lambda$ (torus phức chiều $g$) --- tổng quát hóa $E(\mathbb{C}) \cong \mathbb{C}/\Lambda$.
  • Định lý Mordell--Weil tổng quát: $A(K)$ hữu hạn sinh cho $K$ trường số.
  • Hàm $L$: $L(A, s) = \prod_p L_p(A, s)^{-1}$, bậc $= 2g$.

Ví dụ

Ví dụ (Đa tạp Abel cụ thể). 1. Chiều 1: Mọi đa tạp Abel chiều 1 là đường cong elliptic. $L(E, s)$ bậc 2 (tích Euler cục bộ bậc 2).

2. Chiều 2 --- bề mặt Abel: Jacobian $J(C)$ của đường cong genus 2 (ví dụ $C: y^2 = x^5 + x + 1$) là đa tạp Abel chiều 2. $J(C)(\mathbb{Q})$ hữu hạn sinh, $L(J(C), s)$ bậc 4.

3. Jacobian newform: Cho $f$ newform trọng số 2, level $N$, hệ số trong $K_f$ (trường số bậc $d = [K_f : \mathbb{Q}]$). Đa tạp Abel $A_f = J_0(N) / I_f J_0(N)$ (thương Jacobian) có chiều $g = d$. Khi $d = 1$: $A_f$ = đường cong elliptic (modularity).

4. BSD tổng quát: Cho $A/\mathbb{Q}$ đa tạp Abel chiều $g$:

\[ \mathrm{ord}_{s=1} L(A, s) \stackrel{?}{=} \mathrm{rk}(A(\mathbb{Q})). \]
Đã biết rất ít khi $g > 1$. Kết quả mới: Boxer--Calegari--Gee--Pilloni (2018) chứng minh modularity cho một số bề mặt Abel → mở đường BSD cho $g = 2$.

Ý nghĩa trực giác

Đa tạp Abel --- “đường cong elliptic chiều cao”.
  • Hình dung: Đường cong elliptic = “torus 1 chiều” ($\mathbb{C}/\Lambda$, hình bánh donut). Đa tạp Abel chiều $g$ = “torus $g$ chiều” ($\mathbb{C}^g/\Lambda$). Mọi tính chất “hay” của EC (nhóm, Mordell--Weil, hàm $L$, BSD) tổng quát hóa lên chiều cao.
  • Jacobian: Nguồn chính đa tạp Abel: Jacobian $J(C)$ của đường cong genus $g$. Chiều $J(C) = g$. Khi $g = 1$: $C$ là EC, $J(C) = C$.
  • Khó hơn nhiều: Chiều $> 1$ khó hơn bội: (a) không có “phương trình Weierstrass”, (b) modularity chưa biết tổng quát, (c) Euler system chưa xây dựng.

Liên hệ với giả thuyết Birch--Dyer

Đa tạp Abel trong BSD.
  • BSD tổng quát: $\mathrm{ord}_{s=1} L(A, s) = \mathrm{rk}(A(\mathbb{Q}))$ cho đa tạp Abel $A/\mathbb{Q}$ chiều $g$. Khi $g = 1$: BSD cổ điển. Khi $g > 1$: gần như hoàn toàn mở.
  • $A_f$ (thương Jacobian): Nếu $A = A_f$ đến từ newform $f$, thì $L(A, s) = \prod_\sigma L(f^\sigma, s)$ (tích các conjugates). BSD cho $A_f$ tương đương BSD cho $f$ và tất cả conjugates.
  • Tiến triển gần đây: BSD mạnh cho bề mặt Abel (2024, Loeffler--Zerbes et al.) sử dụng Euler system trên nhóm symplectic $\mathrm{GSp}_4$. Đây là bước tiến lớn nhất ngoài chiều 1.
199 Jacobian (Jacobian (of curve)) Ch.5 6

Định nghĩa

Định nghĩa (Jacobian [milne1986]). Cho $C$ đường cong đại số trơn xạ ảnh genus $g$ trên trường $K$. Jacobian (Jacobian) $J(C)$ là đa tạp Abel chiều $g$ phân loại bó đường thẳng bậc 0 (degree-0 line bundles) trên $C$:
\[ J(C) = \mathrm{Pic}^0(C) = \frac{\text{nhóm chia (divisors) bậc 0}}{\text{chia chính (principal divisors)}}. \]

Cụ thể: Chia bậc 0 là $D = \sum n_i P_i$ với $\sum n_i = 0$. Chia chính là $\mathrm{div}(f) = \sum \mathrm{ord}_P(f) \cdot P$ cho hàm hữu tỉ $f$. Thì:

\[ J(C)(K) = \mathrm{Div}^0(C_{\bar{K}})^{G_K} / \mathrm{Princ}(C_{\bar{K}})^{G_K}. \]

Tính chất:

  1. $J(C)$ là đa tạp Abel chiều $g$ --- trơn, xạ ảnh, liên thông, với nhóm cộng.
  2. $J(C)(\mathbb{C}) \cong \mathbb{C}^g / \Lambda$ (torus phức $g$ chiều) với $\Lambda$ lưới hạng $2g$.
  3. Khi $g = 1$ (EC): $J(C) \cong C$ (Jacobian = chính nó).
  4. Khi $g \geq 2$: $C$ nhúng vào $J(C)$ qua $P \mapsto [P - P_0]$, nhưng $J(C)$ lớn hơn $C$ rất nhiều.

Ví dụ

Ví dụ (Jacobian cụ thể). 1. Genus 1: $C: y^2 = x^3 - x$. $J(C) = C$ (đường cong elliptic). $\dim J = 1$.

2. Genus 2: $C: y^2 = x^5 + x + 1$. Jacobian $J(C)$ là bề mặt Abel (chiều 2). Điểm trên $J(C)(\mathbb{Q})$ là lớp tương đương $[P + Q - 2\infty]$ với $P, Q \in C(\bar{\mathbb{Q}})$, modulo chia chính.

3. Đường cong modular: $J_0(N) = J(X_0(N))$ là Jacobian của đường cong modular $X_0(N)$, chiều $= g(X_0(N)) \sim N/12$. Thương $J_0(N) \to A_f$ (bởi ideal Hecke) cho đa tạp Abel $A_f$ ứng với newform $f$.

4. Đếm điểm: Cho $C: y^2 = x^5 - x$ genus 2, $p = 7$. Số điểm: $\#J(C)(\mathbb{F}_7) = ?$ tính từ đa thức đặc trưng Frobenius bậc 4 (vì $\dim J = 2$).

Ý nghĩa trực giác

Jacobian --- “nhóm Abel hóa đường cong”.
  • Hình dung: Đường cong $C$ genus $g \geq 2$ không phải nhóm (không có phép cộng điểm tự nhiên). Jacobian $J(C)$ “Abel hóa” $C$: biến đường cong thành nhóm Abel. Cái giá: chiều tăng từ 1 lên $g$.
  • “Linearization”: $C$ (phi tuyến) $\to$ $J(C)$ (tuyến tính --- nhóm Abel). Giống biến đổi Fourier: biến đối tượng phức tạp thành đối tượng có cấu trúc đại số tốt hơn.
  • Mọi đa tạp Abel “gần” Jacobian: Định lý Poincaré: mọi đa tạp Abel đơn giản trên trường số xuất hiện (up to isogeny) như thành phần của Jacobian nào đó.

Liên hệ với giả thuyết Birch--Dyer

Jacobian trong BSD.
  • $J_0(N)$ chứa EC modular: Modularity: $E \hookrightarrow J_0(N)$ (tham số hóa modular). Điểm Heegner sống trong $J_0(N)(\mathbb{Q})$ trước khi “chiếu” xuống $E(\mathbb{Q})$.
  • BSD tổng quát: BSD cho Jacobian: $\mathrm{ord}_{s=1} L(J(C), s) = \mathrm{rk}(J(C)(\mathbb{Q}))$. Khi $g = 2$: gần đây có tiến triển (modularity + Euler system cho $\mathrm{GSp}_4$).
  • Hạng Jacobian: $\mathrm{rk}(J(C)(\mathbb{Q}))$ đo “sự phong phú” của điểm hữu tỉ trên $C$. Nếu $\mathrm{rk}(J(C)(\mathbb{Q})) = 0$: $C(\mathbb{Q})$ hữu hạn (Chabauty, đã biết khi $\mathrm{rk} < g$).
200 Đa tạp Shimura (Shimura variety) Ch.9 9

Định nghĩa

Định nghĩa (Đa tạp Shimura [milne2005]). Đa tạp Shimura (Shimura variety) là đa tạp đại số (thường trên trường số) được xây dựng từ dữ liệu $(G, X)$ gồm:
  • $G$: nhóm reductive trên $\mathbb{Q}$,
  • $X$: lớp liên hợp đồng cấu $h: \mathrm{Res}_{\mathbb{C}/\mathbb{R}} \mathbb{G}_m \to G_\mathbb{R}$ (dữ liệu Hodge).

Đa tạp Shimura phức:

\[ \mathrm{Sh}(G, X) = G(\mathbb{Q}) \backslash (X \times G(\mathbb{A}_f)) / K, \]
với $K \subset G(\mathbb{A}_f)$ compact mở (“mức” --- level structure), $\mathbb{A}_f$ = adèles hữu hạn.

Ví dụ quan trọng nhất: $G = \mathrm{GL}_2$, $X = \mathcal{H}^\pm$ (nửa mặt phẳng trên và dưới):

\[ \mathrm{Sh}(\mathrm{GL}_2, \mathcal{H}^\pm)_K = \mathrm{GL}_2(\mathbb{Q}) \backslash (\mathcal{H}^\pm \times \mathrm{GL}_2(\mathbb{A}_f)) / K, \]
đây chính là hợp các đường cong modular (chiều 1). Khi $K = K_0(N)$: $\mathrm{Sh}_K = X_0(N)$.

Ví dụ

Ví dụ (Đa tạp Shimura cụ thể). 1. Đường cong modular: $G = \mathrm{GL}_2$, $K = K_0(N)$ → $X_0(N)$ (chiều 1). Đây là đa tạp Shimura đơn giản nhất.

2. Bề mặt Hilbert modular: $G = \mathrm{Res}_{F/\mathbb{Q}} \mathrm{GL}_2$ cho trường số thực bậc hai $F$ → đa tạp chiều 2. Modularity cho $F$ liên quan đến Hilbert modular forms.

3. Đa tạp Siegel modular: $G = \mathrm{GSp}_{2g}$ (nhóm symplectic) → tham số hóa đa tạp Abel chiều $g$ với cấu trúc phân cực. Chiều $= g(g+1)/2$.

Ý nghĩa trực giác

Đa tạp Shimura --- “không gian moduli số học”.
  • Hình dung: Đa tạp Shimura là “không gian tham số” phân loại đối tượng số học (đường cong elliptic, đa tạp Abel, v.v.) với cấu trúc bổ sung. Mỗi điểm ↔ một đối tượng.
  • “Xương sống” của Langlands: Đa tạp Shimura là nơi “hiện thực hóa” tương ứng Langlands: đối đồng điều $H^*(Sh, \mathcal{L})$ chứa biểu diễn Galois + biểu diễn tự đẳng cấu.

Liên hệ với giả thuyết Birch--Dyer

Đa tạp Shimura trong BSD.
  • Nguồn EC và đa tạp Abel: Mọi EC modular “sống” trên $X_0(N)$ (đa tạp Shimura). Điểm đặc biệt trên Shimura variety (CM points, Heegner points) tạo điểm hữu tỉ trên EC --- then chốt cho Gross--Zagier.
  • BSD chiều cao: BSD cho đa tạp Abel chiều $> 1$ cần modularity trên đa tạp Shimura bậc cao (Siegel, Hilbert). Boxer--Calegari--Gee--Pilloni (2018): modularity cho bề mặt Abel sử dụng đa tạp Shimura chiều 3.
201 Đường cong Shimura (Shimura curve) Ch.6 8

Định nghĩa

Định nghĩa (Đường cong Shimura [darmon2004]). Đường cong Shimura (Shimura curve) $X^B_0(N)$ là đa tạp Shimura chiều 1 gắn với đại số quaternion $B$ trên $\mathbb{Q}$ (chia $B \neq M_2(\mathbb{Q})$):
\[ X^B_0(N) = B^\times(\mathbb{Q}) \backslash (\mathcal{H} \times B^\times(\mathbb{A}_f)) / K^B_0(N). \]

So sánh: đường cong modular $X_0(N)$ ứng với $B = M_2(\mathbb{Q})$ (“split”). Đường cong Shimura ứng với $B$ “non-split” --- đại số quaternion phân nhánh tại tập hữu hạn primes.

Tính chất:

  1. Đường cong Shimura là đường cong đại số trơn trên $\mathbb{Q}$.
  2. Không có cusps (khác với $X_0(N)$): compact tự nhiên.
  3. Jacobian $J(X^B_0(N))$ chứa đa tạp Abel “mới” (Jacquet--Langlands correspondence).
  4. Điểm Heegner trên Shimura curve: tương tự CM points trên $X_0(N)$, nhưng tồn tại cho trường phức bậc hai ảo không thỏa điều kiện Heegner cổ điển.

Ví dụ

Ví dụ (Đường cong Shimura và Jacquet--Langlands). 1. $B$ phân nhánh tại $\{2, \infty\}$: Đại số quaternion trên $\mathbb{Q}$ phân nhánh chính xác tại 2 và $\infty$. Đường cong Shimura $X^B_0(1)$ (level 1) là đường cong genus 0 --- nhưng $X^B_0(N)$ có genus tăng khi $N$ tăng.

2. Jacquet--Langlands: Newform $f$ trên $\Gamma_0(N)$ “chuyển” thành dạng tự đẳng cấu trên $B^\times$ khi $B$ phân nhánh tại các thừa số nguyên tố của $N$. Khi đó EC $E_f$ “sống” trên cả $X_0(N)$ và $X^B_0(N/\mathrm{disc}(B))$.

3. Ứng dụng: Khi điều kiện Heegner không thỏa cho $X_0(N)$ (ví dụ $N$ nguyên tố), ta có thể dùng đường cong Shimura (với $B$ phân nhánh tại $N$) --- nơi điều kiện Heegner “dễ” thỏa hơn.

Ý nghĩa trực giác

Đường cong Shimura --- “anh em” của đường cong modular.
  • Hình dung: Đường cong modular $X_0(N)$ phân loại “cặp $(E, C)$” (EC + nhóm con cyclic). Đường cong Shimura phân loại “đa tạp Abel với nhân bởi đại số quaternion” --- đối tượng “tương tự nhưng xoắn”.
  • Complementary: $X_0(N)$ và $X^B_0(N)$ mang thông tin “bổ sung” --- Jacquet--Langlands nói chúng “nhìn” cùng dạng tự đẳng cấu từ hai góc khác nhau.

Liên hệ với giả thuyết Birch--Dyer

Đường cong Shimura trong BSD.
  • Điểm Heegner mở rộng: Zhang (2001) mở rộng Gross--Zagier cho điểm Heegner trên đường cong Shimura: $L'(E, \chi_K, 1) = c \cdot \hat{h}(P_K^B)$. Mở rộng phạm vi áp dụng BSD (hạng giải tích 1).
  • Darmon: Sử dụng đường cong Shimura cho “$p$-adic Heegner points” --- hướng nghiên cứu mới cho BSD khi điều kiện Heegner cổ điển không thỏa.
202 Điểm Stark–Heegner (Stark–Heegner point) Ch.9 9

Định nghĩa

Định nghĩa (Điểm Stark--Heegner [darmon2004]). Điểm Stark--Heegner (Stark--Heegner point) (còn gọi Darmon point) là điểm trên đường cong elliptic $E(\mathbb{Q}_p)$ (hoặc $E(K)$ cho trường số $K$) được xây dựng bằng phương pháp “$p$-adic” tương tự điểm Heegner, nhưng cho trường số thực bậc hai $K$ (thay vì trường phức bậc hai ảo).

Ý tưởng (Darmon, 2001): Thay tích phân phức $\int_{\tau_1}^{\tau_2} \omega_f$ (xây điểm Heegner cổ điển) bằng tích phân $p$-adic:

\[ P_{\mathrm{SH}} = \int^{p\text{-adic}}_{\gamma} \omega_f \in E(\mathbb{Q}_p), \]
với $\gamma$ “đường đi” liên quan đến trường thực bậc hai $K = \mathbb{Q}(\sqrt{D})$ ($D > 0$).

Phỏng đoán Darmon: $P_{\mathrm{SH}} \in E(K)$ (thực sự là điểm hữu tỉ trên $K$, không chỉ $p$-adic), và $P_{\mathrm{SH}} \neq O$ khi $L'(E/K, 1) \neq 0$.

Ví dụ

Ví dụ (Điểm Stark--Heegner cụ thể). 1. $E: y^2 + y = x^3 + x^2$ (conductor 11), $K = \mathbb{Q}(\sqrt{2})$, $p = 11$: $E$ rút gọn nhân tách tại 11. Darmon xây điểm $P_{\mathrm{SH}} \in E(\mathbb{Q}_{11})$ qua tích phân $p$-adic trên nửa mặt phẳng $p$-adic $\mathcal{H}_p = \mathbb{P}^1(\mathbb{C}_p) \setminus \mathbb{P}^1(\mathbb{Q}_p)$.

Tính toán số: $P_{\mathrm{SH}}$ (modulo $11^{20}$) khớp với điểm hữu tỉ trong $E(\mathbb{Q}(\sqrt{2}))$ --- bằng chứng số mạnh cho phỏng đoán Darmon.

2. So sánh Heegner vs Stark--Heegner:

Heegner Stark--Heegner
Trường $K$ $\mathbb{Q}(\sqrt{D})$, $D < 0$ $\mathbb{Q}(\sqrt{D})$, $D > 0$
Tích phân Phức ($\mathbb{C}$) $p$-adic ($\mathbb{C}_p$)
Trạng thái Đã chứng minh (GZ, Kol) Phỏng đoán (Darmon)

Ý nghĩa trực giác

Stark--Heegner --- “điểm Heegner $p$-adic”.
  • Hình dung: Điểm Heegner cổ điển “sống” trong thế giới phức ($\mathbb{C}$). Điểm Stark--Heegner “sống” trong thế giới $p$-adic ($\mathbb{C}_p$). Cả hai “xây” điểm trên $E$ từ “dữ liệu trường bậc hai”, nhưng bằng “kính” khác nhau.
  • Tại sao khó: Phương pháp Gross--Zagier--Kolyvagin dùng “CM points” (nhúng $K \hookrightarrow M_2(\mathbb{Q})$ cho $K$ ảo). Khi $K$ thực: không có nhúng tự nhiên → phải dùng “$p$-adic trick” (Darmon).
  • Tham vọng: Nếu phỏng đoán Darmon đúng, nó mở đường cho BSD khi hạng giải tích = 1 trên trường thực bậc hai --- lãnh thổ hoàn toàn mới.

Liên hệ với giả thuyết Birch--Dyer

Stark--Heegner trong BSD.
  • BSD cho trường thực: Điểm Heegner chứng minh BSD cho $K$ ảo (hạng $\leq 1$). Điểm Stark--Heegner nhắm đến BSD cho $K$ thực --- hoàn toàn mở với phương pháp hiện tại.
  • Bằng chứng số: Nhiều tính toán (Darmon--Green, Greenberg--Shahabi) xác nhận phỏng đoán Darmon đến độ chính xác $p$-adic rất cao --- nhưng chứng minh lý thuyết vẫn ngoài tầm.
  • Hướng mới: Bertolini--Darmon--Prasanna (2013) xây “$p$-adic Gross--Zagier formula” cho điểm Stark--Heegner. Đây là bước tiến quan trọng nhất hướng tới chứng minh.
203 Phỏng đoán Gan–Gross–Prasad (Arithmetic GGP Conjecture) Ch.9 10

Định nghĩa

Định nghĩa (Phỏng đoán Gan--Gross--Prasad [gan-gross-prasad2012]). Phỏng đoán Gan--Gross--Prasad (Gan--Gross--Prasad (GGP) Conjecture) là tổng quát hóa lớn của công thức Gross--Zagier, liên hệ giá trị đặc biệt hàm $L$ với chu kỳ (periods) trên đa tạp Shimura.

GGP cục bộ (đã chứng minh bởi Waldspurger, Beuzart-Plessis): Cho $\pi$ biểu diễn tự đẳng cấu của $G = \mathrm{SO}(n)$ hoặc $\mathrm{U}(n)$, và $H \subset G$ nhóm con, liên hệ:

\[ \mathrm{Hom}_H(\pi, \mathbb{C}) \neq 0 \iff \varepsilon(\pi, 1/2) = \varepsilon(G/H), \]
(điều kiện epsilon = điều kiện dấu gốc cục bộ).

GGP số học (phỏng đoán): Cho $\pi$ trên $G = \mathrm{U}(n) \times \mathrm{U}(n+1)$ (nhóm đơn nhất):

\[ L'(\pi, 1/2) = c \cdot \langle P, P \rangle_{\mathrm{NT}}, \]
với $P$ “chu kỳ” trên đa tạp Shimura (tổng quát hóa chiều cao Néron--Tate điểm Heegner). Khi $n = 1$: đây chính là Gross--Zagier.

Ví dụ

Ví dụ (GGP và Gross--Zagier). 1. $n = 1$: $G = \mathrm{U}(1) \times \mathrm{U}(2)$. Biểu diễn $\pi$ ứng với newform $f$ (EC). “Chu kỳ” $P$ = điểm Heegner trên $X_0(N)$. GGP trở thành:
\[ L'(E/K, 1) = c \cdot \hat{h}(P_K) \quad \text{(Gross--Zagier)}. \]

2. $n = 2$: $G = \mathrm{U}(2) \times \mathrm{U}(3)$. “Chu kỳ” liên quan cycle trên đa tạp Shimura chiều 3. GGP liên hệ $L'(\pi, 1/2)$ với “chiều cao” cycle --- tổng quát hóa Gross--Zagier cho bề mặt Abel.

3. Tiến triển: W. Zhang (2012) chứng minh GGP số học cho $\mathrm{U}(n) \times \mathrm{U}(n+1)$ trong nhiều trường hợp (“arithmetic fundamental lemma”). Đây là bước tiến lớn nhất trong chương trình GGP.

Ý nghĩa trực giác

GGP --- “Gross--Zagier chiều cao”.
  • Hình dung: Gross--Zagier liên hệ $L'(E, 1)$ với chiều cao điểm trên đường cong (chiều 1). GGP liên hệ $L^{(r)}(\pi, 1/2)$ với “chiều cao” chu kỳ trên đa tạp Shimura (chiều cao hơn). “Cùng công thức, mọi chiều”.
  • Tại sao nhóm đơn nhất?: Nhóm đơn nhất $\mathrm{U}(n)$ “tổng quát tự nhiên” nhóm $\mathrm{GL}_2$ (khi $n = 2$, trên trường phức bậc hai ảo). Cấu trúc Hermitian cho “ghép đôi chiều cao” tự nhiên.

Liên hệ với giả thuyết Birch--Dyer

GGP trong BSD.
  • Gross--Zagier ⊂ GGP: Công thức Gross--Zagier (then chốt cho BSD hạng 1) là trường hợp $n = 1$ của GGP. Chứng minh GGP tổng quát → mở rộng BSD sang chiều cao.
  • BSD cho bề mặt Abel: GGP cho $n = 2$ liên hệ $L'$ của bề mặt Abel với cycle trên Shimura 3-fold. Kết hợp Euler system (Loeffler--Zerbes): BSD cho bề mặt Abel.
  • “Chương trình GGP--BSD”: Chương trình lớn của Wei Zhang và cộng sự: GGP + Euler system $\mathrm{U}(n) \times \mathrm{U}(n+1)$ → BSD cho đa tạp Abel chiều $n$. Hiện mới ở giai đoạn đầu cho $n \geq 2$.
204 Phương trình Diophantus (Diophantine equation) Ch.1 2

Định nghĩa

Định nghĩa (Phương trình Diophantus). Phương trình Diophantus (Diophantine equation) là phương trình đa thức với hệ số nguyên mà ta tìm nghiệm nguyên (hoặc hữu tỉ):
\[ f(x_1, x_2, \ldots, x_n) = 0, \quad f \in \mathbb{Z}[x_1, \ldots, x_n], \quad x_i \in \mathbb{Z} \text{ (hoặc } \mathbb{Q}\text{)}. \]

Đặt theo Diophantus xứ Alexandria (thế kỷ 3 SCN), tác giả Arithmetica --- 13 cuốn sách về phương trình số nguyên.

Phân loại theo bậc và số biến:

  • Bậc 1: $ax + by = c$ --- Bézout, giải hoàn toàn bởi thuật toán Euclid.
  • Bậc 2: $ax^2 + bxy + cy^2 + \cdots = 0$ --- Lý thuyết dạng bậc hai (Gauss, Hasse--Minkowski). Nguyên lý Hasse đúng.
  • Bậc 3: Đường cong elliptic $y^2 = x^3 + ax + b$. Nguyên lý Hasse sai ($\mathrm{Sha} \neq 0$). Đây là đối tượng của BSD.
  • Bậc $\geq 4$: Hệ quả Faltings (1983, tên cũ: Mordell conjecture): đường cong genus $\geq 2$ có hữu hạn điểm hữu tỉ.

Ví dụ

Ví dụ (Phương trình Diophantus nổi tiếng). 1. Pythagoras: $x^2 + y^2 = z^2$. Nghiệm nguyên: $(3, 4, 5), (5, 12, 13), \ldots$ Công thức tổng quát: $(m^2 - n^2, 2mn, m^2 + n^2)$.

2. Fermat: $x^n + y^n = z^n$ cho $n \geq 3$. Không có nghiệm nguyên dương (Wiles, 1995 --- qua modularity + EC Frey).

3. Số đồng dư: “$n$ là số đồng dư?” ↔ “$y^2 = x^3 - n^2x$ có điểm hữu tỉ bậc vô hạn?” ↔ “$L(E_n, 1) = 0$?” (BSD!). Tunnell (1983): thuật toán (giả sử BSD) kiểm tra $n$ đồng dư.

4. Đường cong genus 1 không Weierstrass: $3x^3 + 4y^3 + 5z^3 = 0$ (genus 1, bậc 3, 3 biến). Có nghiệm cục bộ mọi nơi nhưng không có nghiệm hữu tỉ → phần tử $\mathrm{Sha}[3]$ của Jacobian → trực tiếp liên quan BSD.

Ý nghĩa trực giác

Phương trình Diophantus --- “bài toán cổ nhất, sâu nhất”.
  • Hình dung: “Cho phương trình đa thức, tìm nghiệm nguyên” --- câu hỏi đơn giản nhất mà đứa trẻ nào cũng hiểu. Nhưng câu trả lời có thể đòi hỏi toàn bộ toán học hiện đại (modularity, Galois cohomology, Euler system, Iwasawa theory).
  • Hilbert 10: “Có thuật toán tổng quát giải mọi phương trình Diophantus không?” --- Câu trả lời: Không (Matiyasevich, 1970, giải bài toán thứ 10 Hilbert). Nhưng cho từng lớp cụ thể (bậc 2, bậc 3 genus 1), ta có thể nói nhiều hơn --- và BSD là “câu trả lời” cho lớp bậc 3 genus 1.
  • BSD = “Oracle”: Nếu BSD đúng, ta có “oracle” cho phương trình Diophantus genus 1: tính $L(E, 1)$ → biết hạng → biết “có vô hạn nghiệm hay không”. Thậm chí BSD mạnh cho $|\mathrm{Sha}|$ → biết chính xác “bao nhiêu chướng ngại cục bộ--toàn cục”.

Liên hệ với giả thuyết Birch--Dyer

Phương trình Diophantus và BSD.
  • BSD = “giải” phương trình bậc 3: Với mỗi đường cong elliptic $E: y^2 = x^3 + ax + b$, BSD nói: hạng (“bao nhiêu” nghiệm hữu tỉ độc lập) = bậc triệt tiêu $L(E, s)$ tại $s = 1$.
  • Ứng dụng: Số đồng dư (Tunnell), phương trình Fermat (Wiles), đường cong genus 1 (Sha), mật mã (ECC) --- tất cả kết nối với lý thuyết đường cong elliptic và BSD.
  • Giải thưởng Clay: BSD là một trong 7 bài toán thiên niên kỷ ($1 triệu USD). Nếu chứng minh, nó sẽ cho công cụ mạnh nhất trong lịch sử để hiểu nghiệm Diophantine.
205 Bộ ba Pythagoras (Pythagorean triple) Ch.1 1

Định nghĩa

Định nghĩa (Bộ ba Pythagoras). Bộ ba Pythagoras (Pythagorean triple) là bộ ba số nguyên dương $(a, b, c)$ thỏa mãn:
\[ a^2 + b^2 = c^2. \]
Bộ ba gọi là nguyên thủy (primitive) nếu $\gcd(a, b, c) = 1$.

Công thức tổng quát (đã biết từ thời Euclid): Mọi bộ ba Pythagoras nguyên thủy có dạng

\[ (a, b, c) = (m^2 - n^2, \; 2mn, \; m^2 + n^2) \]
với $m > n > 0$, $\gcd(m, n) = 1$, $m \not\equiv n \pmod{2}$ (một chẵn một lẻ).

Diễn giải hình học: Các bộ ba Pythagoras nguyên thủy tương ứng một--một với các điểm hữu tỉ trên đường tròn đơn vị $X^2 + Y^2 = 1$: nếu $a^2 + b^2 = c^2$ thì $(a/c, b/c)$ là điểm hữu tỉ trên đường tròn, và ngược lại.

Ví dụ

Ví dụ (Các bộ ba Pythagoras).
  1. Nhỏ nhất: $(3, 4, 5)$ --- $9 + 16 = 25$. Đây là bộ ba cổ điển nhất, đã biết từ thời Babylon (khoảng 1800 TCN, bảng đất sét Plimpton 322).
  2. Vài bộ ba nguyên thủy khác:
    • $(5, 12, 13)$: $m = 3, n = 2$ cho $9 - 4 = 5$, $12$, $9 + 4 = 13$.
    • $(8, 15, 17)$: $m = 4, n = 1$ cho $15$, $8$, $17$.
    • $(7, 24, 25)$: $m = 4, n = 3$ cho $7$, $24$, $25$.
  3. Có vô hạn bộ ba: Chọn $m = k + 1, n = k$ cho mọi $k \geq 1$ luôn được bộ ba nguyên thủy: $(3,4,5), (5,12,13), (7,24,25), (9,40,41), \ldots$
  4. Điểm hữu tỉ trên đường tròn: Kẻ đường thẳng qua $(-1, 0)$ với hệ số góc $t \in \mathbb{Q}$, giao với $X^2 + Y^2 = 1$ tại
    \[ \left(\frac{1 - t^2}{1 + t^2}, \; \frac{2t}{1 + t^2}\right). \]
    Với $t = 1/2$: $\left(\frac{3}{5}, \frac{4}{5}\right) \leftrightarrow (3,4,5)$. Với $t = 2/3$: $\left(\frac{5}{13}, \frac{12}{13}\right) \leftrightarrow (5,12,13)$.

Ý nghĩa trực giác

Bộ ba Pythagoras --- “cửa ngõ” vào phương trình Diophantus.
  • Hình dung: Bài toán Pythagoras là phương trình Diophantus “dễ nhất” --- bậc 2, trên đường tròn (genus 0). Ta giải được hoàn toàn: có vô hạn nghiệm và biết công thức tham số cho tất cả.
  • So sánh: $x^n + y^n = z^n$ cho $n \geq 3$ --- cùng dạng nhưng không có nghiệm nguyên dương (Wiles, 1995). Bậc 2 cho đường conic (genus 0) → vô hạn nghiệm; bậc $\geq 3$ → genus cao → hữu hạn hoặc không nghiệm.
  • Phương pháp tham số hóa: “Kẻ đường thẳng qua một điểm” trên đường conic cho mọi điểm hữu tỉ. Với đường cong elliptic (genus 1), ta không thể tham số hóa --- và đó là lý do BSD cần thiết.

Liên hệ với giả thuyết Birch--Dyer

Bộ ba Pythagoras và BSD.
  • Genus 0 vs genus 1: Bộ ba Pythagoras sống trên đường cong bậc 2 (genus 0) --- ta hiểu hoàn toàn. Đường cong elliptic (genus 1) phức tạp hơn vô cùng, và BSD là “câu trả lời” cho chúng.
  • Pythagoras $\to$ số đồng dư: “Tam giác vuông cạnh nguyên” $\to$ “tam giác vuông cạnh hữu tỉ có diện tích $n$” $\to$ bài toán số đồng dư $\to$ đường cong $E_n: y^2 = x^3 - n^2 x$ $\to$ BSD.
  • Bài học: Đã giải $a^2 + b^2 = c^2$ từ 4000 năm trước, nhưng $y^2 = x^3 + ax + b$ (chỉ thêm bậc 1!) vẫn chưa giải hoàn toàn --- minh chứng cho chiều sâu phi thường của BSD.
206 Số đồng dư (Congruent number) Ch.3 3

Định nghĩa

Định nghĩa (Số đồng dư). Số đồng dư (congruent number) là số nguyên dương $n$ bằng diện tích của một tam giác vuông có ba cạnh đều là số hữu tỉ. Tương đương:
\[ n \text{ đồng dư} \iff \exists\, a, b, c \in \mathbb{Q}_{>0} :\; a^2 + b^2 = c^2 \;\text{và}\; \frac{ab}{2} = n. \]

Liên hệ với đường cong elliptic [tunnell1983]: $n$ là số đồng dư khi và chỉ khi đường cong elliptic

\[ E_n : y^2 = x^3 - n^2 x \]
có một điểm hữu tỉ $(x, y)$ với $y \neq 0$, tức là $\mathrm{rk}(E_n(\mathbb{Q})) \geq 1$.

Phép biến đổi: Nếu tam giác vuông cạnh hữu tỉ $(a, b, c)$ có diện tích $n$, đặt

\[ x = \left(\frac{c}{2}\right)^2, \quad y = \frac{c(a^2 - b^2)}{8}. \]
Thì $(x, y) \in E_n(\mathbb{Q})$ với $y \neq 0$. Ngược lại, từ điểm trên $E_n$ ta khôi phục được tam giác.

Ví dụ

Ví dụ (Các số đồng dư và không đồng dư).
  1. $n = 6$: Tam giác $(3, 4, 5)$ có diện tích $6$. Điểm trên $E_6: y^2 = x^3 - 36x$:
    \[ x = (5/2)^2 = 25/4, \quad y = 5(9 - 16)/8 = -35/8. \]
    Kiểm tra: $(25/4)^3 - 36 \cdot 25/4 = 15625/64 - 14400/64 = 1225/64 = (35/8)^2$. \checkmark
  2. $n = 5$: Tam giác $\left(\frac{3}{2}, \frac{20}{3}, \frac{41}{6}\right)$ có diện tích $\frac{3/2 \times 20/3}{2} = 5$. Ba cạnh đều hữu tỉ nhưng không nguyên!
  3. $n = 1$ không đồng dư: Fermat chứng minh (bằng descent vô hạn) rằng không tồn tại tam giác vuông cạnh hữu tỉ có diện tích $1$. Tương đương: $E_1: y^2 = x^3 - x$ có $\mathrm{rk} = 0$, chỉ có 4 điểm xoắn.
  4. Danh sách: Số đồng dư (squarefree) đầu tiên: $5, 6, 7, 13, 14, 15, 20, 21, 22, 23, 24, 28, 29, 30, \ldots$ Số không đồng dư: $1, 2, 3, 10, 11, 17, 19, 26, \ldots$

Ý nghĩa trực giác

Số đồng dư --- “bài toán 1000 năm tuổi”.
  • Hình dung: “Số nào là diện tích tam giác vuông cạnh hữu tỉ?” --- câu hỏi đơn giản mà ai cũng hiểu. Nhưng trả lời đầy đủ cho mọi $n$ đòi hỏi BSD!
  • Lịch sử: Xuất hiện trong toán học Arab thế kỷ 10 (al-Khazin) và Fibonacci (1225, Liber Quadratorum). Fermat chứng minh $1, 2, 3$ không đồng dư. Đến thế kỷ 20, nhờ lý thuyết đường cong elliptic, ta mới hiểu cấu trúc tổng quát.
  • Phép biến đổi kỳ diệu: “Tam giác vuông cạnh hữu tỉ” $\leftrightarrow$ “Điểm hữu tỉ trên đường cong elliptic” --- hai bài toán trông hoàn toàn khác nhau nhưng tương đương toán học.

Liên hệ với giả thuyết Birch--Dyer

Số đồng dư và BSD.
  • BSD quyết định: $n$ đồng dư $\iff \mathrm{rk}(E_n(\mathbb{Q})) \geq 1 \iff L(E_n, 1) = 0$ (theo BSD yếu). Vì $E_n$ có CM bởi $\mathbb{Z}[i]$, Coates--Wiles [coates-wiles1977] cho: $L(E_n, 1) \neq 0 \Rightarrow \mathrm{rk} = 0$.
  • Tunnell + BSD: Tunnell (1983) đưa ra tiêu chuẩn đếm biểu diễn bởi dạng bậc hai để kiểm tra. Một chiều luôn đúng; chiều ngược đúng nếu BSD đúng.
  • Kết quả thống kê: Bhargava--Shankar--Zhang cho thấy $\geq 66.48\%$ đường cong elliptic có hạng $\leq 1$ → phần lớn $n$ squarefree được Tunnell phân loại chính xác ngay cả khi chưa chứng minh BSD.
207 Định lý Tunnell (Tunnell's Theorem) Ch.3 6

Định nghĩa

Định lý (Tunnell, 1983 [tunnell1983]). Cho $n$ nguyên dương squarefree. Đặt
\[\begin{aligned} f(n) &= \#\{(x, y, z) \in \mathbb{Z}^3 : 2x^2 + y^2 + 32z^2 = n\}, \\ g(n) &= \#\{(x, y, z) \in \mathbb{Z}^3 : 2x^2 + y^2 + 8z^2 = n\}. \end{aligned}\]
Nếu $n$ lẻ:
  • $n$ đồng dư $\Rightarrow f(n) = \frac{1}{2}\, g(n)$.
  • Nếu BSD đúng cho $E_n$: $f(n) = \frac{1}{2}\, g(n) \Rightarrow n$ đồng dư.
Nếu $n$ chẵn, thay $n$ bởi $n/2$:
\[\begin{aligned} f'(n/2) &= \#\{(x, y, z) \in \mathbb{Z}^3 : 4x^2 + y^2 + 32z^2 = n/2\}, \\ g'(n/2) &= \#\{(x, y, z) \in \mathbb{Z}^3 : 4x^2 + y^2 + 8z^2 = n/2\}, \end{aligned}\]
với tiêu chuẩn tương tự $f' = \frac{1}{2}\, g'$.

Ý tưởng chứng minh

Sơ lược ý tưởng Tunnell. Tunnell kết hợp ba thành phần:
  1. Công thức Waldspurger: Liên hệ $L(E_n, 1)$ với bình phương hệ số Fourier $c(n)$ của dạng modular nửa nguyên (half-integral weight $3/2$):
    \[ L(E_n, 1) = \kappa \cdot |c(n)|^2 \cdot \frac{\sqrt{n}}{n} \]
    với $\kappa > 0$ là hằng số. Do đó $L(E_n, 1) = 0 \iff c(n) = 0$.
  2. Đếm biểu diễn: Hệ số $c(n)$ liên hệ với hiệu $f(n) - \frac{1}{2} g(n)$ qua chuỗi theta (theta series) của dạng bậc hai ternary $2x^2 + y^2 + 32z^2$ và $2x^2 + y^2 + 8z^2$.
  3. Coates--Wiles: Vì $E_n: y^2 = x^3 - n^2 x$ có CM bởi $\mathbb{Z}[i]$, ta biết $L(E_n, 1) \neq 0 \Rightarrow \mathrm{rk}(E_n(\mathbb{Q})) = 0$ [coates-wiles1977]. Chiều ngược ($L = 0 \Rightarrow \mathrm{rk} \geq 1$) chính là BSD.

Ví dụ

Ví dụ (Kiểm tra Tunnell cho các số nhỏ).
  1. $n = 1$ (lẻ): $g(1) = \#\{2x^2 + y^2 + 8z^2 = 1\} = 2$ (chỉ $x = z = 0, y = \pm 1$). $f(1) = \#\{2x^2 + y^2 + 32z^2 = 1\} = 2$ (cùng nghiệm). Kiểm tra: $f(1) = 2 \neq 1 = g(1)/2$, nên $1$ không đồng dư. \checkmark
  2. $n = 5$ (lẻ): $g(5) = 0$ (không có $(x,y,z) \in \mathbb{Z}^3$ thỏa $2x^2 + y^2 + 8z^2 = 5$). $f(5) = 0$. Kiểm tra: $0 = 0/2$ $\checkmark$, nên $5$ đồng dư (giả sử BSD). Thực tế: tam giác $(\frac{3}{2}, \frac{20}{3}, \frac{41}{6})$ có diện tích $5$. \checkmark
  3. $n = 3$ (lẻ): $g(3) = 4$ (nghiệm $(\pm 1, \pm 1, 0)$). $f(3) = 4$ (cùng nghiệm). Kiểm tra: $4 \neq 2 = 4/2$, nên $3$ không đồng dư. \checkmark
  4. Tốc độ: Đếm $f(n), g(n)$ chỉ cần duyệt $(x, y, z)$ với $|x|, |y|, |z| \leq \sqrt{n}$ --- thời gian $O(n^{3/2})$, rất nhanh trên máy tính. Đã kiểm tra cho mọi $n \leq 10^{12}$.

Ý nghĩa trực giác

Định lý Tunnell --- “máy dò số đồng dư”.
  • Hình dung: Tunnell biến bài toán “tìm tam giác vuông cạnh hữu tỉ” (rất khó) thành bài toán “đếm nghiệm phương trình bậc hai” (rất dễ). Như có “máy dò” --- nhập $n$, đếm hai con số $f(n)$ và $g(n)$, so sánh là biết ngay!
  • Chuỗi kết nối: Số đồng dư $\to$ đường cong elliptic $E_n$ $\to$ hàm $L(E_n, s)$ $\to$ dạng modular trọng số $3/2$ (Waldspurger) $\to$ chuỗi theta $\to$ đếm biểu diễn bậc hai.
  • Điều kiện BSD: Một chiều (không đồng dư $\Rightarrow$ điều kiện vi phạm) là vô điều kiện. Chiều ngược phụ thuộc BSD --- đây là ví dụ cụ thể nhất về “nếu BSD đúng thì ta giải được bài toán cổ điển”.

Liên hệ với giả thuyết Birch--Dyer

Định lý Tunnell và BSD.
  • Ứng dụng trực tiếp nhất: Tunnell là minh họa “nếu BSD đúng thì sao?” rõ ràng nhất --- ta sẽ có thuật toán $O(n^{3/2})$ phân loại mọi số đồng dư.
  • Waldspurger + BSD: Công thức Waldspurger liên hệ $L(E, 1)$ với hệ số Fourier dạng modular nửa nguyên. Kết hợp BSD yếu ($L = 0 \iff \mathrm{rk} \geq 1$), ta “dịch” bài toán hạng thành bài toán đếm.
  • Tình trạng: Với $\mathrm{rk} = 0$ (Coates--Wiles) và $\mathrm{rk} = 1$ (Gross--Zagier + Kolyvagin), phần lớn trường hợp đã được giải. Phần còn lại ($\mathrm{rk} \geq 2$) cần BSD đầy đủ.
208 Bài toán logarit rời rạc trên EC (ECDLP) Ch.2 4

Định nghĩa

Định nghĩa (Bài toán logarit rời rạc trên đường cong elliptic --- ECDLP). Bài toán logarit rời rạc trên đường cong elliptic (Elliptic Curve Discrete Logarithm Problem, ECDLP) phát biểu như sau:

Cho đường cong elliptic $E$ trên trường hữu hạn $\mathbb{F}_p$ (với $p$ nguyên tố lớn), cho hai điểm $P, Q \in E(\mathbb{F}_p)$ với $Q = [k]P$ (tức $Q = \underbrace{P + P + \cdots + P}_{k \text{ lần}}$). Tìm số nguyên $k$.

Tính chất:

  • Chiều thuận dễ: Cho $P$ và $k$, tính $Q = [k]P$ bằng thuật toán double-and-add trong $O(\log k)$ phép cộng điểm (nhanh).
  • Chiều ngược khó: Cho $P$ và $Q$, tìm $k$ --- không có thuật toán cổ điển hiệu quả. Thuật toán tốt nhất (Pollard's rho) có độ phức tạp $O(\sqrt{p})$, cần $\sim 2^{128}$ phép toán với $p \sim 2^{256}$.
  • So sánh: Bài toán logarit rời rạc “thông thường” trên $\mathbb{F}_p^*$ (cho $g^k \equiv h \pmod{p}$, tìm $k$) có thuật toán index calculus thời gian dưới hàm mũ $L_p[1/3]$. ECDLP không có thuật toán dưới hàm mũ tổng quát --- đây là lợi thế chính.

Ví dụ

Ví dụ (ECDLP trên đường cong nhỏ). Xét $E: y^2 = x^3 + 2x + 3$ trên $\mathbb{F}_5$ (5 phần tử).
  1. Các điểm: liệt kê $(x, y)$ thỏa $y^2 \equiv x^3 + 2x + 3 \pmod{5}$:
    • $x = 0$: $y^2 \equiv 3 \pmod{5}$ --- $3$ không là thặng dư bậc hai mod $5$ → không có điểm.
    • $x = 1$: $y^2 \equiv 6 \equiv 1 \pmod{5}$ → $y = 1, 4$. Điểm: $(1, 1), (1, 4)$.
    • $x = 2$: $y^2 \equiv 15 \equiv 0 \pmod{5}$ → $y = 0$. Điểm: $(2, 0)$.
    • Tổng cộng: $E(\mathbb{F}_5) = \{\mathcal{O}, (1, 1), (1, 4), (2, 0)\}$, có $4$ phần tử.
  2. Nếu $P = (1, 1)$: tính $[2]P, [3]P$ bằng luật cộng → liệt kê bảng. ECDLP trên nhóm nhỏ ($4$ phần tử) thì dễ --- chỉ thử tối đa 4 lần. Nhưng với $p \sim 2^{256}$, nhóm có $\sim 2^{256}$ phần tử → không thể thử hết.
  3. Thực tế: Curve25519 (dùng trong Signal, TLS) có $p = 2^{255} - 19$, nhóm cỡ $\sim 2^{252}$. ECDLP cần $\sim 2^{126}$ phép toán --- vượt xa khả năng mọi siêu máy tính.

Ý nghĩa trực giác

ECDLP --- “hàm một chiều” từ hình học.
  • Hình dung: Nhân vô hướng $[k]P$ giống “nhảy $k$ bước trên đường cong”. Cho biết điểm đến $Q$, hỏi “nhảy bao nhiêu bước?” --- rất khó vì luật cộng trên EC “trộn” tọa độ phức tạp, không có cấu trúc để “quay ngược”.
  • So với RSA: RSA dựa trên “nhân dễ, phân tích khó” ($n = pq$ → tìm $p, q$). ECC dựa trên “cộng điểm dễ, logarit rời rạc khó”. ECC cần khóa ngắn hơn nhiều: 256-bit ECC $\approx$ 3072-bit RSA về độ bảo mật.
  • Tại sao EC đặc biệt? Nhóm $E(\mathbb{F}_p)$ có cấu trúc “phong phú nhưng không quá có quy luật” --- đủ cấu trúc để tính toán hiệu quả, nhưng không đủ để giải ECDLP nhanh. Đây là “điểm ngọt” giữa cấu trúc và hỗn loạn.

Liên hệ với giả thuyết Birch--Dyer

ECDLP và BSD.
  • Cùng đối tượng, khác trường: ECDLP nghiên cứu $E(\mathbb{F}_p)$ (trường hữu hạn --- mật mã), BSD nghiên cứu $E(\mathbb{Q})$ (trường hữu tỉ --- số học). Cấu trúc nhóm $E(\mathbb{F}_p)$ ảnh hưởng cả hai: $a_p = p + 1 - \#E(\mathbb{F}_p)$ vừa xuất hiện trong hàm $L$ (BSD) vừa quyết định bậc nhóm (mật mã).
  • Frobenius: Tự đồng cấu Frobenius $\phi_p$ quyết định $\#E(\mathbb{F}_p) = p + 1 - a_p$, với $a_p$ là vết Frobenius. Cùng $a_p$ này xây dựng tích Euler của $L(E, s)$.
  • Ứng dụng gián tiếp: Hiểu sâu $E(\mathbb{Q})$ qua BSD có thể dẫn đến hiểu tốt hơn cấu trúc $E(\mathbb{F}_p)$ --- và ngược lại, dữ liệu từ ECDLP/mật mã giúp kiểm nghiệm BSD.
209 Mật mã đường cong elliptic (Elliptic Curve Cryptography (ECC)) Ch.1 4

Định nghĩa

Định nghĩa (Mật mã đường cong elliptic --- ECC). Mật mã đường cong elliptic (Elliptic Curve Cryptography, ECC) là hệ thống mật mã khóa công khai dựa trên độ khó của ECDLP [silverman2009].

Thiết lập: Chọn đường cong $E$ trên $\mathbb{F}_p$ và điểm sinh $G \in E(\mathbb{F}_p)$ có bậc lớn $n$.

Trao đổi khóa Diffie--Hellman trên EC (ECDH):

  1. Alice chọn $a$ ngẫu nhiên, gửi $A = [a]G$ cho Bob.
  2. Bob chọn $b$ ngẫu nhiên, gửi $B = [b]G$ cho Alice.
  3. Khóa chung: Alice tính $[a]B = [ab]G$, Bob tính $[b]A = [ab]G$. Cùng kết quả!
  4. Kẻ nghe lén biết $A, B, G$ nhưng không biết $a, b$ (vì ECDLP khó).

Chữ ký số ECDSA (dùng trong Bitcoin, TLS): Dùng khóa bí mật $d$, khóa công khai $Q = [d]G$. Ký bằng $d$, xác minh bằng $Q$ --- an toàn vì ECDLP ngăn tìm $d$ từ $Q$.

Các đường cong tiêu chuẩn:

  • NIST P-256: $y^2 = x^3 - 3x + b$ trên $\mathbb{F}_p$ với $p = 2^{256} - 2^{224} + 2^{192} + 2^{96} - 1$.
  • Curve25519: $y^2 = x^3 + 486662x^2 + x$ trên $\mathbb{F}_p$ với $p = 2^{255} - 19$ (Bernstein, 2006).
  • secp256k1: $y^2 = x^3 + 7$ trên $\mathbb{F}_p$ (dùng trong Bitcoin).

Ví dụ

Ví dụ (ECC minh họa đơn giản).
  1. ECDH nhỏ: $E: y^2 = x^3 + x + 6$ trên $\mathbb{F}_{11}$, $G = (2, 7)$ có bậc $7$.
    • Alice: $a = 3$, $A = [3]G = (7, 2)$.
    • Bob: $b = 5$, $B = [5]G = (8, 3)$.
    • Khóa chung: $[3]B = [5]A = [15]G = [15 \bmod 7]G = [1]G = (2, 7)$.
  2. Lợi thế kích thước khóa: {lcc} Độ bảo mật & RSA (bit) & ECC (bit) \\ \hline 128 bit & 3072 & 256 \\ 192 bit & 7680 & 384 \\ 256 bit & 15360 & 512 ECC cần khóa ngắn hơn $\sim 12$ lần, tiết kiệm băng thông và tính toán.
  3. Ứng dụng: TLS/HTTPS (hầu hết trình duyệt), Bitcoin và Ethereum (secp256k1), Signal/WhatsApp (Curve25519), hộ chiếu điện tử, thẻ thông minh.

Ý nghĩa trực giác

ECC --- “mật mã từ hình học”.
  • Hình dung: Đường cong elliptic giống “bàn bi-da cong” --- cộng hai điểm bằng “bắn bi” (kẻ đường thẳng, lấy giao điểm thứ ba, đối xứng). Nhân vô hướng = bắn $k$ lần. Biết viên bi cuối cùng ở đâu, hỏi “bắn bao nhiêu lần?” --- gần như không thể trả lời.
  • Tại sao ECC thay RSA? RSA yếu dần vì thuật toán phân tích số (NFS) ngày càng nhanh. ECDLP không có thuật toán dưới hàm mũ tổng quát → an toàn hơn với khóa ngắn hơn nhiều → nhanh hơn, tiết kiệm hơn.
  • Mối đe dọa lượng tử: Thuật toán Shor (máy tính lượng tử) phá được cả RSA và ECDLP. Nhưng trước khi có máy tính lượng tử đủ mạnh, ECC vẫn là lựa chọn tốt nhất cho mật mã khóa công khai.

Liên hệ với giả thuyết Birch--Dyer

ECC và BSD.
  • Cùng toán học: ECC sử dụng $E(\mathbb{F}_p)$, BSD nghiên cứu $E(\mathbb{Q})$ --- cùng lý thuyết đường cong elliptic. Các khái niệm (luật nhóm, Frobenius, conductor) xuất hiện trong cả hai.
  • Lý thuyết nuôi ứng dụng: Nghiên cứu thuần túy về EC (Mordell--Weil, Hasse bound, modularity) tạo nền tảng cho ứng dụng mật mã. Ngược lại, nhu cầu mật mã thúc đẩy nghiên cứu cấu trúc $E(\mathbb{F}_p)$.
  • Đường cong CM: Đường cong có nhân phức (CM) đặc biệt quan trọng cả trong BSD (Coates--Wiles, đơn vị elliptic) và mật mã (dễ tạo đường cong có bậc nhóm mong muốn). secp256k1 ($y^2 = x^3 + 7$) không có CM; NIST P-256 cũng không; nhưng đường cong CM có vai trò lý thuyết quan trọng.
210 Phương pháp phân tích thừa số Lenstra (Lenstra's ECM) Ch.2 5

Định nghĩa

Định nghĩa (Phương pháp phân tích thừa số bằng đường cong elliptic --- ECM). Phương pháp ECM (Elliptic Curve Method, ECM) là thuật toán phân tích thừa số do Lenstra (1987) đề xuất [lenstra1987].

Ý tưởng: Cho $N = pq$ cần phân tích. Chọn ngẫu nhiên đường cong elliptic $E$ modulo $N$ và điểm $P \in E(\mathbb{Z}/N\mathbb{Z})$. Tính $[B!]P$ cho $B$ đủ lớn. Nếu “vô tình” bậc của $P$ trong $E(\mathbb{F}_p)$ chia hết $B!$ nhưng bậc trong $E(\mathbb{F}_q)$ không, thì phép tính sẽ gặp “phép chia cho $0$ modulo $p$” --- tức ta tìm được $\gcd$ không tầm thường, phân tích được $N$.

Thuật toán ECM (phiên bản đơn giản):

  1. Chọn ngẫu nhiên $a, x_0, y_0$; đặt $b = y_0^2 - x_0^3 - ax_0 \pmod{N}$.
  2. Đường cong $E: y^2 = x^3 + ax + b \pmod{N}$, điểm $P = (x_0, y_0)$.
  3. Tính $Q = [B!]P$ trên $E(\mathbb{Z}/N\mathbb{Z})$ bằng double-and-add.
  4. Nếu tại bước nào cần nghịch đảo $d \pmod{N}$ mà $1 < \gcd(d, N) < N$: tìm được thừa số!
  5. Nếu không: chọn $E$ khác, thử lại.

Độ phức tạp: $O\!\left(\exp\!\left(c\sqrt{\ln p \cdot \ln \ln p}\right)\right)$ với $p$ là thừa số nhỏ nhất --- phụ thuộc vào $p$, không phụ thuộc vào $N$. Đây là lợi thế quyết định so với NFS (phụ thuộc $N$).

Ví dụ

Ví dụ (ECM minh họa).
  1. Phân tích $N = 5959$: Chọn $E: y^2 = x^3 + 5x + 8 \pmod{5959}$, $P = (1, 4)$.
    • Tính $[2]P$: cần nghịch đảo $2y = 8$ mod $5959$. $\gcd(8, 5959) = 1$, OK → $[2]P$ tính được.
    • Tính $[3!]P = [6]P$: giả sử tại bước nào đó cần nghịch đảo $d$ mod $5959$ mà $\gcd(d, 5959) = 59$. → Tìm được: $5959 = 59 \times 101$.
  2. Kỷ lục: ECM đã tìm thừa số 83 chữ số (274 bit) của số $7^{337} + 1$ (2013). Với thừa số $\leq 60$ chữ số, ECM là phương pháp nhanh nhất.
  3. So sánh:
    • Trial division: $O(\sqrt{N})$ --- chỉ khả thi cho $N$ nhỏ.
    • Pollard $p-1$: Dùng $\mathbb{F}_p^*$ thay vì $E(\mathbb{F}_p)$. Chỉ hiệu quả nếu $p - 1$ smooth.
    • ECM: Dùng $\#E(\mathbb{F}_p) \approx p + 1 - a_p$ --- bậc nhóm thay đổi khi đổi $E$! Nếu $\#E(\mathbb{F}_p)$ “vô tình” smooth → thành công. Đổi $E$ cho cơ hội mới.
    • NFS: $O(\exp(c \cdot (\ln N)^{1/3}(\ln \ln N)^{2/3}))$ --- nhanh hơn cho $N$ rất lớn, nhưng phụ thuộc $N$ chứ không $p$.

Ý nghĩa trực giác

ECM --- “đổi đường cong để may mắn”.
  • Hình dung: ECM giống “thử chìa khóa”. Mỗi đường cong $E$ là một “chiếc chìa”. Bậc nhóm $\#E(\mathbb{F}_p) \approx p \pm 2\sqrt{p}$ (Hasse) thay đổi theo $E$. Nếu bậc “smooth” (chia hết bởi các số nguyên tố nhỏ), thì chiếc chìa đó mở được cửa. Ta thử nhiều chìa cho đến khi tìm được chiếc đúng.
  • Tại sao EC đặc biệt? Pollard $p-1$ cố định nhóm $\mathbb{F}_p^*$ (bậc $p - 1$). ECM cho phép thay đổi nhóm bằng cách đổi $E$ --- mỗi lần thử là một nhóm khác, tăng xác suất “trúng”.
  • Định lý Hasse: $\#E(\mathbb{F}_p) \in [p + 1 - 2\sqrt{p}, \; p + 1 + 2\sqrt{p}]$. Khoảng $4\sqrt{p}$ giá trị khả dĩ → đủ đa dạng để “mò” bậc smooth.

Liên hệ với giả thuyết Birch--Dyer

ECM và BSD.
  • Cùng lý thuyết: ECM dùng đường cong elliptic trên $\mathbb{F}_p$ + cấu trúc nhóm + Hasse bound. BSD dùng cùng đối tượng nhưng nghiên cứu $E(\mathbb{Q})$ và hàm $L$.
  • Frobenius và $a_p$: Bậc $\#E(\mathbb{F}_p) = p + 1 - a_p$ vừa quyết định hiệu quả ECM (cần $\#E(\mathbb{F}_p)$ smooth) vừa xây dựng hàm $L$ trong BSD ($L(E, s) = \prod_p$ tích Euler với $a_p$).
  • Ý nghĩa triết học: Một lý thuyết thuần túy (EC trên $\mathbb{Q}$, BSD) dẫn đến ứng dụng bất ngờ: phân tích thừa số (ECM), mật mã (ECC). Đây minh chứng rằng nghiên cứu cơ bản trong lý thuyết số luôn có giá trị ứng dụng --- dù có thể phải đợi hàng thế kỷ.
211 Kết quả Bhargava–Shankar (Bhargava–Shankar results) Ch.3 8

Định nghĩa

Định lý (Bhargava--Shankar, 2010--2015 [bhargava-shankar2015]). Kết quả Bhargava--Shankar (Bhargava--Shankar results) là loạt định lý tính giá trị trung bình của nhóm Selmer:
  1. Trung bình $|\mathrm{Sel}_2(E)|$: Khi $E$ chạy qua tất cả đường cong elliptic (sắp theo chiều cao), trung bình $|\mathrm{Sel}_2(E)| = 3$.
  2. Trung bình $|\mathrm{Sel}_3(E)| = 4$, $|\mathrm{Sel}_4(E)| = 7$, $|\mathrm{Sel}_5(E)| = 6$.
  3. Công thức tổng quát: $\mathrm{avg}\,|\mathrm{Sel}_n(E)| = \sigma(n) = \sum_{d \mid n} d$ (tổng ước).

Hệ quả: Hạng trung bình $\mathrm{avg}\,\mathrm{rk}(E(\mathbb{Q})) \leq 0.885$ (từ $\mathrm{Sel}_5$). Nói riêng, phần lớn đường cong elliptic có hạng $\leq 1$.

Phương pháp: Bhargava--Shankar sử dụng hình học của số (geometry of numbers) --- đếm các điểm lưới trong vùng thay vì làm việc trực tiếp với nhóm Selmer. Cụ thể:

  • $\mathrm{Sel}_2$ tham số hóa bởi dạng nhị phần bậc bốn (binary quartic forms).
  • $\mathrm{Sel}_3$ bởi dạng khối nhị phần bậc ba (pairs of ternary quadratic forms).
  • Đếm quỹ đạo của các nhóm tuyến tính trên không gian này → trung bình Selmer.

Ví dụ

Ví dụ (Trung bình Selmer --- con số và ý nghĩa).
  1. $\mathrm{avg}\,|\mathrm{Sel}_2| = 3$: Nhóm Selmer $\mathrm{Sel}_2(E)$ chứa $E(\mathbb{Q})/2E(\mathbb{Q})$ (kích thước $2^{r+t}$ với $r = \mathrm{rk}$, $t$ liên quan xoắn) và phần $\mathrm{Sha}[2]$. Trung bình kích thước $= 3$ gợi ý rằng “hầu hết EC có $|\mathrm{Sel}_2| = 1$ (hạng 0) hoặc $2$ (hạng 1), ít EC có Selmer lớn”.
  2. So sánh $\sigma(n)$: {cccc} $n$ & $\sigma(n)$ & $\mathrm{avg}\,|\mathrm{Sel}_n|$ & Cận hạng \\ \hline 2 & 3 & 3 & 1.5 \\ 3 & 4 & 4 & 1.17 \\ 4 & 7 & 7 & 0.998 \\ 5 & 6 & 6 & 0.885 Cận hạng giảm khi $n$ tăng --- nhưng vẫn $> 0$. Heuristic PPVW dự đoán hạng trung bình thực sự là $1/2$.
  3. Tại sao $\sigma(n)$? Đây là “số phần tử trung bình” của nhóm Abel hữu hạn ngẫu nhiên bậc $n$, theo mô hình Cohen--Lenstra. Selmer “hành xử” như nhóm ngẫu nhiên!

Ý nghĩa trực giác

Bhargava--Shankar --- “phần lớn EC có hạng nhỏ”.
  • Hình dung: Trước Bhargava, không ai biết hạng trung bình hữu hạn hay vô hạn. Bhargava--Shankar chứng minh: “đường cong elliptic trung bình có ít điểm hữu tỉ” --- hạng trung bình $\leq 0.885$.
  • Phương pháp mới: Thay vì nghiên cứu từng EC riêng lẻ (“kính hiển vi”), Bhargava nhìn toàn bộ EC cùng lúc (“ống nhòm thống kê”) bằng cách đếm đối tượng đại số trong không gian lưới.
  • Ý nghĩa sâu: Kết quả gợi ý rằng “hầu hết EC có hạng 0 hoặc 1” --- phù hợp với phỏng đoán Goldfeld và heuristic PPVW. Nếu đúng, BSD quyết định được hạng cho “hầu hết” EC (vì $\mathrm{rk} \leq 1$ đã được giải bởi Gross--Zagier--Kolyvagin).

Liên hệ với giả thuyết Birch--Dyer

Bhargava--Shankar và BSD.
  • Kết hợp Bhargava--Shankar + Gross--Zagier--Kolyvagin: Nếu $\mathrm{Sel}_5$ nhỏ thì $\mathrm{rk} \leq 1$ → BSD yếu đúng cho EC đó. Kết quả: “phần lớn” EC thỏa mãn BSD yếu.
  • Bhargava--Skinner--Zhang: Kết hợp thêm Skinner → $\geq 66.48\%$ EC thỏa BSD (xem STT 212).
  • Sha: Trung bình Selmer cũng cho thông tin về $\mathrm{Sha}$ --- nếu $|\mathrm{Sel}_n|$ lớn nhưng $\mathrm{rk}$ nhỏ, phần dư là $\mathrm{Sha}$. Bhargava--Shankar gợi ý $\mathrm{Sha}$ “thường nhỏ”.
212 Kết quả Bhargava–Skinner–Zhang (BSZ 66.48%) Ch.1 8

Định nghĩa

Định lý (Bhargava--Skinner--Zhang, 2014 [bhargava-skinner-zhang2014]). Ít nhất $66.48\%$ tất cả đường cong elliptic trên $\mathbb{Q}$ (sắp theo chiều cao) thỏa mãn giả thuyết BSD yếu: $\mathrm{ord}_{s=1} L(E, s) = \mathrm{rk}(E(\mathbb{Q}))$.

Cụ thể, họ chứng minh:

  • $\geq 16.50\%$ EC có $\mathrm{rk} = 0$ và $L(E, 1) \neq 0$ (BSD đúng hiển nhiên).
  • $\geq 49.98\%$ EC có $\mathrm{rk} \leq 1$ và $\mathrm{ord}_{s=1} L(E, s) = \mathrm{rk}$ (BSD yếu đúng, dùng Gross--Zagier--Kolyvagin).

Thành phần chứng minh

Ba thành phần chính.
  1. Bhargava--Shankar: Trung bình $|\mathrm{Sel}_5| = 6$ → phần lớn EC có $\mathrm{rk} \leq 1$.
  2. Gross--Zagier + Kolyvagin: Nếu $\mathrm{ord}_{s=1} L(E, s) \leq 1$ thì $\mathrm{rk} = \mathrm{ord}_{s=1} L(E, s)$ và $|\mathrm{Sha}| < \infty$.
  3. Skinner + Zhang: “Converse theorems” --- nếu $\mathrm{rk} = 0$ (hoặc 1) và một số điều kiện kỹ thuật, thì $\mathrm{ord}_{s=1} L(E, s) = 0$ (hoặc 1). Đặc biệt, Skinner (2014): nếu $\mathrm{rk} = 0$, $|\mathrm{Sha}| < \infty$, và $\bar{\rho}_{E,p}$ surjective cho $p \geq 3$, thì $L(E, 1) \neq 0$.
Kết hợp: “phần lớn EC có $\mathrm{rk} \leq 1$” (Bhargava) + “$\mathrm{rk} \leq 1$ → BSD đúng” (GZK + Skinner) = “$\geq 66.48\%$ thỏa BSD”.

Ví dụ

Ví dụ (Con số 66.48%).
  1. Ý nghĩa thống kê: Trong 10 đường cong elliptic ngẫu nhiên, ta kỳ vọng ít nhất 6--7 cái thỏa BSD. Con số thực tế có thể cao hơn (heuristic gợi ý $\sim 100\%$), nhưng $66.48\%$ là cận dưới được chứng minh.
  2. Phân tách: Khoảng $50\%$ EC có hạng 0 (BSD đúng nhờ Kolyvagin), $\sim 50\%$ có hạng 1 (BSD đúng nhờ Gross--Zagier). Hạng $\geq 2$ rất hiếm (mật độ 0 theo Bhargava).
  3. Trích dẫn Bhargava (2014): “Kết quả gợi ý rằng BSD đúng cho 100% đường cong elliptic --- nhưng chứng minh 100% còn rất xa.”

Ý nghĩa trực giác

BSZ 66.48% --- “phần lớn BSD đã đúng”.
  • Hình dung: Nếu BSD là “tường thành”, thì $2/3$ tường đã được xây xong. Phần còn lại ($\mathrm{rk} \geq 2$ và các trường hợp kỹ thuật) là “viên gạch cuối” khó nhất.
  • Tại sao chưa 100%? Vì (1) EC hạng $\geq 2$ chưa có công cụ (Gross--Zagier chỉ cho hạng 1); (2) điều kiện kỹ thuật của Skinner (biểu diễn thặng dư surjective) không phải lúc nào cũng thỏa.
  • Tiến bộ liên tục: Mỗi cải thiện nhỏ (ví dụ mở rộng converse theorem) sẽ nâng $66.48\%$ lên --- mục tiêu cuối cùng là $100\%$.

Liên hệ với giả thuyết Birch--Dyer

BSZ và BSD.
  • Bằng chứng mạnh nhất: $66.48\%$ là con số lớn nhất từng chứng minh cho BSD --- minh chứng rằng BSD “gần đúng” dù chưa chứng minh hoàn toàn.
  • BSD yếu vs mạnh: BSZ chứng minh BSD yếu ($\mathrm{ord} = \mathrm{rk}$) cho $\geq 66.48\%$. BSD mạnh (công thức đầy đủ cho $L^{(r)}(E,1)/r!$) khó hơn nhiều, chỉ biết cho $\mathrm{rk} = 0, 1$ (và cần thêm Sha hữu hạn).
  • Hướng phát triển: Smith (2022) chứng minh Goldfeld conjecture cho $\mathrm{Sel}_2$ → $50\%$ EC hạng 0, $50\%$ hạng 1 (trong họ twist). Kết hợp sẽ cho BSD cho $100\%$ twist!
213 Kết quả Smith (2022) (Smith's Theorem) Ch.6 9

Định nghĩa

Định lý (Smith, 2022). Cho $E/\mathbb{Q}$ đường cong elliptic. Xét họ twist bậc hai $E_d: dy^2 = x^3 + ax + b$ với $d$ squarefree. Alexander Smith chứng minh:
  1. Goldfeld conjecture cho $\mathrm{Sel}_2$: Trong họ twist, mật độ $d$ mà $|\mathrm{Sel}_2(E_d)| = 1$ (tức $\mathrm{rk} = 0$ và $\mathrm{Sha}[2] = 0$) là $50\%$.
  2. Mật độ $d$ mà $|\mathrm{Sel}_2(E_d)| = 2$ (gợi ý $\mathrm{rk} = 1$, $\mathrm{Sha}[2] = 0$) là $50\%$.
  3. Mật độ $d$ mà $\mathrm{rk}(E_d(\mathbb{Q})) \geq 2$ là $0\%$ (giả sử Sha hữu hạn).

Kết quả này chứng minh phỏng đoán Goldfeld (1979): trong mỗi họ twist, $50\%$ có hạng 0 và $50\%$ có hạng 1 --- nếu $\mathrm{Sha}$ hữu hạn.

Phương pháp: Smith sử dụng lý thuyết xác suất trên nhóm Selmer, mở rộng công trình của Heath-Brown và Swinnerton-Dyer về phân bố $\mathrm{Sel}_2$ trong họ twist.

Ví dụ

Ví dụ (Goldfeld conjecture --- phân bố hạng trong họ twist).
  1. $E: y^2 = x^3 - x$ (conductor 32, CM). Twist $E_d: dy^2 = x^3 - x$.
    • $d = -1$: $\mathrm{rk}(E_{-1}) = 0$ (Fermat, $-1$ không đồng dư).
    • $d = 5$: $\mathrm{rk}(E_5) = 1$ ($5$ đồng dư).
    • $d = 6$: $\mathrm{rk}(E_6) = 1$ ($6$ đồng dư).
    • $d = 34$: $\mathrm{rk}(E_{34}) = 2$ (hiếm!).
    Smith: khi lấy mẫu $d$ squarefree ngẫu nhiên, tỷ lệ $\mathrm{rk} = 0 : \mathrm{rk} = 1 : \mathrm{rk} \geq 2$ tiến đến $50\% : 50\% : 0\%$.
  2. Dữ liệu thực nghiệm: Với $E: y^2 = x^3 - x$ và $1 \leq d \leq 10^6$ squarefree:
    • $\mathrm{rk} = 0$: $\sim 50.1\%$
    • $\mathrm{rk} = 1$: $\sim 49.8\%$
    • $\mathrm{rk} \geq 2$: $\sim 0.1\%$ (giảm dần)
    Hoàn toàn phù hợp với Smith.

Ý nghĩa trực giác

Smith --- “đồng xu Selmer”.
  • Hình dung: Trong họ twist, hạng EC giống “tung đồng xu” --- $50\%$ hạng 0 (“ngửa”), $50\%$ hạng 1 (“sấp”). Hạng $\geq 2$ giống “đồng xu đứng cạnh” --- xác suất 0.
  • Selmer như nhóm ngẫu nhiên: Smith chứng minh $\mathrm{Sel}_2$ phân bố như “nhóm Abel $2$-sơ cấp ngẫu nhiên” theo mô hình Cohen--Lenstra --- xác suất $|\mathrm{Sel}_2| = 2^k$ giảm cực nhanh theo $k$.
  • Hoàn thiện bức tranh: Bhargava--Shankar (trung bình) + Smith (phân bố trong twist) + heuristic PPVW (phân bố tổng quát) → bức tranh thống kê về hạng EC gần hoàn chỉnh.

Liên hệ với giả thuyết Birch--Dyer

Smith và BSD.
  • BSD cho 100% twist: Smith + Gross--Zagier--Kolyvagin + Skinner → BSD yếu đúng cho “100% twist” (giả sử Sha hữu hạn). Đây là kết quả mật độ mạnh nhất cho BSD.
  • Goldfeld gốc: Phỏng đoán Goldfeld gốc nói về bậc triệt tiêu $\mathrm{ord}_{s=1} L(E_d, s)$. Smith chứng minh cho Selmer (tương đương nếu BSD + Sha hữu hạn). Chiều “Selmer $\to$ $L$-function” cần BSD.
  • Hạng $\geq 2$ mật độ 0: Gợi ý rằng “phần chưa giải của BSD” (hạng $\geq 2$) ảnh hưởng “tập đo 0” --- dù vẫn khó chứng minh cho từng EC cụ thể.
214 Miền cơ bản (Fundamental domain) Ch.6 4

Định nghĩa

Định nghĩa (Miền cơ bản). Miền cơ bản (fundamental domain) của tác động nhóm $G$ trên không gian $X$ là tập con $\mathcal{F} \subset X$ sao cho:
  1. Mỗi quỹ đạo $G \cdot x$ giao $\mathcal{F}$ ít nhất một điểm (surjective).
  2. Nếu $x, y \in \mathcal{F}$ và $g \cdot x = y$ với $g \in G$, thì $x = y$ hoặc $x, y$ nằm trên biên (gần injective).

Ví dụ quan trọng nhất: Miền cơ bản chuẩn của $\mathrm{SL}_2(\mathbb{Z})$ tác động trên nửa mặt phẳng trên $\mathcal{H} = \{\tau \in \mathbb{C} : \mathrm{Im}(\tau) > 0\}$:

\[ \mathcal{F} = \left\{\tau \in \mathcal{H} : |\mathrm{Re}(\tau)| \leq \frac{1}{2}, \; |\tau| \geq 1\right\}. \]
Mọi $\tau \in \mathcal{H}$ tương đương (modulo $\mathrm{SL}_2(\mathbb{Z})$) với đúng một $\tau' \in \mathcal{F}$ (trừ biên).

Ví dụ

Ví dụ (Miền cơ bản trong toán học).
  1. $\mathrm{SL}_2(\mathbb{Z})$ trên $\mathcal{H}$: Miền $\mathcal{F}$ hình “mũi nhọn” --- biên trái $\mathrm{Re}(\tau) = -1/2$, biên phải $\mathrm{Re}(\tau) = 1/2$, biên dưới $|\tau| = 1$. Hai phép sinh: $T: \tau \mapsto \tau + 1$ (dịch ngang) và $S: \tau \mapsto -1/\tau$ (nghịch đảo + phản xạ). Mọi $\tau$ đưa về $\mathcal{F}$ bằng tổ hợp $S, T$.
  2. Lưới $\mathbb{Z}^n$ trên $\mathbb{R}^n$: Miền cơ bản = khối đơn vị $[0, 1)^n$. Mỗi vector $v \in \mathbb{R}^n$ tương đương (modulo $\mathbb{Z}^n$) với đúng một vector trong $[0, 1)^n$.
  3. Nhóm $\Gamma_0(N)$ trên $\mathcal{H}$: Miền cơ bản có diện tích $\frac{\pi}{3} N \prod_{p \mid N}(1 + 1/p)$ (hyperbolic) --- liên hệ trực tiếp với chỉ số $[\mathrm{SL}_2(\mathbb{Z}) : \Gamma_0(N)]$ và số chiều không gian dạng modular.

Ý nghĩa trực giác

Miền cơ bản --- “mảnh ghép lặp lại”.
  • Hình dung: Giống “ô gạch” lát sàn. Nhóm $G$ “dán” các bản sao của $\mathcal{F}$ khít nhau phủ kín $X$. Thay vì nghiên cứu toàn bộ $X$ (quá lớn), ta chỉ cần hiểu $\mathcal{F}$ (nhỏ, gọn).
  • Không gian thương: $X/G \cong \mathcal{F}/\!\sim$ --- miền cơ bản “đại diện” cho không gian thương. Ví dụ $\mathcal{H}/\mathrm{SL}_2(\mathbb{Z}) \cong \mathbb{C}$ (qua $j$-bất biến), tức mọi đường cong elliptic trên $\mathbb{C}$ (lên đến đẳng cấu) tương ứng một điểm trong $\mathcal{F}$.
  • Bhargava dùng: Trong geometry of numbers, Bhargava đếm điểm lưới trong miền cơ bản của tác động nhóm trên không gian dạng bậc hai/bậc ba → tính trung bình Selmer.

Liên hệ với giả thuyết Birch--Dyer

Miền cơ bản và BSD.
  • Dạng modular: Dạng modular $f(\tau)$ sống trên $\mathcal{H}/\Gamma_0(N)$ --- để hiểu $f$, ta nghiên cứu trên miền cơ bản $\mathcal{F}_0(N)$. Tích phân $\int_{\mathcal{F}_0(N)} |f(\tau)|^2 \, d\mu$ cho tích Petersson.
  • Bhargava--Shankar: Miền cơ bản của $\mathrm{GL}_2(\mathbb{Z})$ (hoặc $\mathrm{SL}_2(\mathbb{Z}) \times \mathrm{SL}_3(\mathbb{Z})$) tác động trên không gian dạng → đếm phần tử Selmer → trung bình hạng → BSD cho phần lớn EC.
  • $j$-bất biến: $\mathcal{H}/\mathrm{SL}_2(\mathbb{Z}) \to \mathbb{C}$ qua $j(\tau)$ phân loại EC trên $\mathbb{C}$. Đường cong modular $X_0(N) = \mathcal{H}/\Gamma_0(N)$ liên hệ trực tiếp với modularity theorem (nền tảng BSD).
215 Nguyên lý Minkowski (Minkowski principle) Ch.6 5

Định nghĩa

Định lý (Minkowski, 1896). Định lý Minkowski (Minkowski's theorem) (hình học của số): Cho $\Lambda \subset \mathbb{R}^n$ là lưới có thể tích cơ bản $\mathrm{vol}(\Lambda) = V$, và $S \subset \mathbb{R}^n$ là tập lồi, đối xứng qua gốc tọa độ, có thể tích:
\[ \mathrm{vol}(S) > 2^n \cdot V. \]
Thì $S$ chứa ít nhất một điểm lưới $v \in \Lambda \setminus \{0\}$.

Dạng mạnh: Nếu $S$ đóng, thì $\mathrm{vol}(S) \geq 2^n \cdot V$ là đủ.

Hệ quả cổ điển: Mọi trường số bậc $n > 1$ trên $\mathbb{Q}$ đều có biệt thức $|d_K| > 1$, tức luôn tồn tại nguyên tố phân nhánh.

Ví dụ

Ví dụ (Nguyên lý Minkowski).
  1. Trong $\mathbb{R}^2$: Lưới $\mathbb{Z}^2$, $V = 1$. Hình tròn bán kính $r$: $\mathrm{vol} = \pi r^2$. Cần $\pi r^2 > 4$, tức $r > 2/\sqrt{\pi} \approx 1.13$. Hình tròn bán kính $1.2$ chứa các điểm $(\pm 1, 0), (0, \pm 1)$. \checkmark
  2. Biểu diễn bởi dạng bậc hai: Để chứng minh “mọi số nguyên tố $p \equiv 1 \pmod{4}$ là tổng hai bình phương” ($p = a^2 + b^2$), Minkowski dùng: lưới $\Lambda = \{(a, b) : a \equiv rb \pmod{p}\}$ (với $r^2 \equiv -1 \pmod{p}$) có $V = p$. Hình tròn bán kính $\sqrt{2p}$: $\mathrm{vol} = 2\pi p > 4p$. → Tồn tại $(a, b) \neq (0, 0)$ trong hình tròn $\cap$ lưới, tức $a^2 + b^2 < 2p$ và $a^2 + b^2 \equiv 0 \pmod{p}$ → $a^2 + b^2 = p$.
  3. Bhargava dùng Minkowski mở rộng: Đếm điểm lưới trong “miền cơ bản” phóng to/biến dạng → đếm dạng nhị phần bậc bốn/bậc ba → đếm phần tử Selmer → trung bình hạng.

Ý nghĩa trực giác

Minkowski --- “tập đủ lớn phải chứa điểm lưới”.
  • Hình dung: Nếu “cái lưới” mau (thể tích ô nhỏ) và “cái túi” to (thể tích lớn), thì túi chắc chắn “bắt” được ít nhất một điểm lưới. Nguyên lý “pigeonhole” hình học!
  • Sức mạnh: Chứng minh tồn tại mà không cần tìm --- công cụ phi constructive nhưng cực kỳ mạnh. Nhiều định lý lý thuyết số (biểu diễn bậc hai, cận biệt thức) đều dùng Minkowski.
  • Nền tảng geometry of numbers: Minkowski sáng lập hình học của số (1896). 120 năm sau, Bhargava mở rộng phương pháp này để giải quyết bài toán Selmer --- minh chứng sức sống bền bỉ.

Liên hệ với giả thuyết Birch--Dyer

Minkowski và BSD.
  • Bhargava--Shankar: Đếm quỹ đạo dạng nhị phần bậc bốn bằng “Minkowski mở rộng” → trung bình $|\mathrm{Sel}_2| = 3$ → cận hạng → BSD cho phần lớn EC.
  • Hình học của số: Minkowski $\to$ Davenport (1950s, đếm dạng bậc ba) $\to$ Bhargava (2000s, đếm dạng bậc $n$, liên hệ Selmer) --- dòng chảy 120 năm dẫn đến BSD.
  • Nguyên lý cục bộ--toàn cục: Minkowski cũng liên hệ với Hasse principle --- “tồn tại nghiệm cục bộ mọi nơi $\Rightarrow$ tồn tại nghiệm toàn cục?” Sha đo “lỗi” của nguyên lý này.
216 Định lý Skinner–Urban (Skinner–Urban Theorem) Ch.6 10

Định nghĩa

Định lý (Skinner--Urban, 2014). Cho $E/\mathbb{Q}$ đường cong elliptic với conductor $N$, và $p \geq 3$ nguyên tố tốt (good ordinary reduction). Giả sử:
  1. Biểu diễn thặng dư $\bar{\rho}_{E,p} : G_{\mathbb{Q}} \to \mathrm{GL}_2(\mathbb{F}_p)$ là surjective.
  2. Tồn tại nguyên tố $\ell \| N$ ($\ell$ chia đúng $N$ một lần) sao cho $\bar{\rho}_{E,p}$ ramified tại $\ell$.
Thì phỏng đoán chính Iwasawa cho $(E, p)$ đúng:
\[ \mathrm{char}_{\Lambda}\!\left(\mathrm{Sel}_{p^\infty}(E/\mathbb{Q}_\infty)^\vee\right) = (L_p(E)), \]
với $L_p(E)$ là hàm $L$ $p$-adic Mazur--Swinnerton-Dyer, $\Lambda = \mathbb{Z}_p[\![T]\!]$ đại số Iwasawa, $\mathrm{Sel}_{p^\infty}$ nhóm Selmer $p$-adic trên tháp cyclotomic $\mathbb{Q}_\infty$.

Hệ quả cho BSD: Nếu $L(E, 1) \neq 0$ (và các điều kiện trên), thì:

\[ \left|\frac{L(E, 1)}{\Omega_E}\right|_p = \left|\frac{|\mathrm{Sha}(E)| \cdot \prod c_\ell}{|E(\mathbb{Q})_{\mathrm{tors}}|^2}\right|_p, \]
tức BSD mạnh phần $p$ đúng.

Ví dụ

Ví dụ (Skinner--Urban cho đường cong cụ thể).
  1. $E = $ 37a1: $y^2 + y = x^3 - x$, conductor $37$, $\mathrm{rk} = 1$. Với $p = 5$: $\bar{\rho}_{E,5}$ surjective (kiểm tra), $37 \| N$. Skinner--Urban áp dụng → IMC đúng cho $(E, 5)$ → BSD mạnh phần $5$.
  2. $E = $ 11a1: $y^2 + y = x^3 - x^2 - 10x - 20$, conductor $11$, $\mathrm{rk} = 0$. $L(E, 1)/\Omega_E = 1/5$. Với $p = 3$: IMC đúng → $|\mathrm{Sha}|_3 = 1$, kiểm chứng BSD mạnh phần $3$.
  3. Kết hợp nhiều $p$: Áp dụng Skinner--Urban cho mọi $p$ tốt → BSD mạnh “gần hoàn toàn” (trừ $p = 2$ và $p$ xấu). Cùng Kato (phần “$\leq$”) → đẳng thức cho hầu hết $p$.

Ý nghĩa trực giác

Skinner--Urban --- “cầu nối Iwasawa--BSD”.
  • Hình dung: IMC nói “hai thế giới” --- thế giới đại số (Selmer $p$-adic) và thế giới giải tích (hàm $L$ $p$-adic) --- “bằng nhau” trong đại số Iwasawa. Đây là phiên bản $p$-adic của BSD.
  • Lý thuyết Iwasawa cổ điển: Iwasawa (1960s) chứng minh “IMC cho nhóm lớp” (Mazur--Wiles, 1984). Skinner--Urban mở rộng lên $\mathrm{GL}_2$ (đường cong elliptic) --- khó hơn nhiều bậc.
  • Kỹ thuật: Dùng “$p$-adic deformation” của dạng modular trên nhóm unitary $\mathrm{GU}(2,2)$ --- kết hợp lý thuyết Iwasawa, dạng tự đẳng cấu, và hình học đại số ở mức cao nhất.

Liên hệ với giả thuyết Birch--Dyer

Skinner--Urban và BSD.
  • BSD mạnh phần $p$: Kết hợp IMC (Skinner--Urban, chiều “$\geq$”) + Kato (chiều “$\leq$”) → đẳng thức $p$-adic → BSD mạnh phần $p$.
  • Converse theorem (Skinner, 2014, 2020): Nếu $\mathrm{rk}(E(\mathbb{Q})) = 0$ và $|\mathrm{Sha}| < \infty$, cùng điều kiện kỹ thuật → $L(E, 1) \neq 0$. Đây là “chiều ngược” của Kolyvagin.
  • BSZ 66.48%: Converse theorem của Skinner là thành phần then chốt trong chứng minh “$\geq 66.48\%$ EC thỏa BSD” (Bhargava--Skinner--Zhang).
217 Định lý nghịch đảo Skinner (Skinner's converse theorem) Ch.6 10

Định nghĩa

Định lý (Skinner, 2014--2020). Cho $E/\mathbb{Q}$ đường cong elliptic. Skinner chứng minh chiều ngược của Kolyvagin:

Phiên bản 2014: Nếu $\mathrm{rk}(E(\mathbb{Q})) = 0$ và tồn tại $p \geq 3$ sao cho:

  • $E$ có good ordinary reduction tại $p$,
  • $\bar{\rho}_{E,p}$ surjective,
  • Tồn tại $\ell \| N_E$ với $\bar{\rho}_{E,p}$ ramified tại $\ell$,
thì $L(E, 1) \neq 0$.

Phiên bản mạnh (2020): Nếu thêm $|\mathrm{Sha}(E/\mathbb{Q})| < \infty$, thì kết luận mạnh hơn: $\mathrm{ord}_{s=1} L(E, s) = \mathrm{rk}(E(\mathbb{Q}))$ (BSD yếu) và BSD mạnh phần $p$.

So sánh:

  • Kolyvagin (1990): $L(E, 1) \neq 0 \Rightarrow \mathrm{rk} = 0$ và $|\mathrm{Sha}| < \infty$.
  • Skinner (2014): $\mathrm{rk} = 0$ + điều kiện $\Rightarrow L(E, 1) \neq 0$.
Kết hợp: $\mathrm{rk} = 0 \iff L(E, 1) \neq 0$ cho “hầu hết” EC (khi điều kiện kỹ thuật thỏa).

Ví dụ

Ví dụ (Converse theorem áp dụng).
  1. $E = $ 11a1: $\mathrm{rk} = 0$, $p = 3$: good ordinary, $\bar{\rho}_{E,3}$ surjective, $11 \| N$. Skinner → $L(E, 1) \neq 0$. Thực tế: $L(E, 1)/\Omega_E = 1/5 \neq 0$. \checkmark
  2. Tại sao quan trọng? Kolyvagin đi “từ $L$ đến hạng” ($L \neq 0 \Rightarrow \mathrm{rk} = 0$). Skinner đi ngược (“từ hạng đến $L$”). Hai chiều cùng nhau cho tương đương: cột trụ BSD yếu cho $\mathrm{rk} = 0$.
  3. BSZ: Bhargava--Shankar cho “phần lớn EC có $\mathrm{rk} \leq 1$”. Skinner converse cho “$\mathrm{rk} = 0 \Rightarrow L \neq 0$” → BSD yếu cho phần lớn EC hạng 0. Kết hợp GZK (hạng 1) → $\geq 66.48\%$ thỏa BSD.

Ý nghĩa trực giác

Converse theorem --- “chiều ngược”.
  • Hình dung: BSD nói “hạng $=$ bậc triệt tiêu $L$”. Gross--Zagier--Kolyvagin cho chiều “$\leq$” ($\mathrm{ord} \leq 1 \Rightarrow \mathrm{rk} = \mathrm{ord}$). Skinner cho chiều “$\geq$” ($\mathrm{rk} \leq 1 \Rightarrow \mathrm{ord} \geq \mathrm{rk}$). Hai chiều kết hợp → đẳng thức (BSD yếu cho $\mathrm{rk} \leq 1$).
  • Khó ở đâu? “Từ $L$ đến hạng” dùng hệ thống Euler (Kolyvagin). “Từ hạng đến $L$” cần xây dựng phần tử phù hợp trong đại số Iwasawa → kỹ thuật Skinner--Urban ($p$-adic deformation trên $\mathrm{GU}(2,2)$).
  • Tương lai: Mở rộng converse theorem cho mọi $p$ (kể cả $p = 2$) và giảm điều kiện kỹ thuật → nâng $66.48\%$ lên.

Liên hệ với giả thuyết Birch--Dyer

Converse theorem và BSD.
  • Thành phần then chốt: Converse theorem là “mảnh ghép cuối” để kết hợp Bhargava + GZK → BSD cho phần lớn EC. Không có Skinner, BSZ không đạt $66.48\%$.
  • BSD mạnh phần $p$: Phiên bản 2020 không chỉ cho $\mathrm{ord} = \mathrm{rk}$ mà còn kiểm tra công thức BSD mạnh modulo $p$ --- tiến gần hơn đến BSD hoàn toàn.
  • Hạn chế: Chỉ áp dụng cho $\mathrm{rk} \leq 1$ và cần điều kiện (surjective, ramified). $\mathrm{rk} \geq 2$ vẫn ngoài tầm --- đây là rào cản lớn nhất.
218 Dạng tự đẳng cấu (biến dạng) (Automorphic deformation) Ch.6 9

Định nghĩa

Định nghĩa (Biến dạng tự đẳng cấu). Biến dạng tự đẳng cấu (automorphic deformation) là quá trình “biến dạng liên tục” một biểu diễn Galois $\bar{\rho}: G_{\mathbb{Q}} \to \mathrm{GL}_n(\mathbb{F}_p)$ thành họ biểu diễn $\rho_x: G_{\mathbb{Q}} \to \mathrm{GL}_n(\mathcal{O}_x)$ tham số bởi điểm $x$ trên không gian biến dạng (deformation space), đồng thời mỗi $\rho_x$ “đến từ” một dạng tự đẳng cấu.

Ngữ cảnh Wiles: Cho $E/\mathbb{Q}$ và biểu diễn thặng dư $\bar{\rho}_{E,p}: G_{\mathbb{Q}} \to \mathrm{GL}_2(\mathbb{F}_p)$.

  • Phía Galois: Vành biến dạng $R$ phân loại mọi “nâng” (lift) $\rho: G_{\mathbb{Q}} \to \mathrm{GL}_2(\mathbb{Z}_p)$ thỏa các điều kiện cục bộ.
  • Phía tự đẳng cấu: Vành Hecke $\mathbb{T}$ phân loại mọi dạng modular “nâng” $\bar{\rho}$.
  • Định lý $R = \mathbb{T}$: Wiles--Taylor (1995) chứng minh $R \cong \mathbb{T}$ → mọi biến dạng Galois đều tự đẳng cấu → modularity.

Skinner--Urban: Thay $\mathrm{GL}_2$ bằng $\mathrm{GU}(2,2)$ --- biến dạng dạng tự đẳng cấu trên nhóm unitary 4 chiều. Dạng Eisenstein trên $\mathrm{GU}(2,2)$ “chuyên chở” thông tin hàm $L$ $p$-adic → chứng minh IMC.

Ví dụ

Ví dụ (Biến dạng --- ví dụ đơn giản).
  1. Hình ảnh: Nghĩ $\bar{\rho}$ là “bản phác thảo” (sketch) --- chỉ thấy đường nét chính (modulo $p$). Biến dạng = “tô màu” --- thêm chi tiết, nâng lên $\mathbb{Z}_p$. Nhiều cách tô (vành $R$), nhưng chỉ những cách “hài hòa” mới cho dạng modular (vành $\mathbb{T}$). $R = \mathbb{T}$: “mọi cách tô hợp lý đều hài hòa”.
  2. Cụ thể: $E = $ 11a1, $p = 5$. $\bar{\rho}_{E,5}: G_{\mathbb{Q}} \to \mathrm{GL}_2(\mathbb{F}_5)$ --- “hình ảnh modulo 5” của biểu diễn Galois. Biến dạng: nâng lên $\mathrm{GL}_2(\mathbb{Z}_5)$ bằng nhiều cách. $R = \mathbb{T}$ nói: mọi cách nâng “tốt” đều đến từ dạng modular.
  3. Taylor--Wiles patching: Kỹ thuật chứng minh $R = \mathbb{T}$ bằng “vá” (patching) --- xây dựng họ vành phụ trợ “xấp xỉ” $R$ và $\mathbb{T}$, rồi lấy giới hạn.

Ý nghĩa trực giác

Biến dạng tự đẳng cấu --- “mọi hình đều có tên”.
  • Triết lý Langlands: “Mọi biểu diễn Galois 'tốt' đều đến từ dạng tự đẳng cấu” --- đây là trái tim của chương trình Langlands. $R = \mathbb{T}$ chứng minh điều này cho $\mathrm{GL}_2/\mathbb{Q}$.
  • Từ Wiles đến Skinner--Urban: Wiles dùng $\mathrm{GL}_2$-deformation → modularity → Fermat. Skinner--Urban dùng $\mathrm{GU}(2,2)$-deformation → IMC → BSD mạnh phần $p$. Cùng triết lý, mở rộng phạm vi.
  • Tương lai: Biến dạng trên nhóm lớn hơn ($\mathrm{GSp}_4$, $\mathrm{GL}_n$) → IMC/BSD cho abelian varieties bậc cao → giải quyết BSD hoàn toàn?

Liên hệ với giả thuyết Birch--Dyer

Biến dạng tự đẳng cấu và BSD.
  • Modularity: $R = \mathbb{T}$ → mọi EC modular → hàm $L(E, s)$ có tính chất tốt (phương trình hàm, thác triển) → BSD có nghĩa.
  • IMC: Biến dạng trên $\mathrm{GU}(2,2)$ → Skinner--Urban → IMC → BSD mạnh phần $p$. Đây là đường dẫn kỹ thuật chính từ lý thuyết biến dạng đến BSD.
  • Rào cản: Biến dạng hiện chỉ hiệu quả cho $\mathrm{rk} \leq 1$. Để giải $\mathrm{rk} \geq 2$ cần “biến dạng bậc cao” hoặc phương pháp hoàn toàn mới.
219 Thuật toán Schoof (Schoof's algorithm) Ch.2 6

Định nghĩa

Định nghĩa (Thuật toán Schoof, 1985 [schoof1985]). Thuật toán Schoof (Schoof's algorithm) tính $\#E(\mathbb{F}_p)$ trong thời gian đa thức $O(\log^8 p)$ (hoặc $O(\log^5 p)$ với cải tiến) --- thuật toán đa thức đầu tiên cho bài toán đếm điểm.

Ý tưởng: Tính vết Frobenius $a_p$ modulo các nguyên tố nhỏ $\ell$, rồi dùng CRT (Định lý thặng dư Trung Hoa) khôi phục $a_p$.

Các bước:

  1. Phương trình Frobenius: Trên $E(\bar{\mathbb{F}}_p)$, tự đồng cấu Frobenius $\phi_p: (x, y) \mapsto (x^p, y^p)$ thỏa
    \[ \phi_p^2 - a_p \phi_p + p = 0 \quad \text{trong } \mathrm{End}(E). \]
  2. Hạn chế lên $E[\ell]$: Trên nhóm $\ell$-xoắn $E[\ell] \cong (\mathbb{Z}/\ell\mathbb{Z})^2$, phương trình trở thành
    \[ (x^{p^2}, y^{p^2}) + [p](x, y) = [a_p \bmod \ell](x^p, y^p) \quad \text{trong } E[\ell]. \]
  3. Thử $a_p \bmod \ell$: Duyệt $t = 0, 1, \ldots, \ell - 1$, kiểm tra phương trình trên modulo $\ell$-division polynomial $\psi_\ell(x)$. Tìm $t$ duy nhất thỏa → $a_p \equiv t \pmod{\ell}$.
  4. CRT: Lặp cho $\ell = 2, 3, 5, 7, \ldots$ cho đến khi $\prod \ell > 4\sqrt{p}$ (cận Hasse). Dùng CRT khôi phục $a_p$ duy nhất.

Kết quả: $\#E(\mathbb{F}_p) = p + 1 - a_p$.

Ví dụ

Ví dụ (Schoof cho đường cong nhỏ).
  1. $E: y^2 = x^3 + x + 1$ trên $\mathbb{F}_{23}$:
    • Cận Hasse: $|a_{23}| \leq 2\sqrt{23} \approx 9.59$, nên $a_{23} \in \{-9, \ldots, 9\}$.
    • Cần $\prod \ell > 2 \times 9.59 \approx 19.2$. Dùng $\ell = 2, 3, 5$: $2 \times 3 \times 5 = 30 > 19.2$. ✓
    • $\ell = 2$: Kiểm tra $\gcd(x^{23} - x, x^3 + x + 1) \pmod{23}$ → xác định $a_{23}$ chẵn/lẻ.
    • $\ell = 3$: Kiểm tra trên $E[3]$ qua $\psi_3(x) = 3x^4 + 6x^2 + 12x - 1 \pmod{23}$.
    • $\ell = 5$: Tương tự qua $\psi_5(x)$.
    • CRT: $a_{23} \equiv ? \pmod{30}$ → $a_{23}$ duy nhất → $\#E(\mathbb{F}_{23}) = 24 - a_{23}$.
  2. Thực tế: Đếm trực tiếp $E(\mathbb{F}_{23})$ cho $28$ điểm → $a_{23} = 23 + 1 - 28 = -4$. Schoof tìm $a_{23} = -4$ mà không cần đếm trực tiếp --- lợi thế rõ khi $p$ rất lớn.
  3. Độ phức tạp: Với $p \sim 2^{256}$ (mật mã), Schoof cần $\sim 256^5$ phép toán --- khả thi trên máy tính, trong khi đếm trực tiếp cần $\sim 2^{256}$ phép (không khả thi).

Ý nghĩa trực giác

Schoof --- “CRT cho Frobenius”.
  • Hình dung: Thay vì hỏi “$a_p$ bằng bao nhiêu?” (câu hỏi khó), Schoof hỏi “$a_p$ chia $\ell$ dư bao nhiêu?” cho từng $\ell$ nhỏ (câu hỏi dễ hơn). Ghép đáp án lại bằng CRT → $a_p$ chính xác.
  • Division polynomial: “Ngôn ngữ” để làm việc trên $E[\ell]$ mà không cần mở rộng trường --- giữ tính toán trong $\mathbb{F}_p[x]/\psi_\ell(x)$, đa thức bậc $O(\ell^2)$.
  • Đột phá 1985: Trước Schoof, đếm điểm là bài toán “hàm mũ”. Schoof cho thuật toán đa thức đầu tiên --- mở đường cho ứng dụng mật mã (cần biết $\#E(\mathbb{F}_p)$ để chọn đường cong an toàn).

Liên hệ với giả thuyết Birch--Dyer

Schoof và BSD.
  • Tính $a_p$: Schoof tính $a_p = p + 1 - \#E(\mathbb{F}_p)$ --- chính xác giá trị cần cho tích Euler $L(E, s) = \prod_p (1 - a_p p^{-s} + p^{1-2s})^{-1}$.
  • Kiểm nghiệm BSD: Để kiểm tra BSD bằng số cho EC cụ thể, cần tính $L(E, 1)$ bằng số → cần nhiều $a_p$ → Schoof/SEA cho tính toán hiệu quả.
  • LMFDB: Cơ sở dữ liệu LMFDB lưu hàng triệu EC cùng $a_p$, $L(E, s)$, hạng --- tất cả tính bằng Schoof/SEA. Dữ liệu này là “phòng thí nghiệm” kiểm nghiệm BSD.
220 Thuật toán SEA (Schoof–Elkies–Atkin algorithm) Ch.2 7

Định nghĩa

Định nghĩa (Thuật toán SEA). Thuật toán SEA (Schoof--Elkies--Atkin algorithm) là cải tiến của thuật toán Schoof bởi Elkies (1991) và Atkin, giảm độ phức tạp xuống $O(\log^4 p)$ (thực tế rất nhanh).

Ý tưởng cải tiến: Phân loại nguyên tố $\ell$ thành hai loại:

  • Elkies prime: $\ell$ mà $\phi_p$ có giá trị riêng trong $\mathbb{F}_\ell$ trên $E[\ell]$ --- tức đa thức đặc trưng $X^2 - a_pX + p \pmod{\ell}$ có nghiệm. Khi đó tồn tại isogeny bậc $\ell$ từ $E$, và ta chỉ cần tính trên hạt nhân (bậc $\ell$, thay vì $\ell^2$ như Schoof gốc).
  • Atkin prime: $\ell$ mà đa thức đặc trưng không có nghiệm trong $\mathbb{F}_\ell$. Ta chỉ biết $a_p \bmod \ell$ nằm trong tập nhỏ (không chính xác), dùng “baby-step giant-step” kết hợp.

Tốc độ: Khoảng $50\%$ các $\ell$ là Elkies (theo Chebotarev density). Phần Elkies chiếm ưu thế tính toán → tốc độ tổng thể cải thiện đáng kể.

Ví dụ

Ví dụ (SEA --- cải tiến thực tế).
  1. So sánh tốc độ: Đếm $\#E(\mathbb{F}_p)$ với $p \sim 2^{256}$:
    • Schoof gốc: $\sim$ vài giờ (division polynomial bậc $\ell^2$).
    • SEA: $\sim$ vài giây (Elkies giảm xuống bậc $\ell$).
    • Tăng tốc $\sim 100$--$1000$ lần thực tế.
  2. Kỷ lục: SEA đã đếm $\#E(\mathbb{F}_p)$ cho $p$ tới $10^{10000}$ chữ số --- dùng trong xây dựng đường cong mật mã và kiểm nghiệm BSD.
  3. Phần mềm: PARI/GP, Magma, SageMath đều cài sẵn SEA. Lệnh E.order() trong SageMath tự động dùng SEA.

Ý nghĩa trực giác

SEA --- “Schoof thông minh hơn”.
  • Hình dung: Schoof hỏi “$a_p \bmod \ell$?” bằng cách thử tất cả trên $E[\ell] \cong (\mathbb{Z}/\ell\mathbb{Z})^2$ (hai chiều). Elkies nói: “nếu Frobenius có giá trị riêng mod $\ell$, ta chỉ cần kiểm tra trên eigenspace một chiều” → nhanh hơn $\ell$ lần.
  • Isogeny: Elkies prime cho isogeny $E \to E'$ bậc $\ell$. Hạt nhân isogeny là “hướng riêng” mà Frobenius tác động đơn giản. Tính toán trên hạt nhân (bậc $\ell$) thay vì toàn bộ $E[\ell]$ (bậc $\ell^2$).
  • Từ $\ell^2$ xuống $\ell$: Division polynomial bậc $(\ell^2 - 1)/2$ → modular polynomial cho isogeny bậc $\ell$. Giảm mạnh kích thước tính toán.

Liên hệ với giả thuyết Birch--Dyer

SEA và BSD.
  • Công cụ tính toán: SEA là “công cụ nền” cho mọi kiểm nghiệm BSD bằng số --- tính $a_p$ nhanh → tính $L(E, s)$ bằng số → kiểm tra $\mathrm{ord}_{s=1} L = \mathrm{rk}$.
  • LMFDB + Cremona: Dữ liệu hàng triệu EC (conductor $\leq 500{,}000$) đều tính bằng SEA. Mỗi EC kèm $a_p$, $L(E, 1)$, hạng, $\mathrm{Sha}$ --- kiểm nghiệm BSD chi tiết.
  • Isogeny và Selmer: Isogeny (công cụ Elkies) cũng xuất hiện trong tính nhóm Selmer (descent qua isogeny) --- cùng đối tượng phục vụ cả tính toán ($a_p$) và lý thuyết (Selmer/BSD).
221 Bài toán thiên niên kỷ (Millennium Prize Problems) Ch.1 1

Định nghĩa

Định nghĩa (Bài toán thiên niên kỷ). Bài toán thiên niên kỷ (Millennium Prize Problems) là 7 bài toán toán học do Viện Toán Clay (Clay Mathematics Institute, CMI) công bố năm 2000, mỗi bài có giải thưởng 1 triệu USD.

Bảy bài toán:

  1. Giả thuyết Riemann: Mọi zero không tầm thường của $\zeta(s)$ có phần thực $1/2$.
  2. P vs NP: Lớp P có bằng lớp NP không?
  3. Phương trình Navier--Stokes: Sự tồn tại và trơn của nghiệm.
  4. Giả thuyết Hodge: Lớp Hodge trên đa tạp đại số là tổ hợp hữu tỉ lớp đại số.
  5. Giả thuyết Poincaré: Đa tạp compact 3 chiều đơn liên đồng phôi $S^3$. [Đã giải --- Perelman, 2003.]
  6. Giả thuyết Birch và Swinnerton-Dyer: $\mathrm{rk}(E(\mathbb{Q})) = \mathrm{ord}_{s=1} L(E, s)$.
  7. Lý thuyết Yang--Mills: Tồn tại “mass gap” trong lý thuyết gauge lượng tử.

Ví dụ

Ví dụ (Bảy bài toán --- tình trạng).
  1. Đã giải (1/7): Poincaré Conjecture --- Grigori Perelman (2003), dùng Ricci flow (Hamilton). Perelman từ chối giải thưởng $1M và Huy chương Fields.
  2. Tiến bộ đáng kể: Riemann ($\sim 40\%$ zero kiểm nghiệm, nhưng chưa chứng minh). BSD ($66.48\%$ EC thỏa mãn --- Bhargava--Skinner--Zhang).
  3. Ít tiến bộ: P vs NP (hầu như không có chiến lược rõ ràng). Navier--Stokes (chỉ biết cho dữ liệu ban đầu nhỏ).
  4. BSD trong 7 bài toán: BSD là bài toán duy nhất về lý thuyết số (trực tiếp), liên kết giải tích ($L$-function), đại số (nhóm Mordell--Weil), và hình học (đường cong elliptic).

Ý nghĩa trực giác

Bài toán thiên niên kỷ --- “đỉnh Everest của toán học”.
  • Hình dung: 7 bài toán như 7 đỉnh núi cao nhất --- mỗi bài đại diện một lĩnh vực cốt lõi. Giải một bài = chinh phục một đỉnh = mở ra hiểu biết mới sâu sắc cho toàn ngành.
  • Tại sao được chọn? Mỗi bài toán: (1) phát biểu dễ hiểu (ít nhất ở mức sơ cấp); (2) đã chống lại mọi nỗ lực hàng chục/trăm năm; (3) nếu giải, sẽ có ảnh hưởng sâu rộng đến nhiều nhánh toán.
  • Thực tế: Giải thưởng $1M “ít quan trọng” so với danh dự --- người giải sẽ đi vào lịch sử. Perelman từ chối giải thưởng nhưng đã “bất tử hóa” tên mình.

Liên hệ với giả thuyết Birch--Dyer

Bài toán thiên niên kỷ và BSD.
  • BSD = Bài toán #6: BSD nằm trong danh sách danh giá nhất toán học hiện đại. Giải thưởng $1M của Clay chính thức hóa tầm quan trọng.
  • Liên hệ với Riemann: Giả thuyết Riemann (bài toán #1) liên quan $\zeta(s)$ --- “cha” của hàm $L(E, s)$. Nếu GRH (Riemann mở rộng) đúng, nhiều kết quả BSD sẽ cải thiện.
  • Tiêu chí Clay: Để nhận giải, cần chứng minh “BSD yếu hoàn toàn” ($\mathrm{ord} = \mathrm{rk}$ cho mọi $E/\mathbb{Q}$) hoặc phiên bản mạnh tương đương. Hiện tại: chứng minh cho $\mathrm{rk} \leq 1$ + $66.48\%$ EC, nhưng chưa đủ.
222 Viện Clay (Clay Mathematics Institute) Ch.1 1

Định nghĩa

Định nghĩa (Viện Toán Clay). Viện Toán Clay (Clay Mathematics Institute, CMI) là tổ chức phi lợi nhuận thành lập năm 1998 bởi Landon T. Clay (doanh nhân Boston), với sứ mệnh “tăng cường và phổ biến kiến thức toán học”.

Hoạt động chính:

  • Giải thưởng Thiên niên kỷ: 7 bài toán $\times$ $1M = $7M tổng giải thưởng (công bố 24/5/2000 tại Collège de France, Paris).
  • Clay Research Awards: Giải thưởng hàng năm cho nhà toán học trẻ xuất sắc.
  • Clay Research Fellowships: Học bổng 5 năm cho tiến sĩ trẻ tài năng. Nhiều người nhận sau đó đoạt Fields Medal (Tao, Mirzakhani, Venkatesh, \ldots).
  • Hội thảo và trường hè: Tài trợ các hoạt động học thuật toán học.

Trụ sở: Oxford, Anh (từ 2005, trước đó ở Cambridge, Massachusetts).

Ví dụ

Ví dụ (Clay và toán học).
  1. Sự kiện 2000: Bảy bài toán được chọn bởi hội đồng gồm Atiyah, Bombieri, Connes, Deligne, Fefferman, Milnor, Mumford, Wiles, Witten. Danh sách phản ánh “sự đồng thuận” của giới toán về các vấn đề trung tâm.
  2. Perelman (2010): CMI trao giải $1M cho Perelman (giải Poincaré). Perelman từ chối: “Tôi không cần tiền. Nếu chứng minh đúng, đó là phần thưởng đủ rồi.”
  3. BSD và Clay: Andrew Wiles --- người viết bài miêu tả chính thức BSD cho Clay --- cũng là người chứng minh modularity theorem (nền tảng quan trọng nhất cho BSD). Wiles nhận Giải Abel 2016.

Ý nghĩa trực giác

Viện Clay --- “hải đăng” cho nghiên cứu toán.
  • Hình dung: Clay giống “hải đăng” chiếu sáng những bài toán quan trọng nhất, thu hút sự chú ý và nỗ lực của cả thế hệ toán học. $1M không phải mục đích chính --- mà là sự công nhận tầm quan trọng.
  • Hilbert 1900 vs Clay 2000: Hilbert đặt 23 bài toán năm 1900, định hướng toán học thế kỷ 20. Clay đặt 7 bài toán năm 2000, định hướng thế kỷ 21. BSD nằm trong cả hai danh sách (liên quan bài toán 10 Hilbert).
  • Tác động: Đặt bài toán Thiên niên kỷ khiến BSD được biết đến rộng rãi hơn --- không chỉ trong giới chuyên gia mà cả công chúng quan tâm toán học.

Liên hệ với giả thuyết Birch--Dyer

Viện Clay và BSD.
  • Công nhận chính thức: BSD được Clay chọn là 1 trong 7 bài toán quan trọng nhất --- khẳng định vị trí trung tâm trong toán học hiện đại.
  • Tiêu chí giải: Bài giải phải được công bố trên tạp chí uy tín và “chấp nhận rộng rãi” ít nhất 2 năm trước khi xét giải. Điều này đảm bảo tính chính xác.
  • Trạng thái: BSD vẫn mở --- dù có tiến bộ lớn ($\mathrm{rk} \leq 1$ giải xong, $66.48\%$ EC thỏa mãn), chứng minh tổng quát vẫn “xa vời” theo đánh giá của hầu hết chuyên gia.
223 Hình học đại số (Algebraic geometry) Ch.1 5

Định nghĩa

Định nghĩa (Hình học đại số). Hình học đại số (algebraic geometry) là ngành toán nghiên cứu tập nghiệm của hệ phương trình đa thức, gọi là đa tạp đại số (algebraic variety).

Ý tưởng cốt lõi: Dùng phương trình đại số để định nghĩa “hình” và dùng công cụ đại số (vành, iđêan, sheaf) để nghiên cứu tính chất hình học.

Các đối tượng:

  • Đường cong đại số: Nghiệm của $f(x, y) = 0$ --- đường cong elliptic $y^2 = x^3 + ax + b$ là ví dụ quan trọng nhất.
  • Mặt đại số: Nghiệm của $f(x, y, z) = 0$ --- ví dụ: mặt K3, abelian surface.
  • Đa tạp: Tổng quát hóa lên nhiều chiều. Genus là bất biến tô-pô cơ bản: genus 0 (đường conic), genus 1 (đường cong elliptic), genus $\geq 2$ (siêu elliptic).

Các giai đoạn: Hình học đại số cổ điển (thế kỷ 19, Italy) → Weil--Zariski (1940s, nền tảng mới) → Grothendieck (1960s, schéma, đối đồng điều étale) → hiện đại (derived, motivic).

Ví dụ

Ví dụ (Hình học đại số --- từ đơn giản đến phức tạp).
  1. Đường thẳng: $y = 2x + 1$ --- đa tạp đại số đơn giản nhất (affine, chiều 1, genus 0). Có vô hạn điểm hữu tỉ.
  2. Đường conic: $x^2 + y^2 = 1$ --- genus 0, có tham số hóa hữu tỉ. Vô hạn điểm hữu tỉ (bộ ba Pythagoras!).
  3. Đường cong elliptic: $y^2 = x^3 - x + 1$ --- genus 1. Có thể có vô hạn hoặc hữu hạn điểm hữu tỉ, và BSD cho biết “bao nhiêu”.
  4. Genus $\geq 2$: $y^2 = x^5 - x$ --- genus 2. Faltings (1983): luôn có hữu hạn điểm hữu tỉ. Đường cong Fermat $x^n + y^n = 1$ ($n \geq 4$): genus $\geq 3$ → hữu hạn (Faltings giải phỏng đoán Mordell).

Ý nghĩa trực giác

Hình học đại số --- “hình dạng” giải phương trình.
  • Hình dung: Hình học đại số “nhìn” phương trình --- thay vì tính nghiệm bằng công thức, ta nghiên cứu “hình dạng” tập nghiệm. Hình dạng (genus, kỳ dị, đối đồng điều) quyết định “bao nhiêu” nghiệm hữu tỉ.
  • Ba thế giới: Genus 0 → “dễ” (vô hạn nghiệm, tham số hóa). Genus 1 → “vừa” (có thể vô hạn, BSD quyết định). Genus $\geq 2$ → “hữu hạn” (Faltings). Đường cong elliptic nằm ở “ranh giới” phức tạp nhất!
  • Grothendieck: “Cách mạng” hình học đại số 1960s bằng ngôn ngữ schéma --- cho phép làm việc trên mọi trường (hữu hạn, $p$-adic, số) thống nhất. Nền tảng cho mọi chứng minh BSD hiện đại.

Liên hệ với giả thuyết Birch--Dyer

Hình học đại số và BSD.
  • EC = đối tượng hình học đại số: Đường cong elliptic là đa tạp đại số chiều 1, genus 1, với cấu trúc nhóm. Mọi khái niệm BSD (rút gọn, Néron model, Frobenius, Selmer) đều thuộc hình học đại số.
  • Ngôn ngữ Grothendieck: Đối đồng điều étale, schéma Néron, mô hình tối thiểu --- công cụ Grothendieck là “ngôn ngữ” viết BSD chính xác.
  • BSD mở rộng: BSD cho đa tạp Abel (abelian variety) bậc cao là bài toán hình học đại số thuần túy --- tổng quát hóa tự nhiên trong khuôn khổ Grothendieck.
224 Hình học số học (Arithmetic geometry) Ch.1 6

Định nghĩa

Định nghĩa (Hình học số học). Hình học số học (arithmetic geometry) là ngành giao thoa giữa lý thuyết sốhình học đại số, nghiên cứu tính chất số học (điểm hữu tỉ, rút gọn modulo $p$, hàm $L$) của các đối tượng hình học đại số (đường cong, đa tạp).

Câu hỏi trung tâm: Cho đa tạp đại số $V$ định nghĩa trên $\mathbb{Q}$:

  • $V(\mathbb{Q})$ có khác rỗng không? (Hasse principle, obstruction.)
  • Nếu có, $V(\mathbb{Q})$ “lớn” thế nào? (Hạng Mordell--Weil, chiều cao.)
  • $V(\mathbb{F}_p)$ có bao nhiêu điểm? (Weil conjectures, Frobenius.)
  • Hàm $L(V, s)$ có tính chất gì? (Thác triển, phương trình hàm, giá trị đặc biệt.)

Các nhà sáng lập: Weil (Weil conjectures), Grothendieck (schéma), Serre (đối đồng điều Galois), Tate (đối ngẫu, module Tate), Faltings (Mordell conjecture).

Ví dụ

Ví dụ (Hình học số học --- kết quả lớn).
  1. Weil conjectures (1949, chứng minh 1974 bởi Deligne): $\#V(\mathbb{F}_q)$ thỏa mãn “giả thuyết Riemann” --- liên hệ hình học (đối đồng điều étale) với số học ($\#V(\mathbb{F}_q)$).
  2. Faltings (1983): Đường cong genus $\geq 2$ trên $\mathbb{Q}$ có hữu hạn điểm hữu tỉ (phỏng đoán Mordell). Chứng minh dùng Arakelov geometry --- giao thoa sâu sắc hình học/số học.
  3. Wiles (1995): Modularity = “đường cong elliptic = dạng modular” --- kết nối đối tượng hình học (EC) với đối tượng giải tích (modular form). Hệ quả: Fermat's Last Theorem.
  4. BSD: Kết nối $E(\mathbb{Q})$ (đại số/hình học) với $L(E, s)$ (giải tích) --- “bài toán trung tâm nhất” của hình học số học.

Ý nghĩa trực giác

Hình học số học --- “hình dạng” của số.
  • Hình dung: “Số” (lý thuyết số) và “hình” (hình học) --- hai thế giới tưởng xa nhau. Hình học số học cho thấy chúng “là một”: tính chất hình dạng (genus, đối đồng điều) quyết định tính chất số (số nghiệm, hạng, $L$-function).
  • Triết lý Grothendieck: “Mọi bài toán số học đều là bài toán hình học --- trên schéma $\mathrm{Spec}(\mathbb{Z})$.” Đường cong elliptic trên $\mathbb{Q}$ = morphism $E \to \mathrm{Spec}(\mathbb{Z})$ --- rút gọn modulo $p$ = thớ tại $p$.
  • Thống nhất: Weil conjectures, Langlands, BSD --- tất cả đều nằm trong bức tranh lớn “hình học số học”, kết nối giải tích, đại số, hình học, và tô-pô.

Liên hệ với giả thuyết Birch--Dyer

Hình học số học và BSD.
  • BSD = bài toán trung tâm: BSD là “viên ngọc” của hình học số học --- kết nối ba trụ cột (đại số: $\mathrm{rk}$, giải tích: $L$, hình học: $E$).
  • Công cụ: Mọi chứng minh BSD hiện đại (Gross--Zagier, Kolyvagin, Skinner--Urban) đều dùng công cụ hình học số học: đối đồng điều Galois, schéma Néron, Arakelov theory, modular curves.
  • Tương lai: Giải BSD hoàn toàn có thể đòi hỏi “hình học số học mới” --- có thể là motivic cohomology, derived geometry, hoặc ý tưởng chưa ai nghĩ đến.
225 Lý thuyết số (Number theory) Ch.1 2

Định nghĩa

Định nghĩa (Lý thuyết số). Lý thuyết số (number theory) là ngành toán nghiên cứu tính chất số nguyên $\mathbb{Z}$ và các mở rộng (số hữu tỉ $\mathbb{Q}$, trường số, trường hữu hạn $\mathbb{F}_p$).

Các nhánh chính:

  • Lý thuyết số sơ cấp: Chia hết, số nguyên tố, đồng dư, hàm số học (Euler $\phi$, Möbius $\mu$). Công cụ: tổ hợp, bất đẳng thức.
  • Lý thuyết số đại số: Trường số, vành số nguyên đại số, nhóm lớp, phân rã nguyên tố. Công cụ: đại số trừu tượng.
  • Lý thuyết số giải tích: Phân bố số nguyên tố, hàm zeta/L, sàng. Công cụ: giải tích phức, biến đổi Fourier.
  • Lý thuyết số số học (arithmetic): Đường cong elliptic, dạng modular, biểu diễn Galois. Giao thoa với hình học đại số → hình học số học.

Ví dụ

Ví dụ (Lý thuyết số --- bài toán kinh điển).
  1. Định lý số nguyên tố (1896, Hadamard--de la Vallée-Poussin): $\pi(x) \sim x/\ln x$. Số nguyên tố “dày đặc” --- cứ $\ln x$ số thì có khoảng 1 số nguyên tố.
  2. Fermat's Last Theorem (1637--1995): $x^n + y^n = z^n$ không có nghiệm nguyên dương cho $n \geq 3$. Phát biểu sơ cấp nhưng chứng minh dùng toàn bộ “vũ khí” hiện đại (modularity, Galois representations).
  3. Goldbach conjecture: Mọi số chẵn $\geq 4$ là tổng hai số nguyên tố. Vẫn chưa chứng minh! Nhưng “gần đúng”: Helfgott (2013) chứng minh phiên bản lẻ (mọi số lẻ $\geq 7$ là tổng ba nguyên tố).
  4. BSD: “Bao nhiêu điểm hữu tỉ trên đường cong elliptic?” --- câu hỏi lý thuyết số, trả lời bằng hàm $L$ (giải tích) qua đường cong (hình học).

Ý nghĩa trực giác

Lý thuyết số --- “nữ hoàng toán học”.
  • Gauss: “Toán học là nữ hoàng các ngành khoa học, và lý thuyết số là nữ hoàng của toán học.” Các bài toán số “đơn giản nhất” (phát biểu dễ hiểu) nhưng “sâu nhất” (khó chứng minh nhất).
  • Ứng dụng bất ngờ: Lý thuyết số “thuần túy” (Hardy tự hào “toán tôi không có ứng dụng”) nay là nền tảng mật mã: RSA (phân tích thừa số), ECC (đường cong elliptic), lattice-based crypto (lưới).
  • Thống nhất: Lý thuyết số hiện đại không tách biệt “sơ cấp/đại số/giải tích” mà hợp nhất tất cả --- BSD là ví dụ hoàn hảo (cần cả ba nhánh).

Liên hệ với giả thuyết Birch--Dyer

Lý thuyết số và BSD.
  • BSD thuộc lý thuyết số: BSD là bài toán lý thuyết số “số học” (arithmetic) --- nhánh hiện đại nhất, kết hợp đại số + giải tích + hình học.
  • Tất cả nhánh hội tụ: Sơ cấp (phương trình Diophantus), đại số (nhóm Mordell--Weil, Galois), giải tích (hàm $L$, thác triển), hình học (đường cong, modularity) --- tất cả gặp nhau tại BSD.
  • Giải thưởng: BSD nằm trong 7 bài toán Clay, lý thuyết số đóng góp 2/7 (Riemann + BSD) --- phản ánh vị trí trung tâm của lý thuyết số.
226 Giải tích (Analysis) Ch.1 2

Định nghĩa

Định nghĩa (Giải tích). Giải tích (analysis) là ngành toán nghiên cứu giới hạn, liên tục, vi phân, tích phân, và chuỗi --- nói chung là “toán của vô hạn”.

Vai trò trong lý thuyết số:

  • Giải tích phức: Thác triển giải tích hàm $\zeta(s)$, $L(E, s)$. Phương trình hàm. Phân bố zero.
  • Chuỗi Fourier: Dạng modular $f(\tau) = \sum a_n q^n$. Biến đổi Mellin liên hệ $f \leftrightarrow L(f, s)$.
  • Giải tích hài hòa: Công thức vết Selberg--Arthur. Phương pháp vòng tròn Hardy--Littlewood.
  • Giải tích $p$-adic: Hàm $L$ $p$-adic, lý thuyết Hodge $p$-adic, phân tích trên $\mathbb{Q}_p$.

Ví dụ

Ví dụ (Giải tích trong BSD).
  1. Hàm $L(E, s) = \sum_{n=1}^{\infty} a_n n^{-s}$: Chuỗi Dirichlet --- đối tượng giải tích phức. Hội tụ tuyệt đối cho $\mathrm{Re}(s) > 3/2$. Thác triển ra toàn $\mathbb{C}$ (nhờ modularity) --- kỹ thuật giải tích phức.
  2. Bậc triệt tiêu: $\mathrm{ord}_{s=1} L(E, s)$ --- khái niệm giải tích (bậc zero của hàm giải tích tại $s = 1$). BSD nói: con số giải tích này = con số đại số (hạng).
  3. Biến đổi Mellin: $L(E, s) = \frac{(2\pi)^s}{\Gamma(s)} \int_0^{\infty} f(iy) y^{s-1} dy$ với $f$ là dạng modular --- kết nối “thế giới Fourier” ($f$) với “thế giới Dirichlet” ($L$).
  4. Chu kỳ thực: $\Omega_E = \int_{E(\mathbb{R})} |\omega|$ --- tích phân vi phân trên đường cong --- đối tượng giải tích thực, xuất hiện trong BSD mạnh.

Ý nghĩa trực giác

Giải tích --- “ngôn ngữ” của hàm $L$.
  • Hình dung: Nếu đường cong elliptic là “bài toán” (đại số/hình học), thì hàm $L$ là “câu trả lời” (giải tích). BSD nói: “đọc câu trả lời giải tích sẽ biết đáp án đại số”.
  • Tại sao giải tích cần thiết? Nhóm Mordell--Weil $E(\mathbb{Q})$ “rời rạc” --- khó nghiên cứu trực tiếp. Hàm $L(E, s)$ “liên tục” --- dễ phân tích (thác triển, zero, residue). Giải tích “mượt hóa” bài toán rời rạc.
  • Ngạc nhiên: Tính chất “rời rạc” (hạng, số nguyên) được “mã hóa” trong hàm “liên tục” ($L$-function) --- đây là phép màu sâu sắc nhất của toán học, và BSD là hiện thân của nó.

Liên hệ với giả thuyết Birch--Dyer

Giải tích và BSD.
  • Nửa giải tích: BSD có “nửa giải tích” ($\mathrm{ord}_{s=1} L(E, s)$, chu kỳ $\Omega_E$, hàm $L$ $p$-adic) và “nửa đại số” (hạng, Sha, Tamagawa). BSD nói hai nửa “bằng nhau”.
  • Thác triển: Modularity → $L(E, s)$ có thác triển giải tích ra toàn $\mathbb{C}$ → $\mathrm{ord}_{s=1} L$ có nghĩa. Không có modularity, BSD thậm chí không phát biểu được!
  • Tương lai: Phân tích hài hòa (Langlands), giải tích $p$-adic (Iwasawa), lý thuyết Hodge --- công cụ giải tích tiếp tục là “vũ khí” chính cho BSD.
227 Lý thuyết dây (String theory) Ch.4 6

Định nghĩa

Định nghĩa (Lý thuyết dây và toán học). Lý thuyết dây (string theory) là lý thuyết vật lý giả thuyết trong đó các hạt cơ bản không phải điểm mà là “sợi dây” (string) dao động trong không-thời gian nhiều chiều (thường 10 hoặc 11 chiều).

Liên hệ với toán học:

  • Đường cong elliptic: Compactification trên torus $T^2 = \mathbb{C}/\Lambda$ (tương đương đường cong elliptic trên $\mathbb{C}$) xuất hiện tự nhiên trong lý thuyết dây. $\mathrm{SL}_2(\mathbb{Z})$-invariance = T-duality.
  • Dạng modular: Hàm phân hoạch dây (string partition function) là dạng modular --- bất biến dưới $\mathrm{SL}_2(\mathbb{Z})$ vì hai cách “quấn” dây trên torus cho cùng vật lý.
  • Hàm $L$: Một số nhà vật lý (Candelas, de la Ossa) phỏng đoán rằng “hàm $L$ đường cong elliptic xuất hiện tự nhiên” trong hàm tương quan điểm trên Calabi--Yau.
  • Mirror symmetry: Đối xứng gương Calabi--Yau dẫn đến các đẳng thức bất ngờ trong hình học đếm (enumerative geometry) --- đã kích thích nhiều phát triển toán học thuần túy.

Ví dụ

Ví dụ (Lý thuyết dây và đường cong elliptic).
  1. F-theory (Vafa, 1996): Compactification lý thuyết dây trên không gian mà mỗi “điểm” kèm theo một đường cong elliptic $E_\tau$ (biến theo vị trí). $j$-bất biến $j(\tau)$ mã hóa hình dạng dây. Kỳ dị ($j \to \infty$) = “D7-brane” --- vật thể vật lý!
  2. Hàm Dedekind $\eta(\tau)$: $\eta(\tau) = q^{1/24} \prod_{n=1}^{\infty}(1 - q^n)$ với $q = e^{2\pi i \tau}$ --- xuất hiện trong hàm phân hoạch dây bosonic (chiều 26). Tính modular $\eta(-1/\tau) = \sqrt{-i\tau}\, \eta(\tau)$ phản ánh T-duality.
  3. Moonshine: Liên hệ bất ngờ giữa nhóm Monster (đại số) và $j(\tau)$ (giải tích/dạng modular) --- giải thích bởi lý thuyết trường conformal (CFT, một phần của lý thuyết dây). Borcherds nhận Fields Medal 1998.

Ý nghĩa trực giác

Lý thuyết dây --- “vật lý nuôi toán”.
  • Hình dung: Lý thuyết dây như “nhà máy” sản xuất phỏng đoán toán học --- vật lý gợi ý “điều gì nên đúng”, rồi nhà toán học chứng minh nghiêm ngặt. Mirror symmetry, Moonshine, geometric Langlands --- tất cả có nguồn gốc vật lý.
  • Đường cong elliptic ở đâu? Torus phức $\mathbb{C}/\Lambda$ là “hình dạng chiều thêm” (extra dimension) trong compactification. Không-thời gian 10 chiều $= 4$ chiều thường $+ 6$ chiều compact (Calabi--Yau), và torus phức (EC) là viên gạch xây Calabi--Yau.
  • Cảnh báo: Lý thuyết dây chưa có kiểm nghiệm thực nghiệm trực tiếp. Nhưng giá trị toán học là không thể phủ nhận --- hàng trăm định lý toán thuần túy đã được chứng minh nhờ trực giác vật lý.

Liên hệ với giả thuyết Birch--Dyer

Lý thuyết dây và BSD.
  • Liên hệ gián tiếp: Lý thuyết dây không “chứng minh” BSD, nhưng cung cấp ngôn ngữtrực giác --- ví dụ: dạng modular, hàm $L$, Langlands correspondence đều có diễn giải vật lý.
  • Geometric Langlands: Phiên bản “hình học” của Langlands (kích thích bởi gauge theory, Kapustin--Witten 2006) có thể dẫn đến hiểu biết mới về Langlands số học → BSD.
  • Tương lai: Nếu lý thuyết dây đúng (hoặc ít nhất “toán học đúng”), liên hệ EC/dạng modular/hàm $L$ với vật lý có thể cho góc nhìn mới về BSD --- từ “tại sao hạng = bậc triệt tiêu?” đến “vì vật lý đòi hỏi!”.