Chương 1: Xây dựng Hệ thống Số thực (The Construction of Real Numbers)
Trong chương này, chúng ta sẽ không khám phá những điều mới lạ, bạn hãy tạm quên mọi thứ bạn đã học về số thực, và hãy bắt đầu từ đầu. để xây dựng lại một cách chặt chẽ và logic từ những viên gạch cơ bản nhất là các tiên đề. Điều này để đảm bảo rằng khi chúng ta xây dựng lại số thực, chúng ta sẽ không bỏ qua bất kỳ khía cạnh nào, và hiểu được bản chất của từng phép toán.
Giới thiệu về các tập hợp số (Sets of Numbers)
Trước khi đi sâu vào xây dựng số thực, chúng ta cần làm quen với các tập hợp số cơ bản và các ký hiệu của chúng. Đây là nền tảng để hiểu các tiên đề, tính chất, và các khái niệm cao hơn trong giải tích và đại số.
1. Số tự nhiên (Natural Numbers) – ℕ
- Là tập hợp các số dùng để đếm: 1, 2, 3, 4, …
- Ký hiệu:
- Trong một số tài liệu, 0 cũng được tính là số tự nhiên:
Ví dụ: Bạn có 3 quả táo, 3 là một số tự nhiên.
2. Số nguyên (Integers) – ℤ
- trái ngược lại với số tự nhiên là chỉ đại diện cho những gì bạn đang có, số nguyên mở rộng thêm các con số âm để có thể đại diện cho những gì bạn đang nợ, hoặc thiếu hụt :d
- Bao gồm tất cả các số âm, dương và số 0: …, -3, -2, -1, 0, 1, 2, 3, …
- Ký hiệu:
Ví dụ: Điểm số -2 trên một trục nhiệt độ, hay số tầng -1 trong tòa nhà.
3. Số hữu tỉ (Rational Numbers) – ℚ
- số hữu tỉ là số có thể viết dưới dạng phân số,
- Là các số có thể viết dưới dạng phân số với và
- Ký hiệu:
Ví dụ: 1/2, -3/4, 5 đều là số hữu tỉ (5 = 5/1).
4. Số vô tỉ (Irrational Numbers)
- Là các số không thể viết dưới dạng phân số.
- Chúng có thập phân vô hạn và không tuần hoàn.
Ví dụ:√2, π, e
5. Số thực (Real Numbers) – ℝ
- Bao gồm tất cả số hữu tỉ và số vô tỉ. Số thực có thể nằm trên trục số liên tục mà không có "lỗ hổng".
- Ký hiệu:
Ví dụ: 2, -1, 0.5, , là các số thực.
6. Số phức (Complex Numbers) – ℂ
- Bao gồm các số dạng với và
- Ký hiệu:
Ví dụ: , , là các số phức.
Chú ý: Số thực là một trường hợp đặc biệt của số phức khi .
7. Mối quan hệ giữa các tập hợp số
Các tập hợp số cơ bản được sắp xếp theo thứ bậc bao gồm:
ℕ ⊂ ℤ ⊂ ℚ ⊂ ℝ ⊂ ℂ
Tiên đề về trường (Field Axioms) và thứ tự (Order Axioms)
1. Khái niệm, Cách hiểu đơn giản:
Hãy tưởng tượng tập số thực là một sân chơi hoàn hảo cho các phép toán số học (cộng, trừ, nhân, chia) và so sánh (lớn hơn, nhỏ hơn). Các Tiên đề về trường (Field Axioms) chính là những quy tắc cho việc "chơi" với các phép toán, đảm bảo chúng hoạt động nhất quán. Các Tiên đề về thứ tự (Order Axioms) là những quy tắc cho việc "so sánh", cho phép chúng ta sắp xếp mọi con số trên một đường thẳng. Cùng nhau, chúng tạo nên một trường có thứ tự (ordered field).
2. Định nghĩa toán học:
a) Field Axioms: Trên tập hợp , tồn tại hai phép toán và thỏa mãn:
- Tính giao hoán, kết hợp, tồn tại phần tử trung hòa (0 và 1), tồn tại phần tử nghịch đảo (đối và nghịch đảo) cho cả hai phép toán.
- Tính phân phối: cho mọi .
b) Order Axioms: Tồn tại một tập con các số dương thỏa mãn:
- Tính đóng (Closure): Nếu thì và .
- Tính tam phân (Trichotomy): Với mỗi , chỉ một trong ba điều sau xảy ra: , , hoặc . Từ đó ta định nghĩa nếu .
3. Ý nghĩa hình học, hoặc ý nghĩa nào đó:
Các Field Axioms mang ý nghĩa đại số thuần túy, là bộ luật cho các phép tính. Các Order Axioms mang ý nghĩa hình học, biến tập hợp các con số thành một đường thẳng có thứ tự. Tính tam phân đảm bảo mọi điểm hoặc nằm bên phải 0, bên trái 0, hoặc chính là 0. Quan hệ có nghĩa là điểm nằm về bên phải điểm trên trục số.
4. Ứng dụng trong Machine Learning, Deep learning, hoặc AI …:
- Field Axioms: Nền tảng cho mọi tính toán số học trong mạng neural. Phép nhân ma trận giữa trọng số và dữ liệu đầu vào, hay việc cập nhật trọng số trong thuật toán
gradient descent, đều dựa trên các quy tắc này. - Order Axioms: Cốt lõi của việc tối ưu hóa. Hàm mất mát (
loss function) đo "độ sai" của mô hình, và mục tiêu là làm giá trị này nhỏ nhất có thể. Khái niệm "nhỏ hơn" là nền tảng cho việc so sánh hiệu suất và điều chỉnh mô hình.
Khái niệm supremum (cận trên đúng) và infimum (cận dưới đúng)
1. Khái niệm, Cách hiểu đơn giản:
Hãy tưởng tượng một tập hợp các điểm trên trục số, ví dụ tập . Có vô số "rào chắn" phía trên cho tập này, ví dụ 6, 10, hoặc 5.1. Những số này gọi là cận trên (upper bounds). Trong tất cả các rào chắn này, có một "rào chắn thấp nhất" hay "chặt nhất", đó chính là số 5. Số này được gọi là supremum (cận trên đúng). Tương tự, infimum (cận dưới đúng) là "sàn nhà cao nhất" hay "chặt nhất" của một tập hợp.
2. Định nghĩa toán học:
Cho một tập con khác rỗng .
- Số được gọi là supremum của , ký hiệu , nếu:
- là một cận trên của (tức là với mọi ).
- Nếu là một cận trên bất kỳ của , thì .
- Số được gọi là infimum của , ký hiệu , nếu:
- là một cận dưới của (tức là với mọi ).
- Nếu là một cận dưới bất kỳ của , thì .
3. Ý nghĩa hình học, hoặc ý nghĩa nào đó:
Supremum và infimum xác định một cách chính xác "biên" của một tập hợp trên trục số. là điểm ngoài cùng bên phải mà không "bỏ sót" bất kỳ phần tử nào của , trong khi là điểm ngoài cùng bên trái. Chúng giống như hai chiếc kẹp giữ tập hợp lại, ngay cả khi chính những chiếc kẹp đó không thuộc về tập hợp.
4. Ứng dụng trong Machine Learning, Deep learning, hoặc AI …:
Các hàm kích hoạt (activation functions) trong mạng neural thường giới hạn đầu ra trong một khoảng nhất định. Ví dụ, hàm Sigmoid nhận đầu vào là một số thực bất kỳ nhưng cho ra kết quả trong khoảng . Trong trường hợp này, supremum của tập hợp các giá trị đầu ra là 1 và infimum là 0. Những giới hạn này rất quan trọng trong các bài toán phân loại xác suất.
Tiên đề về sự đầy đủ (Completeness Axiom)
1. Khái niệm, Cách hiểu đơn giản:
Đây là tiên đề phân biệt tập số thực với tập số hữu tỉ . Ý tưởng cốt lõi là: trục số thực không có lỗ hổng. Nếu bạn có một tập hợp các số bị chặn ở trên (ví dụ, các số hữu tỉ có bình phương nhỏ hơn 2), thì luôn luôn tồn tại một "rào chắn trên chặt nhất" (supremum), và quan trọng là, cái rào chắn đó cũng là một số thực. Tập không có tính chất này; nó có một "lỗ hổng" tại vị trí của .
2. Định nghĩa toán học:
Completeness Axiom: Mọi tập con khác rỗng của bị chặn trên đều có một cận trên đúng (supremum) trong .
3. Ý nghĩa hình học, hoặc ý nghĩa nào đó:
Ý nghĩa hình học của sự đầy đủ là tính liên tục (continuum) của trục số. Nó đảm bảo rằng đường thẳng số thực là một đường liền nét. Bất cứ khi nào một dãy số dường như đang tiến đến một điểm, tiên đề này đảm bảo rằng điểm đó thực sự tồn tại. Đây là nền tảng cho toàn bộ Giải tích, bao gồm giới hạn, đạo hàm và tích phân.
4. Ứng dụng trong Machine Learning, Deep learning, hoặc AI …:
Việc huấn luyện một mạng neural là một quá trình tìm kiếm trong một không gian tham số (parameter space) liên tục khổng lồ. Mỗi trọng số (weight) trong mạng là một chiều của không gian này. Tính đầy đủ của đảm bảo không gian này là một continuum, không có "lỗ hổng". Điều này cho phép các thuật toán tối ưu hóa dựa trên gradient có thể thực hiện những bước đi vô cùng nhỏ một cách trơn tru trên "bề mặt mất mát" (loss landscape) để tìm ra điểm cực tiểu.
Tính chất Archimedean (Archimedean Property)
1. Khái niệm, Cách hiểu đơn giản:
Tính chất này nói rằng không có số thực nào "lớn vô hạn" hoặc "nhỏ vô hạn" so với các số khác. Cụ thể, nếu bạn có một que diêm (độ dài ) và một cây sào rất dài (độ dài ), bạn luôn có thể xếp đủ số que diêm nối tiếp nhau để dài hơn cây sào.
2. Định nghĩa toán học:
Cho hai số thực bất kỳ với . Tồn tại một số nguyên dương sao cho .
3. Ý nghĩa hình học, hoặc ý nghĩa nào đó:
Trên trục số, điều này có nghĩa là bạn có thể đi từ điểm 0 đến bất kỳ điểm nào bằng cách thực hiện các bước nhảy có độ dài cố định. Trục số không có những "vùng xa xôi" mà ta không thể với tới được. Mọi thứ đều có thể đo lường được bằng cùng một thước đo.
4. Ứng dụng trong Machine Learning, Deep learning, hoặc AI …:
Trong các thuật toán tối ưu, learning rate (tốc độ học) là một số dương nhỏ. Gradient có thể rất lớn. Tính chất Archimedean đảm bảo rằng dù gradient lớn đến đâu, vẫn tồn tại một số bước cập nhật sao cho tạo ra một sự thay đổi đáng kể cho các trọng số của mô hình. Điều này đảm bảo rằng quá trình học luôn có thể tiến triển.
Tính trù mật của Q trong R (Density of Q in R)
1. Khái niệm, Cách hiểu đơn giản:
Tính chất này nói rằng các số hữu tỉ (, các số có thể viết dưới dạng phân số) được "rải" khắp nơi trên trục số thực. Giữa hai số thực bất kỳ, dù chúng có gần nhau đến đâu, bạn luôn có thể tìm thấy ít nhất một số hữu tỉ.
2. Định nghĩa toán học:
Cho hai số thực bất kỳ với . Tồn tại một số hữu tỉ sao cho .
3. Ý nghĩa hình học, hoặc ý nghĩa nào đó:
Mặc dù tập số hữu tỉ có "vô số lỗ hổng" (các số vô tỉ), các lỗ hổng này không tạo ra những khoảng trống có độ dài. Bất kỳ một đoạn thẳng nhỏ nào trên trục số, dù nhỏ đến đâu, cũng đều chứa vô số số hữu tỉ. Điều này có nghĩa là chúng ta có thể xấp xỉ (approximate) một số thực bất kỳ bằng một số hữu tỉ với độ chính xác mong muốn.
4. Ứng dụng trong Machine Learning, Deep learning, hoặc AI …:
Đây là một trong những cầu nối quan trọng nhất giữa toán học lý thuyết và AI thực tiễn. Máy tính không thể biểu diễn số vô tỉ một cách chính xác. Chúng sử dụng các kiểu dữ liệu có độ chính xác hữu hạn như floating-point numbers (ví dụ: float32, float64), vốn là các số hữu tỉ, để xấp xỉ các số thực. Tính trù mật của trong là sự bảo đảm về mặt toán học rằng việc xấp xỉ này là hợp lệ và đáng tin cậy cho các tính toán trong AI.