Chương 2: Không gian hữu hạn chiều (Finite-Dimensional Vector Spaces)
Sau khi định nghĩa "sân khấu" trừu tượng là vector space, chương này sẽ trả lời một câu hỏi cơ bản: Làm thế nào để đo lường "kích thước" của một sân khấu? Chúng ta sẽ giới thiệu các khái niệm basis (cơ sở) và dimension (số chiều), những công cụ cho phép chúng ta định lượng và so sánh các không gian vector, đặc biệt là trong trường hợp hữu hạn chiều, nơi mà trực giác của chúng ta hoạt động tốt nhất.
Cơ sở (Basis)
1. Động lực / Vấn đề cần giải quyết:
Ở chương 1, chúng ta đã biết về span (khả năng "sinh ra" một không gian) và linear independence (tính "không dư thừa"). Vấn đề là làm thế nào để kết hợp hai ý tưởng này? Chúng ta muốn tìm một tập hợp vector "vừa đủ": vừa có thể sinh ra toàn bộ không gian, lại vừa phải là tập hợp nhỏ nhất có thể, không chứa bất kỳ vector thừa thãi nào. Khái niệm basis ra đời để định nghĩa chính xác tập hợp "hiệu quả" này.
2. Khái niệm, Cách hiểu đơn giản:
Một basis của một vector space giống như một bộ "trục tọa độ" hoặc một bộ "viên gạch Lego" cho không gian đó. Nó là tập hợp các vector xây dựng nền tảng, thỏa mãn hai điều kiện:
- Đủ mạnh: Chúng có thể "xây" nên mọi
vectorkhác trong không gian bằng cách tổ hợp tuyến tính (span). - Không thừa: Không có
vectornào trong bộ này có thể được xây từ nhữngvectorcòn lại (linear independence). Mỗivectortrong không gian sẽ có một "bản thiết kế" duy nhất từ những viên gạch này.
3. Định nghĩa toán học:
Một tập con của một vector space được gọi là một basis nếu nó thỏa mãn hai điều kiện:
- là
linearly independent. span(B) = V.
Một kết quả nền tảng (thường được chứng minh bằng Bổ đề Zorn trong trường hợp tổng quát) là mọi vector space đều có một basis. Trong khóa học này, chúng ta chủ yếu tập trung vào các không gian có basis hữu hạn.
4. Ví dụ và Phản ví dụ:
- Ví dụ:
- Trong , tập hợp là một
basis(cơ sở chính tắc). Tập hợp cũng là mộtbasis. - Trong không gian các đa thức bậc không quá 2, , tập hợp là một
basis.
- Trong , tập hợp là một
- Phản ví dụ:
- Trong , tập hợp không phải là
basisvì nó khônglinearly independent(dư thừa). - Trong , tập hợp không phải là
basisvì nó khôngspantoàn bộ không gian (không thể tạo ra cácvectorcó thành phần z khác 0).
- Trong , tập hợp không phải là
5. Ý nghĩa hình học, hoặc ý nghĩa nào đó:
Một basis định nghĩa một hệ tọa độ cho không gian vector. Một khi bạn đã chọn một basis, mọi vector trong không gian đó đều có một "địa chỉ" duy nhất, chính là bộ các hệ số trong tổ hợp tuyến tính biểu diễn vector đó qua basis. Việc thay đổi basis giống như việc xoay hoặc thay đổi tỉ lệ các trục tọa độ.
6. Ứng dụng trong Machine Learning, Deep Learning, hoặc AI:
- Feature Engineering: Các đặc trưng (
features) mà chúng ta chọn để mô tả dữ liệu có thể được xem như mộtbasischo không gian đặc trưng. Một bộ đặc trưng tốt là một bộ độc lập tuyến tính (cung cấp thông tin mới) và có khả năngspan(biểu diễn) được các biến thể quan trọng trong dữ liệu. - Basis Functions in Kernel Methods: Trong các phương pháp
kernel, chúng ta ngầm ánh xạ dữ liệu vào một không gian đặc trưng vô hạn chiều. Các hàmkernelhoạt động như thể chúng ta đang làm việc với mộtbasisvô hạn các hàm phi tuyến, cho phép các mô hình tuyến tính học được các ranh giới phức tạp.
Số chiều (Dimension)
1. Động lực / Vấn đề cần giải quyết:
Chúng ta có thể cảm nhận rằng một đường thẳng "nhỏ hơn" một mặt phẳng, và một mặt phẳng "nhỏ hơn" không gian 3 chiều. Làm thế nào để định lượng một cách chính xác khái niệm "kích thước" hay "số bậc tự do" của một vector space? Số chiều chính là câu trả lời.
2. Khái niệm, Cách hiểu đơn giản:
Dimension của một vector space đơn giản là số lượng vector trong một basis bất kỳ của không gian đó. Một định lý nền tảng đảm bảo rằng mọi basis của cùng một không gian đều có cùng một số lượng vector. Dimension cho bạn biết bạn cần bao nhiêu con số (tọa độ) để xác định vị trí một điểm trong không gian đó.
3. Định nghĩa toán học:
Dimension của một vector space hữu hạn chiều , ký hiệu là , là số lượng vector trong một basis của . Nếu một vector space không có basis hữu hạn, nó được gọi là vô hạn chiều.
Mối liên hệ với không gian con: Nếu là một subspace của , thì:
4. Ví dụ và Phản ví dụ:
- Ví dụ:
- .
- (vì
basislà ). - Không gian các ma trận có .
- Phản ví dụ:
- Không gian tất cả các đa thức là vô hạn chiều.
- Không gian các hàm liên tục là vô hạn chiều.
5. Ý nghĩa hình học, hoặc ý nghĩa nào đó:
Dimension là một bất biến quan trọng nhất của một vector space. Hai không gian vector hữu hạn chiều là "giống hệt nhau" về mặt cấu trúc đại số (isomorphic) khi và chỉ khi chúng có cùng dimension. Điều này có nghĩa là, về mặt trừu tượng, chỉ có một không gian vector 3 chiều duy nhất trên trường , đó chính là . Mọi không gian 3 chiều khác chỉ là một "phiên bản" khác của nó.
6. Ứng dụng trong Machine Learning, Deep Learning, hoặc AI:
- Dimensionality Reduction: Đây là một trong những nhiệm vụ cốt lõi của ML. Dữ liệu thô (ví dụ: hình ảnh) thường có
dimensionrất cao. Các thuật toán như Principal Component Analysis (PCA) hay t-SNE tìm cách chiếu dữ liệu xuống mộtsubspacecódimensionthấp hơn nhiều trong khi vẫn giữ lại được các thông tin quan trọng nhất.Dimensioncủa không gianlatent(không gian ẩn) là một siêu tham số quan trọng trong các mô hình như Autoencoders.
Tổng (Sum) và Tổng trực tiếp (Direct Sum)
1. Động lực / Vấn đề cần giải quyết:
Chúng ta đã biết cách phân tích các không gian vector thành các subspace nhỏ hơn. Bây giờ, chúng ta cần một cách để "ghép" các subspace lại với nhau để tạo thành một không gian lớn hơn. Khái niệm sum và direct sum cung cấp các công cụ đại số để thực hiện việc "xây dựng" này.
2. Khái niệm, Cách hiểu đơn giản:
Sum(Tổng):Sumcủa haisubspacevà là tập hợp tất cả cácvectorbạn có thể tạo ra bằng cách lấy mộtvectortừ cộng với mộtvectortừ . Nếu và là hai đường thẳng khác nhau đi qua gốc tọa độ trong ,sumcủa chúng chính là mặt phẳng chứa cả hai đường thẳng đó.Direct Sum(Tổng trực tiếp): Đây là một loạisum"đẹp" và "không dư thừa". Nó xảy ra khi haisubspacechỉ có một điểm chung duy nhất làvectorkhông. Trong trường hợp này, mọivectortrong không gian tổng có một "công thức" phân tách duy nhất thành một phần từ và một phần từ .
3. Định nghĩa toán học:
Cho là các subspace của .
Sumcủa chúng được định nghĩa là:Sumđược gọi làdirect sum, ký hiệu , nếu mọivectorđều có một biểu diễn duy nhất dưới dạng trên. Điều này tương đương với việc giao của bất kỳsubspacenào với tổng của cácsubspacecòn lại chỉ là .
Định lý về số chiều:
4. Ví dụ và Phản ví dụ:
- Ví dụ:
- Trong , trục x () và trục y () tạo thành một
direct sum, và . - Không gian của tất cả các hàm có thể được phân tích thành
direct sumcủa không gian các hàm chẵn và không gian các hàm lẻ.
- Trong , trục x () và trục y () tạo thành một
- Phản ví dụ:
- Trong , gọi là mặt phẳng xy và là mặt phẳng yz.
Sumcủa chúng là toàn bộ , nhưng nó không phải làdirect sumvì chúng giao nhau trên trục y ().
- Trong , gọi là mặt phẳng xy và là mặt phẳng yz.
5. Ý nghĩa hình học, hoặc ý nghĩa nào đó:
Direct sum là một công cụ phân rã mạnh mẽ. Nó cho phép chúng ta chia một không gian phức tạp thành các thành phần đơn giản hơn, độc lập với nhau. Nhiều định lý quan trọng trong đại số tuyến tính (như Định lý Phổ) về cơ bản là các định lý về việc phân rã một không gian vector thành một direct sum của các không gian con riêng.
6. Ứng dụng trong Machine Learning, Deep Learning, hoặc AI:
- The Four Fundamental Subspaces: Với một ma trận , không gian nguồn có thể được phân rã thành
direct sumcủarow spacevànull space. Không gian đích có thể được phân rã thànhdirect sumcủacolumn spacevàleft null space. Sự phân rã trực giao này là nền tảng của nhiều thuật toán, bao gồm cả Singular Value Decomposition (SVD). - Analysis of Variance (ANOVA): Trong thống kê, tổng bình phương sai lệch có thể được phân rã thành một
sumcủa các thành phần, mỗi thành phần tương ứng với một nguồn biến thiên khác nhau. Về mặt hình học, đây là một sự phân rã của mộtvectortrong một không gian nhiều chiều thành các thành phần nằm trong cácsubspacetrực giao.