Biến ngẫu nhiên
Bách khoa toàn thư mở Wikipedia
Biến ngẫu nhiên là một thuật ngữ được dùng trong toán học và thống kê. Trong một phép thử ngẫu nhiên (random experiment), đầu ra (outcome) của nó có thể là giá trị số hoặc không phải. Ví dụ phép thử ngẫu nhiên là tung một đồng xu lên và xét mặt nào của đồng xu ở phía trên, thì kết quả đầu ra có thể là {sấp, ngửa} (đầu ra không phải là số). Ví dụ phép thử ngẫu nhiên là tung con xúc sắc và xem mặt nằm phía trên là có mấy chấm, thì kết quả đầu ra có thể là {1,2,3,4,5,6} (đầu ra là số). Tuy nhiên, trong các ứng dụng của thống kê, người ta muốn mỗi đầu ra đều gắn với một đại lượng đo đạc được, hay còn gọi là thuộc tính có giá trị là số. Để thực hiện điều này, người ta định ra biến ngẫu nhiên để ánh xạ mỗi đầu ra của một phép thử ngẫu nhiên với một giá trị số.
Biến ngẫu nhiên là một hàm toán học với đặc điểm: nó gán một giá trị bằng số cho kết quả (đầu ra) của một phép thử ngẫu nhiên (thực nghiệm).
với ζ là đại diện cho đầu ra của một thực nghiệm, x là một số thực, X là hàm ánh xạ (hay là biến ngẫu nhiên). Vì thế, người ta còn gọi X là biến ngẫu nhiên giá trị thực (real-valued random variable) .
Ví dụ: trong phép thử ngẫu nhiên tung đồng xu, ta định ra một biến ngẫu nhiên tương ứng
Ví dụ: trong phép thử ngẫu nhiên tung con xúc xắc, vì đầu ra vốn dĩ đã là số thực, nên ta có thể ánh xạ trực tiếp đầu ra bằng hàm đồng nhất thức
Phép thử ngẫu nhiên trong trường hợp tung con xúc xắc còn được gọi là phép thử ngẫu nhiên có giá trị bằng số (numerically valued random experiment)
.Thuật ngữ biến trong biến ngẫu nhiên không có nghĩa nó là một biến như các biến toán học khác, mà thực chất nó là một hàm số (hay ánh xạ). Ta không thể gán giá trị cụ thể cho một biến ngẫu nhiên; một biến ngẫu nhiên không mô tả kết quả thực tế của một thực nghiệm cụ thể, nó dùng các số thực để mô tả các kết quả có thể có nhưng chưa xác định.
Thuật ngữ ngẫu nhiên trong biến ngẫu nhiên không có nghĩa nó là một hàm số ngẫu nhiên, mà nó là một hàm số được xác định. Tính ngẫu nhiên được thể hiện ở tham số đầu vào ζ. Điều này dẫn tới đầu ra của hàm (hay biến ngẫu nhiên) là ngẫu nhiên. Nói tóm lại, biến ngẫu nhiên có thể được xem là kết quả bằng số của việc vận hành một cơ chế không đơn định hoặc thực hiện một thực nghiệm không đơn định để tạo ra một kết quả ngẫu nhiên. Ví dụ, một biến ngẫu nhiên có thể mô tả các kết quả có thể của việc chọn ngẫu nhiên một người và đo chiều cao của người đó.
Tuy các ví dụ đơn giản như thả súc sắc và đo chiều cao (như miêu tả ở trên) giúp ta dễ dàng hình dung về ứng dụng thực tế của các biến ngẫu nhiên, cấu trúc toán học của chúng mang lại cho các nhà toán học sự thuận tiện khi làm việc với lý thuyết xác suất độ đo trong một môi trường quen thuộc hơn với các hàm số giá trị thực. Ngược lại, khái niệm này cũng đặt các thực nghiệm có liên quan đến các kết quả với giá trị là số thực vào trong khuôn khổ lý thuyết độ đo một cách vững chắc.
Mục lục |
[sửa] Các định nghĩa
[sửa] Biến ngẫu nhiên
Một số người cho rằng gọi tên biến ngẫu nhiên là một sự nhầm lẫn, do một biến ngẫu nhiên không phải là một biến mà là một hàm số ánh xạ các biến cố tới các số. Cho A là một σ-đại số và Ω là không gian các biến cố liên quan tới thực nghiệm đang được tiến hành. Trong ví dụ thả súc sắc, không gian các biến cố chính là các kết quả có thể của một lần thả, nghĩa là Ω = { 1, 2, 3, 4, 5, 6 }, và A sẽ là tập lũy thừa của Ω. Trong trường hợp này, một biến ngẫu nhiên thích hợp có thể là hàm đồng nhất (identity function) X(ω) = ω, sao cho nếu kết quả là nhất thì biến ngẫu nhiên cũng sẽ bằng 1. Một ví dụ cũng đơn giản nhưng ít tầm thường hơn là việc tung đồng xu: một không gian thích hợp cho các biến cố có thể là Ω = {S, N} (S: sấp, N: ngửa), và A cũng lại bằng tập lũy thừa của Ω. Một trong số nhiều biến ngẫu nhiên có thể được định nghĩa trên không gian này là
Một biến ngẫu nhiên được định nghĩa như là một hàm đo được (measurable function) từ một không gian xác suất tới một không gian đo được nào đó. Không gian đo được này là một không gian của các giá trị có thể của biến, và nó thường được lấy là các số thực với Borel σ-đại số. Phần còn lại của bài này sử dụng giả thuyết đó, trừ khi được chỉ rõ.
Cho không gian xác suất (Ω, A, P). Một hàm X: Ω → R là một biến ngẫu nhiên giá trị thực nếu với mọi tập con Ar = { ω : X(ω) ≤ r } trong đó r ∈ R, ta cũng có Ar ∈ A. Định nghĩa này có tầm quan trọng ở chỗ nó cho phép ta xây dựng hàm phân bố của biến ngẫu nhiên.
[sửa] Các hàm phân bố
Nếu cho trước một biến ngẫu nhiên xác định trên không gian xác suất (Ω,P), ta có thể đặt các câu hỏi như "Khả năng giá trị của X lớn hơn 2 là bao nhiêu?". Đó chính là xác suất của biến cố , thường được viết gọn là P(X > 2).
Việc ghi nhận tất cả các xác suất này của các khoảng biến thiên kết quả của một biến ngẫu nhiên giá trị thực X cho ra phân bố xác suất của X. Phân bố xác suất "bỏ quên" không gian xác suất đã được dùng để định nghĩa X và chỉ ghi nhận các xác suất của các giá trị của X. Bao giờ cũng có thể mô tả một phân bố xác suất như vậy bằng hàm phân bố tích lũy của nó.
và đôi khi còn dùng một hàm mật độ xác suất. Theo thuật ngữ lý thuyết độ đo, ta sử dụng biến ngẫu nhiên X để "đẩy" (push-forward) độ đo P trên Ω tới một độ đo dF trên R.
Không gian xác suất Ω là một thiết bị kỹ thuật để đảm bảo sự tồn tại của các biến ngẫu nhiên, và đôi khi để xây dựng chúng. Trong thực tế, người ta thường bỏ qua không gian Ω và chỉ đặt một độ đo lên R mà độ đo này gán số đo bằng 1 cho toàn bộ đường số thực, nghĩa là người ta làm việc với phân bố xác suất thay vì các biến ngẫu nhiên.
[sửa] Hàm của các biến ngẫu nhiên
Nếu ta có một biến ngẫu nhiên X trên Ω và một hàm đo được (measurable function) f: R → R, thì Y = f(X) cũng là một biến ngẫu nhiên trên Ω, do hợp của các hàm đo được cũng là một hàm đo được. Có thể sử dụng quy trình cho phép đi từ một không gian xác suất (Ω, P) tới (R, dFX) để thu được phân bố của Y. Hàm phân bố tích lũy của Y là
[sửa] Ví dụ
Cho X là một biến ngẫu nhiên liên tục giá trị thực và Y = X2. Khi đó,
Nếu y < 0, thì P(X2 ≤ y) = 0, do đó
Nếu y ≥ 0, thì
do đó
- nếu
[sửa] Mômen
Phân bố xác suất của một biến ngẫu nhiên thường được đặc trưng bởi một số các tham số, các tham số này cũng có một cách hiểu thực dụng. Ví dụ, trong nhiều trường hợp, biết "giá trị trung bình" của biến ngẫu nhiên là đủ. Giá trị này được thể hiện bởi khái niệm toán học giá trị kỳ vọng của một biến ngẫu nhiên, được ký hiệu là E[X]. Lưu ý rằng, nói chung, E[f(X)] khác với f(E[X]). Một khi đã biết được "giá trị trung bình", người ta có thể đặt câu hỏi cái giá trị trung bình này cách bao xa đối với các giá trị điển hình của X, câu hỏi này được trả lời bởi các khái niệm phương sai và độ lệch tiêu chuẩn của một biến ngẫu nhiên.
Trong toán học, bài toán (mở rộng) về các mômen (generalised problem of moments) được phát biểu như sau: cho trước một lớp gồm các biến ngẫu nhiên X, tìm một tập hợp {fi} gồm các hàm sao cho các giá trị kỳ vọng E[fi(X)] đặc trưng đầy đủ cho phân bố của biến ngẫu nhiên X.
[sửa] Tính tương đương của các biến ngẫu nhiên
Các biến ngẫu nhiên có thể được coi là tương đương theo một số nghĩa. Hai biến ngẫu nhiên có thể bằng nhau, gần như bằng nhau, trung bình bằng nhau, hoặc phân bố bằng nhau.
Định nghĩa chính xác của các khái niệm trên được cho dưới đây theo thứ tự tăng dần về độ mạnh.
[sửa] Phân bố bằng nhau
Hai biến ngẫu nhiên X và Y có phân bố bằng nhau nếu chúng có các hàm phân bố giống nhau:
Hai biến ngẫu nhiên có các hàm sinh mômen bằng nhau có phân bố bằng nhau. Điều này cung cấp một phương pháp kiểm tra tính bằng nhau của một số hàm nhất định của các biến phân bố đồng nhất độc lập (dependent identical-distributed variable).
Để có phân bố bằng nhau, các biến ngẫu nhiên không cần phải được định nghĩa trên cùng một không gian xác suất.
Khái niệm phân bố tương đương có quan hệ với khái niệm dưới đây về khoảng cách giữa các phân bố xác suất,
đây là căn bản của thử nghiệm Kolmogorov-Smirnov.
[sửa] Giá trị trung bình bằng nhau
Hai biến ngẫu nhiên X và Y là bằng nhau theo trung bình thứ p nếu mômen thứ p của |X − Y| bằng 0, nghĩa là
Đẳng thức đối với trung bình thứ p hàm ý đẳng thức đối với trung bình thứ q với mọi q<p. Cũng như trong trường hợp trước, khái niệm này có liên quan đến một quan hộ khoảng cách giữa các biến ngẫu nhiên, đó là
[sửa] Gần như bằng nhau
Hai biến ngẫu nhiên X và Y là gần như bằng nhau khi và chỉ khi xác suất chúng khác nhau là bằng 0:
Với mọi mục đích thực tiễn trong lý thuyết xác suất, khái niệm tương đương này cũng mạnh như khái niệm bằng nhau thực sự. Nó liên quan đến khoảng cách sau:
trong đó 'sup' trong trường hợp này biểu diễn cận trên thực chất (essential supremum) với ý nghĩa của ngành lý thuyết độ đo.
[sửa] Bằng nhau
Cuối cùng, hai biến ngẫu nhiên X và Y là bằng nhau nếu chúng bằng nhau với vai trò các hàm số trên không gian xác suất của chúng, nghĩa là,
[sửa] Hội tụ
Nhiều thống kê toán học cốt ở việc chứng minh các kết quả hội tụ đối với một số dãy biến ngẫu nhiên nhất định; xem thêm trong những bài như luật số lớn (law of large numbers) và định lý giới hạn trung tâm (central limit theorem).
Một dãy (Xn) gồm các biến ngẫu nhiên có thể hội tụ thành một biến ngẫu nhiên X theo nhiều kiểu khác nhau. Những kiểu đó được giải thích trong bài sự hội tụ của các biến ngẫu nhiên (convergence of random variables).
[sửa] Tham khảo
- ^ Kay, Steven 2006 Intuitive probability and Random Processes using Matlab . Springer.
- ^ Papoulis, Athanasios 1965 Probability, Random Variables, and Stochastic Processes. McGraw-Hill Kogakusha, Tokyo, 9th edition, ISBN 0071199810.
[sửa] Xem thêm
- Biến ngẫu nhiên rời rạc
- Biến ngẫu nhiên liên tục
- Phân bố xác suất
- Biến cố (lý thuyết xác suất)
- Tính ngẫu nhiên
- Véctơ ngẫu nhiên
- Hàm ngẫu nhiên
- Hàm sinh (generating function)
- Lý thuyết thông tin thuật toán (Algorithmic information theory)
Bài này có sử dụng tài liệu từ Random variable tại PlanetMath, với giấy phép sử dụng GFDL.