Xác suất thống kê là nền tảng quan trọng cho các mô hình máy học và phân tích dữ liệu. Bài viết này của tôi ghi lại những kiến thức và khái niệm cơ bản nhất về xác suất thống kê, giúp bạn đọc có thể tham khảo và ôn tập lại kiến thức của môn học này.
Bạn Đang Xem: Xác suất thống kê 1 – Các khái niệm cơ bản
Xác suất, xác suất có điều kiện, công thức Bayes
1. thử nghiệm, sự kiện, không gian mẫu
Khái niệm
-
Thí nghiệm ngẫu nhiên là một loạt các phương pháp tiến hành và quan sát thí nghiệm cho chúng ta những kết quả không thể đoán trước.
-
Sự kiện chính là kết quả đơn giản nhất có thể quan sát được và không thể chia cắt của một thử nghiệm.
-
không gian mẫu ($s$) là tập hợp tất cả các sự kiện cơ bản của một thử nghiệm, mâu thuẫn với nhau, được ký hiệu là s.
-
Mọi tập hợp con của không gian mẫu được gọi là biến cố.
thuộc tính
-
Không gian mẫu $omega$ là một tập hợp, thực tế nó là tập con của $omega$ nên mọi quan hệ (tập con, tương đương) và phép toán (hợp, giao, bù, phép trừ) tương tự như lý thuyết tập hợp.
-
Không tương thích: $ a_{1}, dots , a_{n}$ được gọi là không tương thích nếu $ a_{i} cap a_{j } = emptyset, forall i ne j$.
-
Tính đầy đủ: $ a_{1}, dots , a_{n} nếu $ a_{i} cup dots cup a_{ n} $ được coi là hoàn thành =s $.
-
Không gian sự kiện: $ a_{1}, dots , a_{n} $ Nếu vừa không tương thích vừa đủ đầy thì được gọi là không gian sự kiện.
2. xác suất
Khái niệm, tính chất
xác suất của một phép thử là ánh xạ $p(.)$ từ không gian mẫu sang tập hợp các số thực sao cho:
-
- Đối với tất cả các sự kiện $a$ thì $p(a) geq 0$.
-
- $p(omega) = 1$.
-
- Đối với $a_{1}, a_{2},dots $ xung đột thì:
-
- $p(emptyset) = 0$
-
- $a, b$ không tương thích thì $p(a cup b) = p(a) + p(b)$.
-
- $a, b$ bất kỳ $p(a cup b) = p(a) + p(b) – p(a cap b) $.
- Công thức nhân:
- Hai biến cố được gọi là độc lập khi và chỉ khi:
- $p(a)$ được gọi là xác suất trước.
- $p(b)$ được gọi là xác suất hậu nghiệm.
- $p(b) = p(b|a) times p(a) + p(b|bar{a}) times p(bar{a})$.
- $p(a|b)$ được gọi là xác suất hậu nghiệm.
- $p(b|a)$ được gọi là xác suất đúng (khả năng xảy ra).
- Rời rạc: Một tập hợp các giá trị rời rạc, đếm được. Khái niệm đếm được ở đây được hiểu theo nghĩa toán học, tức là nó có thể mô tả cách đếm không bỏ sót phần tử nào của tập hợp số, nhưng không thể bỏ sót phần tử nào của tập hợp số. number phải có hữu hạn phần tử. Bạn có thể đọc thêm về khái niệm này tại đây.
- Liên tục: Tập hợp các giá trị là liên tục, nghĩa là nó lấp đầy một khoảng và không đếm được.
- $p_x(x) geq 0, forall x in mathbb{r}$
- $sum_{i=1}^{n}p_x(x_i) = 1$
- $f_x(-infty) = 0; f_x(+infty) = 1$
- $p(x leq a) = f_x(a); p(x > a) = 1 – f_x(a)$
- $p(a < x leq b) = f_x(b) – f_x(a)$
- Hàm trọng số
- Hàm phân phối xác suất $f_x(x) = begin{cases} 0; & x < 1 \ 1/6; & x < 2 \ 2/6; & x < 3 3/6; & x < 4 \ 4/6; & x < 5 \ 5/6; & x < sáu mươi mốt; & x geq 6; x in omega end{ trường hợp }$
- In bảng phân phối xác suất theo giá trị mô phỏng.
- Viết hàm trọng số và hàm phân phối xác suất.
- Tính xác suất để lần tung xúc xắc lớn hơn 2 và không lớn hơn 4.
- Không có âm thanh: $f(x) ge 0 ~~~, forall x in mathbb{r}$
- Tổng số miền bằng 1: $int_{-infty}^infty f(x)dx = 1$
- $f(x)=int_{-infty}^xf(t)dt$
- $p(a leq x < b) = f_x(a) – f_x(b) = int_a^b f_x(t)dt$
- $e(c) = c$ trong đó $c$ là hằng số
- $e(cx) = ce(x)$ trong đó $c$ là hằng số
- $e[ax+b] = ae[x]+b $ trong đó $a, b$ là các hằng số
- $e[x+y] = e[x]+e[y]$
- $e[xy] = e[x]e[y]$ trong đó $x, y$ độc lập
- $e[g(x)] = begin{cases} displaystylesum_{forall i} g(x_i)p_x(x_i) &text{nếu x rời rạc} cr displaystyle int_ {-infty}^infty g(x)f(x)dx &text{nếu x liên tục} end{cases} $
- $var(c) = 0$ trong đó $c$ là hằng số
- $var(cx) = c^2var(x)$ trong đó $c$ là hằng số
- $var(ax+b) = a^2var(x)$ trong đó $a, b$ là các hằng số
- $var(x+y) = var(x)+var(y)$ trong đó $x, y$ độc lập
- Kỳ vọng là thời điểm của lệnh 1 tại đó $a=0$.
- Phương sai là thời điểm thứ hai của $a=e[x]$.
Định nghĩa xác suất cổ điển
Xác suất cổ điển dựa trên không gian mẫu hữu hạn và cũng có khả năng $omega = {w_1, w_2, dots, w_n}$.
Vì các sự kiện có khả năng xảy ra như nhau nên $p(w_1) = p(w_2) = dots = p(w_n)$.
Làm $1 = p(omega) = p({w_1}) + p({w_2}) + dots + p({w_n}) = np({w_1})$ nên $p({w_i} ) = frac{1}{n}, forall i = overline{1,n}$.
a là một sự kiện thì $p(a) = frac{#a}{#omega}$.
Xác suất có điều kiện
Một phép thử Nếu sự kiện $b,p(p)ne 0$ đã biết đã xảy ra, thì xác suất của sự kiện a xảy ra là xác suất có điều kiện $p(a|b)$ được xác định theo công thức:
$$ p(a|b) = frac{p(a cap b)}{p(b)} $$
Xem Thêm: Điều chế N2 trong phòng thí nghiệm và công nghiệp ra sao?
$$ p(a cap b) = p(b).p(a|b) = p(a).p(b|a) $$
$$ p(a cap b) = p(a).p(b) $$
3. Công thức Bayes
Tổng xác suất
$$ sum_{i=1}^n(p(a_i.p(b|a_i))) $$
Công thức Bayes
Công thức Bayes cho 2 biến cố $a$, $b$
Đối với hai biến cố $a, b$ và $p(a), p(b)$ là xác suất của hai quan sát độc lập.
Xem Thêm : Định luật Jun Len Xơ là gì? Công thức tính định luật Jun Len Xơ từ A – Z
Chúng ta có một công thức Bayesian cho 2 sự kiện $a$ và $b$
$$ p(a|b) = frac{p(a).p(b|a)}{p(b)} $$
$$ hậu thế = khả năng lần trước / bằng chứng $$
Công thức Bayes chung:
Đối với không gian sự kiện $a_1, dots, a_n$. b là một biến cố.
Ta có công thức tính tổng xác suất:
$$ p(b) = sum_{i=1}^{n}p(a_i).p(b|a_i) $$
Công thức Bayes chung cho nhiều biến cố:
$$ p(a_i|b) = frac{p(a_i cap b)}{p(b)} = frac{(p(a_i cap b))}{sum_{i=1 }^n(p(a_j).p(b|a_j))}$$
Biến ngẫu nhiên và phân phối xác suất
1. biến ngẫu nhiên
Khái niệm
Biến ngẫu nhiên là biến nhận các giá trị ngẫu nhiên đại diện cho kết quả của một phép thử. Mỗi giá trị $x$ nhận được của biến ngẫu nhiên $x$ được gọi là một thể hiện của $x$, cũng là kết quả của một phép thử hay còn gọi là một biến cố.
Có hai loại biến ngẫu nhiên:
Ví dụ
Khi tung hai con xúc xắc, gọi x và y lần lượt là số xuất hiện trên mặt xúc xắc thứ nhất và thứ hai thì x và y là hai biến ngẫu nhiên vì chúng có kết quả bằng nhau. Các hàm như $x + y, 2xy, sin(xy)$ cũng là các biến ngẫu nhiên.
2. Phân phối xác suất
Hàm khối lượng xác suất (pmf)
Xét một biến ngẫu nhiên rời rạc $x$, có miền có thể nhận $(x_1, x_2, dots, x_n$. Hàm trọng số của biến ngẫu nhiên rời rạc được biểu thị như sau:
Xem Thêm: Giải SBT Vật lý 9: Bài 42-43. Thấu kính hội tụ. Ảnh của một vật tạo
$$ p_x(x) = p(x = x), forall x in mathbb{r} $$
Ý nghĩa: Hàm trọng số biểu thị xác suất của một điểm $x$.
Tính năng
Hàm phân phối tích lũy (cdf)
Hàm phân phối xác suất của biến ngẫu nhiên $x$ là một hàm được xác định bởi công thức:
$$ f_x(x) = p(x le x), forall x in mathbb{r} $$
Ý nghĩa: Hàm phân phối xác suất là xác suất của biến cố “biến ngẫu nhiên $x$ nhận giá trị trong khoảng từ $−infty$ đến $x$”. Khi có các hàm phân phối, chúng ta thực hiện với các hàm phân tích, thay vì làm toán với các dữ kiện.
Tính năng
$x$ là biến ngẫu nhiên rời rạc thì $f_x(x) = sum x_i <; xp_x(x_i)$
Ví dụ về hàm trọng số và phân phối xác suất
Tung xúc xắc. $x$ là số điểm xảy ra. Các giá trị x có thể là $s = {1, 2, 3, 4, 5, 6}$
$$ p_x(x) = begin{cases} 1/6; & x in omega \ 0; & x notin omega end{cases} $$
Thí nghiệm ném xúc xắc mô phỏng
Xem Thêm : Lời hỏi thăm tiếng Anh hay và phổ biến bạn cần biết
Mô phỏng tung một con xúc xắc gần 5000 lần.
Đồ thị hàm trọng số
Đồ thị hàm phân phối xác suất
Hàm xác suất mật độ (pdf)
Với $x$ là một biến ngẫu nhiên liên tục, thì $p(x = x) = 0, forall x in mathbb{r}$. Do đó, sẽ không có ý nghĩa gì khi xem xét giá trị xác suất của một điểm với một biến ngẫu nhiên liên tục. Trong trường hợp này, chúng ta có khái niệm hàm mật độ xác suất (pdf – xác suất mật độ hàm) để ước tính mức độ tập trung của xác suất trong vùng lân cận của một điểm nhất định. Hàm mật độ xác suất $f(x)$ tại một điểm $x$ được xác định bằng cách lấy đạo hàm của hàm phân phối tích lũy $f(x)$ tại điểm đó:
$$ f(x) = f^{prime}(x) $$
Tính năng
Đồ thị hàm mật độ xác suất
Xem Thêm: Giải Toán lớp 6 Bài 16 Phép nhân số nguyên Sách Kết nối tri thức
Sau đây là một ví dụ đồ thị về hàm mật độ xác suất của một phân bố chuẩn.
Đồ thị hàm mật độ xác suất
3. Giá trị riêng
Mong chờ
Kỳ vọng của một biến ngẫu nhiên chính là giá trị trung bình của biến ngẫu nhiên. Kỳ vọng của biến ngẫu nhiên $x$ được biểu thị bằng $e[x]$: $$e[x]=begin{cases} displaystylesum_{forall i} x_ip_i &text{với x rời rạc } cr displaystyleint_{-infty}^infty xf(x)dx &text{với x liên tục} end{cases} $$
Lưu ý rằng giá trị trung bình của biến ngẫu nhiên ở đây là trung bình có trọng số, không phải trung bình của xác suất của biến ngẫu nhiên.
Tính năng
Phương sai
Dựa trên kỳ vọng, chúng ta sẽ nhận được giá trị trung bình của biến ngẫu nhiên, nhưng nó không cung cấp cho chúng ta thông tin về mức độ lan truyền của xác suất, vì vậy chúng ta cần một cách để đo lường mức chênh lệch này. Một trong những phương pháp này là phương sai.
Phương sai $var(x)$ là giá trị trung bình của bình phương khoảng cách của biến ngẫu nhiên $x$ so với giá trị trung bình: $$var(x) = e[(x-e[x])^2] = e [ x^2 ]-e^2[x]$$
Ta thấy rằng phương sai luôn là một giá trị không âm, phương sai càng lớn thì độ phân tán của dữ liệu càng rộng, tức là độ ổn định càng nhỏ.
Tính năng
Độ lệch chuẩn
Vì đơn vị của phương sai là bình phương nên không thể tính được đơn vị của các biến ngẫu nhiên phù hợp, vì vậy khái niệm độ lệch chuẩn (sd-Standard Lệch) được thêm vào. ) bằng căn bậc hai của phương sai.
$$sigma(x)=sqrt{var(x)}$$
Người ta cũng sử dụng $sigma^2(x)$ để biểu thị phương sai của một biến ngẫu nhiên $x$.
Trung bình
Trung vị là điểm mà tại đó xác suất được chia thành 2 phần bằng nhau, được biểu thị bằng $med(x)$: $$p(x < med(x)) = p(x ge med( x ) ) = 0,5$$
Vậy trung vị là nghiệm của phương trình xác suất tích lũy: $f_x(x) = 0,5$
Ngay lập tức
là khái niệm chung về kỳ vọng và phương sai. Định nghĩa về thời điểm $k$ xung quanh $c$ như sau:
$$m_k = e[(x-a)^k]$$
Như vậy:
Lưu ý: Mô tả này đang được xây dựng. Nếu bạn thấy lỗi, vui lòng cho tôi biết trong phần nhận xét bên dưới hoặc nhắn tin cho tôi qua trang liên hệ. Cảm ơn!
$$ p(a_{1} cup a_{2} dots) = p(a_{1}) + p(a_{2}) + dots $$
Theo 3 tiên đề trên, ta có thuộc tính:
-
-
Nguồn: https://anhvufood.vn
Danh mục: Giáo Dục
- Dienmaystar.vn – máy chiếu, máy đếm tiền, máy chấm công, máy photocopy, bảng điện tử tương tác, máy hủy tài liệu, hủy giấy, bộ đàm, máy hút ẩm, máy in hóa đơn, mã vạch
- Bí Quyết Nấu Chè Bắp Mỹ Cực Ngon
- Cách nấu bún măng gà thơm ngon bổ dưỡng, cực hấp dẫn – VinID
- Phân tích chi tiết giếng nước, ngọc trai trong Truyện An Dương Vương
- Cơm gà – Đặc sản dọc miền đất nước gây thương nhớ cho du khách