Xác suất thống kê
Có thể bạn quan tâm

Thắng cảnh nổi tiếng đất Cần Thơ – Phòng bán vé

Giải Toán 9 Bài 1: Sự xác định đường tròn Tính chất đối xứng của

Soạn bài Quê hương siêu ngắn | Ngữ văn lớp 8

Bài 2 trang 54 SGK Ngữ văn 8 tập 1

Tên con Trai hay nhất – Những tên bé Trai hay nhất cho bố mẹ lựa chọn

Xác suất thống kê là nền tảng quan trọng cho các mô hình máy học và phân tích dữ liệu. Bài viết này của tôi ghi lại những kiến thức và khái niệm cơ bản nhất về xác suất thống kê, giúp bạn đọc có thể tham khảo và ôn tập lại kiến thức của môn học này.

Bạn Đang Xem: Xác suất thống kê 1 – Các khái niệm cơ bản

Xác suất, xác suất có điều kiện, công thức Bayes

1. thử nghiệm, sự kiện, không gian mẫu

Khái niệm

Thí nghiệm ngẫu nhiên là một loạt các phương pháp tiến hành và quan sát thí nghiệm cho chúng ta những kết quả không thể đoán trước.
Sự kiện chính là kết quả đơn giản nhất có thể quan sát được và không thể chia cắt của một thử nghiệm.
không gian mẫu ($s$) là tập hợp tất cả các sự kiện cơ bản của một thử nghiệm, mâu thuẫn với nhau, được ký hiệu là s.
Mọi tập hợp con của không gian mẫu được gọi là biến cố.

thuộc tính
- Không gian mẫu $omega$ là một tập hợp, thực tế nó là tập con của $omega$ nên mọi quan hệ (tập con, tương đương) và phép toán (hợp, giao, bù, phép trừ) tương tự như lý thuyết tập hợp.
- Không tương thích: $ a_{1}, dots , a_{n}$ được gọi là không tương thích nếu $ a_{i} cap a_{j } = emptyset, forall i ne j$.
- Tính đầy đủ: $ a_{1}, dots , a_{n} nếu $ a_{i} cup dots cup a_{ n} $ được coi là hoàn thành =s $.
- Không gian sự kiện: $ a_{1}, dots , a_{n} $ Nếu vừa không tương thích vừa đủ đầy thì được gọi là không gian sự kiện.
  
  2. xác suất
  
  Khái niệm, tính chất
  
  xác suất của một phép thử là ánh xạ $p(.)$ từ không gian mẫu sang tập hợp các số thực sao cho:
  - 1. Đối với tất cả các sự kiện $a$ thì $p(a) geq 0$.
    2. 1. $p(omega) = 1$.
      2. Đối với $a_{1}, a_{2},dots $ xung đột thì:
        
        $$ p(a_{1} cup a_{2} dots) = p(a_{1}) + p(a_{2}) + dots $$
        
        Theo 3 tiên đề trên, ta có thuộc tính:
        
        $p(emptyset) = 0$
        
        $a, b$ không tương thích thì $p(a cup b) = p(a) + p(b)$.
        
        $a, b$ bất kỳ $p(a cup b) = p(a) + p(b) – p(a cap b) $.
        
        Định nghĩa xác suất cổ điển
        
        Xác suất cổ điển dựa trên không gian mẫu hữu hạn và cũng có khả năng $omega = {w_1, w_2, dots, w_n}$.
        
        Vì các sự kiện có khả năng xảy ra như nhau nên $p(w_1) = p(w_2) = dots = p(w_n)$.
        
        Làm $1 = p(omega) = p({w_1}) + p({w_2}) + dots + p({w_n}) = np({w_1})$ nên $p({w_i} ) = frac{1}{n}, forall i = overline{1,n}$.
        
        a là một sự kiện thì $p(a) = frac{#a}{#omega}$.
        
        Xác suất có điều kiện
        
        Một phép thử Nếu sự kiện $b,p(p)ne 0$ đã biết đã xảy ra, thì xác suất của sự kiện a xảy ra là xác suất có điều kiện $p(a|b)$ được xác định theo công thức:
        
        $$ p(a|b) = frac{p(a cap b)}{p(b)} $$
        
        Công thức nhân:
        
        Xem Thêm: Điều chế N2 trong phòng thí nghiệm và công nghiệp ra sao?
        
        $$ p(a cap b) = p(b).p(a|b) = p(a).p(b|a) $$
        
        Hai biến cố được gọi là độc lập khi và chỉ khi:
        
        $$ p(a cap b) = p(a).p(b) $$
        
        3. Công thức Bayes
        
        Tổng xác suất
        
        $$ sum_{i=1}^n(p(a_i.p(b|a_i))) $$
        
        Công thức Bayes
        
        Công thức Bayes cho 2 biến cố $a$, $b$
        
        Đối với hai biến cố $a, b$ và $p(a), p(b)$ là xác suất của hai quan sát độc lập.
        
        $p(a)$ được gọi là xác suất trước.
        
        $p(b)$ được gọi là xác suất hậu nghiệm.
        
        $p(b) = p(b|a) times p(a) + p(b|bar{a}) times p(bar{a})$.
        
        $p(a|b)$ được gọi là xác suất hậu nghiệm.
        
        $p(b|a)$ được gọi là xác suất đúng (khả năng xảy ra).
        
        Xem Thêm : Định luật Jun Len Xơ là gì? Công thức tính định luật Jun Len Xơ từ A – Z
        Chúng ta có một công thức Bayesian cho 2 sự kiện $a$ và $b$
        
        $$ p(a|b) = frac{p(a).p(b|a)}{p(b)} $$
        
        $$ hậu thế = khả năng lần trước / bằng chứng $$
        
        Công thức Bayes chung:
        
        Đối với không gian sự kiện $a_1, dots, a_n$. b là một biến cố.
        
        Ta có công thức tính tổng xác suất:
        
        $$ p(b) = sum_{i=1}^{n}p(a_i).p(b|a_i) $$
        
        Công thức Bayes chung cho nhiều biến cố:
        
        $$ p(a_i|b) = frac{p(a_i cap b)}{p(b)} = frac{(p(a_i cap b))}{sum_{i=1 }^n(p(a_j).p(b|a_j))}$$
        
        Biến ngẫu nhiên và phân phối xác suất
        
        1. biến ngẫu nhiên
        
        Khái niệm
        
        Biến ngẫu nhiên là biến nhận các giá trị ngẫu nhiên đại diện cho kết quả của một phép thử. Mỗi giá trị $x$ nhận được của biến ngẫu nhiên $x$ được gọi là một thể hiện của $x$, cũng là kết quả của một phép thử hay còn gọi là một biến cố.
        
        Có hai loại biến ngẫu nhiên:
        
        Rời rạc: Một tập hợp các giá trị rời rạc, đếm được. Khái niệm đếm được ở đây được hiểu theo nghĩa toán học, tức là nó có thể mô tả cách đếm không bỏ sót phần tử nào của tập hợp số, nhưng không thể bỏ sót phần tử nào của tập hợp số. number phải có hữu hạn phần tử. Bạn có thể đọc thêm về khái niệm này tại đây.
        
        Liên tục: Tập hợp các giá trị là liên tục, nghĩa là nó lấp đầy một khoảng và không đếm được.
        
        Ví dụ
        
        Khi tung hai con xúc xắc, gọi x và y lần lượt là số xuất hiện trên mặt xúc xắc thứ nhất và thứ hai thì x và y là hai biến ngẫu nhiên vì chúng có kết quả bằng nhau. Các hàm như $x + y, 2xy, sin(xy)$ cũng là các biến ngẫu nhiên.
        
        2. Phân phối xác suất
        
        Hàm khối lượng xác suất (pmf)
        
        Xét một biến ngẫu nhiên rời rạc $x$, có miền có thể nhận $(x_1, x_2, dots, x_n$. Hàm trọng số của biến ngẫu nhiên rời rạc được biểu thị như sau:
        
        Xem Thêm: Giải SBT Vật lý 9: Bài 42-43. Thấu kính hội tụ. Ảnh của một vật tạo
        
        $$ p_x(x) = p(x = x), forall x in mathbb{r} $$
        
        Ý nghĩa: Hàm trọng số biểu thị xác suất của một điểm $x$.
        
        Tính năng
        
        $p_x(x) geq 0, forall x in mathbb{r}$
        
        $sum_{i=1}^{n}p_x(x_i) = 1$
        
        Hàm phân phối tích lũy (cdf)
        
        Hàm phân phối xác suất của biến ngẫu nhiên $x$ là một hàm được xác định bởi công thức:
        
        $$ f_x(x) = p(x le x), forall x in mathbb{r} $$
        
        Ý nghĩa: Hàm phân phối xác suất là xác suất của biến cố “biến ngẫu nhiên $x$ nhận giá trị trong khoảng từ $−infty$ đến $x$”. Khi có các hàm phân phối, chúng ta thực hiện với các hàm phân tích, thay vì làm toán với các dữ kiện.
        
        Tính năng
        
        $f_x(-infty) = 0; f_x(+infty) = 1$
        
        $p(x leq a) = f_x(a); p(x > a) = 1 – f_x(a)$
        
        $p(a < x leq b) = f_x(b) – f_x(a)$
        
        $x$ là biến ngẫu nhiên rời rạc thì $f_x(x) = sum x_i <; xp_x(x_i)$
        
        Ví dụ về hàm trọng số và phân phối xác suất
        
        Tung xúc xắc. $x$ là số điểm xảy ra. Các giá trị x có thể là $s = {1, 2, 3, 4, 5, 6}$
        
        Hàm trọng số
        
        $$ p_x(x) = begin{cases} 1/6; & x in omega \ 0; & x notin omega end{cases} $$
        
        Hàm phân phối xác suất $f_x(x) = begin{cases} 0; & x < 1 \ 1/6; & x < 2 \ 2/6; & x < 3 3/6; & x < 4 \ 4/6; & x < 5 \ 5/6; & x < sáu mươi mốt; & x geq 6; x in omega end{ trường hợp }$
        
        Thí nghiệm ném xúc xắc mô phỏng
        
        Xem Thêm : Lời hỏi thăm tiếng Anh hay và phổ biến bạn cần biết
        Mô phỏng tung một con xúc xắc gần 5000 lần.
        
        In bảng phân phối xác suất theo giá trị mô phỏng.
        
        Viết hàm trọng số và hàm phân phối xác suất.
        
        Tính xác suất để lần tung xúc xắc lớn hơn 2 và không lớn hơn 4.
        
        Đồ thị hàm trọng số
        
        Đồ thị hàm phân phối xác suất
        
        Hàm xác suất mật độ (pdf)
        
        Với $x$ là một biến ngẫu nhiên liên tục, thì $p(x = x) = 0, forall x in mathbb{r}$. Do đó, sẽ không có ý nghĩa gì khi xem xét giá trị xác suất của một điểm với một biến ngẫu nhiên liên tục. Trong trường hợp này, chúng ta có khái niệm hàm mật độ xác suất (pdf – xác suất mật độ hàm) để ước tính mức độ tập trung của xác suất trong vùng lân cận của một điểm nhất định. Hàm mật độ xác suất $f(x)$ tại một điểm $x$ được xác định bằng cách lấy đạo hàm của hàm phân phối tích lũy $f(x)$ tại điểm đó:
        
        $$ f(x) = f^{prime}(x) $$
        
        Tính năng
        
        Không có âm thanh: $f(x) ge 0 ~~~, forall x in mathbb{r}$
        
        Tổng số miền bằng 1: $int_{-infty}^infty f(x)dx = 1$
        
        $f(x)=int_{-infty}^xf(t)dt$
        
        $p(a leq x < b) = f_x(a) – f_x(b) = int_a^b f_x(t)dt$
        
        Đồ thị hàm mật độ xác suất
        
        Xem Thêm: Giải Toán lớp 6 Bài 16 Phép nhân số nguyên Sách Kết nối tri thức
        
        Sau đây là một ví dụ đồ thị về hàm mật độ xác suất của một phân bố chuẩn.
        
        Đồ thị hàm mật độ xác suất
        
        3. Giá trị riêng
        
        Mong chờ
        
        Kỳ vọng của một biến ngẫu nhiên chính là giá trị trung bình của biến ngẫu nhiên. Kỳ vọng của biến ngẫu nhiên $x$ được biểu thị bằng $e[x]$: $$e[x]=begin{cases} displaystylesum_{forall i} x_ip_i &text{với x rời rạc } cr displaystyleint_{-infty}^infty xf(x)dx &text{với x liên tục} end{cases} $$
        
        Lưu ý rằng giá trị trung bình của biến ngẫu nhiên ở đây là trung bình có trọng số, không phải trung bình của xác suất của biến ngẫu nhiên.
        
        Tính năng
        
        $e(c) = c$ trong đó $c$ là hằng số
        
        $e(cx) = ce(x)$ trong đó $c$ là hằng số
        
        $e[ax+b] = ae[x]+b $ trong đó $a, b$ là các hằng số
        
        $e[x+y] = e[x]+e[y]$
        
        $e[xy] = e[x]e[y]$ trong đó $x, y$ độc lập
        
        $e[g(x)] = begin{cases} displaystylesum_{forall i} g(x_i)p_x(x_i) &text{nếu x rời rạc} cr displaystyle int_ {-infty}^infty g(x)f(x)dx &text{nếu x liên tục} end{cases} $
        
        Phương sai
        
        Dựa trên kỳ vọng, chúng ta sẽ nhận được giá trị trung bình của biến ngẫu nhiên, nhưng nó không cung cấp cho chúng ta thông tin về mức độ lan truyền của xác suất, vì vậy chúng ta cần một cách để đo lường mức chênh lệch này. Một trong những phương pháp này là phương sai.
        
        Phương sai $var(x)$ là giá trị trung bình của bình phương khoảng cách của biến ngẫu nhiên $x$ so với giá trị trung bình: $$var(x) = e[(x-e[x])^2] = e [ x^2 ]-e^2[x]$$
        
        Ta thấy rằng phương sai luôn là một giá trị không âm, phương sai càng lớn thì độ phân tán của dữ liệu càng rộng, tức là độ ổn định càng nhỏ.
        
        Tính năng
        
        $var(c) = 0$ trong đó $c$ là hằng số
        
        $var(cx) = c^2var(x)$ trong đó $c$ là hằng số
        
        $var(ax+b) = a^2var(x)$ trong đó $a, b$ là các hằng số
        
        $var(x+y) = var(x)+var(y)$ trong đó $x, y$ độc lập
        
        Độ lệch chuẩn
        
        Vì đơn vị của phương sai là bình phương nên không thể tính được đơn vị của các biến ngẫu nhiên phù hợp, vì vậy khái niệm độ lệch chuẩn (sd-Standard Lệch) được thêm vào. ) bằng căn bậc hai của phương sai.
        
        $$sigma(x)=sqrt{var(x)}$$
        
        Người ta cũng sử dụng $sigma^2(x)$ để biểu thị phương sai của một biến ngẫu nhiên $x$.
        
        Trung bình
        
        Trung vị là điểm mà tại đó xác suất được chia thành 2 phần bằng nhau, được biểu thị bằng $med(x)$: $$p(x < med(x)) = p(x ge med( x ) ) = 0,5$$
        
        Vậy trung vị là nghiệm của phương trình xác suất tích lũy: $f_x(x) = 0,5$
        
        Ngay lập tức
        
        là khái niệm chung về kỳ vọng và phương sai. Định nghĩa về thời điểm $k$ xung quanh $c$ như sau:
        
        $$m_k = e[(x-a)^k]$$
        
        Như vậy:
        
        Kỳ vọng là thời điểm của lệnh 1 tại đó $a=0$.
        
        Phương sai là thời điểm thứ hai của $a=e[x]$.
        
        Lưu ý: Mô tả này đang được xây dựng. Nếu bạn thấy lỗi, vui lòng cho tôi biết trong phần nhận xét bên dưới hoặc nhắn tin cho tôi qua trang liên hệ. Cảm ơn!

Nguồn: https://anhvufood.vn
Danh mục: Giáo Dục

Xem thêm:

Giáo Dục

Xác suất thống kê 1 – Các khái niệm cơ bản

Xác suất, xác suất có điều kiện, công thức Bayes

1. thử nghiệm, sự kiện, không gian mẫu

Khái niệm

thuộc tính

2. xác suất

Khái niệm, tính chất

Định nghĩa xác suất cổ điển

Xác suất có điều kiện

3. Công thức Bayes

Tổng xác suất

Công thức Bayes

Biến ngẫu nhiên và phân phối xác suất

1. biến ngẫu nhiên

Khái niệm

Ví dụ

2. Phân phối xác suất

Hàm khối lượng xác suất (pmf)

Hàm phân phối tích lũy (cdf)

Ví dụ về hàm trọng số và phân phối xác suất

Hàm xác suất mật độ (pdf)

3. Giá trị riêng

Mong chờ

Phương sai

Độ lệch chuẩn

Trung bình

Ngay lập tức

Anh Vũ Food

Bài Viết cùng chủ đề

Soạn bài Viết quảng cáo | Ngắn nhất Soạn văn 10

Hướng dẫn Giải bài 1 2 3 4 5 trang 149 sgk Hóa học 8

Cảm nhận khi đọc bài thơ: Thiên trường vãn vọng của Trần Nhân

Toán lớp 6 Kết nối tri thức Bài 13: Tập hợp các số nguyên

17 Kết bài chiếc thuyền ngoài xa giúp bạn đạt điểm tối đa

Hệ bài tiết nước tiểu gồm các cơ quan?

KHÁI NIỆM VÀ CÔNG THỨC TÍNH CÔNG, CÔNG CÔNG SUẤT

Tác phẩm: Bến quê | Soạn văn 9 chi tiết

Giải Bài Tập Sinh Học 9 – Bài 41: Môi trường và các nhân tố sinh thái

Trả lời Hủy