Hướng dẫn học tập Xác suất thống kê - TS. Lê Bá Long

pdf 177 trang phuongnguyen 4530
Bạn đang xem 20 trang mẫu của tài liệu "Hướng dẫn học tập Xác suất thống kê - TS. Lê Bá Long", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên

Tài liệu đính kèm:

  • pdfhuong_dan_hoc_tap_xac_suat_thong_ke_ts_le_ba_long.pdf

Nội dung text: Hướng dẫn học tập Xác suất thống kê - TS. Lê Bá Long

  1. HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG SÁCH HƯỚNG DẪN HỌC TẬP XÁC SUẤT THỐNG KÊ (Dùng cho sinh viên ngành CNTT và ĐTVT hệ đào tạo đại học từ xa) Lưu hành nội bộ HÀ NỘI - 2006
  2. HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG SÁCH HƯỚNG DẪN HỌC TẬP XÁC SUẤT THỐNG KÊ Biên soạn : Ts. LÊ BÁ LONG
  3. LỜI NÓI ĐẦU Lý thuyết xác suất thống kê là một bộ phận của toán học, nghiên cứu các hiện tượng ngẫu nhiên và ứng dụng chúng vào thực tế. Ta có thể hiểu hiện tượng ngẫu nhiên là hiện tượng không thể nói trước nó xảy ra hay không xảy ra khi thực hiện một lần quan sát. Tuy nhiên, nếu tiến hành quan sát khá nhiều lần một hiện tượng ngẫu nhiên trong các phép thử như nhau, ta có thể rút ra được những kết luận khoa học về hiện tượng này. Lý thuyết xác suất cũng là cơ sở để nghiên cứu Thống kê – môn học nghiên cứu các các phương pháp thu thập thông tin chọn mẫu, xử lý thông tin, nhằm rút ra các kết luận hoặc quyết định cần thiết. Ngày nay, với sự hỗ trợ tích cực của máy tính điện tử và công nghệ thông tin, lý thuyết xác suất thống kê ngày càng được ứng dụng rộng rãi và hiệu quả trong mọi lĩnh vực khoa học tự nhiên và xã hội. Chính vì vậy lý thuyết xác suất thống kê được giảng dạy cho hầu hết các nhóm ngành ở đại học. Có nhiều sách giáo khoa và tài liệu chuyên khảo viết về lý thuyết xác suất thống kê. Tuy nhiên, với phương thức đào tạo từ xa có những đặc thù riêng, đòi hỏi học viên phải làm việc độc lập nhiều hơn, vì vậy cần phải có tài liệu hướng dẫn học tập của từng môn học thích hợp cho đối tượng này. Tập tài liệu “Hướng dẫn học môn toán xác suất thống kê” này được biên soạn cũng nhằm mục đích trên. Tập tài liệu này được biên soạn cho hệ đại học chuyên ngành Điện tử-Viễn thông theo đề cương chi tiết chương trình qui định của Học viện Công nghệ Bưu Chính Viễn Thông. Nội dung của cuốn sách bám sát các giáo trình của các trường đại học khối kỹ thuật và theo kinh nghiệm giảng dạy nhiều năm của tác giả. Chính vì thế, giáo trình này cũng có thể dùng làm tài liệu học tập, tài liệu tham khảo cho sinh viên của các trường, các ngành đại học và cao đẳng khối kỹ thuật. Giáo trình gồm 6 chương tương ứng với 4 đơn vị học trình (60 tiết): Chương I: Các khái niệm cơ bản về xác suất. Chương II: Biến ngẫu nhiên và các đặc trưng của chúng. Chương III: Véc tơ ngẫu nhiên và các đặc trưng của chúng. Chương IV: Luật số lớn và định lý giới hạn. Chương V:.Thống kê toán học Chương VI: Quá trình ngẫu nhiên và chuỗi Markov. Điều kiện tiên quyết môn học này là hai môn toán cao cấp đại số và giải tích trong chương trình toán đại cương. Tuy nhiên vì sự hạn chế của chương trình toán dành cho hình thức đào tạo từ xa, do đó nhiều kết quả và định lý chỉ được phát biểu và minh họa chứ không có điều kiện để chứng minh chi tiết. Giáo trình được trình bày theo cách thích hợp đối với người tự học, đặc biệt phục vụ đắc lực cho công tác đào tạo từ xa. Trước khi nghiên cứu các nội dung chi tiết, người đọc nên xem phần giới thiệu của mỗi chương để thấy được mục đích ý nghĩa, yêu cầu chính của chương đó. Trong
  4. mỗi chương, mỗi nội dung, người đọc có thể tự đọc và hiểu được cặn kẽ thông qua cách diễn đạt và chỉ dẫn rõ ràng. Đặc biệt bạn đọc nên chú ý đến các nhận xét, bình luận để hiểu sâu hơn hoặc mở rộng tổng quát hơn các kết quả và hướng ứng dụng vào thực tế. Hầu hết các bài toán được xây dựng theo lược đồ: đặt bài toán, chứng minh sự tồn tại lời giải bằng lý thuyết và cuối cùng nêu thuật toán giải quyết bài toán này. Các ví dụ là để minh hoạ trực tiếp khái niệm, định lý hoặc các thuật toán, vì vậy sẽ giúp người đọc dễ dàng hơn khi tiếp thu bài học. Sau các chương có phần tóm tắt các nội dung chính và cuối cùng là các câu hỏi luyện tập. Có khoảng từ 20 đến 30 bài tập cho mỗi chương, tương ứng vói 3 -5 câu hỏi cho mỗi tiết lý thuyết. Hệ thống câu hỏi này bao trùm toàn bộ nội dung vừa được học. Có những câu kiểm tra trực tiếp các kiến thức vừa được học nhưng cũng có những câu đòi hỏi học viên phải vận dụng một cách tổng hợp và sáng tạo các kiến thức để giải quyết. Vì vậy việc giải các bài tập này giúp học viên nắm chắc hơn lý thuyết và kiểm tra được mức độ tiếp thu lý thuyết của mình. Tuy rằng tác giả đã rất cố gắng, song vì thời gian bị hạn hẹp cùng với yêu cầu cấp bách của Học viện, vì vậy các thiếu sót còn tồn tại trong giáo trình là điều khó tránh khỏi. Tác giả rất mong sự đóng góp ý kiến của bạn bè đồng nghiệp, học viên xa gần và xin cám ơn vì điều đó. Cuối cùng chúng tôi bày tỏ sự cám ơn đối với Ban Giám đốc Học viện Công nghệ Bưu Chính Viễn Thông, Trung tâm Đào tạo Bưu Chính Viễn Thông 1 và bạn bè đồng nghiệp đã khuyến khích động viên, tạo nhiều điều kiện thuận lợi để chúng tôi hoàn thành tập tài liệu này. Hà Nội, đầu năm 2006. Lê Bá Long Khoa cơ bản 1 Học Viện CNBCVT
  5. Chương 1: Các khái niệm cơ bản về xác suất CHƯƠNG I: CÁC KHÁI NIỆM CƠ BẢN VỀ XÁC SUẤT GIỚI THIỆU Các hiện tượng trong tự nhiên hay xã hội xảy ra một cách ngẫu nhiên (không biết trước kết quả) hoặc tất định (biết trước kết quả sẽ xảy ra). Chẳng hạn ta biết chắc chắn rằng lông của quạ có mầu đen, một vật được thả từ trên cao chắc chắn sẽ rơi xuống đất Đó là những hiện tượng diễn ra có tính quy luật, tất định. Trái lại khi tung đồng xu ta không biết mặt sấp hay mặt ngửa sẽ xuất hiện. Ta không thể biết có bao nhiêu cuộc gọi đến tổng đài, có bao nhiêu khách hàng đến điểm phục vụ trong khoảng thời gian nào đó. Ta không thể xác định trước chỉ số chứng khoán trên thị trường chứng khoán Đó là những hiện tượng ngẫu nhiên. Tuy nhiên, nếu tiến hành quan sát khá nhiều lần một hiện tượng ngẫu nhiên trong những hoàn cảnh như nhau, thì trong nhiều trường hợp ta có thể rút ra những kết luận có tính quy luật về những hiện tượng này. Lý thuyết xác suất nghiên cứu các qui luật của các hiện tượng ngẫu nhiên. Việc nắm bắt các quy luật này sẽ cho phép dự báo các hiện tượng ngẫu nhiên đó sẽ xảy ra như thế nào. Chính vì vậy các phương pháp của lý thuyết xác suất được ứng dụng rộng rãi trong việc giải quyết các bài toán thuộc nhiều lĩnh vực khác nhau của khoa học tự nhiên, kỹ thuật và kinh tế-xã hội. Chương này trình bày một cách có hệ thống các khái niệm và các kết quả chính về lý thuyết xác suất: - Các khái niệm phép thử, biến cố. - Quan hệ giữa các biến cố. - Các định nghĩa về xác suất: định nghĩa xác suất theo cổ điển, theo thống kê. - Các tính chất của xác suất: công thức cộng và công thức nhân xác suất, xác suất của biến cố đối. - Xác suất có điều kiện, công thức nhân trong trường hợp không độc lập. Công thức xác suất đầy đủ và định lý Bayes. - Dãy phép thử Bernoulli và xác suất nhị thức Khi nắm vững các kiến thức về đại số tập hợp như hợp, giao tập hợp, tập con, phần bù của một tập con học viên sẽ dễ dàng trong việc tiếp thu, biểu diễn hoặc mô tả các biến cố. Để tính xác suất các biến cố theo phương pháp cổ điển đòi hỏi phải tính số các trường hợp thuận lợi đối với biến cố và số các trường hợp có thể. Vì vậy học viên cần nắm vững các phương pháp đếm - giải tích tổ hợp (đã được học ở lớp 12 và trong chương 1 của toán đại số A2). Tuy nhiên để thuận lợi cho người học chúng tôi sẽ nhắc lại các kết quả chính trong mục 3. Một trong những khó khăn của bài toán xác suất là xác định được biến cố và sử dụng đúng các công thức thích hợp. Bằng cách tham khảo các ví dụ và giải nhiều bài tập sẽ rèn luyện tốt kỹ năng này. 3
  6. Chương 1: Các khái niệm cơ bản về xác suất NỘI DUNG 1.1. PHÉP THỬ VÀ BIẾN CỐ 1.1.1. Phép thử (Experiment) Trong thực tế ta thường gặp nhiều thí nghiệm, quan sát mà các kết quả của nó không thể dự báo trước được. Ta gọi chúng là các phép thử ngẫu nhiên. Phép thử ngẫu nhiên thường được ký hiệu bởi chữ C . Tuy không biết kết quả sẽ xảy ra như thế nào, nhưng ta có thể liệt kê được hoặc biểu diễn tất cả các kết quả của phép thử C . Mỗi kết quả của phép thử C được gọi là một biến cố sơ cấp. Tập hợp tất cả các biến cố sơ cấp của phép thử được gọi là không gian mẫu, ký hiệu Ω . Ví dụ 1.1: ƒ Phép thử tung đồng xu có không gian mẫu là Ω = {S, N}. ƒ Với phép thử tung xúc xắc, các biến cố sơ cấp có thể xem là số các nốt trên mỗi mặt xuất hiện. Vậy Ω = {}1,2,3,4,5,6 . ƒ Phép thử tung đồng thời 2 đồng xu có không gian mẫu là Ω = {}(S, S),(S, N),(N, S),(N, N) . Chú ý rằng bản chất của các biến cố sơ cấp không có vai trò đặc biệt gì trong lý thuyết xác suất. Chẳng hạn có thể xem không gian mẫu của phép thử tung đồng tiền là Ω = {}0, 1 , trong đó 0 là biến cố sơ cấp chỉ mặt sấp xuất hiện và 1 để chỉ mặt ngửa xuất hiện. 1.1.2. Biến cố (Event) Với phép thử C ta thường xét các biến cố (còn gọi là sự kiện) mà việc xảy ra hay không xảy ra hoàn toàn được xác định bởi kết quả của C . Mỗi kết quả ω của C được gọi là kết quả thuận lợi cho biến cố A nếu A xảy ra khi kết quả của C là ω . Ví dụ 1.2: Nếu gọi A là biến cố số nốt xuất hiện là chẵn trong phép thử tung xúc xắc ở ví dụ 1.1 thì A có các kết quả thuận lợi là 2, 4, 6. Tung hai đồng xu, biến cố xuất hiện một mặt sấp một mặt ngửa (xin âm dương) có các kết quả thuận lợi là (S, N); (N, S) . Như vậy mỗi biến cố A được đồng nhất với một tập con của không gian mẫu Ω bao gồm các kết quả thuận lợi đối với A . Mỗi biến cố chỉ có thể xảy ra khi một phép thử được thực hiện, nghĩa là gắn với không gian mẫu nào đó. Có hai biến cố đặc biệt sau: • Biến cố chắc chắn là biến cố luôn luôn xảy ra khi thực hiện phép thử, biến cố này trùng với không gian mẫu Ω . • Biến cố không thể là biến cố nhất định không xảy ra khi thực hiện phép thử. Biến cố không thể được ký hiệu φ . 4
  7. Chương 1: Các khái niệm cơ bản về xác suất Tung một con xúc xắc, biến cố xuất hiện mặt có số nốt nhỏ hơn hay bằng 6 là biến chắc chắn, biến cố xuất hiện mặt có 7 nốt là biến cố không thể. 1.1.3. Quan hệ giữa các biến cố Trong lý thuyết xác suất người ta xét các quan hệ sau đây cho các biến cố. a. Quan hệ kéo theo Biến cố A kéo theo biến cố B , ký hiệu A ⊂ B , nếu A xảy ra thì B xảy ra. b. Quan hệ biến cố đối Biến cố đối của A là biến cố được ký hiệu là A và được xác định như sau: A xảy ra khi và chỉ khi A không xảy ra. c. Tổng của hai biến cố Tổng của hai biến cố A, B là biến cố được ký hiệu A ∪ B . Biến cố A ∪ B xảy ra khi và chỉ khi có ít nhất A hoặc B xảy ra. n Tổng của một dãy các biến cố {A1, A2 , , An } là biến cố ∪ Ai . Biến cố này xảy ra khi có i=1 ít nhất một trong các biến cố Ai xảy ra. d. Tích của hai biến cố Tích của hai biến cố A, B là biến cố được ký hiệu AB . Biến cố AB xảy ra khi và chỉ khi cả hai biến cố A , B cùng xảy ra. n Tích của một dãy các biến cố {A1, A2 , , An } là biến cố ∏ Ai . Biến cố này xảy ra khi tất i=1 cả các biến cố Ai cùng xảy ra. e. Biến cố xung khắc Hai biến số A, B gọi là xung khắc nếu biến cố tích AB là biến cố không thể. Nghĩa là hai biến cố này không thể đồng thời xảy ra. Chú ý rằng các biến cố với phép toán tổng, tích và lấy biến cố đối tạo thành đại số Boole do đó các phép toán được định nghĩa ở trên có các tính chất như các phép toán hợp, giao, lấy phần bù đối với các tập con của không gian mẫu. f. Hệ đầy đủ các biến cố Dãy các biến cố A1, A2 , , An được gọi là một hệ đầy đủ các biến cố nếu: i. Xung khắc từng đôi một, nghĩa là Ai Aj = φ với mọi i ≠ j = 1, ,n , n ii. Tổng của chúng là biến cố chắc chắc, nghĩa là ∪ Ai = Ω . i=1 Đặc biệt với mọi biến cố A , hệ {A, A } là hệ đầy đủ. 5
  8. Chương 1: Các khái niệm cơ bản về xác suất Ví dụ 1.3: Một nhà máy có ba phân xưởng sản xuất ra cùng một loại sản phẩm. Giả sử rằng mỗi sản phẩm của nhà máy chỉ do một trong ba phân xưởng này sản xuất. Chọn ngẫu nhiên một sản phẩm, gọi A1, A2 , A3 lần lượt là biến cố sản phẩm được chọn do phân xưởng thứ nhất, thứ hai, thứ ba sản xuất. Khi đó hệ ba biến cố A1, A2 , A3 là hệ đầy đủ. g. Tính độc lập của các biến cố Hai biến cố A và B được gọi là độc lập với nhau nếu việc xảy ra hay không xảy ra biến cố này không ảnh hưởng tới việc xảy ra hay không xảy ra biến cố kia. Tổng quát các biến cố A1, A2 , , An được gọi là độc lập nếu việc xảy ra hay không xảy ra của một nhóm bất kỳ k biến cố, trong đó 1 ≤ k ≤ n , không làm ảnh hưởng tới việc xảy ra hay không xảy ra của các biến cố còn lại. Định lý 1.2: Nếu A, B độc lập thì các cặp biến cố: A, B ; A, B ; A, B cũng độc lập. Ví dụ 1.4: Ba xạ thủ A, B, C mỗi người bắn một viên đạn vào mục tiêu. Gọi A, B,C lần lượt là biến cố A, B, C bắn trúng mục tiêu. a. Hãy mô tả các biến cố: ABC,, A BC A∪∪ B C . b. Biểu diễn các biến cố sau theo A, B,C : - D : Có ít nhất 2 xạ thủ bắn trúng. - E : Có nhiều nhất 1 xạ thủ bắn trúng. - F : Chỉ có xạ thủ C bắn trúng. - G : Chỉ có 1 xạ thủ bắn trúng. c. Các biến cố A, B,C có xung khắc, có độc lập không ? Giải: a. ABC : cả 3 đều bắn trúng. A BC : cả 3 đều bắn trượt. A ∪ B ∪ C : có ít nhất 1 người bắn trúng. b. D = AB ∪ BC ∪ CA . Có nhiều nhất một xạ thủ bắn trúng có nghĩa là có ít nhất hai xạ thủ bắn trượt, vậy E = A B ∪ BC ∪ C A . F = A BC . G = A BC ∪ A BC ∪ A BC . c. Ba biến cố A, B,C độc lập nhưng không xung khắc. 1.2. ĐỊNH NGHĨA XÁC SUẤT VÀ CÁC TÍNH CHẤT Việc biến cố ngẫu nhiên xảy ra hay không trong kết quả của một phép thử là điều không thể biết hoặc đoán trước được. Tuy nhiên bằng những cách khác nhau ta có thể định lượng khả năng xuất hiện của biến cố, đó là xác suất xuất hiện của biến cố. 6
  9. Chương 1: Các khái niệm cơ bản về xác suất Xác suất của một biến cố là một con số đặc trưng khả năng khách quan xuất hiện biến cố đó khi thực hiện phép thử. Dựa vào bản chất của phép thử (đồng khả năng) ta có thể suy luận về khả năng xuất hiện của biến cố, với cách tiếp cận này ta có định nghĩa xác suất theo phương pháp cổ điển. Khi thực hiện nhiều lần lặp lại độc lập một phép thử ta có thể tính được tần suất xuất hiện của một biến cố nào đó. Tần suất thể hiện khả năng xuất hiện của biến cố, với cách tiếp cận này ta có định nghĩa xác suất theo thống kê. 1.2.1. Định nghĩa cổ điển về xác suất Giả sử phép thử C thoả mãn hai điều kiện sau: (i) Không gian mẫu có một số hữu hạn phần tử. (ii) Các kết quả xảy ra đồng khả năng. Khi đó ta định nghĩa xác suất của biến cố A là sè tr−êng hîp thuËn lîi đèi víi A P(A) = (1.1) sè tr−êng hîp cã thÓ Nếu xem biến cố A như là tập con của không gian mẫu Ω thì sè phÇn tö cña A A P(A) = = (1.1)’ sè phÇn tö cña Ω Ω Ví dụ 1.5: Biến cố A xuất hiện mặt chẵn trong phép thử gieo con xúc xắc ở ví dụ 1.1 có 3 3 1 trường hợp thuận lợi ( A = 3) và 6 trường hợp có thể ( Ω = 6 ). Vậy P(A) = = . 6 2 Để tính xác suất cổ điển ta sử dụng phương pháp đếm của giải tích tổ hợp. 1.2.2. Các qui tắc đếm a. Qui tắc cộng Nếu có m1 cách chọn loại đối tượng x1, m2 cách chọn loại đối tượng x2 , , mn cách chọn loại đối tượng xn . Các cách chọn đối tượng xi không trùng với cách chọn x j nếu i ≠ j thì có m1 + m2 ++ mn cách chọn một trong các đối tượng đã cho. b. Qui tắc nhân Giả sử công việc H gồm nhiều công đoạn liên tiếp H1, H2, , H k và mỗi công đoạn Hi có ni cách thực hiện thì có tất cả n1 × n2 ×× nk cách thực hiện công việc H . c. Hoán vị Mỗi phép đổi chỗ của n phần tử được gọi là phép hoán vị n phần tử. Sử dụng quy tắc nhân ta có thể tính được: Có n! hoán vị n phần tử. 7
  10. Chương 1: Các khái niệm cơ bản về xác suất d. Chỉnh hợp Chọn lần lượt k phần tử không hoàn lại trong tập n phần tử ta được một chỉnh hợp chập k của n phần tử. Sử dụng quy tắc nhân ta có thể tính được số các chỉnh hợp chập k của n phần tử là n! Ak = (1.2) n (n − k)! e. Tổ hợp Một tổ hợp chập k của n phần tử là một tập con k phần tử của tập n phần tử. Cũng có thể xem một tổ hợp chập k của n phần tử là một cách chọn đồng thời k phần tử của tập n phần tử. Hai chỉnh hợp chập k của n phần tử là khác nhau nếu: ƒ có ít nhất 1 phần tử của chỉnh hợp này không có trong chỉnh hợp kia. ƒ các phần tử đều như nhau nhưng thứ tự khác nhau. Do đó với mỗi tổ hợp chập k của n phần tử có k! chỉnh hợp tương ứng. Mặt khác hai chỉnh hợp khác nhau ứng với hai tổ hợp khác nhau là khác nhau. Vậy số các tổ hợp chập k của n phần tử là Ak n! C k = n = (1.3) n k! k!(n − k)! Ví dụ 1.6: Tung một con xúc xắc hai lần. Tìm xác suất để trong đó có 1 lần ra 6 nốt. Giải: Số các trường hợp có thể là 36. Gọi A là biến cố “ trong 2 lần tung con xúc xắc có 1 lần được mặt 6”. Nếu lần thứ nhất ra mặt 6 thì lần thứ hai chỉ có thể ra các mặt từ 1 đến 5, nghĩa là có 5 trường hợp. Tương tự cũng có 5 trường hợp chỉ xuất hiện mặt 6 ở lần tung thứ hai. Áp dụng 10 quy tắc cộng ta suy ra xác suất để chỉ có một lần ra mặt 6 khi tung xúc xắc 2 lần là . 36 Ví dụ 1.7: Cho các từ mã 6 bit được tạo từ các chuỗi các bit 0 và bit 1 đồng khả năng. Hãy tìm xác suất của các từ có chứa k bit 1, với k = 0, ,6 . 6 Giải: Số trường hợp có thể Ω = 2 . Đặt Ak là biến cố " từ mã có chứa k bit 1" . Có thể xem mỗi từ mã có chứa k bit 1 là một tổ hợp chập k của 6 phần tử, vậy số trường hợp thuận lợi 6! đối với A là số các tổ hợp 6 chập k . Do đó A = C k = k k 6 k!(6 − k)! 6! Vậy xác suất của các biến cố tương ứng P()Ak = , k = 0, , 6 . k!(6 − k)!26 Ví dụ 1.8: Một người gọi điện thoại quên mất hai số cuối của số điện thoại và chỉ nhớ được rằng chúng khác nhau. Tìm xác suất để quay ngẫu nhiên một lần được đúng số cần gọi. 8
  11. Chương 1: Các khái niệm cơ bản về xác suất Giải: Gọi A là biến cố “quay ngẫu nhiên một lần được đúng số cần gọi”. Số các trường hợp có thể là số các cặp hai chữ số khác nhau từ 10 chữ số từ 0 đến 9. Nó bằng số các chỉnh hợp 10 2 chập 2. Vậy số các trường hợp có thể là A10 = 10 ⋅9 = 90 . Số các trường hợp thuận lợi của A là 1 1. Do đó P(A) = . 90 Ví dụ 1.9: Một công ty cần tuyển 2 nhân viên. Có 6 người nộp đơn trong đó có 4 nữ và 2 nam. Giả sử khả năng trúng tuyển của cả 6 người là như nhau. Tính xác suất biến cố: a. Hai người trúng tuyển là nam b. Hai người trúng tuyển là nữ c. Có ít nhất 1nữ trúng tuyển. 2 Giải: Số trường hợp có thể Ω=C6 =15 . a. Chỉ có 1 trường hợp cả 2 nam đều trúng tuyển do đó xác suất tương ứng là P = 1/15 . 2 b. Có C4 = 6 cách chọn 2 trong 4 nữ, vậy xác suất tương ứng P = 6 /15 . c. Trong 15 trường hợp có thể chỉ có 1 trường hợp cả 2 nam được chọn, vậy có 14 trường hợp ít nhất 1 nữ được chọn. Do đo xác suất tương ứng P = 14 /15 . 1.2.3. Định nghĩa thống kê về xác suất Định nghĩa xác suất theo cổ điển trực quan, dễ hiểu. Tuy nhiên khi số các kết quả có thể vô hạn hoặc không đồng khả năng thì cách tính xác suất cổ điển không áp dụng được. Giả sử phép thử C có thể được thực hiện lặp lại nhiều lần độc lập trong những điều kiện giống hệt nhau. Nếu trong n lần thực hiện phép thử C , biến cố A xuất hiện kn (A) lần thì tỉ số k (A) f (A) = n n n được gọi là tần suất xuất hiện của biến cố A trong n phép thử. Người ta chứng minh được (định lý luật số lớn) khi n tăng lên vô hạn thì fn (A) tiến đến một giới hạn xác định. Ta định nghĩa giới hạn này là xác suất của biến cố A , ký hiệu P(A) . P(A) = lim fn (A) (1.4) n→∞ Trên thực tế P(A) được tính xấp xỉ bởi tần suất fn (A) khi n đủ lớn. Ví dụ 1.10: Một công ty bảo hiểm muốn xác định xác suất để một người Mỹ 25 tuổi sẽ bị chết trong năm tới, người ta theo dõi 100.000 thanh niên và thấy rằng có 798 người bị chết trong vòng 1 năm sau đó. Vậy xác suất cần tìm xấp xỉ bằng 0,008. Ví dụ 1.11: Thống kê cho thấy tần suất sinh con trai xấp xỉ 0,513. Vậy xác suất để bé trai ra đời lớn hơn bé gái. Nhận xét: Định nghĩa xác suất theo thống kê khắc phục được hạn chế của định nghĩa cổ điển, nó hoàn toàn dựa trên các thí nghiệm quan sát thực tế để tìm xác suất của biến cố. Tuy nhiên 9
  12. Chương 1: Các khái niệm cơ bản về xác suất định nghĩa thống kê về xác suất cũng chỉ áp dụng cho các phép thử mà có thể lặp lại được nhiều lần một cách độc lập trong những điều kiện giống hệt nhau. Ngoài ra để xác định một cách tương đối chính xác giá trị của xác suất thì cần tiến hành một số n đủ lớn lần các phép thử, mà việc này đôi khi không thể làm được vì hạn chế về thời gian và kinh phí. Ngày nay với sự trợ giúp của công nghệ thông tin, người ta có thể mô phỏng các phép thử ngẫu nhiên mà không cần thực hiện các phép thử trong thực tế. Điều này cho phép tính xác suất theo phương pháp thống kê thuận tiện hơn. 1.2.4. Định nghĩa xác suất theo hình học Định nghĩa 1.3: Giả sử không gian mẫu Ω có thể biểu diễn tương ứng với một miền nào đó có diện tích (thể tích, độ dài) hữu hạn và biến cố A tương ứng với một miền con của Ω thì xác suất của biến cố A được định nghĩa: diÖn tÝch A P(A) = . y diÖn tÝch Ω Ví dụ 1.12: Hai người bạn hẹn gặp nhau ở một 60 địa điểm trong khoảng thời gian từ 12h đến 13h. Mỗi người có thể đến điểm hẹn một cách ngẫu nhiên tại một thời điểm trong khoảng thời gian nói trên và họ quy ước rằng ai đến trước thì chỉ đợi người kia trong vòng 15 phút. Tính xác suất để hai người gặp nhau. A 15 Giải: Giả sử x, y là thời điểm người thứ nhất và thứ hai đến điểm hẹn thì 0 ≤ x ≤ 60 , 0 ≤ y ≤ 60. Vậy mỗi cặp thời điểm đến (x; y) là một điểm O 15 60 x của hình vuông Ω = [0,60]2 . Gọi A là biến cố hai người gặp nhau thì A = {(x; y) ∈ Ω x − y ≤ 15 } = {(x; y) ∈ Ω −15 + x ≤ y ≤ x +15 }. diÖn tÝch A 452 9 7 ⇒ P(A) = = 1− = 1− = . diÖn tÝch Ω 602 16 16 1.2.6. Các tính chất và định lý xác suất 1.2.6.1. Các tính chất của xác suất Các định nghĩa trên của xác suất thoả mãn các tính chất sau: 1. Với mọi biến cố A : 0 ≤ P(A) ≤ 1. (1.5) 2. Xác suất của biến cố không thể bằng 0, xác suất của biến cố chắc chắn bằng 1. PP()φ =Ω= 0,( ) 1 (1.6) 10
  13. Chương 1: Các khái niệm cơ bản về xác suất 1.2.6.2. Qui tắc cộng xác suất a. Trường hợp xung khắc Nếu A, B là hai biến cố xung khắc thì P(A ∪ B) = P(A) + P(B) . (1.7) Tổng quát hơn, nếu {}A1, A2 , , An là dãy các biến cố xung khắc từng đôi một thì ⎛ n ⎞ n P⎜ A ⎟ = P(A ) . (1.7)’ ⎜∪ i ⎟ ∑ i ⎝ i=1 ⎠ i=1 Từ công thức (1.6) và (1.7)’ ta có hệ quả: Nếu {A1, A2 , , An } là một hệ đầy đủ thì n ∑ P(Ai ) = 1 (1.8) i=1 b. Trường hợp tổng quát ƒ Nếu A, B là hai biến cố bất kỳ thì P(A ∪ B) = P(A) + P(B) − P(AB) (1.9) ƒ Nếu A, B,C là ba biến cố bất kỳ thì P(A ∪ B ∪ C) = P(A) + P(B) + P(C) − P(AB) − P(BC) − P(CA) + P(ABC) (1.9)’ ƒ Nếu {}A1, A2 , , An là dãy các biến cố bất kỳ ⎛ n ⎞ n P⎜ A ⎟ = P(A ) − P(A A ) + P(A A A ) −+ (−1)n−1 P(A A A ) . (1.9)” ⎜∪ i ⎟ ∑ i ∑ i j ∑ i j k 1 2 n ⎝i=1 ⎠ i=1 i< j i< j<k Ví dụ 12: Một lô hàng có 25% sản phẩm loại I, 55% sản phẩm loại II và 20% sản phẩm loại III. Sản phẩm được cho là đạt chất lượng nếu thuộc loại I hoặc loại II. Chọn ngẫu nhiên 1 sản phẩm tìm xác suất để sản phẩm này đạt tiêu chuẩn chất lượng. Giải: Gọi A1, A2 , A3 lần lượt là biến cố sản phẩm được chọn thuộc loại I, II, III. Ba biến cố này xung khắc từng đôi một. P(A1) = 0,25 , P(A2 ) = 0,55 , P(A3 ) = 0,20 . Gọi A là biến cố sản phẩm được chọn đạt tiêu chuẩn chất lượng. Vậy A = A1 ∪ A2 . P(A) = P(A1) + P(A2 ) = 0,25 + 0,55 = 0,8 . Áp dụng công thức (1.8) cho hệ đầy đủ {A, A } ta được quy tắc xác suất biến cố đối 1.2.6.3. Quy tắc xác suất của biến cố đối Với mọi biến cố A P( A) = 1− P(A) . (1.10) 11
  14. Chương 1: Các khái niệm cơ bản về xác suất 1.2.5. Nguyên lý xác suất lớn, xác suất nhỏ Một biến cố không thể có xác suất bằng 0. Tuy nhiên một biến cố có xác suất bằng 0 vẫn có thể xảy ra trong một số lớn các phép thử. Qua thực nghiệm và quan sát thực tế, người ta thấy rằng các biến cố có xác suất nhỏ sẽ không xảy ra khi ta chỉ thực hiện một phép thử hay một vài phép thử. Từ đó ta thừa nhận nguyên lý sau đây, gọi là “Nguyên lý xác suất nhỏ”: Nếu một biến cố có xác suất rất nhỏ thì thực tế có thể cho rằng trong một phép thử biến cố đó sẽ không xảy ra. Chẳng hạn mỗi chiếc máy bay đều có một xác suất rất nhỏ bị xảy ra tai nạn. Nhưng trên thực tế ta vẫn không từ chối đi máy bay vì tin tưởng rằng trong chuyến bay ta đi sự kiện máy bay rơi không xảy ra. Hiển nhiên việc quy định một mức xác suất thế nào được gọi là nhỏ sẽ phụ thuộc vào từng bài toán cụ thể. Chẳng hạn nếu xác suất để máy bay rơi là 0,01 thì xác suất đó chưa thể được coi là nhỏ. Song nếu xác suất một chuyến tàu khởi hành chậm là 0,01 thì có thể coi rằng xác suất này là nhỏ. Mức xác suất nhỏ này được gọi là mức ý nghĩa. Nếu α là mức ý nghĩa thì số β = 1−α gọi là độ tin cậy. Khi dựa trên nguyên lý xác suất nhỏ ta tuyên bố rằng: “Biến cố A có xác suất nhỏ (tức là P(A) ≤ α ) sẽ không xảy ra trên thực tế” thì độ tin cậy của kết luận trên là β . Tính đúng đắn của kết luận chỉ xảy ra trong 100 ⋅ β % trường hợp. Tương tự như vậy ta có thể đưa ra “Nguyên lý xác suất lớn”: “Nếu biến cố A có xác suất gần bằng 1 thì trên thực tế có thể cho rằng biến cố đó sẽ xảy ra trong một phép thử”. Cũng như trên, việc quy định một mức xác suất thế nào được gọi là lớn sẽ tùy thuộc vào từng bài toán cụ thể. 1.3. XÁC SUẤT CÓ ĐIỀU KIỆN 1.3.1. Định nghĩa cà các tính chất của xác suất có điều kiện Xác suất của biến cố B được tính trong điều kiện biết rằng biến cố A đã xảy ra được gọi là xác suất của B với điều kiện A . Ký hiệu P(B A). Tính chất ¾ Nếu P(A) > 0 thì P(AB) P()B A = . (1.11) P(A) ¾ Khi cố định A với P(A) > 0 thì xác suất có điều kiện P(B A) có tất cả các tính chất của xác suất thông thường (công thức (1.5)-(1.10)”) đối với biến cố B . Chẳng hạn: P(B A)= 1− P()B A , P()B1 ∪ B2 A = P(B1 A)+ P(B2 A)− P(B1B2 A). 12
  15. Chương 1: Các khái niệm cơ bản về xác suất Ví dụ 13: Gieo đồng thời hai con xúc xắc cân đối. Tính xác suất để tổng số nốt xuất hiện trên hai con xúc xắc ≥10 biết rằng ít nhất một con đã ra nốt 5. 2 ⎛⎞511 Giải: Gọi A là biến cố " ít nhất một con ra nốt 5". PA()=− 1 P() A =− 1⎜⎟ = . ⎝⎠636 Gọi B là biến cố "tổng số nốt trên hai con ≥10 " Biến cố AB có 3 kết quả thuận lợi là (5,6), (6,5), (5,5). 3 3113 Vậy PAB()=⇒ PBA() = =. 36 36 36 11 1.3.2. Quy tắc nhân xác suất 1.3.2.1. Trường hợp độc lập: ƒ Nếu A, B là hai biến cố độc lập thì P(AB) = P(A)P(B) . (1.12) ƒ Nếu {}A1, A2 , , An là càc biến cố độc lập thì P()A1A2 An = P(A1 )P(A2 ) P(An ). (1.13) 1.3.2.2. Trường hợp tổng quát: ƒ P(AB) = P(A)P(B A) (1.14) ƒ PAA()12 Annn= PA() 1 PA() 2 A 1 PAAA( 3 12) PA( AA 12 A− 1) . (1.15) Ví dụ 1.14: Túi I chứa 3 bi trắng, 7 bi đỏ, 15 bi xanh. Túi II chứa 10 bi trắng, 6 bi đỏ, 9 bi xanh. Từ mỗi túi lấy ngẫu nhiên 1 bi. Tìm xác suất để 2 bi được rút từ 2 túi là cùng màu. Giải: Gọi At , Ađ , Ax lần lượt là biến cố bi được rút từ túi I là trắng, đỏ, xanh. Bt , Bđ , Bx lần lượt là biến cố bi được rút từ túi II là trắng, đỏ, xanh. Các biến cố At , Ađ , Ax độc lập với các biến cố Bt , Bđ , Bx . Vậy xác suất để 2 bi được rút cùng mầu là PAB()tt∪∪ ABđđ ABxx = PAB( tt) + PAB( đđ) + PAB( xx) =+PA( tt) PB( ) PA( đđ) PB( ) + PA( xx)( PB ) 3 10 7 6 15 9 207 = + + = ≈ 0,331. 25 25 25 25 25 25 625 13
  16. Chương 1: Các khái niệm cơ bản về xác suất Ví dụ 1.15: Một thủ kho có một chùm chìa khóa gồm 9 chiếc, bề ngoài chúng giống hệt nhau nhưng trong đó chỉ có đúng 2 chiếc mở được kho. Anh ta thử ngẫu nhiên từng chìa (chìa nào không trúng thì bỏ ra). Tính xác suất để mở được kho ở lần thứ ba. Giải: Ký hiệu Ai là biến cố "thử đúng chìa ở lần thứ i". Vậy xác suất cần tìm là 762 1 PAAA=== PA PA A PAAA . ()123() 1() 2 1() 3 12 987 6 1.3.3. Công thức xác suất đầy đủ Định lý 1.3: Nếu {AA12, , , An} là một hệ đầy đủ các biến cố. Với mọi biến cố B của cùng một phép thử, ta có n PB()= ∑ PA (ii ) P() B A (1.16) i=1 1.3.4. Công thức Bayes Định lý 1.4: Nếu {A12,AA , , n} là một hệ đầy đủ các biến cố. Với mọi biến cố B của cùng một phép thử sao cho P(B) > 0 ta có : PAB()k PA()kk PBA( ) PA()k B== . (1.17) PB() n ∑ PA()ii PBA() i=1 Giải thích: Trong thực tế các xác suất {PA(12 ), PA ( ), , PA (n )} đã biết và được gọi là các xác suất tiền nghiệm. Sau khi quan sát biết được biến cố B xảy ra, các xác suất của Ak được tính trên thông tin này (xác suất có điều kiện P(Ak B)) được gọi là xác suất hậu nghiệm. Vì vậy công thức Bayes còn được gọi là công thức xác suất hậu nghiệm. Ví dụ 1.16: Một trạm chỉ phát hai tín hiệu A và B với xác suất tương ứng 0,85 và 0,15. Do có nhiễu trên đường truyền nên 1/7 tín hiệu A bị méo và thu được như tín hiệu B còn 1/8 tín hiệu B bị méo và thu được như A. a. Tìm xác suất thu được tín hiệu A. b. Giả sử đã thu được tín hiệu A. Tìm xác suất thu được đúng tín hiệu lúc phát. Giải: Gọi là A biến cố "phát tín hiệu A" và B là biến cố "phát tín hiệu B". Khi đó {A, B} là hệ đầy đủ. Gọi là TA biến cố "thu được tín hiệu A" và là TB biến cố "thu được tín hiệu B". 1 1 P(A) = 0,85, P(B) = 0,15; P()T A = , P()T B = . B 7 A 8 a. Áp dụng công thức xác suất đầy đủ ta có xác suất thu được tín hiệu A: 6 1 P()T = P(A)P()T A + P(B)P()T B = 0,85× + 0,15× = 0,7473 . A A A 7 8 14
  17. Chương 1: Các khái niệm cơ bản về xác suất b. Áp dụng công thức Bayes ta có 6 0,85× P(A)P()TA A 7 P()A TA = = = 0,975 . P()TA 0,7473 Ví dụ 1.17: Người ta dùng một thiết bị để kiểm tra một loại sản phẩm nhằm xác định sản phẩm có đạt yêu cầu không. Biết rằng sản phẩm có tỉ lệ phế phẩm là p% . Thiết bị có khả năng phát hiện đúng sản phẩm là phế phẩm với xác suất α và phát hiện đúng sản phẩm đạt chất lượng với xác suất β . Kiểm tra ngẫu nhiên một sản phẩm, tìm xác suất sao cho sản phẩm này: a. Được kết luận là phế phẩm (biến cố A ). b. Được kết luận là đạt chất lượng thì lại là phế phẩm. c. Được kết luận đúng với thực chất của nó. Giải: Gọi H là biến cố “sản phẩm được chọn là phế phẩm”. Theo giả thiết ta có: PH()== p , P() AHα , P() A H =β . a. Áp dụng công thức đầy đủ cho hệ đầy đủ {HH, } ta có: PA()= PHP ( )() AH+=+−− PH( ) P( AH) pα (1)(1) p β . PHA() p(1−α ) b. PHA()== . PA() p(1−+−α ) (1p )β c. PAHPAHPHPAHPHPAHp()+=( ) ()( ) +( ) ( ) =+−α (1) pβ . 1.4. DÃY PHÉP THỬ BERNOULLI Dãy các phép thử lặp lại, độc lập, trong mỗi phép thử chỉ có 2 kết cục: A , A và xác suất xuất hiện của biến cố A không đổi P(A) = p, (0 < p < 1) được gọi là dãy phép thử Bernoulli. p là xác suất thành công trong mỗi lần thử. Kí hiệu H k là biến cố " A xuất hiện ra đúng k lần trong n phép thử". Đặt Pn (k ; p) = P(H k ) . k k n−k Định lý 1.1: Pn (k ; p) = Cn p (1− p) ; k = 0,1, ,n . (1.18) k Chứng minh: H k là tổng của Cn các biến cố xung khắc từng đôi nhận được bằng cách hoán vị các chữ A và A trong biến cố tích sau: A AA A k lÇn n−k lÇn 15
  18. Chương 1: Các khái niệm cơ bản về xác suất Mỗi biến cố này có xác suất P( A AA A ) = p k (1− p)n−k . k lÇn n−k lÇn k k n−k Vậy Pn (k ; p) = Cn p (1− p) . Định lý 1.2: (n − k +1) p (i). P (k ; p) = P (k −1; p) (1.19) n kq n (ii). Khi k tăng từ 0 đến n thì Pn (k ; p) mới đầu tăng sau đó giảm và đạt giá trị lớn nhất tại k = m thoả mãn: (n +1) p −1 ≤ m ≤ (n +1) p (1.20) Như vậy, ƒ Khi (n +1) p không nguyên thì m = [(n +1) p] (là phần nguyên của (n +1) p ). ƒ Khi (n +1) p nguyên thì m = (n +1) p −1 hoặc m = (n +1) p Pmax = Pn (m −1; p) = Pn (m; p) (1.20)’ Chứng minh: n! p k q n−k P (k ; p) k!(n − k)! (n − k +1) p n = = , từ đó có (1.19). P (k −1; p) n! kq n p k−1q n−k+1 (k −1)!(n − k +1)! P (k ; p) (k + 1)(1 − p) P (k ; p) (1.19) ⇒ n = . Do đó n Pn (k + 1; p) khi k ≥ (n +1) p ⇒ Pn (k ; p) (n +1) p , trong đó m là số tự nhiên thỏa mãn (n +1) p −1 ≤ m ≤ (n +1) p . P (m −1; p) (n + 1)(1 − p) p Khi m = (n +1) p thì n = =1 Pn (m; p) ()n − (n + 1) p + 1 p ⇒ Pn (m −1; p) = Pn (m; p) . Định nghĩa 1.1: m xác định bởi công thức (1.20) hoặc (1.20)’ được gọi là giá trị chắc chắn nhất của số thành công hay giá trị có khả năng xảy ra lớn nhất. Pn (m; p) là số hạng trung tâm của phân bố nhị thức. 16
  19. Chương 1: Các khái niệm cơ bản về xác suất Ví dụ 1.19: Tín hiệu thông tin được phát đi 3 lần độc lập nhau. Xác suất thu được mỗi lần là 0.4. a) Tìm xác suất để nguồn thu nhận được thông tin đúng 2 lần. b) Tìm xác suất để nguồn thu nhận được thông tin đó. c) Nếu muốn xác suất thu được tin ≥ 0,9 thì phải phát đi ít nhất bao nhiêu lần. Giải: Có thể xem mỗi lần phát tin là một phép thử Bernoulli mà sự thành công của phép thử là nguồn thu nhận được tin, theo giả thiết xác suất thành công của mỗI lần thử là 0,4. Vậy: a) Xác suất để nguồn thu nhận được thông tin đúng 2 lần là 2 2 P2 (3;0,4) = C3 (0,4) (0,6) = 0,288 . b) Xác suất để nguồn thu nhận được thông tin là P = 1− (0,6)3 = 0,784 . c) Xác suất để nguồn thu nhận được thông tin khi phát n lần là P = 1− ()0,6 n . Vậy nếu muốn xác suất thu được tin ≥ 0,9 thì phải phát đi ít nhất n lần sao cho: lg(0,1) −1 1− ()0,6 n ≥ 0,9 ⇔ ()0,6 n ≤ 0,1 ⇔ n ≥ = = 4,504 . Chọn n = 5 . lg()0,6 −1 = 0,778 TÓM TẮT Phép thử Trong thực tế ta thường gặp nhiều thí nghiệm, quan sát mà các kết quả của nó không thể dự báo trước được. Ta gọi chúng là các phép thử ngẫu nhiên. Mỗi kết quả của phép thử C được gọi là một biến cố sơ cấp. Tập hợp tất cả các biến cố sơ cấp của phép thử được gọi là không gian mẫu, ký hiệu Ω . Biến cố Mỗi biến cố A được đồng nhất với một tập con của không gian mẫu Ω bao gồm các kết quả thuận lợi đối với A . Xác suất Xác suất của một biến cố là một con số đặc trưng khả năng khách quan xuất hiện biến cố đó khi thực hiện phép thử. Định nghĩa cổ điển về xác suất sè tr−êng hîp thuËn lîi đèi víi A Xác suất của biến cố A là P(A) = sè tr−êng hîp cã thÓ Định nghĩa thống kê về xác suất k (A) Xác suất của biến cố A là P(A) ≈ f (A) = n trong đó k (A) số lần xuất hiện biến n n n cố A trong n phép thử. 17
  20. Chương 1: Các khái niệm cơ bản về xác suất Nguyên lý xác suất nhỏ Nếu một biến cố có xác suất rất nhỏ thì thực tế có thể cho rằng trong một phép thử biến cố đó sẽ không xảy ra. Nguyên lý xác suất lớn Nếu biến cố A có xác suất gần bằng 1 thì trên thực tế có thể cho rằng biến cố đó sẽ xảy ra trong một phép thử. Quan hệ kéo theo Biến cố A kéo theo biến cố B , ký hiệu A ⊂ B , nếu A xảy ra thì B xảy ra. Quan hệ biến cố đối A là biến cố đối của A . A xảy ra khi và chỉ khi A không xảy ra. Tổng của hai biến cố Biến cố A ∪ B tổng của hai biến cố A, B xảy ra khi và chỉ khi có ít nhất A hoặc B xảy ra. n Biến cố tổng ∪ Ai của một dãy các biến cố {A1, A2 , , An } xảy ra khi có ít nhất một trong i=1 các biến cố Ai xảy ra. Tích của hai biến cố Biến cố AB của hai biến cố A, B xảy ra khi và chỉ khi cả hai biến cố A , B cùng xảy ra. n Biến cố tích ∏ Ai của dãy các biến cố {A1, A2 , , An } xảy ra khi tất cả các biến cố Ai i=1 cùng xảy ra. Biến cố xung khắc Hai biến số A, B gọi là xung khắc nếu AB là biến cố không thể. Hệ đầy đủ các biến cố Dãy các biến cố A1, A2 , , An được gọi là một hệ đầy đủ các biến cố nếu chúng xung khắc từng đôi một và tổng của chúng là biến cố chắc chắc. Tính độc lập của các biến cố Hai biến cố A và B được gọi là độc lập với nhau nếu việc xảy ra hay không xảy ra biến cố này không ảnh hưởng tới việc xảy ra hay không xảy ra biến cố kia. Tổng quát các biến cố A1, A2 , , An được gọi là độc lập nếu việc xảy ra hay không xảy ra của một nhóm bất kỳ k biến cố, trong đó 1 ≤ k ≤ n , không làm ảnh hưởng tới việc xảy ra hay không xảy ra của các biến cố còn lại. Qui tắc cộng 18
  21. Chương 1: Các khái niệm cơ bản về xác suất ⎛ n ⎞ n Trường hợp xung khắc: P(A ∪ B) = P(A) + P(B) ; P⎜ A ⎟ = P(A ) . ⎜∪ i ⎟ ∑ i ⎝ i=1 ⎠ i=1 Trường hợp tổng quát P(A ∪ B) = P(A) + P(B) − P(AB) P(A ∪ B ∪ C) = P(A) + P(B) + P(C) − P(AB) − P(BC) − P(CA) + P(ABC) ⎛ n ⎞ n P⎜ A ⎟ = P(A ) − P(A A ) + P(A A A ) −+ (−1)n−1 P(A A A ) . ⎜∪ i ⎟ ∑ i ∑ i j ∑ i j k 1 2 n ⎝i=1 ⎠ i=1 i 0 ta có : PAB()k PA()kk PBA( ) PA()k B== . PB() n ∑ PA()ii PBA() i=1 Dãy phép thử Bernoulli Dãy các phép thử lặp lại, độc lập, trong mỗi phép thử chỉ có 2 kết cục: A , A và xác suất xuất hiện của biến cố A không đổi P(A) = p, (0 < p < 1) được gọi là dãy phép thử Bernoulli. 19
  22. Chương 1: Các khái niệm cơ bản về xác suất m m n−m Khi m = [](n +1) p thì Pn (m; p) = Cn p (1− p) đạt giá trị lớn nhất. Gọi m là giá trị có khả năng xảy ra lớn nhất của dãy phép thử Bernoulli. CÂU HỎI ÔN TẬP VÀ BÀI TẬP 1.1 Ta có thể có hai không gian mẫu Ω các biến cố sơ cấp cho cùng một phép thử C ? Đúng Sai . 1.2 Các biến cố A và A ∪ B là xung khắc. Đúng Sai . 1.3 Hai biến cố A và B xung khắc thì P(A ∪ B) = P(A) + P(B) . Đúng Sai . 1.4 Thông tin liên quan đến việc xuất hiện biến cố B làm tăng xác suất của biến cố A , tức là P(A B) ≥ P(A) ? Đúng Sai . 1.5 Hai biến cố xung khắc là hai biến cố độc lập. Đúng Sai . 1.6 Các biến cố đối của hai biến cố độc lập cũng là độc lập. Đúng Sai . 1.7 Xác suất của tổng hai biến cố độc lập bằng tổng xác suất của hai biến cố này. Đúng Sai . 1.8 Xác suất của tích 2 biến cố xung khắc bằng tích 2 xác suất. Đúng Sai . 1.9 Hệ 2 biến cố {A, A} là hệ đầy đủ. Đúng Sai . 1.10 Cho Ω = {}a,b,c,d trong đó các biến cố sơ cấp là đồng khả năng. Biến cố A = {a,b} và B = {}a,c là phụ thuộc vì chúng cùng xảy ra khi biến cố sơ cấp a xảy ra. Đúng Sai . 1.11 Trong một hòm đựng 10 chi tiết đạt tiêu chuẩn và 5 chi tiết là phế phẩm. Lấy đồng thời 3 chi tiết. Tính xác suất: a) Cả 3 chi tiết lấy ra thuộc loại đạt tiêu chuẩn. b) Trong số 3 chi tiết lấy ra có 2 chi tiết đạt tiêu chuẩn. 1.12 Thang máy của một tòa nhà 7 tầng xuất phát từ tầng một với 3 khách. Tìm xác suất để: a) Tất cả cùng ra ở tầng bốn. 20
  23. Chương 1: Các khái niệm cơ bản về xác suất b) Tất cả cùng ra ở một tầng c) Mỗi người ra một tầng khác nhau. 1.13 Một người gọi điện thoại cho bạn nhưng lại quên mất 3 chữ số cuối và chỉ nhớ rằng chúng khác nhau. Tìm xác suất để người đó quay số một lần được đúng số điện thoại của bạn. 1.14 Ta kiểm tra theo thứ tự một lô hàng có 10 sản phẩm. Mỗi sản phẩm thuộc một trong hai loại: Tốt hoặc Xấu. Ký hiệu Ak ( k = 1,10 ) là biến cố chỉ sản phẩm kiểm tra thứ k thuộc loại xấu. Biểu diễn các biến cố sau theo Ak : a) Cả 10 sản phẩm đều xấu. b) Có ít nhất một sản phẩm xấu. c) Có 6 sản phẩm kiểm tra đầu là tốt, các sản phẩm còn lại là xấu. d) Có 6 sản phẩm kiểm tra đầu là xấu. 1.15 Hai người cùng bắn vào một mục tiêu. Khả năng bắn trúng của từng người là 0,8 và 0,9. Tìm xác suất: a) Chỉ có một người bắn trúng mục tiêu. b) Có người bắn trúng mục tiêu. c) Cả hai người bắn trượt. 1.16 Cơ cấu chất lượng sản phẩm của nhà máy như sau: 40% sản phẩm là loại I, 50% sản phẩm là loại II, còn lại là phế phẩm. Lấy ngẫu nhiên một sản phẩm của nhà máy. Tính xác suất sản phẩm lấy ra là phế phẩm. 1.17 Có 1000 vé số trong đó có 20 vé trúng thưởng. Một người mua 30 vé, tìm xác suất để người đó trúng 5 vé. 1.18 Để được nhập kho, sản phẩm của nhà máy phải qua 3 vòng kiểm tra chất lượng độc lập nhau. Xác suất phát hiện ra phế phẩm ở các vòng lần lượt theo thứ tự là 0,8; 0,9 và 0,99. Tính xác suất phế phẩm được nhập kho. 1.19 Một thủ kho có một chùm chìa khóa gồm 9 chiếc trông giống hệt nhau trong đó chỉ có một chiếc mở được kho. Anh ta thử ngẫu nhiên từng chìa khóa một, chiếc nào được thử thì không thử lại. Tính xác suất anh ta mở được cửa ở lần thử thứ 4. 1.20 Một lô hàng có 9 sản phẩm. Mỗi lần kiểm tra chất lượng lấy ngẫu nhiên 3 sản phẩm. Sau khi kiểm tra xong trả lại vào lô hàng. Tính xác suất để sau 3 lần kiểm tra lô hàng, tất cả các sản phẩm đều được kiểm tra. 1.21 Một nhà máy ôtô có ba phân xưởng I, II, III cùng sản xuất ra một loại pít-tông. Phân xưởng I, II, III sản xuất tương ứng 36%, 34%, 30% sản lượng của nhà máy, với tỷ lệ phế phẩm tương ứng là 0,12; 0,1; 0,08. a) Tìm tỷ lệ phế phẩm chung của nhà máy. b) Lấy ngẫu nhiên một sản phẩm kiểm tra và được sản phẩm là phế phẩm. Tính xác suất để phế phẩm đó là do phân xưởng I, II, III sản xuất. 21
  24. Chương 1: Các khái niệm cơ bản về xác suất 1.22 Có bốn nhóm xạ thủ tập bắn. Nhóm thứ nhất có 5 người, nhóm thứ hai có 7 người, nhóm thứ ba có 4 người và nhóm thứ tư có 2 người. Xác suất bắn trúng đích của mỗi người trong nhóm thứ nhất, nhóm thứ hai, nhóm thứ ba và nhóm thứ tư theo thứ tự là 0,8; 0,7; 0,6 và 0,5. Chọn ngẫu nhiên một xạ thủ và biết rằng xạ thủ này bắn trượt. Hãy xác định xem xạ thủ này có khả năng ở trong nhóm nào nhất. 1.23 Bắn hai lần độc lập với nhau mỗi lần một viên đạn vào cùng một bia. Xác suất trúng đích của viên đạn thứ nhất là 0,7 và của viên đạn thứ hai là 0,4 . Tìm xác suất để chỉ có một viên đạn trúng bia (biến cố A). Sau khi bắn, quan trắc viên báo có một vết đạn ở bia. Tìm xác suất để vết đạn đó là vết đạn của viên đạn thứ nhất. 1.24 Một nhà máy sản xuất một chi tiết của điện thoại di động có tỷ lệ sản phẩm đạt tiêu chuẩn chất lượng là 85%. Trước khi xuất xưởng người ta dùng một thiết bị kiểm tra để kết luận sản phẩm có đạt yêu cầu chất lượng hay không. Thiết bị có khả năng phát hiện đúng sản phẩm đạt tiêu chuẩn với xác suất là 0,9 và phát hiện đúng sản phẩm không đạt tiêu chuẩn với xác suất là 0,95. Tìm xác suất để 1 sản phẩm được chọn ngẫu nhiên sau khi kiểm tra: a) Được kết luận là đạt tiêu chuẩn. b) Được kết luận là đạt tiêu chuẩn thì lại không đạt tiêu chuẩn. c) Được kết luận đúng với thực chất của nó. 22
  25. Chương 2: Biến ngẫu nhiên và các đặc trưng của chúng CHƯƠNG II: BIẾN NGẪU NHIÊN VÀ CÁC ĐẶC TRƯNG CỦA CHÚNG PHẦN GIỚI THIỆU Trong chương này ta khảo sát các biến cố gắn với các giá trị nào đó, khi các giá trị này thay đổi ta được các biến ngẫu nhiên. Khái niệm biến ngẫu nhiên (còn được gọi là đại lượng ngẫu nhiên) và các đặc trưng của chúng là những khái niệm rất quan trọng của lý thuyết xác suất. Đối với biến ngẫu nhiên ta chỉ quan tâm đến vấn đề biên ngẫu nhiên này nhận một giá trị nào đó hoặc nhận giá trị trong một khoảng nào đó với xác suất bao nhiêu. Nói cách khác biên ngẫu nhiên X có thể được khảo sát thông qua hàm phân bố xác suất của nó F()xPXx=<{ } . Như vậy khi ta biết qui luật phân bố xác suất của một biến ngẫu nhiên thì ta đã nắm được toàn bộ thông tin về biến ngẫu nhiên này. Khi biến ngẫu nhiên chỉ nhận các giá trị rời rạc thì hàm phân bố xác suất hoàn toàn được xác định bởi bảng phân bố xác suất, đó là bảng ghi các giá trị mà biến ngẫu nhiên nhận với xác suất tương ứng. Khi biến ngẫu nhiên nhận giá trị liên tục thì hàm phân bố xác suất được xác định bởi hàm mật độ xác suất. Ngoài phương pháp sử dụng hàm phân bố để xác định biến ngẫu nhiên, trong nhiều trường hợp bài toán chỉ đòi hỏi cần khảo sát những đặc trưng cơ bản của biến ngẫu nhiên. Các đặc trưng của biến ngẫu nhiên được chia thành hai loại sau: ™ Các đặc trưng cho vị trí trung tâm của biến ngẫu nhiên như: Kỳ vọng, Trung vị, Mốt. ™ Các đặc trưng cho độ phân tán của biến ngẫu nhiên như: Phương sai, Độ lệch chuẩn, Hệ số biến thiên, Hệ số bất đối xứng và Hệ số nhọn. Trong các bài toán thực tế kỳ vọng được sử dụng dưới dạng lợi nhuận kỳ vọng còn phương sai để tính mức độ rủi ro của quyết định. Trong kỹ thuật độ lệch chuẩn biểu diẽn sai số của phép đo. Trong chương này ta xét các quy luật phân bố xác suất quan trọng sau: - Quy luật nhị thức, quy luật này thường gặp trong dãy phép thử Bernoulli. - Quy luật Poisson, quy luật này thường gặp trong bài toán về quá trình đếm sự xuất hiện biến cố A nào đó. Quá trình đến của các hệ phục vụ. - Quy luật phân bố đều, quy luật phân bố đều trên một đoạn là quy luật phân bố xác suất của biến ngẫu nhiên liên tục đồng khả năng lấy giá trị trong khoảng đó. Quy luật phân bố đều có ứng dụng rộng trong thống kê toán. Nó có ý nghĩa to lớn trong các bài toán sử dụng phương pháp phi tham số. 23
  26. Chương 2: Biến ngẫu nhiên và các đặc trưng của chúng - Quy luật phân bố mũ. - Quy luật phân bố Erlang-k. - Quy luật chuẩn. - Quy luật khi bình phương. - Quy luật Student. Phân bố chuẩn thường được gặp trong các bài toán về sai số khi đo đạc các đại lượng trong vật lý, thiên văn Trong thực tế, nhiều biến ngẫu nhiên tuân theo quy luật chuẩn hoặc tiệm cận chuẩn (định lý giới hạn trung tâm) chẳng hạn: trọng lượng, chiều cao của một nhóm người nào đó, điểm thi của thí sinh, năng suất cây trồng, mức lãi suất của một công ty, nhu cầu tiêu thụ của một mặt hàng nào đó Với mỗi quy luật phân bố xác suất ta sẽ khảo sát bảng phân bố xác suất hoặc hàm mật độ các tính chất và các đặc trưng của nó. Để học tốt chương này học viên phải nắm vững định nghĩa xác suất, biến cố và các tính chất của chúng. Các đặc trưng của biến ngẫu nhiên được xác định thông qua tính tổng của các số hạng nào đó (trường hợp biến ngẫu nhiên rời rạc) hoặc tính tích phân xác định (trường hợp biến ngẫu nhiên liên tục). Vì vậy học viên cần ôn tập về tích phân xác định. NỘI DUNG 2.1. BIẾN NGẪU NHIÊN 2.1.1. Khái niệm biến ngẫu nhiên Định nghĩa 2.1: Biến ngẫu nhiên X là đại lượng nhận các giá trị nào đó phụ thuộc vào các yếu tố ngẫu nhiên, nghĩa là với mọi giá trị thực x ∈ thì {X < x} là một biến cố ngẫu nhiên Như vậy đối với biến ngẫu nhiên người ta chỉ quan tâm xem nó nhận một giá trị nào đó hoặc nhận giá trị trong một khoảng nào đó với một xác suất bao nhiêu. Ví dụ 2.1: Các đại lượng sau là biến ngẫu nhiên • Số nốt xuất hiện khi gieo một con xúc xắc. • Tuổi thọ của một thiết bị đang hoạt động. • Số khách hàng vào một điểm phục vụ trong 1 đơn vị thời gian. • Số cuộc gọi đến một tổng đài. • Sai số khi đo lường một đại lượng vật lý 2.1.2. Phân loại Người ta phân các biến ngẫu nhiên thành hai loại: ™ Biến ngẫu nhiên rời rạc nếu nó chỉ nhận một số hữu hạn hoặc vô hạn đếm được các giá trị. Nghĩa là có thể liệt kê các giá trị thành một dãy x1, x2 , 24
  27. Chương 2: Biến ngẫu nhiên và các đặc trưng của chúng ™ Biến ngẫu nhiên liên tục nếu các giá trị của nó có thể lấp đầy một hoặc một số các khoảng hữu hạn hoặc vô hạn và xác suất P{X = a} bằng không với mọi a. Ví dụ 2.2: • Gọi X là số nốt xuất hiện khi gieo một con xúc xắc thì X là biến ngẫu nhiên rời rạc nhận các giá trị 1, 2,3, 4,5,6 . • Gọi Y là tuổi thọ của một thiết bị đang hoạt động thì Y là biến ngẫu nhiên liên tục nhận giá trị trong một khoảng. • Gọi Z là số khách hàng vào một điểm phục vụ trong 1 đơn vị thời gian, Z là biến ngẫu nhiên rời rạc nhận các giá trị 0,1,2, • Số cuộc gọi đến một tổng đài là biến ngẫu nhiên rời rạc nhận các giá trị 0,1, 2, • Sai số khi đo lường một đại lượng vật lý Y nào đó là biến ngẫu nhiên liên tục nhận giá trị trong một khoảng. 2.1.3. Hàm phân bố xác suất Định nghĩa 2.2: Hàm phân bố xác suất (cumulative distribution function, viết tắt CDF) của biến ngẫu nhiên X là hàm số F(x) xác định với mọi x ∈ bởi công thức: F(x) = P{X 0 và ∑ pi =1. i Bảng phân bố xác suất của X có dạng sau: X x x 1 2 P p1 p2 25
  28. Chương 2: Biến ngẫu nhiên và các đặc trưng của chúng • Nếu biến ngẫu nhiên rời rạc X nhận vô hạn các giá trị x1, x2 , thì hàm phân bố có dạng: ⎧ 0 nÕu x ≤ x1 F(x) = ⎨ (2.5) ⎩p1 + p2 ++ pk−1 nÕu xk−1 xn Ví dụ 2.3: Chọn ngẫu nhiên 3 bi từ một túi có 6 bi đen, 4 bi trắng. Gọi X là số bi trắng trong 3 bi vừa chọn thì X là một biến ngẫu nhiên rời rạc. Tìm bảng phân bố và hàm phân bố. C3 5 CC21 15 Giải: PX==0 6 = , PX==1 64 = {}3 {}3 C10 30 C10 30 CC12 9 C3 1 PX==2 64 = , PX==3 4 = {}3 {}3 C10 30 C10 30 X 0 1 2 3 Bảng phân bố xác suất: P 5/ 30 15/ 30 9 / 30 1/ 30 ⎧ 0 nÕu x ≤ 0 ⎪5/ 30 nÕu 0 3 Đồ thị 26
  29. Chương 2: Biến ngẫu nhiên và các đặc trưng của chúng y 30 / 30 29 / 30 20 / 30 5/30 O 1 2 3 x 2.2.2. Qui luật nhị thức B(n; p) Định nghĩa 2.3: Biến ngẫu nhiên rời rạc X nhận các giá trị 0, 1, , n với xác suất tương ứng k k n−k P{X = k}= Cn p q (2.8) trong đó n là số tự nhiên và 0 < p < 1, q = 1− p , được gọi là có phân bố nhị thức tham số n, p , ký hiệu X ~ B(n; p) . Bảng phân bố xác suất của biến ngẫu nhiên có quy luật nhị thức B(n; p) X 0 1 k n 0 0 n 1 1 n−1 k k n−k nn0 P Cn p q Cn p q Cn p q Cpqn Nhận xét: 1. Thực hiện n phép thử Bernoulli với xác suất thành công của biến cố A trong mỗi lần thử là p . Với mỗi in=1,2, , ; nếu ở lần thử thứ i biến cố A xuất hiện ta cho X i nhận giá trị 1, nếu biến cố A không xuất hiện ta cho X i nhận giá trị 0. Như vậy X i là biến ngẫu nhiên rời rạc có bảng phân bố: X i 0 1 P 1− p p X i được gọi là có phân bố không- một A()p . (2.9) Gọi X là số thành công trong n phép thử Bernoulli này thì 27
  30. Chương 2: Biến ngẫu nhiên và các đặc trưng của chúng X =+++XX12 Xn ~(;)B np (2.10) 2. Từ (2.10) suy ra rằng nếu X ~ B(n1 ; p) và Y ~ B(n2 ; p) thì X + Y ~ B(n1 + n2 ; p) (2.11) 2.2.3. Phân bố Poisson Định nghĩa 2.4: Biến ngẫu nhiên X nhận các giá trị k = 0, 1, 2, với xác suất λk PX{}== k e−λ (2.12) k! gọi là có phân bố Poisson tham số λ>0 , ký hiệu X ~()P λ . Trong thực tế với một số giả thiết thích hợp thì các biến ngẫu nhiên là các quá trình đếm sau: 1) Số cuộc gọi đến một tổng đài. 2) Số khách hàng đến 1 điểm phục vụ. 3) Số xe cộ qua 1 ngã tư. 4) Số tai nạn (xe cộ); số các sự cố xảy ra ở một địa điểm trong một khoảng thời gian xác định nào đó sẽ có phân bố Poisson với tham số λ là tốc độ trung bình diễn ra trong khoảng thời gian này. Ví dụ 3.3: Ở một tổng đài điện thoại các cuộc gọi đến một cách ngẫu nhiên, độc lập và trung bình có 2 cuộc gọi trong 1 phút. Tìm xác suất để: a) Có đúng 5 cuộc gọi đến trong 2 phút (biến cố A). b) Không có một cuộc gọi nào trong 30 giây (biến cố B). c) Có ít nhất 1 cuộc gọi trong 10 giây (biến cố C). Giải: Nếu ký hiệu X (t) là số cuộc gọi đến tổng đài trong khoảng thời gian t phút thì X (t) ~ P (2t) . 45 a) X (2) ~ P (4) , do đó P(A) = P{}X (2) = 5 = e−4 ≈ 0,156 . 5! b) X (1/ 2) ~ P (1) , do đó P(B) = P{X (1/ 2) = 0}= e−1 ≈ 0,3679 . c) X (1/ 6) ~ P (1/ 3) , do đó P(C) = P{}X (1/ 6) ≥ 0 = 1− P{X (1/ 6) = 0}= 1− e−1/3 ≈ 0,2835 . Quy luật Poisson có ứng dụng rộng rãi trong nhiều lĩnh vực thực tế như kiểm tra chất lượng sản phẩm, lý thuyết quản trị dự trữ, lý thuyết sắp hàng, các hệ phục vụ đám đông, các bài toán chuyển mạch trong tổng đài 28
  31. Chương 2: Biến ngẫu nhiên và các đặc trưng của chúng Nếu X1, X 2 là hai biến ngẫu nhiên độc lập có phân bố Poisson tham số lần lượt λ1, λ 2 thì X12+ X cũng có phân bố Poisson tham số λ12+ λ . X1 + X 2 ~ P (λ1 + λ 2 ) (2.13) 2.3. BIẾN NGẪU NHIÊN LIÊN TỤC 2.3.1. Hàm mật độ phân bố xác suất của biến ngẫu nhiên liên tục Định nghĩa 2.5: Giả sử X là một biến ngẫu nhiên liên tục có hàm phân bố F(x) . Nếu tồn tại hàm f (x) sao cho với mọi x ∈ x F(x) = ∫ f (t)dt (2.14) −∞ thì f (x) được gọi là hàm mật độ của biến ngẫu nhiên X (probability density function, viết tắt PDF). Như vậy giá trị của hàm F(x) bằng diện tích hình phẳng giới hạn bởi đồ thị hàm mật độ f (x) , trục hoành và đường thẳng song song với trục tung có hoàng độ là x . f ()x F(x) x x Tính chất của hàm mật độ a. F'(x) = f (x) tại các điểm x mà f (x) liên tục. (2.15) b. f (x) ≥ 0 với mọi x ∈ , (2.16) ∞ c. ∫ f (x)dx = 1, (2.17) −∞ b d. P{}{}{}{}a < X < b = P a ≤ X ≤ b = P a < X ≤ b = P a ≤ X < b = ∫ f (x)dx . (2.18) a Ví dụ 2.4: Hàm phân bố xác suất của biến ngẫu nhiên liên tục X có dạng 29
  32. Chương 2: Biến ngẫu nhiên và các đặc trưng của chúng ⎧ 0 víi x ≤ 0 ⎪ 2 F(x) = ⎨kx víi 0 1 ⎩ a. Xác định hệ số k ; b. Tìm hàm mật độ xác suất f (x) . Giải: a. Vì hàm phân bố xác suất F(x) liên tục, do đó tại x = 1 ⇒ 1 = F(1) = kx2 = k . x=1 b. Theo tính chất (2.10) của hàm mật độ xác suất ta có ⎧ 00víi x ≤ ⎪ f ()xx= ⎨ 2víi 0<< x 1 ⎪ ⎩ 01víi x ≥ Ví dụ 2.5: Biến ngẫu nhiên liên tục X có hàm mật độ dạng ⎧ 0 víi x < 1 ⎪ f (x) = ⎨ k ⎪ víi x ≥ 1 ⎩ x2 Hãy xác định: a. Hệ số k ; b. Hàm phân bố F(x) ; c. Xác suất P{}2 < X < 3 ; d. Xác suất để trong 4 phép thử độc lập biến ngẫu nhiên X đều không lấy giá trị trong khoảng (2,3) . Giải: ∞ ∞ k ⎛ k a ⎞ a. Dựa vào tính chất (2.12) ta có 1 = f (x)dx = dx = − lim ⎜ ⎟ = k , từ đó k = 1. ∫ ∫ 2 a→∞⎜ x ⎟ −∞ 1 x ⎝ 1 ⎠ b. Từ công thức (2.9) xác định hàm mật độ ta có x ⎧ 0 víi x < 1 ⎪ F(x) = f (t)dt = ⎨ x −1 ∫ víi x ≥ 1 −∞ ⎩⎪ x 2 1 1 c. Từ công thức (2.13) ta có P{}2 < X < 3 = F(3) − F(2) = − = . 3 2 6 30
  33. Chương 2: Biến ngẫu nhiên và các đặc trưng của chúng 1 5 d. Xác suất để X không lấy giá trị trong khoảng (2;3) trong một phép thử bằng 1− = . 6 6 Vậy xác suất để trong 4 phép thử độc lập biến ngẫu nhiên X đều không lấy giá trị trong khoảng 4 ⎛ 5 ⎞ (2;3) bằng ⎜ ⎟ ≈ 0,48 . ⎝ 6 ⎠ 2.3.2. Quy luật phân bố đều U(a,b) Định nghĩa 2.6: Biến ngẫu nhiên X được gọi là có phân bố đều trên []a,b nếu hàm mật độ của nó xác định bởi: ⎧ 1 ⎪ nÕu a ≤ x ≤ b f (x) = ⎨b − a (2.19) ⎩⎪ 0 nÕu ng−îc l¹i Hàm phân bố ⎧ 0 nÕu x b Vậy X có khả năng nhận giá trị trong khoảng [a,b] là “đều nhau” và không nhận giá trị ngoài []a,b . f (x) F(x) 1 b − a O a x b x Đồ thị hàm mật độ của phân bố đều U(a,b) F(x) 1 b − a O a b x Đồ thị của hàm phân bố đều U(a,b) 31
  34. Chương 2: Biến ngẫu nhiên và các đặc trưng của chúng Quy luật phân bố đều có nhiều ứng dụng trong thống kê toán như mô phỏng thống kê, đặc biệt trong phương pháp phi tham số. Trong một số lý thuyết kết luận thống kê người ta thường xuất phát từ quy tắc sau đây: Nếu ta không biết gì về giá trị của tham số cần ước lượng thì mỗi giá trị có thể có của tham số đó là đồng khả năng. Điều đó dẫn đến việc quan niệm tham số cần ước lượng như một biến ngẫu nhiên có quy luật phân bố đều. 2.3.3. Phân bố mũ Định nghĩa 2.7: Biến ngẫu nhiên X được gọi là có phân bố mũ tham số λ > 0 nếu có hàm mật độ: ⎪⎧λe−λx nÕu x > 0 f (x) = ⎨ (2.21) ⎩⎪ 0 nÕu x ≤ 0 Hàm phân bố x ⎪⎧ 0 nÕu x ≤ 0 F(x) = f (t)dt = (2.22) ∫ ⎨ −λx −∞ ⎩⎪1 − e nÕu x > 0 Phân bố mũ thường xuất hiện trong các bài toán về thời gian sống của một loài sinh vật, tuổi thọ của thiết bị hoặc khoảng thời gian giữa hai lần xuất hiện của một biến cố E nào đó mà số lần xuất hiện của E tuân theo luật phân bố Poisson. Ví dụ 2.5: Tuổi thọ của một mạch điện tử trong máy tính là một biến ngẫu nhiên có phân bố 1 mũ tham số λ > 0 . Giả sử tuổi thọ trung bình của mạch điện tử này là = 6,25 (năm). Thời gian λ bảo hành là 5 năm. Hỏi có bao nhiêu phần trăm mạch điện tử bán ra phải thay thế trong thời gian bảo hành. Giải: Gọi X là tuổi thọ của mạch điện tử. Xác suất để mạch điện tử bị hỏng trong thời gian bảo hành là: −5 PX{}≤=−5 1 e−−50,8λ =− 1 e6,25 =− 1 e =− 1 0,449 = 0,551. Vậy có khoảng 55% số mạch điện tử bán ra phải thay thế trong thời gian bảo hành. Biến ngẫu nhiên X được gọi là không nhớ (memoryless) nếu PX{ >+ x tX > t} = PX{ > x} ∀ xt,0 > P{}X > x + t = P{X > x}P{X > t} ∀ x,t > 0 (2.23) Gọi F(x) là hàm phân bố của X , đặt G(x) = P{X > x}=1 − F(x) . Điều kiện (2.23) có thể viết lại G(x + t) = G(x)G(t) (2.24) Giải phương trình (2.24) với điều kiện G(x) =1, ∀x < 0 và G(+∞) = 0 ta được G(x) = e−λx . Vậy biến ngẫu nhiên X không nhớ khi và chỉ khi X có phân bố mũ. Vì vậy phân bố mũ còn được gọi là phân bố Markov. 32
  35. Chương 2: Biến ngẫu nhiên và các đặc trưng của chúng 2.3.4. Quy luật phân bố Erlang − k Định nghĩa 2.8: Biến ngẫu nhiên X có phân bố Erlang − k tham số λ > 0 nếu hàm mật độ có dạng: ⎧ λk ⎪ xk−1eλx nÕu x > 0 f (x) = ⎨(k −1)! (2.25) ⎪ ⎩ 0 nÕu x ≤ 0 Có thể chứng minh được rằng nếu X1, X 2 , , X k là k biến ngẫu nhiên độc lập cùng có phân bố mũ tham số λ > 0 thì X = X1 + X 2 ++ X k có phân bố Erlang − k tham số λ . 2.3.5. Quy luật chuẩn N(μ;σ2 ) 2.3.5.1. Định nghĩa Định nghĩa 2.9: Biến ngẫu nhiên liên tục X có phân bố chuẩn N(μ;σ2 ) , ký hiệu X ~ N(μ;σ2 ) , nếu hàm mật độ có dạng −−()x μ 2 1 2 fx()= e2σ ; ∀∈ x  (2.26) σπ2 Phân bố chuẩn được Gauss tìm ra năm 1809 nên nó còn được gọi là phân bố Gauss. Phân bố chuẩn thường được thấy trong các bài toán về sai số gặp phải khi đo đạc các đại lượng vật lý, thiên văn Trong thực tế, nhiều biến ngẫu nhiên tuân theo quy luật chuẩn hoặc tiệm cận chuẩn (Định lý giới hạn trung tâm). Chẳng hạn: trọng lượng, chiều cao của một nhóm người nào đó, điểm thi của thí sinh, năng suất cây trồng, mức lãi suất của một công ty, nhu cầu tiêu thụ của một mặt hàng nào đó 2.3.5.2. Tính chất đồ thị của hàm mật độ của quy luật chuẩn Từ công thức xác định hàm mật độ (2.26) ta suy ra các tính chất sau của đồ thị: - Nhận trục x = μ làm trục đối xứng. - Tiệm cận với trục hoành khi x → ±∞ . - Diện tích giới hạn bởi đồ thị và trục hoành bằng 1. 1 - Đạt cực đại tại x = μ và có giá trị cực đại bằng . Có 2 điểm uốn tại x =±μ σ . σ 2π - Do đó khi μ tăng lên thì đồ thị dịch sang phải, còn khi μ giảm đồ thị dịch sang trái. - Khi σ tăng lên thì đồ thị sẽ thấp xuống, còn khi σ giảm đồ thị cao lên và nhọn hơn. 33
  36. Chương 2: Biến ngẫu nhiên và các đặc trưng của chúng y σ 1 O x = μ x 2 Nếu X1, X 2 là hai biến ngẫu nhiên độc lập có phân bố chuẩn X1 ~ N(μ1 ;σ1 ) và 2 X 2 ~ N(μ2 ;σ2 ) thì tổ hợp tuyến tính bất kỳ của X1, X 2 cũng có phân bố chuẩn, đặc biệt 2 2 X1 + X 2 ~ N(μ1 + μ2 ;σ1 + σ2 ) (2.27) 2.3.5.3. Phân bố chuẩn tắc Phân bố chuẩn N(0;1) với kỳ vọng bằng 0, phương sai bằng 1 gọi là phân bố chuẩn tắc. Hàm mật độ của N(0;1) −x2 1 ϕ()xe= 2 ; ∀ x ∈ (2.28) 2π Hàm phân bố của N(0;1) 2 xx−t 1 Φ=()x ∫∫ϕ ()tdt = e2 dt ; ∀ x ∈ (2.29) −∞2π −∞ Có bảng tính sẵn các giá trị của ϕ()x và Φ(x) (xem Phụ lục I và Phụ lục II). Đồ thị của hàm mật độ ϕ(x) 34
  37. Chương 2: Biến ngẫu nhiên và các đặc trưng của chúng y 1 2π Φ(−a) 1− Φ(a) − a O a x Các tính chất của hàm phân bố Φ(x) 1) Φ(x) + Φ(−x) = 1, Φ(−x) = 1− Φ(x) . 2) Nếu X ~ N(0;1) thì ∀>aPXa0,{ =} 2( 1 −Φ ( a )) . (2.30) Định nghĩa 2.10: Giá trị U α gọi là giá trị tới hạn của phân bố chuẩn tắc mức α nếu −1 Φ (1− α) = U α . (2.31) Nếu X ~ N(0;1) thì ⎪⎪⎪⎪⎧⎫⎧⎫ PX{}>= Uααα ;;1 P⎨⎬⎨⎬ X > U =αα P X < U α =−. (2.32) ⎩⎭⎩⎭⎪⎪⎪⎪22 Người ta chứng minh được: X − μ Nếu X ~ N(μ;σ2 ) thì ~ N(0;1) . (2.33) σ Từ đó ta có ⎧ X − μ x − μ⎫ ⎛ x − μ ⎞ F(x) = P{}X < x = P⎨ < ⎬ = Φ⎜ ⎟ . (2.33)’ ⎩ σ σ ⎭ ⎝ σ ⎠ ⎧a − μ X − μ b − μ⎫ ⎛ b − μ ⎞ ⎛ a − μ ⎞ P{}a < X < b = P⎨ < < ⎬ = Φ⎜ ⎟ − Φ⎜ ⎟ . (2.33)” ⎩ σ σ σ ⎭ ⎝ σ ⎠ ⎝ σ ⎠ Xác suất của sự sai lệch giữa biến ngẫu nhiên có quy luật chuẩn X ~ N(μ;σ2 ) và kỳ vọng của nó được tính theo công thức ⎛⎞ε PX{}− με<=Φ21⎜⎟ − (2.34) ⎝⎠σ 35
  38. Chương 2: Biến ngẫu nhiên và các đặc trưng của chúng Ví dụ 3.4: Giả sử X ~ N(μ;σ2 ) , μ = 2100, σ = 200 . Hãy tìm: a) P{}X > 2400 . b) P{}1700 a = 0,03 . Giải: ⎛ 2400 − 2100 ⎞ a) P{}X > 2400 = 1− Φ⎜ ⎟ = 1− Φ(1,5) = 1− 0,9332 = 0,0668. ⎝ 200 ⎠ b) Áp dụng công thức (3.23): ⎛ 2200 − 2100 ⎞ ⎛1700 − 2100 ⎞ P{}1700 a = 1− Φ⎜ ⎟ = 0,03 ⇒ Φ⎜ ⎟ = 0,97 ⎝ 200 ⎠ ⎝ 200 ⎠ a − 2100 Tra bảng ta được 0,97 = Φ(1,881) ⇒ = 1,881 ⇒ a = 2476,2 . 200 2.3.5.4. Quy tắc hai xích ma và ba xích ma Nếu trong công thức (3.27) ta đặt ε = 2σ tức là bằng hai lần độ lệch chuẩn của X thì PX{ − 0 f (x) = ⎨2n / 2 Γ(n / 2) (2.37) ⎪ ⎩ 0 nÕu x ≤ 0 36
  39. Chương 2: Biến ngẫu nhiên và các đặc trưng của chúng +∞ trong đó Γ(x) = ∫ t x−1e−t dt là hàm Gamma. 0 Có thể chứng minh được rằng nếu X1, X 2 , , X n là các biến ngẫu nhiên độc lập có cùng phân bố chuẩn tắc N(0,1) thì n 2 2 2 2 2 ∑ X i = X1 + X 2 ++ X n ~ χn (2.38) i=1 Phân bố χ2 do Karl Pearson đưa ra vào năm 1900. Từ (3.34) suy ra rằng nếu X1, X 2 là hai biến ngẫu nhiên độc lập có phân bố khi bình phương lần lượt n1 và n2 bậc tự do thì X12+ X là biến ngẫu nhiên có phân bố khi bình phương n1 + n2 bậc tự do X + X ~ χ2 (2.39) 1 2 n1+n2 y α O χ2 (n) x α 2 Giá trị tới hạn khi bình phương n bậc tự do mức α , ký hiệu χα (n) , được định nghĩa như sau: 2 2 P{χ > χα (n)}= α . (2.40) 2 Bảng các giá trị tới hạn χα (n) được tính sẵn trong bảng ở Phụ lục III. 2.3.7. Quy luật student T(n) Định nghĩa 2.12: Biến ngẫu nhiên liên tục T có phân bố Student n bậc tự do, ký hiệu T ~ T(n) , nếu hàm mật độ có dạng: ⎛ n +1⎞ −(n+1) Γ⎜ ⎟ 2 ⎛ t 2 ⎞ 2 f (t) = ⎝ ⎠ ⎜1+ ⎟ , − ∞ < t < ∞ . (2.41) ⎜ ⎟ nπΓ()n / 2 ⎝ n ⎠ 37
  40. Chương 2: Biến ngẫu nhiên và các đặc trưng của chúng trong đó Γ(x) là hàm Gamma. 2 Người ta chứng minh được rằng nếu Z ~ N(0;1), V ~ χn ; Z và V độc lập thì Z T = ~ T(n) (2.42) V n Giá trị tới hạn mức α của phân bố Student n bậc tự do ký hiệu tn (α) thỏa mãn: P{T > tα (n)}= α . (2.43) Bảng tính các giá trị tới hạn tα (n) cho trong Phụ lục IV. Hàm mật độ (3.38) là hàm chẵn nên đồ thị đối xứng qua trục tung. Khi số bậc tự do tăng lên, phân bố Student hội tụ rất nhanh về phân bố chuẩn tắc N(0;1) . Do đó khi n đủ lớn ( n ≥ 30 ) có thể dùng phân bố chuẩn tắc thay cho phân bố Student. Tuy nhiên khi n nhỏ ( n < 30 ) việc thay thế như trên sẽ gặp sai số lớn. f (t) α α t (n) O α−1 tα (n) t 2.4. CÁC THAM SỐ ĐẶC TRƯNG CỦA BIẾN NGẪU NHIÊN 2.4.1. Kỳ vọng toán 2.4.1.1. Định nghĩa Kỳ vọng hoặc giá trị trung bình (average, mean value, expected value) của biến ngẫu nhiên X ký hiệu là EX và được xác định như sau: (i) Nếu X rời rạc nhận các giá trị xi với xác suất tương ứng pi = P{}X = xi thì E X = ∑ xi pi (2.44) i (ii) Nếu X liên tục có hàm mật độ f (x) thì 38
  41. Chương 2: Biến ngẫu nhiên và các đặc trưng của chúng ∞ E X = ∫ xf (x)dx (2.45) −∞ Kỳ vọng E X tồn tại nếu chuỗi (2.44) (trường hợp rời rạc) hội tụ tuyệt đối hoặc tích phân (2.45) (trường hợp liên tục) hội tụ tuyệt đối. Ví dụ 2.6: Tính kỳ vọng của biến ngẫu nhiên X cho ở ví dụ 2.3. 5 15 9 1 6 Giải: E X = 0× +1× + 2× + 3× = . 30 30 30 30 5 Ví dụ 2.7: Theo thống kê việc một người Mỹ 25 tuổi sẽ sống thêm trên một năm có xác suất là 0,992, còn xác suất để người đó chết trong vòng một năm tới là 0,008. Một chương trình bảo hiểm đề nghị người đó bảo hiểm sinh mạng cho 1 năm với số tiền chi trả 1000 đô la, còn tiền đóng là 10 đô la. Hỏi lợi nhuận của công ty bảo hiểm nhận được là bao nhiêu? Giải: Rõ ràng lợi nhuận là biến ngẫu nhiên X với 2 giá trị là +10 đô la (nếu người bảo hiểm không chết) và − 990 đô la (nếu người đó chết). Bảng phân bố xác suất tương ứng. X − 990 +10 P 0,008 0,992 Do đó kỳ vọng E X = (−990) ⋅ 0,008 +10 ⋅ 0,992 = 2 . Ta thấy lợi nhuận trung bình là một số dương vì vậy công ty bảo hiểm có thể làm ăn có lãi. Ví dụ 2.8: Tuổi thọ của một loại côn trùng nào đó là một biến ngẫu nhiên X (đơn vị là tháng) với hàm mật độ như sau: ⎪⎧kx2 (4 − x) nÕu 0 ≤ x ≤ 4 f (x) = ⎨ ⎩⎪ 0 nÕu ng−îc l¹i Tìm hàm phân bố và tìm tuổi thọ trung bình của loài côn trùng trên. 4 64 3 Giải: Vì x2 (4 − x)dx = ⇒ k = . Hàm phân bố xác suất ∫ 3 64 0 ⎧ 0 nÕu x ≤ 0 x ⎪ ⎪3x3 ⎛ 4 x ⎞ F(x) = f (t)dt = ⎨ ⎜ − ⎟ nÕu 0 4 4 3 4 3 ⎛ x5 ⎞ 12 Tuổi thọ trung bình E X = x3 (4 − x)dx = ⎜ x4 − ⎟ = (tháng). 64 ∫ 64 ⎜ 5 ⎟ 5 0 ⎝ ⎠ 0 2.4.1.2. Ý nghĩa của kỳ vọng Kỳ vọng mang ý nghĩa là giá trị trung bình mà biến ngẫu nhiên nhận được. Giả sử biến ngẫu nhiên X nhận các giá trị x1, x2 , , xm với các tần số tương ứng r1,r2 , ,rm . 39
  42. Chương 2: Biến ngẫu nhiên và các đặc trưng của chúng ri xi là tổng giá trị X nhận được với cùng giá trị xi . Do đó r1x1 + r2 x2 ++ rm xm là r x + r x ++ r x tổng tất cả các giá trị X nhận được. 1 1 2 2 m m là giá trị trung bình của X , trong n đó r1 + r2 ++ rm = n . r f = i được gọi là tần suất nhận giá trị x của X . Trong trường hợp tổng quát thì tần i n i suất fi được thay bằng xác suất pi . Trường hợp biến ngẫu nhiên liên tục phép tính tổng của giá trị trung bình được thay bằng phép tính tích phân xác định. Khái niệm kỳ vọng được áp dụng rộng rãi trong nhiều lĩnh vực. Trong kinh doanh và quản lý, kỳ vọng được ứng dụng dưới dạng lợi nhuận kỳ vọng hay doanh số kỳ vọng. 2.4.1.3. Tính chất 1) E (C) = C với mọi hằng số C. 2) E (CX ) = CE (X ) với mọi hằng số C. (2.46) 3) E ()()X1 ++ X n = E X1 ++ E (X n ) (2.47) 4) Cho hàm số ϕ(x) , xét biến ngẫu nhiên Y = ϕ(X ) thì ⎧ ∑ϕ(xi ) pi nÕu X rêi r¹c cã p = P{X = xi } ⎪ i ⎪ i EY = ⎨ ∞ (2.48) ⎪ ϕ(x)f(x)dx nÕu X liª n tôc cã hµm mËt đé f (x) ⎪ ∫ ⎩ −∞ Đặc biệt ta có các đẳng thức sau nếu tổng hoặc tích phân sau tương ứng hội tụ: ⎧ 2 ∑ xpii nÕu X rêi r¹c ⎪ i 2 ⎪ E X = ⎨ ∞ (2.49) 2 ⎪ ∫ xf(x)dx nÕu X liª n tôc cã hµm mËt đ é fx() ⎩⎪ −∞ 5) Giả sử ϕ(x, y) là hàm hai biến sao cho ϕ(X ,Y ) còn là biến ngẫu nhiên, khi đó: ⎧ ∑ϕ(xi , y j ) pij nÕu X rêi r¹c cã p = P{X = xi ,Y = y j } ⎪ ij ⎪ i, j E ϕ(X ,Y ) = ⎨ ∞ ∞ (2.50) ⎪ ϕ(x, y)f(x, y)dxdy nÕu (X ,Y ) liª n tôc cã hµm mËt đé f (x, y) ⎪ ∫∫ ⎩ −∞ −∞ 6) Nếu X1, , X n độc lập thì E (X1 X n ) = E (X1 )E (X n ). (2.51) Ví dụ 2.10: Chọn ngẫu nhiên 3 bi từ một túi có 6 bi đen, 4 bi trắng. 40
  43. Chương 2: Biến ngẫu nhiên và các đặc trưng của chúng a) Nếu chọn được 1 bi trắng sẽ được thưởng 200$. Gọi Y là số tiền nhận được. Tính kỳ vọng của Y . b) Nếu chọn được 1 bi trắng sẽ được thưởng 200$ và chọn được 1 bi đen sẽ được thưởng 300$. Gọi Z là số tiền nhận được. Tính kỳ vọng của Z . Giải: a) Gọi X là số bi trắng trong 3 bi vừa chọn (xem ví dụ 2.3) thì Y = ϕ(X ) = 200X là một biến ngẫu nhiên rời rạc có bảng phân bố sau: Y = ϕ(X ) 0 200 400 600 P 5/ 30 15/ 30 9 / 30 1/ 30 5 15 9 1 EY = 0× + 200× + 400× + 600× = 240 = 200E X . 30 30 30 30 b) Z = 200X + 300(3 − X ) = 900 −100X 6 ⇒ E Z = E ()900 −100X = 900 −100EX = 900 −100× = 780$ . 5 Ví dụ 2.11: Tung con xúc xắc n lần. Tìm kỳ vọng của tổng số nốt thu được. Giải: Gọi X i (i = 1, ,n) là số nốt thu được ở lần tung thứ i , gọi X là tổng số nốt thu n n được trong n lần tung. Như vậy X = ∑ X i . Theo công thức (3.5) ta có E X = ∑ E X i . i=1 i=1 Các biến ngẫu nhiên X i đều có bảng phân bố xác suất như sau X i 1 2 3 4 5 6 P 1/ 6 1/ 6 1/ 6 1/ 6 1/ 6 1/ 6 1 7 7 Do đó E X = ()1+ 2 + 3 + 4 + 5 + 6 = ⇒ E X = n . i 6 2 2 2.4.2. Phương sai 2.4.2.1. Định nghĩa Phương sai (variance) hay độ lệch bình phương trung bình của biến ngẫu nhiên X là đại lượng đo sự phân tán bình phương trung bình của X xung quanh giá trị trung bình EX . Phương sai của X được ký hiệu là DX hay var X và định nghĩa như sau: 2 DEX =−()XX E (2.52) σ X = DX được gọi là độ lệch tiêu chuẩn (deviation) của X . Khai triển vế phải công thức (2.52) và áp dụng các tính chất của kỳ vọng ta có thể tính phương sai theo công thức sau: 41
  44. Chương 2: Biến ngẫu nhiên và các đặc trưng của chúng 2 DEX =−XX2 () E (2.53) Theo công thức (2.49) thì phương sai có thể tính theo công thức sau: (i). Nếu X rời rạc nhận các giá trị với xác suất tương ứng pi = P{X = xi } thì 2 2 2 D X = ∑(xi − E X ) pi = ∑ xi pi − (E X ) (2.54) i i (ii). Nếu X liên tục có hàm mật độ f (x) thì ∞ ∞ D X = ∫ ()x − E X 2 f (x)dx = ∫ x2 f (x)dx − ()E X 2 (2.55) −∞ −∞ Ví dụ 2.12: Tính phương sai của biến ngẫu nhiên xét trong ví dụ 2.7. Giải: EX 22=− ( 990) ⋅ 0,008 + 10 2 ⋅ 0,992 = 7940 2 2 ⇒=−DXX E() E X = 7940 −= 4 7936 ⇒ σ X = DX = 7936 ≈ 89,08. Điều này nói lên rằng mặc dù kinh doanh bảo hiểm có lãi nhưng rủi ro khá lớn. Ví dụ 2.13: Tính phương sai của biến ngẫu nhiên xét trong ví dụ 2.8. 4 3 4 3 ⎛ 4x5 x6 ⎞ 32 Giải: E X 2 = x4 (4 − x)dx = ⎜ − ⎟ = 64 ∫ 64 ⎜ 5 6 ⎟ 5 0 ⎝ ⎠ 0 2 2 2 32 ⎛12 ⎞ 16 4 ⇒ DX = EX − ()EX = − ⎜ ⎟ = ⇒ σ X = . 5 ⎝ 5 ⎠ 25 5 Phương sai của biến ngẫu nhiên X là độ lệch bình phương trung bình quanh giá trị trung bình E X . Trong kỹ thuật phương sai đặc trưng cho mức độ phân tán của các chi tiết gia công hay sai số của thiết bị. Trong quản lý và kinh doanh thì phương sai đặc trưng cho mức độ rủi ro của các quyết định. Ví dụ 2.8 cho thấy đầu tư bảo hiểm cho những người 25 tuổi là có lãi, nhưng ví dụ 2.12 cho thấy rủi ro của bảo hiểm rất lớn. 2.4.2.2. Tính chất 1) D(a )= 0 với mọi hằng số a . (2.56) 2) D(aX )= a2 D( X ) với mọi hằng số a . 3) D(aX+= b ) a2 D( X ) với mọi hằng số a, b . (2.57) 4) Nếu X1, , X n độc lập có các phương sai hữu hạn thì DDDaX++ a X = a22 X ++ a X . (2.58) ()11nn1 () 1 n ( n) 42
  45. Chương 2: Biến ngẫu nhiên và các đặc trưng của chúng Nói riêng: Nếu X ,Y độc lập và D,DX Y hữu hạn thì DDD( X ±=YXY) + . Ví dụ 2.15: Tung con xúc xắc n lần độc lập nhau. Tìm phương sai của tổng số nốt xuất hiện. n Giải: Xét X = ∑ X i ở ví dụ 2.11. Vì các X i (i = 1, ,n) độc lập nhau, do đó theo công i=1 n thức (2.58) ta có DDX = ∑ Xi . i=1 7 1 91 Mặt khác E X = ; E X 2 = (12 + 22 + 32 + 42 + 52 + 62 )= . i 2 i 6 6 91 72 35 35 Do đó DXi =− =. Vậy DX = n . 61222 12 2.4.3. Phân vị, Trung vị 2.4.3.1. Phân vị Phân vị mức α của biến ngẫu nhiên X có hàm phân bố F(x) là giá trị vα thỏa mãn P{X < vα }≤ α ≤ P{X ≤ vα } Hay F(vα ) ≤ α ≤ F(vα + 0) (2.59) • Nếu F(x) liên tục tăng chặt thì phân vị vα là nghiệm duy nhất của phương trình F(x) = α , nghĩa là −1 vα = F (α) (2.60) X x1 x2 • Nếu X rời rạc có phân bố: đặt Pi = p1 ++ pi thì P p1 p2 ⎧ m, ∀m ∈[xi , xi+1] nÕu Pi = α < Pi+1 vα = ⎨ (2.61) ⎩ xi+1 nÕu Pi < α < Pi+1 2.4.3.2. Trung vị Phân vị mức 1/2 được gọi là median hay trung vị của X , ký hiệu MedX . Như vậy trung vị là điểm phân chia phân bố xác suất thành hai phần bằng nhau. 2.4.4. Mốt Mốt (Mode) của biến ngẫu nhiên X là giá trị mà biến ngẫu nhiên X nhận với xác suất lớn nhất. 43
  46. Chương 2: Biến ngẫu nhiên và các đặc trưng của chúng X x x • Nếu X rời rạc có phân bố: 1 2 thì P p1 p2 x = Mod X ⇔ p = max p , p , (2.62) i0 i0 { 1 2 } • Nếu X liên tục có hàm mật độ f (x) c = Mod X ⇔ f (c) = max{f (x), x ∈}. (2.63) Ví dụ 2.16: Biến ngẫu nhiên X ở ví dụ 2.3 có Mốt và trung vị ModX = MedX = 1. Ví dụ 2.17: Tìm trung vị và Mốt của biến ngẫu nhiên rời rạc có bảng phân bố xác suất X 20 21 22 23 24 P 0,3 0,25 0,18 0,14 0,13 Giải: Dễ thấy rằng ModX = 20 . Hàm phân bố xác suất của X ⎧ 0 nÕu x ≤ 20 ⎪ ⎪ 0,3 nÕu 20 24 Từ đó suy ra MedX = 21. Ví dụ 2.18: Tìm MedX và ModX của biến ngẫu nhiên liên tục X xét trong ví dụ 2.4 1 1 Giải: MedX là nghiệm của phương trình F(x) = x2 = ⇒ MedX = . 2 2 ⎧ 0 víi x ≤ 0 ⎪ Hàm mật độ f (x) = ⎨2x víi 0 1 Ví dụ 2.19: Tìm MedX và ModX của biến ngẫu nhiên liên tục X có hàm mật độ xác định như sau ⎧3 ⎪ x()2 − x víi 0 ≤ x ≤ 2 f (x) = ⎨4 ⎩⎪ 0 nÕu tr¸i l¹i Giải: Hàm phân bố xác suất 44
  47. Chương 2: Biến ngẫu nhiên và các đặc trưng của chúng ⎧ 0 víi x ≤ 0 ⎪ ⎪3 ⎛ x3 ⎞ F(x) = ⎜ x2 − ⎟ víi 0 2 1 ⎪⎧x3 − 3x2 + 2 = 0 MedX là nghiệm của phương trình F(x) = ⇔ ⎨ . Từ đó MedX = 1. 2 ⎩⎪0 0 thì phân bố xác suất và đồ thị của hàm mật độ sẽ lệch về bên phải hơn. ƒ Hệ số nhọn α4 đặc trưng cho độ nhọn của đồ thị hàm mật độ so với đồ thị hàm mật độ của phân bố chuẩn. Với biến ngẫu nhiên có phân bố chuẩn thì α4 = 3. α4 > 3 thì đồ thị hàm mật độ sẽ nhọn hơn so với đồ thị hàm mật độ chuẩn. α4 < 3 thì đồ thị hàm mật độ sẽ tù hơn so với đồ thị hàm mật độ chuẩn. ƒ Khi phân bố của X đối xứng hoặc gần đối xứng thì dùng kỳ vọng để định vị là tốt nhất, song nếu phân bố của X quá lệch thì nên dùng Median và Mode để định vị. 45
  48. Chương 2: Biến ngẫu nhiên và các đặc trưng của chúng 2.5. HÀM ĐẶC TRƯNG 2.5.1. Định nghĩa Hàm đặc trưng biến ngẫu nhiên X ký hiệu là ϕ X (t) và được định nghĩa bởi biểu thức: ∞ itX itx ϕ X (t) = E()e = ∫ e f X (x)dx . (2.68) −∞ 2 trong đó f X (x) hàm mật độ của biến ngẫu nhiên X , i là đơn vị ảo thỏa mãn i = −1. 2.5.2. Tính chất −1 1) Hàm đặc trưng là biến đổi Fourier ngược của hàm mật độ ϕ X (t) = F {}f X (x) . Vì vậy hàm đặc trưng có các tính chất như biến đổi Fourier. 2) ϕ X (t) ≤ ϕ X (0) = 1. 3) ϕ X (t) xác định không âm. 4) Nếu biến ngẫu nhiên X có môment cấp k thì ϕ X (t) có đạo hàm đến cấp k và k 1 (k) E[]X = ϕ X (0) . (2.69) ik 5) Các biến ngẫu nhiên X1, X 2 , , X n độc lập khi và chỉ khi ϕ (t) = ϕ (t)ϕ (t) . (2.70) X1+X 2 ++X n X1 X n 6) Nếu hàm đặc trưng ϕ X (t) có biến đổi Fourier (khả tích tuyệt đối và thỏa mãn điều kiện Dirichlet) thì hàm mật độ được tính theo công thức: ∞ 1 f (x) = e−itxϕ (t)dt . (2.71) X 2π ∫ X −∞ 2.5.3. Các đặc trưng của các quy luật phân bố xác suất thường gặp Quy luật xác suất Kỳ vọng Phương sai Hàm đặc trưng n Nhị thức X ~ B(n; p) EX = np DX = npq ()peit + q it Poisson X ~()P λ EX = λ DX = λ eλ(e −1) ab+ ()ba− 2 eibt − eiat Đều X ~(,)U ab EX = DX = 2 12 it(b − a) 1 1 λ X có phân bố mũ tham số λ > 0 EX = DX = λ λ2 λ − it 46
  49. Chương 2: Biến ngẫu nhiên và các đặc trưng của chúng 1 2 2 Chuẩn X ~(;)N μ σ 2 EX = μ DX = σ 2 iμt− σ t e 2 k k λk Erlang-k X ~ Ek (λ) EX = DX = λ λ2 ()λ − it k TÓM TẮT Biến ngẫu nhiên Biến ngẫu nhiên X là đại lượng nhận các giá trị nào đó phụ thuộc vào các yếu tố ngẫu nhiên, nghĩa là với mọi giá trị thực x ∈ thì {X 0 và ∑ pi =1. Bảng phân bố xác suất của X có dạng sau: i X x x 1 2 P p1 p2 Hàm mật độ phân bố xác suất của biến ngẫu nhiên liên tục Giả sử X là một biến ngẫu nhiên liên tục có hàm phân bố F(x) . Hàm mật độ của biến x ngẫu nhiên X là hàm f (x) sao cho với mọi x ∈ , F(x) = ∫ f (t)dt . −∞ Kỳ vọng Kỳ vọng hoặc giá trị trung bình của biến ngẫu nhiên X ký hiệu là EX và được xác định như sau: ƒ Nếu X rời rạc nhận các giá trị xi với xác suất tương ứng pi = P{}X = xi thì E X = ∑ xi pi i 47
  50. Chương 2: Biến ngẫu nhiên và các đặc trưng của chúng ∞ ƒ Nếu X liên tục có hàm mật độ f (x) thì E X = ∫ xf (x)dx . −∞ Phương sai Phương sai hay độ lệch bình phương trung bình của biến ngẫu nhiên X là đại lượng đo sự phân tán bình phương trung bình của X xung quanh giá trị trung bình EX . Phương sai của X 2 được ký hiệu là DX hay var X và định nghĩa như sau: DEX =−()XX E . Độ lệch tiêu chuẩn σ X = DX được gọi là độ lệch tiêu chuẩn của X . Phân vị Phân vị mức α của biến ngẫu nhiên X có hàm phân bố F(x) là giá trị vα thỏa mãn P{}X < vα ≤ α ≤ P{X ≤ vα } hay F(vα ) ≤ α ≤ F(vα + 0) Trung vị Phân vị mức 1/2 được gọi là median hay trung vị của X , ký hiệu MedX . Như vậy trung vị là điểm phân chia phân bố xác suất thành hai phần bằng nhau. Mốt Mốt (Mode) của biến ngẫu nhiên X là giá trị mà biến ngẫu nhiên X nhận với xác suất lớn nhất. X x x ƒ Nếu X rời rạc có phân bố: 1 2 thì P p1 p2 x = Mod X ⇔ p = max p , p , i0 i0 { 1 2 } ƒ Nếu X liên tục có hàm mật độ f (x) thì c = Mod X ⇔ f (c) = max{}f (x), x ∈ . Moment, hệ số bất đối xứng, hệ số nhọn k ƒ Moment cấp k mk = EX ; k = 1,2, k ƒ Moment quy tâm cấp k μk = E (X − EX ) ; k = 1,2, μ3 ƒ Hệ số bất đối xứng α3 = với σ = DX . σ3 μ4 ƒ Hệ số nhọn α4 = . σ4 ƒ Hệ số bất đối xứng α3 đo mức độ bất đối xứng của luật phân bố. ƒ Hệ số nhọn α4 cho phép bổ sung thêm thông tin về phương sai của phân bố. 48
  51. Chương 2: Biến ngẫu nhiên và các đặc trưng của chúng CÂU HỎI ÔN TẬP VÀ BÀI TẬP 2.1 Biến ngẫu nhiên luôn luôn nhận giá trị dương. Đúng Sai . 2.2 Biến ngẫu nhiên rời rạc chỉ nhận một số hữu hạn các giá trị. Đúng Sai . 2.3 Nếu biến ngẫu nhiên X rời rạc chỉ nhận các giá trị x1, , xn thì hệ các biến cố {}X = x1 , , {}X = xn lập thành một hệ đầy đủ. Đúng Sai . 2.4 Kỳ vọng của biến ngẫu nhiên rời rạc là giá trị nó lấy thường xuyên nhất. Đúng Sai . 2.5 Kỳ vọng của tổng hai biến ngẫu nhiên luôn luôn bằng tổng các kỳ vọng của nó. Đúng Sai . 2.6 Hai biến ngẫu nhiên có cùng kỳ vọng sẽ có cùng phương sai. Đúng Sai . 2.7 Phương sai của tổng hai biến ngẫu nhiên rời rạc luôn luôn bằng tổng phương sai của nó. Đúng Sai . 2.8 Biến ngẫu nhiên tồn tại phương sai thì cũng tồn tại kỳ vọng. Đúng Sai . 2.9 Hàm mật độ f (x) của biến ngẫu nhiên liên tục có tính chất f (x) ≥ 0 . Đúng Sai . 2.10 Tổng của hai biến ngẫu nhiên phân bố theo quy luật nhị thức bất kỳ luôn luôn là một biến ngẫu nhiên phân bố theo quy luật nhị thức. Đúng Sai . 2.11 Biến ngẫu nhiên phân bố theo quy luật Poisson là biến ngẫu nhiên rời rạc nên chỉ nhận một số hữu hạn các giá trị. Đúng Sai . 2.12 Nếu X là biến ngẫu nhiên phân bố theo quy luật Poisson tham số λ >0 thì kỳ vọng, phương sai và mốt của X đều bằng λ . Đúng Sai . 2.13 Nếu biến ngẫu nhiên X phân bố theo quy luật chuẩn N(μ;σ2 ) thì xác suất sai lệch giữa ⎛ ε ⎞ X và kỳ vọng của nó thỏa mãn P{}X − μ < ε = 2Φ⎜ ⎟ −1. ⎝ σ ⎠ Đúng Sai . 49
  52. Chương 2: Biến ngẫu nhiên và các đặc trưng của chúng X − μ 2.14 Nếu biến ngẫu nhiên X phân bố theo quy luật chuẩn N(μ;σ2 ) thì phân bố theo σ quy luật chuẩn tắc N(0;1) . Đúng Sai . 2.15 Biến ngẫu nhiên phân bố theo quy luật Student chỉ nhận những giá trị dương. Đúng Sai . 2.16 Biến ngẫu nhiên X có bảng phân bố X −5234 P 0, 4 0,3 0,1 0, 2 Tính kỳ vọng EX và phương sai DX. 2.17 Biến ngẫu nhiên rời rạc X nhận ba giá trị có thể có là x123,,xx. Biết xx12==4, 0,6 với xác suất tương ứng p1 = 0,5 , p2 = 0,3 và có kỳ vọng EX = 8. Tìm x3 và p3 . 2.18 Cho X1 và X 2 là hai biến ngẫu nhiên độc lập có bảng phân bố xác suất như sau: X1 2 3 5 X 2 1 4 P 0,3 0,5 0,2 P 0,2 0,8 a) Tính EX1 ; EX 2 ; DX1 ; DX 2 . b) Tính E(X1 + X 2 ) và D(X1 + X 2 ) . 2.19 Cho X1 , X 2 , X 3 là ba biến ngẫu nhiên độc lập có bảng phân bố xác suất như sau: X1 0 2 X 2 1 2 X 3 0 2 P 0,6 0,4 P 0,4 0.6 P 0,8 0.2 X + X + X Lập X = 1 2 3 . Tính E(X ) ; D(X ) . 3 2.20 Hai biến ngẫu nhiên X , Y độc lập. Tính D(Z) với: a) Z = 2X + 3Y . b) Z = −3X + Y . Cho biết D(X ) = 4, D(Y) = 5 . 2.21 Biến ngẫu nhiên rời rạc X nhận các giá trị có thể có là x1 = −1; x2 = 0; x3 = 1. Tìm các xác suất tương ứng p1 ; p2 ; p3 biết rằng E(X ) = 0,1 và D(X ) = 0,89 . 2.22 Xếp ngẫu nhiên 5 hành khách lên 3 toa tầu I, II, III. Gọi X là số khách lên toa I và Y là số khách lên toa II và III. a) Tính xác suất để cả 3 toa đều có khách. b) Lập bảng phân bố xác suất của biến ngẫu nhiên X và biến ngẫu nhiên Y . 50
  53. Chương 2: Biến ngẫu nhiên và các đặc trưng của chúng 2.23 Tính kỳ vọng của biến ngẫu nhiên liên tục X có hàm mật độ xác suất ⎧cos x ⎪ nÕu x ∈−()ππ/2; /2 fx()= ⎨ 2 ⎪ ⎩ 0/2;/2nÕu x ∉−()ππ 2.24 Tuổi thọ của một loài côn trùng nào đó là một biến ngẫu nhiên X (đơn vị là tháng) với hàm mật độ như sau ⎪⎧kx2(2− x ) nÕu 0≤≤ x 2 fx()= ⎨ ⎩⎪0 nÕu tr¸i l¹i a) Tìm k ; b) Tính xác suất để côn trùng chết trước khi nó được một tháng tuổi; c) Tìm E,DX X . 2.25 Hai xạ thủ A và B tập bắn. Mỗi người bắn hai phát. Xác suất bắn trúng đích của A trong mỗi lần bắn là 0,4; còn của B là 0,5. a) Gọi X là số phát bắn trúng của A trừ đi số phát bắn trúng của B. Tìm phân bố xác suất của X , kỳ vọng EX và phương sai DX. b) Tìm phân bố xác suất của YX= và kỳ vọng EY . 2.26 Một xí nghiệp có hai ôtô vận tải hoạt động. Xác suất trong ngày làm việc các ôtô bị hỏng tương ứng bằng 0,1 và 0,2. Gọi X là số ôtô bị hỏng trong thời gian làm việc. Lập bảng phân bố xác suất, tính kỳ vọng EX và phương sai DX của X . 2.27 Cho biến ngẫu nhiên rời rạc X có bảng phân bố xác suất X 0 1 2 3 4 5 6 7 P 0 k 2k 2k 3k k 2 k 2 k 2 + k a) Xác định k. b) Tính xác suất PX{ ≥ 5} và PX{ < 3} . c) Tính kỳ vọng EX. d) Tính phương sai DX . 2.28 Có 5 sản phẩm trong đó có 4 chính phẩm và 1 phế phẩm. Người ta lấy ra lần lượt 2 sản phẩm (lấy không hoàn lại). a) Gọi X là "số phế phẩm có thể gặp phải". Lập bảng phân bố xác suất của X. Tính kỳ vọng EX và phương sai DX. b) Gọi Y là "số chính phẩm có thể gặp phải". Lập hệ thức cho biết mối quan hệ giữa Y và X. Tính kỳ vọng EY và phương sai DY. 51
  54. Chương 2: Biến ngẫu nhiên và các đặc trưng của chúng 2.29 Một nhóm có 10 người trong đó có 6 nam và 4 nữ. Chọn ngẫu nhiên ra 3 người. Gọi X là số nữ có trong nhóm được chọn. Lập bảng phân bố xác suất của X. Tính kỳ vọng EX. 2.30 Hai kiện tướng bóng bàn ngang sức thi đấu với nhau. Hỏi thắng 2 trong 4 ván dễ hơn hay thắng 3 trong 6 ván dễ hơn. 2.31 Một nữ công nhân quản lý 12 máy dệt. Xác suất để mỗi máy trong khoảng thời gian T cần đến sự chăm sóc của nữ công nhân là 1/3. Tính xác suất: a) Trong khoảng thời gian T có 4 máy cần đến sự chăm sóc của nữ công nhân. b) Trong khoảng thời gian T có từ 3 đến 6 máy cần đến sự chăm sóc của nữ công nhân. 2.32 Trong một lô hàng có 800 sản phẩm loại 1 và 200 sản phẩm loại 2. Lấy ngẫu nhiên ra 5 sản phẩm theo phương thức có hoàn lại. Gọi X là số sản phẩm loại 1 lấy được. a) X tuân theo quy luật phân bố gì? Viết biểu thức tổng quát của quy luật. b) Tìm kỳ vọng và phương sai của X . c) Tìm mốt của X và tính khả năng để xảy ra điều đó. 2.33 Xác suất để sản phẩm sản xuất ra bị hỏng bằng 0,1. a) Tìm xác suất để trong 5 sản phẩm sản xuất ra có không quá 2 sản phẩm hỏng. b) Tìm số sản phẩm hỏng trung bình trong 5 sản phẩm đó. c) Tìm số sản phẩm hỏng có khả năng xảy ra nhiều nhất. 2.34 Một bài thi trắc nghiệm gồm có 10 câu hỏi, mỗi câu hỏi có 5 phương án trả lời, trong đó chỉ có một phương án đúng. Giả sử mỗi câu trả lời đúng được 4 điểm và câu trả lời sai bị trừ 2 điểm. Một học sinh kém làm bài bằng cách chọn hú hoạ một phương án cho mỗi câu hỏi. Tính xác suất để: a) Anh ta được 4 điểm. b) Anh ta bị điểm âm. 2.35 Tín hiệu thông tin được phát đi 5 lần độc lập nhau. Xác suất thu được tin của mỗi lần phát là 0,7. Tính xác suât: a) Thu được tín hiệu đúng 2 lần. b) Thu được tín hiệu nhiều nhất 1 lần. c) Thu được tin. 2.36 Một cầu thủ nổi tiếng về đá phạt đền, xác suất đá vào gôn là 4/5. Có người cho rằng cứ “sút” 5 quả thì chắc chắn rằng có 4 quả vào lưới. Điều khẳng định đó có đúng không? Tìm xác suất để trong 5 lần sút có đúng 4 lần bóng vào lưới. 2.37 Ỏ một tổng đài bưu điện các cuộc điện thoại gọi đến xuất hiện một cách ngẫu nhiên, độc lập với nhau và trung bình có 2 cuộc gọi trong một phút. Tính xác suất để: a) Có ít nhất một cuộc gọi trong khoảng thời gian 10 giây. b) Trong khoảng thời gian 3 phút có nhiều nhất ba cuộc gọi. c) Trong khoảng thời gian 3 phút liên tiếp mỗi phút có nhiều nhất một cuộc gọi. 52
  55. Chương 2: Biến ngẫu nhiên và các đặc trưng của chúng 2.38 Biến ngẫu nhiên X tuân theo quy luật chuẩn với kỳ vọng μ = 10 và phương sai σ2 = 4 . Tính xác suất để X nhận giá trị trong khoảng (8; 12). 2.39 Biến ngẫu nhiên X tuân theo quy luật chuẩn với kỳ vọng μ = 10 . Xác suất để X nhận giá trị trong khoảng (10; 20) là 0,3. Tìm xác suất để X nhận giá trị trong khoảng (0; 10). 2.40 Trọng lượng sản phẩm X do một máy tự động sản xuất là một biến ngẫu nhiên tuân theo quy luật chuẩn với μ = 100 gam và độ lệch chuẩn σ = 100 gam. Sản phẩm được coi là đạt tiêu chuẩn kỹ thuật nếu trọng lượng của nó đạt từ 98 đến 102gam. a) Tìm tỷ lệ sản phẩm đạt tiêu chuẩn kỹ thuật của nhà máy. b) Tìm tỷ lệ phế phẩm của nhà máy. c) Giải thích bằng đồ thị kết quả tìm được ở phần a). 2.41 Chiều cao của nam giới khi trưởng thành ở một vùng dân cư là biến ngẫu nhiên phân bố chuẩn vớí kỳ vọng μ = 160 cm và độ lệch chuẩn σ = 6 cm. Một thanh niên bị coi là lùn nếu có chiều cao nhỏ hơn 155 cm. a) Tìm tỷ lệ thanh niên lùn ở vùng đó. b) Tìm xác suất để lấy ngẫu nhiên 4 người thì có ít nhất 1 người không bị lùn. 2.42 Cho X i (i = 1,n )là các biến ngẫu nhiên độc lập, cùng tuân theo quy luật chuẩn với 2 E(X1) = E(X 2 ) = = E(X n ) = μ ; D(X1) = D(X 2 ) = = D(X n ) = σ 1 n Lập công thức tính P{X − μ 0 tùy ý. 53
  56. Chương 3: Véc tơ ngẫu nhiên CHƯƠNG III: VÉC TƠ NGẪU NHIÊN GIỚI THIỆU Véc tơ ngẫu nhiên là một bộ có thứ tự bao gồm nhiều biến ngẫu nhiên. Mỗi biến ngẫu nhiên là một thành phần của véc tơ ngẫu nhiên. Số biến ngẫu nhiên thành phần gọi là chiều của véc tơ ngẫu nhiên. Tương tự biến ngẫu nhiên, quy luật biến ngẫu nhiên nhiều chiều được khảo sát thông qua hàm phân bố. Trường hợp biến ngẫu nhiên nhiều chiều có các biến ngẫu nhiên thành phần rời rạc được gọi là biến ngẫu nhiên nhiều chiều rời rạc. Nếu tất cả các biến ngẫu nhiên thành phần liên tục thì biến ngẫu nhiên nhiều chiều tương ứng gọi là liên tục. Biến ngẫu nhiên nhiều chiều rời rạc được xác định bởi bảng phân bố xác suất đồng thời, còn biến ngẫu nhiên liên tục được xác định bởi hàm mật độ xác suất đồng thời. Với biến ngẫu nhiên hai chiều rời rạc ta có bảng phân bố xác suất đồng thời, đó là bảng ghi các giá trị của hai biến ngẫu nhiên thành phần theo hàng, theo cột và xác suất tương ứng. Dựa vào công thức cộng xác suất đầy đủ ta có thể tìm được bảng phân bố xác suất của hai biến ngẫu nhiên thành phần. Tương tự, từ hàm mật độ đồng thời ta có thể tìm hàm mật độ của biến ngẫu nhiên thành phần bằng cách lấy tích phân theo các biến thích hợp. Ngoài các đặc trưng kỳ vọng, phương sai của các biến ngẫu nhiên thành phần, các véc tơ ngẫu nhiên còn được đặc trưng bởi hiệp phương sai và hệ số tương quan. Hệ số tương quan đo mức độ phụ thuộc tuyến tính của hai biến ngẫu nhiên thành phần, hệ số tương quan càng gần 1 thì mức độ phụ thuộc tuyến tính càng chặt. Hai biến ngẫu nhiên thành phần không tương quan thì hệ số tương quan bằng 0. Dựa vào đặc trưng này ta có thể xây dựng hàm hồi quy tương quan. Hai biến ngẫu nhiên độc lập thì không tương quan. Tính độc lập của các biến ngẫu nhiên được nhận biết thông qua dấu hiệu của bảng phân bố, hàm phân bố hoặc hàm mật độ xác suất. Đối với biến ngẫu nhiên không độc lập, bằng cách áp dụng công thức tính xác suất có điều kiện suy ra quy luật phân bố xác suất có điều kiện của các biến ngẫu nhiên thành phần. Từ các biến ngẫu nhiên X1, X 2 , , X n và hàm nhiều biến ϕ(x1, , xn ) ta có thể xây dựng các biến ngẫu nhiên mới ϕ(X1, , X n ) đó là hàm của các biến ngẫu nhiên đã cho. Xác định bảng phân bố xác suất hay hàm mật độ xác suất của ϕ(X1, , X n ) . Để học tốt chương này học viên cần nắm vững các tính chất cơ bản của xác suất, xác suất có điều kiện, phân bố xác suất của biến ngẫu nhiên rời rạc; Tích phân suy rộng, hàm nhiều biến. 54
  57. Chương 3: Véc tơ ngẫu nhiên NỘI DUNG 3.1. KHÁI NIỆM VÉC TƠ NGẪU NHIÊN 3.1.1. Khái niệm Trong các chương trước ta xét các biến ngẫu nhiên mà giá trị chúng nhận được có thể biểu diễn bằng một số, đó là các biến ngẫu nhiên một chiều. Tuy nhiên trong thực tế có thể gặp các đại lượng ngẫu nhiên mà giá trị nhận được là một bộ gồm hai, ba, , n số. Những đại lượng này được gọi một cách tương ứng là biến ngẫu nhiên hai chiều, ba chiều, , n chiều và được gọi chung là biến ngẫu nhiên nhiều chiều. Các biến ngẫu nhiên hai chiều, ba chiều, , n chiều còn được gọi là véc tơ ngẫu nhiên hai chiều, ba chiều, , n chiều. Định nghĩa 3.1: Một véc tơ ngẫu nhiên n chiều là một bộ có thứ tự ()X1, X 2 , , X n với các thành phần X1, X 2 , , X n là các biến ngẫu nhiên. Ta ký hiệu véc tơ ngẫu nhiên hai chiều là (X ,Y ) , trong đó X là biến ngẫu nhiên thành phần thứ nhất và Y là biến ngẫu nhiên thành phần thứ hai. Ví dụ 3.1: Một nhà máy sản xuất một loại sản phẩm. Nếu kích thước của sản phẩm được đo bằng chiều dài X và chiều rộng Y thì ta có biến ngẫu nhiên hai chiều, còn nếu xét thêm cả chiều cao Z nữa thì ta có biến ngẫu nhiên ba chiều. Nếu ta chỉ quan tâm đến trọng lượng và thể tích của sản phẩm ta cũng được biến ngẫu nhiên hai chiều. Véc tơ ngẫu nhiên n chiều ()X1, X 2 , , X n là liên tục hay rời rạc nếu tất cả các biến ngẫu nhiên thành phần X1, X 2 , , X n là liên tục hay rời rạc. 3.1.2. Hàm phân bố Định nghĩa 3.2: Hàm n biến F(x1, x2 , , xn ) xác định bởi: F(x1, x2 , , xn ) = P{X1 < x1, X 2 < x2 , , X n < xn } (3.1) được gọi là hàm phân bố của véc tơ ngẫu nhiên X = (X1, X 2 , , X n ) hay được gọi là phân bố đồng thời của các biến ngẫu nhiên X1, X 2 , , X n . Hàm phân bố đồng thời có các tính chất: 1. 0 ≤ F(x1, x2 , , xn ) ≤ 1. (3.2) 2. lim F(x1, x2 , , xn ) = 0 , với k nào đó thuộc {1, ,n}. (3.3) xk →−∞ 3. lim F(x1, x2 , , xn ) = 1. (3.4) (x1, , xn )→(∞, ,∞) 4. F(x1, x2 , , xn ) không giảm theo từng biến. 5. lim F(x1, , xk , , xn ) = P{X1 < x1, , X k−1 < xk−1, X k+1 < xk+1, , X n < xn } xk →∞ 6. Đặc biệt F(x, y) là hàm phân bố của véc tơ ngẫu nhiên hai chiều (X ,Y ) thì: 55
  58. Chương 3: Véc tơ ngẫu nhiên lim F(x, y) = P{}X < x = FX (x); lim F(x, y) = P{Y < y}= FY (y) (3.5) y→∞ x→∞ FX (x), FY (y) là các hàm phân bố của biến ngẫu nhiên X , Y hay còn được gọi là các phân bố thành phần của véc tơ ngẫu nhiên (X ,Y ) cũng là phân bố biên duyên của phân bố đồng thời F(x, y) . 3.2. BẢNG PHÂN BỐ XÁC SUẤT CỦA VÉC TƠ NGẪU NHIÊN RỜI RẠC HAI CHIỀU 3.2.1. Bảng phân bố xác suất đồng thời Bảng phân bố xác suất đồng thời của biến ngẫu nhiên rời rạc hai chiều (X ,Y ) là bảng liệt kê tất cả các giá trị của X theo hàng, Y theo cột và các xác suất tương ứng. Y y1 y2 y j ym ∑ j X x1 p(,xy11 ) p(,xy12 ) p(,xy1 j ) p(,xy1 m ) p()x1 x2 p(,)xy21 p(,xy22 ) p(,xy2 j ) p(,xy2 m ) p()x2 xi p(,xyi 1 ) p(,xyi 2 ) p(,xyij ) p(,xyim ) p()xi xn p(,)xyn 1 p(,xyn 2 ) p(,xynj ) p(,xynm ) p()xn p()y ∑i p()y1 p()y2 j p()ym 1 Trong đó xi (i = 1,n ) là các giá trị có thể có của thành phần X ; y j ( j = 1,m ) là các giá trị có thể có của thành phần Y . p(xi , y j ) là xác suất đồng thời của biến ngẫu nhiên hai chiều (X ,Y ) nhận giá trị (xi , y j ) , nghĩa là: p(,xyij )=== PX{ xY i , y j} , các xác suất này thỏa mãn ⎧ p(xi , y j ) ≥ 0, ∀i = 1,n, j = 1,m ⎪ ⎨ n m (3.6) ⎪ ∑∑p(xi , y j ) = 1 ⎩⎪ i==11j 56
  59. Chương 3: Véc tơ ngẫu nhiên 3.2.2. Bảng phân bố xác suất biên Áp dụng công thức xác suất đầy đủ (1.16) cho hệ {X ==xXx12},{ } , , { Xx =n} (xem công thức 2.7) ta có: n n p(y j ) = P{}{Y = y j = ∑ P X = xi ,Y = y j }= ∑ p(xi , y j ) ; j = 1,m (3.7) i=1 i=1 Tương tự m m p(xi ) = P{}X = xi = ∑ P{}X = xi ,Y = y j = ∑ p(xi , y j ) ; i = 1,n (3.8) j=1 j=1 Như vậy từ bảng phân bố xác suất đồng thời của (X ,Y ) , nếu ta cộng các xác suất theo cột thì ta được các xác suất tương ứng với các giá trị của Y , nếu ta cộng các xác suất theo hàng ta được các xác suất tương ứng với giá trị của X . Từ đó nhận được phân bố xác suất của biến ngẫu nhiên thành phần Y và biến ngẫu nhiên thành phần X . X x1 x2 xi xn P p(x1) p(x2 ) p(xi ) p(xn ) Y y1 y2 y j ym P p(y1) p(y2 ) p(y j ) p(ym ) Ví dụ 3.2: Gieo 3 đồng tiền cân đối A, B, C. Gọi X là số mặt ngửa xuất hiện của 2 đồng tiền A, B và Y là số mặt ngửa xuất hiện của cả 3 đồng tiền A, B, C. Hãy lập bảng phân bố xác suất đồng thời của X ,Y . Giải: Chúng ta có bảng 8 kết quả đồng khả năng của việc gieo 3 đồng tiền cân đối và tính các giá trị của X ,Y tương ứng, trong đó N là ký hiệu mặt ngửa xuất hiện còn S là mặt sấp. A B C X Y N N N 2 3 N N S 2 2 N S N 1 2 N S S 1 1 S N N 1 1 S N S 1 2 S S N 0 1 S S S 0 0 57
  60. Chương 3: Véc tơ ngẫu nhiên Sử dụng công thức tính xác suất cổ điển (1.1) ta có: 1 1 2 P{}X = 2,Y = 3 = ; P{}X = 2,Y = 2 = ; P{}X = 1,Y = 2 = 8 8 8 Vậy bảng phân bố xác suất đồng thời của X và Y là Y 0 1 2 3 ∑ X 0 1/8 1/8 0 0 2/8 1 0 2/8 2/8 0 4/8 2 0 0 1/8 1/8 2/8 ∑ 1/8 3/8 3/8 1/8 1 Phân bố xác suất của biến ngẫu nhiên thành phần: Cộng các cột ta được: X 0 1 2 P 2/8 4/8 2/8 Cộng các hàng ta được: Y 0 1 2 3 P 1/8 3/8 3/8 1/8 Ví dụ 3.3: Có hai hộp, mỗi hộp đựng 6 bi. Hộp I có 1 bi mang số 1, 2 bi mang số 2, 3 bi mang số 3. Hộp II có 2 bi mang số 1, 3 bi mang số 2, 1 bi mang số 3. Rút ngẫu nhiên từ mỗi hộp 1 bi. Gọi X ,Y lần lượt là số ghi trên bi rút được từ hộp I và hộp II. Hãy lập bảng phân bố xác suất đồng thời của X ,Y . Giải: Mỗi hộp có 6 bi cho nên số các trường hợp có thể có của phép thử là 6 ⋅ 6 = 36 , trong đó có 2 trường hợp (1,1) , 3 trường hợp (1,2) , 4 trường hợp (2,1) , Vậy bảng phân bố xác suất đồng thời của X ,Y như sau: 58
  61. Chương 3: Véc tơ ngẫu nhiên Y 1 2 3 ∑ X 1 2/36 3/36 1/36 1/6 2 4/36 6/36 2/36 2/6 3 6/36 9/36 3/36 3/6 ∑ 2/6 3/6 1/6 1 Ví dụ 3.4: (Phân bố đa thức) Véc tơ ngẫu nhiên n chiều X = (X1, X 2 , , X n ) được gọi là có phân bố đa thức với các tham số N; p1, , pn ký hiệu X ~ MUT(N; p1, , pn ) nếu: N! k1 k2 kn kn+1 P{}X1 = k1, , X n = kn = p1 p2 pn q k1!k2! kn+1! trong đó 0 ≤ ki ≤ N, kn+1 = N − (k1 ++ kn ); q = 1− ( p1 ++ pn ) . Trường hợp n = 1 ta được phân bố nhị thức. Xét N phép thử độc lập, thuần nhất mỗi phép thử có n +1 kết quả; giả sử xác suất xuất hiện kết quả thứ k là pk thì p1 ++ pn + pn+1 = 1. Gọi X k là số thành công của kết quả thứ k trong N phép thử thì X = ()X1, X 2 , , X n có phân bố đa thức X ~ MUT()N; p1, , pn . Gieo xúc xắc cân đối 10 lần. Tính các xác suất: 1) Có đúng 3 lần xuất hiện mặt 5 chấm (biến cố A). 2) Có 2 lần xuất hiện mặt 1 chấm, 4 lần mặt 3 chấm, 1 lần mặt 4 chấm và 3 lần mặt 6 chấm (biến cố B). Giải: 1) Gọi X là số lần xuất hiện mặt 5 trong 10 lần thử thì X ~ B(10;1/ 6). 3 7 3 ⎛ 1 ⎞ ⎛ 5 ⎞ P(A) = P{}X = 3 = C10 ⎜ ⎟ ⎜ ⎟ = 0,155 . ⎝ 6 ⎠ ⎝ 6 ⎠ 2) Gọi X k là số lần xuất hiện mặt k trong 10 phép thử thì (X1, X 2 , X 3, X 4 , X 6 ) có phân bố đa thức MUT()10;1/ 6, 1/ 6, 1/ 6, 1/ 6, 1/ 6 . 10 10! ⎛ 1 ⎞ P(B) = P{}X1 = 2, X 2 = 0, X 3 = 4, X 4 = 1, X 6 = 3 = ⎜ ⎟ ≈ 0,0002 . 2!0!4!1!3!⎝ 6 ⎠ 59
  62. Chương 3: Véc tơ ngẫu nhiên 3.3. VÉC TƠ NGẪU NHIÊN LIÊN TỤC 3.3.1. Hàm mật độ của véc tơ ngẫu nhiên liên tục Định nghĩa 3.3: Hàm mật độ của véc tơ ngẫu nhiên liên tục X = (X1, X 2 , , X n ) là hàm n biến f (x1, x2 , , xn ) ≥ 0 thoả mãn: x1 xn F(x1, x2 , , xn ) = P{}X1 < x1, X 2 < x2 , , X n < xn = ∫∫ f (t1,t2 , ,tn ) dt1dt2 dtn −∞∞ − f (x1, x2 , , xn ) còn được gọi là hàm mật độ đồng thời của X1, X 2 , , X n . Tính chất: Để đơn giản cho cách biểu diễn ta xét trường hợp véc tơ ngẫu nhiên hai chiều (X ,Y ) có hàm mật độ f (x, y) . ∞ ∞ 1) f (x, y) ≥ 0 với mọi (x, y) và ∫∫f (x, y)dxdy = 1. (3.12) −∞ −∞ 2) P{}(X ,Y) ∈ A = ∫∫ f (x, y)dxdy với A ⊂ 2 . (3.13) (x,y)∈A ⎧ ∂ 2 ⎪ F(x, y) nÕu tån t¹i đ¹o hµm t¹i (x, y) 3) f (x, y) = ⎨∂x∂y (3.14) ⎪ ⎩ 0 nÕu ng−îc l¹i ∞ 4) ∫ f (x, y) dy = f X (x) hàm mật độ của biến ngẫu nhiên X . (3.15) −∞ ∞ ∫ f (x, y) dx = fY (y) hàm mật độ của biến ngẫu nhiên Y . −∞ Ví dụ 3.5: Cho véc tơ ngẫu nhiên (X ,Y ) có hàm mật độ xác định như sau: ⎧ C nÕu x + y ≤ 1 f (x, y) = ⎨ . ⎩ 0 nÕu ng−îc l¹i y a) Tìm C. b) Tìm các hàm mật độ của các biến ngẫu nhiên X , Y . Giải: −1 1 x a) Miền D: x + y ≤ 1 đối xứng qua hai trục toạ độ Ox, Oy. Phần của D nằm trong góc phần tư thứ nhất là tam giác vuông cân 0 ≤ x,0 ≤ y; x + y ≤ 1. 60
  63. Chương 3: Véc tơ ngẫu nhiên Vậy D là hình vuông có độ dài cạnh bằng 2 , do đó: ∞∞ 1 1(,)dtD2===⇒=∫∫fxydxdyC C C . −∞ −∞ 2 ⎧ x −1 ≤ y ≤ 1− x nÕu 0 ≤ x ≤ 1 b) x + y ≤ 1 ⇔ x −1 ≤ y ≤ x +1 ⇔ ⎨ ⎩− x −1 ≤ y ≤ x +1 nÕu -1 ≤ x ≤ 0 ⎧1 1+x ⎪ dy = 1+ x nÕu −1 ≤ x ≤ 0 2 ∫ ⎪ -x-1 ⎪ ⎪⎧1− x nÕu x ≤ 1 f X (x) = ⎨ 0 nÕu ng−îc l¹i = ⎨ ⎪ ⎩⎪ 0 nÕu x > 1 1 1−x ⎪ dy = 1− x nÕu 0 ≤ x ≤ 1 ⎪2 ∫ ⎩ x-1 Do tính chất đối xứng của X và Y nên ta cũng có: ⎪⎧1− y nÕu y ≤ 1 fY (y) = ⎨ . ⎩⎪ 0 nÕu y > 1 3.4. TÍNH ĐỘC LẬP CỦA CÁC BIẾN NGẪU NHIÊN Định nghĩa 3.4: Hai biến ngẫu nhiên X và Y gọi là độc lập nếu mỗi biến ngẫu nhiên nhận giá trị này hay giá trị khác không ảnh hưởng gì đến phân bố xác suất của biến ngẫu nhiên kia. Định lý 3.1: Giả sử F(x, y) là hàm phân bố của véc tơ ngẫu nhiên (X ,Y ) . Khi đó X ,Y độc lập khi và chỉ khi F(x, y) = FX (x)FY (y) (3.16) trong đó FX (x), FY (y) lần lượt là hàm phân bố của X và Y . Định lý 3.2: Véc tơ ngẫu nhiên hai chiều rời rạc (X ,Y ) với phân bố xác suất đồng thời (3.6) là độc lập khi và chỉ khi p(xi , y j ) = p(xi ) p(y j ) ∀i = 1,n, j = 1,m . (3.17 ) Một dấu hiệu để nhận biết hai biến ngẫu nhiên rời rạc độc lập là bảng phân bố xác suất đồng thời có tính chất: • Hai hàng bất kỳ tỉ lệ. • Hai cột bất kỳ tỉ lệ. 2 Ví dụ 3.6: Hai biến ngẫu nhiên X và Y của ví dụ 3.2 không độc lập vì P{}X = 2 = , 8 3 P{}Y = 1 = nhưng P{}X = 2,Y = 1 = 0 . 8 61
  64. Chương 3: Véc tơ ngẫu nhiên Hai biến ngẫu nhiên X và Y của ví dụ 3.3 độc lập vì thỏa mãn điều kiện (3.17). Định lý 3.3: Giả sử véc tơ ngẫu nhiên (X ,Y ) có hàm mật độ f (x, y) . Khi đó X ,Y độc lập khi và chỉ khi f (x, y) = f X (x) fY (y) (3.18) trong đó f X (x), fY (y) lần lượt là hàm mật độ của X và Y . Ví dụ 3.7: Véc tơ ngẫu nhiên (X ,Y ) của ví dụ 3.5 không độc lập vì hàm mật độ f (x, y) ≠ f X (x) fY (y) . 3.5. HÀM CỦA CÁC BIẾN NGẪU NHIÊN 3.5.1. Hàm của một biến ngẫu nhiên Giả sử X là một biến ngẫu nhiên và ϕ(x) là hàm liên tục một biến số. Khi đó Y = ϕ(X ) cũng là một biến ngẫu nhiên gọi là hàm của biến ngẫu nhiên X . a. Trường hợp rời rạc: Nếu X có phân bố rời rạc: X x1 x2 P p1 p2 thì Y cũng có phân bố rời rạc: Y ϕ(x1) ϕ(x2 ) P p1 p2 b. Trường hợp liên tục: Nếu X liên tục có hàm phân bố FX (x) và hàm mật độ f X (x) thì bằng phương pháp giải tích ta có thể tìm được hàm phân bố và hàm mật độ của biến ngẫu nhiên Y = ϕ(X ) . ™ Trường hợp ϕ(x) là một song ánh. Khi đó ϕ(x) hoặc đơn điệu tăng hoặc đơn điệu giảm: ♦ ϕ(x) đơn điệu tăng −1 −1 FY (y) = P{}ϕ(X ) ϕ (y)}= 1− FX (ϕ (y)) ⇒ FX (x) = 1− FY ()ϕ(x) 62
  65. Chương 3: Véc tơ ngẫu nhiên −1 −1 f X (ϕ (y)) f X (ϕ (y)) dx f X (x) = − fY ()ϕ(x) ϕ'(x) hay fY (y) = − = = f X (x) . (3.20) ϕ'()ϕ−1(y) ϕ'()ϕ−1(y) dy ™ Trường hợp ϕ(x) là một hàm liên tục bất kỳ ta tính trực tiếp xác suất P{}Y 0 ta có: 2 FZ (z) = P{Z 0 f Z (z) = ⎨2 z ⎪ ⎩ 0 nÕu z ≤ 0 c. Với t > 0 ta có: − X FT (t) = P{}T −lnt}=1− FX (−lnt) Khi t ≤ 0 biến cố {}T < t là biến cố không thể vì T = e−X chỉ nhận giá trị dương, do đó P{}T < t = 0 . Vậy hàm mật độ của T xác định như sau: 63