Tìm kiếm trình tự sinh học và đăng ký trình tự trên cơ sở dữ liệu
Bạn đang xem 20 trang mẫu của tài liệu "Tìm kiếm trình tự sinh học và đăng ký trình tự trên cơ sở dữ liệu", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên
Tài liệu đính kèm:
tim_kiem_trinh_tu_sinh_hoc_va_dang_ky_trinh_tu_tren_co_so_du.ppt
Nội dung text: Tìm kiếm trình tự sinh học và đăng ký trình tự trên cơ sở dữ liệu
- TÌM KIẾM TRÌNH TỰ SINH HỌC VÀ ĐĂNG KÝ TRÌNH TỰ TRÊN CƠ SỞ DỮ LIỆU
- Mục tiêu của bài học ◼ Có khả tìm kiếm được những trình tự sinh học như DNA, RNA, Protein. ◼ Đăng ký những trình tự đã nghiên cứu được lên Cơ sở dữ liệu sinh học bằng phần mềm Sequin. 2 Tìm kiếm trình tự sinh học
- Nguyên tắc trong giải trình tự ❑ Phương pháp Sanger: là phương pháp dựa trên sự tổng hợp gián đoạn DNA. ❑ Dựa theo phương pháp này chúng ta có thể xác định được trình tự nucleotide của DNA hay RNA (ATGC TTT) 3 Tìm kiếm trình tự sinh học
- Nhiễm sắc thể, DNA, Gene, Nucleotide 4 Giới thiệu môn học
- Gửi trình tự lên Genebank của NCBI Sequin Trình tự đã giải Đưa vào cơ sở dữ liệu sinh học: -NCBI - Các cơ sở dữ liệu khác 5 Giới thiệu môn học
- Nguyên tắc tìm kiếm trình tự sau khi đã giải trình tự 1.Tìm bằng từ khóa: 2.Công cụ tìm kiếm -Mã số truy cập -Tên (gene hay Protein) -GI -Độ dài trình tự Kết quả cần tìm -Trọng lượng phân tử -Tên tác giả giải trình tự 3. Lọc trình tự 6 Tìm kiếm trình tự sinh học
- Tìm kiếm trình tự sinh học qua NCBI Click 7 Tìm kiếm trình tự sinh học
- Tìm kiếm trình tự DNA 8 Tìm kiếm trình tự sinh học
- Tìm kiếm trình tự qua mã số truy cập Mã số truy cập của một trình tự là mã số do các nhà quản trị CSDLSH đặt cho một trình tự, thường có dạng : ❖8 ký tự : 2 chữ và 6 số ví dụ như AY690640 ❖6 ký tự : 1 chữ và 5 số ví dụ như U20068 9 Tìm kiếm trình tự sinh học
- TÌM KIẾM TRÌNH TỰ SINH HỌC QUA MÃ SỐ TRUY CẬP 10 Tìm kiếm trình tự sinh học
- Kết quả tìm trình tự DNA qua mã số truy cập 11 Giới thiệu môn học
- Tìm kiếm trình tự qua tên gene 12 Tìm kiếm trình tự sinh học
- 13 Tìm kiếm trình tự sinh học
- Cách lấy trình tự theo định dang FASTA 14 Giới thiệu môn học
- Định dạng FASTA ◼ FASTA là một giải thuật bắt cặp trình tự được David J. Lipman và William R. Pearson miêu tả lần đầu tiên vào năm 1985 (Rapid and sensitive protein similarity searches). ◼ Nhiều phần mềm tin sinh học cần dữ liệu trình tự gene hoặc protein theo kiểu định dạng FASTA như ví dụ minh hoạ dưới đây: >tên trình tự gattctcacttggtctgctgcaaggacgcggaccattaaaactgttcatggcccttgtggcgttctcgt ttcctaacaatcccaccaacagcagggatactaaaaagatggggaacgatcaaaaaatcaaaagct atcaatgtcttgagagggttcaggaaagagattggaaggatgctgaacatcttgaacaggagacgc aggacagcaggcgtgattgttatgttgattccacagcgatggcgttccatttaaccacacgcaatgg 15 Tìm kiếm trình tự sinh học
- Một số mã số truy cập của RefSeq database 1. mRNAs and Proteins ◼ NM_123456 Curated mRNA ◼ NP_123456 Curated Protein ◼ NR_123456 Curated non-coding RNA ◼ XM_123456 Predicted mRNA ◼ XP_123456 Predicted Protein ◼ XR_123456 Predicted non-coding RNA 2. Chromosome NC_123455 Microbial replicons, organelle genomes, human chromosomes 4. Assemblies NT_123456 Contig 16 Tìm kiếm trình tự sinh học
- Ví dụ 1: NM_123456Curated mRNA NM_123456 17 Tìm kiếm trình s sinh học
- V í dụ 2: NC_12345 18 Giới thiệu môn học
- Kết quả tìm kiếm bộ gene 19 Giới thiệu môn học
- Thẻ giới hạn phạm vi tìm kiếm DNA ◼ [ALL] : Tất cả các trường tìm kiếm ◼ [ACCN]: Mã số truy cập của trình tự - Accession number ◼ [GI] : Số gi ◼ [AUTH] :Tên tác giả giải trình tự- author name ◼ [PDAT] : Ngày trình tự được chỉnh sửa hay ngày trình tự được cập nhật (update) – publication date ◼ [ORGN] : Sinh vật chứa trình tự đó - organism ◼ [TITL] :Định nghĩa trình tự trong mẫu tin – title ◼ [SLEN] :Chiều dài của trình tự - Sequence length ◼ [GENE] : Tên gene 20 Tìm kiếm trình tự môn học ◼
- BÀI TẬP Chúng ta thực tập tìm kiếm trình tự gen có tên là ST GENE và lấy đoạn nucleotide theo định dạng FASTA. Câu hỏi 1: Kết quả có bao nhiêu mục tìm thấy ? Trả lời 1: Câu hỏi 2: Trình tự DNA này dài bao nhiêu ? Nó mã hoá cho protein gì? Công trình này được đăng tải bởi tạp chí nào? Tác giả là ai? Trả lời 2: 21 Giới thiệu môn học
- Tìm kiếm trình tự protein 22 Tìm kiếm trình tự sinh học
- Tìm kiếm trình tự qua tên sinh vật 23 Giới thiệu môn học
- Định dạng trình tự dạng FASTA 24 Giới thiệu môn học
- Thẻ giới hạn phạm vi tìm kiếm trình tự protein ◼ [ALL] : Tất cả các trường tìm kiếm ◼ [ACCN] : Mã số truy cập của trình tự - Accession number ◼ [GI] : Số gi ◼ [AUTH] :Tên tác giả giải trình tự- author name ◼ [PDAT] : Ngày trình tự được chỉnh sửa hay ngày trình tự được cập nhật (update) – publication date ◼ [ORGN] : Sinh vật chứa trình tự đó - organism ◼ [TITL] : Định nghĩa trình tự trong mẫu tin – title ◼ [SLEN] : Chiều dài của trình tự - Sequence length ◼ [PROT] : Tên protein – Protein name ◼ [MOLWT] : Trọng lượng phân tử protein 25 Giới thiệu môn học
- Bài tập Chúng ta thực tập tìm kiếm trình tự protein là độc tố bền nhiệt có tên là ST (ST toxin). Câu hỏi: Có bao nhiêu mục bài liên quan đến trình tự protein yêu cầu được tìm thấy Trình tự protein ST toxin chủ yếu liên quan đến loài nào ? Đặc điểm của protein này? Trả lời: Cách mã hóa dùng trong trình tự amino acid 26 Giới thiệu môn học
- 27 Tìm kiếm trình tự sinh học
- Phần mềm Sequin 28 Tìm kiếm trình tự sinh học
- 29 Giới thiệu môn học
- Các download phần mềm sequin trong NCBI 30 Giới thiệu môn học
- Cách đăng ký trình tự đã được giải mã qua phần mềm sequin Chọn Genebank (NCBI) 31 Giới thiệu môn học
- Bước 1: Điền thông tin 32 Giới thiệu môn học
- 33 Tìm kiếm trình tự sinh học
- 34 Giới thiệu môn học
- 35 Giới thiệu môn học
- 36 Giới thiệu môn học
- 37 Giới thiệu môn học
- 38 Giới thiệu môn học
- 39 Giới thiệu môn học
- 40 Giới thiệu môn học
- 41 Giới thiệu môn học
- 42 Giới thiệu môn học
- 43 Giới thiệu môn học
- 44 Giới thiệu môn học
- BÀI TẬP Tìm kiếm trình tự gene mà bạn muốn, sau đó đăng ký lên trên gene bank bằng sequin 45 Tìm kiếm trình tự sinh học
- ĐỪNG NGỦ TRONG LỚP 46 Giới thiệu môn học
- 47 Giới thiệu môn học



