Bài giảng Ứng dụng công nghệ gene trong chăm sóc sức khỏe người - TS. Trần Hoàng Dũng (Phần 1)

65 trang phuongnguyen 4440

Download

Bạn đang xem 20 trang mẫu của tài liệu "Bài giảng Ứng dụng công nghệ gene trong chăm sóc sức khỏe người - TS. Trần Hoàng Dũng (Phần 1)", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên

Tài liệu đính kèm:

bai_giang_ung_dung_cong_nghe_gene_trong_cham_soc_suc_khoe_ng.pdf

Nội dung text: Bài giảng Ứng dụng công nghệ gene trong chăm sóc sức khỏe người - TS. Trần Hoàng Dũng (Phần 1)

Trường Đại Học Nguyễn Tất Thành Khoa Công Nghệ Sinh Học ỨNG DỤNG CÔNG NGHỆ GENE TRONG CHĂM SÓC SỨC KHỎE NGƯỜI Giảng viên: TS. TRẦN HOÀNG DŨNG Tháng 04/2012
Chương 1 CẤU TRÚC GENE, SỰ BIỂU HIỆN GENE VÀ CƠ SỞ PHÂN TỬ CỦA DI TRUYỀN 1. GIỚI THIỆU Từ khi thuật ngữ “gene” được đặt ra bởi nhà thực vật học Đan Mạch Wilhelm Johannsen vào năm 1909, khái niệm gen được mở ra. Lúc đầu, gen được cho là một thực thể trừu tượng không có một ý nghĩa vật chất – cấu trúc nào. Nó có ý nghĩa đối với những nhà tự nhiên học quan tâm đến sự di truyền của những biến đổi có lợi cung cấp vật liệu cho tiến hóa. Vào những năm đầu thập niên 50, thí nghiệm của Seymour Benzer trên locus rII của T4 bacteriophage đã giúp định nghĩa gene dưới dạng một đơn vị chức năng, gọi là “cistron”. Khái niệm cistron mô tả cistron là một chuỗi DNA liên tục mã hóa cho một polypeptide thông qua sự phiên mã ra RNA. Nghiên cứu sâu hơn của Charles Yahofsky và Harvey Itano đã cho ra giả thuyết “1 cistron-1 polypeptide”. Khái niệm gene-protein được xác định độc lập bởi Sydney Brenner và Charles Yanofsky và mô hình operon do Francois Jacob và Jacques Monod đưa ra vào những năm đầu thập niên 60 cũng tán thành khái niệm cistron này. Mô hình operon giải thích sự phiên mã một cistron được điều hòa như thế nào, trong khi mô hình gene-protein chứng minh rằng một đột biến trên gene (cistron) gây ra sự biến đổi trình tự amino acid trên protein. Vì vậy, mô hình điều hòa sự biểu hiện cistron (gene) thông qua tương tác promoter-operator đã giúp thống nhất những khía cạnh về cấu trúc và chức năng của gene thành một khái niệm gene duy nhất. Khái niệm gene này đã được xem xét một lần nữa thông qua những khám phá độc lập được công bố vào năm 1977 bởi Phillip Sharp và Richard Roberts, theo sau đó là một chuỗi những công bố tương tự. Những khám phá này chứng minh rằng gene không nhất thiết tồn tại như là một chuỗi DNA liên tục mà nó còn có thể tồn tại một cách ngắt quãng: vùng mã hóa của một gene (cistron) bị ngắt quãng bởi những trình tự không mã hóa xen kẽ (intron). Gene được phiên mã cho ra một chuỗi dài gọi là “heterogeneous nuclear RNA” (hnRNA) hay “tiền-mRNA” (pre-mRNA). Việc xử lý những “tiền-mRNA” liên quan đến ba sự kiện: gắn mũ chụp (capping), polyadenyl hóa và cắt nối (splicing). Gắn mũ chụp là gắn thêm một cái “mũ” (m7G) vào base đầu tiên của mRNA ở đầu 5′; polyadenyl hóa là việc gắn thêm một chuỗi dài các nucleotide Adenyl (khoảng 200-250 ở eukaryote) vào đầu 3′ của mRNA; và cắt nối (splicing) là việc loại bỏ các đoạn intron tạo thành mRNA trưởng thành. Những vùng gene có hiện diện trên tiên-mRNA mà không hiện diện trên mRNA trưởng thành được gọi là “intron”, những đoạn hiện diện trên mRNA trưởng thành gọi là “exon”. Thuật ngữ exon và intron được đưa ra bởi Walter Gilbert. Sự phát triển của khái niệm gene từng phần (gồm exon và intron) trên đã không làm mất đi khái niệm cistron, nó vẫn đúng đối với những gene không có
intron như ở những gene prokaryote và một số eukaryote. Thuật ngữ “cistron” hiện nay đã được thay thế bằng thuật ngữ “khung đọc mở” (ORF). Cùng với sự hiểu biết ngày càng cao về cấu trúc và chức năng của gene, quá trình và sự điều hòa phiên mã, sau phiên mã, dịch mã và sau dịch mã, đã có nhiều khám phá đầy bất ngờ, thách thức khái niệm gene từng phần. Một vài trong số những khám phá này như gene tái cấu trúc, promoter khác thường, những giai đoạn khác nhau của sự cắt nối khác thường bao gồm cả những exon bên cạnh intron, gene chồng lấp (nested genes), trans-splicing mRNA, sự sắp xếp RNA (RNA editing) và cắt nối protein (protein splicing) đã nhấn mạnh hơn nữa tính lưu động của cấu trúc gene eukaryote vượt qua khỏi mô hình exon-intron. Quan điểm truyền thống về sự tương ứng một đối một giữa gene, mRNA và trình tự polypeptide đã không còn là một chủ đề phổ biến nữa; nó có thể thích hợp với nhiều gen eukaryote nhưng không phải tất cả. Mặc dù có nhiều ngoại lệ đối với quan hệ giữa trình tự gene-mRNA- polypeptide, mô hình exon-intron vẫn là mô hình chủ yếu trong việc tìm hiểu cấu trúc phân tử và chức năng của những gene eukaryote. Bài tiểu luận này sẽ thảo luận về cấu trúc của gene eukaryote điển hình và sự biểu hiện của chúng. 2. CẤU TRÚC GENE Có thể định nghĩa một gene là toàn bộ trình tự nucleic acid cần cho sự tổng hợp một phân tử sản phẩm có chức năng (polypeptide hay RNA). Dựa vào định nghĩa này, một gen bao gồm nhiều hơn những đoạn nucleotide mã hóa cho trình tự acid amin của một protein. Một gen bao gồm cả những trình tự DNA cần cho việc tổng hợp một phân tử RNA. Ở những gen eukaryote, những vùng điều khiển phiên mã được gọi là enhancer có thể nằm ở vị trí cách vùng mã hóa 50 kb hoặc hơn. Những vùng không mã hóa quan trọng khác ở eukaryote là những trình tự đánh dấu sự cắt ở đầu 3′ và sự polyadenyl hóa, gọi là vùng poly (A), và đánh dấu sự cắt nối (splicing) những đoạn RNA phiên mã, được gọi là vùng cắt nối. Đột biến trên những tín hiệu chế biến RNA này làm ngăn chặn sự biểu hiện của một mRNA chức năng và do đó ngăn chặn biểu hiện ra polypeptide. Mặc dù hầu hết các gene đều được phiên mã ra mRNA mã hóa cho protein, tuy nhiên rõ ràng là một số trình tự DNA được phiên mã thành những RNA không mã hóa cho protein (ví dụ, tRNA và rRNA). Tuy nhiên, vì những DNA mã hóa cho tRNA và rRNA có thể gây ra những kiểu hình đặc biệt khi nó bị đột biến, nên những vùng DNA này thường được quy là gene tRNA và rRNA, mặc dù sản phẩm cuối cùng của chúng không phải là protein. Ngoài ra còn có nhiều loại RNA khác cũng được phiên mã từ gene không mã hóa protein. 2.1. Monocistron – Polycistron Những phân tử mRNA ở vi khuẩn đều là polycistron, nghĩa là một phân tử mRNA (ví dụ mRNA mã hóa từ operon Trp) chứa vùng mã hóa cho một vài protein hoạt động với nhau trong cùng một quá trình sinh học. Ngược lại, hầu hết mRNA ở 1
eukaryote đều là monocistron, nghĩa là mỗi phân tử mRNA chỉ mã hóa cho một protein duy nhất. Sự khác nhau giữa các mRNA monocistron và polycistron này tương ứng với sự khác nhau cơ bản trong quá trình dịch mã của chúng (sẽ được nói rõ ở các phần sau). Trong một phân tử mRNA polycistron ở vi khuẩn, vùng gắn ribosome nằm ở gần vị trí bắt đầu vùng mã hóa protein, hay những cistron trong mRNA. Sự khởi sự dịch mã có thể bắt đầu tại bất cứ vị trí nào trong những vị trí này, sản xuất ra nhiều loại protein khác nhau (hình 1a). Tuy nhiên đối với hầu hết những mRNA eukaryote, cấu trúc đầu mũ chụp 5′ chỉ thị cho sự gắn vào của ribosome và dịch mã bắt đầu tại vị trí codon AUG gần nhất (hình 1b). Hình 1: So sánh cấu trúc gene, sự phiên mã và dịch mã ở prokaryote và eukaryote (a) Operon tryptophan (tryp) ở E.coli gồm 5 gene (màu xanh dương) mã hóa cho những enzyme cần thiết cho sự tổng hợp tryptophan. Toàn bộ operon được phiên mã từ một promoter thành một phân tử mRNA dài và liên tục (màu đỏ). Sự dịch mã mRNA này bắt đầu tại 5 vùng khác nhau, tạo ra 5 protein khác nhau (màu xanh lá). Trật tự của các gene này trong nhiễn sắc thể của vi khuẩn song song tương ứng với thứ tự chức năng liên tiếp của các protein được mã hóa trong con đường tổng hợp tryptophan. (b) 5 gene mã hóa cho các enzyme cần cho quá trình tổng hợp tryptophan ở nấm men (Saccharomyces cerevisiae) nằm trên 4 nhiễm sắc thể khác nhau (IV, V, VII và XI). Mỗi gene được phiên mã từ promoter của chính nó tạo ra đoạn phiên mã sơ cấp được chế biến thành phân tử mRNA chức năng mã hóa cho ra một protein đơn lẻ. Chiều dài của các nhiễm sắc thể trên được thể hiện ở bên phải và tính bằng kilobase (103 base). 2
2.2. Intron – Exon Khác với những gene không chứa intron ở vi khuẩn và nấm men, hầu hết những gene ở động vật và thực vật đa bào đều chứa những đoạn intron được loại bỏ trong suốt quá trình chế biến mRNA. Trong nhiều trường hợp, những đoạn intron trong một gene dài hơn đáng kể so với exon. Ví dụ, trong một gene mã hóa cho một protein có kích thước trung bình chứa khoảng 50.000 cặp base, hơn 95% là intron và những vùng không mã hóa ở đầu 5′ và 3′. Nhiều phân tử protein lớn ở những sinh vật bậc cao có những domain lặp lại, được mã hóa bởi những gen bao gồm những đoạn exon tương tự lặp đi lặp lại và xen kẽ bởi những đoạn intron có chiều dài biến thiên. 2.3. Sự tổ chức các gene và DNA không mã hóa trên nhiễm sắc thể Bộ gene của nhiều sinh vật chứa rất nhiều DNA không chức năng. So sánh ban đầu trên tổng DNA nhiễm sắc thể trong mỗi tế bào ở nhiều loài gợi ý rằng đa số DNA ở các sinh vật không mã hóa cho RNA hay có bất kỳ một chức năng cấu trúc hay điều hòa nào rõ ràng. Ví dụ ở nấm men, ruồi giấm, gà và người được nhận thấy là có lượng DNA trong bộ nhiễm sắc thể tương ứng với cấp độ phức tạp của chúng (lượng DNA lần lượt là 12; 180; 1300; và 3300 Mb). Tuy nhiên, trong số động vật có xương, những loài có lượng DNA trong mỗi tế bào lớn nhất lại là lưỡng cư - những loài chắc chắn là ít phức tạp hơn so với người cả về cấu trúc lẫn hành vi. Rất nhiều loài thực vật cũng có số lượng DNA nhiều hơn đáng kể so với người. Ví dụ như tulip có số lượng DNA gấp 10 lần so với người. Ngoài ra, lượng DNA trong mỗi tế bào cũng biến thiên đáng kể giữa những loài có quan hệ gần gũi với nhau. Việc giải trình tự và xác định chi tiết các đoạn exon trên DNA nhiễm sắc thể đã chứng minh rằng bộ gen của những sinh vật eukaryote bậc cao chứa lượng lớn DNA không mã hóa. Ví dụ như, chỉ một phần nhỏ (khoảng 80 kb) trên cụm gene β- globin ở người là mã hóa cho protein (hình 2). Hơn nữa, so với những vùng DNA khác ở động vật có xương, cụm gene β-globin thường giàu những trình tự mã hóa cho protein, và những đoạn intron trên gene globin ngắn hơn đáng kể so với những đoạn intron trên nhiều gene khác ở người. Ngược lại, một đoạn DNA 80 kb ở nấm men S. cerevisiae chứa nhiều trình tự mã hóa gần nhau, rất ít intron và DNA không mã hóa. Mật độ gene biến thiên rất lớn giữa những vùng DNA nhiễm sắc thể người khác nhau, từ những vùng “giàu gene” như cụm gene β-globin cho đến những vùng “sa mạc” nghèo gene. Trong số 94% DNA bộ gene người được giải trình tự, chỉ khoảng 1,5% là tương ứng với các trình tự mã hóa protein (các đoạn exon). Hầu hết các đoạn exon ở người chứa từ 50-200 cặp base mặc dù đoạn exon ở đầu 3’ ở nhiều đơn vị phiên mã dài hơn nhiều. Độ dài những đoạn intron ở người cũng biến thiên đáng kể: nhiều đoạn dài khoảng 90 cặp base, một số khác thường dài hơn rất nhiều, trung bình 3,3 kb. Xấp xỉ 1/3 DNA bộ gene người được cho là được phiên mã thành những đoạn tiền-mRNA, nhưng khoảng 95% những trình tự này đều là intron, được loại bỏ trong quá trình cắt nối RNA. 3
Hình 2: So sánh mật độ gene trên một vùng ≈ 80 kb ở người và nấm men [Phần (a), xem F. S. Collins và S. M. Weissman, 1984, Prog. Nucl. Acid Res Mol. Biol. 31:315; phần (b), xem S.G. Oliver và cs, 1992, Nature 357:28.] Sự khác nhau đáng kể về lượng DNA không chức năng ở những sinh vật đơn bào và đa bào có thể là do những áp lực chọn lọc khác nhau trong suốt quá trình tiến hóa. Ví dụ như, những vi sinh vật cần phải cạnh tranh lượng chất dinh dưỡng có giới hạn trong môi trường, do đó việc kiểm soát trao đổi chất là một đặc điểm then chốt. Vì sự tổng hợp DNA không chức năng cần có nhiều thời gian và năng lượng cho nên có lẽ đã có áp lực chọn lọc để loại bỏ DNA không chức năng trong suốt quá trình tiến hóa của vi sinh vật. Mặt khác, chọn lọc tự nhiên ở những loài động vật có xương phần lớn dựa vào hành vi của chúng. Năng lượng đầu tư vào việc tổng hợp DNA là không đáng kể so với năng lượng trao đổi chất cần cho sự vận động của các bắp cơ; do đó có rất ít áp lực chọn lọc để loại bỏ DNA không chức năng này. 2.4. Cấu trúc gene mã hóa protein điển hình ở eukaryote Cấu trúc của một gene mã hóa protein điển hình ở eukaryote được minh họa ở hình dưới đây. Có 3 phần chính: một vùng cánh 5′ (5′-flank) ở đầu 5′ của gene; một vùng được phiên mã ở giữa; và một vùng cánh 3′ (3' -flank) ở đầu 3′ của gene. Promoter nằm ở đầu 5′ của gene. 4
Hình 3: Cấu trúc một gene eukaryote điển hình Trên hình thể hiện mạch sense, mạch khuôn, TATA box, vị trí mũ chụp (vị trí bắt đầu phiên mã), tín hiệu poly(A) (AATAAA ở DNA và AAUAAA ở RNA), vị trí cho và nhận sự ghép nối trên intron (GT AG ở DNA; GU AG ở RNA), cũng như quá trình chế biến tiền-mRNA. Trên hình cho thấy đoạn exon 1 và một phần nhỏ ở đầu 5′ của đoạn exon 2 là những đoạn không mã hóa, do đó chúng cấu tạo nên 5'- UTR. 2.4.1. Vùng được phiên mã Vùng phiên mã của một gene gồm 3 phần: một vùng 5′ không được dịch mã (5′-UTR – 5′ -untranslated region), một vùng mã hóa amino acid (còn được gọi là khung đọc mở hay ORF), và vùng 3′ không được dịch mã (3′-UTR). Đối với bất kỳ một gene nào, chỉ một trong hai mạch của DNA là được phiên mã. Mạch được phiên mã được gọi là mạch khuôn (template) hay mạch antisense. Mạch không được phiên mã kia được gọi là mạch sense vì hai lý do: đầu tiên, trình tự của những base trong mạch không phiên mã tương tự như trình tự base ở mRNA (ngoại trừ T ở DNA thay vì U ở RNA) cho nên trình tự những codon ở mRNA được phản ánh ở trình tự base của mạch không phiên mã; thứ hai, tính phân cực 5′ →3′ ở mạch không phiên mã cũng tương tự như mRNA. Tất cả những gene nằm trên cùng một DNA nhiễm sắc thể có thể sẽ không được phiên mã từ cùng một mạch DNA. Đối với một vài gene, một mạch có thể là mạch khuôn, trong khi đối với những gene khác, mạch kia có thể là mạch khuôn. Do sự phiên mã luôn diễn ra theo chiều 5
5′→3′, và do mạch DNA khuôn và RNA được tổng hợp từ nó là đối song song, nên vị trí của promoter tự động xác định mạch nào của DNA có thể được dùng làm mạch khuôn cho sự phiên mã. Sự biểu hiện đầu 5′- và 3′-UTR có liên quan đến cả mRNA và gene. Vùng 5′- UTR của một gene (và mRNA) là toàn bộ trình tự từ vị trí bắt đầu phiên mã (vùng mũ chụp) cho đến nucleotide trước codon khởi sự dịch mã (ATG ở mạch không phiên mã – sense strand của DNA; AUG ở mRNA). Tương tự, vùng 3′-UTR của một gene (và mRNA) là toàn bộ trình tự bắt đầu sau codon kết thúc dịch mã (TAG/TGA/TAA ở mạch không phiên mã của DNA; UAG/UGA/UAA ở mRNA) cho đến nucleotide trước đuôi poly(A) (hình 3). Do đó, hai vùng 5′- và 3′-UTR của một gene bao gồm tất cả những exon không mã hóa, những phần không mã hóa của exon và thỉnh thoảng gồm cả intron. 2.4.2. Vùng cánh 5' của gene 2.4.2.1. Promoter Mô hình operon được đề xuất bởi Jacob và Monod đã đưa ra khái niệm promoter như là một phần không thể thiếu của gene hay đơn vị phiên mã, là nơi mà RNA polymerase gắn vào. Với những tiến bộ về kỹ thuật tạo dòng phân tử, người ta đã phân tích và xác định được rất nhiều các trình tự promoter thông qua phân tích xóa bỏ (deletion analysis). Đặc điểm quan trọng nhất của trình tự promoter đó là chúng điều khiển sự khởi sự phiên mã của một gene đặc hiệu, và vị trí của chúng được cố định tương đối so với vị trí bắt đầu phiên mã. Do sự phiên mã được tiến hành theo chiều 5′→3′, và RNA vừa mới tổng hợp có định hướng đối song song với mạch khuôn DNA nên vị trí của promoter sẽ tự động quyết định mạch nào trong hai mạch DNA của gene đó sẽ được phiên mã. Có rất nhiều vùng promoter được gọi là “promoter trung tâm” (core/basal promoter), “promoter lân cận” (proximal promoter) và “promoter ngoại biên” (distal promoter) dựa trên chức năng và khoảng cách của chúng so với điểm khởi đầu phiên mã. Đôi lúc những trình tự điều hòa phiên mã này nằm ở vùng thượng nguồn của promoter trung tâm được gọi chung là những “trình tự promoter thượng nguồn” (upstream promoter elements). Ngoài promoter ra còn có những trình tự DNA khác cũng đóng góp trong việc điều hòa sự biểu hiện gene bao gồm enhancer, silencer, vùng điều khiển locus (LCR) và những trình tự cách ly (insulator elements). Thông thường, vị trí bắt đầu phiên mã được quyết định bởi hộp TATA và trình tự khởi đầu, hoặc đối với những promoter không có hộp TATA, vị trí này được quyết định bởi trình tự khởi đầu và trình tự promoter hạ nguồn, tất cả đều nằm bên trong promoter trung tâm. Vùng promoter trung tâm giúp hình thành phức hợp tiền khởi sự phiên mã (PIC) ở gần vị trí bắt đầu phiên mã. Phức hợp PIC bao gồm RNA polymerase và những nhân tố phiên mã chung (GTFs) – những nhân tố cần cho sự khởi sự phiên mã bởi RNA pol II. Tuy nhiên, hiệu quả và tính đặc hiệu trong việc nhận biết promoter phụ thuộc vào một vài trình tự khác (và những protein tương tác 6
với chúng) nằm xa hơn về phía thượng nguồn trong promoter lân cận. Vùng promoter lân cận là nơi gắn của một nhóm các nhân tố phiên mã khác – các nhân tố hoạt hóa phiên mã. Những protein hoạt hóa này tương tác với những cấu trúc cơ bản. Một vài các nhân tố hoạt hóa có thể có tính đặc hiệu với mô và được gọi là “những nhân tố phiên mã đặc hiệu” hoặc “nhân tố hoạt hóa đặc hiệu mô”. a) Promoter trung tâm Promoter trung tâm là trình tự tiếp giáp, dẫn dắt sự khởi đầu phiên mã chính xác bởi RNA poly II. Nó là vị trí gắn của RNA poly II và các GTF. Thông thường nó dài khoảng 35 cặp base và kéo dài cả về phía thượng nguồn lẫn hạ nguồn của vị trí bắt đầu phiên mã (-35 đến +35). Promoter trung tâm có thể chứa hai hay nhiều hơn trong số các motif sau: hộp TATA , trình tự khởi đầu (Inr) và trình tự promoter hạ nguồn (DPE). b) Promoter lân cận Promoter lân cận dài khoảng 250 cặp base và có thể kéo dài cả hai phía của vị trí bắt đầu phiên mã (-250 đến +250). Tuy nhiên, theo tài liệu, những trình tự xa hơn -250 về phía thượng nguồn cũng được gọi là “trình tự promoter lân cận”. Thông thường nó là nơi gắn các nhân tố phiên mã đặc hiệu hoặc nhân tố hoạt hóa. Hai trình tự hoạt hóa phiên mã nằm trong promoter này gồm hộp CAAT và hộp GC. Hộp CAAT gắn nhân tố phiên mã NF-I (nuclear factor I, còn gọi là NF-Y, CTF và CBF), nằm ở vị trí khoảng nucleotide 75 phía thượng nguồn tính từ vị trí bắt đầu phiên mã và có trình tự thỏa hiệp là GG(T/C)CAATCT. Hộp GC có trình tự thỏa hiệp là GGGCGG, nằm ở vị trí nucleotide 90 phía thượng nguồn tính từ vị trí bắt đầu phiên mã, là nơi gắn nhân tố phiên mã Sp1 (specificity protein 1). Hộp CAAT và GC hoạt động giống như các trình tự enhancer vì chúng có thể hoạt hóa sự phiên mã khi được đặt ở một trong hai hướng bên trong promoter lân cận. c) Promoter ngoại biên Thuật ngữ “promoter ngoại biên” được dùng để chỉ các trình tự nằm xa hơn về phía thượng nguồn của promoter trung tâm. Có rất nhiều ví dụ về sự kết hợp giữa promoter lân cận và promoter ngoại biên trong việc điều hòa phiên mã. Cả hai promoter của gene đều thể hiện sự đặc hiệu đối với mô và chứa nhiều các trình tự điều hòa phiên mã đặc biệt, được nhận biết bởi các nhân tố phiên mã đặc hiệu mô. Ngoài ra, thỉnh thoảng những trình tự bên trong intron cũng đóng vai trò không thể thiếu trong việc điều hòa tăng cường phiên mã được gọi là những trình tự giống promoter bên trong intron (Salguerro S. và cs, 2000). Nhóm tác giả cho rằng một vài intron cũng có đặc điểm tương tự promoter,như trình tự giống TATA, hộp CAAT. 2.4.2.2. Các trình tự điều hòa khác (Enhancer, Silencer, LCR, Insulator) Rất nhiều các trình tự điều hòa phiên mã có thể nằm ở vị trí cách xa gene khoảng một vài kb cả về hai phía tính từ vị trí bắt đầu phiên mã. Một vài trong số những trình tự này kích hoạt sự phiên mã như enhancer và LCR, trong khi một số khác hoạt động như những tác nhân ức chế phiên mã như silencer. Những vùng này 7
chứa những trình tự nhận biết nhiều loại protein gắn DNA đặc hiệu với trình tự có liên quan đến sự điều hòa phiên mã. a) Enhancer và Silencer Enhancer có thể giúp tăng cường tốc độ phiên mã bằng cách tăng cường vận dụng promoter. Chúng là vị trí gắn của các nhân tố hoạt hóa phiên mã đặc hiệu. Một đoạn enhancer có thể điều khiển sự phiên mã của nhiều hơn một gene theo kiểu không phụ thuộc vào vị trí và chiều hướng. Những trình tự enhancer có thể nằm ở vị trí gần với vị trí bắt đầu phiên mã, phía thượng nguồn lẫn hạ nguồn và thậm chí còn có thể nằm bên trong intron. Hộp CAAT và GC đề cập ở trên là những trình tự enhancer đóng vai trò không thể thiếu trong promoter lân cận ở hầu hết các gene. Người ta cho rằng enhancer đem những nhân tố hoạt hóa gắn vào nó tương tác với những nhân tố phiên mã gắn với promoter bằng cách uốn cong DNA. Từ đó, chúng làm tăng nồng độ các nhân tố hoạt hóa gần promoter và những nhân tố này tương tác trực tiếp hoặc gián tiếp với promoter để khởi sự quá trình phiên mã. Ngược lại với enhancer là silencer, chúng ức chế sự phiên mã bằng cách gắn với những nhân tố ức chế phiên mã, từ đó hoạt động như là yếu tố điều hòa âm. Silencer có thể hoạt động không phụ thuộc vào chiều, vị trí và khoảng cách, và chúng cũng có thể nằm bên trong intron. b) Vùng điểu khiển locus (LCR) LCR (locus control region) là một loại trình tự tăng cường phiên mã khác. LCR tăng cường sự phiên mã của một cụm các gene liên kết với nhau bằng cách tạo ra một hình dáng nhiễm sắc thể mở bên cạnh locus. Từ đó, LCR có thể tác động mạnh đến mức độ hoạt động của một vùng nhiễm sắc chất điển hình (euchromatic) của một nhiễm sắc thể. LCR được xác định đầu tiên ở locus β -globin ở người. c) Insulator Insulator (trình tự cách ly) là một trình tự ranh giới gene quan trọng. Khi gắn vào những protein gắn insulator, chúng sẽ bảo vệ promoter khỏi những tác động của các yếu tố điều hòa gần đó. Insulator có hai dạng chức năng: chức năng ngăn chặn enhancer và chức năng hàng rào dị nhiễm sắc chất (heterochromatin). Chức năng ngăn chặn enhancer liên quan đến việc ngăn chặn sự tương tác giữa một enhancer và promoter khi insulator nằm ở vị trí giữa hai trình tự này, và từ đó ngăn chặn sự hoạt hóa của enhancer đối với promoter. Vì một enhencer có thể tác động đến nhiều hơn một promoter nên chức năng ức chế có thể ngăn chặn tác động bừa bãi của một enhancer lên nhiều promoter và bắt buộc chúng chỉ tác động lên một promoter đặc hiệu. Chức năng hàng rào dị nhiễm sắc chất (heterochromatin barrier) liên quan đến việc bảo vệ một vùng nhiễm sắc chất điển hình (bao gồm những gene với những promoter hoạt động) khỏi việc trở thành dị nhiễm sắc chất bằng cách bất hoạt tác động xâm lấn của dị nhiễm sắc chất gần kề. Một số insulator sở hữa cả hai chức năng ngăn chặn và hàng rào, trong khi một số khác chỉ có một chức năng. 8
2.4.3. Vùng cánh 3' của gene Vùng cánh 3' của gene kéo dài xa hơn vùng 3'-UTR và chứa những tín hiệu kết thúc phiên mã. Ở vi khuẩn (prokaryote) có hai kiểu kết thúc phiên mã: phụ thuộc rho và không phụ thuộc vào rho. Kết thúc phiên mã không phụ thuộc rho cần có hai cấu trúc đặc trưng cần cho cả hai kiểu kết thúc: (i) một trình tự có thể tạo ra cấu trúc thòng lọng (stem-loop) và (ii) một vùng giàu U ở phía cuối của cấu trúc thòng lọng. Cấu trúc thòng lọng thường chứa một vùng giàu GC nằm cách vùng giàu U khoảng 10 base. Sự hình thành cấu trúc thòng lọng này làm cho RNA poly ngừng lại, từ đó kết thúc sự phiên mã. Kết thúc phiên mã phụ thuộc vào rho được phát hiện ở khoảng phân nửa các gene của E. coli. Rho là một nhân tố kết thúc phiên mã gắn vào RNA, là một protein có hoạt tính helicase và ATPase phụ thuộc RNA. Vùng kết thúc phiên mã phụ thuộc vào rho thường là giàu C và nghèo G. Trong suốt quá trình phiên mã, nhân tố rho gắn lên trên RNA đang được kéo dài ở vị trí dài khoảng 75 nucleotide và phía thượng nguồn của vùng kết thúc phiên mã. Sử dụng hoạt tính ATPase của nó, rho di chuyển dọc theo RNA và có lẽ với vận tốc nhanh hơn RNA pol di chuyển trên mạch khuôn. Khi RNA pol ngừng tại vị trí kết thúc, rho bắt kịp nó và sử dụng hoạt tính helicase để tách đoạn mạch lai giữa DNA-RNA, từ đó kết thúc sự phiên mã và giải phóng RNA và RNA pol. Ở Eukaryote người ta vẫn chưa biết nhiều về sự kết thúc phiên mã. Tuy nhiên người ta có thể khái quát nó dựa trên những hiểu biết hiện tại. Mỗi loại RNA pol sử dụng một cơ chế kết thúc phiên mã khác nhau. Đối với pol I và III, việc dừng lại ở trình tự kết thúc ở vùng cánh 3' có vẻ đóng vai trò quan trọng trong việc kết thúc phiên mã và giải phóng RNA và pol. Những nhân tố giúp dừng phiên mã có thể không nhất thiết là những nhân tố giải phóng. Những tín hiệu kết thúc cũng như những nhân tố kết thúc và giải phóng có thể rất khác nhau ở những loài eukaryote khác nhau. 3. SỰ BIỂU HIỆN GENE 3.1. Đơn vị phiên mã Ở vi khuẩn, một đơn vị phiên mã bao gồm một cụm các gen tạo nên một operon, được phiên mã từ một promoter xác định thành một đoạn phiên mã duy nhất. Nói cách khác, ta có thể phân biệt được gene và đơn vị phiên mã ở prokaryote. Ngược lại, ở eukaryote hầu hết các gene và đơn vị phiên mã là như nhau, và hai thuật ngữ này thường có thể được sử dụng thay thế cho nhau. Tùy thuộc vào số phận của đoạn phiên mã sơ cấp, đơn vị phiên mã ở eukaryote được phân thành 2 dạng: đơn vị phiên mã đơn giản và đơn vị phiên mã phức tạp. Một đơn vị phiên mã đơn giản (simple transcription unit) tạo ra một đoạn phiên mã sơ cấp, đoạn phiên mã này sẽ được chế biến để tạo ra một dạng mRNA duy nhất, mã hóa cho một protein đơn lẻ. Tất cả đột biến trên các đoạn exon, intron 9
và những vùng điều hòa phiên mã đều có thể ảnh hưởng đến sự biểu hiện của protein được mã hóa bởi một đơn vị phiên mã đơn giản (hình 4). Hình 4: Đơn vị phiên mã đơn (simple transcription unit) Một đơn vị phiên mã đơn giản gồm một vùng mã hóa cho một protein, kéo dài từ mũ chụp đầu 5’ cho đến vùng poly(A) ở đầu 3’ và các vùng điều hòa có liên quan. Các đoạn intron nằm xen kẽ giữa các đoạn exon (hình chữ nhật màu xanh) và được loại bỏ trong suốt quá trình chế biến các tiền-mRNA và do đó không hiện diện trên phân tử mRNA chức năng đơn cistron (monocistron). Những đột biến trên vùng điều hòa phiên mã (đột biến a, b) có thể làm giảm hay ngăn chặn sự phiên mã, từ đó làm giảm hay xóa bỏ sự tổng hợp protein được mã hóa. Một đột biến bên trong đoạn exon (đột biến c) có thể tạo ra một protein bất thường. Một đột biến bên trong đoạn intron (đột biến d) cho ra vị trí cắt nối mới, kết quả tạo ra một mRNA bị cắt nối không bình thường, mã hóa cho ra một protein mất chức năng. Trong khi đó, đơn vị phiên mã phức (complex transcription unit) khá phổ biến ở sinh vật đa bào và đoạn phiên mã RNA sơ cấp có thể được chế biến theo nhiều cách, dẫn đến hình thành các mRNA chứa những đoạn exon khác nhau. Mỗi mRNA đều là monocistron và được dịch mã thành một polypeptide duy nhất, với sự dịch mã khởi sự ở AUG đầu tiên trên mRNA. Trong hình 6, có nhiều loại mRNA khác nhau có thể được tạo thành theo ba cách: (i) Sử dụng những vị trí nối khác nhau tạo ra những mRNA có cùng những exon ở đầu 5′ và 3′ nhưng khác nhau ở những exon bên trong; (ii) Sử dụng những vị trí poly(A) khác nhau tạo ra những mRNA có cùng những exon đầu 5′ nhưng khác ở những exon đầu 3′; (iii) Sử dụng những promoter khác nhau tạo ra những mRNA khác nhau ở những exon đầu 5′ nhưng giống nhau ở những exon đầu 3′. Một gene được biểu hiện một cách có chọn lọc ở hai hay nhiều loại tế bào khác nhau thì thường được phiên mã từ những promoter khác nhau đặc hiệu với loại tế bào. 10
i) ii) iii) Hình 5: Đơn vị phiên mã phức (complex transcription unit) Đơn vị phiên mã phức tạo ra những đoạn phiên mã sơ cấp có thể được chế biến theo nhiều cách khác nhau: (i) Nếu một đoạn phiên mã sơ cấp có chứa những vị trí cắt nối khác nhau, nó có thể được chế biến thanh những mRNA với cùng những exon ở đầu 5’ và 3’ nhưng khác nhau ở những exon bên trong; (ii) Nếu một đoạn phiên mã sơ cấp có hai vị trí poly(A), nó có thể được chế biến thành các mRNA với những exon đầu 3’ khác nhau; (iii) Nếu các promoter khác nhau (f hoặc g) được kích hoạt ở những dạng tế bào khác nhau, thì mRNA1 - được sản xuất ở một dạng tế bào mà trong đó promoter f được kích hoạt - sẽ có một exon (1A) khác với mRNA2 - được sản xuất ở một dạng tế bào khác mà trong đó promoter g được kích hoạt và exon 1B được sử dụng thay cho 1A. Những đột biến ở những vùng điều hòa (a và b) và những đột biến bên trong exon (c) giống nhau ở những mRNA khác nhau có ảnh hưởng đến những protein mã hóa bởi cả hai mRNA được chế biến khác nhau đó. Ngược lại, những đột biến bên trong các đoạn exon (d và e) khác nhau ở những mRNA khác nhau chỉ có tác động ảnh hưởng đến protein được mã hóa từ mRNA đó. Đối với những gene được 11
phiên mã từ những promoter khác nhau ở các dạng tế bào khác nhau, những đột biến ở các vùng điều hòa khác nhau (f và g) chỉ có tác động ảnh hưởng ở dạng tế bào mà trong đó đoạn promoter đó được hoạt hóa. Hình dưới đây mô tả ba cách chế biến RNA khác nhau xảy ra trong quá trình biệt hóa giới tính ở Drosophila. Thông thường một mRNA được tạo ra từ một đơn vị phiên mã phức ở một vài dạng tế bào, và một mRNA khác được tạo ra ở những dạng tế bào khác. Ví dụ như sự khác nhau ở cách ghép nối ở những đoạn phiên mã fibronectin sơ cấp ở tế bào fibroblast và tế bào gan sẽ quyết định liệu protein tiết ra có bao gồm những domain đóng vai trò bám vào bề mặt tế bào hay không. Hình 6: Chuỗi điều hòa cắt nối điều khiển sự định đoạt giới tính ở phôi Drosophila Chuỗi điều hòa cắt nối điều khiển sự định đoạt giới tính thông qua sự biểu hiện của các gene sxl (sex-lethal), tra (transformer) và dsx (double-sex) ở phôi Drosophila. Hình chỉ thể hiện các đoạn exon (hình chữ nhật) và intron (đường gạch đen) - nơi xảy ra sự điều hòa cắt nối. Đường đứt khúc màu đỏ thể hiện sự cắt nối (splicing) tiền-mRNA ở con cái và tương tự đường màu xanh thể hiện sự cắt nối ở con đực. Đường dọc màu đỏ bên trong các đoạn exon biểu thị các codon stop bên trong khung đọc - cái ngăn chặn sự tổng hợp protein chức năng. Chỉ những phôi cái mới sản xuất protein Sxl chức năng - protein ức chế việc cắt nối giữa exon 2 và 3 trong tiền-mRNA sxl (a) và giữa exon 1 và 2 trong tiền-mRNA tra (b). (c) Ngược lại, việc gắn mang tính điều phối của protein Tra và hai protein SR, Rbp1 và Tra2, hoạt hóa việc cắt nối giữa exon 3 và 4 và sự cắt/polyadenyl hóa An ở đầu 3’ của exon 4 ở tiền-mRNA dsx ở phôi cái. Ở phôi đực – phôi thiếu Tra chức năng – protein SR không gắn vào exon 4, và do đó exon 3 được nối vào exon 5. Các protein Dsx khác nhau sản sinh ở phôi đực và cái - kết quả của chuỗi điều hòa cắt nối - có tác dụng ức chế sự phiên mã các gene cần thiết cho sự biệt hóa giới tính của giới tính kia. [Sửa lại từ M. J. Moore và cs, 1993, in R. Gesteland và J. Atkins, eds., The RNA World, Cold Spring Harbor Press, trang 303-357.] 12
Đối với trường hợp đơn vị phiên mã phức, quan hệ giữa một đột biến và một gene không phải lúc nào cũng trung thực hay trực tiếp. Một đột biến ở cùng một vùng điều hòa hay một đoạn exon ở những mRNA khác nhau sẽ ảnh hưởng đến tất cả những protein khác nhau được mã hóa bởi cùng một đơn vị phiên mã phức. Mặt khác, những đột biến trên một exon chỉ hiện diện ở một trong số những mRNA khác nhau thì chỉ ảnh hưởng đến protein được mã hóa bởi mRNA đó. 3.2. Sự phiên mã ở gene mã hóa protein và sự hình thành mRNA chức năng Khái niệm đơn giản nhất của gene đó là một “đơn vị DNA bao gồm thông tin chỉ định sự tổng hợp của một chuỗi polypeptide hay một phân tử RNA chức năng (như tRNA).” Và một phần rất lớn trong gene mang thông tin để tạo nên phân tử protein, và chính những bản sao RNA của những gene mã hóa protein này cấu thành nên những phân tử mRNA của tế bào. Ở virus một phân tử DNA chỉ chứa một vài gene, trong khi ở những động thực vật bậc cao một phân tử DNA ở mỗi nhiễm sắc thể có thể chứa đến vài ngàn gene. Quá trình tổng hợp RNA (phiên mã) chỉ đơn giản là sự sao chép lại ngôn ngữ gồm bốn base của DNA bao gồm A, G, C và T thành ngôn ngữ gồm bốn base tương tự của RNA, chỉ trừ U thay thế cho T. Mặt khác, quá trình tổng hợp protein là sự phiên dịch lại ngôn ngữ trên thành ngôn ngữ 20 amino acid của protein. Dưới đây là quá trình hình thành mRNA chức năng từ các gene mã hóa protein điển hình. 3.2.1. Sự polymer hóa ribonucleotide Như đã đề cập ở trên, trong suốt quá trình phiên mã, một mạch của DNA đóng vai trò là mạch khuôn, quyết định thứ tự của các monomer ribonucleoside triphosphate (rNTP) để hình thành một chuỗi RNA bổ sung. Các base trên mạch DNA khuôn bắt cặp với các rNTP bổ sung, cái mà sau đó được gắn lại với nhau trong phản ứng polymer hóa được xúc tác bởi RNA polymerase. Sự polymer hóa liên quan đến sự ăn mòn bởi 3' oxygen trên chuỗi RNA đang dài ra lên α phosphate của nuclotide tiếp theo, hình thành nên liên kết phosphodiester và giải phóng pyrophosphate (Ppi). Theo cơ chế này thì phân tử RNA luôn luôn được tổng hợp từ đầu 5' 3' (hình 7). 13
Hình 7: Sự polymer hóa ribonucleotide bởi RNA polymerase trong quá trình phiên mã Các ribonucleotide sắp được gắn vào đầu 3' của mạch RNA được chỉ định bởi sự bắt cặp giữa base tiếp theo trên mạch DNA khuôn và ribonucleoside triphosphate (rNTP) bổ sung. Một liên kết phosphodiester được hình thành khi RNA polymerase xúc tác một phản ứng giữa 3' O của mạch đang dài ra với α phosphate của một rNTP bắt cặp chính xác. Mạch RNA luôn được tổng hợp theo hướng 5' 3' và ngược lại với chiều phân cực của mạch khuôn DNA. 3.2.1. Các giai đoạn phiên mã [1] Trong suốt quá trình khởi sự phiên mã, RNA polymerase nhận biết và gắn vào một vị trí đặc hiệu – promoter trên DNA mạch đôi (Hình 9-bước 1). Những RNA polymerase nhân cần rất nhiều nhân tố protein khác nhau – các nhân tố phiên mã chung – để giúp chúng định vị promoter và khởi đầu sự phiên mã. Sau khi gắn vào promoter RNA polymerase tháo gỡ hai mạch DNA để các ribonucleotide triphosphate có thể tiếp cận được với các base trên mạch khuôn. Các RNA polymerase trong tế bào tháo gỡ khoảng 14 cặp base xung quanh vị trí bắt đầu phiên mã trên DNA (bước 2). Sự khởi sự phiên mã được cho là hoàn tất khi hai 14
ribonucleotide của một chuỗi RNA được nối với nhau bằng liên kết phosphodiester (bước 3). Khởi sự Bước 1: Polymerase gắn vào promoter trên mạch đôi DNA Bước 2: Polymerase tháo gỡ mạch đôi DNA gần vị trí bắt đầu phiên mã tạo thành bóng phiên mã Bước 3: Polymerase xúc tác hình thành liên kết phosphodiester giữa hai rNTP đầu tiên Kéo dài Bước 4: Polymerase di chuyển theo chiều 3' 5' của mạch khuôn, tháo gỡ mạch đôi DNA và gắn các rNTP vào mạch RNA Kết thúc Bước 5: Tại vị trí ngừng phiên mã, polymerase giải phóng RNA đã hoàn thành và rời khỏi DNA Hình 8: Ba bước của quá trình phiên mã Trong suốt quá trình khởi sự phiên mã, RNA polymerase tạo nên một bóng phiên mã và bắt đầu sự polymer hóa các ribonucleotide (rNTP) tại vị trí bắt đầu nằm bên trong vùng promoter. Khi một vùng của DNA được phiên mã, mạch còn lại đã tách ra được phục hồi trở lại thành cấu trúc xoắn kép. Đầu 5’ của mạch RNA rời khỏi RNA polymerase thông qua một rãnh bên trong enzyme. Sự kết thúc dịch mã xảy ra khi polymerase gặp một trình tự kết thúc đặc hiệu. Sau khi một vài ribonucleotide đã được gắn vào, RNA pol tách khỏi promoter và các nhân tố phiên mã chung. Trong suốt giai đoạn kéo dài mạch, RNA pol chạy dọc theo mạch DNA khuôn từng base một, đồng thời tháo gỡ mạch đôi DNA ở phía trước nó và phục hồi mạch đôi ở phía nó vừa đi qua (bước 4). Lần lượt từng ribonucleotide một được thêm vào đầu 3' của mạch RNA mới sinh trong giai đoạn kéo dài phiên mã bởi polymerase. Enzyme này vẫn duy trì một vùng tháo gỡ khoảng 14 cặp base, được gọi là bóng phiên mã. Khoảng chừng 8 nucleotide ở đầu 15
3' của mạch RNA đang tổng hợp vần còn bắt cặp base với mạch DNA khuôn trong bóng phiên mã. Phức hợp kéo dài phiên mã bao gồm RNA polymerase, DNA khuôn và mạch RNA đang dài ra. Phức hợp này cực kỳ ổn định. Trong quá trình kết thúc phiên mã, phân tử RNA đã hoàn thành, hay đoạn phiên mã sơ cấp, được giải phóng khỏi RNA polymerase và polymerase tách khỏi mạch khuôn DNA (bước 5). Những trình tự đặc biệt trên DNA khuôn ra tín hiệu cho RNA polymerase kết thúc phiên mã. Sau khi được giải phóng, RNA pol tự do có thể phiên mã cho cùng một gene một lần nữa hoặc một gene khác. 3.3. Biến đổi tiền-mRNA thành mRNA chức năng ở Eukaryote [1] [3] Ở các tế bào prokaryote không có nhân, sự dịch mã một phân tử mRNA thành protein có thể bắt đầu từ đầu 5' của mRNA ngay trong lúc đầu 3' vẫn đang được tổng hợp bởi RNA polymerase. Nói cách khác, sự phiên mã và dịch mã có thể xảy ra đồng thời ở prokaryote. Tuy nhiên, ở tế bào eukaryote nhân được tách khỏi tế bào chất – nơi dịch mã xảy ra nên không gian của hai quá trình phiên mã và dịch mã là khác nhau. Hơn nữa các đoạn phiên mã sơ cấp mới chỉ là những tiền-mRNA, cần phải trải qua một vài biến đổi – gọi chung là quá trình chế biến RNA để hình thành nên một phân tử mRNA chức năng (RNA trưởng thành). Phân tử mRNA này sau đó phải được vận chuyển ra tế bào chất trước khi nó có thể được dịch mã thành protein. Vì vậy, sự phiên mã và dịch mã không thể nào xảy ra đồng thời ở những tế bào eukaryote. 3.3.1. Gắn mũ chụp 5’ [1] [3] Đầu tiên, tất cả các tiền-mRNA ở eukaryote đều được biến đổi ở hai đầu của nó, và những biến đổi này được giữ lại trên mRNA trưởng thành. Tại đầu 5' của chuỗi RNA vừa mới được tách khỏi RNA pol II, ngay lập tức nó được tác động bởi một vài các enzyme kết hợp tổng hợp nên mũ chụp 5', một 7-methylguanylate liên kết với nucleotide cuối cùng của RNA bằng một liên kết 5', 5' triphosphate. Mũ chụp được viết là m7Gppp, viết tắt là m7G hay m7G. Cấu trúc mũ chụp m7G kinh điển được gọi là “cap0”, hiện diện ở tất cả các mRNA eukaryote. Cap0 được thêm vào theo một phản ứng gồm ba bước: đầu tiên, đầu phosphate tận cùng (γ- phosphate) được thủy phân bởi RNA 5′ triphosphatase từ triphosphate của nucleotide đầu tiên của tiền-mRNA thành diphosphate; tiếp theo, RNA guanylyltransferase xúc tác sự kết hợp giữa một GMP và diphosphate của nucleotide đầu tiên này thông qua liên kết 5′-5′, nhờ đó khôi phục lại triphosphate ở tận cùng; cuối cùng, RNA (guanine-7)-methyltransferase xúc tác sự methyl hóa vị trí N7 của guanine. Ở động vật có vú, hoạt động của triphosphatase nằm ở đầu N và hoạt động của guanylyltransferase nằm ở đầu C của cùng một polypeptide, nhưng ở nấm men, chúng được xúc tác bởi những enzyme riêng biệt. 16
Hình 9: Những cấu trúc mũ chụp trên mRNA ở eukaryote Ở eukaryote bậc thấp, quá trình gắn mũ chụp chỉ tạo ra cap0. Ở eukaryote bậc cao, quá trình gắn mũ chụp có thể tạo ra cap1 và cap2 bằng những biến đổi như methyl hóa 2'-O trên ribose của nucleotide 1 và 2 của tiền-mRNA, sự methyl hóa N6của base đầu tiên trên tiền-mRNA nếu như base đầu tiên là adenine. Những enzyme gắn mũ chụp được đưa đến tiền-mRNA bằng cách gắn vào domain đầu C (CTD) được phosphoryl hóa của RNA polymerase II (RNA pol II). Đuôi CTD chứa nhiều đoạn gồm 7 peptide lặp đi lặp lại có tính bảo tồn cao với trình tự thỏa hiệp (consensus sequence) là Tyr-Ser-Pro-Thr-Ser-Pro-Ser (YSPTSPS). Số lượng lặp lại biến thiên từ 26 ở nấm men đến 52 ở động vật có vú. Năm trong số bảy amino acid trong motif thỏa hiệp này là những điểm tiếp nhận phosphate, và sự phosphoryl hóa là một sự biến đổi sau dịch mã chủ yếu của đuôi CTD in vivo. Sự mất khả năng đi vào quá trình chế biến của những đoạn phiên mã tạo ra bởi RNA pol I và III được cho là do sự mất đuôi CTD ở những enzyme này. Việc gắn mũ chụp có hai chức năng chủ yếu: (1) ngăn chặn sự phân hủy mRNA trước khi trưởng thành, do đó làm tăng tính ổn định của mRNA; (2) đóng góp vào quá trình khởi sự dịch mã – một quá trình phụ thuộc vào mũ chụp. Ngoài ra, những phát hiện gần đây chỉ ra rằng mũ chụp cũng đóng một vai trò chủ yếu trong việc ức chế dịch mã điều hòa bởi miRNA (microRNA-mediated translational silencing). 17
3.3.2. Gắn đuôi poly(A) [1] Sự biến đổi ở đầu 3' của tiền-mRNA liên quan đến sự phân cắt bởi một endonuclease để có được một nhóm 3'-hydroxyl tự do – vị trí gắn một chuỗi các adenylic acid bởi enzyme poly(A) polymerase. Kết quả tạo ra một đuôi poly(A) khoảng 100-250 base đối với động vật có xương. Poly(A) polymerase là một phần của phức hợp các protein có thể định vị và phân cắt một đoạn phiên mã tại vị trí đặc hiệu và sau đó thêm vào các adenyl theo một quá trình mà không cần có mạch khuôn. 3.3.3. Cắt nối (splicing) [1] Bước cuối cùng trong quá trình biến đổi của nhiều loại mRNA ở eukaryote đó là cắt nối RNA (RNA splicing): quá trình cắt bỏ những đoạn intron bên trong đoạn phiên mã và tiếp sau đó là quá trình nối lại các đoạn exon mã hóa. Hình 10: Tổng quan quá trình chế biến RNA tạo RNA trưởng thành ở eukaryote Gene β-globin chứa ba exon mã hóa protein (vùng mã hóa, màu đỏ) và hai intron không mã hóa xen kẽ (màu xanh). Những đoạn intron làm đứt quãng trình tự mã hóa protein giữa các codon cho amino acid 31 và 32, 105 và 106. Sự phiên mã các gene mã hóa protein ở eukaryote bắt đầu trước trình tự mã hóa cho amino acid đầu tiên và kéo dài qua khỏi trình tự mã hóa cho amino acid cuối cùng, kết quả tạo ra những vùng không mã hóa (màu xám) ở cuối đoạn phiên mã sơ cấp (tiền-mRNA). Những vùng không được dịch mã (UTR) này được giữ lại trong suốt quá trình trên. Đầu 5’ được gắn thêm mũ chụp (m7Gppp) trong suốt quá trình hình thành đoạn phiên mã RNA. Đoạn phiên mã này kéo dài qua khỏi vùng poly(A) (poly(A) site). Sau quá trình cắt tại vùng poly(A) và quá trình thêm vào một chuỗi A tại đầu 3’, quá trình cắt nối (splicing) tháo bỏ các đoạn intron và nối các đoạn exon lại với nhau tạo thành phân tử mRNA β-globin trưởng thành gồm 147 codon mã hóa cho amino acid. 18
Những phân tử mRNA chức năng tạo thành bởi quá trình biến đổi trên vẫn còn giữ các vùng không mã hóa hay những vùng không được dịch mã (UTR) 5' và 3'. Ở mRNA động vật có vú, 5'-UTR có thể dài khoảng một trăm nucleotide hoặc hơn, và 3'-UTR có thể dài đến một vài kilobase. mRNA ở prokaryote thường cũng có 5'- UTR và 3'-UTR, nhưng chúng ngắn hơn nhiều so với mRNA eukaryote, thường ít hơn khoảng 10 nucleotide. 3.4. Cắt nối luân phiên (Alternative splicing) [1] Việc cắt nối RNA theo những cách khác nhau – cắt nối luân phiên – làm tăng số lượng protein biểu hiện từ một gene đơn lẻ. Như đã nói ở trên, ngược lại với các gene ở vi khuẩn và vi khuẩn cổ, đa số các gene ở eukaryote đa bào bậc cao đều chứa rất nhiều intron. Như chúng ta đã biết, nhiều protein ở eukaryote bậc cao có một cấu trúc bậc bốn gồm nhiều domain khác nhau. Những domain lặp lại của một protein thường được mã hóa bởi một exon hoặc một số lượng nhỏ các exon mã hóa những trình tư amino acid giống nhau hoặc gần như giống nhau. Những đoạn exon lặp lại như vậy được cho là đã tiến hóa từ sự sao bản ngẫu nhiên một đoạn DNA nằm giữa hai vùng trong những đoạn intron gần kề, kết quả là sự chèn vào một chuỗi các đoạn exon lặp lại được tách nhau bởi những intron. Sự hiện diện của các đoạn intron khác nhau ở nhiều gene eukaryote cho phép biểu hiện các protein khác nhau có liên quan đến nhau từ một gene duy nhất bằng cách cắt nối theo nhiều kiểu khác nhau – cắt nối luân phiên. Ở những eukaryote bậc cao, việc cắt nối luân phiên là một cơ chế quan trọng trong việc sản xuất nhiều dạng khác nhau của một protein ở nhiều dạng tế bào khác nhau. Ví dụ như fibronectin, một protein kết dính ngoại bào gồm nhiều domain được tìm thấy ở động vật có vú. Gene fibronectin chứa rất nhiều exon, được nhóm vào một vài vùng tương ứng với các domain đặc trưng của protein. Những nguyên bào sợi sản xuất các mRNA fibronectin có chứa các exon EIIIA và EIIIB; những exon này mã hóa cho những trình tự amino acid gắn chặt vào những protein trên màng tế bào của nguyên bào sợi. Do đó, dạng fibronectin này gắn nguyên bào sợi vào chất nền ngoại bào. Việc cắt nối luân phiên đoạn phiên mã sơ cấp fibronectin ở tế bào gan tạo ra mRNA thiếu các exon EIIIA và EIIIB. Kết quả là fibronectin được tiết vào máu bởi tế bào gan sẽ không gắn chặt vào nguyên bào sợi hay hầu hết tất cả các dạng tế bào khác, cho phép chúng lưu hành trong dòng máu. Tuy nhiên trong quá trình hình thành cục máu đông, những domain gắn fibrin của fibronectin từ tế bào gan gắn vào fibrin, một trong những thành phần cốt yếu của cục máu đông. Fibronectin sau khi gắn vào sẽ tương tác với các integrin trên màng của các tiểu cầu hoạt hóa trôi ngang qua, từ đó mở rộng cục máu đông bằng cách gắn thêm tiểu cầu vào. 19
Hình 11: Sự cắt nối (splicing) tiền-mRNA fibronectin ở nguyên bào sợi và tế bào gan Gene fibronectin (trên cùng) kích thước ≈ 75 kb bao gồm nhiều exon. Các đoạn exon EIIIB và EIIIA (màu xanh lá) mã hóa cho các domain gắn kết những protein đặc hiệu trên bề mặt nguyên bào sợi. mRNA fibronectin được sản xuất trong nguyên bào sợi có chứa các exon EIIIA và EIIIB, trong khi ở tế bào gan, những exon này bị loại bỏ khỏi mRNA fibronectin. (Các đoạn intron trong sơ đồ không được vẽ theo tỉ lệ, trên thực tế hầu hết chúng đều dài hơn nhiều so với các đoạn exon.) Có hơn 20 dạng fibronectin khác nhau đã được xác định, mỗi loại được mã hóa từ một mRNA khác nhau, được cắt nối khác nhau và chứa sự kết hợp đặc trưng các đoạn exon của gene fibronectin. Gần đây, việc giải trình tự lượng lớn các mRNA được tách từ các mô khác nhau và so sách các trình tự của chúng với DNA bộ gene biểu thị rằng gần 60% các gene người là được biểu hiện thông qua sự cắt nối luân phiên mRNA. Rõ ràng là, sự cắt nối luân phiên RNA giúp mở rộng số lượng các protein được mã hóa từ bộ gen ở những sinh vật đa bào bậc cao. 3.5. Quá trình dịch mã tổng hợp protein [1] Mặc dù DNA chứa thông tin cho sự tổng hợp protein và mRNA truyền đạt những thông tin mã hóa từ DNA, hầu hết các hoạt động sinh học đều được tiến hành bởi những protein. Như chúng ta đã biết, trình tự các amino acid trên mỗi protein quyết định cấu trúc ba chiều và hoạt động của nó. Vì lý do này, việc kết hợp các amino acid theo đúng thứ tự như được mã hóa từ DNA mang tính quyết định đối với sự hình thành các protein có chức năng và do đó quan trọng trong hoạt động bình thường của tế bào sinh vật. 3.5.1. Các loại RNA tham gia dịch mã Dịch mã là toàn bộ quá trình mà các trình tự nucleotide của một mRNA được sử dụng để chỉ dẫn và kết hợp các amino acid vào trong một chuỗi polypeptide. Ở tế bào eukaryote, sự tổng hợp protein xảy ra trong tế bào chất, nơi có ba dạng phân tử RNA phối hợp cùng thực hiện quá trình dịch mã: 1. RNA thông tin (mRNA) mang thông tin di truyền được phiên mã từ DNA theo dạng một chuỗi các bộ trình tự gồm 3 nucleotide, gọi là codon, mỗi codon định rõ một amino acid riêng biệt. 2. RNA vận chuyển (tRNA) là chìa khóa cho việc giải mã các codon trên mRNA. Mỗi loại amino acid được gắn vào một loại tRNA riêng biệt và được vận chuyển vào đầu đang tổng hợp của chuỗi polypeptide. tRNA thích hợp với amino 20
acid gắn vào nó được chọn lọc ở mỗi bước bởi vì mỗi phân tử tRNA riêng biệt đều chứa một trình tự gồm ba nucleotide, gọi là anticodon, mà có thể bắt cặp với codon bổ sung của nó trên mRNA. 3. RNA ribosome (rRNA) kết hợp với một nhóm các protein hình thành nên ribosome – những cấu trúc phức tạp chạy dọc theo phân tử mRNA, xúc tác cho sự gắn kết các amino acid vào chuỗi polypeptide. Chúng cũng gắn tRNA và nhiều protein phụ khác cần thiết cho sự tổng hợp protein. Ribosome bao gồm một tiểu phần lớn và một tiểu phần nhỏ và mỗi cái đều chứa phân tử rRNA của riêng nó. 3.5.2. Các bước tổng hợp protein Tương tự như quá trình phiên mã, quá trình dịch mã có thể chia thành ba giai đoạn – khởi sự, kéo dài và kết thúc dịch mã. Cơ chế dịch mã về cơ bản đều giống nhau ở tất cả các dạng tế bào prokaryote và eukaryote. Dưới đây là quá trình dịch mã ở các tế bào eukaryote. Codon AUG (Methionine) đóng vai trò là codon khởi sự ở đa số các mRNA. Sự khởi đầu dịch mã để bắt đầu tổng hợp protein ở codon khởi đầu đóng vai trò chủ chốt để từ đó thiết lập nên khung đọc chính xác cho cả phân tử mRNA. Cả prokaryote lẫn eukaryote đều có hai tRNA methionine khác nhau: tRNAiMet khởi sự tổng hợp protein và tRNAMet gắn Methionine trên chuỗi protein đang tổng hợp. Cả hai tRNA này đều được gắn methionine bởi cùng một enzyme aminoacyl-tRNA synthetase (MetRS). Nhưng chỉ có Met-tRNAiMet (methionine hoạt hóa đã gắn vào tRNAiMet) là có thể gắn vào vị trí thích hợp trên tiểu phần nhỏ của ribosome, vị trí P, để bắt đầu tổng hợp chuỗi polypeptide. Còn Met-tRNAMet bình thường và tất cả các tRNA đã gắn amino acid khác đều chỉ gắn vào vị trí A của ribosome. 3.5.2.1. Khởi sự dịch mã Khởi sự dịch mã thường xảy ra ở gần AUG ở gần phía đầu 5' nhất của mRNA. Trong suốt giai đoạn đầu của dịch mã, ribosome tập hợp một mRNA và một tRNA khởi sự đã được hoạt hóa và được định vị chính xác tại codon khởi đầu. Các tiểu phần lớn và nhỏ của ribosome chưa tham gia vào dịch mã được giữ tách rời nhau bằng cách gắn vài hai nhân tố khởi sự eIF3 và eIF6 (ở eukaryote) (hình 12). Phức hợp tiền khởi sự dịch mã (preinitiation complex) hình thành khi phức hợp eIF3-tiểu phần 40S được gắn bởi eIF1A và một phức hợp bậc ba của Met-tRNAiMet, eIF2 và GTP (Hình 13-bước 1). Tế bào có thể điều hòa sự tổng hợp protein bằng cách phosphoryl hóa một serine trên eIF2 gắn vào GDP; phức hợp được phosphoryl hóa không có khả năng trao đổi GDP bằng GTP và không thể gắn vào Met-tRNAiMet, do đó ức chế sự tổng hợp protein. 21
Hình 12: Các tiểu phần ribosome trước dịch mã Khi một ribosome phân tách ra vào cuối quá trình dịch mã, các tiểu phần 40S và 60S liên kết với các nhân tố khởi sự eIF3 và eIF6 tạo nên những phức hợp khởi sự cho một quá trình dịch mã mới. Trong suốt quá trình khởi sự, đầu mũ chụp 5' của một mRNA được gắn bởi tiểu phần eIF4E của phức hợp gắn mũ chụp eIF4. Phức hợp mRNA-eIF4 sau đó tách khỏi phức hợp tiền khởi sự thông qua một tương tác của tiểu phần eIF4G và eIF3, tạo nên phức hợp khởi sự dịch mã (bước 2). Phức hợp khởi sự sau đó sẽ trượt dọc theo mRNA trong khi hoạt tính helicase của eIF4A sử dụng năng lượng từ sự thủy phân ATP để tháo gỡ cấu trúc bậc hai của RNA. Phức hợp dừng lại khi tRNAiMet anticodon nhận biết được codon khởi đầu – AUG đầu tiên phía hạ nguồn (bước 3). Sự nhận biết codon khởi đầu dẫn đến sự thủy phân GTP liên kết với eIF2, đây là một quá trình không đảo ngược nhằm ngăn chặn sự trượt xa hơn nữa của phức hợp khởi sự. Việc lựa chọn AUG khởi sự thuận tiện hơn nhờ các nucleotide đặc biệt xung quanh nó gọi là trình tự Kozak (được xác định bởi Marilyn Kozak): (5') ACCAUGG (3'). Adenyl đứng trước AUG (gạch dưới) và Guanine ngay sau nó là hai nucleotide quan trọng nhất, ảnh hưởng đến hiệu quả của sự khởi đầu dịch mã. Khi tiểu phần nhỏ của ribosome cùng với Met-tRNAiMet được định vị tại codon khởi đầu, sự kết hợp với tiểu phần lớn 60S của ribosome hoàn tất hình thành nên ribosome 80S. Quá trình này cần có hoạt động của một nhân tố khác – eIF5 và sự thủy phân một GTP liên kết với nó (bước 4). Việc kết nối những phản ứng gắn kết vào sự thủy phân GTP làm cho nó trở thành một quá trình không đảo ngược, từ đó các tiểu phần của ribosome không tách rời nhau cho đến khi toàn bộ mRNA được dịch mã và sự tổng hợp protein kết thúc. Sau quá trình này là quá trình kéo dài phiên mã: chuỗi polypeptide đang dài ra vẫn gắn vào tRNA tại vị trí P trên ribosome. Ở eukaryote, ribosome – bộ máy tổng hợp protein – bắt đầu dịch mã trong vòng khoảng 100 nucleotide của đầu mũ chụp 5' của hầu như toàn bộ mRNA của tế bào. Tuy nhiên, một vài mRNA của tế bào có chứa một vị trí tiếp nhận ribosome bên trong (IRES) nằm ở vị trí xa hơn phía hạ nguồn. Ngoài ra, ở một vài mRNA virus thiếu mũ chụp 5', sự dịch mã được khởi đầu tại vị trí IRES bởi bộ máy dịch mã của tế bào chủ eukaryote bị nhiễm. 22
Hình 13: Khởi sự phiên mã ở eukaryote Bước 1 và 2: Các thành phần khác gắn vào phức hợp tiểu phần 40S-eIF3 hình thành phức hợp khởi sự dịch mã. Bước 3: Phức hợp khởi sự trượt dọc mRNA và đặt tiểu phần nhỏ cùng với Met-tRNAiMet vào vị trí codon khởi đầu. Bước 4: Tiểu phần lớn 60S gắn vào hình thành ribosome 80S sẵn sàng cho dịch mã. Hai nhân tố khởi sự, eIF2 (bước 1) và eIF5 (bước 4) là những protein gắn GTP, và GTP này được thủy phân trong suốt quá trình khởi sự. [Hình sửa lại từ R. Mendez và J. D. Richter, 2001, Nature Rev. Mol. Cell Biol. 2 :521.] 3.5.2.2. Kéo dài dịch mã Phức hợp 80S ribosome – Met-tRNAiMet nằm đúng vị trí bây giờ đã sẵn sàng cho sự thêm vào các aminoacid. Giống như trường hợp khởi sự, sự kéo dài chuỗi cũng cần một nhóm các protein đặc biệt gọi là các nhân tố kéo dài (EF). Những 23
bước chủ yếu trong quá trình kéo dài bao gồm sự đi vào của aminoacyl-tRNA, sự hình thành liên kết peptide và sự chuyển động của ribosome theo từng codon một dọc theo mRNA. Sau khi quá trình khởi sự hoàn thành, Met-tRNAiMet được gắn vào vị trí P trên 80S ribosome. Vị trí này của ribosome được gọi là vị trí P bởi vì đây là vị trí tRNA gắn với chuỗi polypeptide đang dài ra. Aminoacyl-tRNA thứ hai ở dạng phức hợp bậc ba liên kết với EF1α∙GTP được đưa vào trong ribosome và gắn vào vị trí A - nơi gắn vào của tRNA đã được aminoacyl hóa (bước 1). Nếu anticodon của aminoacyl-tRNA kế tiếp (thứ hai) bắt cặp chính xác với codon thứ hai trên mRNA, GTP trong phức hợp EF1α∙GTP bị thủy phân. Sự thủy phân GTP xúc tiến thay đổi hình dạng của ribosome, dẫn đến việc gắn chặt của aminoacyl-tRNA vào vị trí A và giải phóng phức hợp EF1α∙GDP (bước 2). Sự thay đổi hình dạng này còn đặt đầu 3' đã được aminoacyl hóa của tRNA ở vị trí A gần với đầu 3' của Met-tRNAiMet ở vị trí P. Sự thủy phân GTP và sự gắn chặt sau đó sẽ không xảy ra nếu anticodon trên aminoacyl-tRNA kế tiếp không bắt cặp được với codon tại vị trí A. Trong trường hợp này, phức hợp bậc ba sẽ rời khỏi, để lại vị trí A trống có thể kết hợp với những phức hợp aminoacyl-tRNA–EF1α∙GTP khác cho đến khi có một tRNA thích hợp bắt cặp bổ sung gắn vào. Hiện tượng này đóng góp vào tính trung thực, chính xác của việc gắn aminoacyl-tRNA vào vị trí A. Với Met-tRNAiMet khởi đầu ở vị trí P và aminoacyl-tRNA thứ hai gắn chặt vào vị trí A, nhóm α-animo của amino acid thứ hai phản ứng với methionie đã được hoạt hóa (liên kết ester) trên tRNA khởi đầu, tạo thành một liên kết peptide. Phản ứng peptidyltransferase được xúc tác bởi rRNA lớn, giúp định hướng những phân tử tương tác một cách chính xác. Tiếp theo sự tổng hợp liên kết peptide, ribosome được dịch chuyển dọc theo mRNA một khoảng cách bằng một codon. Sự dịch chuyển này được xúc tiến bởi sự thủy phân của GTP trong phức hợp EF2∙GTP. Sự dịch chuyển này làm cho tRNAiMet, bây giờ đã không còn methionine nữa, được chuyển vào vị trí E (Exit) trên ribosome; đồng thời, tRNA thứ hai, bây giờ đã được gắn cộng hóa trị vào một dipeptide (một peptidyl-tRNA), được dịch chuyển vào vị trí P (bước 4). Từ đó sự dịch chuyển trả hình dạng ribosome về một trạng thái mà vị trí A được mở và có khả năng tiếp nhận một tRNA đã được aminoacyl hóa khác tạo phức hợp với EF1α∙GTP, bắt đầu một chu trình kéo dài chuỗi khác. Sự lặp lại của chu trình kéo dài thêm các amino acid từng cái một vào đầu C của polypeptide đang kéo dài như được chỉ dẫn từ trình tự mRNA cho đến khi gặp codon kết thúc. Ở những chu trình tiếp theo, sự thay đổi hình dạng xảy ra ở bước hai đẩy tRNA không được acyl hóa ra khỏi vị trí E. Trong lúc chuỗi polypeptide trở nên dài hơn, nó len lỏi qua một rãnh ở tiểu phần lớn của ribosome và rời khỏi ở một vị trí đối diện với vị trí tương tác với tiểu phần nhỏ. 24
Hình 14: Chu trình kéo dài chuỗi peptidyl trong quá trình dịch mã ở eukaryote Khi ribosome 80S kết hợp với Met-tRNAiMet ở vị trí P của ribosome, một phức hợp bậc ba mang amino acid thứ 2 (aa2) gắn vào vị trí A (bước 1). Sự thủy phân GTP trong phức hợp EF1α∙GTP gây ra sự thay đổi hình dạng của ribosome (bước 2). Sau đó rRNA lớn xúc tác sự hình thành liên kết peptide giữa Meti và aa2 (bước 3). Sự thủy phân GTP trong phức hợp EF2∙GTP gây ra một biến đổi hình dạng khác của ribosome, dẫn đến sự dịch chuyển một codon dọc theo mRNA và chuyển tRNAiMet không còn acyl hóa vào vị trí E và tRNA với đoạn peptide vào vị trí P (bước 4). Chu trình có thể bắt đầu lại với việc gắn một phức hợp bậc ba mang aa3 vào vị trí A đang được mở. Trong chu trình thứ hai và những chu trình tiếp theo, tRNA tại vị trí E bị đẩy ra trong bước thứ 2 do sự biến đổi hình dạng gây ra bởi sự thủy phân GTP trong phức hợp EF1α∙GTP. [Hình sửa lại từ K. H. Nierhaus và cs, 2000, trong R. A. Gerrett và cs, eds., The Ribosome: Structure, Function, Antibiotivà cs, and Cellular Interactions, ASM Press, p. 319.] 25
3.5.2.3. Kết thúc dịch mã Giai đoạn cuối cùng của quá trình dịch mã cũng cần những tín hiệu phân tử có tính đặc hiệu cao, quyết định số phận của phức hợp mRNA-ribosome-tRNA- peptidyl. Có hai dạng nhân tố giải phóng (RF) đặc hiệu đã được phát hiện. Ở eukaryote, eRF1 (có hình dạng tương tự tRNA) có vẻ hoạt động bằng cách gắn vào vị trí A của ribosome và nhận biết codon kết thúc một cách trực tiếp. Giống như một vài nhân tố khởi sự và kéo dài đã đề cập ở trên, nhân tố giải phóng thứ hai ở eukaryote, eRF3, là một protein gắn GTP. Phức hợp eRF3∙GTP hoạt động phối hợp với eRF1 để xúc tiến sự phân cắt peptidyl-tRNA, từ đó giải phóng chuỗi protein vừa hoàn thành. Ở vi khuẩn có hai nhân tố giải phóng (RF1 và RF2) cũng có chức năng tương tự như eRF1 và một nhân tố gắn GTP (RF3) tương tự như eRF3. Hình 15: Sự kết thúc dịch mã ở eukaryote Khi một ribosome mang một chuỗi protein mới được tổng hợp đi đến codon kết thúc (UAA, UGA, UAG), nhân tố giải phóng eRF1 đi vào phức hợp ribosome, có thể là tại vị trí A hoặc gần đó cùng với phức hợp eRF3∙GTP. Đi kèm với sự thủy phân GTP là sự phân cắt chuỗi peptide khỏi tRNA tại vị trí P và sự giải phóng các tRNA cùng với hai tiểu phần của ribosome. Sau khi giải phóng khỏi ribosome, protein mới được tổng hợp sẽ gấp cuộn thành hình dạng không gian ba chiều nhờ những protein gọi là chaperone. Những nhân tố giải phóng khác sau đó sẽ xúc tiến sự tách ra của ribosome, giải phóng các tiểu phần, mRNA và tRNA kết thúc. Từ đó lại bắt đầu một vòng dịch mã mới. 3.5.3. Polysome và sự tái sử dụng ribosome Quá trình dịch mã của một phân tử mRNA ở eukaryote để có được một protein có kích cỡ trung bình cần khoảng 30-60 giây. Có hai hiện tượng làm tăng đáng kể 26
tốc độ tổng hợp protein của tế bào: quá trình dịch mã đồng thời một phân tử mRNA bởi nhiều ribosome và việc tái sử dụng nhanh chóng các tiểu phần ribosome sau khi chúng rời khỏi từ đầu 3' của mRNA. Sự dịch mã đồng thời một mRNA bởi nhiều ribosome có thể thấy rõ trên hình hiển vi điện tử và bằng phân tích lắng tụ (sedimentation analysis) cho thấy mRNA gắn vào những ribosome mang những chuỗi polypeptide đang được tổng hợp. Những cấu trúc này được gọi là polyribosome hay polysome, có hình vòng tròn trên hình hiển vi điện tử ở một vài loại mô. Những nghiên cứu sau đó trên tế bào nấm men đã giải thích hình dạng vòng tròn của polyribosome và gợi ý cách thức tái sử dụng ribosome một cách hiệu quả. Hình 16: Mô hình vòng polysome và sự tái sử dụng các tiểu phần ribosome Có thể có rất nhiều các ribosome cùng lúc dịch mã cho một phân tử mRNA của eukaryote. Vòng tròn polysome được ổn định bằng tương tác giữa các protein gắn tại hai đầu 3' và 5'. Khi một ribosome hoàn thành sự dịch mã và tách rời khỏi đầu 3', các tiểu phần tách riêng đó có thể nhanh chóng tìm thấy vùng mũ chụp 5' gần đó và khởi đầu một quá trình tổng hợp protein khác. Những nghiên cứu này cho thấy rằng những bản sao của một protein được tìm thấy ở tất cả các tế bào eukaryote, protein gắn poly(A) (PABPI), có thể tương tác với cả đuôi poly(A) của mRNA lẫn tiểu phần 4G của eIF4 ở nấm men. Hơn nữa, tiểu phần 4E của eIF4 ở nấm men gắn vào đầu 5' của một mRNA. Những tương tác này làm cho hai đầu của một phân tử mRNA có thể được gắn kết bởi những protein can thiệp, tạo nên vòng tròn mRNA. Bởi vì hai đầu của một polysome tương đối gần với nhau nên những tiểu phần ribosome vừa mới rời khỏi đầu 3' được định vị gần đầu 5', làm cho sự tái khởi đầu xảy ra bởi tương tác giữa tiểu phần 40S với eIF4 gắn vào mũ chụp 5'. Con đường xoay vòng này xảy ra ở nhiều tế bào eukaryote và giúp tăng cường sự tái sử dụng ribosome và từ đó làm tăng hiệu quả tổng hợp protein của tế bào. 3.6. Sự định vị và biến đổi sau dịch mã của protein Số phận ban đầu của một protein được quyết định bởi những trình tự peptide ngắn trên mỗi chuỗi polypeptide. Đoạn peptide tín hiệu này dài khoảng 20-30 27
amino acid, gắn vào những phần tử nhận biết tín hiệu. Những phần tử này sẽ gắn vào một thụ thể bên trong mạng lưới nội chất. Điều này làm cho đoạn peptide có thể đi vào bên trong lumen của mạng lưới nội chất cùng với chuỗi polypeptide vừa mới dịch mã. Đoạn peptide tín hiệu này sau đó sẽ bị cắt bỏ khỏi chuỗi bởi enzyme peptidase. Những protein được định trù vào trong những bào quan trong tế bào như lysosome và peroxisome cần có sự biến đổi bằng cách thêm vào những trình tự mục tiêu và được vận chuyễn vào những thụ thể tín hiệu mục tiêu. Sự thêm vào những trình tự mục tiêu để xúc tiên sự định vị là một ví dụ về sự biến đổi của chuỗi polypeptide vừa mới tổng hợp, một quá trình được gọi là biến đổi sau dịch mã. Những ví dụ khác bao gồm sự hình thành các liên kết disulphide, sự phân cắt các polypeptide vận chuyển, hydroxyl hóa và phosphoryl hóa. Sự hình thành các liên kết disulphide đóng vai trò quan trọng cho sự gấp cuộn và hình thành cấu trúc không gian ba chiều của protein. Ví dụ như, đột biến trên FGFR3 gây ra sự hình thành thêm các liên kết disulphide giữa những thụ thể bên cạnh dẫn đến tình trạng gây tử vong gọi là chứng loạn sản thanatophoric. Sự thất bại trong việc phân cắt đoạn peptide vận chuyển trong procollagen để hình thành nên collagen trưởng thành gây ra một tình trạng cử động quá mức ở khớp nối gọi là hội chứng Ehlers-Danlos typr VII. Sự hydroxyl hóa lysine và proline cần thiết cho sự hình thành hydroxylysine và hydroxyproline. Sự vắng mặt của enzyme lysine hydroxylase gây ra một hội chứng khác gọi là hội chứng Ehler-Danlos type VI, một tình trạng liên quan đến thị giác yếu. Cuối cùng, sự phosphoryl hóa là một sự kiện chủ yếu trong qua trình truyền tín hiệu ở tất cả các tế bào. 3.7. Sự điều hòa biểu hiện gene Như chúng ta đã biết, cấu trúc và chức năng của mỗi loại tế bào đều được quyết định bởi các protein mà nó chứa, vì vậy việc điều hòa sự biểu hiện của gene là một lĩnh vực quan trọng trong sinh học phân tử tế bào. Thông thường, việc quyết định khởi sự phiên mã của một gene mã hóa cho một protein nào đó là một cơ chế chủ yếu trong việc điều khiển sự sản xuất của protein đó trong tế bào. Bằng cách điều khiển sự khởi sự phiên mã, một tế bào có thể điều hòa những protein nào mà nó sản xuất và tốc độ sản xuất của nó. Khi sự phiên mã của một gene bị ức chế, mRNA tương ứng cùng với protein mà nó mã hóa được tổng hợp với một tốc độ thấp. Ngược lại, khi sự phiên mã của một gene được kích hoạt, cả mRNA và protein mã hóa được sản xuất rất nhanh. Ở hầu hết các vi khuẩn và các sinh vật đơn bào, sự biểu hiện gene được điều hòa chủ yếu để điều chỉnh bộ máy enzyme và những thành phần cấu trúc của tế bào để thích nghi với sự thay đổi của môi trường. Như vậy, ở một thời điểm nào đó, một tế bào vi khuẩn thường chỉ tổng hợp những protein mà nó cần cho sự tồn tại dưới những điều kiện nhất định. Ngoài ra, ở những sinh vật prokaryote này quá trình phiên mã và dịch mã hầu như xảy ra cùng lúc nên sự điều hòa biểu hiện gene chỉ chủ yếu ở giai đoạn khởi sự phiên mã. 28
Ở những sinh vật đa bào, sự biểu hiện gene phần lớn được hướng vào sự đảm bảo đúng những gene cần biểu hiện ở một loại tế bào nhất định vào đúng thời điểm trong quá trình phát triển phôi, biệt hóa mô cũng như trong những giai đoạn phát triển, điều kiện sinh lý khác nhau. Do đặc tính cấu tạo của tế bào và sinh vật eukaryote và sự tách biệt về không gian và thời gian giữa hai quá trình phiên mã và dịch mã, sự điều hòa biểu hiện gene ở eukaryote có thể xảy ra ở nhiều cấp độ hơn so với prokaryote: điều hòa ở cấp độ nhiễm sắc chất và cấu trúc của bộ gene; điều hòa ở cấp độ khởi đầu phiên mã; điều hòa ở cấp độ kéo dài phiên mã, ổn định mRNA và cắt nối luân phiên (alternative splicing); điều hòa dịch mã; và điều hòa sau dịch mã. Tuy nhiên, tựu chung lại, cấp độ điều hòa biểu hiện gene chủ yếu của eukaryote cũng giống như các tế bào prokaryote đó là cấp độ khởi đầu phiên mã. 4. CƠ SỞ CỦA DI TRUYỀN 4.1. Vật liệu di truyền Trước đây dù đã xác nhận được sự tồn tại của gen trên nhiễm sắc thể - hợp thành từ protein và DNA, tuy nhiên người ta vẫn chưa biết đến cái gì trong hai chất đó đóng vai trò trong sự di truyền. Năm1928, Frederick Griffith tìm ra hiện tượng biến nạp: những vi khuẩn đã chết có thể chuyển vật liệu di truyền của chúng để làm biến đổi những vi khuẩn còn sống khác. Năm 1944, Oswald Theodore Avery, Colin McLeod và Maclyn McCarty trực tiếp xác định DNA là phân tử đảm nhận biến nạp. Tuy nhiên, đến tận năm 1952, thí nghiệm của Hershey-Chase mới cho thấy DNA (chứ không phải protein) là vật liệu di truyền của virus xâm nhiễm vi khuẩn, cung cấp thêm bằng chứng chứng tỏ DNA là phân tử đảm nhận chức năng di truyền. Những đại phân tử DNA này chứa những thông tin quyết định trình tự amino acid, cấu trúc và chức năng của tất cả những protein trong một tế bào, hay nói cách khác chúng chứa thông tin cần thiết để xây dựng nên tế bào và mô của một sinh vật. Sự sao chép lại những thông tin này một cách chính xác ở tất cả các loài đảm bảo tính kế tục di truyền từ đời này sang đời khác và đóng vai trò then chốt cho sự phát triển bình thường của một cá thể. 4.2. Sự sao chép DNA – cơ sở phân tử của di truyền James D. Watson và Francis Crick cho ra đời mô hình cấu trúc DNA năm 1953, sử dụng công trình tinh thể học tia X của Rosalind Franklin, chứng tỏ rằng DNA có cấu trúc xoắn kép[30][31]. Sự bắt cặp các base bên trong mô hình xoắn kép DNA của Watson và Crick gợi ý rằng mạch DNA mới được tổng hợp bằng cách sử dụng mạch sẵn có (mạch mẹ) làm khuôn để hình thành nên mạch con mới bổ sung với mạch mẹ. Như vậy có hai cơ chế được suy ra từ mô hình này: cơ chế bảo tồn và bán bảo tồn. Trong cơ chế bảo tồn, hai mạch con tạo ra một phân tử DNA mạch đôi mới với mạch đôi mẹ vẫn nguyên vẹn. Trong cơ chế bán bảo tồn, mạch mẹ được tách ra và mỗi cái tạo ra một phân tử mạch đôi với mạch con bắt cặp base với mạch mẹ. M. Meselson và W. F. Stahl đã tìm ra bằng chứng cho thấy mạch đôi DNA được sao chép theo cơ chế bán bảo tồn. 29
Như vậy, việc sao chép một mạch khuôn DNA tạo thành mạch bổ sung là một đặc điểm chung của sự sao chép DNA và phiên mã từ DNA ra RNA. Ở cả hai trường hợp, thông tin trên mạch được bảo toàn. Ở một vài virus, những phân tử RNA mạch đơn đóng vai trò là mạch khuôn cho sự tổng hợp mạch RNA bổ sung hoặc mạch DNA. 4.2.1. Đoạn mồi Giống như RNA, DNA được tổng hợp từ những đơn phân deoxynucleoside 5- triphosphate (dNTP). Và cũng giống như sự tổng hợp RNA, sự tổng hợp DNA luôn diễn ra theo chiều từ 5' 3' vì mạch được phát triển từ sự hình thành một liên kết phosphoester giữa 3' oxygen của mạch đang dài ra và α phosphate của một dNTP. Như đã đề cập ở phần trên, RNA polymerase có thể tìm kiếm vị trí bắt đầu phiên mã thích hợp trên mạch đôi DNA và khởi sự tổng hợp một phân tử RNA bổ sung với mạch DNA. Ngược lại, DNA polymerse không thể khởi sự tổng hợp chuỗi ngay từ đầu mà thay vào đó, chúng cần có một mạch RNA hoặc DNA ngắn, gọi là đoạn mồi primer, để bắt đầu sự phát triển của chuỗi. Với một mồi bắt cặp với mạc khuôn, DNA polymerase gắn các deoxynucleotide vào nhóm hydroxyl tự đo ở đầu 3' của đoạn mồi theo sự chỉ định bởi trình tự trên mạch khuôn. Khi đoạn mồi là RNA, mạch con được tạo thành là RNA ở đầu 5' và là DNA ở đầu 3'. 4.2.2. Sự tháo gỡ mạch đôi và chĩa ba sao chép Để mạch đôi DNA có chức năng như là mạch khuôn trong suốt sự sao chép, hai mạch xoắn quấn vào nhau phải được tháo gỡ để các base có thể bắt cặp được với các base của dNTP. Sự tháo gỡ này của mạch DNA mẹ được tiến hành nhờ enzyme helicase, bắt đầu tại những đoạn đặc biệt trên DNA gọi là điểm bắt đầu sao chép (replication origin). Trình tự của những điểm này khác nhau rất lớn ở những sinh vật khác nhau mặc dù chúng thường chứa A, T. Khi các enzyme helicase đã tháo gỡ mạch DNA ở điểm bắt đầu, một loại RNA polymerase đặc biệt gọi primase đến để tạo nên đoạn mồi RNA ngắn bổ sung với mạch khuôn đã tháo gỡ. Đoạn mồi trong lúc vẫn bắt cặp với mạch DNA, nó được kéo dài bởi một DNA polymerase, từ đó tạo nên mạch con mới. 30
Hình 17: Sơ đồ tổng hợp DNA ở mạch tới và mạch chậm tại chĩa ba sao chép Các nucleotide được thêm vào bởi DNA polymerase ở mỗi mạch con theo chiều từ 5' 3'. Mạch tới được tổng hợp liên tục từ một đoạn mồi RNA (màu đỏ) ở đầu 5'. Mạch chậm được tổng hợp không liên tục từ nhiều đoạn mồi RNA được tạo ra một cách gián đoạn mỗi khi một vùng mới của mạch đôi được tách ra. Sự kéo dài những đoạn mồi ban đầu tạo ra những đoạn Okazaki. Khi mỗi đoạn này được kéo dài gần đến đoạn trước nó, đoạn mồi sẽ bị tháo gỡ và những đoạn này được nối lại với nhau. Quá trình này lặp đi lặp lại cho đến khi tổng hợp được toàn bộ mạch chậm. Vùng DNA mà tại đó tất cả những protein tập hợp lại để tiến hành sao chép tổng hợp mạch con được gọi là chĩa ba sao chép. Khi sự sao chép diễn ra, chĩa ba sao chép và những protein liên quan rời khỏi điểm bắt đầu. Như đã biết, việc tách mạch mạch đôi DNA tạo nên một áp lực xoắn lên những đoạn xoắn kép lân cận. Áp lực này được giải phóng bởi enzyme topoisomerase I. Để cho DNA polymerase có thể chạy dọc theo và sao chép DNA, helicase phải liên tục tách mạch và topoisomerse phải tháo bỏ siêu xoắn được tạo thành từ đó. Một vấn đề phức tạp trong hoạt động của chĩa ba sao chép DNA nảy sinh từ hai tính chất: hai mạch của DNA mẹ là đối song song, và DNA polymerase (cũng giống như RNA polymerase) có thể gắn các nucleotidr vào mạch mới chỉ theo chiều 5' 3'. Sự tổng hợp của một mạch con gọi là mạch tới, có thể tiến hành một cách liên tục từ một đoạn mồi RNA theo hướng 5' 3', cùng hướng di chuyển của chĩa ba sao chép. Vấn đề đến từ việc tổng hợp mạch con khác, gọi là mạch chậm. Bởi vì sự phát triển của mạch chậm cần phải xảy ra theo hướng 5' 3' nên việc sao chép mạch khuôn của nó cần phải xảy ra theo hướng ngược lại với chiều di chuyển của chĩa ba sao chép. Một tế bào hoàn thành việc này bằng cách tổng hợp một đoạn mồi mới dài khoảng vài trăm base trên mạch mẹ thứ hai. Mỗi đoạn primer này bắt cặp vào mạch khuôn của chúng và được kéo dài theo hướng 5' 3', tạo nên những đoạn không liên tục gọi là đoạn Okazaki (đặt tên theo người phát hiện ra chúng Reiji Okazaki). Đoạn mồi RNA của mỗi đoạn Okazaki được tháo bỏ và thay 31
thế bằng sự phát triển của những đoạn Okazaki kế bên; cuối cùng một enzyme gọi là DNA ligase gắn những đoạn gần nhau cho ra một mạch con hoàn chỉnh. 4.2.3. Helicase, primase, DNA polymerase và các protein tham gia vào sao chép Những nghiên cứu trên DNA virus, đặc biệt là DNA SV40, bộ gen vòng của một virus gây nhiễm ở khỉ đã giúp các nhà khoa học hiểu chi tiết hơn về những protein ở eukaryote tham gia vào sự sao chép DNA. Hình dưới đây minh họa nhiều loại protein phối hợp vào việc sao chép SV40 DNA tại chĩa ba sao chép. Những phức hợp nhiều thành phần khác nhau này cho phép tế bào thực hiện một chuỗi các sự kiện để hoàn thành được chức năng cần thiết của tế bào. Trong bộ máy phân tử sao chép SV40 DNA, một hexamer của một protein virus gọi là T-antigen có nhiệm vụ tách mạch đôi tại chĩa ba. Tất cả những protein khác liên quan đến sự sao chép SV40 DNA được cung cấp bởi tế bào chủ. Những đoạn mồi cho mạch con DNA ở mạch tới và mạch sau được tổng hợp bởi một phức hợp primase, và DNA polymerase α (Pol α), cái mà có nhiệm vụ kéo dài đoạn mồi RNA với deoxynucleotide, tạo nên đoạn mồi hỗn hợp RNA-DNA. Đoạn mồi được kéo dài thành mạch con DNA bởi DNA polymerase (Pol). Pol ít có khả năng sai sót hơn so với Pol α, nó tạo một phức hợp với Rfc (nhân tố sao chép C) và PCNA (kháng nguyên nhân tăng sinh tế bào), cái mà thay thế phức hợp primase-Pol α sau sự tổng hợp mồi. Sau khi DNA mẹ được tách thành những mạch khuôn đơn tại chĩa bao sao chép, nó được gắn bởi nhiều bản sao của RPA (protein sao chép A). Việc gắn vào của RPA duy trì mạch khuôn ở một hình dạng không thay đổi tối ưu cho sự sao chép bởi DNA polymerase. Những protein RPA gắn vào sẽ bị đẩy ra khỏi mạch mẹ bởi Pol α và Pol khi chúng tổng hợp những mạch bắt cặp bổ sung với những mạch mẹ. Ngoài ra ở eukaryote còn có những protein khác tham gia vào sao chép DNA. Enzyme topoisomerase kết hợp với mạch DNA mẹ ở phía trước helicase để giải bớt áp lực xoắn gây ra bởi sự tách mạch ở mạch mẹ. Ribonuclease H và FEN I tháo gỡ ribonucleotide tại đầu 5' của những đoạn Okazaki; những ribonucleotide này sẽ được thay thế bằng deoxynucleotide được thêm vào bởi DNA pol khi nó kéo dài đoạn Okazaki ở phía thượng nguồn. Những đoạn Okazaki liên tiếp được gắn vào nhau bởi DNA ligase qua những liên kết 5' 3' thông thường. 32
Hình 18: Mô hình chĩa ba sao chép SV40 DNA và những protein liên quan Hexamer của T-antigen lớn (1) là một protein của virus có chức năng như một helicase giúp tách mạch DNA. Những vùng mạch đợn của mạch khuôn được tách ra bởi T- antigen này được gắn bởi những bản sao của protein RPA (2). Mạch tới được tổng hợp bởi phức hợp DNA polymerase δ (Pol δ), PCNA và Rfc (3). Những đoạn mồi cho sự tổng hợp mạch chậm (màu đỏ, RNA; màu xanh, DNA) thì được tổng hợp bởi một phức hợp gồm DNA polymerase α (Pol α) và primase (4). Đầu 3' của mỗi đoạn mồi được tổng hợp bởi Pol α-primase sau đó sẽ được gắn bởi phức hợp PCNA-Rfc-Pol. Phức hợp này tiếp tục tổng hợp kéo dài đoạn mồi (5). [Sơ đồ được sửa lại từ S. J. Flint và cs, 2000, Virology: Molecular Biology, Pathogenesis, and Control, ASM Press.] 4.2.4. Sự sao chép hai chiều Theo lý thuyết, sự sao chép DNA từ một điểm bắt đầu có thể cho ra một chĩa ba sao chép di chuyển theo một chiều. Nhưng thật ra sự sao chép DNA thường xảy ra theo hai chiều: có thể có hai chĩa ba sao chép ở cùng một điểm bắt đầu và chúng di chuyển theo hai thướng ngược nhau. Việc sao chép hai chiều này đã được chứng minh bởi một vài thí nghiệm. Tế bào prokaryote và eukaryote đều sử dụng cơ chế sao chép hai chiều này. Trong trường hợp SV40 DNA, sự sao chép được khởi sự bằng việc gắn hai helicase T-antigen vào một điểm khởi đầu duy nhất và việc tập hợp những protein khác tạo nên hai chĩa ba sao chép. Hai chĩa ba này sau đó di chuyển theo hai hướng ngược nhau từ điểm khởi đầu với sự tổng hợp mạch tới lẫn mạch chậm xảy ra ở cả hai chĩa ba. Không giống như SV40 DNA, những phân tử DNA nhiễm sắc thể ở eukaryote chứa nhiều điểm bắt đầu khác nhau cách nhau khoảng vài chục cho đến vài trăm kilobase. Phức hợp nhận diện điểm bắt đầu là một protein gồm 6 tiểu đơn vị gọi là 33
ORC gán vào mỗi điểm và liên kết với những protein khác cần cho việc lắp những helicase gồm 6 protein MCM. Hai helicase MCM ngược nhau tách hai mạch mẹ ở điểm khởi đầu với những protein RPA gắn vào mạch đơn DNA đã tách ra. Sự tổng hợp các đoạn mồi và những bước tiếp theo trong sao chép DNA được cho là giống với sự sao chép của SV40 DNA. Hình 19: Hình hiển vi điện tử thể hiện sự sao chép hai chiều ở SV40 DNA [Xem G. C. Fareed và cs, 1972, J. Virol. 10:484; photographs courtesy of N. P. Salzman.] Sự sao chép DNA tế bào và những sự kiện khác dẫn đến sự tăng sinh của tế bào được điều hóa rất chặt chẽ để chỉ sản xuất ra đúng số lượng tế bào thích hợp cấu thành nên mỗi mô trong suốt quá trình phát triển và sinh sống của một sinh vật. Cũng như sự phiên mã của hầu hết các gene, việc điều khiển ở bước khởi sự cũng là cơ chế chủ yếu trong việc điều hòa sao chép DNA. Sự hoạt hóa helicase MCM cần cho việc khởi sự sao chép được điều hòa bởi những protein kinase đặc biệt gọi là kinase phase S phụ thuộc cyclin (S-phase cyclin-dependent kinase). Những kinase phụ thuộc cyclin khác điều hòa những quá trình khác của sự tăng sinh tế bào, bao gồm quá trình nguyên phân phức tạp mà nhờ đó một tế bào eukaryote phân chia thành hai tế bào con có bộ nhiễm sắc thể giống hệt tế bào mẹ. 5. KẾT LUẬN – TRIỂN VỌNG TƯƠNG LAI Trình tự bộ gene người là mỏ vàng cho những khám phá mới về sinh học phân tử tế bào, những protein mới - nền tảng của các liệu pháp chữa bệnh hiệu quả - và thậm chí còn cho những khám phá liên quan đến lịch sử sơ khai và tiến hóa của loài 34
người chúng ta. Tuy nhiên, vì chỉ có khoảng 1.5% trình tự là mã hóa cho protein nên việc tìm kiếm những gene mới giống như là mò kim trong đống cỏ khô vậy. Khác với bộ gene vi khuẩn do rất ít intron nên việc xác định các gene tương đối dễ dàng. Chỉ đơn giản tìm kiếm những đoạn khung đọc mở dài có thể giúp ta xác định hầu hết các gene. Ngược lại, việc tìm kiếm các gene ở người thì cực kỳ phức tạp do hầu hết gene đều bao gồm rất nhiều những đoạn exon ngắn xen kẽ bởi những đoạn intron không mã hóa dài hơn rất nhiều. Cho đến nay người ta chỉ xác định được khoảng phân nửa các gene ở người. Và việc xác định các đơn vị phiên mã phức chỉ bằng cách khảo sát trình tự DNA lại còn mang tính thử thách hơn nữa. Những tiến bộ trong phương pháp sinh tin học để xác định gene và mô tả đặc tính những bản sao cDNA của những mRNA tách từ hàng trăm loại tế bào ở người có lẽ sẽ đưa đến việc khám phá ra những protein mới và sự hiểu biết về những quá trình sinh học, ứng dụng của chúng trong y học và nông nghiệp. Mặt khác, hiểu biết của chúng ta về những quá trình cơ bản của tế bào (sao chép DNA, phiên mã và dịch mã) có lẽ sẽ không thay đổi nhiều trong tương lai vì chúng đã được đặt trên một nền tảng của vô số những bằng chứng từ những kết quả thí nghiệm. Tuy nhiên, độ sâu hiểu biết của chúng ta sẽ tiếp tục tăng lên khi ngày càng có nhiều khám phá chi tiết hơn về cấu trúc và tương tác giữa các bộ máy đại phân tử liên quan. Sự xác định cấu trúc không gian của RNA polymerase, các tiểu phần của ribosome và những protein trong sự sao chép DNA đã cho phép các nhà nghiên cứu thiết kế được những phương pháp thử nghiệm sâu sát hơn nhằm khám phá cách hoạt động của những đại phân tử này. Và sự hiểu biết chi tiết hơn có thể sẽ cho phép thiết kế và tạo ra nhiều loại thuốc mới hiệu quả hơn trong chữa trị bệnh ở người. Ví dụ như, cấu trúc có độ phân giải cao của ribosome giúp chúng ta thấu hiểu hơn cơ chế kháng sinh ức chế sự tổng hợp protein của vi khuẩn mà không làm ảnh hưởng đến chức năng ribosome của vật chủ. Phát hiện mới này có thể cho phép chúng ta tạo ra những kháng sinh hiệu quả hơn. Tương tự, sự hiểu biết chi tiết về những cơ chế điều hòa phiên mã những gene ở người có thể đưa đến những chiến lược điều trị có thể làm giảm những phản ứng miễn dịch không thích đáng dẫn đến các bệnh như đa xơ cứng (multiple sclerosis) và viêm khớp; làm giảm sự phân chia tế bào không thích đáng trong ung thư; và những quá trình bệnh học khác. TÀI LIỆU THAM KHẢO [1] Harvey Lodish, Arnold Berk và cs (2003), Molecular Cell Biology 5th Edition, Chapter 4: Basic molecular genetic mechanism, pp. 101-145. [2] ] Harvey Lodish, Arnold Berk và cs (2003), Molecular Cell Biology 5th Edition, Chapter 10: Molecular structure of genes and chromosomes, pp. 405-445. [3] Supratim Choudhuri and David B. Carlson (2008), Genomivà cs: Fundamentals and Application, Chapter 1: Fundamentals of Structure-Function Analysis of Eukaryoteic Protein-Coding Genes, pp. 3-48, New York. 35
Chương 2 TỔNG QUAN VỀ MICROARRAY Giới thiệu chung DNA microarray analysis lần đầu tiên được mô tả vào giữa thập kỷ 1990 và chúng được xem như là một phương tiện hữu ích cho việc khảo sát sự biểu hiện đồng thời của hàng ngàn gen và đã nhanh chóng trở thành một phương tiện hữu dụng cho việc nghiên cứu một loạt các quá trình sinh học. Hầu hết tất cả nghiên cứu đều được thiết kế với một mục đích đơn giản là nhằm so sánh hai họ sinh học để tìm hiểu sự khác nhau trong việc biểu hiện gen của chúng, các gen này có chức năng liên quan đến một loạt các quá trình sinh học như là sự phát triển của các tế bào ung thư, các nguyên nhân dẫn đến bệnh hen suyễn, bệnh về tim, sự rối loạn về thần kinh, hay là phân tích các yếu tố liên quan đến sự vô sinh. Một lượng thông tin có giá trị trong việc điều hòa nghĩa là hiện nay chúng đã có thể kiểm tra sự biểu hiện của một lượng lớn thông tin liên quan đến gen cũng như là RNA. Các nghiên cứu này về mặt nguyên tắc phải đòi hỏi sử dụng các công nghệ kỹ thuật cho phép đồng thời phát hiện nhiều gen cùng một lúc với một khoảng thời gian ngắn nằm trong giới hạn cho phép. Do đó, trong chương này chúng tôi đề cập đến các phương pháp phương tích sự biểu hiện của mRNA với một tần số cao. Chúng tôi chia chương này thành ba phần. Phần một đề cập đến khả năng liên kết của DNA với chính bản thân nó; phần thứ hai đề cập đến vấn đề sử dụng phương pháp PCR (polymerase chain reaction) để khuếch đại một lượng lớn các cDNA. Và cuối cùng phần còn lại liên quan đến kỹ thuật dựa trên việc DNA sequencing để tiến hành định lượng các gen đã được gắn các dấu hiệu đánh dấu. Mỗi phương pháp kể trên đều có những ưu điểm riên của nó, tuy nhiên vẫn còn rất nhiều hạn chế trong việc phân tích một lượng lớn thông tin biểu hiện của các gen. Trong khi đó, phân tích sự biểu hiện các gen dựa trên phương pháp sử dụng DNA microarray là một công cụ hữu ích trong việc phân tích một lượng lớn các gen. Tuy nhiên, nhược điểm duy nhất của nó là phải biết được trình tự các đoạn DNA được gắn trên phiến DNA microarray. Hơn nữa, đây là một kỹ thuật rất tốn kém và xảy ra một vài vấn đề liên quan việc kiểm soát chất lượng và ít nhạy cảm. Khác với việc sử dụng RT-PCR một phương pháp không tốn kém, tuy nhiên có một ưu thế trong việc xác định mức độ biểu hiện gen của các gen chưa biết. Các phương pháp dựa trên gen sequencing như phương pháp Massively parallel signature sequencing (MPSS®) và serial analysis of gene expression (SAGE) cũng liên quan đến việc phân tích sự điều hòa các gen chưa biết nhưng các kỹ thuật này khá tốn kém và đòi hỏi phải có một mức độ cơ sở hạ tầng nào đó cho phép sử dụng các kỹ thuật để đạt được những kết quả tốt. Chúng tôi mong rằng việc trình bày theo sự phân bổ này có thể giúp cho người đọc có thể quyết định được phương pháp sử dụng nào tốt nhất cho các thí nghiệm của mình. 36
1. Giới thiệu DNA Microarrays Rất nhiều phương pháp sinh học phân tử và hóa sinh đều là những công cụ hỗ trợ cho việc sử dụng phương pháp microarray. Ví dụng như Biochip có một kích thước nhỏ hơn khá nhiều so với một chiếc tem thư nhưng lại cho phép đo lường sự biểu hiện đồng thời của hàng ngàn gen. Biochip không chỉ thích hợp cho việc phân tích sự biểu hiện gen và cho việc sắp xếp các mà còn được ứng dụng cho việc chuẩn bị và phân tích mẫu. Hiện nay, đã có rất nhiều nỗ lực hướng tới việc phát triển các hệ thống các “lab-on-chip” tích hợp và tự động . Trong một tương lai không xa, các hệ thống như thế này sẽ trở thành một công cụ hữu ích trong việc chẩn đoán liên quan đến các gen và một vài các lĩnh vực khác trong các nghiên cứu liên quan đến gen, và trở thành một công cụ phân tích chính xác và giảm được chi phí tiêu tốn. Bên cạnh ứng dụng trong lĩnh vực microtechnology, một trong những lĩnh vực quan trọng gần đây là ứng dụng trong lĩnh vực nanotechnology, sự phát triển của công cụ thang đo nanometer (10-9 met). Việc thu nhỏ của mức độ này cung cấp khá nhiều lợi ích khác nhau bao gồm việc giảm thiểu chi phí các sản phẩm, tăng tính tự động, tính mềm dẻo của phương pháp. Lĩnh vực ứng dụng biochip trong việc thiết kế nucleic array thích hợp cho việc ứng dụng nanotechnology. Mục tiêu của chương này nhằm tổng kết lại các quá trình chính trong việc thiết kế các microarrays hay “DNA chips” như một công cụ phân tích biểu hiện như một tần số cao và trong tương lai sẽ ngày càng phát triển hành một công cụ hữu ích. Thông tin các gen được mã hóa từ bộ genome người được đánh giá khoảng từ 30,000 đến 40,000 gen, tổng cộng các đoạn có thể lên tới mười phần trăm tổng số 3,2 tỷ nucleotide ((Lander và cs, 2001; Venter và cs, 2001; Zhuo và cs, 2001). Tuy nhiên, trong thời điểm ghi nhận, Chỉ duy nhất một phần mười số lượng các gen được biết rõ về cấu trúc chức năng của các protein và enzyme mà chúng mã hóa. Hầu như các chuỗi nucleic acids đã được xác định trên nhiễm sắc thể, những thông tin biểu hiện gen trong cơ sở dữ liệu vần còn gặp nhiều hạn chế. Do đó, hầu như cấu trúc, chức năng protein mà các chuỗi trình tự mã hóa protein (ESTs) vẫn chưa được biết đến. Một tiêu điểm của các nghiên cứu liên quan đến y dược và hóa sinh là tạo ra lượng thông tin về gen để giải thích cơ chế đồng hóa của tế bào, và đã trở thành một trong những cơ hội thách thức và đầy tiềm năng phát triển, nhưng ứng dụng này khá thú vị và nhiệm vụ này đã tốn mất khá nhiều thời gian trong vài thập kỷ qua. Những quá trình này tiến hành càng nhanh bởi việc ứng dụng DNA microarray trong việc phân tích sự biểu hiện của gen. 2. Lịch sử phát minh DNA microarray. Đầu tiên có thể kể đến các mô tả đầu tiên về cấu trúc DNA của Watson & Crick (1953), cho thấy có thể tách DNA thành hai mạch đơn (biến tính) khi xử lý nhiệt hoặc dung dịch kiềm. Năm 1961, Marmur & Doty mô tả quá trình ngược lại, hồi tính, cơ sở của tất cả các phương pháp PCR và lai phân tử. Các nghiên cứu này gợi 37
ra cách phân tích axit nucleotide dựa trên mối liên hệ trình tự giữa chúng và các phương pháp lai phân tử phát triển nhanh chóng. Vào cuối những năm 1960, Pardue, Gall; Jones và Roberson tìm ra phương pháp lai in situ (sau này kết hợp với mẫu dò đánh dấu huỳnh quang gọi là FISH). Phương pháp cố định các nhiễm sắc thể và nhân trên phiến kính, sao cho DNA tạo thành mạch kép với mẫu dò, ngày nay được sử dụng để đặt DNA lên phiến kính trong phương pháp microarray. Vào thời gian này, hoá học hữu cơ cũng phát triển, cho phép tổng hợp tự động các mẫu dò oligonucleotide vào năm 1979. Kỹ thuật phân tích sử dụng phương pháp gắn đồng thời nhiều trình tự đích lên một màng lọc theo thứ tự, phương pháp thấm điểm (dot blot), được Kafatos và cs (1979) đưa ra. Trong kỹ thuật này, các trình tự đích được cố định trên giá thể và lai với mẫu dò (thường là trình tự axit nucleic đã đánh dấu). Saiki và cs (1989) đưa ra một cách khác, dot blot ngược, trong đó gắn nhiều mẫu dò theo thứ tự trên màng và đích để phân tích được đánh dấu. Cùng thời gian này, các array đầu tiên với giá thể không thấm nước được tạo ra trong phòng thí nghiệm của Maskos (1991). Đầu những năm 1990, kỹ thuật đánh dấu phát huỳnh quang đa màu được Ried và cs; Balding & Ward giới thiệu để phân tích nhiều loại mẫu dò với phương pháp FISH. Hiện nay, phương pháp này được sử dụng để phân tích so sánh mRNA từ những nguồn khác nhau. Vào năm 1993, array chứa các oligonucleotide ngắn, dưới 19 nucleotide được tổng hợp in situ. Năm 1994, Hoheisel và cs tăng mật độ chấm (spot) bằng cách dùng robot để lấy và đặt mẫu dò lên giá thể giúp tăng tốc độ quá trình, giảm sai sót chắc chắn mắc phải khi thực hiện những thủ tục có tính lặp lại cao bằng tay, và tăng tính chính xác vị trí. Tất cả các thí nghiệm tiên phong ở trên là cơ sở của kỹ thuật array hiện nay. Kỹ thuật này phát triển đến mức chỉ vài năm nữa có thể so sánh nó với kỹ thuật PCR không thể thiếu trong sinh học hiện nay. 3. Nguyên tắc hoạt động của DNA microarray như thế nào? 3.1. Cấu trúc và chức năng của DNA microarray DNA microarray function sử dụng các phương pháp, kỹ thuật lai phân tử cơ bản được phát triển bởi Edward Southern và sử dụng khá thường xuyên kỹ thuật Sothern và Northern Blots.(Alwine và cs, 1977; Brown, 1993; Brown &Mackey, 1997; Dyson, 1991; Southern, 1975). Điểm chủ yếu của phương pháp này là việc lai chuyên biệt giữa chuỗi DNA đơn với nhau dựa trên nguyên lý kết hợp các base của Watson-Crick. Tính chuyên biệt kết hợp này có thể bị giảm trong những điều kiện cụ thể làm giảm khả năng kết hợp ngăn cản quá trình lai giữa trong như các điểm mismatch ở một vị trí riêng lẻ trên một chuỗi của phân tử DNA. DNA microarrays, các chuỗi nucleic acid đã biết chuỗi trình tự được cố định trên phiến mẫu. Mẫu nucleic acid kiểm định được tiến hành đánh dấu và tiến hành lai với các chuỗi nucleic acid đã cố định trên mẫu. Dưới những điều kiện thích hợp, 38
sự bắt cặp Watson-crick được thực hiện giữa các chuỗi acid có trình tự kết hợp được với nhau. Hơn nữa, trong một số điều kiện tốt, cường độ phát hiện các tín hiệu được đo trực tiếp tỷ lệ lượng mẫu dò bắt cặp, do đó, một lượng các mẫu acid nucleic hiện diện trong mẫu được đo. Trong kỹ thuật DNA array, người ta cố định các axit nucleic có trình tự xác định (mẫu dò) trên giá thể (mảng) thích hợp theo thứ tự. Axit nucleic cần nghiên cứu (đích) được đánh dấu sau đó lai với mẫu dò trên mảng. Ở những điều kiện lý tưởng, các axit nucleic có trình tự bổ sung bắt cặp chính xác với nhau. Hơn nữa dưới các điều kiện này, cường độ phát hiện tín hiệu tỷ lệ trực tiếp với lượng mẫu dò nên có thể định lượng các loại axit nucleic trong mẫu ban đầu. Đường kính chấm (mỗi chấm đại diện cho một loại mẫu dò) trên macroarray thường ≥ 300 µm và có thể được hiện hình bằng kỹ thuật gel thông thường hoặc máy quét dùng trong những kỹ thuật blot trước đây. Ngược lại, các chấm trên microarray thường có đường kính 200 µm và cần thiết bị hiện ảnh đặc biệt như máy quét laser tiêu điểm (confocal laser scanner). Các phương pháp mới đây có thể tạo ra đường kính chấm 100 µm và nếu dùng phương pháp in quang hoạt (photolitho- graphy) để tổng hợp mẫu dò oligonucleotide in situ thì có thể tạo ra chấm có đường kính 20 µm. 3.2. Microarray mật độ thấp Các microarray mật độ thấp được thương mại hóa rộng rãi bởi các nhà cung cấp hay được sản xuất bởi các nhóm nghiên cứu trong các phòng thí nghiệm trên thế giới. Nucleic acid được lai trên màng nylon hay là phiến kính. Trong một vài trường hợp, các nucleic acid được tiến hành lai chéo với nhau với màng nylon bằng cách sử dụng tia cực tím. Plasmids và các sản phẩm của phản ứng PCR (các spot) với màng lai hay các phiến kính ở một mật độ thấp với 80 - 200 spot cho mỗi cm2 và 500 - 10000 spot cho mỗi cm2 trong trường hợp microarray với mật độ trung bình (Schena & Davis, 1999). Các phương pháp để phát hiện và đánh dấu phụ thuộc vào vật liệu mà các mẫu nucleic acid được tiến hành lai. Các mẫu được đánh dấu phóng xạ được tiến hành trên màng nylon array và xác định bằng phương pháp phóng xạ trên phim Xray. Còn trong trường hợp các mẫu đánh dấu huỳnh quang sẽ được tiến hành trên kính và được phân tích bằng đầu đọc đo huỳnh quang. Các microarray thương mại được sử dụng một cách rộng rãi và kỹ thuật này được miêu tả chi tiết trong các phần sau của quyển sách này. 3.3. Microarray mật độ cao Microarray với hơn 10,000 mẫu dò trong mỗi centimet vuông đã được thiết lập. Ngày nay, khả năng sản xuất DNA microarray với hơn 250,000 mẫu dò trên mỗi centimet vuông (Schena và Davies, 1999). Các microarray mật độ cao được gọi là các DNA chip. Chất nền được sử dụng cho việc cố định các mẫu dò trong microarray mật độ cao, trong một vài trường hợp phiến kính được biến đổi hóa học hay là sử dụng hợp chất silicon. Ngân hàng các acid nucleic trong chip có thể bao 39
gồm các oligonucleotide có thể lên tới 25 đến 60 base trong chiều dài, hay là các đoạn PCR hay trong một trường hợp là các plasmid với lượng các base từ 500 và 5,000. Hai ứng dụng của các microarray mật độ cao là định lượng sự biểu hiện các gen và phân tích các chuỗi trình tự acid nucleivà cs Các mẫu và vị trí của các nucleic acids trên microarray có thể được chọn lựa tùy theo ứng dụng của nó. 3.4. Sử dụng DNA microarray phân tích sự biểu hiện của gen Để phân tích sự biểu hiện của gen, các nucleic acids mà kết hợp tương thích với các mRNA để định lượng được thể hiện trên bề mặt các array. Nói chung, nó không hữu ích trong trường hợp lai trực tiếp mRNS từ các mô phẩm cần khảo sát, cũng như hệ thống phát hiện không hiệu quả trong các trường hợp mà các acid nucleic chưa được tiến hành đánh dấu. Do vậy, các mRNA thông thường được chuyển đổi thành cDNA nhờ phản ứng reverse transcriptase. Bên cạnh đó, bởi hiệu quả chuyển đổi thành cDNA không cao và lượng nguyên liệu mRNA ban đầu lại không đủ lượng lớn để tiến hành (ví dụ như là các mRNA của các mẫu bệnh phẩm sinh thiết, hay là các mẫu phẩm máu), lượng các cDNA thu nhận được sẽ tiến hành khuếch đại chúng. Tuy nhiên, việc này khá quan trọng và trong việc lựa chọn một phương pháp sao cho có thể tránh khỏi tỷ lệ các mẫu acid nucleic bị thay đổi. Trong trường hợp này, hai kỹ thuật được sử dụng một cách rộng rãi là phương pháp PCR với số chu kỳ thấp hay là việc phiên mã in vitro. Trong trường hợp phiên mã in vitro, một promotor cho RNA polymerase được gắn chèn vào chuỗi cDNA thông qua quá trình chuyển đổi reverse transcriptase từ mẫu mRNA của mẫu bệnh phẩm hay mẫu thí nghiệm. Sau đó, cDNA được tiến hành khuếch đại bởi một yếu tố bởi RNA polymerase. Thông suốt quá trình phiên mã in vitro, các phân tử RNA thông thường đều được tiến hành đánh dấu huỳnh quang. Tuy nhiên, nếu lượng RNA không bị hạn chế trong thí nghiệm, các cDNA đã được đánh dấu có thể được sử dụng trực tiếp cho phép lai phân tử trên phiến microarray. Một vài các quy trình biến đổi cho việc khuếch đại của các mẫu RNA hay là cho việc làm gia tăng cường độ tín hiệu biểu hiện đã được miêu tả (Ivashuta và cs, 2002; Karsten và cs, 2002; Mahadevappa & Warrington,1999; Nallur và cs, 2001; Pabón và cs, 2001; Phillips & Eberwine, 1996; Stears và cs, 2000; Wang và cs, 2000a; Zhumabayeva và cs, 2001). Hai quy trình biểu hiện thông thường mà có giá trị trong việc đánh giá sự biểu hiện các gen và trong việc đánh giá sự khác nhau trong sự biểu hiện của gen giữa các mẫu (hình 4.1A và 4.1B). Trong quy trình đầu tiên, các nucleic acid đã được đánh dấu thu nhận từ hai nguồn mẫu khác nhau để so sánh được tiến hành lai trên hai phiến array khác biệt nhau. Trong trường hợp để tiêu chuẩn hóa các cường độ tín hiệu của các tín hiệu gen riêng lẻ thì các phương pháp tiêu chuẩn hóa và phương pháp phân tích thống kê được sử dụng một cách rộng rãi để giải quyết. Thông thường các gen giữ nhà có một tỷ lệ biểu hiện ổn định có thể ứng dụng làm tiêu chuẩn (đối với các trường hợp liên quan đến các vấn đề của việc sử dụng các gen 40
giữ nhà, xem lại chương 1). Thay vào đó, giá trị cường độ tín hiệu của sự biểu hiện được đánh giá và sử dụng cho việc tiêu chuẩn hóa tín hiệu sau này. Một vài các phương pháp đã được phát triển cho việc tiêu chuẩn hóa, định chuẩn dụng cụ, tính phương sai, định lượng, và phân tích thông kê. (Alter và cs, 2000; Baldi & Long, 2001; Beissbarth và cs, 2000; Brazma và cs, 2001; Brown và cs, 2001; Chudin và cs, 2002; Claverie, 1999; Draghici và cs, 2001; Eickhoff và cs, 1999; Herwig và cs, 2001; Hill và cs, 2001; Ideker và cs, 2000; Kadota và cs, 2001; Kerr & Churchill, 2001; Kerr và cs, 2000; Lee và cs, 2000; Li & Wong, 2001; Long và cs, 2001; Manduchi và cs, 2000; Mutch và cs, 2001; Naef và cs, 2002; Newton và cs, 2001; Quackenbush, 2001; Rifkin và cs, 2000; Rocke & Durbin, 2001; Schadt và cs, 2000 and 2001; Schuchhardt và cs, 2000; Thomas và cs, 2001; Troyanskaya và cs, 2001; Tseng và cs, 2001; Tsodikov và cs, 2002; Tusher et al; 2001; Wang và cs, 2001a; Yang và cs, 2001 and 2002; Yuen và cs, 2002; Zhang & Zhao, 2000; Zien và cs, 2001). Quy trình thứ hai cho việc so sánh sự biểu hiện các gen liên đòi hỏi thiết lập trên một phiến array cho cả hai mẫu thí nghiệm. Trong trường hợp này, cả hai mẫu được đánh dấu bởi các chất khác nhau, thông thường là hai chất huỳnh quang khác nhau, ví dụ như chất Cy3 (IUPAC name of the water-soluble cyanine dye: 2- [(1E,3E)-5-(1-{6-[2,5-dioxo-1-pyrrolidinyl)oxy]-6-oxohexyl}-3,3-dimethyl-5-sulfo- 1,3-hihydro-2H-indol-2-ylidene)-1,3-propadienyl]-1-ethyl-3,3-dimethyl-3H- indolium-5-sulphonate) với bước sóng hấp thụ là 552 nanomet và bước sóng phản xạ là 568 nm, và chất huỳnh quang thứ hai là Cy5 (IUPAC name of the water- soluble cyanine dye: 2-[(1E,3E)-5-(1-{6-[2,5-dioxo-1-pyrrolidinyl)oxy]-6- oxohexyl}-3,3-dimethyl-5-sulfo-1,3-dihydro-2H-indol-2-ylidene)-1,3-pentadienyl]- 1-ethyl-3,3-dimethyl-3H-indolium-5-sulphonate) với bước sóng hấp thụ là 650 nanomet và bước sóng phản xạ là 667 nm. Quá trình lai trên microarray được tiến hành với một tỷ lệ các mẫu acid nucleic đã được đánh dấu với tỷ lệ 1:1. Các gen với các mức độ biểu hiện được xác định bởi các màu khác nhau, trong khi đó các gen được biểu hiện với một tỷ lệ khác nhau với sự biểu hiện của chất huỳnh quang này khác mạnh hơn so với chất huỳnh quang còn lại. Quy trình được miêu tả trên được thực hiện thông dụng nhất cho các microarray bao gồm các sản phẩm PCR hay các plasmid, quá trình tiến hành đơn giản là một lợi thế của phương pháp này. Tuy nhiên, tính không đồng nhất của động học phép lai trong hỗn hợp chứa một sự khác biệt giữa các phân tử nucleic khác nhau sẽ gây nhiều khó khăn trong việc lai, các lý do có thể gây khó khăn trong việc lai như là nhiệt độ phòng và nồng độ các muối là một vấn đề khá quan trọng đối với các phân tử. Kết quả là sự không đặc hiệu hoặc lai không hoàn toàn có thể xảy ra dẫn đến kết quả không chính xác. Ngoài ra, các nucleic acid được gắn kết trong chất nền với một nồng độ tự do, có thể dẫn đến ảnh hưởng kết quả lai với các mẫu DNA. Một trong những giải pháp cho việc sử dụng các olionucleic microarray bao gồm các mẫu dò nucleic acid trong khoảng phạm vi từ 15 đến 25 bases (thông 41
thường có thể 60 bases). Công ty Affymetrix (Santa Clara,San Diego, USA) đã phát triển giải pháp ưu việt. Trong khoảng giai đoạn này, các microarray sử dụng 11 đến 25-mer oligonucleotides cho mỗi mRNA. Các oligonucleotides trên microarray bổ sung chính xác các đoạn khác nhau với vùng 3’ không mã hóa của mRNA và do đó được gọi là các oligomucleotides kết hợp hoàn hảo (hình 4.2). Từ nhiệt độ nóng chảy của việc lai các oligonucleotide trên microarray mẫu DNA có thể xác định được dựa trên các đoạn cơ bản, các đoạn oligonucleotide với các đặc điểm lai tốt nhất có thể được chọn lọc dựa trên các đoạn mRNA của gen mà sự biểu hiện được nghiên cứu. Do đó, ngay cả việc lai các oligonucleotide kém hay không hiệu quả, những vẫn đủ cho việc phân tích kết quả một cách chính xác. Trong mẫu đối chứng âm để có sự kết hợp bổ sung các oligonucleotide, công ty Affymetrix thiết kế microarray cũng chứa đựng các một lượng các mismatch của oligonucleotide như nhau khác biệt so với các chuỗi kết hợp hoàn hảo bởi sự hiện diện của một mismatch base trong vùng trung tâm của oligonucleotide. Lý tưởng hơn, ở đây không xảy ra hiện tượng lai dưới những điều kiện bình thường đối với các mismatch oligonucleotide do đó các tín hiệu được thu nhận từ các phép lai không chuyên biệt. Những sự khác biệt trong các cường độ tín hiệu giữa các match hoàn hảo và mismatch của các oligonucleotide cho phép đánh giá sự kết hợp không chuyên biệt. Một thuật toán được ứng dụng cho việc tính toán cường độ chính xác cho các match oligonucleotide được tiến hành so sánh với cường độ biểu hiện trong phiến array thứ hai khác với những mẫu dò khác. Sự khác cuối cuối cùng trong một lượng các lớn mRNA giữa kết quả của hai mẫu từ sự tích hợp các kết quả của việc so sánh tất cả các điểm match của oligonucleotide biểu hiện (Hình 4.3). Kỹ thuật được ứng dụng cho việc sản xuất các microarray nêu trên được miêu tả ở phần dưới. Trước một công nghệ kỹ thuật hữu ích, đọc giả cần thiết phải nhận thức được những điểm khó khăn của microarray trong việc thiết kế phân tích sự biểu hiện của gen. Hình 4.1 Hai ví dụ cho việc phân tích sử biểu hiện gen dựa trên việc sử dụng DNA microarray. Hình A. DNA microarray sử dụng hệ thống phát hiện hai màu. Hai mẫu RNA (được đánh dấu hoặc là Cy3TM hay Cy5TM) được trộn lẫn với nhau và tiến hành lai trên một phiến array chứa 6,116 RNAs của nấm mem và đối chứng. Hình ảnh được 42
cung cấp bởi TS. Patrick O. Brown (Trường Đại học Stanford, California, USA). Hình B, Human Genome U95A array (Affymetrix, Inc., Santa Clara, San Diego, UAS) được tiến hành lai với cRNA được đánh dấu bằng biotin (phát hiện sau khi tiến hành ủ hai lần với streptavidin-bound phycoerythrin) thu nhận từ dòng tế bào monocyte của người THP-1. Phiến array chứa đựng hơn 12,000 mẫu dò dùng để ứng dụng biểu hiện gen người. Hình 4.2 Phân tích biểu hiện với một cường cao bằng oligonucleotide array (Affymetrix, Inc., Santa Clara, California, USA) sử dụng hệ thống perfect match/ mismatch. Một vài vùng của mRNA được biểu hiện trên bề mặt của array như 25 mers (mẫu perfect match). Mismatch oligonucleotides khác với perfect oligonucleotide bởi các thay đổi của các base trong trung tâm của oligonucleotide. So sánh cường độ tín hiệu giữa các mẫu dò perfect match và mismatch được sử dụng có quyết định đến tính chuyên biệt của kết hợp. Vùng 1 cho thấy 1 ví dụ mà mẫu được tiến hành lai với perfect match và mismatch; vùng này được loại trừ khi tiến hành tính toán. Tương tử, vùng 3 không được đánh giá bởi vì các mẫu lai với perfect match và mismatch với một cường độ biểu hiện như nhau cho thấy không có tính chuyên biệt trong phép lai. Tất cả những vùng còn lại khác được tiến hành đánh giá cho thấy tính chuyên biệt trong phép lai phân tử và là đối tượng của phép phân tích. Hình 4.3. Chi tiết hình ảnh của oligomicroarray được lai với các mẫu cRNA chuyển đổi từ các mRNA từ việc nuôi cấy nấm mem. Các tế bào nấm mem được tiến hành nuôi trong môi trường giàu dinh dưỡng và nghèo dinh dưỡng, ở nhiệt độ 30oC. Vùng được 43