Bài giảng Sản xuất protein trong y học - TS. Trần Hoàng Dũng (Phần 1)

83 trang phuongnguyen 5750

Download

Bạn đang xem 20 trang mẫu của tài liệu "Bài giảng Sản xuất protein trong y học - TS. Trần Hoàng Dũng (Phần 1)", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên

Tài liệu đính kèm:

bai_giang_san_xuat_protein_trong_y_hoc_ts_tran_hoang_dung.pdf

Nội dung text: Bài giảng Sản xuất protein trong y học - TS. Trần Hoàng Dũng (Phần 1)

Trường Đại Học Nguyễn Tất Thành Khoa Công Nghệ Sinh Học SẢN XUẤT PROTEIN TRONG Y HỌC TS. TRẦN HOÀNG DŨNG Tháng 04/2012
Sản xuất protein trong y học Chương 1 DNA - CẤU TRÚC VÀ CHỨC NĂNG Những khái niệm chính  Các thông tin di truyền được chứa trong các axit nucleic.  DNA là một sợi đôi xoắn song song ngược chiều nhau.  Cặp base (A với T và G để C) giữ hai sợi xoắn lại với nhau.  Sự sao chép DNA xảy ra thông qua việc tháo xoắn của các sợi DNA và sao chép trên mỗi chuỗi.  Các nguyên lý trung tâm của sinh học phân tử: DNA phiên mã RNA dịch mã Protein  Phiên mã là việc sản xuất một bản sao RNA của một trong các sợi DNA.  Dịch mã là giải mã của một phân tử RNA để sản xuất protein. Mỗi sinh vật sở hữu các thông tin cần thiết để xây dựng và duy trì một bản sao sống của chính nó. Các khái niệm cơ bản về di truyền và kết quả cho thấy các gen có thể được truy hồi trở lại năm 1865 và các nghiên cứu của Gregor Mendel được thảo luận bởi Orel (1995). Từ những kết quả của thí nghiệm của ông với đậu Hà Lan, Mendel kết luận rằng mỗi cây đậu Hà Lan có hai alen cho mỗi gen nhưng chỉ hiển thị một kiểu hình đơn lẻ. Có lẽ thành tích xuất sắc nhất của Mendel là khả năng xác định đúng một hiện tượng phức tạp mà không có sẵn những kiến thức về các quá trình phân tử liên quan đến việc hình thành các hiện tượng đó. Sự di truyền qua tinh dịch và trứng được biết cùng một thời điểm và Ernst Haeckel ghi nhận tinh trùng bao gồm phần lớn các vật liệu từ nhân, mặc nhiên đã công nhận rằng nhân đóng vai trò về tính di truyền. 1.1. Acid nucleic là vật chất của di truyền Ý tưởng cho rằng vật chất di truyền là chất truyền từ cha mẹ sang con theo quy luật tự nhiên đã được thừa nhận như là các khái niệm về sự di truyền đã được kế thừa trước đây. Cả hai protein và axit nucleic được xem là chất có vai trò quan trọng trong vật chất di truyền. Cho đến những năm 1940, nhiều nhà khoa học nghiên cứu về protein. Có hai lý do chính cho việc này. Thứ nhất, protein có nhiều ở các tế bào, mặc dù số lượng của một protein riêng biệt thay đổi đáng kể từ các loại tế bào khác nhau, hàm lượng protein tổng thể của tế bào nhất chiếm trên 50% trọng lượng khô. Thứ hai, axit nucleic có thể dễ dàng để vận chuyển các thông tin phức tạp, cần thiết để truyền đạt những đặc điểm của tính di truyền. DNA (deoxyribonucleic acid) lần đầu tiên được xác lập vào năm 1869 bởi nhà hóa học Thụy Sĩ Johann Friedrich Miescher. Ông tách nhân từ tế bào chất của tế bào và sau đó nó được tách bởi một chất có tính axit từ các nhân mà ông gọi là nuclein. Miescher cho thấy nuclein có chứa một lượng lớn phosphorus và không có lưu huỳnh, đặc tính mà có thể phân biệt chúng với protein. Từ những gì đã được chứng minh cho ta có một cái nhìn tổng thể, ông cho rằng "nếu muốn giả định rằng một chất đơn lẻ. . . là nguyên nhân của sự thụ tinh thì chúng ta nên chắc chắn rằng tất cả các suy nghĩ đầu tiên là về nuclein. Năm 1926 dựa trên ý tưởng về DNA bao gồm bốn nhóm nucleotide khác nhau, bằng cách xác định các loại hình liên kết mà nó đã tham gia liên kết với các 1
Sản xuất protein trong y học nucleotide, Levene và Simms đề xuất một cấu trúc của bốn nucleotide (Hình 1.1) để giải thích trình tự sắp xếp hóa học của nucleotide trong axit nucleic (Levene và Simms, 1926). Họ tìm thấy một nucleotide đơn của bốn loại đã được lặp đi lặp lại nhiều lần để tạo thành phân tử acid nucleic dài. Bởi vì cấu trúc của bốn nucleotide là tương đối đơn giản, axit nucleic không có khả năng làm biến đổi tính chất hóa học của các vật chất di truyền. Protein có chứa 20 acid amin khác nhau. Hình 1.1. Đề xuất của Levene Simms năm 1926 về các mô hình bốn nucleotide của cấu trúc axit nucleic. Vào thời gian đó mô hình này đã được đề xuất, người ta cho rằng acid nucleic của thực vật và động vật có thể là khác nhau và sự khác biệt giữa DNA và RNA chưa hoàn toàn được hiểu rõ. Năm 1928, Frederick Griffith tiến hành thí nghiệm bằng cách sử dụng một vài chủng vi khuẩn Streptococcus pneumoniae khác nhau (Griffith 1928). Một số các dòng sử dụng được gọi là dòng độc hại, chúng gây ra viêm phổi ở cả người và chuột. Một số dòng khác thì không gây độc và không gây bệnh. Cả hai dòng này có hình thái riêng biệt trong đó các dòng gây bệnh có một lớp vỏ polysaccharide bao quanh vi khuẩn và hình dáng bên ngoài mượt mà, tạo bề mặt nhẵn khi được nuôi cấy trên các tấm thạch. Vi khuẩn không độc thì không có lớp vỏ và tạo một vùng nhám trên cùng một mẫu. Các vi khuẩn dòng nhẵn thì nguy hiểm vì các viên đường cấu tạo từ lớp vỏ sẽ loại bỏ hệ thống miễn dịch của động vật nhiễm bệnh và do đó chúng có thể nhân rộng và gây ra bệnh viêm phổi. Các vi khuẩn gặp khó khăn khi không có các viên nang polysaccharide nên sẽ không có sự bảo vệ này, do đó chúng dễ dàng xâm nhập và phá huỷ hệ thống miễn dịch của vật chủ. Griffith biết rằng chỉ có vi khuẩn độc sống sẽ tạo ra bệnh viêm phổi khi tiêm vào chuột. Nếu giết chết vi khuẩn gây độc bởi nhiệt sau đó tiêm vào chuột, kết quả cho thấy không có bệnh viêm phổi cũng giống như vi khuẩn sống không độc, không gây bệnh khi tiêm vào chuột. Thí nghiệm quan trọng của Griffith (hình 1.2) liên quan đến việc tiêm vào chuột vi khuẩn sống không độc (avirulent) kết hợp với vi khuẩn độc xử lý nhiệt. Không có loại tế bào gây ra tử vong ở chuột khi họ tiêm, nhưng tất cả những con chuột thu được kết hợp tiêm thuốc thì sẽ bị chết. Các phân tích máu của những con chuột đã chết cho thấy một số lượng lớn các vi khuẩn độc sống khi nuôi trên các tấm thạch. Griffith đã kết luận rằng nhiệt giết chết vi khuẩn nhẵn và bằng cách nào đó chúng đóng vai trò chuyển vi khuẩn nhẵn vào vi khuẩn sống. Ông gọi hiện tượng này là hiện tượng biến nạp và cho rằng nguyên tắc biến nạp có thể là do một số thành phần của viên nang hay hợp chất polysaccharide là nguyên nhân để tổng hợp nên tác nhân gây bệnh, mặc dù ông lưu ý rằng các viên đường một mình nó không gây ra bệnh viêm phổi. 2
Sản xuất protein trong y học Hình 1.2. Các tính năng chính của thí nghiệm của Griffith, kết hợp với dữ liệu của Avery, MacLeod và McCarty để xác định DNA là nguyên tắc chuyển đổi từ Streptococcus pneumoniae. Griffith lưu ý rằng tiêm vi khuẩn nhẵn sống vào chuột dẫn đến sự hình thành của bệnh viêm phổi và cuối cùng đến cái chết của chuột. Xử lý nhiệt trước khi tiêm vi khuẩn không gây ra sự hình thành của bệnh. Không độc đối với chủng vi khuẩn, mà không gây ra các bệnh riêng của chúng, có thể được chuyển đổi bằng cách tiêm kết hợp với xử lý nhiệt vi khuẩn độc hại. Avery, MacLeod và McCarty xác định DNA là nguyên tắc chuyển đổi. Như vậy tác nhân nào đó từ phế cầu khuẩn đã biến nạp và làm cho phế cầu khuẩn từ R chuyển sang S. Người ta chứng minh được rằng :DNA tách từ vi khuẩn S nếu được đưa vào vi khuẩn R thì gây nên sự biến đổi kiểu R sang S, phát hiện này khẳng định DNA là vật chất di truyền. Trong hơn 10 năm trời kể từ sau thí nghiệm của ông, Oswald Avery cùng với Macleod và McCarty đã tiến hành trở lại thí nghiệm biến nạp này nhưng dùng trong in vitro. Năm 1944, Oswald Avery, Colin MacLeod và Maclyn McCarty xuất bản tác phẩm của họ cho thấy rằng các phân tử đóng vai trò là yếu tố cơ bản chuyển đổi là DNA (Avery, MacLeod và McCarty, 1944). Họ bắt đầu bằng cách nuôi số lượng lớn tế bào Streptococcus pneumoniae nhẵn. Các tế bào được thu nhận từ các môi trường nuôi cấy và sau đó giết chết bởi nhiệt. Sau đó đồng nhất và sử dụng chất tẩy rữa, họ thu được một phần chiết được kiểm tra bằng cách tiêm vào vi khuẩn sống theo những nguyên tắc biến nạp. Protein đã được gỡ bỏ từ dịch chiết của chloroform và polysaccharides được nhiều enzyme tiêu hóa và loại bỏ. Cuối cùng, những phần kết tuả với ethanol đã tạo ra một khối lượng xơ mà vẫn giữ lại khả năng gây ra biến nạp của các tế bào vi khuẩn sù sì (avirulent). Từ 75 lít môi trường nuôi cấy của các tế bào 3
Sản xuất protein trong y học vi khuẩn, sau quá trình thu được 10-25 mg từ các yếu tố hoạt động. Những thí nghiệm được thiết lập qua một nghi ngờ rằng nguyên tắc biến nạp là DNA. Khối lượng các sợi sơ được phân tích dựa trên tỷ lệ nitơ / phốt pho, được biểu hiện trùng khớp với tỷ lệ dự kiến với DNA. Để loại bỏ tất cả các chất gây ô nhiễm có thể xảy ra từ chúng khi giải phóng, họ tiến hành xử lí với nó với enzym thủy phân protein trypsin và chyomtrypsin và sau đó họ dùng phương pháp xử lí bằng cách tiêu hóa nó với một RNA enzyme tiêu hóa ribonuclease, nó sẽ bị phá hủy bất kỳ hoạt động còn lại của protein và RNA nhưng vẫn giữ lại các hoạt tính chuyển đổi. Việc xác nhận cuối cùng DNA đã được chuyển đổi bằng cách tiêu hóa dịch chiết với deoxyribonuclease, chúng sẽ bị phá hủy hoạt động chuyển đổi. Năm 1944, O.T Avery Mc Carti đã chứng minh được rằng tác nhân biến nạp là DNA. Phế cầu khuẩn bị xử lí bằng protease hoặc RNA-aza thì hoạt tính biến nạp vẫn còn: nhưng nếu phế cầu khuẩn S bị xử lí bởi DNA-aza thì hoạt tính biến nạp không còn nữa (Cơ sở và phương pháp phân tích sinh học phân tử, T.s Chu Hoàng Mậu, trang 9). Việc thứ hai chứng minh bằng chứng rằng ADN là vật liệu di truyền đã được cung cấp bởi các nghiên cứu về sự lây nhiễm của vi khuẩn Escherichia coli bởi một trong những virus phage T2 . Thường gọi đơn giản là thể thực khuẩn, virus bao gồm một lớp vỏ protein bao quanh một lõi của DNA (xem hình 1.3). Hình 1.3. Vòng đời của thể thực khuẩn T2. Trong quá trình xâm nhiễm, vi khuẩn bám vào các bề mặt của tế bào Escherichia coli. Truyền các thông tin di truyền nhưng không phải là toàn bộ nhân thể thực khuẩn được chèn vào trong vi khuẩn, nơi nó được nhân rộng. Các thể thực khuẩn được sao chép, lớp vỏ protein vẫn còn ở bề mặt của vi khuẩn. Sau khi tổng hợp các nhân thể thực khuẩn mới được sản xuất, ly giải tế bào vi khuẩn và các nhân thể thực khuẩn được giải phóng vào môi trường xung quanh. Trong những năm 1950 chúng ta ít được biết về thể thực khuẩn lây nhiễm. Thể thực khuẩn được biết là hấp thụ vào bề mặt của vi khuẩn, sau đó có một giai đoạn tiềm 4
Sản xuất protein trong y học ẩn của chúng khoảng mười phút trước khi các virus lây nhiễm bắt đầu được thực hiện, cuối cùng dẫn đến ly giải tế bào và phóng thích thể thực khuẩn. Alfred Hershey và Martha Chase lý luận rằng nếu họ biết bản chất của các protein thể thực khuẩn và acid nucleic vào đầu của quá trình xâm nhiễm, họ sẽ hiểu hơn về bản chất của những bước đầu tiến trình. Hình 1.4. Hershey -Chase thử nghiệm cho thấy acid nucleic là vật chất di truyền. Hershey và Chase tăng bacteriophages T2 là vi khuẩn có khả năng truyền tải P32trong môi trường (để đánh dấu phốt pho của axit nucleic) hoặc S35(để đánh dấu lưu huỳnh của các protein trong các chuỗi bên của các axit amin methionine và cysteine chứa lưu huỳnh). Họ sử dụng phóng xạ đánh dấu bacteriophages của chúng để lây nhiễm một môi trường nuôi cấy mới của vi khuẩn không đánh dấu. Sau khi ủ bệnh ngắn, vi khuẩn đã được thu nhận bằng cách ly tâm và đưa vào máy khuấy để tách các vi khuẩn đi từ thể thực khuẩn gắn liền với bề mặt của nó. Họ thấy rằng, khi DNA đã được đánh dấu, các chất đánh dấu được chuyển vào các tế bào vi khuẩn, trong khi các protein đánh dấu vẫn được gắn phage thực khuẩn. Họ kết luận là vật chất di truyền -tức là các vật chất truyền cho con cái - là nucleic acid. Họ sử dụng đồng vị phóng xạ P32và S35 để thực hiện theo các thành phần phân tử của các thực khuẩn trong xâm nhiễm (Hình 1.4). Vì DNA có chứa phốt pho nhưng không chứa lưu huỳnh, P32 hiệu quả với DNA và bởi vì các protein có chứa chứa lưu huỳnh nhưng không phốt pho, S35 được đánh dấu lên protein. Nếu E. coli tế bào được nuôi cấy trong sự hiện diện của P32 hoặc S35 và sau đó bị nhiễm virus T2, các tổng hợp thực khuẩn mới sẽ có cả một lõi DNA được đánh dấu phóng xạ hoặc protein vỏ đánh 5
Sản xuất protein trong y học dấu phóng xạ tương ứng. Những thực khuẩn có đánh dấu có thể được phân lập từ môi trường nuôi cấy bị nhiễm bệnh và được sử dụng để lây nhiễm vi khuẩn khác không được đánh dấu. Hershey và Chase đánh dấu các thực khuẩn T2 với một trong hai chất phóng xạ S35 hoặc P32 và cho phép chúng hấp thu vi khuẩn không được đánh dấu. Các tế bào này sau đó được tách ra bằng cách ly tâm. Các tế bào được tạo huyền phù và việc dừng pha trộn để tách phần bên trong của thể thực khuẩn từ vi khuẩn bị nhiễm bệnh. Những phần không chứa các vật chất di truyền, mà được nhân rộng trong các vi khuẩn chủ. Hershey và Chase thấy rằng khoảng 80% của S35 đánh dấu đã được gỡ bỏ từ các vi khuẩn trong khi chỉ khoảng 20% của P32 đánh dấu đã được gỡ bỏ. Họ kết luận rằng hầu hết các DNA thể thực khuẩn xâm nhập vào tế bào và một dư lượng có ít nhất 80% protein có chứa lưu huỳnh của thể thực khuẩn vẫn còn ở bề mặt tế bào. Điều này cho thấy cùng với lúc đó Avery, MacLeod và McCarty cung cấp bằng chứng rằng DNA là phân tử có vai trò về tính di truyền học. Hershey và Chase hơi nghi nghờ về những phát hiện của họ và sau đó họ kết luận protein không có chức năng trong nhân thể thực khuẩn và DNA có một số chức năng (Hershey và Chase, 1952). 1.2 Cấu trúc của acid nucleid Như chúng ta đã thấy trong phần trên, các vật chất di truyền là DNA hay đúng hơn axit nucleic. Trong hầu hết các sinh vật, vật chất di truyền là DNA. Tuy nhiên, một số virus sử dụng RNA (ribonucleic acid) là những khối vật chất xây dựng cho hệ gen của chúng. DNA và RNA là những phân tử cao phân tử được tạo thành từ chuỗi tuyến tính của các tiểu đơn vị nucleotide. Mỗi nucleotide có ba phần: một gốc base nitơ, 5 nguyên tử carbon, đường và một nhóm phosphate (Hình 1.5). Sự kết hợp của các base và đường được gọi là một nucleoside, trong khi các base-phosphate- đường được gọi là một nucleotide. Chúng bao gồm đường 2’-deoxyribose, các nucleotide của DNA được gọi là deoxyribonucleotides, trong khi những thành phần của RNA có chứa các đường ribose được gọi là ribonucleotides. Các base của nucleotide có thể là bao gồm một vòng purine hoặc một pyrimidine . DNA và RNA được xây dựng từ hai vòng purine và hai vòng pyrimidine có chứa nucleotide. Cácvòng purin của cả DNA và RNA là như nhau bao gồm adenine (A) và guanine (G). Các vòng pyrimidine gồm cytosine (C) cũng được tìm thấy ở cả hai loại axit nucleic, trong khi pyrimidine gồm thymine (T) được giới hạn trong DNA, nó được thay thế bởi uracil (U) trong RNA. Hệ thống đánh số cho nucleotide được sử dụng rộng rãi trong các văn bản này được thể hiện trong hình 1.5. Mỗi nguyên tử carbon và nitơ trong vòng pyrimidine của cả hai và vòng purine được đánh số tương ứng 1-6 hoặc 1-9. Các nguyên tử cacbon của vòng đường hoặc là ribose hoặc deoxyribose được đánh số từ 1 đến 5. Như vậy, 2’-deoxyribose thiếu một nhóm hydroxyl thuộc carbon 2 của vòng đường.Các nucleotide riêng biệt được kết nối với nhau trong cả DNA và RNA thông qua gốc phosphate- đường kết nối từ các nhóm hydroxyl trên carbon số 3 của một nucleotide với nhóm phosphate vào carbon số 5 trên một nucleotide khác. Xem (Hình 1.6. )Hai nucleotide liên kết với nhau được gọi là một dinucleotide, ba được gọi là trinucleotide và nhiều kết nối trong một chuỗi dài được gọi là một polynucleotide. 6
Sản xuất protein trong y học Hình 1.5. Cấu trúc của các purin và pyrimidine các axit nucleic. Các base được đánh dấu bằng màu da cam và các nhóm đường được đánh dấu bằng màu xanh. Bên dưới là hệ thống đánh số được sử dụng trong văn bản này. Các nguyên tử của vòng purine được đánh số từ 1 đến 9 và các thành phần của vòng pyrimidine được đánh số từ 1 đến 6. Các nguyên tử của các đường được đánh số từ 1 đến 5. Hình 1.6. Việc liên kết của các nucleotide như adenine và guanine của một nucleotide. Các phosphate gắn với đường trên vòng của guanine được chỉ định là α, β hay γ. Trong sự hình thành của các dinucleotide, pyrophosphate (đại diện cho β và γ phosphate) là bị mất và các liên kết trong đó liên kết phosphodiester các hydroxyl 3’ 7
Sản xuất protein trong y học đến phosphate về các bon 5‘nguyên tử của đường. Các phân tử DNA luôn có một phosphate 5’tự do và hydroxyl 3’. Trong những năm 1950, nhà hóa học Erwin Chargaff thực hiện thí nghiệm tìm ra cấu trúc, thành phần hóa học của axit nucleic và ông nhận ra rằng axit nucleic chứa các thành phần tỷ lệ không bằng nhau của mỗi nucleotide. Chargaff tách DNA từ một số sinh vật, cả hai sinh chất và nhân điển hình (Chargaff, Lipshitz và Green, 1952, và cộng sự Chargaff, 1951; Zamenhof, Brawerman và Chargaff, 1952). Ông thủy phân DNA vào thành phần nucleotide của nó bằng cách xử lý với axít mạnh và sau đó tách các nucleotide bằng sắc ký giấy. Thí nghiệm của ông cho thấy các tỷ lệ tương đối của 4 base không bằng nhau nhưng cũng không phải ngẫu nhiên. Số lượng adenine (A) (residues )dư lượng trong tất cả các mẫu DNA đã bằng với số thymine (T) dư lượng, trong khi số lượng guanine (G) dư lượng ngang bằng với số cytosine (C) dư lượng (Bảng 1.1). Chargaff quy định rằng đối với bất kỳ loài nào thì: A = T và G = C Tổng các purin = Tổng các pyrimidine Tỷ lệ phần trăm (C + G) không nhất thiết phải bằng tỷ lệ phần trăm (A+T). Những phát hiện này mở ra khả năng cho sự sắp xếp chính xác của các nucleotide trong một phân tử DNA, nhưng ý nghĩa cơ bản của các T = A và G = C sự tương quan giữa C đã không được đầy đủ nhận thấy cho đến khi cấu trúc ba chiều của DNA được tìm ra . Như chúng ta sẽ thấy sau này, trong DNA thì A luôn cặp với T và G luôn cặp với C. Bảng 1.1 Nguyên tắc Chargaff’s. Tỷ lệ của các loại nucleotide được tách từ DNA của các nguồn vi sinh vật khác nhau.Trong khi tỷ lệ của các vòng của purine: purine và pyrimidine: pyrimidine biến thiên rộng, tỷ lệ của purine:pyrimidine được tìm thấy là hằng số không đổi. Giữa năm 1940 và 1953 nhiều nhà khoa học quan tâm trong việc tìm kiếm cấu trúc của DNA. Nhiễu xạ tia X như là một phương pháp xác định cấu trúc protein đã trở thành một kỹ thuật xác định. Nhiễu xạ tia X liên quan đến việc bắn một tia X tại một chuỗi chính xác của các phân tử hoặc tinh thể hoặc một sợi. Khi chùm tia X va chạm 8
Sản xuất protein trong y học vào một nguyên tử trong chuỗi đó chúng sẽ được nhiễu xạ và các chùm tia nhiễu xạ được phát hiện như những đốm trên phim của tia X. Phân tích các mẫu nhiễu xạ thì cho biết các thông tin về cấu trúc và hình dạng của các phân tử trong chuỗi. Đầu năm 1938 William Astbury áp dụng các kỹ thuật lên các sợi DNA. Tới năm 1947, ông đã phát hiện một chu kỳ trong DNA dài khoảng 0,34 nm. Giữa năm 1950 và 1953, Rosalind Franklin được cải tiến dữ liệu tia X từ các mẫu DNA tinh khiết cao. Công việc của bà khẳng định có tính chu kỳ và cho rằng cấu trúc của DNA bao gồm một số dạng xoắn. Franklin đã không đề xuất một mô hình cho cấu trúc của DNA. Thay vào đó, Linus Pauling và Robert Corey sử dụng dữ liệu của Franklin, cùng với điều đó của một người khác và đã đề xuất rằng DNA là một chuỗi xoắn ba với phosphate gần trung tâm của trục và các base ở bên ngoài (Pauling và Corey, 1953). 1.3 Sợi xoắn kép Franklin đã lưu ý rằng các sợi DNA có thể cho hai loại hình ảnh nhiễu xạ khác nhau và chúng phụ thuộc vào cách chuẩn bị và lưu trữ các mẫu. Điều đầu tiên (cấu trúc A) là các sợi tương đối mất nước, thứ hai (Cấu trúc B) đã được phổ biến trên một loạt các ghi nhận. Bà nhận thấy rằng sự thay đổi từ cấu trúc A đến cấu trúc B được đảo ngược, tùy thuộc vào mức độ mẫu hydrat hóa (Franklin và Gosling, 1953). Người ta cho rằng các dạng B của DNA là quan trọng trong cấu tạo sinh học. Dạng DNA (hình dạng A xoắn phải và hình dạng Z xoắn trái) chắc chắn vẫn tồn tại nhất định trong các điều kiện và có thể đóng vai trò quan trọng trong quá trình vận chuyển của các tế bào. Ví dụ, một loại của các protein liên kết đặc biệt với Z-DNA gần đây đã được mô tả (Schwartz và cộng sự năm 2001). Ở đây chúng tôi sẽ tập trung vào các đặc tính và sự tương tác của hình dạng cấu trúc B của DNA. Năm 1953, James Watson và Francis Crick đã cố gắng để xây dựng mô hình phân tử của ADN và nhận ra rằng các cấu trúc Pauling -Corey là không chính xác, một số nguyên tử cần phải xích lại gần nhau hơn. Bằng cách kết hợp mẫu nhiễu xạ tia X của Franklin cùng với nguyên tắc Chargaff, Watson và Crick đã đề xuất mô hình xoắn kép vào năm 1953 (Watson và Crick, 1953a). Mô hình này thể hiện trong hình 1.7, nó có các tính năng chủ yếu dưới đây và một trong số đó đã được cập nhật một ít từ mô hình ban đầu trong ánh sáng của độ phân giải cao trong dữ liệu nhiễu xạ tinh thể tia X. (A) Hai chuỗi polynucleotide dài cuộn quanh một trục trung tâm, tạo thành một chuỗi xoắn kép hướng xoắn phải, điều này có nghĩa rằng các các vòng xoắn theo chiều kim đồng hồ khi nhìn từ trên xuống trục xoắn ốc. (B) Hai chuỗi được xoắn đối song song, có nghĩa là mỗi chuỗi có một hướng xoắn đặc trưng và chạy ngược chiều nhau. (C) Các base của cả hai chuỗi là những cấu trúc phẳng, nằm vuông góc với trục. Chúng được "xếp chồng lên nhau", cách nhau 0,34 nm và hướng vào bên trong của đường xoắn ốc này. (D) Base nitơ của các sợi ngược chiều nhau được liên kết với nhau bởi liên kết hydro. 9
Sản xuất protein trong y học (E) Mỗi vòng xoắn hoàn chỉnh có chiều dài là 3,4 nm. Điều này có nghĩa là chỉ có hơn 10 cặp base từ mỗi sợi (10,4 bp) tạo thành một vòng hoàn chỉnh của đường xoắn ốc này. (F) Theo chiều dài của một phân tử, các khe lớn thì rộng và các khe nhỏ thì hẹp được phân biệt rõ ràng trong cùng đường xoắn ốc. (G) Kích thước đường kính của đường xoắn được tăng gấp đôi khoảng 2 nm. Các liên kết của các base nitơ ở trung tâm của đường xoắn ốc là tính năng quan trọng nhất của mô hình của Watson và Crick. Tuy nhiên, một số tính năng khác cũng rất quan trọng để hiểu được chuỗi xoắn kép. 1.3.1 Các sợi xoắn đối song song Bản chất của các sợi xoắn đối song song của hai chuỗi polynucleotide là một phần quan trọng của chuỗi xoắn kép. Do hạn chế của các góc liên kết của các cặp base và phosphate , đường, các chuỗi xoắn kép có thể không được hình thành một cách dễ dàng nếu cả hai chuỗi chạy song song cùng chiều. Một chuỗi xoắn chạy bắt đầu từ đầu 3’đến 5’ và các chuỗi khác chạy bắt đầu từ đầu 5’ đến 3’. Điều này được minh họa trong hình 1.8. Hình 1.7. Các Watson và Crick mô hình của DNA Các danh pháp đầu 5’ và 3’ là bắt nguồn từ hệ thống đánh số của vòng đường mà chúng ta đã thấy trong hình 1.5. Theo quy ước, trình tự DNA được viết theo hướng 5’ đến 3’. Điều này có nghĩa là một chuỗi DNA duy nhất bắt đầu với một nhóm phosphate tự do trên carbon 5 của một vòng deoxyribose. Nucleotide bổ sung được tham gia vào chuỗi thông qua liên kết phosphodiester, mà liên kết các nhóm hydroxyl trên nguyên tử cacbon 3 của một đường với các phosphate trên nguyên tử cacbon 5 của một đường liền kề. Chuỗi kết thúc bằng một nhóm hydroxyl tự do trên các nguyên tử cacbon 3 của đường cuối cùng. 10
Sản xuất protein trong y học Hình 1.8. Các cặp base của DNA liên kết và bổ sung. Hai chuỗi xoắn này, mũi tên trong hướng 3 đến 5, được xoắn đối sog song. Các cặp base trên một sợi xoắn được bổ sung cho nhau trên sợi đối diện, một cặp base A luôn luôn cặp với T và cặp base G luôn luôn cặp với C. 1.3.2 Cặp Base và cách sắp xếp Các base của cả hai chuỗi DNA là những cấu trúc phẳng nằm gần vuông góc với trục xoắn ốc. Các base của chính nó được xếp chồng lên nhau trong mỗi chuỗi. Sắp xếp này là minh họa tốt nhất qua sự kiểm tra của một mô hình mà máy tính đưa ra để kiểm tra độ phân giải cao dữ liệu của nhiễu xạ tia X (hình 1.9). Nó có thể được lưu ý rằng không phải tất cả các cặp base là đều vuông góc với trục xoắn và một số vị trí xoắn cho thấy các cặp base của các vòng purine và pyrimidine không nằm bằng phẳng với nhau nhưng chúng xoắn đối với mỗi vị trí khác, như các cánh trong cùng một cánh quạt (Dickerson, 1983). Các liên kết của một vòng purine (A hoặc G) với một pyrimidine (T, C) trong vòng xoắn này là quan trọng đối với sự hoàn chỉnh của các đường xoắn ốc. 11
Sản xuất protein trong y học Hình 1.9. Máy tính tạo ra mô hình của DNA. Cấu trúc của dạng DNA sợi B gấp đôi bắt nguồn từ nhiễu xạ tia X có độ phân giải cao của các tinh thể DNA. Nguyên tử oxy được tô màu đỏ, phosphorus là màu cam, màu trắng carbon và nitơ là màu xanh. Độ dài liên tục của vòng purine-pyrimidine ghép nối sẽ bị phá vỡ nếu xảy ra các cặp purine-purine (quá lớn) hoặc pyrimidine-pyrimidine (quá nhỏ). Các cặp pyrimidine- purine được bổ sung cho nhau và hai sợi của một phân tử ADN đơn lẻ bổ sung cho nhau. Như vậy, nếu trình tự 5’-ATGATCAGTACG-3’ xảy ra trên một sợi AND thì các sợi khác phải có trình tự 5’-CGTACTGATCAT-3’. Hai chuỗi được bổ sung cho nhau: Chúng ta sẽ thấy trong nhiều chương sau, những ý tưởng của sự phân bổ giữa hai sợi DNA là cơ sở của nhiều thí nghiệm trong kỹ thuật di truyền. Các liên kết của hai sợi DNA rất cụ thể, chính xác phù hợp giữa hai sợi DNA. Giống như những liên kết ở trên có tính ổn định cao và dễ dàng hình thành xoắn. Như chúng ta sẽ thấy sau này, hai sợi DNA mà không bổ sung cho nhau nhưng có vẫn còn ở mức bổ sung cao vẫn giữ lại khả năng tương tác với nhau. 12
Sản xuất protein trong y học 1.3.3 Các thông tin có được truyền đến nhau hay không khi mà chúng ta phá vở các sợi xoắn kép ra xa nhau Làm thế nào để thông tin có thể tổ chức trong chuỗi DNA được đọc mà không cần phải làm sáng tỏ các chuỗi xoắn kép? Bản chất bất biến của liên kết giữa đường - phosphate dường như không thể bị phá vở các trình tự cơ bản DNA. Các khe dọc theo trục xoắn ốc đã cung cấp một cơ chế mà trong đó các base có thể được phân biệt với nhau. Như chúng ta có thể thấy trong hình 1.7 Hình 1.10. Sự tương tác giữa các gen ức chế-λ của vi khuẩn λ và DNA. Máy tính tạo ra mô hình của sự tương tác giữa DNA, chúng được thể hiện bằng cách sắp xếp màu như trong hình 1.9 và gen ức chế λ, có α-xoắn được thể hiện trong màu xanh lá cây và được liên kết bởi các axit amin mà không thông qua cấu trúc thứ. Hai phân tử của gen ức chế λ (một dimer) tương tác với một phân đoạn bp 17 của-DNA chuỗi xoắn kép. (B) chuỗi xoắn 5 của gen ức chế λ. Mỗi monomer gen ức chế của DNA ràng buộc miền λ có sợi xoắn 5, đánh số 1-5 từ cuối amin của protein. Đường xoắn 3 nằm trong rãnh lớn và các chuỗi bên (không hiển thị) mở rộng đến các cạnh của các rãnh lớn, tiếp xúc với các cơ sở DNA. Hình dạng xoắn 2 và 3 xoắn cuộn ràng buộc motif DNA được tìm thấy trong nhiều loại protein liên kết ADN. Sợi xoắn 3 là chuỗi xoắn nhận dạng và có hình dạng chuỗi đặc trưng trình tự ADN trong các khe lớn, trong khi xoắn 2 là chuỗi xoắn ổn định tương tác không đặc trưng với các trục chính của sợi DNA để cung cấp ổn định cho các protein tương tác DNA. DNA bao gồm các khe được xếp chủ yếu và một số khe nhỏ dọc theo trục của nó. Đây là kết quả của các liên kết glycosidic có đính kèm một cặp base với đường trong vòng của nó, chúng không nằm trực tiếp đối diện nhau qua trục xoắn ốc. Kết quả là trục chính của các chuỗi xoắn kép liên kết giữa đường- phosphate không đều nhau dọc theo trục xoắn và các khe hình thành giữa các trục chính không bằng nhau. Các khe lớn rộng (~ 0,22 nm) và nông, trong khi các khe nhỏ hẹp (~ 0,12 nm) và sâu. Các nhóm chính bao gồm chủ yếu là nitơ và oxy nguyên tử của mỗi cặp base. Ngược lại, khe nhỏ được che lấp bởi nguyên tử nitơ và oxy nói chung hoặc là các vòng purines hoặc pyrimidine. Như vậy, khả năng tương tác các rãnh lớn cho cho thấy 13
Sản xuất protein trong y học nó phụ thuộc nhiều vào trình tự cơ bản của các rãnh nhỏ. Phát hiện này đã dẫn tới sự suy đoán rằng trình tự ADN cụ thể nhận ra các protein liên kết DNA bằng cách hình thành liên kết hydro chủ yếu giữa các nhóm cụ thể ở vị trí bên trong và dọc theo các đường rãnh lớn. Một trong những cách phổ biến nhất trong đó các protein có thể nhận ra các chuỗi ADN cụ thể là bằng cách chèn các protein xoắn α vào các rãnh chính của ADN. Các chuỗi xoắn α, ban đầu được mặc nhiên công nhận bởi Pauling và Corey năm 1951. Nó là một protein cấu trúc thứ cấp, trong đó một vòng xoắn phải được hình thành bởi các axit amin trên một chuỗi polypeptide (Pauling và cộng sự năm 1951). Mỗi axit amin trong chuỗi xoắn chiếm một khoảng cách 0,15 nm, và có 3,6 amino acid của các chuỗi xoắn (xem phụ lục 1). Đường kính của trục polypeptide trong một xoắn α là khoảng 0,5 nm, tuy nhiên acid amin chuỗi có kích thước xa trục xoắn ốc. Kết quả là protein xoắn α có thể để phù hợp với hầu như chính xác vào các rãnh chính DNA sợi đôi. Acid amin kích thước chuỗi đi từ xoắn α có thể hình thành liên kết hydro với các cặp base của ADN trong chính các rãnh. Các loại protein-DNA tương tác được thể hiện trong hình 1.10. 1.3.4 Liên kết hydrogen Các mô hình Watson và Crick cấu trúc DNA dự đoán rằng hai chuỗi polynucleotide được giữ với nhau bằng liên kết hydro không cộng hóa trị hơn là tương tác cộng hóa trị. Điều này đặt ra một số câu hỏi quan trọng như liên kết hydro là gì và nó đủ mạnh để duy trì tính toàn vẹn của chuỗi xoắn kép? Để giải quyết câu hỏi đầu tiên, một liên kết hydro là một sự tương tác tĩnh điện yếu giữa liên kết cộng hóa trị của nguyên tử hydro và một nguyên tử khác với một cặp điện tử không có ái lực, một đặc tính của liên kết cộng hóa trị giữa nguyên tử oxy và nitơ. Các nguyên tử hiđrô giả định tích điện dương, trong khi các cặp điện tử không có ái lực giả định tích điện âm. Các nguyên tử này tích điện trái dấu thì hút nhau bằng liên kết hóa học yếu. Nói chung, một liên kết hóa học là một lực hấp dẫn để giữ các nguyên tử với nhau. Sự hình thành ngẫu nhiên của một liên kết giữa hai nguyên tử tự do liên quan đến việc giải phóng năng lượng nội bộ của các nguyên tử không liên kết và chuyển đổi sang một hình thức năng lượng, ví dụ như nhiệt. Lực của một liên kết cụ thể được đo bằng lượng năng lượng giải phóng theo sự hình thành của liên kết. Các liên kết mạnh hơn, năng lượng nhiều hơn được giải phóng. Sự thay đổi năng lượng ( G) đi kèm với sự hình thành liên kết được sử dụng để mô tả lực của một liên kết. Giá trị của G được tính theo phương trình sau đây: G = −RT ln Keq Trong đó R là hằng số khí (8,314 JK-1 mol-1), T là nhiệt độ tuyệt đối và ln Keq là log tự nhiên của các hằng số cân bằng giữa các liên kết hoặc không liên kết các phân tử với nhau.Liên kết cộng hóa trị ngắn (0,095 nm) và rất mạnh, với G giá trị trong khoảng -100 đến -500 kJ mol-1. Liên kết hydrogen là dài hơn (khoảng 0,3 nm) và là yếu hơn nhiều với giá trị G trong phạm vi từ -10 đến-30 kJ mol-1. 14
Sản xuất protein trong y học Khi tìm thấy trong các chuỗi xoắn kép, hình thức adenine hình thành 2 liên kết hyđrô với thymine, và các hình thức cytosine ba liên kết hydro với guanine (xem hình 1.8). Trong khi một liên kết hydro duy nhất giữa chính nó là rất yếu 2500 hay như vậy liên kết hydro mà giữ lại với nhau mỗi kilobase DNA cung cấp mức độ bất thường của sự ổn định để xoắn. Điều này cũng có nghĩa là, như chúng ta sẽ thấy dưới đây và trong các chương sau, có một cặp base AT là kém ổn định hơn về mặt nhiệt động lực học hơn là một cặp cơ sở GC. 1.4 Biến tính thuận nghịch của DNA Mạch đôi DNA là một phân tử rất bền. Trong một mẫu mất nước, nó có thể tồn tại gần như nguyên vẹn trong hàng ngàn năm. Những đoạn DNA đã được phân lập từ xác ướp Ai Cập cách đây khoảng 3.000 năm. Trong những mẫu này, chuỗi xoắn kép vẫn còn nguyên vẹn, nhưng DNA đã bị đứt gãy. Hiện tại một chuổi gồm hàng triệu nucleotide được ghép lại kề nhau thì tạo được một đoạn DNA ngắn, dài khoảng 500- 1000 (bp), với một số mối liên kết đồng hóa trị tạo thành khung phosphodiester bị gãy vụn. Tác dụng chủ yếu của liên kết không cộng hóa trị là giữ chặt hai sợi xoắn kép, đồng thời nó cũng làm cho sợi đôi DNA có thể bị tách ra (biến tính) đơn giản bằng cách nung nóng. Nhiệt năng được cung cấp cho một đoạn DNA bằng cách nung nóng sẽ phá vỡ liên kết hydro, nhưng sẽ không ảnh hưởng đến các liên kết đồng hóa trị mà giữ mỗi chuỗi với nhau (Lin và Chargaff, 1966). Việc tách hai sợi DNA trong một cấu trúc xoắn được kèm theo những thay đổi về tính chất vật lý của DNA. Một trong những thay đổi này là sự hập thụ tia UV của DNA. DNA hấp thụ ánh sáng ở bước sóng 260 nm do sự hiện diện của các liên kết đôi và liên kết đơn xen kẽ trong các bases DNA (hình 1,5). Mỗi một bases của bốn loại nucleotid có phổ hấp thụ khác nhau không nhiều, và quang phổ hấp thụ tổng thể của DNA là trung bình cộng của chúng. Một dung dịch DNA tinh khiết được nhìn thấy trong suốt bằng mắt, và sự hấp thu trở nên không thể đo được đến khoảng 320 nm. Giảm bước sóng dần xuống thì có một đỉnh hấp thụ vào khoảng 260 nm, tiếp theo được giảm xuống giữa 220 và 230, và sau đó dung dịch trở nên mờ đi về bản chất trong tia cực tím. Một dung dịch sợi đôi, DNA tự nhiên,với nồng độ là 0,05 mg/ml, có độ hấp thụ (hoặc mật độ quang học, OD) khoảng 1,0 at ở đỉnh cao 260nm. Khi một chuỗi xoắn DNA được biến tính để trở thành sợi đơn duy nhất, ví dụ bằng cách nung nóng, tăng hấp thụ. Cùng một nồng độ 0,05 mg/ml dung dịch sợi đôi DNA mà chúng tôi sử dụng trên sẽ có một mức hấp thụ là 1,5 khi ở dạng sợi đơn. Đây là số liệu hấp thụ thường được thể hiện dưới dạng hiển thị dưới đây: 1.0 A260nm sợi đôi DNA = 50 μg/mL 1.0 A260nm sợi đơn DNA = 33 μg/mL Sự gia tăng hấp thụ như sợi DNA kép trở thành sợi đơn, gọi là hiệu ứng hyperchromic (Thomas, 1993), cho thấy sự tương tác giữa các điện tử lưỡng cực trong việc xếp chồng các bases sợi đôi xoắn kép và được trình bày sơ lược trong hình 1.11. Việc xếp chồng của các cặp bases trong sợi đôi DNA có tác dụng làm giảm sự hấp thu của riêng nucleotide do sự tương tác cạnh tranh của các cặp bases liền kề trong ngăn 15
Sản xuất protein trong y học xếp. Ở dạng sợi đơn, không có cạnh tranh như vậy xảy ra và kết quả là DNA sợi đơn hấp thụ ánh sáng với mức độ lớn hơn so với sợ đôi của nó. Hình 1.11. Ảnh hưởng của việc nung nóng sợi đôi DNA. Như là một phân tử DNA sợi kép được đốt nóng trên nhiệt độ môi trường xung quanh, các liên kết hydro không cộng hóa trị giữ hai sợi với nhau bắt đầu bị phá vỡ. Điều này được đi kèm với sự gia tăng hấp thụ ở 260 nm. Ở nhiệt độ cao trên 90 0C hai sợi DNA sẽ hoàn toàn tách biệt nhau. Quá trình này có thể thuận nghịch. Nếu nhiệt độ giảm tương đối chậm, hai sợi DNA bổ sung sẽ sửa đổi để tạo ra một phân tử DNA sợi kép kết hợp một cách chính xác. Nhiệt độ nóng chảy (Tm) là nhiệt độ mà tại đó một nửa số sợi được tách Khi một mẫu DNA được đun nóng, cấu trúc xoắn bắt đầu tách ra, trong một quá trình đôi khi được gọi là nóng chảy. Cặp bases A-T chỉ có hai liên kết hyđrô giữ chúng lại với nhau, các vùng DNA với mật độ A và T cao sẽ tách ra trước. Khi nhiệt độ tiếp tục tăng, và tăng cao liên tục thì DNA sẽ mang tích chất của một sợi đơn tự nhiên, cho đến khi hai sợi tách ra hoàn toàn. Nhiệt độ mà tại đó một nửa là DNA sợi đơn được gọi là nhiệt độ nóng chảy (Tm). Nhiệt độ nóng chảy của toàn bộ phân tử DNA thì không giống nhau, và được quyết định dựa trên chiều dài của DNA, và tỉ lệ các cặp bases G- C và A-T. Thông thường những phân tử DNA ngắn có giá trị Tm thấp, như bao gồm tỉ lệ cao của các cặp bases A-T. Nhiệt độ nóng chảy của phân tử DNA dài được tính toán dựa theo phương trình: 0 Tm = 16.5(log[Na+]) + 0.41(%GC) + 81.5 C Ở đây [Na+] là nồng độ của các ion natri trong các dung dịch DNA và (% GC) là tỷ lệ phần trăm của G-C còn lại trong mạch đôi. Vì vậy, đối với một phân tử DNA có chứa 40% GC còn lại (điển hình cho một bộ gen động vật có vú) trong một dung dịch NaCl có nồng độ 50 mM NaCl, nhiệt độ nóng chảy là 76,40C. Như chúng ta sẽ thấy trong chương sau, các phân tử DNA ngắn (15-30 bases) thường được sử dụng trong 16
Sản xuất protein trong y học các thí nghiệm kỹ thuật di truyền. Vì những trình tự bổ sung ngắn, phương trình trên không còn đúng nữa, và theo dự toán (đôi khi được gọi là quy tắc Wallace) được sử dụng để xác định Tm (Wallace và cộng sự năm 1979.,): Tm = 2(AT) + 4(GC) Trong đó, cứ mỗi cặp bases A-T ở cấu trúc mạch kép đóng góp 20C ổn định của sợi đôi xoắn kép, trong khi mỗi cặp G-C đóng góp 40C ổn định. Do đó, một oligonucleotide của 20 bases của sợi đơn DNA có chứa năm chất thừa, còn lại 6 T, 3 C và 6 G sẽ có một nhiệt độ ủ bổ sung vào chuỗi ADN xấp xỉ 2 (11) + 4 (9) = 58 0C. Tầm quan trọng của nhiệt độ ủ sẽ trở nên rõ ràng khi chúng ta nhìn vào phản ứng dây chuyền polymerase (PCR) và lai tạo acid nucleic trong các chương sau. Việc làm nóng các chuỗi DNA xoắn kép để tạo ra sợi đơn là cả một quá trình ngược. DNA sợi đơn được thực hiện bằng cách đun nóng duplex sẽ thay đổi khi nhiệt độ giảm. Khi nhiệt độ giảm xuống, năng lượng nhiệt đã được sử dụng để phá vỡ các liên kết hydro giữa các sợi bị giảm theo, và va chạm ngẫu nhiên giữa các sợi sẽ giúp các sợi gắn lại theo nguyên tắc bổ sung. Nhiệt năng cung cấp giảm tương đối chậm (1- 20C / giây), sự tạo thành mạch kép sẽ hoàn tất. Hai sợi đơn phân tử DNA bổ sung sẽ đến với nhau và sửa đổi chính xác mạch kép (duplex) ban đầu trước khi mẫu được đun nóng. Nếu nhiệt độ giảm xuống nhanh chóng, ví dụ như nhúng chìm một mẫu DNA tại 940C trực tiếp vào nước đá, sự điều chỉnh các cặp bases sẽ không xảy ra và các DNA sẽ được giữ lại ở dạng một đơn tương đối. 1.5 Cấu trúc của DNA trong các tế bào Các loại axit nucleic được sử dụng để hình thành hệ gen của sinh vật phụ thuộc vào chính sinh vật đó. Ví dụ, virus có bộ gen gồm hai sợi DNA kép, sợi DNA đơn hoặc RNA, tùy thuộc vào loại virus. Nhiễm sắc thể của hầu hết các sinh vật nhân chuẩn bao gồm các sợi đôi DNA. Các bộ gen của các sinh vật prokaryote thường bao gồm một phân tử DNA vòng tròn. Nghĩa là, thay vì phải có đầu 5’ tự do và đầu kết thúc 3’, các đầu được nối với nhau để tạo thành một vòng liên tục của chuỗi xoắn kép ADN. Một số nhiễm sắc thể bổ sung phân tử DNA, gọi là plasmid, được tìm thấy trong các tế bào prokaryote. Như chúng ta sẽ thấy trong chương 3, hiểu biết như thế nào về sự phân chia các tế bào với những plasmids có vai trò hoạt động then chốt trong sinh học phân tử và kỹ thuật di truyền tiên tiến. Phân tử DNA plasmid thường đóng vòng của sợi đơn hay sợi đôi DNA.Khi nhìn vào cấu trúc của DNA được trình bày trong hình 1.7, nó rất dễ nhằm lẫn là chuỗi xoắn kép, đúng hơn là một chất rắn thiếu linh hoạt hơn. Tuy nhiên, không chỉ đơn giảm là vậy. Hình ảnh dưới kính hiển vi điện tử của các phân tử DNA (hình 1.12) cho thấy DNA có dạng chuỗi nhiều hơn dạng que, và bao xung quanh chính nó để tạo thành một loạt các cấu trúc bất thường. Bên trong một tế bào nhân chuẩn, DNA được liên kết với một loạt các protein. Ví dụ, protein cần thiết cho nhân bản của nó, sao chép nó vào RNA và bao bọc của nó trong tế bào. Nhiều protein cuốn quanh DNA của chính nó, hoặc bằng cách nhốt hoặc bẻ cong phân tử DNA. Đối với các phân tử DNA thẳng ngắn, loại hạn chế này không phải là một vấn đề nghiêm trọng. Điểm stress được đặt trong một phần của một phân tử DNA, ví dụ, chuỗi xoắn kép có thể được thuyên giảm bởi sự tháo xoắn một phần khác của DNA. 17
Sản xuất protein trong y học Hình 1.12. Hình ảnh của sợi DNA kép được tìm ra bởi kính hiển vi điện tử. DNA vòng phân lập từ polyoma virus cho thấy nhiều crossings của sợi DNA đôi, chỉ ra rằng DNA là xoắn cực đại. Sao chép từ Vinograd và cộng sự (1965) Đầu kết thúc tự do của đoạn DNA dài cho phép quay tương đối tự do quanh sợi DNA. Đối với các phân tử DNA dạng vòng. Tuy những stress có thể rất khó để chứng minh. Khi những đầu tận cùng của DNA không tự do, nó không thể lơi lỏng ra và chống lại sự xoắn tại một nơi nào đó trong phân tử. Kết quả của các phân tử DNA xoắn trong sự hình thành của DNA xoắn cực đại (Hình 1,13). Năm 1965 Jerome Vinograd và các đồng nghiệp cho rằng các phân tử DNA vòng kín có thể chấp nhận một hình thức xoắn tròn '(Vinograd và cộng sự năm 1965.,). Như một hình thức sẽ có kết quả nếu, trước khi tham gia kết thúc của một sợi đôi DNA dài thành một vòng tròn kép kín, một đầu được xoắn tương đối khác để mở đầu cho một số khuynh hướng trong phân tử. Như cuộn xoắn DNA của chính nó được gọi là supercoil. Supercoil chỉ có thể được hình thành hoặc phá vỡ từ một phân tử DNA vòng tròn kín bằng cách phá vỡ ít nhất một trong những khung xương phosphodiester. Hình 1.13. Sự hình thành của DNA xoắn cực đại. Một phân tử DNA vòng không chứa supercoil được hiển thị. Hai nửa của phân tử này đã được đánh dấu màu đỏ và màu xanh để giúp dễ phân biệt. Một lần xoắn trong phân tử sẽ dẫn đến việc hình thành một cực dương (+) và supercoils cực âm(-). Quá trình này không dẫn đến một thay đổi số lượng kết nối. Tuy nhiên, khung xương DNA bị 18
Sản xuất protein trong y học phá vỡ và sau đó được đóng kín lại sau khi một đoạn của DNA đã bị rạn nứt, sau đó là số liên kết được giảm thành 2. Phân tử bây giờ là không còn xoắn cực đại. Mức xoắn cực đại trong một phân tử DNA đặc trưng có thể được mô tả bởi số lượng kết nối của nó (Lc). Con số này tương ứng với số vòng đôi xoắn trong phân tử tuyến tính ban đầu. Quá trình đưa sự xoắn cực đại vào một phân tử DNA làm giảm hoặc tăng số vòng xoắn ốc bị mắc kẹt khi vòng tròn được hình thành, và kết quả trong những thay đổi trong các số liên kết với các loài có vòng khép kín cuối cùng. Sự khác biệt liên kết (Lc) chỉ thị của các mức độ của cấu trúc xoắn cực đại trong một phân tử cần quan tâm (Hình 1,13). Các độc giả quan tâm cần tham khảo các tài liệu phổ biến cho một mô tả đầy đủ hơn của DNA cấu trúc liên kết và các vấn đề liên kết của nó (Bates và Maxwell, 1993). Vòng DNA khép kín được phân lập từ tế bào prokaryote thì không có cấu trúc xoắn cực đại. Nghĩa là, DNA tương đối không được tốt so với trạng thái tuyến tính của nó. Mặc dù tế bào Eukaryotic có chứa các phân tử DNA tuyến tính, độ dài của DNA trong nhiễm sắc thể có nghĩa là những điểm hạn chế trong một phần của phân tử DNA không thể dễ dàng làm giảm bằng cách chuyển sự căng thẳng đến một trong những đoạn kết thúc. Tương tự thích hợp ở đây là để suy nghĩ về cách bạn sẽ mở gu t một ô ng nươ c vườn xoắn. Bạn sẽ tháo xoắn bằng cách chuyển xoắn đến hết đường ống. Cuối cùng, sự quay của ống chính nó sẽ dẫn đến việc giải phóng cho nút thắt này. Đây là loại hành động để tháo một xoắn hoặc xoắn trong một phân tử DNA tuyến tính sẽ tương đối đơn giản nếu DNA bị ngắn. Chiều dài phân tử DNA nhiễm sắc thể, tuy nhiên, gặp một số khó khăn mà làm cho loại hình này tách ra hạn chế không thực tế. Chiều dài của DNA có liên quan sẽ làm cho nó khó khăn để di chuyển xoắn từ giữa DNA để kết thúc, và sự kết hợp của các DNA với các protein sẽ tạo nên một rào cản đối với loại hình chuyển động này. Trở lại với ô ng nươ c, một cách khác để loại bỏ các nút thắt (mặc dù ít thực tế hơn trong vườn) các đường ống sẽ được cắt để tạo ra kết thúc mới gần các đoạn của đoạn xoắn. Các đường ống sau đó có thể là không xoắn tại địa vị trí và chuẩn bị mẫu để loại bỏ các xoắn và cải cách các đường ống. Đó là trong thời trang còn đối với việc giải quyết các tế bào với các chủng trong DNA. Họ có các enzym, được gọi là topoisomerases DNA, làm cho các vết cắt trong các phân tử DNA đơn hoặc sợi đôi phá vỡ khung phosphodiester để cho phép các vị trí và sự tháo xoắn của chuỗi DNA. Các enzyme topoisomerase sau đó đánh dấu khung xương DNA để cải cách các phân tử DNA. 1.6. Thể nhân eukaryote Mỗi tế bào trong cơ thể chúng ta chứa một lượng lớn DNA. Những nhiễm sắc thể khác nhau của bộ gen người chứa khoảng 3.2 x 109 cặp base của DNA. Vì chúng ta là những sinh vật lưỡng bội, có hai bộ nhiễm sắc thể, tổng số lượng DNA lớn nhất trong toàn bộ tế bào của chúng ta là 6.4 x 109 cặp base. Tại 0.33 nm cặp base (hình 1.7), tương ứng với toàn bộ chiều dài ở trên khoảng 2.1 m. Kết hợp của các protein bên ngoài quấn quanh DNA tạo nhân. Trong kỳ giảm phân, các vật liệu di truyền (cùng với các protein liên kết) tương đối duỗi thẳng và phân tán khắp trong nhân giống như 19
Sản xuất protein trong y học nhiễm sắc thể. Khi bắt đầu nguyên phân, nhiễm sắc thể co lại rất nhiều, trong kỳ trước có thể nhận biết nhiễm sắc thể. Độ dài của chúng co lại khoảng 10 000 lần. Các vật chất di truyền khi phân lập từ vi khuẩn và vurus bao gồm sợi DNA và RNA hầu như không có protein. Tuy nhiên, ở sinh vật nhân chuẩn, số lượng đáng kể của protein kết hợp với DNA để hình thành hình dáng chất nhiễm sắc thể. Quan sát bằng kính hiển vi điện tử ta thấy rằng cấu trúc sợi nhiễm sắc thể được kết hợp các mảng tuyến tính của các hạt hình cầu. Các hạt này xuất hiện thường xuyên dọc theo trục của một nhiễm sắc thể và giống các hạt trên chuỗi. Các hạt, ban đầu gọi là v – bodies (olins và olins, 1974), ngày nay gọi là thể nhân. Digestion của sợi nhiễm sắc thể với những nuclease cố định, chẳng hạn như phân tử nuclease, số lượng các đoạn DNA dài khoảng chừng 200 bp, hoặc nhiều hơn nữa (Wingert và Von Hoppel, 1968). Nếu digestion của DNA nhiễm sắc thể là ngẫu nhiên, sau đó các các đoạn có kích thước khác nhau được tạo ra. Do đó điều này đã chứng minh rằng DNA của nhiễm sắc thể được che chở (bảo vệ) từ sự phân cắt của các enzyme. Từ DNA chúng sẽ bắt đầu và cắt bởi nulease, và tại hai hay nhiều vị trí được nối lại với nhau. Các protein kết hợp với ADN trong nhiễm sắc thể được chia thành cơ bản, histon tích điện dương và ít tích điện dương khi không histones. Protein kết hợp với DNA, việc sử dụng histone có vai trò cấu trúc quan trọng nhất. Histone chứa một lượng lớn điện tích dương axit amin lysine và arginine (xem phụ lục1), làm cho nó có thể liên kết thông qua tương tác tĩnh điện với nhóm phosphate tích điện âm của các nucleotide DNA. Có năm loại protein histone khác nhau: H1, H2A, H2B, H3 và H4. Một hạt nhân bao gồm hai bản sao của mỗi histone H2A, H2B, H3 và H4 để tạo thành một octamer xung quanh histone khoảng 150 cặp base của DNA được bao bọc trong một chuỗi xoắn kép trái, hình thành khoảng 1,7 vòng xoắn trong nhân (hình 1.14). Gần đây, để hiểu biết về cấu trúc của các thể nhân, vào năm 1997 Richmond và các đồng nghiệp đã có thể làm sáng tỏ được cấu trúc tinh thể tia X của phức hợp DNA thể nhân ở cấp độ phân tử. Tại cấp độ phân tử này, hầu hết các nguyên tử của mỗi histone đều có thể nhìn thấy, và các chiều chuỗi xoắn DNA rõ ràng vì nó bao quanh các octamer histone có thể được nhìn thấy (hình 1.15). Cấu trúc ở cấp độ cao phân tử cho biết rằng amino kết thúc cuối cùng của một số các histon nhô ra từ octamer các và project đi từ nhân. Ý nghĩa của các amino cuối cùng ở doạn cuối thì có khả năng tương tác với các thể nhân bên cạnh tạo contacts (sự tương tác, mối quan hệ). Chúng sẽ cạnh tranh signficance các histone cuối cùng ở xa hơn nữa khi look của biểu hiện gen. Mở rộng nghiên cứu về cấu trúc của nhân đã cung cấp cơ sở để dự đoán sự hình thành các sợi chất nhiễm sắc trong nhân tế bào, và chúng cuộn thành các nhiễm sắc thể mitotic. Mô hình này được minh họa trong hình 1.16. Có 2 nm chuỗi DNA xoắn kép cuộn ban đầu thành một lõi trong nhân khoảng đường kính 10 nm. Khoảng 200 cặp base của mỗi DNA liên kết hạt nhân để hình thành "hạt trên dây” có thể nhìn thấy hình ảnh trong kính hiển vi. Histone H1, nó không phải là một phần của lõi octamer, có thể được nằm ở vị trí mà DNA hình thành và rời khỏi nhân và có thể chức năng để xác dịnh các DNA trên thể nhân. 20
Sản xuất protein trong y học Hình 1.14. DNA bao xung quanh lõi nhân. thể nhân gồm hai phân tử của histone H4, H3, H2A và H2B. Trong các hình đại diện ở đây chỉ là một monomer của H2A và H2B có thể quan sát được, các monome khác được đặt ở mặt sau của octamer này. Gần 150 bp của DNA quấn quanh lõi octamer, tạo thành khoảng hai lần. Hình 1.15. Cấu trúc của phức hợp DNA-nhân được làm sáng tỏ bằng cách crystallography X-quang ở cấp độ phân tử. Trong cả hai hình trên, các sợi của DNA (thể hiện trong màu xanh lá cây và màu da cam) bọc quanh octamer histone. Các lõi protein là hầu như chỉ nằm bên trong, ngoại trừ phần đuôi histone amino cuối cùng được mở rộng ra từ cái phức tạp. Điều này được cung cấp bởi Tim Richmond (ETH Zurich) và được tái bản với sự cho phép từ thiên nhiên (Luger và cộng sự, 1997) bản quyền (1997) Các nhà xuất bản Macmillan Ltd. Sự hình thành của nhân đại diện cho mức độ bao quanh, như vậy chiều dài DNA được giảm xuống còn khoảng một phần ba chiều dài ban đầu. Tuy nhiên, trong hạt nhân, chất nhiễm sắc không tồn tại trong hình thức duỗi thẳng. Thay vào đó, trong sợi nhiễm 21
Sản xuất protein trong y học sắc 10 nm đã dược xoắn cuộn từ một sợi dài 30 nm, sợi nhiễm sắc thề ban đầu đó được gọi là solenoid. Không hiểu rỏ các quá trình chuyển đổi giữa sợi 10 nm và cac1 sợi 30 nm biểu hiện cho đặc tính sinh lý hoặc cho dù điều đó chỉ xảy ra trong ống nghiệm xem như là kết quả của sự thay đổi nồng độ muối. Tuy nhiên, các sợi 30 nm, gồm nhiều nhân được kết hợp (đóng gói) chặt chẽ với nhau, nhưng các định hướng chính xác và chi tiết của cấu trúc không rõ ràng. Gần đây, người ta có thể chấp nhận rằng trong một sợi 30 nm compact xoắn zig-zag mẫu với khoảng bốn nhân cho mỗi 10 nm (Beard và Schlick, 2001). Sự hình thành các sợi 30 nm tạo ra một cấp độ thứ hai của việc đóng gói, khi đó chiều dài tổng thể của DNA được giảm một nửa so với ban đầu Hình 1.16. Packaging của DNA trong nhiễm sắc thể nhân chuẩn. Các chuỗi xoắn kép DNA 2 nm được gói thành nucleosome như minh họa trong hình 1.15. Tại một số điểm histone H1 ở trong phức tạp, có thể ở DNA / điểm xuất từ nhân. Các thể nhân có thể hình thành sợi dài 10 nm trong nhân. Các thể nhân có thể tiếp tục kết hợp để tạo thành một sợi nm 30. tạo ra đường zig-zag trong nhân. Các sợi 30 nm sau đó được bọc tạo một proteins caffold, chúng có thể gấp cuộn để hình thành các nhiễm sắc thể trong phân bào, được quan sát dưới kính hiển vi điện tử. 1.7. Sự sao chép DNA Vào năm 1953, Watson và Crick đã hoàn thành bài viết nổi tiếng của mình về cơ chế sao vật chất di truyền. Từ việc sắp xếp và tính chất của các base mà mỗi mạch của các chuỗi xoắn kép ADN có thể làm một khuôn để tổng hợp của một mạch bổ sung (hình 1.17). Họ cho rằng nếu chuỗi xoắn kép đã unwound, mỗi nucleotide dc tạo ra từ 22
Sản xuất protein trong y học nột mạch gốc ban đầu theo nguyên tắc bổ sung sẽ có các nucleotide giống với các nucleotide của mạch còn còn lại (Watson và Crick, 1953b). Như vậy, mỗi mạch DNA gốc có thể làm một khuôn để tổng hợp một mạch DNA mới, vì thế có thể dẫn đến việc hình thành hai mạch đôi DNA giống như nhau. Trong mô hình này, DNA mới được tổng hợp bao gồm một mạch gốc ban đầu và một sợi mới được tổng hợp theo nguyên tắc bổ sung, do đó, quá trình được gọi là sao chép semi-conservative. Hình 1.17. Các bản sao của mạch đôi DNA theo đề nghị của Watson và Crick. Việc tách mạch DNA gốc xoắn kép (màu đen), mỗi sợi có thể làm một khuôn mẫu cho sự tổng hợp hình thành một chuỗi ADN mới (màu xanh). Điều này được gọi là sao chép semi-conservative, phân tử DNA mới gồm một chuỗi cũ và một sợi mới. Hai phương thức khác của bản sao này cũng dựa vào các sợi gốc ban đầu co nhiệm vụ làm mẫu cho sự tổng hợp DNA mới. Trong nhân bản conservative, những đường xoắn ốc của mạch gốc ban đầu sẽ được tháo xoắn, một chuỗi xoắn mới tổng hợp sẽ được hình thành theo nguyên tắc bắt cặp bổ sung. Hai mạch DNA mới tổng hợp sẽ kết hợp với nhau sẽ tạo thành một đường xoắn ốc và xoắn của mạch gốc sẽ được sửa đổi. Trong cơ chế khác, gọi là nhân bản dispersive, mạch DNA gốc từ một sợi có thể được tách ra và kết hợp một trong các mới sợi tổng hợp, tạo ra những mạch hỗn hợp giữa ADN mới và cũ. Matthew Meselson và Franklin Stahl đã cung cấp bằng chứng thực nghiệm cho rằng nhân bản semi-conservative đã được sử dụng bởi vi khuẩn từ việc sản xuất các phân tử DNA mới (Meselson và Stahl, 1958). Các kết quả thí nghiệm của tác giả được mô tả trong hình 1,18. Ông đã đã tăng trưởng các tế bào E. coli cho nhiều thế hệ trong một môi trường, trong đó các nguồn nitơ duy nhất dẫn xuất của amoni clorua (15NH4Cl). Điều này có nghĩa rằng DNA của những tế bào E. coli, ở 15N được kết 23
Sản xuất protein trong y học hợp với thành phần của base, nặng hơn so với ADN từ các tế bào phát triển về bình 14 thường amoni clorua ( NH4Cl). Các dạng bình thường và nặng của DNA có thể được tách sau khi ly tâm, bằng gradient nồng độ của caesium chloride. Trong điều kiện đó, các DNA nặng hơn sẽ đi xa hơn các ADN nhẹ hơn. Điều này giúp theo dõi các cấp độ của mỗi nitơ đồng vị trong việc nha6 bản DNA của vi khuẩn như nó đã được sao chép. Meselson và Stahl đã đưa vi khuẩn có chứa DNA nặng và chuyển chúng thành phương pháp di truyền có chứa amoni clorua vào ADN bình thường và sau đó cô lập mỗi thế hệ kế tiếp. Sau một vòng duy nhất của quá trình sao chép DNA trên phương pháp di truyền bình thường, hiện nay ông tìm thấy rằng DNA của vi khuẩn có mật độ trung gian giữa các vị trí dự kiến chứa toàn bộ 15N và 14N DNA. Kết quả này phù hợp với nhân bản semi-conservative, nhưng không phải với nhân bản conservative. Sau khi tế bào phên chia, Meselson và Stahl đã quan sát sự hiện diện của hai mạch của các mật độ ban đầu khác nhau tương ứng với vị trí của một loài 14N/15N DNA và lần thứ hai, các bằng cường độ ánh sáng, tương ứng với vị trí dự kiến của 14N/14N DNA. Chu kỳ tiếp theo của quá trình nhân đôi DNA dẫn đến một tỷ lệ tăng các 14N/13N mạch DNA. Các thí nghiệm mô tả ở trên cho thấy rằng nhân bản conservative không xảy ra, nhưng không thể loại trừ nhân rộng dispersive. Tuy nhiên, Meselson và Stahl, bác bỏ cơ chế sao chép này trong việc tách các mạch riêng lẻ của DNA sao chép. Họ đun nóng DNA (hình 1.11) và được cho thấy rằng có sợi riêng lẽ hoặc cường độ 15N hoặc 14N chứa DNA sợi đơn, nhưng không phải là của một cường độ trung bình mà có thể đã được kết hợp nếu một sợi DNA mới tổng hợp có chứa các mạch hỗn hợp của mạch gốc và mạch vừa được tổng hợp trình tự. Sao chép semi-conservative có cũng được biểu hiện ở sinh vật nhân chuẩn (Taylor, Woods và Hughes, 1957), và bây giờ được coi như là cơ chế chung cho nhân đôi DNA. 24
Sản xuất protein trong y học 1.8 DNA Polymerase Cả ở tế bào vi khuẩn và tế bào eukaryotic đều có nhiều enzyme DNA Polymerase. E. coli chứa 3 loại enzyme này ( bảng 1.2 ). DNA polymerase I chủ yếu tham gia vào quá trình sửa chữa DNA hơn là tham gia tái bản. DNA polymerase II củng tham gia vào sửa chữa DNA, trong khi đó DNA polymerase III chủ yếu tham gia vào quá trình tái bản (Kornberg and Baker, 1992). DNA polymerase III là một enzyme đa cấu tử có chức năng như là chất nhị trùng (dimer) của nhiều tiểu đôn vị. Nhiều enzyme DNA polymerase đã được nghiên cứu ở các cấp cấu trúc, trong đó kết hợp với phân tích sinh hóa đã dẫn đến sự giải thích cơ chế hoạt động của chúng. Enzyme DNA polymerase có 3 hoạt động riêng biệt. Tất cả các enzyme DNA polymerase tổng hợp trực tiếp đoạn DNA theo hướng 5’ -3’. Nhiều DNA polymerase có hoạt động exonuclease từ đầu 3’- 5’. Điều này cho phép cắt bỏ các nucleotide ở đầu 3’ của sợi mới tổng hợp. Hoạt động này được xem là hoạt động đọc sửa (proof-reading activity ) mà có thể để cắt bỏ các nucleotide sai hỏng trước khi nó thay thế các base đúng.  Một số DNA polymerase củng hoat động exonuclease theo hướng 5’- 3’. Điều này cho phép enzyme loại bỏ các trình tự đã được tổng hợp và tham gia đến việc nối các đoạn DNA được tổng hợp dựa trên sợi muộn trong thời gian tái bản DNA. DNA polymerase không có khả năng tự bắt đầu tổng hợp . Chúng cần một yêu cầu tuyệt đối là có đầu 3’ tự do mà enzyme có thể nối thêm các nucleotide mới. Điều này có nghĩa rằng cần phải có hai mồi để khởi đầu sự sao chép DNA theo mỗi hướng từ điểm gốc, mỗi mồi sẽ bổ xung cho một sợi DNA được sao chép. Như đã nêu ở trên, sự tổng hợp DNA chỉ diển ra theo hướng 5’- 3’, các nucleotide mới sẽ được nối vào đầu 3’ của chuỗi polynucleotide. Điều này dẫn đến một vấn đề, cả hai sợi gốc đều phải được tái bản nhưng chỉ có một sợi được định hướng 5’ – 3’từ điểm gốc của sự sao chép. Sợi này được gọi là sợi sớm, nó được sao chép một cách liên tục. Sự tái bản ở sợi muộn không thể xảy ra theo hướng 3’ – 5’. Sợi muộn được tái bản một cách không liên tục ( hình 1.19). Sự tổng hợp các doạn ngắn không liên tục theo hướng 5’ – 3’ (Okazaki 1968) mà sau đó được nối lại với nhau thành một sợi hoàn chỉnh. 25
Sản xuất protein trong y học Còn có một loại enzyme mà chúng ta sẽ được tìm hiểu trong chương sau là DNA polymerase phụ thuộc RNA gọi là enzyme phiên mã ngược (reverse transcriptase). Enzyme được tìm thấy ở một số virus gọi là retrovirus có vật chất di truyền là RNA thay vì DNA. Sau khi nhiễm vào tế bào chủ các RNA này được dùng làm khuôn cho sự tổng hợp phân tử DNA bổ xung (cDNA). Các DNA sau đó được đưa vào hệ gen vật chủ , nếu DNA được biểu hiện thì bộ gen virus được tạo ra. Việc sử dụng enzyme phiên mã ngược trong ống nghiệm để sản xuất DNA từ RNA được thảo luận trong chương 5. 1.9 Quá trình tái bản Làm thế nào để bắt đầu và kết thúc sự sao chép DNA? Như chúng ta đã biết các DNA trong tế bào là rất quan trọng và cần phải được kiểm soát chặt chẽ sự tái bản DNA là điều hiển nhiên. Quá trình tái bản gồm 3 giai đoạn : khởi đầu, kéo dài và kết thúc. Hinh 1.19: Tái bản DNA bởi DNA polymerase III. Sợi DNA gốc (đen) được tháo xoắn bởi helicase tại chạc ba tái bản. Sợi sớm và sợi muộn sau đó được tổng hợp bởi DNA polymerase III. Tái bản DNA trên sợi chính xảy ra theo hướng 5’ – 3’ bằng cách kéo dài mồi RNA đơn. Trên sợi muộn đòi hỏi cần phải có nhiều mồi để tổng hợp các đoạn ngắn (đoạn okazaki), sau đó các đoạn được nối lại bởi DNA ligase  Giai đoạn khởi đầu: Việc khởi đầu tái bản DNA không xảy ra ở các vị trí ngẫu nhiên trong bộ gen mà được bắt đầu tại một điểm cụ thể gọi là điểm gốc tái bản. Khi sự tổng hợp DNA được bắt đầu, hai chạc ba tái bản đươc tách dài theo hai hướng từ điểm gốc tái bản, điều này cho phép tái bản toàn bộ genome. Ở vi khuẩn chẳng hạn E coli. Chỉ có một điểm gốc tái bản (gọi là Ori C). Nhưng ở tế bào eukaryote thì lại có nhiều điểm gốc tái bản ví dụ ở nấm men Saccharomyces cerevisiae có khoản 300 điểm gốc tái bản, ở tế bào người có khoản 20000 điểm trong bộ gen. Ori C là một đoạn DNA có 245 bp , đoạn DNA này chứa các vị trí liên kết với một số protein ( cụ thể là DnaA, B and C). Các liên kết của protein này thúc đẩy sự nóng chảy của chuổi DNA xoắn, một quá trình cần thiếc để enzyme đọc trình tự base. Sự nhân đôi ở prokaryotes và eukaryotes có thể đáp ứng cùng một chức năng tổng thể nhưng điểm gốc tái bản của tế bào prokaryotes sẽ không thay thế cho eukaryotes và ngược lại. Khi xoắn được tháo ra 26
Sản xuất protein trong y học thì DNA polymerase có thể tiến đến và tổng hợp sợi DNA bổ xung. Tuy nhiên polymerase chỉ hoạt động khi đầu 3’ có nhóm OH tự do. Nhóm OH được cung cấp bởi một mồi RNA (liên kết bổ xung với sợi DNA gốc) có chiều dài khoản 5 – 15 nucleotide. Sự tổng hợp mồi được thực hiện bởi RNA polymerase (còn gọi là primase) mà không cần đầu 3’ tự do để bắt đầu tổng hợp. Sự tái bản DNA sau đó được thực hiện đồng thời trên cả hai sợi. Các protein khác cũng cần thiết để quá trình tái bản được xảy ra. Các sợi đơn DNA không bắt cặp trở lại là nhờ sự kéo căng của các protein (SSBs) khi chúng liên kết với sợi đơn DNA và khi đó DNA tháo ra tạo thành phức hợp với polymerase với sự giúp đỡ của enzyme helicase (hình 1.19). Ngoài ra, enzyme topoisomerase cần thiết để làm giảm độ căng trong cấu trúc xoắn để đi đến quá trình tháo xoắn.  Giai đoạn kéo dài: DNA polymerase III chỉ có thể sao chép theo hướng 5’– 3’, vậy làm thế nào để cả hai sợi đều được sao chép đồng thời? Cơ chế về sự tổng hợp các sợi DNA sớm và muộn đươc biểu diển ở hình 1.19. Trong mô hình này DNA polymerase III có khả năng sao chép một cách liên tục trên sợi sớm. Ở sợi muộn để sự sao chép DNA xảy ra theo hướng 5’ – 3’ thì quá trình sao chép xảy ra theo từng đoạn ngắn (gọi là đoạn Okazaki) tạo nên các vòng lặp. Sau khi tổng hợp 1000 – 2000 cặp base, các monomer của enzyme sẽ gặp đoạn Okazaki được bổ xung, lúc này enzyme sẽ tách ra khỏi sợi muộn. Một vòng lặp mới sau đó được hình thành và quá trình được lặp lại như vậy. Sự hoạt động exonuclease theo hướng 5’ – 3’ có thể hổ trợ để tạo thành các đoạn okazaki hoàn chỉnh. Sau đó enzyme ligase sẽ tham gia hình thành các liên kết phosphodiester nối các đoạn okazaki hoàn thành quá trình tổng hợp ở sợi muộn. Chúng ta sẽ thảo luận cơ chế hoạt động của DNA ligase và cách sử dụng nó trong kĩ thuật di truyền ở chương 2.  Giai đoạn kết thúc: Cũng quan trọng như việc bắt đầu tổng hợp, sự kết thúc phải được kết thúc chính xác. Đối với vi khuẩn chẳng hạn như E coli.chúng chứa bộ gen vòng, nếu sự khởi đầu tái bản xảy ra tại một điểm duy nhất thì sau đó sự kết thức xảy ra tại một điểm nằm dối diện với điểm khởi đầu. Sự kết thúc không phải là một quá trình thụ động mà xảy ra ở các trình tự DNA xác định ( gọi là trình tụ kết thúc ) ở đó có sự hoạt động liên kết với các protein gọi là Tus. Tus liên kết với trình tự kết thúc bất đối xứng. cho phép chạc ba tái bản đi theo một hướng để vượt qua nhưng khối DNA được tái bản theo hướng ngược lại (Kamada và cộng sự, 1996). Giai đoạn kết thúc ở eukaryotes chưa được biết rõ. 27
Sản xuất protein trong y học Hình 1.20. Chu kì tế bào eukaryotes. Sau khi phân chia xong, tế bào phát triển trong phase G1. Sự tổng hợp DNA sau đó xảy ra (S) trước khi bước qua phase G2. Cuối cùng, nhiễm sắc thể nhân đôi và tách ra riêng biệt sau đó xảy ra phân chia tế bào. Các giai đoạn của chu kì được điều khiển bởi proteins – cyclins và cyclin- dependent kinases (CDKs). Đây gọi là các trạm kiểm soát. Trong tế bào eukaryotes sự tái bản phải được phối hợp với chu kì tế bào để khi phân chia tế bào có sẳn hai bản sao của bộ gen. Chu kì tế bào trải qua 4 giai đoạn dựa trên quan sát sự phân chia tế bào dưới kính hiển vi ( hình 1.20 ). Những quan sát này cho thấy tế bào phân chia thông qua các chu kì lặp đi lặp lại của pha giữa khi sự phân chia nhân và tế bào xảy ra, ở kì trung gian có một vài thay đổi có thể phát hiện được dưới kính hiển vi. Sự tái bản DNA xảy ra trong kì gian phân. Bốn giai đoạn của chu kì tế bào là:  M-phase (mitosis): thời kì nhân và tế bào phân chia.  G1-phase (gap 1): pha tăng trưởng, sự phiên mã, dịch mã và các hoạt động chung của tế bào xảy ra.  S-phase (synthesis): xảy ra sự tổng hợp DNA và tái bản bộ gen.  G2-phase (Gap 2): Giai đoạn tăng trưởng chuẩn bị cho sự phân chia tế bào. Tế bào người trong môi trường nuôi cấy mất khoảng 20h để hoàn thành chu kì tế bào , trong đó, phase G1 cần hơn 9h, phase S mất khoản 8h và G2 kéo dài khoảng 2h. Thời gian thực tế để phân chia tế bào (phase M) chỉ mất khoảng 45 phút. Rõ ràng, phase S và phase M là hai phase rất quan trọng nó điều phối quá trình tái bản bộ gen trước khi sự phân chia tế bào xảy ra. Các giai đoạn trước khi vào phase S và phase M có vai trò là các trạm kiểm soát chu kì tế bào. Proteins, cyclins và cyclin-dependent kinases (CDKs) hoạt động kiểm soát trong mỗi giai đoạn của chu kì tế bào. Cyclins là một họ protein mà chúng liên kết và kích hoạt một số thành viên trong họ CDK. Cyclin có nồng độ thay đổi đột ngột trong chu kì tế bào làm tạo ra các dao động trong sự hoạt động của CDK hình thành cơ sở cho sự kiểm soát chu kì tế bào. Các trạm kiểm soát khác cung tồn tại chủ yếu trong phase S, ví dụ DNA bị sai được sữa chữa trước khi sự tái bản hoàn thành. Lee Hartwell, Paul Nurse và Tim Hunt được trao tặng giải Nobel sinh lý y học cho những khám phá về sự kiểm soát chu kì tế bào. 28
Sản xuất protein trong y học 1.10 Tái tổ hợp DNA thì không bao giờ được xem như là một phân tử tĩnh. Nó thay đổi liên tục và một cơ chế được tạo bởi sự thay đổi này được mang lại là tái tổ hợp (recombination). Sự tái tổ hợp là sự sắp xếp lại trên quy mô lớn các phân tử DNA. Kiểu sắp xếp lại này xảy ra như là một hệ quả của việc chia sẻ hai phân tử DNA hay những khu vực rộng lớn của chuỗi tương đồng (Sự tái tổ hợp tương đồng) hoặc những khu vực rất ngắn có tính tương đồng (Sự tái tổ hợp vùng đặc trưng). Các tế bào lưỡng bội có nhiều cơ hội để tìm những phần tương đồng khi xuất hiện sự tái tổ hợp. Sự tái tổ hợp ở vi khuẩn thì được giải thích đầu tiên bởi Alfed Hershev và Max Delbruck năm 1947. Họ nghiên cứu sự xâm nhiễm của E.coli với những thể thực khuẩn. Nếu một tế bào E.coli được xâm nhiễm cùng lúc với hai thể thực khuẩn T2 khác nhau về mặt di truyền, kết quả là quần thể thể thực khuẩn kể cả kiểu thể thực khuẩn tái tổ hợp cũng như các kiểu thể thực khuẩn gốc ban đầu (Hershey, 1947). Sự tái tổ hợp tương đồng xảy ra giữa hai phân tử DNA có trình tự chuỗi tương đồng về bản chất. Thông tin bộ về gen thì được trao đổi và hòa hợp giữa hai bản DNA sao cho những phân tử DNA được tái tổ hợp là một hỗn hợp của những DNA ban đầu. Một vài cơ chế đã được đề xuất để giải thích cơ sở phân tử của những vấn đề này. Nguyên tắc để hiểu được quy trình phân tử phức tạp trong sự tái tổ hợp nêu ra vào năm 1964 bởi Robin Holliday (Holliday, 1964). Mẫu tái tổ hợp của ông đòi hỏi phải có một điểm cắt (phân cắt tại liên kết phosphodiester giữa hai nucleotide) xuất hiện tại cùng một vùng trong hai phân tử DNA tương đồng (được gọi là DNA cho và nhận). Tương tác trao đổi trên sợi DNA sau đó xảy ra, tiếp theo đó DNA ligase sẽ hàn gắn lại những chỗ đó. Sự trao đổi trên sợi DNA cho và nhận dẫn đầu để tạo ra sự hình thành của một Holliday junction- một cấu trúc mà trong đó những chuỗi DNA lai kết hợp với phân tử DNA cho và nhận. Holliday junction có thể trải qua sự di động trong phân chia, dẫn đầu để tái tổ hợp nhiều hơn giữa hai sợi từ hai phân tử DNA khác nhau. Cuối cùng, chức năng xoắn cuộn cung cấp nhiều phân tử DNA tái tổ hợp. Ở đó, mặc dù, chúng tôi tập trung vào cơ chế biến đổi được đề xuất bởi Meselson và Radding (1975) kể từ khi sự kiện tái tổ hợp được công bố là có thể tạo ra một vết cắt đơn lẻ trên sợi DNA hay nó đúng hơn là những mẫu sớm hơn, dựa vào hai vết cắt DNA đã tái tổ hợp trước đó có thể xảy ra. Một mẫu đơn giản chỉ ra ở hình 1.21(a). Cùng với sự hình thành Holliday junction và sự xoắn cuộn của nó, với một vài protein E. coli biết được tiến trình xoắn cuộn, được chỉ ra bên dưới. Vết cắt được tạo bởi RecBCD endonuclease, chất mà sẽ tách sợi của chuỗi DNA được gọi là chi (  ) ở vị trí (5’-GCTGGTGG-3’). Sự xâm nhập vào chuỗi được xúc tác bởi RecA protein, dọc theo sợi đơn DNA liên kết với protein (SSB), là chất sẽ làm duỗi thẳng sợi DNA. ‘D-loop’ là được tạo thành sau khi sợi bị cắt một lần nữa bởi RecBCD endonuclease. Xuất hiện và kết thúc sự thay đổi trên sợi và được nối lại sử dụng DNA ligase. Hình thức này được gọi là Holliday junction. 29
Sản xuất protein trong y học Hình thức của Holliday junction tiếp theo là sự vận chuyển nhánh được xúc tác bởi protein RuvA và RuvB. Sự chuyển hóa của Holliday junction đòi hỏi phải có RuvC protein, chứa hai vết cắt trên sợi DNA. DNA ligase sau đó nối các sợi sau khi nó đã bị cắt. Hình 1.21 Tái tổ hợp tương đồng và tại những vị trí riêng biệt. (a) Mẫu Meselson-Radding của tái tổ hợp tương đồng. (b) Sự hòa hợp của  DNA bên trong hệ gen E.coli. Xem nội dung để hiểu rõ hơn. Tại thời điểm cuối của tiến trình, tế bào sẽ có hai phân tử là DNA được biến đổi. Tiến trình tương tự được chỉ ra ở trên cũng diễn ra ở Eukaryotes, sử dụng loài enzyme đã được hoạt hóa tương tự. Gần đây cấu trúc chuyển hóa cấp cao của Holliday junction được giữ ổn định bởi RuvA protein đã được giải quyết (Hargreaves và cộng sự, 1998). Không giống như tái tổ hợp tương đồng, tái tổ hợp trên vị trí riêng biệt xảy ra khi có một DNA đặc biệt, nó không phải là tất cả các điểm tương đồng của DNA khác, có 30
Sản xuất protein trong y học một chuỗi hoạt động có mục đích khi xảy ra sự tái tổ hợp DNA khác. Ở Prokaryotes, khi các nhóm DNA cuả bacterriophagae  bên trong NST của E. coli, nơi mà nó sẽ tồn tại trạng thái phóng thích vi khuẩn. Chúng tôi sẽ chỉ ra chu kỳ sống của  rõ hơn ở chương 3. Sự tái tổ hợp xảy ra giữa các vị trí ở DNA bacteriophage (attP) có sự tương đồng chuỗi với các vị trí trong DNA vi khuẩn (attB), thậm chí ở cả hai phân tử DNA khác nhau hoàn toàn trong tất cả các chuỗi khác. Sự tái tổ hợp này được chỉ ra ở hình 1.21(b). Enzyme xúc tác cho những quá trình này được gọi là enzyme integrase (Int), cùng với protein chủ yếu tố chủ đính vào (integration host factor- IHF). Khi DNA của thể thực khuẩn được cắt bỏ từ hệ gen của E.coli để bắt đầu cho sự hình thành một lượng thể thực khuẩn mới, một protein của thể thực khuẩn được gọi là Xis. Tái tổ hợp trên vị trí riêng biệt vẫn đòi hỏi cặp baze của vùng tương đồng (vị trí attP với attB), không bao gồm bất kỳ protein nào của chuỗi phản ứng hóa sinh tái tổ hợp tương đồng. 1.11 Gen và genome Thông tin di truyền bao gồm trình tự trên chuỗi DNA chỉ ra sản phẩm protein và enzyme xây dựng nên tế bào. Acid nucleic được sắp xếp thành các đơn vị được gọi là gen, tổng hợp tất cả các gen là genome. Hầu hết tất cả các gen thì được sử dụng như là khuôn để sản xất các loại protein. Protein bổ sung trong một loại tế bào riêng biệt thì đặc biệt một nang lông sẽ sản xuất keratin và một tế bào  tuyến tụy sẽ sản xuất insulin nhưng hàm lượng protein của tế bào cũng có thể thay đổi một cách đáng kể, như tính sẵn có của các chất dinh dưỡng. Điều này có nghĩa là những loại tế bào riêng biệt, những gen riêng biệt sẽ được thể hiện và một số khác sẽ không và tế bào phải có khả năng hoạt hóa những gen riêng biệt này để đáp ứng lại những tín hiệu từ bên ngoài. Và những gen này sẽ làm tăng các tín hiệu đó. Làm thế nào để tế bào có khả năng nhận biết được những gì bên trong hệ gen của nó, cái nào là gen cái nào không, làm thế nào tế bào có khả năng mở những gen riêng biệt trong khi tại cùng một thời điểm đó nó không có tác động đến sự thể hiện của gen khác. 1.12. Gennome Gen là gì? Nhưng chưa có câu trả lời nào thỏa đáng nhất. Gen được coi là một đơn vị di truyền bao gồm các acid nucleotic. Trong di truyền học cổ điển, một gen được mô tả như một phần rời rạc của nhiễm sắc thể xác định một đặc tính đặc biệt. Ở đây chúng tôi sẽ mô tả khung đọc mở (ORF – khu vực của gen sẽ được phiên mã và dịch mã thành protein) cùng với các yếu tố kiểm soát phiên mã (promoter and terminator). Vì vậy, một gen không chỉ là trình tự mã hóa chính nó mà nó còn chứa các thông tin cần thiết cho sự biểu hiện của các trình tự mã hóa đó. Hầu hết các ORFs đều có một dạng chung ( Hình 1.22). Chúng đều bắt đầu với một bộ ba riêng biệt của DNA (ATG) và kết thúc dựa vào tín hiệu dừng, một lần nữa một bộ ba căn cứ vào DNA (TGA, TTA, TAG). Các trình tự ở giữa sẽ trực tiếp mã hóa cho các protein (sinh vật nhân sơ) hoặc được chia thành một loạt các exon và intron (sinh vật nhân chuẩn). Chúng ta sẽ thảo luận về exon và intron sau, nhưng với sự ra đời của bộ gen đầy đủ trình tự (Chương 9), một gen được định nghĩa như là một chuỗi DNA có ít nhất 100 codon ở giữa, có mã mở đầu và mã kết thúc. Với các trình tự đơn, tuy nhiên là không 31
Sản xuất protein trong y học đủ để sản xuất trực tiếp protein. Mỗi gen đòi hỏi các trình tự DNA khác nhau liên kết với nhau tạo thành các protein như RNA polymerase, các yếu tố điều hòa phiên mã và dịch mã. Khi kết hợp, các thành phần mã hóa gen, các promoter và terminator của mẫu gen chức năng, đôi khi được gọi là đơn vị phiên mã. Làm thế nào để nhiều gen có mặt trong một bộ gen, làm thế nào để có nhiều gen cần thiết cho tế bào và nó được thể hiện cùng một lúc trong cơ thể. Sự ra đời của một bộ gen hoàn chỉnh (Chương 9) đã giải quyết được một phần câu hỏi trên. Hình 1.22. Các hình dạng đặc thù của gen prokaryotes và eukaryotes mã hóa protein. Ở prokaryotes tập hợp các gen cần thiết, ví dụ tạo ra các enzyme cần thiết trong quá trình phiên mã. Operon gồm các liên kết RNA polymerase (promoter) và các yếu tố kích thích quá trình phiên mã như cAMP gắn vào kích hoạt protein (CAP). Khi gắn lên protein được kích hoạt quá trình phiên mã diễn ra nhanh hơn. Ngoài ra, các operon còn chứa các liên kết với với các protein bị ức chế, khi liên kết với DNA, để polymerase liên kết và dừng quá trình phiên mã. Quá trình phiên mã dừng lại với mã kết thúc tại đầu 3’ của operon. Hình dưới đây là trình tự của vùng kiểm soát của lac operon. Ở sinh vật eukaryotes, gen được sản xuất đơn lẻ và theo quy định riêng. Chúng chứa các chất hoạt hóa và các chất ức chế ở đầu 5’. Nó cũng chứa vài nghìn base ở đầu gen để biểu hiện gen đầy đủ. Kích hoạt lắp ráp phức hợp polymerase RNA holoenzyme II tại hộp TATA và quá trình phiên mã bắt đầu một khoảng ngắn về phia đầu 3’. Một lần nữa kết thúc quá trình phiên mã xảy ra tại điểm vào cuối gen tại đầu 3’. Có sự khác biệt lớn giữa sinh vật prokaryotes và sinh vật eukaryotes là sự hiện diện của đoạn intron và extron. Ở eukaryotes, các đoạn intron bị cắt bỏ, nối các đoạn exon lại với nhau trước khi đi vào quá trình dịch mã. Các trình tự DNA của vùng khởi động của gen β-globin chuột cũng được biểu diễn. 32
Sản xuất protein trong y học Làm thế nào nhiều gen có thể chứa trong cùng một bộ gen? Các bộ gen của vi khuẩn E.coli ( dài 4.6 Mb) có khoảng 4.200 gen. Độ dài trung bình của một gen trong E.coli là khoảng 950 bp, sự tách biệt trung bình của các gen là 118 bp, do đó phần lớn mã hóa cho RNA hoặc protein. Các Saccharomyces cerevisiae, một eukaryote đơn bào, có kích thước bộ gen lớn hơn (13.5 Mb) và có khoảng 6000 gen. Con người, bộ gen lớn gấp 250 lần bộ gen của nấm men (3300 Mb), nhưng có khoảng 30000 gen – đại diện cho sự gia tăng gấp 5 lần. Làm thế nào để có nhiều gen cần thiết trong cơ thể? Để xác định một gen cần thiết cho cơ thể thì chức năng của gen đó phải suy yếu một mức độ nào đó. Điều này thường đạt được bằng sự loại thải gen, nơi mà gen được lấy ra từ hệ gen và các biểu hiện của nó trên tế bào xác định tính khả thi. Phân tích như thế này cho thấy rằng khoảng một nữa bộ gen của vi khuẩn E.coli và nấm men cần thiết cho khả năng tồn tại. Nhiều gen dường như không cần thiết. Tỷ lệ phần trăm của các gen có thể phản ảnh suy biến chức năng giữa các bộ nhất định của gen. Làm thế nào nhiều gen được biểu hiện cùng một lúc? Các gen được thể hiện trong một tế bào đặc biệt. Một số gen biểu hiện trong tế bào gan phải khác với những gen biểu hiện trong tế bào da. Phân tích toàn bộ bộ gen của tất cả các gen trong sinh vật có đầy đủ trình tự như nấm men cho thấy rằng khoảng 90% gen được biểu hiện cùng một lúc, nhưng 80% trong số này được thể hiện với mức độ phong phú thấp theo thứ tự là 0.1 – 2. Mức độ biểu hiện của các gen cũng sẽ rất khác nhau. Rất nhiều protein được sản xuất từ các gen có mức biểu hiện cao, trong khi các protein khác biểu hiện ở mức độ thấp hơn nhiều thường được sản xuất từ gen được thể hiện ở mức độ thấp. Sản phẩm trung gian giữa DNA và protein là RNA. Quá trình chuyển đổi chuỗi DNA thành các protein xảy ra qua hai giai đoạn. DNA được phiên mã ra RNA sau đó được dịch mã ra các chuỗi polypeptide của protein. Như chúng ta đã nhìn thấy (Hình 1.5) RNA khác với DNA ở chỗ nó có chứa một đường ribose thay vì một đường deoxyribose. Ngoài ra, Uracil thay thế cho Thymine như là base bổ sung cho Adenine trong RNA. Phiên mã cũng tương tự như quá trình tự sao mã DNA chỉ khác là một trong hai sợi DNA được sao chép. Có hai loại RNA được tạo ra từ sự phiên mã, RNA thông tin (mRNA) và RNA cấu trúc (ribosome RNA (rRNA) và RNA vận chuyển (tRNA)). Mặc dù cho đến nay, hình thức phong phú nhất của RNA trong hầu hết các tế bào đại diện cho một vài phần trăm trong tổng số RNA là mang thông tin di truyền. 1.13. Quá trình phiên mã Phiên mã là quá trình tạo ra bản sao RNA từ một sợi trong chuỗi xoắn kép DNA. Các sợi antisense của AND được dùng để tổng hợp một phân tử RNA theo nguyên tắc bổ sung. Phân tử RNA được tạo ra giống với sợi có chiều từ 5’ đến 3’ của DNA chỉ khác là nó chứa U thay vì T. Có sự khác biệt cơ bản trong sự phiên mã ở sinh vật nhân sơ và sinh vật nhân chuẩn. Ở đây, điều quan trọng là hiểu được các quy trình liên quan đến từng trường hợp. Trong nhiều thí nghiệm chúng tôi nhận thấy có nhiều vấn đề khi sử dụng các tế bào nhân chuẩn, nhưng các vi khuẩn E.coli vẫn đóng một vai trò quan trọng trong hầu hết các thí nghiệm kỹ thuật di truyền. 33
Sản xuất protein trong y học Quá trình phiên mã bắt đầu từ trình tự DNA đặc trưng được goi là mã mở đầu. Giống như nhân đôi DNA, phiên mã xảy ra trong ba giai đoạn : bắt đầu, kéo dài, kết thúc. Bắt đầu phiên mã thường xảy ra ở đầu 3/ cuả mã mở đầu, chấm dứt dựa vào trình tự kết thúc. Thoạt nhìn, các cấu trúc tổng thể của gene prokaryotic and gene eukaryotic tương tự nhau. Tuy nhiên, vùng kiểm soát các gen nhân chuẩn sẽ không hoạt động trong tế bào prokaryote và ngược lại. Hầu hết các gen mã hóa protein ở sinh vật nhân sơ hoạt động phiên mã một cách tự động. Khi vắng mặt các yếu tố khác, RNA polymerase có thể nhận ra vùng mở đầu, liên kết với nó và tạo ra RNA. Các RNA polymerase của sinh vật nhân điển hình khi tham gia vào việc mã hóa protein (pol II) không nhận biết được các trình tự của vùng mở đầu của riêng mình. Vì vậy, ở các gen sinh vật nhân chuẩn quá trình phiên mã không diễn ra trong trường hợp không có các yếu tố khác. Ở Prokaryotes và Eukaryotes phiên mã là một quá trình có quy định. Đúng thời gian và mức độ biểu hiện gen cần thiết cho hầu hết các qúa trình của tế bào. 1.13.1. Quá trình phiên mã ở Prokaryotes Francois Jacob and Jacques Monod là những người đầu tiên đã xây dựng một mô hình gene điều hòa trong tế bào vi khuẩn. Họ thực hiện trên hệ thống trao đổi chất lactoza trong vi khuẩn đường ruột (E.coli). Lactoza là một disaccharit của galactoza và glucoza. Khi vi khuẩn sống trong môi trường chứa đường lactose nó biểu thị những gen cấu trúc sau: β-galactosidase: enzyme xúc tác sự phân giải lactose thành glucose và galactose. Nó được mã hóa bởi gene lac Z. Lactose permease: enzyme khoang màng tế bào và mang lactose vào tế bào. Nó được mã hóa do gen lac Y. Thiogalactoside transacetylase: các chức năng của enzyme này không được biết rõ. Nó được mã hóa do gen lac A. Ba enzyme nằm liền kề nhau trong hệ gen của vi khuẩn E.coli (Hình 1.23) và một vùng của DNA có trách nhiệm phiên mã quy định nằm ở đầu 5/ của gen cấu trúc . Nó được gọi là operon lac. Để chuyển hóa đường lactose, các gen cấu trúc phải được biểu hiện và protein phải được tạo ra. Nguồn đường để cung cấp cho E.coli là đường glucose, vì nó không cần phải chuyển đổi khi vào cơ thể. Vì vậy, nếu cả glucose và lactose có sẵn, vi khuẩn sẽ ngừng quá trình chuyển hóa đường lactose thành glucose.Các operon lac gồm các thành phần sau:  Operator (lacO) – vùng vận hành, protein ức chế có thể liên kết làm ngăn cản sự phiên mã.  Promoter (lacP) – vùng khởi động, nơi mà RNA polymerase bám vào và khởi đầu phiên mã.  Repressor (lacI) gene – vùng ức chế protein.  Pi vùng mở đầu của lac I.  CAP liên kết cAMP/CAP Trong trường hợp không có lactose, RNA polymerase liên kết với vùng khởi động, nhưng nó ngăn cản sự phiên mã của các gen cấu trúc bởi các protein ức chế liên kết với vùng vận hành (Lee and Goldfarb, 1991). Do đó, không có RNA được tạo ra, không tạo ra protein. Các chất ức chế được sinh ra từ lac I do RNA polymerase liên kết với vùng khởi động (Pi). Khi môi trường có lactose, nó hoạt động như một operon 34
Sản xuất protein trong y học cảm ứng. Một số phân tử lactose liên kết với protein ức chế làm biến đổi cấu hình không gian ba chiều của nó làm cho protein ức chế không liên kết được với vùng vận hành. Khi đó RNA polymerase có thể lên kết với vùng khởi động và RNA có thể được tạo ra từ 3 gen cấu trúc. Lactose có thể được chuyển hóa. Một câu hỏi đặt ra ở đây là cách chuyển hóa lactose được quay về như ban đầu. Như đã nêu ở trên, các gen cấu trúc dịch mã tạo ra các enzyme phân giải đường khi môi trường có lactose, khi không có đường lactose quá trình phiên mã bị dừng lại. Vì vậy, có vẻ như không thể đạt được kích hoạt, kể cả kích hoạt là cần thiết để phân giải đường lactose trong cơ thể. Tuy nhiên đây là một quá trình đơn giản. Mỗi gen cấu trúc được phiên mã ở mức độ thấp, trung bình (khoảng 5 bản sao mỗi tế bào) trong trường hợp không có lactose. Có nghĩa là vi khuẩn khi gặp một nguồn lactose nó có thể vận chuyển một vài phân tử vào trong tế bào gây cảm ứng tác động lên gen cấu trúc. Sau khi gây cảm ứng lên các gen cấu trúc khoảng 5000 bản sao của protein có mặt trong tế bào. Hình 1.23:Việc kích hoạt của operon lac trong E.coli. Trong trường hợp không có lactose, các protein ức chế liên kết với vùng vận hành (O) và ngăn không cho RNA polymerase liên kết với vùng khởi động để tiến hành phiên mã. Khi môi trường có lactose, một số phân tử lactose liên kết với protein ức chế làm biến đổi cấu hình không gian ba chiều của nó làm cho protein ức chế không thể liên được với vùng vận hành. Bây giờ, ARN polymerase có thể liên kết được với vùng khởi động để tiến hành phiên mã từ 3 gen cấu trúc (lacZ, lacA and lacY). Việc kích hoạt các gen lac chỉ xảy ra khi không có glucose catabolite activator protein (CAP) liên kết với vùng vận hành và để cho RNA polymerase liên kết với vùng khởi động. Quá trình kiểm soát vùng vận hành phức tạp hơn vì nó cần dừng lại nếu có glucose, không cần biết lactose trong môi trường có hay không. Khi glucose trong cơ thể cao, sản xuất theo chu kỳ AMP (cAMP) bị ức chế, khi nồng độ đường giảm, một chất liên lạc là AMP vòng được sản xuất. cAMP gắn vào và hoạt hóa CAP (catabolite activator protein), sau đó gắn lên DNA tại vùng vận hành. Điều này kích hoạt cho sự phiên mã của các gen cấu trúc diễn ra nhanh hơn bằng cách tăng ái lực cho các RNA 35
Sản xuất protein trong y học polymrase gắn vào vùng khởi động để tiến hành phiên mã. Hiện tượng này gọi là catabolite repression, khi đường ức chế sự phiên mã của operon lac bằng cách không cho kích hoạt đầy đủ. Giống như operons ở prokaryotes, ba gen cấu trúc được phiên mã như là một mRNA. Mỗi ORFs chứa ribosome của riêng nó trong mRNA được mã hóa độc lập với các gen khác. Chúng ta xem quá trình phiên mã diễn ra như thế nào, và quá trình phiên mã kết thúc như thế nào? Một RNA polymerase bắt đầu quá trình phiên mã, di chuyển dọc theo DNA, tổng hợp RNA, cho đến khi nó kết thúc. Ở đây, các polymerase dừng lại nối thêm nucleotide vào chuỗi RNA, tạo các sản phẩm hoàn chỉnh và tách ra khỏi chuỗi DNA. Kết thúc quá trình phiên mã dựa vào 2 yếu tố sau: Rho-dependent termination: các protein rho liên kết với các chuỗi RNA mới được tổng hợp và nó xuất hiện để kết thúc quá trình phiên mã khi polymerase dừng ở các trình tự DNA nhất định. Rho-independent termination: kết thúc độc lập. Hình thức kết thúc độc lập này không phụ thuộc các yếu tố khác và là hình thức phổ biến nhất kết thúc quá trình phiên mã trong E.coli. 1.13.2 Quá trình phiên mã ở Eukaryotes Quá trình kích hoạt biểu hiện gen ở sinh vật nhân chuẩn (eukaryotes) phức tạp hơn nhiều so với sinh vật nhân sơ (prokaryotes). Có sự khác biệt nhiều giữa các sinh vật eukaryotes và sinh vật prokaryotes là các va chạm khi kích hoạt gen và quá trình tạo ra RNA. Sinh vật eukaryotes có nhiều enzyme RNA polymerase. Việc đóng gói DNA vào thể nhân đại diện cho một rào cản đối với sự phiên mã. Việc tách biệt của nhân (nơi xảy ra phiên mã) và tế bào chất (nơi diễn ra dịch mã) ở eukaryotes có nghĩa là phải có cơ chế để bảo vệ mRNA khỏi suy thoái trong tế bào chất trước khi hoàn thành quá trình dịch mã. Gen ở sinh vật eukaryotes là monocistronic, mỗi gen được phiên mã theo từng đoạn riêng bắt đầu với phần khởi động riêng của nó. Gen ở sinh vật eukaryotes không liên tục và được chia thành các vùng mã hóa và các vùng không mã hóa. Chúng ta sẽ xem xét từng vấn đề làm thế nào một gen có thể phiên mã được và RNA được tạo ra như thế nào? Eukaryotes chứa ba RNA polymerase khác nhau, chịu trách nhiệm phiên mã cho từng gen nhất định. Mỗi polymerase là tập hợp các protein có liên quan, giữa nhiều thứ khác, điều chỉnh hoạt động polymerase. Hoạt động của polymerase II (mã hóa cho protein) được gắn trên vùng khởi động của đoạn DNA để tiến hành phiên mã. Khi không có các yếu tố kích hoạt quá trình phiên mã không diễn ra. Vai trò của các chất hoạt hóa được tập trung nhiều. Tuy nhiên, nó xuất hiện để đơn giản các phức hợp protein để tìm gen mục tiêu. Kiểm soát biểu hiện gen thông qua các chất kích hoạt. Những chất hoạt hóa có hai chức năng riêng biệt. Đầu tiên, nó phải có khả năng liên kết với DNA để tìm thấy gen mục tiêu trong trình tự DNA. Thứ hai, tham gia vào các 36
Sản xuất protein trong y học liên kết protein- protein để RNA polymerase thông qua miền kích hoạt. Một trong những chức năng này có thể được điều chỉnh biểu hiện gen để đáp ứng các tín hiệu cụ thể. RNA Đơn vị Sản phẩm polymerase I Nucleolus 28S, 18S, và 5.8S rRNA II Nucleus mRNA, và một vài snRNA tRNA, 5S rRNA và một vài III Nucleus snRNA Hình 1.24. Vai trò của những chất kích hoạt làm tăng khả năng biểu hiện ở gen eukaryotes. Các liên kết của các chất hoạt hóa protein thông qua miền liên kết trên DNA (DBD) có thể xảy ra ở một phần thể nhân hoặc trên DNA. Một vấn đề bổ sung cho quá trình phiên mã của các gen ở sinh vật eukaryotes là phần lớn các DNA được đóng gói tại thể nhân, là rào cản để lắp ráp các phức hợp phiên mã. Nhiều chất hoạt hóa có thể liên kết với các trình tự trên DNA. Sau khi liên kết DNA, kích hoạt một hoặc nhiều hơn những phức hợp gen. Chromatin-modifying complexes: protein histone tạo thành lõi của thể nhân. Tuy nhiên, như đã thấy ở hình 1.15, các acid amin ở trình tự kết thúc của histone nhô ra ngoài. Những phần nhô ra đó có thể sửa đổi được, bởi các tiên tố, phosphoryl hóa và 37
Sản xuất protein trong y học methyl hóa của các acid amin cụ thể (Figure 1.25(a)), và việc thay đổi đóng vai trò quan trọng trong quá trình phiên mã. Mặc dù các đuôi đó không cần thiết để duy trì sự toàn vẹn cấu trúc nucleosome, nó không có vai trò trong cấu trúc nhiễm sắc thể bậc cao và trong các tương tác với các non-histone chromosomal proteins. Sự acety hóa của histone được thực hiện bởi các enzyme histone acetyltransferases (HATs) trong khi các phản ứng ngược lại được xúc tác bởi enzyme histone deacetylases (H-DACs). Sự acelty của lysine trong việc loại bỏ các điện tích dương từ protein (Hình 1.25 (b)). Những đuôi histone acelty hóa có thể tương tác với DNA lỏng lẻo hơn để các phức histone – DNA linh động và có thể dễ dàng phân ly để quá trình phiên mã xảy ra. Hình 1.25. Sửa đổi các “đuôi” histone Nhiễm sắc thể tái hợp: những phức hợp chẳng hạn như SWI/SNF proteins sử dụng năng lượng có nguồn gốc từ ATP để di chuyển thể nhân. Cơ chế chính xác thì không rõ ràng, nhưng chúng có chức năng như ATP điều khiển chuyển động dọc theo DNA và phá vỡ liên kết protein- DNA khi di chuyển. Các tương tác giữa các chất hoạt hóa và protein mô tả ở trên dẫn đến một mô hình để kích hoạt gen phải liên kết với DNA. Các chất hoạt hóa làm thay đổi cấu trúc nhiễm sắc thể và sau đó tái hợp lại để loại bỏ thể nhân từ promoter, và cuối cùng Pol II được đưa đen vùng khởi động để quá trình phiên mã có thể bắt đầu. Cấu trúc thể nhân các điện tích dương (lysine và arginines) của histone được đặt liền kề với chuỗi xoắn DNA âm tính. 38
Sản xuất protein trong y học Hình 1.26 Cấu trúc của enzyme RNA polymerase II. (a) Mô hình chung cho 10 tiểu đơn vị của RNA polymerase. Các hình cầu lớn màu đỏ trong khe ở trung tâm của phân tử đại diện cho các ion magiê. Một sơ đồ sắp xếp của tiểu đơn vị trong cấu trúc protein, được biểu hiện trong bảng (b) và protein vòng với cả cấu trúc DNA xoắn lại (màu xanh dương và xanh lá cây) và RNA (màu đỏ) trong hình (c).Những thông tin này được cung cấp từ Patrick Cramer (Đại học Munich) và được tái bản với sự cho phép bộ khoa học (Cramer và cộng sự, 2000;. Gnatt và cộng sự, 2001.). Bản quyền thuộc Hiệp hội Khoa học Mỹ vì sự tiến bộ khoa học. Hình 1.27. Cấu trúc của một phân tử mRNA ở sinh vật nhân chuẩn. Sau khi được phiên mã, đầu 7 methyl-guanosine được gắn vào đầu 5’ của đoạn mRNA tại vị trí nhóm đường ribose đầu tiên, đôi khi là thứ 2, nucleotide được methyl hóa ở vị trí 2’. Đầu 3’ được polyadenin hóa do gắn thêm 100-200 adenin. Thật vậy, bằng chứng gần đây cho thấy các enzyme và các chất tham gia vào phiên mã, RNA được phiên mã và dịch mã có thể rộng rãi cùng với sự biểu hiện hình thức tối đa hóa hiệu quả và đặc trưng của mỗi giai đoạn của biểu hiện gen (Maniatis và Reed, 2002). 1.14. Quá trình hình thành RNA Có lẽ sự khác nhau rõ rệt nhất giữa bộ gene của sinh vật nhân nguyên thủy và sinh vật nhân chuẩn đó là bộ gene của loài tiến hóa hơn được chia thành exon (vùng 39
Sản xuất protein trong y học mã hóa) và introns (vùng không mã hóa). Trong những năm giữa thập kỉ 70, Philip Sharp và Richard Rorberts đã độc lập lai tạo được một mRNA được sao chép từ DNA, và xem đoạn lai được này dưới kính hiển vi điện tử. Họ đã phát hiện ra lai RNA xuất hiện các trình tự gián đoạn trong DNA. Đó là mối liên hệ giữa mRNA với cấu trúc DNA, nơi nó xuất phát sẽ dẫn đến sự hình thành cấu trúc vòng trong mạch DNA, tương ứng với trình tự trong DNA mà không có mặt trong mRNA (theo Chow và các cộng sự năm 1977; Berget, Moore và Sharp, năm 1977). Walter Gilbert đã đặt tên cho những vùng khác nhau này. Đoạn gene được tái hiện lại ở mRNA và vì thế là những phần của vùng giống hệt, được gọi là exon. Đoạn gene có trình tự xen vào gọi là introns. Cơ chế tiền RNA chuyển đổi thành mRNA hay nói cách khác, làm thế nào các đoạn introns được loại bỏ, đã trở thành chủ đề được nghiên cứu sôi nổi từ phát hiện của họ. Trước khi đề cập đến vấn đề này, chúng ta cần tìm hiểu một phân tử mRNA đã được hình thành như thế nào. Ngay khi một gene được phiên mã, mRNA được tạo ra có nhiều sửa chữa. Hầu hết là ngay khi quá trình tổng hợp mRNA bắt đầu, cuối đầu 5’ của đoạn mRNA được thêm vào gốc 7-methyl guanosine. Phần đầu được gắn vào điểm cuối 5’ của đoạn mRNA bằng cách trùng ngưng 5’-5’ của guanosine với mRNA để tạo thành cấu trúc bao gồm 3’-G-5’ppp5’-N-3’p. Sau khi hình thành đầu 5’, 1 nhóm methyl được gắn vào gốc guanine và đến nucleotide đầu tiên và/hoặc nu thứ hai liền kề (hình 1.27). Chức năng của đoạn mở đầu không rõ ràng. Người ta dự đoán rằng phần đầu, và protein liên kết với nó, điều khiển ribosome liên kết và khởi đầu dịch mã một cách chính xác. Cùng với đoạn đầu, phần đuôi 3’ của mRNA được cắt từ chuỗi mở rộng và được gắn chuỗi Adenin. Tín hiệu từ một polyA có trong RNA điều khiển sự chia tách bản sao RNA và sự gắn chuỗi Adenin (hình 1.28). Tín hiệu từ trung tâm của chuỗi Adenin ở tiền mRNA của động vật có xương sống bao gồm 2 đơn vị nhận biết phía bên vùng chia tách-gắn chuỗi Adenin. Một cách đặc trưng, một lượng lớn không đổi 5’-AAUAAA-3’ hexamer được tìm thấy từ 20-50 nucleotide ngược dòng của các đơn vị thay đổi hơn giàu U hoặc GU. Sự chia tách sợi sớm xảy ra giữa những cặp đơn vị này và được kết hợp với việc gắn thêm khoảng chừng 200 adenosine ở đầu 3’ hoặc 5’ của sản phẩm đã tách được. Hai yếu tố protein yêu cầu cho quá trình này là sự phân cắt và yếu tố gắn chuỗi Adenin đặc biệt (CPSF), nó liên kết với chuỗi được lặp đi lặp lại AAUAAA, và yếu tố kích thích sự phân cắt (CStF), liên quan đến các đơn vị xuôi dòng giàu GU. Khi tín hiệu của polyA được phát ra từ enzyme polymerase, nó nhận biết các yếu tố phân cắt và gắn chuỗi polyA vừa được thêm vào từ RNA polymerase CTD. Sau đó quá trình hợp thể tiếp tục với nhiều yếu tố tham gia vào phức hợp. Cuối cùng sự phân cắt xảy ra, tiếp theo quá trình gắn một đoạn khoảng 200 Adenine vào đầu 3’ của mRNA. Quá trình gắn polyA chỉ xảy ra ở mRNA nhưng không phải tất cả mRNA, ví dụ, mRNA đặc biệt mã hóa protein histone thì không có quá trình gắn chuỗi adenine. Quá trình gắn chuỗi Adenin được thực hiện bởi enzyme polyA molymerase (PAP), và nó không chỉ giữ ổn định cho quá trình sao mã mà nó còn cần thiết cho quá trình di chuyển mRNA ra khỏi nhân, vào tế bào chất, nơi quá trình dịch mã diễn ra. Như chúng ta sẽ 40
Sản xuất protein trong y học thấy ở những chương sau, việc gắn thêm chuỗi Adenin vào mRNA có một kết quả thực tế quan trọng. Sự lai chuỗi polyT chỉ để chỉ mRNA, không phải các RNA khác, là một công cụ quan trọng cho các kỹ sư di truyền. 1.14.1 Nối RNA Có một vài kỹ thuật nối RNA khác nhau, có chức năng trên các dạng RNA khác nhau. Tuy nhiên, ở đây chúng tôi chỉ tập trung vào kỹ thuật nối mRNA từ sự hiểu biết nó, tầm quan trọng của nó, là được áp dụng nhiều nhất trong kỹ thuật di truyền. Phần đầu và phần đc gắn chuỗi A của mRNA được nối với nhau nhằm tách đoạn introns và nối các đoạn exons với nhau thành 1 đơn vị duy nhất được dịch mã. Điều cần thiết để sản xuất các sản phẩm ghép một cách chính xác là rõ ràng. Khi hợp nhất các đoạn exon với nhau bị trượt bất kì cũng gây ra hậu quả tai hại cho protein vừa được tạo ra cuối cùng. Có bao nhiêu ranh giới giữa một đoạn intron và exon được đánh dấu, và sự ghép nối thực sự diễn ra bởi kỹ thuật phân tử nào? Đáng ngạc nhiên, có tương đối ít trình tự RNA bảo tồn ở ranh giới intron-exon. Phần lớn introns bắt đầu với chuỗi dinucleotide 5’- GU-3’ và kết thúc bằng các trình tự dinucleotide 5’-AG-3’ (Hình 1,29). Tuy nhiên, có một số ít trình tự bảo tồn được thể hiện ở vùng introns mà hoạt động như là vùng liên kết cho phức hợp, cần thiết cho việc ghép nối. Những phức hợp này, được gọi chung là spliceosome, mà thành phần bao gồm RNA và proteins, và chỉ thấy duy nhất trong nhân. Phân tử RNA tìm thấy trong spliceosome rất nhỏ ( khoảng 100-200 nucleotides) và được kết hợp với proteins tạo thành thể nhân nhỏ ribonucleoproteins (snRNPs, hay snurps). Phân tử RNA có trong những phức hợp này chứa nhiều Uridine, do đó mà snRNPs được mô tả dưới các tên U1, U2, U4, U5 và U6. Một mô hình về chu trình nối tổng thể được enzyme spliceosome xúc tác thể hiện qua hình 1.29. Cơ chế nối exon và đẩy introns phụ thuộc vào hai phản ứng ester, mà kết quả là hình thành dạng lariat của introns và hợp nhất các exon. Các nhánh liên kết với nhóm Adenin có trong intron của thể lariat chứa 2 liên kết phosphodiester nối 2’ và 3’ của Adenin. snRNP đóng vai trò trong quá trình xúc tác và trong duy trì cấu trúc 2 exon kế nhau như là chất bắt đầu cho phản ứng gắn 2 exon kề nhau. Người đọc quan tâm đến cơ chế nối chuyển hướng tới nội dung đặc biệt trong chủ đề ( theo Sharp, 1994). 1.14.2 Nối thay thế Mỗi một exon trong bộ gene của eukaryout mã hóa một phần protein, chúng ta có thể tưởng tượng rằng điều này là có thể, bằng cách biến đổi tiền mRNA như thế nào trước khi nó được ghép lại, để tạo ra những kiểu mRNA khác nhau và cuối cùng là các protein khác nhau. Nối thay thế là một hiện tượng xảy ra rộng rãi, với các ước tính gần đây cho thấy rằng có ít nhất 30% gene ở người được xem là đối tượng của loại chu trình này ( Sorek và Amitai, 2001). Làm thế nào để nối ghép các biến thể khác với các trình tự ban đầu, mà từ đó tìm thấy được nguồn gốc của chúng? Các hoạt động sinh lý của các protein được tạo ra từ ghép nối các biến thể có thể là giống nhau, ngược nhau hoặc hoàn toàn khác nhau và không có liên quan với nhau. Do đó nối thay thế làm gia tăng một cách đáng kể số lượng hoạt động của các protein khác nhau, chúng có thể được tạo ra từ các gene được chỉ định có trong bộ gene. 41
Sản xuất protein trong y học Một trong những ví dụ nổi bật nhất của nối thay thế có lẽ được thấy trong các gene xác định giới tính trong ruồi giấm Drosophila melanogaster. CÓ 3 gene liên quan đến quá trình xác định giới tính: sxl ( sex lethal), tra( transformer) và dsx ( double sex) ( Chabot, 1996). Mỗi loại gene này sản sinh ra một tiền mRNA, tiền mRNA này có 2 kiểu nối có thể, tùy thuộc vào ruồi có giới tính đực hay cái. Hình 1.30 thể hiện 3 loại gene này và các mô hinh nối của chúng. Đối với ruồi đực, với 2 exon ( exon 3 trong sxl và exon 2 trong tra) tạo ra các phân tử mRNA có các condon kết thúc và kết quả là tạo ra các protein bất hoạt. Protein được tạo ra ở ruồi đực chỉ hoạt động khi được dịch mã từ gene dsx. Protein này bất hoạt tất cả các gene đặc biệt của con cái. Mặt khác ở ruồi cái, tạo ra mRNA không có condon kết thúc trong exon. Trong trường hợp gene sxl và tra, protein được tạo ra có 1 ảnh hưởng tích cực về mô hình nối được quan sát, kiểm soát việc lựa chọn loại bỏ introns nào trong các phản ứng spliceosome. 1.15. Dịch mã Dịch mã là quá trình mà qua đó các cấu trúc RNA và các protein liên quan, giải mã chuỗi thông tin chứa trong mRNA để tạo ra các chuỗi amino acid , gọi là polypeptide, tạo thành protein. Trình tự nucleotide của mRNA được đọc với 3 nu 1 lần ( một codon). Mỗi một condon gắn 1 amino acid đặc biệt vào chuỗi peptide đang được tạo ra. Dịch mã bắt đầu tại một codon khởi đầu, AUG, và kết thúc tại một trong 3 condon kết thúc khác nhau, UÂ, UGA hoặc AUG ( xem phụ lục 1). Mỗi một bộ 3 được đọc lần lượt từ condon mở đầu trở đi ( hình 1.31). Có 20 loại amino acid khác nhau được tìm thấy trong protein. Các bộ ba mã di truyền, tuy nhiên, lại cho tới 64 codon khác nhau ( Phụ lục 1). Như vậy, có hiện tượng thoái hóa trong mã di truyền, với hấu hết các amino acid được mã hóa bởi hơn 1 codon. Ví dụ, methionine được mã hóa bởi một codon duy nhất (AUG), trong khi đó leucine và arginine được mã hóa bởi 6 codon. Mã di truyền rất phổ biến. phần lớn các gene của tất cả sinh vật tuân theo các mã giống nhau, tuy nhiên, một số gene mã hóa ty thể đi chệch khỏi các mã. Ví dụ, ty thể người và nấm men sử dụng codon kết thúc UGA để them amino acid tryptophan vào chuỗi polypeptide đang kéo dài. Sự biến đổi trong chuỗi DNA có thể gây ảnh hưởng mạnh kẽ đến trình tự protein được tạo ra. Trong ví dụ được thể hiện ở hình 1.31, đột biến ở chuỗi DNA làm biến đổi T trên chuỗi xuôi thành G kết quả làm thay đổi codon mã hóa serine (UCU) thành codon mã hóa alanine (GCU). Việc thêm, bớt nucleotide gây ảnh hưởng lớn lên protein được mã hóa. Ví dụ cho thấy, đột biến thêm base GC làm biến đổi cấu trúc đọc trong dịch mã dẫn đến kết quả protein có trình tự hoàn toàn khác với trình tự ban đầu sau vị trí đột biến. Đột biến dạng này được gọi là đột biến khung đọc (frame-shift mutation). Không phải tất cả đột biến DNA đều làm thay đổi trình tự protein. Ví dụ, nếu codon mã hóa serine được nói ở trên bị đổi từ UCU thành UCG thì codon mới này vẫn sẽ mã hóa serine. Các đột biến này được gọi là đột biến câm (silent mutation), vì chúng không gây đột biến trình tự protein. Các tRNA làm trung gian trong quá trình dịch mã. Nó vận chuyển một amino acid đặc trưng đến bộ 3 mRNA mã hóa nó. Emzyme được gọi là cặp aminoacyl-tRNA synthetases được mã hóa từ codon liên quan đến tRNA chứa anticodon thích hợp. Cặp 42
Sản xuất protein trong y học codon-anticodon chỉ đạo việc bổ sung chính xác các amino acid vào chuỗi polypeptide đang hình thành. RNA được dịch mã nhờ ribosomes. Những cấu trúc hai phía gồm một tiểu đơn vị lớn và tiểu đơn vị nhỏ. Mỗi tiểu đơn vị chứa RNA cấu trúc (rRNAs) liên kết với protein thực hiện các phản ứng hóa học đa dạng liên quan đến dịch mã. Cơ chế dịch mã có thể giống với sao chép và phiên mã DNA, được chia làm 3 bước: bắt đầu, kéo dài và kết thúc. Ở vi khuẩn, giai đoạn bắt đầu khi ribosome tập hợp trên chuỗi Shine-Dalgarno giàu purine ( 5’-AGGAGGU-3’) 4-8 base xuôi dòng của codon mở đầu ( Shine và Dalgarno, 1975). Trình tự này được bổ sung đầu 3’ của rRNA 16S (5’-ACCUCCU-3’) của tiểu đơn vị ribosome 30S, và vị trí các ribosome bắt đầu dịch mã. Ở sinh vật nhân chuẩn, ribosome tập hợp xảy ra ở trình tự Kozak ( vị trí tối ưu 5’-ACCAUGG-3’) bao quanh codon bắt đầu (Kozak, 1986). Sau đó ribosome di chuyển dọc mRNA từ đầu 5’ đến đầu 3’. Dịch mã bắt đầu tại mã mở đầu AUG và tiếp tục dọc theo chuỗi mRNA đến khi ribosome tách khỏi mRNA khi nó gặp codon kết thúc. Không có tRNA tồn tại ở codon kết thúc, và thay vào đó là protein RF (release factor) liên kết để tách ribosome. Dưới điều kiện tối ưu khoảng 20-25 amino acd có thể được trùng hợp trên 1 giây ( Crowleshmith và Gamon, 1982) Tuy nhiên, tốc độ thực tế của dịch mã có thể cao hơn mức này nhờ có hơn một ribosome có thể liên kết với duy nhất một mRNA tại cùng một thời điểm, tạo thành một polysome. Số lượng ribosome liên kết với một mRNA nhất định sẽ ảnh hưởng đến tốc độ dịch mã của nó: lượng ribosome liên kết càng cao, số lượng chuỗi protein được tạo ra càng cao. Sử dụng codon của một đơn mRNA cũng ảnh hưởng đáng kể đến tốc độ kéo dài. Các phân tử tRNA vận chuyển cho codon nào đó nhiều hơn các codon khác, dẫn đến sự khác nhau trong sử dụng codon để gene biểu hiện cao. Dịch mã đã được chứng minh là đặc biệt quan trọng đến kỹ thuật di truyền từ đó mục tiêu về thuốc kháng sinh như nó có thể ức chế vi khuẩn phát triển. Chức năng của các kháng sinh sau đây trong ức chế dịch mã:  Chloramphenicol- ứng chế enzyme vận chuyển peptidyl trên tiểu đơn vị ribosome 50S.  erythromycin- ức chế sự chuyển vị của tiểu đơn vị ribosome 50S  fusidic acid- ức chế chuyển vị bằng cách ngăn chặn sự phân tách của nhân tố kéo dài từ các ribosome  puromycin – một tRNA tương tự aminoacyl là nguyên nhân gây ra kết thúc chuỗi sớm.  Streptomycin- nguyên nhân gây nhầm lẫn đọc và ức chế khởi đầu chuỗi  tetracycline – ức chế nối aminoacyl-tRNA với vùng Adenin của ribosome Chuỗi protein chức thông tin điều khiển chu trình sau dịch mã và phân chia vách tế bào ở sinh vật nhân chuẩn. Quá trình dịch mã protein bắt đầu với gốc methionine tại amino kết thúc của sợi sớm ( dịch mã bởi codon AUG). Nhiều protein, ở cả sinh vật tiền nhân và nhân chuẩn, có gốc này được loại bỏ nhờ 1 enzyme có tên methionine aminopeptidase như trình tự protein cuối cùng bắt đầu với amino acid được mã hóa bởi codon thứ 2 (Bradshaw, Briday và Walter,1998). Protein Cytosolic tan được giải phóng một cách đơn giản khỏi ribosome trước khi quá trình tổng hợp polypeptide hoàn 43