Bài giảng Ứng dụng công nghệ gene trong chăm sóc sức khỏe người - TS. Trần Hoàng Dũng (Phần 2)

119 trang phuongnguyen 4190

Download

Bạn đang xem 20 trang mẫu của tài liệu "Bài giảng Ứng dụng công nghệ gene trong chăm sóc sức khỏe người - TS. Trần Hoàng Dũng (Phần 2)", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên

Tài liệu đính kèm:

bai_giang_ung_dung_cong_nghe_gene_trong_cham_soc_suc_khoe_ng.pdf

Nội dung text: Bài giảng Ứng dụng công nghệ gene trong chăm sóc sức khỏe người - TS. Trần Hoàng Dũng (Phần 2)

Chương 3 LIỆU PHÁP GENE I. GIỚI THIỆU Hầu hết các thuốc truyền thống hoặc là protein hoặc là những phân tử nhỏ tương tác với protein. Hay nói cách khác chúng hoạt động ở cấp độ protein hơn là tác dụng trên cấp độ gen. với các bệnh nhiễm hoặc ung thư, những thuốc truyền thống như vậy là sự điều trị tốt nhất để điều trị tận gốc. Còn đối với các bệnh di truyền, thuốc truyền thống chỉ có khả năng điều trị triệu chứng, còn những khiếm khuyết cơ bản trên gene thì không có gì thay đổi.một cách tiếp cận khác để điều trị các bệnh như vậy là liệu pháp gene: sử dụng nucleic acids để sửa chữa những trình tự DNA mất chức năng hay ít nhất là sự bù đắp chức năng để phục hồi lại chức năng sinh lý bình thường của tế bào. Gene therapy là một trong những liệu pháp nổ bật và được gọi với cái tê là gene medicine, là liệu pháp chuyể acids nucleic vào trong tế bào người. một dạng khác của gene medicine là sử dụng nucleic acid hư là một loại thuốc truyền thống , mặc dủ đích tác kích của liệu pháp thường nhắm vào RNA sản xuất bởi những gene bất thường hơn là tác kích vào protein. Một cách thức khác của liệu pháp gene là sử dụng DNA vaccine để biểu hiện các kháng nguyên trong cơ thể, liệu pháp này đang dẫn đầu trong những phương thức điều trị bằng liệu pháp gene. Về bản chất, khi tiến hành nghiên cứu liệu pháp gene thì cũng phải tiếp cận theo chiều hướng ngược lại, đó là gây các bệnh đột biến di truyền cho động vật để tạo mô hình cho việc nghiên cứu .trong ứng dụng này của kĩ thuật chuyển gen, đột biến mô phỏng bệnh của người được dùng các kĩ thuật phân phối gene trong động vật. Điều này cho phép con người nghiên cứu các khía cạnh sinh lý sinh hóa của bệnh cũng như là nghiên cứu hiệu quả tác dụng của các loại thuốc mới. Nhiều kỹ thuật ứng dụng trong liệu pháp gen và mô hình bệnh đều dựa vào những nguyên tắc giống nhau, mặc dù với những mục đích khác nhau. Những mô hình động vật khác có thể được tạo ra bang cách sử dụng nucleic acids hay protein để can thiệp vào sự biểu hiện gene hay hoạt tính protein. Kỹ thuật chuyển gen phối hợp với liệu pháp tế bào một cách hanh chóng, sử dụng toàn bộ tế bào lấy từ bệnh nhân hay tế bào lấy từ một nguồn thay thế. Trong khi liệu pháp gene và kiệu pháp tế bào là những liệu pháp đầy hứa hẹn , nhưng chùng vẫn gặp một số những trở ngại như vấn đề an toàn khi tác động trên mô hay những vấn đề liên quan đến đạo đức sinh học. Liệu pháp gene và những vấn đề liên quan đến đạo đức sinh học: Cả liệu pháp gene trên dòng tế bào sinh dưỡng hay sinh dục đều dấy lên những vấn đề liên quan đến đạo đức sinh học. Một vấn đề thường gặp là sẽ bị lạm dụng. liệu pháp gene không chỉ dùng để điều trị các bệnh mang tính phá hủy (hay loại bỏ bệnh từ một gia đình trong trường hợp sử dụng liệu pháp tế bào sinh dục) mà còn tăng cường những đặc tính có lợi theo sự đánh giá chủ quan và áp chế những đặc tính không có lợi.điều này có thể dẫn đến tạo ra một đứa trẻ được thiết kế, với những đặc điểm được chọn trước bởi cha mẹ chúng. Ở mức độ nghiêm trọng hơn thì liệu pháp gene có thể được sử dụng để thao tác, thiết lập gene cho toàn bộ quần thể. Có những tranh cãi rất mạnh mẽ liên quan đến đạo lý rằng chỉ nên sử dụng liệu pháp gene để điều trị bệnh khi bệnh đó không thể điều trị bằng bất kì cách nào khác, nhưng một vấn đề quan trọng được đặt ra là nếu liệu pháp gene có 64
thể được dùng để tăng IQ của một đứa trẻ từ 40 lên tới100, điều này thì được gọi là điều trị bệnh hay tăng cường tiềm năng của gen? và ai sẽ đưa ra những qui định thế nào là chấp nhận được hay không chấp nhận được của việc sử dụng liệu pháp gen. Liệu pháp gen trên dòng tế bào sinh dục có hai vấn đề chính liên quan đến đạo đức sinh học. 1. Sự hạn chế về vấn đề kỹ thuật Hiệu quả của biểu hiện gene ổn định là không tiên lượng được, vì thế cho dù bệnh cần điều trị có thể hết thì những khiếm khuyết khác được mang vào cũng không thể biết được. Những kết quả tai hại trong thử nghiệm liệu pháp gen điều trị trên dòng tế bào sinh dưỡng đề điều trị bệnh SCID gần đây là một ví dụ điển hình về tiềm năng nguy hại mà nó có thể xảy ra tương tự đối với liệu pháp gen trên dòng tế bào mầm sinh dục 2. Không có một tiêu chuẩn đúng đắn để quyết định Những kết quả riêng biệt từ việc sử dụng liệu pháp gen trên dòng tế bào sinh dục chưa đưa ra được những minh chứng đáng chấp nhận và do dó không có một ý kiến nào để có thể khẳng định rằng những vật liệu di truyền của họ có nên biến đổi hay không. II. LIỆU PHÁP GENE Liệu pháp gene được định nghĩa như một chiến thuật sữ dụng liệu pháp rong đó tế bào của bệnh nhân được biến đổi về bộ gen nhằm làm nhẹ bớt hay điều trị bệnh. Có một sự phân biệt quan trọng giữa liệu pháp gen trên tế bào sinh dưỡng – sự biến đổi được đưa và bên trong tế bào sinh dưỡng của bệnh nhân, và khái niệm liệu pháp gene trên tế bào dinh dục – những biến đổi về gene được đưa vào tế bào sinh dục và do đó có thể truyến qua các thế hệ sau. Hiện tại chỉ liệu pháp gene trên tế bào sinh dưỡng được chấp nhận . trong khi có những lý do thuyết phục để cho phép sử dụng liệu pháp gene trên tế bào sinh dục trong một vài trường hợp giới hạn (khi cha mẹ chắc chắn sẽ sinh ra con mang bệnh do những khiếm khuyết trong gen của họ sẽ truyền lại cho con cái), ngoài ra những trường hợp khác bị cấm vì những lý do đạo đức sinh học như đã đề cập ở trên. Có rất nhiều kiểu liệu pháp gen trên tế bào sinh dưỡng đã được đưa ra, và hầu hết những tiếp cận phù hợp phụ thuộc vào bản chất của bệnh. 1. Liệu pháp tăng cường Điều này phù hợp cho việc điều trị các bệnh liên quan đến rối loạn di truyền gây ra bởi sự hoạt động gen không phù hợp (lấy lại chức năng gen). Mục đích là chuyển một gen mới mà sản phẩm của nó ngăn chặn sự biểu hiện của gen bệnh hay gen bị mất chức năng, hoặc can thiệp vào sự hoạt động của sản phẩm gen 2. Liệu pháp gen thay thế Liệu pháp này chỉ phù hợp cho bệnh liên quan đến rối lọan di truyền (không phải điều trị bệnh nhiễm hoặc ung thư), nhưng có thể được dùng để điều trị các bệnh đã bị mất hay muốn hồi phục lại chức năng. Mục đích là đề chuyển một gen bình thường có khả năng tái tổ hợp với gene bệnh để thay thế chúng. Đây là một cách tiềm năng nhất để sửa chữa những khiếm khuyết di truyền, nhưng điều này phụ thuộc vào sự tái tổ hợp tương đồng – tiến trình thường không hiệu quả trong hầu hết các tế bào. 3. Giết các tế bào đích Điều này phù hợp cho các bệnh như ung thư nhằm loại bỏ một quần thể tế bào nào đó. Mục đích là biểu hiện trong các tế bào như vậy các gen gây độc. Một tiếp cận nữa là sự 65
biểu hiện của protein làm cho tế bào bị tổn thường để thu hút sự tần công của hệ thống miễn dịch. Hay sự biểu hiện của một emzymes để chuyển các hợp chất vô hại (tiền thuốc) thành một phân tử độc một enzyme. Do tác dụng gây độc của gen tự sát, chúng phải được chuyển trực tiếp vào loại tế bào đích với độ chính xác cao để tránh các tác dụng phụ 66
Hình 1: Các cách tiếp cận sử dụng liệu pháp gen khác nhau III. CHIẾN LƯỢC PHÂN PHỐI GENE Những bệnh di truyền thường được biểu hiện trong những quần tể tế bào chuyên biệt.đôi khi trong trường hợp của bệnh ung thư, do những đột biến gây bệnh hiện hiện chỉ trong quần thể tế bào đó. Đối với những rối loạn di truyền, đột biến thường hiện diện trong tất cả các tế bào nhưng tác động lại giới hạn với những tế bào có gen được biểu hiện (hayở những tế bào có biểu hiện gen bình thường bị mất).phương pháp lựa chọn cho chuyển DNA trong liệu pháp gene do đó phụ thuộc vào tính khả nạp của tế bào tương ứng. Hình 2: Các chiến lược sử dụng liệu pháp gen Nếu tế bào có thể lấy ra và nuôi cấy mà không làm hại đến bệnh nhân, sau đó chúng được chuyển gene trong khi nuôi và sau đó chuyển lại vào cơ thể bệnh nhân.Liệu pháp in 67
vivo này có thể ứng dụng để điều trị các rối loạn lien quan đến hệ miễn dịch và máu bởi vì tế bào gốc tạo máu có thể lấy ra, nuôi cấy, và chuyển gen tương đối dễ. Hơn nữa, chúng có thể tồn tại trong thơi gian dài khi chuyển ngược lại trong cơ thể bệnh nhân và do đó có thể phát triển lượng lớn tế bào đời con. Liệu pháp gene ex vivo cho phép gen đích được kiểm soát cẩn thận trong khi nuôi cấy, vì thế những tế bào được biến đổi di truyền có thể chọn lọc chính xác. Với những tế bào không có khả năng nhận gen chuyển hay những tế bào không thể nuôi cấy hiệu quả, liệu páp gen lien quan đến chuyển trực tiếp DNA vào trong tế bào trong khi tế bào vẫn còn nằm trong cơ thể. Phương pháp này được gọi là liệu pháp gen in vivo và hệ thống phân phối gen phải đòi hỏi vừa hiệu quả và chuyên biệt cho một loại tế bào đích. Chuyển gen trúng đích in vivo đặc biệt rất quan trọng khi chuyển các gen gây độc cho tế bào. IV. CƠ CHẾ PHÂN PHỐI GENE Hệ thống chuyển gen dùng trong liệu pháp gen là vector virus hoặc nonvirus. Chuyển gen bằng virus hay còn dùng thuật ngữ transduction, lien quan đến sự đóng gói DNA (hoặc RNA) vào trong virus. Chuyển gen xảy ra theo cơ chế xâm nhập thông thường của virus và do đó vừa hiệu quả vừa chon lọc. cũng chình vì lí do này chuyền gen sử dụng virus là chiến lược được yêu thích cho liệu pháp gene in vivo. Nhưng một điều quan trọng là virus chính là thực thể gây bệnh do đó bắt buộc phải trải qua bước giảm độc lực của chúng trước khi sử dụng. Đặc tính của virus dùng cho chuyển gene Vector virus dùng cho chuyển gene được đánh giá cơ bản dựa trên hiệu quả chuyển gen, khả năng mang DNA ngoại lai, tính an toàn, cơ chế chuyển gen (nằm ngoài tế bào chất hay gắn chèn vào trong bộ gen) cũng như khả năng tồn tại trong cơ thể vật chủ. Không có loại virus nào là thích hợp cho tất cả vật chủ mặc dù những mối quan tâm để thiết kế các loại virus lai ngày càng tăng (virus phối hợp các đặc điểm tốt nhất của các loại virus khác). Adenovirus Đây là những virus DNA gây bệnh nhệ trên các ống hô hấp ví dụ như gây cảm lạnh thông thường. Gen chuyển nẳm ngoài nhân và virus có thể xâm nhiễm trên phạm vi rộng kể cả ở các tế bào đang phân chia hay không ở trạng thái phân chia. Ưu điểm: hiệu quả xâm nhiễm cao, khả năng mang một đoạn DNA lớn (lên tới 35kb). Nhược điểm: sự biểu hiện gen không kéo dài, tính an toàn thấp (gây đáp ứng viêm ở nhiều bệnh nhân). Đáp ứng viêm như vậy đã dẫn đến cái chết của một người 18 tuổi trong giai đoạn thử nghiệm phase 1 cho bệnh liên quan đến rối loạn chức năng gan (OTD). Tất cả thử nghiệm liệu pháp gene liên quan đến Adenovirus đã bị tạm ngưngđể xác định lại tính an toàn. Adeno-associated viruses (AAV) AAV là virus DNA mạch đơn gây ra bệnh nhiễm không triệu chứng. sự chuyển gene là sự gắn chèn ổn định và virus có thể nhiễm trên phạm vi rộng ở cả tế bào đang phân chia hay ở trạng thái không phân chia. Ưu điểm: an toàn (virus đòi dỏi phải có sự hiện diện của cả adenovirus và herpes virus để sao chép và do đó không có khả năng sao chép một cách tự nhiên), tính ổn định (gắn chèn ổn định vào bộ gen cho phép biểu hiện protein trong thời gian dài). Nhược điểm: khả năng mang gen <5kb. Virus hoang dại có một đặc tính thú vị là nó có thể gắn chèn tại vị trí xác định vào bộ gen người trên NST 19 do đó làm giảm nguy cơ bị đột biến do gắn chèn. Baculoviruses 68
Baculovirus là virus DNA thường nhiễm vào côn trùng, nhưng chúng có thể nhiễm vào tế bào người.gen được chuyển vào trong tế bào chất. những báo cáo ban đầu nhận định virus này có thể nhiễm vào tế bào gan nhưng những nghiên cứu sau này chỉ ra rằng chúng có thể nhiễm vào pham vi tế bào rộng hơn. Ưu điểm: tính an toàn (virus nhiễm vào tế bào động vật nhưng không thể sao chép trong những tế bào này), khả năng mang DNA lạ, viris có hình que nên có thể mang đoạn DNA không giới hạn. Nhược điểm: hiệu quả chuyển gen (virus nhạy cảm với sự bất hoạt qua trung gian bổ thể, mặc dù chiến thuật này đã được phát triển để vượt qua những giới hạn này). Không giống như bốn loại virus vừa kể trên, baculovirus chưa được sử dụng trong thử nghiệm liệu pháp gen. Herpesvirus Herpes simpex virus (HSV) là một virus DNA đóng vai trò trong việc biểu hiện những đặc tính than kinh bất thường, điều này khiến nó trở thành ứng cử viên cho liệu pháp gen thần kinh. Gen chuyển nằm ngoài tế bào chất và virus có thể xâm nhiễm các tế bào khác thông qua mạng synapse. Ưu điểm: khả năng mang DNA lạ không giới hạn, khả năng biểu hiện gen ổn định. Retrovirus Retrovirus là virus RNA và có enzyme phiên mã ngược tổng hợp DNA.DNA có thể gắn chèn vào genome của vật chủ, kết quả là tạo nên sự biểu hiện gen ổn định. Các retroviruses điển hình cỉ nhiễm vàotế bào đang trong giai đoạn phân chia, điều này làm chúng thích hợp cho liệu pháp tế bào ung thư.Tuy nhiên vector dựa trên lentivirus (như HIV) có thể nhiễm cả trên tế bào không ở trạng thái đang phân chia. Ưu điểm: năng suất nhân lên rất nhanh, và khả năng xâm nhiểm hiệu quả, biểu hiện gen ổn định. Nhược điểm: khả năng mang đoạn DNA <8Kb, tính an toàn không cao (sự gắn chèn ngẫu nhiên và do đó gây nguy hiểm cho bộ gen vì có thể gây đột biến do gắn chèn). Cơ chế gắn chèn có thể dẫn đến kết quả hoạt hóa các gen lân cận bao gồm cả các oncogene. Một đặc tính không an toàn khác iên quan đến việc sử dụng virus HIV cho cấu trúc của vector, đây là loại virus duy nhất dùng cho liệu pháp gen mà sẽ gây bệnh chết người. Phương pháp thông thường là loại bỏ những gen thiết yếu và do đó làm cho virus mất khả năng sao chép, cũng là một cách thức để tăng khả năng mang DNA ngoại lai. Để chuẩn bị một lượng lớn các virus như vậy cần phải được cung cấp từ một nguồn thay thế. Có nghĩa là phải sử dụng các helper virus để cung cấp các sản phẩm gen khiếm khuyết nhưng trong hầu hết các trường hợp sử dụng các dòng packing line. Khi DNA được đóng gói , những virus khiếm khuyết có thể được phân lập từ dòng đóng gói. Tiếp theo nó sẽ xâm nhiễm vào tế bào đích để chuyển DNA hay RNA đích nhưng không thể sao chép và gây ra những triệu chứng bệnh. Những đặc điểm an toàn nên được xây dựng trong các dòng đóng gói để làm giảm sự tái tổ hợp giữa các virus khiếm khuyết, và chức năng được hỗ trợ bởi các helper virus, nếu không những virus có độc lực có thể được tạo ra. 69
Hình 3: a,Sơ đổ bộ gen của adenovirus hoang hại Ad5. b, vector Adenovirus đã loại bỏ vùng E1 và E3 để chèn đoạn DNA mục tiêu. Phương pháp chuyển gen không sử dụng virus thì được đánh giá là an toàn hơn sử dụng virus, bao gồm transfections (tế bào được kích thích để nhận các DNA từ xung quanh chúng) và direct transfer (DNA được chuyển vào trong tế bào bằng các phương pháp vật lý như vi tiêm, DNA không được đóng gói trong vector virus mà thường hiện diện ở dạng plasmid. Trong một vài trường hợp, plasmid thì không được thiết kế để sao chép trong tế bào người và do đó cách duy nhất giúp cho sự biểu hiện kéo dài và ổn định là gắn chèn vào bộ gen. Đây là một trường hợp hiếm (nhỏ hơn một trong một triệu tế bào được chuyển gen ổn định vì thế những tế bào hiếm hoi này phải được chọn lọc bao gồm những marker gen cho phép tế bào tăng trưởng trong sự hiện diện của những hợp chất như kháng sinh- chất gây độc cho những tế bào không được chuyển gen. Đối với liệu pháp gen nonvirus in vivo, cần thiết phải có vùng khởi sự sao chép của virus trong vector plasmid, cho phép vector tốn tại như một thể sao chép trong tế bào chất của tế bào được chuyển gen. sự tồn tại trong tế bào chất vẫn chưa được xác định và sự biểu hiện của các gen được chuyển do đó bị giới hạn. Đối với sự chuyển gen trực tiếp, DNA thường được bao bọc trong một vài phức hợp mà có thể dung hợp với tế bào đích hay kích thích sự nhập bào bởi endositosis. 70
Hình 4: Sử dụng marker chọn lọc để chọn lọc và tăng sinh dòng mục tiêu Ví dụ như DNA có thể đóng gói trong các hạt lipid hay còn gọi là liposomes, liposome có thể dung hợp với màng tế bào, chuyển vật mang (acid nucleic) vào trong tế bào chất. hiệu quả chuyển gen qua trung gian liposome có thể tăng tác dụng khi lấy liposome từ vỏ ngoài của virus – chứa protein tăng cường sự dung hợp của màng. Những phương tiện như vậy được gọi là Virosomes. Không giống như sự chuyển gen thông qua liposome, lipofection lien quan đến sự hình thành của phức hợp DNA-Lipid (lipoplex)- phức hợp nhập bào thông qua endocytosis. Gần đây nhưng phương tiện chuyển gen dựa trên polimer ion dương (polyplex) ngày càng trở nên phổ biến bởi vì các đồng polymer đặc biệt có thể sử dụng để biến đổi đặc tính vật lý của vật liệu chuyển gen. trong một vài trường hợp nó đã minh chứng rằng có thể hình thành những phức hợp có những đặc tính khác nhau ở những nhiệt đô khác nhau, giúp cho phép việc phóng thích DNA được kiếm soát. Nó được sử dụng đặc biệt cho chuyển gen invivo tới những vị trí đặc biệt trong cơ thể - có thể làm nóng lên hay lạnh bớt tại từng vị trí trương ứng. Nói chung, sự phân phối của DNA được đóng gói thì ít hiệu quả hơn sử dụng vector virus. Một số DNA bị phân cắt trong tế bào trước khi nó vào trong nhân.Rất khó khi sử dụng chuyển gen không sử dụng virus để chuyển vào một tế bào chuyên biệt, mặc dù vẫn có thể tạo cặp gắn DNA với một phân tử khác mà nó gắn chuyên biệt trên một loại vector của tế bào đích hay còn gọi là receptor-mediated endocytosis. Có những bằng chứng chứng tỏ rằng có thể chuyển DNA trực tiếp vào một vài mô in vivo. Ví dụ như sự tiêm dung dịch DNA vào trong mô cơ kết quả là có gen chuyển trong một vài tế bào, và sự biểu hiện gen kéo dài ổn định trong vài tháng.Để chuyển DNA lên mô, có một phương pháp gọi là particle bombardment- phương pháp sử dụng các vật nhỏ bọc DNA và đưa vào mô đích sử dụng áp suất khí cao hay sử dụng dòng điện để tác kích. V. NGHIÊN CỨU THỰC TIỄN Trên 500 quy trình liệu pháp gen đã được đưa ra, hơn một nửa trong số đó là ứng dụng điều trị ung thư. Sau đây là một vài trường hợp nghiên cứu mô tả những cách 71
thức khác nhau sử dụng liệu pháp gen đã ứng dụng trong thực tế và đồng thời cũng đế cập đến những bất cập của liệu pháp. Và cũng cần nhấn mạnh rằng liệu pháp gen vẫn là liệu pháp có tính nguy cơ gây hại cao với kết quả chưa dự đoán hết được. 1. Sử dụng liệu pháp gen in vivo tăng cường chức năng điều trị bệnh xơ nang Khoảng 10% các quy trình liệu pháp gen được đưa ra để điều trị các bệnh theo quy luật di truyền Mendel. Đó là bởi vì sự khiếm khuyết các gen đơn nên dễ dàng sử dụng liệu pháp gen. bệnh xơ nang (CF) là bệnh di truyên do một gen gây ra rất phổ biến trong cộng đồng người Caucasi, với tỉ lệ mắc bệnh là 1/2000. Do sự khiếm khuyết trong CFTR gen dẫn đến sự mất kênh Chloride lien đới với màng tế bào. Ảnh hưởng của bệnh này thường được biểu hiện nhiều trong hệ thống tiêu hóa và tuyến tụy, khi bị mất cân bằng kênh chloride sẽ dẫn đến một lượng lớn chất nhầy được tạo ra. Trong phổi, nó gây hó khan khi thở và làm tăng khả năng nhiễm, trong khi đó ở tụy, lớp chất nhầy khóa sự tiết của các enzyme tiêu hóa dẫn đến suy dinh dưỡng. Sự chuyển gen CFTR có chức năng sẽ giúp hồi phục những ảnh hưởng này. Những thử nghiệm khởi đầu lien quan đến sử dụng adenovirus vector – vector nhiễm tự nhiên vào những tế bào đường hô hấp.Vector được chuyển vào nhờ bình xịt và động tác hít vào, thử nghiệm tiến hành trên một vài bệnh nhân, liều cao của vector gây ra phản ứng viêm. Gần đây sữ dụng cac1vector an toàn hơn hư adeno-associated virus hay chuyển gen bằng lyposome. Tuy nhiên kết quả thu được không mấy khả quan. Một lý do chính của điếu này là những vector chuyển vào không thể xuyên qua lớp nhày phù đầy trên phổi của bệnh nhân bị xơ nang. 2. Liệu pháp tăng cường ex vivo cho bệnh: thiếu hụt miễn dịch tổ hợp trầm trọng (SCID) Thử nghiệm đầu tiên đã được diễn ra vào năm 1990 trên một cô bé 4 tuổi bị mắc chứng bệnh suy giảm miễn dịch tổ hợp trầm trọng (SCID).Bệnh có đặc điểm là thiếu tế bào lympho có chức năng (tế bào B và tế bào T), kết quả lả bệnh nhân không có khả năng chống chịu với sinh vật nhiễm. SCID có thể gây ra bởi rất nhiều khiếm khuyết nhưng đặc biệt là khiếm khuyết trên gen ADA, gen mã hóa cho enzyme adenosine deaminase. Cách điều trị truyền thống cho ADA-SCID là cấy truyền tủy xương từ người cho tương ứng hoặc là thường xuyên tiêm enzyme ADA tái tổ hợp, khi không được điều trị những đứa trẻ này phải sống trog ôi trường nhân tạo, không chưa vi trùng, do đó chúng được gọi với cái tên là “bubble babies”. Bệnh liên quan đến ADA có thể sử dụng liệu pháp gen để điều trị do một vài lí do: - Bệnh gây ra do mất chức năng của một gen đơn - Mức độ ADA biến thiên rộng rãi trong quần thể do đó sự kiểm soát chặt chẽ gen chuyển là không cần thiết - Gen ADA nhỏ và dễ thao tác trong phòng thí nghiệm - Tế bào đích cho liệu pháp gen là lymphocyte nên dễ dàng lấy ra, nuôi cấy, và chuyển ngược lại cơ thể bệnh nhân - Những liệu pháp điều trị thay thế thì mắc và đe dọa đến tính mạng. Một gen AD có chức năng được chuyển vào trong vector retrovirus và được dùng để chuyển vào tế bào T được nuôi cấy, và tiếp theo đó là chuyển ngược lại vào cơ thể bệnh nhân. Mặc dù đã thu được những thành công bước đầu nhưng hiệu quả của liệu pháp điều trị rất ngắn và bệnh nhân vẫn tiếp tục phụ thuộc vào enzyme ADA cho tới ngày nay. Những thử 72
nghiệm xa hơn được tiến hành trên tế bào tủy xương hoặc tế bào máu cuống rốn, chúng được sử dụng như tế bào đích bởi vì những quần thể tế bào này chứa tế bào gốc và sẽ sản sinh ra tế bào lympho trong giai đoạn sống của chúng.Sự biến đổi thực hiện trên những dóng tế bào gốc này đã tạo ra các tế bào sản xuất ADA lâu hơn nhưng vẫn ơ mức độ thấp. Vào năm 2002 có một khám phá trong liệu pháp gene ADA-SCID sử dụng kỹ thuật gọi là nonmyeloablativeconditioning. Phương pháp này tiến hành hủy tủy xương của bệnh nhân SCID để giúp cho các tế bào gốc đã biến đổi có cơ hội để tăng sinh. Một yếu tố quan trọng khác là những đứa trẻ thử nghiệm liệu pháp này phải chưa từng được điều trị với ADA.Dường như việc xử lý với enzyme trước đó làm nên sự không thành công của phương pháp này. Bệnh nhân đầu tiên sử dụng liệu pháp mới này là một cô bé 2 tuổi người Palestinian, người chưa bao giờ được điều trị với ADA trước đó. Liệu pháp này mang tính khả thi vì bệnh nhân đã có khả năng sản xuất kháng thể như những đứa trẻ khác, có thể chống lại các bệnh cúm gà. Liệu pháp gen cũng được dùng để điều trị bệnh SCID liên kết với giới tính, gây ra do mất chuỗi gama của receptor interleukin 2. Cũng giống như ADA-SCID, liệu pháp in vivo được thực hiện chuyển gen IL2RG có chức năng vào vector retrovirus sau đó chuyển vào tế bào gốc tạo máu, sau đó chuyển ngược lại cơ thể bệnh nhân. Chin trong mười một bệnh nhân đã được điều trị bằng phương pháp này, nhưng từ khi bắt đầu tiến hành thí nghiệm hai trong số họ đã bị ung thư bạch cầu, có thể là do sự hoạt hóa của một oncogene gần với vị trí gắn chèn của retrovirus. Do đó hiện nay những thử nghiệm lien quan đến sử dụng retrovirus đã bị ngưng lại cho đến khi có những dữ liệu đầy đủ của cá bệnh nhân còn lại. Hình 5: Liệu pháp gen cho ADA-SCID sử dụng phương pháp nonmyeloablative 73
Hình 6: Cơ chế dẫn đến ung thư bạch cầu ở bệnh nhân sử dụng liệu pháp gen do sự tái tổ hợp tương đồng liên quan đến retrovirus 74
Chương 4 MỘT SỐ KỸ THUẬT SỬ DỤNG TRONG NGHIÊN CỨU PHÂN TÍCH CHỨC NĂNG BỘ GENE I. Giới thiệu về lĩnh vực phân tích chức năng bộ gene Bộ gene là một bộ sưu tập DNA của sinh vật. Phân tích chức năng bộ gene là một lĩnh vực nghiên cứu bao quát bộ gene, nghiên cứu về chức năng DNA (bao gồm những phần mang gene và không mang gene) cũng về nucleic acid và sản phẩm protein được mã hóa bởi DNA. Phân tích chức năng bộ gene có thể được ứng dụng để hoàn thành bộ sưu tập DNA (bộ gene), RNA (sản phẩm phiên mã) hay protein (sản phẩm dịch mã) một sinh vật. Việc đánh giá quá trình phiên mã RNA ở những giai đoạn phát triển hác nhau hoặc ở các cơ quan khác nhau trên cơ thể là một ví dụ cho lĩnh vực này. Để phân tích chức năng gene cần sử dụng các kỹ thuật quét tần suất cao (high-throughput screening_HTS). Đây là một phương pháp thử nghiệm khoa học sử dụng robot để thực hiện đồng thời thí nghiệm trên hàng loạt mẫu (có thể lên đến hàng ngàn mẫu) thông qua phần mềm vi tính. Một khó khăn trong quá trình phân tích chức năng gene là khó có thể xác định được ảnh hưởng của gene đó lên sự hoạt động của các gene khác trong bộ gene.Ví dụ như ở nấm men Saccharoomyces cerevisiae thì mỗi gene bị khóa một cách riêng rẻ còn “dãy mã hóa” sẽ được đề cập ở phần dưới. Khó khăn lớn nhất trong lĩnh vực này là phải hiểu được mối quan hệ giữa kiểu gene và kiểu hình. Việc gắn kết 2 phần này là mục đích cơ bản của phân tích chức năng gene. Trong tế bào, thông tin bộ gene được thể hiện qua 3 thành phần: DNA, RNA và protein. Các thành phần khác như lipid và các chất chuyển hóa cũng là những thành phần đáng quan tâm, tuy nhiên chúng không chứa thông tin như các thành phần nêu trên. Phạm vi của phân tích chức năng gene bao gồm 2 mức độ: (1) Sự biến thể tự nhiên: Gene, RNA và protein thay đổi như thế nào giữa các phần cơ thể hay giữa các giai đoạn phát triển? (2) Sự ngừng hoạt động chức năng xảy ra trong tự nhiên và trong nghiên cứu, thí nghiệm. Phạm vi này bao gồm sự mất, thêm, chuyển và hoán vị xảy ra trong toàn bộ bộ gene, trong nhiễm sắc thể hay ở một nucleotide. Khi có mất vật chất di truyền, thường là mất hàng triệu cặp baz và mất đi từ 1 đến hàng tá gene, sẽ dẫn đến việc mất đi một số RNA, protein. Bên cạnh đó, sự tăng thêm vật chất di truyền cũng thường thấy trong tự nhiên, ví dụ như hội chứng Down do có sự tăng thêm 1 nhiễm sắc thể 21. Việc tăng thêm vật chất di truyền kéo theo sự tăng biểu hiện của mRNA và các protein được mã hóa trong nhiễm sắc thể 21. Ngoài ra, còn có thể tăng biểu hiện DNA, RNA hay protein bằng cách chuyển gen. 75
Hình 1: Phân tích chức năng gene tiến tới phân tích protein tần suất cao. Từ trái sang phải chúng ta có thể xem xét một vài khía cạnh trong 1 tế bào: chức năng lien quan đến ENA, RNA và protein cũng như các khía cạnh cao hơn như tương tác protein, con đường sinh hóa, trao đổi chất tế bào và cuối cùng là kiểu hình của tế bào và của sinh vật. Hai khía cạnh khác mà phân tích chức năng gene nghiên cứu là sự biến động tự nhiên và sự ngừng hoạt động chức năng. Để nghiên cứu về sự biến thể tự nhiên cần so sánh trạng thái của DNA, RNA, protein hoặc các thành phần khác trong tế bào thay đổi theo thời gian và dưới các điều kiện sinh lý khác nhau hoặc sự thay đổi giữa các loại tế bào và các vùng cơ quan trong cơ thể. Sự mất chức năng thường xảy ra trong tự nhiên do có nhiễm sắc thể bất thường: Hội chứng Williams do mất đoạn ở nhiễm sắc thể 7, Hội chứng Down do có thêm 1 nhiễm sắc thể 21. DNA RNA Protein Biến thể tự nhiên SNPs, epigenomivà cs Phân tích sản Định vị protein; - Giữa các giai đoạn phẩm phiên mã tương tác protein – - Giữa các cơ quan (microarray, protein; con đường - Giữa các chủng, loài SAGE) chuyển hóa Mất chức năng Knockout gene Thay đổi hóa học - Trong thí nghiệm Động vật chuyển gene RNAi; siRNA Myasthenia gravis - Trong tự nhiên Hội chứng Williams Suy giảm RNA Hội chứng Down không mã hóa Ung thư trung gian Biến đổi nhiễm sắc thể 76
II. Các nghiên cứu trong phân tích chức năng gene 1. Mức độ biểu hiện gene Nhà sinh học phân tử có thể đánh giá mức độ biểu hiện của một gene bằng cách xác định lượng mRNA được tạo ra từ gene đó thông qua các kỹ thuật như microarray, EST (expressed sequence tag), SAGE (Serial Analysis of Gene Expression), MPSS (massively parallel signature sequencing), hay khối phổ (định lượng protein). Tất cả những kĩ thuật trên đều tạo ra những dữ liệu chứa thông tin nhiễu (noise-prone) làm việc tính toán, phân tích trở nên phức tạp. Yêu cầu thực tế đó đã cho ra đời một lĩnh vực mới trong sinh học tính toán là phát triển các công cụ thống kê để lọc tín hiệu xác đáng khỏi thông tin nhiễu trong những nghiên cứu biểu hiện gene tần suất cao (high-throughput gene expression). Các nghiên cứu này thường dùng để xác định các gene liên quan đến một bệnh lý nhất định, người ta có thể so sánh dữ liệu microarray từ những tế bào bị ung thư với tế bào bình thường để xác định những protein nào được tăng cường hay giảm thiểu do ung thư. Dữ liệu biểu hiện gene cũng được dùng để nghiên cứu điều hòa gen, người ta có thể so sánh dữ liệu microarray của một sinh vật ở những trạng thái sinh lý khác nhau từ đó kết luận về vai trò của từng gen tham gia vào mỗi trạng thái. Đối với sinh vật đơn bào, ta có thể so sánh các giai đoạn khác nhau của chu kỳ tế bào (cell cycle), hay phản ứng của cơ thể ở những điều kiện stress (stress sốc nhiệt, stress đói dinh dưỡng, .v.v.). Người ta cũng có thể áp dụng giải thuật phân nhóm (clustering algorithms) đối với những dữ liệu biểu hiện để xác định những nhóm gene đồng biểu hiện, hay đơn vị điều hòa (regulon). Những phân tích tiếp theo có thể triển khai theo nhiều hướng, ví dụ phân tích trình tự promoter của những nhóm gene để xác định nhân tố điều hòa chung hoặc sử dụng các công cụ máy tính để dự đoán những promoter liên quan đến cơ chế điều hòa từng nhóm gene (tham khảo [3]). 2. Nhận diện protein Protein microarray và hệ thống khối phổ cao năng (high throughput mass spectrometry) có thể cung cấp hình ảnh tổng thể của các protein hiện có trong một mẫu sinh học. Các ứng dụng tin sinh học có liên quan rất nhiều đến việc lý giải các dữ liệu thu được từ những hệ thống này. Đối với protein microarray, những nhà tin sinh học cần chuyển kiểm tra dữ liệu mRNA gắn trên array. Trong khi đó, những vấn đề tin sinh học liên quan đến việc so trùng dữ liệu khối phổ với cơ sở dữ liệu về trình tự protein. 3. Dự đoán cấu trúc protein Dự đoán cấu trúc là một ứng dụng quan trọng nữa của tin sinh học. Có thể dễ dàng xác định trình tự axit amin hay còn gọi là cấu trúc bậc một của protein từ trình tự gene mã hóa cho nó. Nhưng, protein chỉ có chức năng vốn có khi nó cuộn gấp thành hình dạng chính xác (nếu điều này xảy ra ta có cấu trúc bậc hai, cấu trúc bậc 77
ba và cấu trúc bậc bốn). Tuy nhiên, sẽ là vô cùng khó khăn nếu chỉ dự đoán các cấu trúc gấp nếp này từ trình tự axit amin. Một số phương pháp dự đoán cấu trúc bằng máy tính hiện đang phát triển. Một trong các ý tưởng quan trọng trong nghiên cứu tin sinh học là quan điểm tương đồng. Trong một nhánh genomic của tin sinh học, tính tương đồng được sử dụng để dự đoán cấu trúc của gene: nếu biết trình tự và chức năng của gene A và trình tự này tương đồng với trình tự của gene B chưa biết chức năng thì có thể kết luận là A và B có cùng chức năng. Trong nhánh cấu trúc của tin sinh học, tính tương đồng được dùng để xác định những hợp phần quan trọng trong cấu trúc của protein cũng như tương tác của nó với các protein khác. Với kỹ thuật mô phỏng tính tương đồng (homology modelling), thông tin này được dùng để dự đoán cấu trúc của một protein khi đã biết cấu trúc của một protein khác tương đồng với nó. Hiện tại đây là cách dự đoán cấu trúc protein đáng tin cậy nhất. Một ví dụ là hemoglobin ở người và hemoglobin của các cây họ đậu (leghemoglobin) khá tương đồng với nhau. Cả hai đều có vai trò vận chuyển ôxy. Mặc dù trình tự axit amin hoàn toàn khác nhau, cấu trúc của chúng trên thực tế lại đồng nhất cho thấy rằng chúng hầu như có cùng một chức năng. Các kỹ thuật dự đoán cấu trúc protein khác là protein threading và de novo physi và -based modeling. II. Một số kỹ thuật nghiên cứu chức năng gene tần suất cao 1. Phân tích chuỗi biểu hiện gene (Serial Analysis of Gene Expression _SAGE) Kỹ thuật SAGE cho phép định lượng sự biểu hiện gene bằng cách đo số lượng RNA phiên mã phân tách từ các mô quan tâm. Những đoạn DNA ngắn dài 9 đến 14bp được tách từ đuôi 3’ của sản phẩm phiên mã, được giải trình tự và phân định chức năng gene. Ưu điểm chính của thí nghiệm SAGE là không cần tìm hiểu trước loại mRNA nảo để nghiên cứu và đây là một trong những kỹ thuật tần suất cao cho phép làm đồng loạt trên một lượng mẫu lớn. hơn nữa, người ta cũng đang tiến hành cải tiến kỹ thuật này (Wang, 2007). Có lẽ nhược điểm lớn nhất là việc xây dựng và phân tích thư viện SAGE đòi hỏi các kỹ năng chuyên sâu. Bên cạnh đó, trong thí nghiệm SAGE điển hình thì ½ số đuôi SAGE không gắn vào RNA đích hay gene đích. Từ đó khả năng tái sản xuất sẽ giảm đáng kể. Quy trình tạo đuôi SAGE được nêu trong hình 2 (Velculescu và cs, 1995). RNA được tách chiết từ nguồn tế bào, mô quan tâm và được biến đổi thành cDNA bằng mồi olido(dT) đánh dấu biotin. Một enzyme cắt giới hạn được sử dụng để phân cắt sản phẩm phiên mã nên chỉ có những đoạn ngắn mới được phân tách và liên kết chặt chẽ giữa biotin và avidin cho phép đầu 3’ của mỗi sản phẩm phiên mã bám vào hạt streptavidin. Sau đó bổ sung 2 loại linker để cDNA sau này bị cắt bởi một enzyme cắt giới hạn chuyên biệt, giải phóng linker và một đoạn ngắn cDNA (đuôi). Những cái đuôi này được nối vào nhau, tạo dòng và giải trình tự. Kết quả 78
của quy trình này cho ra thông tin mô tả của hàng ngàn (hoặc hàng triệu) đuôi từ một nguồn sinh học. Hình 2: Mô tả về kỹ thuật phân tích hàng loạt sự biểu hiện gene (SAGE) mRNA được tách chiết từ một nguồn (ví dụ như não) và tổng hợp mạch đôi cDNA bằng mồi oligo(dT) đánh dầu biotin. cDNA bị phân cắt bởi một endonuclease giới hạn (anchorin enzyme, AE). Phần đầu 3’ của mỗi sản phẩm phiên mã được cố định lên hạt streptavidin (hình oval lớn) và linker (A hoặc B) được bổ sung, trong linker có chứa vị trí nhận biết của endonuclease cắt hạn chế (tagging enzyme, TE). Sự phân cắt các dòng nối bằng tagging enzyme giải phóng các linker với đuôi cDNA 9X ở bên trái, O ở bên phải). Các cặp đuôi nối được nối lại với nhau, tạo dòng và giải trình tự. Mỗi đuôi chứa một đoạn 9 – 14bp của sản phẩm phiên mã. 79
Thư viện SAGE đã được xây dựng. Mỗi một đuôi (tag) trong một thư viện gần như tương ứng với một gene. Đối với một tag dài 9bp có 49 hay 262 144 phiên mã phân biệt (một vị trí tương ứng với một nucleotide bất kỳ). Trên thực tế, tag được sắp xếp lên gene bằng UniGene. Trong một số trường hợp, một tag có thể hiện diện ở nhiều gene và một gen có thể có nhiều hơn một tag (ví dụ quá trình cắt ghép (splicing) sau phiên mã làm cho gene đó có nhiều tag). Tuy nhiên người ta đã chứng minh được rằng số lượng tag trong thư viện SAGE tỷ lệ với số lượng phân tử mRNA trong mẫu sinh học đó. Thư viện SAGE có thể được được lấy từ trang web NCBI, cho phép so sánh sự biểu hiện của bất kỳ mô nào đã được tạo thư viện SAGE (Lash và cs, 2000; Lal và cs, 1999). Trang web bao gồm dữ liệu tag từ thư viện SAGE và dữ liệu chú thích vị trí tag trên gene. Trong một số trường hợp, tag thuộc những nhóm Unigene phức tạp và chỉ một hoặc vài nhóm là đáng tin cậy, các nhóm này được NCBI xác định bằng tiêu chuẩn như dựa vào khả năng tương thích với dữ liệu DNA bộ gene. Hình 3: Quá trình xây dựng dữ liệu NCBI SAGE 2. Microarray Kỹ thuật DNA microarray đã trở thành một kỹ thuật mạnh trong việc đo lường số lượng sản phẩm phiên mã mRNA (đo sự biểu hiện gene). Trong khi EST và SAGE cho phép phân tích biểu hiện gene với số lượng lớn thì microarray lại được sử dụng để phân tích sự khác biệt về số lượng mRNA trong các mẫu sinh học khác nhau. Patrick Brown và đồng nghiệp ở Đại học Stanford là người đầu tiên sử dụng phương pháp microarray, sau đó phương pháp này được sử dụng rộng rãi trong nghiên cứu. Microarray là một bề mặt rắn ví dụ như lame kính hiển vi hay màng nylon, trên đó có gắn DNA đã biết trình tự, được sắp xếp theo hàng. DNA này có thể được lấy từ cDNA hoặc các oligoncleotide. Thường thì DNA (nanogram) được cố định trên bề mặt array. RNA tách chiết từ nguồn quan tâm như dòng tế bào có hoặc không có xử lý với thuốc, mô hoang dại hoặc cơ quan đột biến. Sau đó, RNa (hay mRNA) được chuyển thành cDNA, đánh dấu bằng huỳnh quang hoặc phóng xạ rồi đem lai trên array. Trong quá trình lai, cDNA từ phân từ RNA trong vật liệu sinh học lai chọn lọc với nucleic acid tương ứng với nó trên bề mặt microarray. Sau khi 80
rửa, hình ảnh phân tích sẽ được thu nhận và phân tích thành những tín hiệu số lượng. Qua quy trình này, kỹ thuật microarray cho phép đo đồng thời sự biểu hiện gene của hàng ngàn gene có trên array. Thuật ngữ “phân tích chức năng bộ gene” được hiểu là phân tích chức năng của một số lượng lớn gene và microarray là một trong những công cụ trung tâm được sử dụng trong nghiên cứu về lĩnh vực này. Trình tự phân tử trong GenBank ngày càng tăng nhưng chức năng của chúng lại chưa được biết. Phương pháp microarray giúp ta xác định được chức năng của các gene này và ngay cả những gene đáp ứng không tốt trong phương pháp EST (Expressed Sequence Tag). Tuy nhiên, phương pháp này cũng có một số nhược điểm nhất định. Một số ưu điểm và nhược điểm của phương pháp này được nêu ở bảng 1. Bảng 1: Ưu – nhược điểm của microarray Ưu điểm Nhược điểm Nhanh: một người có thể thu nhận dữ Chi phí cao liệu về mức độ phiên mã hơn 20 000 Protein mới là sản phẩm cuối RNA trong 1 tuần cùng của quá trình biểu hiện Toàn diện: có thể có định toàn bộ các gene, không phải RNA. loại RNA trên một microarray. Phương pháp quản lý chất lượng Linh hoạt: có thể cố định cả cDNA không chắc chắn. hoặc oligonucleotide lên microarray, do Kết quả phụ thuộc vào nhiều yếu đó phương pháp này có rất nhiều ứng tố (ngày tách chiết RNA, người dụng (đo microRNA, DNA methyl phân tích, ) hóa, ) Công việc đầu tiên là tách chiết RNA từ mẫu cần phân tích. Phương pháp này có thể áp dụng cho nhiều loại mẫu thuộc nhiều loại sinh vật như vi khuẩn, nấm, người và ngay cả virus. Để phân tích, lượng mẫu ban đầu phải có khối lượng RNA khoảng 1 – 5 µg. Có thể giảm khối lượng mẫu ban đầu bằng cách sử dụng phương pháp khuếch đại RNA hoặc cDNA, tuy nhiên mật độ sau khi khuếch đại không phản ảnh đúng mật độ RNA ban đầu. Có 3 hướng thiết kế thí nghiệm: So sánh riêng lẻ các mẫu sinh học khác nhau (biological replicates) (Hình 5.a): ví dụ như dòng tế bào có xử lý thuốc với dòng tế bào không xử lý thuốc . So sánh 2 dòng RNA tách chiết trên cùng một microarray (technical replicates) (Hình 5.b): RNA của 2 mẫu được tách chiết và đánh dấu bằng phóng xạ hoặc huỳnh quang khác nhau (ví dụ đánh dấu Cy5(đỏ) trên mẫu 1 và Cy3 (xanh) trên mẫu 2). Sau đó, 2 mẫu được trộn lẫn và lai trên cùng một microarray. Nếu gene có biểu hiện ở mẫu 1 (có RNA phiên mã từ gene đó), không biểu hiện ở mẫu 2 thì tại vị trí gene đó có màu đỏ; ngược lại gene biểu hiện ở mẫu 2 và không biểu hiện ở mẫu 1 thì vị trí gene đó có màu xanh. Khi gene biểu hiện ở cả 2 mẫu thì vị trí gene đó có màu vàng (màu trộn của đỏ và xanh). Từ đó tính toán được tỷ lệ biểu hiện 81
gene ở 2 mẫu. Có thể thiết kế thí nghiệm theo từng cặp mẫu để thu được dự liệu phân tích bao quát. So sánh dựa trên một mẫu chuẩn (Hình 5.c): Lai lần lượt từng mẫu với mẫu chuẩn rồi so sánh biểu hiện gene dựa vào hình ảnh thu nhận được. Quy trình thực hiện gồm 6 bước được tóm tắt như hình 4: ThiThiết kếết thíkế thínghi nghiệmệm SoSo sánh sánh mô mô bình bình th thưườờng/mông/mô b bệệnh;nh; t ếtế bào bào quaqua x xửửlý/khônglý/không x xửửlý;lý; giai giai đo đoạạnn phát phát tri triểểnn sớm/musớm/muộn.ộn. Chuẩn bị RNA và mẫu dò Tách chiết RNA, đánh dấu huỳnh quang hoặc đồng vị phóng xạ. So sánh 2 mẫu Lai hai mẫu trên microarray. Phân tích hình ảnh Nhận diện tín hiệu phát hiện của các gene biểu hiện, định lượng. Phân tích dữ liệu: xác định chiều hướng biểu hiện của các gene (sử dụng phần mềm scatter plots); xác định các gene liên quan (cluster analysis); phân loại mẫu. Tách chiết RNA, đánh dấu huỳnh quang hoặc đồng vị phóng xạ. Xác nhận sinh học Kiểm tra lại sự biểu hiện của gene bằng các phương pháp ví dụ như phương pháp Northern Nhập thông tin vào cơ sở dữ liệu (GEO, ArrayExpress) Hình 4: Quy trình thực hiện của phương pháp microarray So sánh dữ liệu phân tích được với các thí nghiệm liên quan khác. 82
Lai đơn mẫu M M M M M ẫu 1 ẫu 2 ẫu 3 ẫu 4 ẫu 5 Lai chéo mẫu M M M M M M ẫu 1 ẫu 2 ẫu 1 ẫu 3 ẫu 1 ẫu 4 M M M M M M ẫu 2 ẫu 3 ẫu 2 ẫu 4 ẫu 3 ẫu 4 Lai với mẫu chứng M Mẫ M Mẫ M Mẫ M Mẫ ẫu 1 u chứng ẫu 2 u chứng ẫu 3 u chứng ẫu 4 u chứng Hình 5: Các kiểu thiết kế thí nghiệm Bước 1: Thiết kế thí nghiệm Bước 2: Chuẩn bị RNA và mẫu dò Có thể tinh chế RNA từ tế bào hoặc mô bằng các nhân tố như TRIzol (Invitrogen). Trong một số ứng dụng của microarray cần phải tinh chế mRNA từ RNA tống. Khi so sánh hai mẫu cần tinh chế RNA ở cùng một điều kiện (ngày tách chiết, giai đoạn lấy mẫu, ). Độ tinh sạch và chất lượng RNA được đánh giá bằng quang phổ (tính tỷ lệ a260/a280) và bằng điện di. Có thể sử dụng thuốc nhuộm huỳnh quang như RiboGreen để đánh giá số lượng. Độ tinh sạch của RNA được kiểm chứng lại bằng phương pháp Northern hoặc PCR. Mẫu RNA có lẫn DNA, rRNA, DNA ty thể, carbohydrate hoặc các đại phân tử khác sẽ làm tăng độ nền, gây sai số trong kết quả phân tích. Sau khi tách chiết, RNA được dùng để tạo cDNA hoặc mạch bổ sung RNA rồi được đánh dấu bằng huỳnh quang (hoặc phóng xạ) để phát hiện nó trong mẫu. Bước 3: Lai mẫu đã đánh dấu trên DNA microarray 83
Microarray là một giá đỡ rắn như màng nylon hay tiêu bản thủy tinh dùng để cố định những đoạn DNA đã biết trình tự. Các quy trình thường cố định khoảng 5ng cDNA (chiều dài từ 100 đến 2000bp) hoặc oligonucleotide lên microarray, xếp theo hàng và cột. Tùy vào tính chất của giá đỡ rắn sử dụng trong cố định DNA mà microarray có những tên gọi khác nhau như blot, màng, chip hay tiêu bản. DNA trên microarray là DNA đích. Người ta đem lai RNA tách chiết từ mẫu kiểm tra đã được đánh dấu với các đoạn mẫu dò trên microarray, ủ qua đêm để mẫu đạt hiệu suất lai cao rồi rửa lại bằng dung dịch đệm. Bước 4: Phân tích hình ảnh Sau khi rửa, ta thu nhận hình ảnh mẫu microarray với những chấm màu (đối với mẫu đánh dấu bằng huỳnh quang) hay những chấm đen đậm nhạt khác nhau (đối với mẫu đánh dấu phóng xạ [33P]). Kết quả hình ảnh giúp mô tả định lượng những mRNA nào trong mẫu được biểu hiện. Hình 6: Hình ảnh microarray 6 tín hiệu quan sát được khi sử dụng phần mềm NIHImage. Phần mềm phân tích hình ảnh phải xác định được tính chất của mỗi tín hiệu, bao gồm cả khả năng một tín hiệu mạnh (phía dưới bên trái) sẽ đè lên tín hiệu yếu (bên dưới bên phải) 84
Một microarray của NEN Perkin-Elmer (gồm 2400 gene) Bước 5: Phân tích dữ liệu Phân tích dữ liệu microarray nhằm mục tiêu xác định các gene riêng lẻ được điều hòa riêng biệt và các kiểu biểu hiện của gene. Khi tiến hành thí nghiệm trên các gene đồng điều hòa thì kết quả cho thấy có sự liên quan về chức năng giữa các gene này. Từ đó, các gene sẽ được phân tích và phân loại thành những nhóm riêng rẽ. Để tiêu chuẩn hóa các bước trong phân tích dữ liệu microarray, Brazma và đồng nghiệp (2001) ở 17 cơ quan khác nhau đã đề nghị xây dựng một hệ thống lưu trữ và chia sẻ dữ liệu microarray. MIAME (Minimum Information About a Microarray Experiment) cung cấp một khung sườn cho các nhà nghiên cứu nhằm mô tả thông tin trên 6 vấn đề: thiết kế thí nghiệm, thiết kế microarray, cách chuẩn bị mẫu, quy trình lai, phân tích hình ảnh và mẫu chuẩn dùng để bình thường hóa các mẫu xét nghiệm. Bước 6: Xác nhận sinh học Thí nghiệm microarray cho ra kết quả định lượng của hàng ngàn giá trị phiên mã mRNA. Phân tích dữ liệu nhằm phát hiện ra các gene có điều hòa đáng kể, tùy thuộc vào mô hình thí nghiệm và cách phân tích thống kê. Danh sách các sản phẩm phiên mã được điều hòa có thể có dương tính thật (được điều hòa thật) và cũng có dương tính giả (các gene được báo cáo là điều hòa đáng kể nhưng thực sự không đúng như vậy). Cần phải xác nhận lại một cách độc lập các gene, tối thiểu là một số gene được điều hóa nhất. 3. Mass Spectrometry Kỹ thuật mass spectrometry (định lượng bằng quang phổ) cho phép xác định protein với độ nhạy cao, từ đó nó đã cách mạng hóa lĩnh vực proteomi và cs (Mann và cs, 2001; Cox và Mann, 2007). Sau đây là một số ứng dụng của mass spectrometry: 85
(1) Xác định protein: ví dụ như xác định protein trên gel 2 chiều hoặc từ một hỗn hợp phức tạp như dịch trích từ tế bào hay từ các dịch tinh chế sinh hóa. (2) Mô tả đặc điểm của protein đã biết: ví dụ như protein tái tổ hợp. (3) Mô tả tính chất của các biến đổi của protein sau khi dịch mã. Kỹ thuật mass spectrometry có thể định lượng protein với độ đúng và chính xác cao, nó có thể phân biệt được thay đổi nhỏ trong protein như sự tăng thêm một nhóm phosphate. Bên cạnh đó, mass spectrometer có thể phân tích protein mang hay phân tử peptide ở thể khí bằng cách chuyển protein sang thể khí và ion hóa nó nhờ máy phun điện (electrospray) hoặc dùng MALDI (matrix-assisted laser desorption ionization). Trong phương pháp MALDI-TOF (MALDI with time-of-flight spectroscopy), phân tử phân tích được làm khô trên chất nền kim loại, sau đó chiếu laser làm phân mảnh phân tử, tạo ra các ion. Các ion này đi qua một cái gương (ion mirror) và được phát hiện bời máy khuếch đại điện tử (channeltron electron multiplier). Tỷ lệ khối lượng đo được của ion cho thấy thời gian ion đi tới máy dò; những ion nhẹ hơn (ion nhỏ hơn) có vận tốc cao hơn và được phát hiện trước. Dựa vào phương pháp này có thể nhận diện được thành phần amino acid của peptide ở độ nhạy 1 femtomol. Sau khi đo được khối lượng của các mảnh, ta so sánh khối lượng này với dữ liệu protein để xác định mẫu phân tích là protein gì. Một số cơ sở dữ liệu thường sử dụng là RefSeq và dbEST của NCBI, Swiss-Prot và MSDB (Mass Spectrometry protein sequence DataBase). Phần mềm hỗ trợ cho việc so sánh giữa protein mẫu với cơ sở dữ liệu cũng rất đa dạng, trong đó phần mềm được sử dụng phổ biến là công cụ OMSSA của trang web NCBI và MASCOT (Perkins và cs, 1999). la ser V ùng trồi Đọ c kết quả Đ Hình7: Phương pháp MALDI - TOF ầu dò 4. Kỹ thuật mô phỏng tính tương đồng (homology modeling) Trong cơ sở dữ liệu PDB có khoảng 50 000 cấu trúc protein, trong khi đó có tới hơn 5 triệu trình tự protein trong SwissProt/TrEMBL (tính đến tháng 11 năm 2007). Với số lượng protein khổng lồ này thì việc xác định mô hình cấu trúc cần có sự hỗ trợ của máy tính cho các thí nghiệm xác định thông thường. Cấu trúc protein có thể được phân tích bằng cách xác định tinh thể nhờ tia X và quang phổ NMR. Phương pháp được tin cậy nhất dùng trong xác định mô hình và đánh giá cấu trúc 86
mới là so sánh với các cấu trúc đã biết hay còn gọi là mô phỏng cấu trúc tương đồng (Jones, 2001; Baker và Sali, 2001). Đây là phương pháp được sử dụng chủ yếu trong lĩnh vực nghiên cứu chức năng bộ gene. Quá trình so sánh này bao gồm 4 bước sau (Marti-Renom và cs, 2000): (1) Chọn khung và đánh giá gấp cuộn. Bước này có thể thực hiện nhờ tìm kiếm các trình tự hay cấu trúc protein tương đồng bằng các công cụ như BLAST và PSI-BLAST từ các cơ sở dữ liệu như PDB, CATH và SCOP. Từ đó xác định vùng cấu trúc bảo tồn và những vùng cấu trúc biến đổi (thường tương ứng với các gấp, cuộn ở ngoài protein). (2) Sắp gióng cột trình tự đích với khung. (3) Xây dựng mô hình. (4) Đánh giá mô hình. Một số lỗi thường mắc phải trong kỹ thuật mô phỏng cấu trúc tương đồng là: Nhập sai chuỗi. Sai vùng sắp gióng cột. Sai vùng tương đồng trên trình tự đích với khung. Sắp gióng cột trình tự. Sử dụng sai khung. Hình 8: Dự đoán cấu trúc protein và độ chính xác của các phương pháp (Baker và Sali (2001)) Nhận diện Độ chính xác Độ phân giải Kỹ thuật Ứng dụng trình tự của mô hình Nghiên cứu cơ 100% chế xúc tác Thiết kế và hoàn thiện 100% 1.0 Å ligand Dự đoán các th ể bằng tia X, NMR phần protein Phương pháp phân tích tinh Xác định epitop kháng thể 50% Hỗ trợ đột biến 95% 1.5 Å điểm So sánh c ấu trúc protein tương đ ồng 87
Cải tiến cấu trúc 30% 80% 3.5 Å NMR Điểu chỉnh mật độ electron với Threading độ phân giải thấp <<20% 80 aa 4 - 8 Å Xác định vùng D ự m ới đoán c ấu trúc bề mặt bảo tồn Bảng 2: Các website có chương trình mô phỏng cấu trúc tương đồng và đánh giá chất lượng Website Đề suất URL 3D-JIGSAW Phòng thí nghiệm của Paul Bates 3djigsaw/ Geno3D POLE MODELLER Nhóm Andrej Sali PredictProtein Phòng thí nghiệm của Burkhard Rost SWISS- ExPASy MODEL PROCHECK Quản lý chất lượng procheck/procheck.html VERIFY3D Quản lý chất lượng WHATIF Quản lý chất lượng Độ chính xác của việc dự đoán cấu trúc protein có liên quan đến phần trăm nhận diện trình tự giữa protein đích và khung của nó. Khi 2 protein giống nhau từ 50% trở lên về thành phần aminoacid thì chất lượng mô hình cũng sẽ tốt. Ví dụ, phương sai của mạch chính thường là 1Å, độ chính xác của mô hình giảm khi mô hình chỉ tương đồng 30 đến 50% và tỷ lệ sai số sẽ tăng nhanh khi độ tương đồng dưới 30%. Nhiều trang web có chức năng mô phỏng mô hình tương đồng và có bao gồm cả quản lý chất lượng như SWISSMODEL ở trang ExPASy, MODELLER, và trang Predict Protein (Bảng 2). Sau khi tạo một mô hình thì cần phải đánh giá lại chất lượng của nó nhằm đánh giá xem cấu trúc đó có phải là cấu trúc đặc biệt, ngoại lệ hay không, dựa vào kiến thức tổng quan về các quy tắc cấu trúc protein. Đánh giá chất lượng nghiêm ngặt sẽ được áp dụng để tính toán xem chiều dài và góc có phù hợp không, liên kết peptide có 2 chiều không, cấu trúc sường carbon có chấp nhận đươc không, có môi trường cục bộ thích hợp cho các phần kỵ nước và ưa nước 88
không, và protein có thể hòa tan không. Một số chương trình dùng trong đánh giá chất lượng bao gồm VERIFY3D, PROCHECK, và WHATIF ở trang CMBI (Hà Lan) (Bảng 2). Ngoài các kỹ thuật được giới thiệu trên còn rất nhiều các kỹ thuật khác được ứng dụng vào các phần việc khác nhau trong công trình nghiên cứu chức năng của bộ gene. III. Tài liệu tham khảo Bioinformati và cs and Functional Genomivà cs, Jonathan Pevsner, Tái bản lần 2, 2009, John Wiley & Sons, Inc. (Chương 8, 10, 12) 89
Chương 5 MICROARRAY Giới thiệu chung DNA microarray analysis lần đầu tiên được mô tả vào giữa thập kỷ 1990 và chúng được xem như là một phương tiện hữu ích cho việc khảo sát sự biểu hiện đồng thời của hàng ngàn gen và đã nhanh chóng trở thành một phương tiện hữu dụng cho việc nghiên cứu một loạt các quá trình sinh học. Hầu hết tất cả nghiên cứu đều được thiết kế với một mục đích đơn giản là nhằm so sánh hai họ sinh học để tìm hiểu sự khác nhau trong việc biểu hiện gen của chúng, các gen này có chức năng liên quan đến một loạt các quá trình sinh học như là sự phát triển của các tế bào ung thư, các nguyên nhân dẫn đến bệnh hen suyễn, bệnh về tim, sự rối loạn về thần kinh, hay là phân tích các yếu tố liên quan đến sự vô sinh. Một lượng thông tin có giá trị trong việc điều hòa nghĩa là hiện nay chúng đã có thể kiểm tra sự biểu hiện của một lượng lớn thông tin liên quan đến gen cũng như là RNA. Các nghiên cứu này về mặt nguyên tắc phải đòi hỏi sử dụng các công nghệ kỹ thuật cho phép đồng thời phát hiện nhiều gen cùng một lúc với một khoảng thời gian ngắn nằm trong giới hạn cho phép. Do đó, trong chương này chúng tôi đề cập đến các phương pháp phương tích sự biểu hiện của mRNA với một tần số cao. Chúng tôi chia chương này thành ba phần. Phần một đề cập đến khả năng liên kết của DNA với chính bản thân nó; phần thứ hai đề cập đến vấn đề sử dụng phương pháp PCR (polymerase chain reaction) để khuếch đại một lượng lớn các cDNA. Và cuối cùng phần còn lại liên quan đến kỹ thuật dựa trên việc DNA sequencing để tiến hành định lượng các gen đã được gắn các dấu hiệu đánh dấu. Mỗi phương pháp kể trên đều có những ưu điểm riên của nó, tuy nhiên vẫn còn rất nhiều hạn chế trong việc phân tích một lượng lớn thông tin biểu hiện của các gen. Trong khi đó, phân tích sự biểu hiện các gen dựa trên phương pháp sử dụng DNA microarray là một công cụ hữu ích trong việc phân tích một lượng lớn các gen. Tuy nhiên, nhược điểm duy nhất của nó là phải biết được trình tự các đoạn DNA được gắn trên phiến DNA microarray. Hơn nữa, đây là một kỹ thuật rất tốn kém và xảy ra một vài vấn đề liên quan việc kiểm soát chất lượng và ít nhạy cảm. Khác với việc sử dụng RT-PCR một phương pháp không tốn kém, tuy nhiên có một ưu thế trong việc xác định mức độ biểu hiện gen của các gen chưa biết. Các phương pháp dựa trên gen sequencing như phương pháp Massively parallel signature sequencing (MPSS®) và serial analysis of gene expression (SAGE) cũng liên quan đến việc phân tích sự điều hòa các gen chưa biết nhưng các kỹ thuật này khá tốn kém và đòi hỏi phải có một mức độ cơ sở hạ tầng nào đó cho phép sử dụng các kỹ thuật để đạt được những kết quả tốt. 1. Giới thiệu DNA Microarrays Rất nhiều phương pháp sinh học phân tử và hóa sinh đều là những công cụ hỗ trợ cho việc sử dụng phương pháp microarray. Ví dụng như Biochip có một kích thước nhỏ hơn khá nhiều so với một chiếc tem thư nhưng lại cho phép đo lường sự biểu hiện đồng thời của hàng ngàn gen. Biochip không chỉ thích hợp cho việc phân tích sự biểu hiện gen và cho việc sắp xếp các mà còn được ứng dụng cho việc chuẩn bị và phân tích mẫu. Hiện nay, đã có rất nhiều nỗ lực hướng tới việc phát triển các hệ thống các “lab-on-chip” tích hợp và tự động . Trong một tương lai không xa, các hệ thống như thế này sẽ trở thành một công cụ hữu ích trong việc chẩn đoán liên quan đến các gen và một vài các lĩnh vực khác trong các 90
nghiên cứu liên quan đến gen, và trở thành một công cụ phân tích chính xác và giảm được chi phí tiêu tốn. Bên cạnh ứng dụng trong lĩnh vực microtechnology, một trong những lĩnh vực quan trọng gần đây là ứng dụng trong lĩnh vực nanotechnology, sự phát triển của công cụ thang đo nanometer (10-9 met). Việc thu nhỏ của mức độ này cung cấp khá nhiều lợi ích khác nhau bao gồm việc giảm thiểu chi phí các sản phẩm, tăng tính tự động, tính mềm dẻo của phương pháp. Lĩnh vực ứng dụng biochip trong việc thiết kế nucleic array thích hợp cho việc ứng dụng nanotechnology. Mục tiêu của chương này nhằm tổng kết lại các quá trình chính trong việc thiết kế các microarrays hay “DNA chips” như một công cụ phân tích biểu hiện như một tần số cao và trong tương lai sẽ ngày càng phát triển hành một công cụ hữu ích. Thông tin các gen được mã hóa từ bộ genome người được đánh giá khoảng từ 30,000 đến 40,000 gen, tổng cộng các đoạn có thể lên tới mười phần trăm tổng số 3,2 tỷ nucleotide ((Lander và cs, 2001; Venter và cs, 2001; Zhuo và cs, 2001). Tuy nhiên, trong thời điểm ghi nhận, Chỉ duy nhất một phần mười số lượng các gen được biết rõ về cấu trúc chức năng của các protein và enzyme mà chúng mã hóa. Hầu như các chuỗi nucleic acids đã được xác định trên nhiễm sắc thể, những thông tin biểu hiện gen trong cơ sở dữ liệu vần còn gặp nhiều hạn chế. Do đó, hầu như cấu trúc, chức năng protein mà các chuỗi trình tự mã hóa protein (ESTs) vẫn chưa được biết đến. Một tiêu điểm của các nghiên cứu liên quan đến y dược và hóa sinh là tạo ra lượng thông tin về gen để giải thích cơ chế đồng hóa của tế bào, và đã trở thành một trong những cơ hội thách thức và đầy tiềm năng phát triển, nhưng ứng dụng này khá thú vị và nhiệm vụ này đã tốn mất khá nhiều thời gian trong vài thập kỷ qua. Những quá trình này tiến hành càng nhanh bởi việc ứng dụng DNA microarray trong việc phân tích sự biểu hiện của gen. 2. Lịch sử DNA microarray Đầu tiên có thể kể đến các mô tả đầu tiên về cấu trúc DNA của Watson & Crick (1953), cho thấy có thể tách DNA thành hai mạch đơn (biến tính) khi xử lý nhiệt hoặc dung dịch kiềm. Năm 1961, Marmur & Doty mô tả quá trình ngược lại, hồi tính, cơ sở của tất cả các phương pháp PCR và lai phân tử. Các nghiên cứu này gợi ra cách phân tích axit nucleotide dựa trên mối liên hệ trình tự giữa chúng và các phương pháp lai phân tử phát triển nhanh chóng. Vào cuối những năm 1960, Pardue, Gall; Jones và Roberson tìm ra phương pháp lai in situ (sau này kết hợp với mẫu dò đánh dấu huỳnh quang gọi là FISH). Phương pháp cố định các nhiễm sắc thể và nhân trên phiến kính, sao cho DNA tạo thành mạch kép với mẫu dò, ngày nay được sử dụng để đặt DNA lên phiến kính trong phương pháp microarray. Vào thời gian này, hoá học hữu cơ cũng phát triển, cho phép tổng hợp tự động các mẫu dò oligonucleotide vào năm 1979. Kỹ thuật phân tích sử dụng phương pháp gắn đồng thời nhiều trình tự đích lên một màng lọc theo thứ tự, phương pháp thấm điểm (dot blot), được Kafatos và cs (1979) đưa ra. Trong kỹ thuật này, các trình tự đích được cố định trên giá thể và lai với mẫu dò (thường là trình tự axit nucleic đã đánh dấu). Saiki và cs (1989) đưa ra một cách khác, dot blot ngược, trong đó gắn nhiều mẫu dò theo thứ tự trên màng và đích để phân tích được đánh dấu. Cùng thời gian này, các array đầu tiên với giá thể không thấm nước được tạo ra trong phòng thí nghiệm của Maskos (1991). Đầu những năm 1990, kỹ thuật đánh dấu phát huỳnh quang đa màu được Ried và cs; Balding & Ward giới thiệu để phân tích nhiều loại 91
mẫu dò với phương pháp FISH. Hiện nay, phương pháp này được sử dụng để phân tích so sánh mRNA từ những nguồn khác nhau. Vào năm 1993, array chứa các oligonucleotide ngắn, dưới 19 nucleotide được tổng hợp in situ. Năm 1994, Hoheisel và cs tăng mật độ chấm (spot) bằng cách dùng robot để lấy và đặt mẫu dò lên giá thể giúp tăng tốc độ quá trình, giảm sai sót chắc chắn mắc phải khi thực hiện những thủ tục có tính lặp lại cao bằng tay, và tăng tính chính xác vị trí. Tất cả các thí nghiệm tiên phong ở trên là cơ sở của kỹ thuật array hiện nay. Kỹ thuật này phát triển đến mức chỉ vài năm nữa có thể so sánh nó với kỹ thuật PCR không thể thiếu trong sinh học hiện nay. 3. Nguyên tắc hoạt động của DNA microarray như thế nào? 3.1. Cấu trúc và chức năng của DNA microarray DNA microarray function sử dụng các phương pháp, kỹ thuật lai phân tử cơ bản được phát triển bởi Edward Southern và sử dụng khá thường xuyên kỹ thuật Sothern và Northern Blots.(Alwine và cs, 1977; Brown, 1993; Brown &Mackey, 1997; Dyson, 1991; Southern, 1975). Điểm chủ yếu của phương pháp này là việc lai chuyên biệt giữa chuỗi DNA đơn với nhau dựa trên nguyên lý kết hợp các base của Watson-Crick. Tính chuyên biệt kết hợp này có thể bị giảm trong những điều kiện cụ thể làm giảm khả năng kết hợp ngăn cản quá trình lai giữa trong như các điểm mismatch ở một vị trí riêng lẻ trên một chuỗi của phân tử DNA. DNA microarrays, các chuỗi nucleic acid đã biết chuỗi trình tự được cố định trên phiến mẫu. Mẫu nucleic acid kiểm định được tiến hành đánh dấu và tiến hành lai với các chuỗi nucleic acid đã cố định trên mẫu. Dưới những điều kiện thích hợp, sự bắt cặp Watson- crick được thực hiện giữa các chuỗi acid có trình tự kết hợp được với nhau. Hơn nữa, trong một số điều kiện tốt, cường độ phát hiện các tín hiệu được đo trực tiếp tỷ lệ lượng mẫu dò bắt cặp, do đó, một lượng các mẫu acid nucleic hiện diện trong mẫu được đo. Trong kỹ thuật DNA array, người ta cố định các axit nucleic có trình tự xác định (mẫu dò) trên giá thể (mảng) thích hợp theo thứ tự. Axit nucleic cần nghiên cứu (đích) được đánh dấu sau đó lai với mẫu dò trên mảng. Ở những điều kiện lý tưởng, các axit nucleic có trình tự bổ sung bắt cặp chính xác với nhau. Hơn nữa dưới các điều kiện này, cường độ phát hiện tín hiệu tỷ lệ trực tiếp với lượng mẫu dò nên có thể định lượng các loại axit nucleic trong mẫu ban đầu. Đường kính chấm (mỗi chấm đại diện cho một loại mẫu dò) trên macroarray thường ≥ 300 µm và có thể được hiện hình bằng kỹ thuật gel thông thường hoặc máy quét dùng trong những kỹ thuật blot trước đây. Ngược lại, các chấm trên microarray thường có đường kính 200 µm và cần thiết bị hiện ảnh đặc biệt như máy quét laser tiêu điểm (confocal laser scanner). Các phương pháp mới đây có thể tạo ra đường kính chấm 100 µm và nếu dùng phương pháp in quang hoạt (photolitho - graphy) để tổng hợp mẫu dò oligonucleotide in situ thì có thể tạo ra chấm có đường kính 20 µm. 92
3.2. Microarray mật độ thấp Các microarray mật độ thấp được thương mại hóa rộng rãi bởi các nhà cung cấp hay được sản xuất bởi các nhóm nghiên cứu trong các phòng thí nghiệm trên thế giới. Nucleic acid được lai trên màng nylon hay là phiến kính. Trong một vài trường hợp, các nucleic acid được tiến hành lai chéo với nhau với màng nylon bằng cách sử dụng tia cực tím. Plasmids và các sản phẩm của phản ứng PCR (các spot) với màng lai hay các phiến kính ở một mật độ thấp với 80 - 200 spot cho mỗi cm2 và 500 - 10000 spot cho mỗi cm2 trong trường hợp microarray với mật độ trung bình (Schena & Davis, 1999). Các phương pháp để phát hiện và đánh dấu phụ thuộc vào vật liệu mà các mẫu nucleic acid được tiến hành lai. Các mẫu được đánh dấu phóng xạ được tiến hành trên màng nylon array và xác định bằng phương pháp phóng xạ trên phim Xray. Còn trong trường hợp các mẫu đánh dấu huỳnh quang sẽ được tiến hành trên kính và được phân tích bằng đầu đọc đo huỳnh quang. Các microarray thương mại được sử dụng một cách rộng rãi và kỹ thuật này được miêu tả chi tiết trong các phần sau của quyển sách này. 3.3. Microarray mật độ cao Microarray với hơn 10,000 mẫu dò trong mỗi centimet vuông đã được thiết lập. Ngày nay, khả năng sản xuất DNA microarray với hơn 250,000 mẫu dò trên mỗi centimet vuông (Schena và Davies, 1999). Các microarray mật độ cao được gọi là các DNA chip. Chất nền được sử dụng cho việc cố định các mẫu dò trong microarray mật độ cao, trong một vài trường hợp phiến kính được biến đổi hóa học hay là sử dụng hợp chất silicon. Ngân hàng các acid nucleic trong chip có thể bao gồm các oligonucleotide có thể lên tới 25 đến 60 base trong chiều dài, hay là các đoạn PCR hay trong một trường hợp là các plasmid với lượng các base từ 500 và 5000. Hai ứng dụng của các microarray mật độ cao là định lượng sự biểu hiện các gen và phân tích các chuỗi trình tự acid nuclei và cs. Các mẫu và vị trí của các nucleic acids trên microarray có thể được chọn lựa tùy theo ứng dụng của nó. 3.4. Sử dụng DNA microarray phân tích sự biểu hiện của gen Để phân tích sự biểu hiện của gen, các nucleic acids mà kết hợp tương thích với các mRNA để định lượng được thể hiện trên bề mặt các array. Nói chung, nó không hữu ích trong trường hợp lai trực tiếp mRNS từ các mô phẩm cần khảo sát, cũng như hệ thống phát hiện không hiệu quả trong các trường hợp mà các acid nucleic chưa được tiến hành đánh dấu. Do vậy, các mRNA thông thường được chuyển đổi thành cDNA nhờ phản ứng reverse transcriptase. Bên cạnh đó, bởi hiệu quả chuyển đổi thành cDNA không cao và lượng nguyên liệu mRNA ban đầu lại không đủ lượng lớn để tiến hành (ví dụ như là các mRNA của các mẫu bệnh phẩm sinh thiết, hay là các mẫu phẩm máu), lượng các cDNA thu nhận được sẽ tiến hành khuếch đại chúng. Tuy nhiên, việc này khá quan trọng và trong việc lựa chọn một phương pháp sao cho có thể tránh khỏi tỷ lệ các mẫu acid nucleic bị thay đổi. Trong trường hợp này, hai kỹ thuật được sử dụng một cách rộng rãi là phương pháp PCR với số chu kỳ thấp hay là việc phiên mã in vitro. Trong trường hợp phiên mã in vitro, một promotor cho RNA polymerase được gắn chèn vào chuỗi cDNA thông qua quá trình chuyển đổi reverse transcriptase từ mẫu mRNA của mẫu bệnh phẩm hay mẫu thí nghiệm. Sau đó, cDNA được tiến hành khuếch đại bởi một yếu tố bởi RNA polymerase. Thông suốt quá trình phiên mã in vitro, các phân tử RNA thông thường đều được tiến hành đánh dấu huỳnh quang. Tuy nhiên, nếu lượng RNA không bị hạn chế trong thí nghiệm, các cDNA đã 93
được đánh dấu có thể được sử dụng trực tiếp cho phép lai phân tử trên phiến microarray. Một vài các quy trình biến đổi cho việc khuếch đại của các mẫu RNA hay là cho việc làm gia tăng cường độ tín hiệu biểu hiện đã được miêu tả (Ivashuta và cs, 2002; Karsten và cs, 2002; Mahadevappa & Warrington,1999; Nallur và cs, 2001; Pabón và cs, 2001; Phillips, Eberwine, 1996; Stears và cs, 2000; Wang và cs, 2000a; Zhumabayeva và cs, 2001). Hai quy trình biểu hiện thông thường mà có giá trị trong việc đánh giá sự biểu hiện các gen và trong việc đánh giá sự khác nhau trong sự biểu hiện của gen giữa các mẫu (hình 4.1A và 4.1B). Trong quy trình đầu tiên, các nucleic acid đã được đánh dấu thu nhận từ hai nguồn mẫu khác nhau để so sánh được tiến hành lai trên hai phiến array khác biệt nhau. Trong trường hợp để tiêu chuẩn hóa các cường độ tín hiệu của các tín hiệu gen riêng lẻ thì các phương pháp tiêu chuẩn hóa và phương pháp phân tích thống kê được sử dụng một cách rộng rãi để giải quyết. Thông thường các gen giữ nhà có một tỷ lệ biểu hiện ổn định có thể ứng dụng làm tiêu chuẩn (đối với các trường hợp liên quan đến các vấn đề của việc sử dụng các gen giữ nhà, xem lại chương 1). Thay vào đó, giá trị cường độ tín hiệu của sự biểu hiện được đánh giá và sử dụng cho việc tiêu chuẩn hóa tín hiệu sau này. Một vài các phương pháp đã được phát triển cho việc tiêu chuẩn hóa, định chuẩn dụng cụ, tính phương sai, định lượng, và phân tích thông kê (Alter và cs, 2000; Baldi & Long, 2001; Beissbarth và cs, 2000; Brazma và cs, 2001; Brown và cs, 2001; Chudin và cs, 2002; Claverie, 1999; Draghici và cs, 2001; Eickhoff và cs, 1999; Herwig và cs, 2001; Hill và cs, 2001; Ideker và cs, 2000; Kadota và cs, 2001; Kerr & Churchill, 2001; Kerr và cs, 2000; Lee và cs, 2000; Li & Wong, 2001; Long và cs, 2001; Manduchi và cs, 2000; Mutch và cs, 2001; Naef và cs, 2002; Newton và cs, 2001; Quackenbush, 2001; Rifkin và cs, 2000; Rocke & Durbin, 2001; Schadt và cs, 2000 and 2001; Schuchhardt và cs, 2000; Thomas và cs, 2001; Troyanskaya và cs, 2001; Tseng và cs, 2001; Tsodikov và cs, 2002; Tusher et al; 2001; Wang và cs, 2001a; Yang và cs, 2001 and 2002; Yuen và cs, 2002; Zhang & Zhao, 2000; Zien và cs, 2001). Quy trình thứ hai cho việc so sánh sự biểu hiện các gen liên đòi hỏi thiết lập trên một phiến array cho cả hai mẫu thí nghiệm. Trong trường hợp này, cả hai mẫu được đánh dấu bởi các chất khác nhau, thông thường là hai chất huỳnh quang khác nhau, ví dụ như chất Cy3 (IUPAC name of the water-soluble cyanine dye: 2-[(1E,3E)-5-(1-{6-[2,5-dioxo- 1-pyrrolidinyl)oxy]-6-oxohexyl}-3,3-dimethyl-5-sulfo-1,3-hihydro-2H-indol-2-ylidene)- 1,3-propadienyl]-1-ethyl-3,3-dimethyl-3H-indolium-5-sulphonate) với bước sóng hấp thụ là 552 nanomet và bước sóng phản xạ là 568 nm, và chất huỳnh quang thứ hai là Cy5 (IUPAC name of the water-soluble cyanine dye: 2-[(1E,3E)-5-(1-{6-[2,5-dioxo-1- pyrrolidinyl)oxy]-6-oxohexyl}-3,3-dimethyl-5-sulfo-1,3-dihydro-2H-indol-2-ylidene)-1,3- pentadienyl]-1-ethyl-3,3-dimethyl-3H-indolium-5-sulphonate) với bước sóng hấp thụ là 650 nanomet và bước sóng phản xạ là 667 nm. Quá trình lai trên microarray được tiến hành với một tỷ lệ các mẫu acid nucleic đã được đánh dấu với tỷ lệ 1:1. Các gen với các mức độ biểu hiện được xác định bởi các màu khác nhau, trong khi đó các gen được biểu hiện với một tỷ lệ khác nhau với sự biểu hiện của chất huỳnh quang này khác mạnh hơn so với chất huỳnh quang còn lại. Quy trình được miêu tả trên được thực hiện thông dụng nhất cho các microarray bao gồm các sản phẩm PCR hay các plasmid, quá trình tiến hành đơn giản là một lợi thế của phương pháp này. Tuy nhiên, tính không đồng nhất của động học phép lai trong hỗn 94
hợp chứa một sự khác biệt giữa các phân tử nucleic khác nhau sẽ gây nhiều khó khăn trong việc lai, các lý do có thể gây khó khăn trong việc lai như là nhiệt độ phòng và nồng độ các muối là một vấn đề khá quan trọng đối với các phân tử. Kết quả là sự không đặc hiệu hoặc lai không hoàn toàn có thể xảy ra dẫn đến kết quả không chính xác. Ngoài ra, các nucleic acid được gắn kết trong chất nền với một nồng độ tự do, có thể dẫn đến ảnh hưởng kết quả lai với các mẫu DNA. Một trong những giải pháp cho việc sử dụng các olionucleic microarray bao gồm các mẫu dò nucleic acid trong khoảng phạm vi từ 15 đến 25 bases (thông thường có thể 60 bases). Công ty Affymetrix (Santa Clara,San Diego, USA) đã phát triển giải pháp ưu việt. Trong khoảng giai đoạn này, các microarray sử dụng 11 đến 25-mer oligonucleotides cho mỗi mRNA. Các oligonucleotides trên microarray bổ sung chính xác các đoạn khác nhau với vùng 3’ không mã hóa của mRNA và do đó được gọi là các oligomucleotides kết hợp hoàn hảo (hình 4.2). Từ nhiệt độ nóng chảy của việc lai các oligonucleotide trên microarray mẫu DNA có thể xác định được dựa trên các đoạn cơ bản, các đoạn oligonucleotide với các đặc điểm lai tốt nhất có thể được chọn lọc dựa trên các đoạn mRNA của gen mà sự biểu hiện được nghiên cứu. Do đó, ngay cả việc lai các oligonucleotide kém hay không hiệu quả, những vẫn đủ cho việc phân tích kết quả một cách chính xác. Trong mẫu đối chứng âm để có sự kết hợp bổ sung các oligonucleotide, công ty Affymetrix thiết kế microarray cũng chứa đựng các một lượng các mismatch của oligonucleotide như nhau khác biệt so với các chuỗi kết hợp hoàn hảo bởi sự hiện diện của một mismatch base trong vùng trung tâm của oligonucleotide. Lý tưởng hơn, ở đây không xảy ra hiện tượng lai dưới những điều kiện bình thường đối với các mismatch oligonucleotide do đó các tín hiệu được thu nhận từ các phép lai không chuyên biệt. Những sự khác biệt trong các cường độ tín hiệu giữa các match hoàn hảo và mismatch của các oligonucleotide cho phép đánh giá sự kết hợp không chuyên biệt. Một thuật toán được ứng dụng cho việc tính toán cường độ chính xác cho các match oligonucleotide được tiến hành so sánh với cường độ biểu hiện trong phiến array thứ hai khác với những mẫu dò khác. Sự khác cuối cuối cùng trong một lượng các lớn mRNA giữa kết quả của hai mẫu từ sự tích hợp các kết quả của việc so sánh tất cả các điểm match của oligonucleotide biểu hiện (Hình 4.3). Kỹ thuật được ứng dụng cho việc sản xuất các microarray nêu trên được miêu tả ở phần dưới. Trước một công nghệ kỹ thuật hữu ích, đọc giả cần thiết phải nhận thức được những điểm khó khăn của microarray trong việc thiết kế phân tích sự biểu hiện của gen. Hình 4.1 Hai ví dụ cho việc phân tích sử biểu hiện gen dựa trên việc sử dụng DNA microarray. 95
Hình A. DNA microarray sử dụng hệ thống phát hiện hai màu. Hai mẫu RNA (được đánh dấu hoặc là Cy3TM hay Cy5TM) được trộn lẫn với nhau và tiến hành lai trên một phiến array chứa 6,116 RNAs của nấm mem và đối chứng. Hình ảnh được cung cấp bởi TS. Patrick O. Brown (Trường Đại học Stanford, California, USA). Hình B, Human Genome U95A array (Affymetrix, Inc., Santa Clara, San Diego, UAS) được tiến hành lai với cRNA được đánh dấu bằng biotin (phát hiện sau khi tiến hành ủ hai lần với streptavidin-bound phycoerythrin) thu nhận từ dòng tế bào monocyte của người THP-1. Phiến array chứa đựng hơn 12,000 mẫu dò dùng để ứng dụng biểu hiện gen người. Hình 4.2 Phân tích biểu hiện với một cường cao bằng oligonucleotide array (Affymetrix, Inc., Santa Clara, California, USA) sử dụng hệ thống perfect match/ mismatch. Một vài vùng của mRNA được biểu hiện trên bề mặt của array như 25-mers (mẫu perfect match). Mismatch oligonucleotides khác với perfect oligonucleotide bởi các thay đổi của các base trong trung tâm của oligonucleotide. So sánh cường độ tín hiệu giữa các mẫu dò perfect match và mismatch được sử dụng có quyết định đến tính chuyên biệt của kết hợp. Vùng 1 cho thấy 1 ví dụ mà mẫu được tiến hành lai với perfect match và mismatch; vùng này được loại trừ khi tiến hành tính toán. Tương tử, vùng 3 không được đánh giá bởi vì các mẫu lai với perfect match và mismatch với một cường độ biểu hiện như nhau cho thấy không có tính chuyên biệt trong phép lai. Tất cả những vùng còn lại khác được tiến hành đánh giá cho thấy tính chuyên biệt trong phép lai phân tử và là đối tượng của phép phân tích. Hình 4.3. Chi tiết hình ảnh của oligomicroarray được lai với các mẫu cRNA chuyển đổi từ các mRNA từ việc nuôi cấy nấm mem. 96
Các tế bào nấm mem được tiến hành nuôi trong môi trường giàu dinh dưỡng và nghèo dinh dưỡng, ở nhiệt độ 30oC. Vùng được đánh dấu [ ] cho thấy có sự xuất hiện của perfect match và mismatch oligonucleotide mà biểu hiện sự xuất hiện của các RNAs với các cường độ biểu hiện khác nhau trong hai môi trường nuôi cấy. (Affymetrix, Inc., Santa Clara, California, USA) 3.5. Re-sequencing by hybridisation Đáng lưu ý rằng việc sử dụng microarray không giới hạn trong việc phân tích sự biểu hiện của gen. Sử dụng oligonucleotide với tần suất cao cho việc re-sequencing bởi phép lai phân tử cho phép việc xác định đột biến và single nucleotide polymorphisms (SNPs) trong chuỗi gen đã biết. Sau khi khuếch đại và đánh dấu, mẫu được đem xét nghiệm tiến hành lai với oligonucleotides trên phiến array. Việc sử dụng microarray chứa đựng gồm các olionucleotides bổ sung với mỗi bốn base trên mỗi vị trí một cách hiệu quả cho phép một chuỗi trình tự DNA chưa biết có thể quyết định dựa trên việc lai mẫu thí nghiệm (hình 4.4). Hiện nay, sequencing bởi việc sử dụng phương tiện DNA microarray gặp nhiều hạn chế bởi những khó khăn gặp được trong suốt quá trình tiến hành thí nghiệm lai, do đó, việc xác định bất kỳ một đột biến nào được tìm thấy là rất cần thiết trước khi kỹ thuật này khi được ứng dụng vào mục đích chẩn đoán. Hơn nữa, kỹ thuật này gặp thất bại khi nếu các đột biến hay những độ chênh lệch trong các chuỗi như là việc xen vào hay xóa bỏ các chuỗi nucleotide. Đối với lý do này, phương pháp sequencing được xem như là phương pháp hữu hiệu. Đương nhiên, trong tương lai, tình trạng này có thể bị thay đổi trong việc thiết kế phiến array cũng như là quá trình thực hiện trên dữ liệu thông bioinformativà cs Hình 4.4 Re-sequencing DNA sử dụng phiến oligonucleotide microarray. Các mẫu lai duy nhất với các oligonucleotide bổ sung một cách hoàn hảo. Do vị trí và chuỗi trình tự của oligonucleotides trên phiến array đã được biết, chuỗi trình tự của các mẫu thí nghiệm có thể bị giảm từ các mẫu lai phân tử. Trục X cho thấy các chuỗi trình tự được đọc từ các mẫu lai trên phiến array. Trục Y quyết định cường độ của các base tại vị trí trên phiến array. 4. Sản xuất DNA microarray DNA được ứng dụng thiết kế trên bề mặt của phiến array theo một trong hai cách khác nhau, cố định các acid nucleic hay việc tổng hợp các oligonucleotide trong in situ. Một số các kỹ thuật cố định DNA được xây dựng, bao gồm nhiều phương pháp khác nhau như contact-tip printing, micro-contact printing (CP), micro-fluidivà cs network (FN) và 97
electro capture. Piezoelectric printing và micro wet printing (WP) có thể được sử dụng cho cả việc cố địnhvà tổng hợp in situ. Kỹ thuật photolithographic được sử dụng cho việc duy nhất tổng hợp in situ. Sau đây cung cấp những thông tin liên quan đến các kỹ thuật nói trên. 4.1. Chế tạo mảng (Subtract) Cơ chất dùng để chế tạo mảng cần có các tính chất sau: gắn ổn định với mẫu dò, tín hiệu nền gây nhiễu thấp, tính chất hoá học bề mặt đồng nhất và chất lượng dữ liệu cao. Một số chất đáp ứng được những điều kiện này và thường được sử dụng là thuỷ tinh, polypropylene, hoặc silicon, trong đó thuỷ tinh thường được dùng nhất. Giá thể thường được biến đổi hoá học để dễ dàng gắn với mẫu dò. Trong trường hợp cơ chất thuỷ tinh, người ta phủ lên đó polymerase-lysine, amino silance hoặc silance có gốc amin hoạt hoá để tăng tính kỵ nước và khả năng bám dính của mẫu dò. Thành phần thứ hai của mảng là mẫu dò. Mẫu dò để gắn trên mảng cần được lựa chọn kỹ theo đích sử dụng. Hiện đã có nhiều phần mềm cũng như cơ sở dữ liệu giúp đơn giản hoá công đoạn này. Tuỳ mục đích sử dụng, mẫu dò có thể là oligonucleotide ngắn (15-25 nucleotide), oligonucleotide dài (50-120 nucleotide) hoặc cDNA (dài 100-3000 bp). Sau khi chọn được mẫu dò, gắn (hay còn gọi là in) chúng trên bề mặt mảng bằng hai cách: (i) cố định (cDNA) (ii) tổng hợp in situ (oligonucleotide). Cách thứ nhất thường sử dụng robot với các kỹ thuật in kim (contact-tip deposition printing), in vi tiếp xúc (micro- contact printing (µCP)), in vi kênh (micro-fluidivà cs networks (µFN)) và in mạ (electro capture) để đặt mẫu dò đã tổng hợp từ trước lên mảng. Kỹ thuật in quang hoạt (photolithographic) được dùng cho các ứng dụng cách hai. Ngoài ra, in áp điện (piezoelectric printing) và in vi lỏng (micro wet printing (µWP)) có thể sử dụng cho cả cố định và tổng hợp in situ. 4.2. Contact-tip deposition printing Kỹ thuật này có giá trị thương mại vào năm 1997 bởi công ty Synteni, được nhiều nhóm nghiên cứu sử dụng để chế tự tạo mảng DNA. Đầu tiên người ta hoà tan axit nucleic sau đó nhúng kim nhọn vào để lấy ra một lượng dung dịch xác định tại đầu của nó. Sau đó gắn dung dịch này lên bề mặt của cơ chất (Hình 4.5). Trong thực nghiệm, dùng nhiều đầu kim cùng lúc. Trong một vài trường hợp, mũi kim có một khe mang như là một chỗ chứa dung dịch để gắn vào mảng như hình dạng của một cây viết bi (Hình 4.6, Schena et al, 1995). Hình 4.5 Sản xuất DNA microarray bằng phương pháp Contact-tip deposition printing Công ty Genetic Microsystem (Woburn, Massachusetts, USA; Affymetrix, Inc., Santa Clara, CA, USA) giới thiệu một kỹ thuật khác được gọi là hệ thống “pin-and-ring array” vào năm 1998 (Rose, 1998). Một vòng nhỏ bán kính vài milimet được nhúng vào dung dịch nucleic acid. Một màng hay lamella được hình thành trong vòng bởi cường độ bề mặt như cái màng xà phòng của trò chơi con nít khi thổi bong bóng xà phòng (Hình 4.7) 98
Hình 4.6. Mũi kim sử dụng cho phương pháp contact-tip deposition printing A. Tip với kích thích 0,004 cm sử dụng cho việc tạo các phiến có các điểm có đường kính từ 50 đến 120 milimet. B. Tip kích thích 0,025 cm sử dụng cho việc tạo các phiến có các điểm có đường kính 100 milimet. C. Tip kích thích 0,025 cm sử dụng cho việc tạo các phiến có các điểm có đường kính khác nhau. D. Tip với 0,20 milimet cho việc chuẩn bị các điểm có chứa mẫu dò lớn với các đường kính khác nhau (Stanford University, California, USA). Hình 4.7. Sản xuất microarray bằng kỹ thuật pin-and-ring array. Các nucleic acid gắn kết rất kém trên các phiến thủy tinh thô do đó phải tiến hành xử lý trước khi gắn DNA vào. Poly-L-Lysine mà gắn kết với các phân tử sinh học bởi các tương tác ion, thường được sử dụng cho mục đích này. Các microarray có thể được sử dụng một lần, tuy nhiên, do điều kiện về nồng độ của muối đòi hỏi phải loại bỏ các mẫu DNA-lai cũng được phân tách từ các mẫu dò cố định từ trên bề mặt của phiến array. Hơn nữa, các mẫu dò nucleic acid được phủ phiến như theo phương pháp này sẽ làm giảm các lai kinetivà cs bởi sự cản trợ steric. Vấn đề này được tránh khỏi hay ít nhất cũng được làm giảm bởi việc sử dụng như là các linker của các phân tử như là việc thu nhận các oligoehtyleneglycol để phân tách ra các DNA bất động từ bề mặt array. Bề mặt kính thường được xử lý bằng muối mà kết hợp tốt với các DNA bởi các tương tác theo quy luật Schiff-base, do đó, có thể ngăn cản việc loại bỏ các mẫu DNA trong suốt quá trình lai và bước tiến hành rửa mẫu và cho phép tái sử dụng các phiến array. Phiến kính mà được sử dụng cho việc phát hiện các mẫu nucleic acid được đánh dấu bởi các chất phóng xạ có thể được phủ lên một màng nylon cho phép các mẫu dò DNA có thể gắn kết với sử hỗ trợ ánh sáng cực tím. 99
Do một lượng mẫu rất hạn chế nên đòi hỏi phương pháp contact-tip deposition printing được sử dụng phương pháp này để thiết kế các phiến array (phương pháp làm thông thường nhất). Các máy in mẫu dò thông dụng (‘spotters) được sử dụng một cách rộng rãi. Nhóm nghiên cứu Pat Brown của trường Đại học Stanford, Califonia đã cung cấp và giới thiệu công cụ trên internet ( 4.3. CP – Micro-contact printing Phương pháp CP – Micro-contact printing có nguyên lý tương tự phương pháp contact-tip deposition printing. rong đó, dùng “con dấu” polydimethysilane (PDMS) để chuyển axit nucleic lên bề mặt giá thể (Hình 4.8). Ưu điểm của vật liệu này là nó có thể sản xuất trên một cấu trúc rất nhỏ. Vào thời điểm viết sách này, các caon dấu đã được sản xuất với một kích thước có thể nhỏ hơn 50 nanomet. Theo lý thuyết, nó đã mở ra một thời kỳ sản xuất với một mức độ thu nhỏ sản xuất mới (Kumar và Whitesides, 1993). Tuy nhiên, các kết quả thực tế cho thấy rằng khi sử dụng phương pháp CP đã gây sự thất vọng trong quá trình thiết kế. Trong khi đó, CP được sử dụng cho việc cố định các mẫu kháng thể trên bề mặt vàng (Morhard và cs, 1988), kỹ thuật này vẫn chưa được thành công trong việc sản xuất những mẫu dò với mật độ cao đòi hỏi trong việc sản xuất các DNA array. Hình 4.8 Sản xuất DNA array bằng phương pháp sử dụng micro-contact printing. 4.4. FN-Micro-fluidivà cs net work (In vi kênh) Kỹ thuật FN-Micro-fluidivà cs net work được cãi tiến từ CP. Trong kỹ thuật FN, một con dấu PDSM có chứa đựng một kênh nhỏ được đặt trên một phiến kính bằng thủy tinh, vàng, polystyrene hay silicon/ silicone dioxide (Hình 4.8). Các kênh nhỏ này chứa dung dịch cơ bản sẽ được tiêm vào bề mặt bởi lực hút mao dẫn. Hệ thống này được sử dụng cho việc cố định các mẫu kháng thể cho phép hoạt hóa các cơ chất bởi N- hydroxysuccinimidyl esters (Delamarche at el., 1997). Tuy nhiên, tính khả thi của FN cho việc sản xuất các DNA array vẫn chưa được tập trung nghiên cứu đầy đủ. Vào thời điểm viết này, các con dấu PDMS có thể đo tới 3 milimet x 1 milimet đã được sử dụng cho việc thiết kế 100 mao mạch với độ sâu 1,5 milimet, chiều rộng 3 lilimet, và chiều dài 3 milimet trên các phiến cơ chất khác nhau (Ligher và cs, 1988). 4.5. Piezoelectricprinting Piezoelectric printers sử dụng kỹ thuật được phát triển từ in kim để pha trộn một lượng dung dịch DNA thay vì các loại mực in thông thường (heriault và cs, 1999). Sử dụng các tip silicon và thủy tinh với kích thước bán kính nhỏ hơn 100 micromet, với thể tích khoảng 15 picolit (15 x 10-12 lit). Kỹ thuật Piezoelectric printing được thể hiện trong hình 4.11 và 4.12 cho thấy việc thiết kế những giọt như một cái tip mao quản. Sản xuất microarray bằng phương pháp Piezoelectric printing có thể sản xuất các điểm lên tới 10,000 điểm trên mỗi centimet vuông. 100
Hệ thống Piezoelectric printing được sử dụng một cách rộng rãi cho phép sử dụng cho việc sản xuất các array với các điểm có đường kính vào khoảng 200 micromet, khoảng cách giữa các điểm vào khoảng 300 microarray và mật độ các điểm vào khoảng 25 đến 30 micomet (Harris và cs, 2000; Okamoto và cs, 2000). Hình 4.11. Quy trình Piezoelectric printing và sơ đồ cấu trúc của piezoelectric jet Hình 4.12. Tổng hợp oligonucleotide in situ bằng phương pháp piezoelectric dispenser. Hình A. Tiến hành bằng jet đơn. Hình B. Tiến hành bằng đa jet. 4.6. Electro capture (electrochemical focussing) Các array này giống như một con chip silicon. Giá thể ở đây là silicon có lớp bề mặt bị ôxi hoá bởi nhiệt. Ở những vị trí xác định trên bề mặt này có các điện cực platin dày 500 nm. Sau đó tiến hành một loạt các biến đổi hoá học có thứ tự để tạo ra chip gồm nhiều lớp. Toàn bộ chip trừ phần không gian của điện cực platin được phủ lớp lưỡng điện (dielectric) Si3N4 dày 2 mm, bằng cách này có thể thao tác với điện cực từ trên xuống trong khi xung 101
quanh nó được bảo vệ bởi lớp Si3N4. Trên cùng của chip là lớp streptavidin-agarose giúp cố định các phân tử axit nucleic đã biotin hoá. Hình 4.13. Kỹ thuật tạo array bằng phương pháp Electro capture Gắn mẫu dò lên chip bằng cách phủ lên bề mặt dung dịch chứa các oligonucleotide đã biotin hoá . Chúng được vận chuyển đặc hiệu tới các chấm chứa strepta-vidin bằng cách cho dòng điện lần lượt chạy qua mỗi điện cực. Hiện tại, chip với trên 400 điện cực đang phát triển trong các phân tích di truyền ( Hình 4.14 Sơ đồ chip electric silicon (A) Sơ đồ chip có 25 điện cực platin, chiều dài mỗi cạnh 1 cm. Phần ngoại biên của chip có các điện cực platin (ô vuông màu sáng) để nối chip với nguồn điện. Khi có dòng điện sẽ xuất hiện các đường sáng chạy giữa điện cực ngoại biên và điện cực nhỏ hơn ở trung tâm. (B) Mặt cắt vùng điện cực trong trung tâm. Vùng này chứa điện cực đường kính 160 µm tại bốn góc và 25 điện cực khác xếp thành hình vuông. (C) Vùng điện cực 4.7. Phương pháp in hoạt hóa (Photolithography) Công ty Affymetrix đã phát triển phương pháp in quang hoạt để tổng hợp oligonu- cleotide in situ trên giá thể rắn.Quá trình này dựa trên các kỹ thuật công nghiệp bán dẫn. Đầu tiên, gắn các phân tử có nhóm bảo vệ dễ phân huỷ bởi tia cực tím trên bề mặt giá thể rắn. Dùng mặt nạ để hoạt hoá chọn lọc các vị trí trên bề mặt bằng tia cực tím nhằm loại trừ nhóm bảo vệ nhạy sáng tại đó. Sau đó ủ với các nucleotide để chúng phản ứng với nhóm OH tự do tại bề mặt những vùng đã hoạt hoá, kết thúc một chu kỳ. Lặp lại chu kỳ trên với mặt nạ và nucleotide khác sẽ tạo ra một “bãi chông dày đặc các oligonucleotide có trình tự bất kỳ” tại những vị trí xác định trên cơ chất [14]. Hiện tại, có thể gắn hơn 500,000 oligonucleotide khác nhau trên diện tích 1,28x1,28 cm ( 102
Hình 4.15. Phương pháp in hoạt hóa. 4.8. µWP - Micro wet printing Kỹ thuật này được Ermantraut và cs (1998) phát triển, dùng hộp mực in khung silicon để định vị mặt nạ chắn trên bề mặt mảng. Khung silicon kết hợp với đường ống phân phối thuỷ tinh tạo thành hệ thống kênh. Kênh này sẽ liên kết các đường vào riêng biệt với mặt nạ trong hộp mực. Mặt nạ đóng vai trò giao tuyến của hộp mực và bề mặt mảng đảm bảo chỉ một số vùng nhất định được tiếp xúc với hộp mực chứa chất khử nhóm bảo vệ. Khi dung dịch oligonucleotide và dung dịch rửa đi qua chỗ khử nhóm bảo vệ trên bề mặt, mặt nạ bị tách đi kết thúc một chu kỳ (hình 10). Tiếp tục chu kỳ mới ở đó thay đổi các nucleotide thêm vào và vị trí mặt nạ, ta sẽ tổng hợp được các oligonucleotide ngắn tại những vị trí xác định trên cơ chất. Hệ thống này cũng có thể được sử dụng để cố định các oligonucleotide và các chất khác như protein hoặc kháng thể. Hình 4.16. Sơ đồ nguyên lý của phương pháp microarray. Tuy nhiên, vẫn còn nhiều phương pháp khác nhau trong việc thiết kế, sản xuất microarray. Một trong những vấn đề chính trong nghiên cứu về microarray là nhằm nghiên cứu một kỹ thuật sao cho chi phí sản xuất và sử dụng thấp nhất mà chất lượng đạt tiêu chuẩn tốt nhất trong việc phân tích kiểm tra sự biểu hiện gen. Các kỹ thuật về sản xuất microarray ngày càng hoàn thiện và là tăng giá trị hiệu quả của phép phân tích. Khi mới phát minh kỹ thuật microarray, lĩnh vực ứng dụng của microarray ngày càng rộng lớn, góp phần trong nhiều lĩnh vực khác nhau như chẩn đoán y học, và ứng dụng trong việc phát hiện đột biến. Trong giai đoạn gần đây, việc sử dụng DNA microarray đã trở nên một công cụ rất cần thiết và hữu ích trong các nghiên cứu về học thuật và công nghiệp trong lĩnh vực liên quan đến genomivà cs 5. Quá trình thực hiện microarray Nói chung, kỹ thuật microarray bao gồm 2 bước cơ bản nhất: - Thiết kế mảng - Tiến hành thí nghiệm Có thể tóm tắt quy trình thí nghiệm bằng hình vẽ dưới đây. 103
Hình 4.17 Sơ đồ thể hiện tổng quát về các bước tiến hành microarray Thiết kế mảng (Đã được trình bày ở phần trên, các phương pháp kỹ thuật gắn mẫu dò lên trên mảng đã được trình bày trong phần trên). 5.1. Chuẩn bị mẫu Hiệu quả phân tích bằng microarray phụ thuộc đáng kể vào khâu chuẩn bị mẫu. Mẫu để lai (đích) có thể là RNA hoặc DNA được đánh dấu nhằm mục đích phát hiện trực tiếp chúng sau khi lai. Cho đến nay đã có rất nhiều phương pháp đánh dấu khác nhau được phát triển nhằm tăng độ nhạy và tính đặc hiệu của thí nghiệm. Các phương pháp đánh dấu bao gồm gắn trực tiếp chất đánh dấu vào đích bằng phản ứng của các nhóm hoạt động hoá học, PCR với mồi đánh dấu hoặc dùng enzyme biến đổi trực tiếp trình tự đích. Các chất chỉ thị phát hiện có thể là chất phát huỳnh quang (Cy3/Cy5, streptavidin /phycoerythrin), chất phóng xạ (32P, 33P, 35S), chất phát quang hoá học (Chemilumi-nescent) như digoxigenein, biotin; và nhuộm vàng/bạc. Trong đó, Cy3/Cy5 được sử dụng rộng rãi nhất. 5.2. Tiến hành lai Sau khi đánh dấu, tiến hành lai trên mảng. Do sử dụng chất mang rắn nên phương pháp microarray dễ tiến hành hơn các phương pháp blot. Trong quá trình lai, cho dung dịch đích đã đánh dấu đi qua mảng. Ở đó mẫu dò bắt cặp bổ sung (nếu có) với đích. Nếu dùng chất mang thuỷ tinh, có thể đặt úp một phiến kính thuỷ tinh lên trên sau đó cho dung dịch đích đi qua khe trống giữa chúng bởi lực mao dẫn. Một cách đơn giản khác là đặt trực tiếp mảng trong bể nhỏ chứa dung dịch lai. Các điều kiện lai (như nồng độ mẫu, lực ion, nhiệt độ) phụ thuộc lớn vào kích thước mẫu dò trên mảng và phải được xác định cho từng thí nghiệm. Hiệu quả lai có thể tăng lên nếu dung dịch lai luôn ở trong trạng thái động so với bề mặt mảng. 5.3. Xác định và phân tích dữ liệu thu nhận được Sau khi lai, tiến hành rửa để loại bỏ đích không bắt cặp hoặc bắt cặp không đặc hiệu với mẫu dò. Tiếp đó dùng thiết bị hiện ảnh xác định tín hiệu lai do chất đánh dấu trên đích phát ra. Cường độ tín hiệu cho phép đánh giá tương đối hiệu quả bắt cặp giữa đích và mẫu dò. Điều đáng nói ở đây là lượng dữ liệu cần phân tích trong thí nghiệm microarray rất lớn 104
do trên một mảng có thể đặt hàng chục ngàn mẫu dò, tương ứng với nó là hàng chục ngàn tín hiệu, trong đó lại có những tín hiệu nhiễu vì nhiều nguyên nhân. Do đó cần có các phần mềm máy tính để chuẩn hoá dữ liệu, đơn giản hoá quá trình phân tích nhằm đưa ra các kết luận nhanh và chính xác. Các bước chung khi tiến hành kỹ thuật microarray là như vậy, nhưng vì có hai loại mảng ứng với mẫu dò là cDNA và oligonucleotide nên có đôi chút khác nhau khi sử dụng chúng. Thông thường có hai phương thức được dùng để thu nhận các dữ liệu trong kỹ thuật microarray. Trong trường hợp two-color array, hai mẫu RNA được tiến hành đánh dấu bằng các thuộc nhuộm khác nhau và tiến hành lai đồng thời trên cùng một bản array. Mẫu được quan tâm hay mẫu đang nghi vấn (ví dụ như là một mẫu bệnh phẩm ung thư vú) được tiến hành nhuộm bằng một thuốc nhuộm và mẫu đối chứng được tiến hành nhuộm bằng một thuốc nhuộm khác. Hai mẫu được trộn với tỉ lệ ứng với 1:1 với nhau trên cơ cở đồng nhất các thuốc nhuộm. Sau đó tiến hành so sánh các mẫu với nhau, sự biểu hiện của các mẫu tuân theo hàm logarit giữa tỷ lệ các RNA trong mẫu nghi vấn đối với mẫu đối chứng. Trong trường hợp là single-color array, như Genechip (Affymetrix), mỗi mẫu sẽ được tiến hành nhuộm riêng biệt và tiến hành trên thực hiện trên một phiến array. Sau đó tiến hành lai và rửa mẫu, sự biểu hiện của từng gen được thể hiện thông qua sự biểu hiện cường độ phát huỳnh quang, từ đó có thể đánh giá mức độ biểu hiện của gen. Hình 4.18. Hình ảnh cho thấy tỷ lệ lai khác nhau sẽ cho tín hiệu màu khác nhau. Hình 4.19. Hình ảnh phép phân tích “Two-color” và “Single-color” của microarray 105
Hình 4.20. Xử lý tính hiệu bằng phần mềm xử lý hình ảnh Trong phép phân tích “two-color” (hình A), mẫu RNA được thu nhận từ bệnh nhân và mẫu đối chứng được tiến hành nhuộm riêng biệt khác nhau và tiến hành lai với duy nhất 1 DNA chứa mẫu dò chuyên biệt với gen. Quan hệ về mức độ biểu hiện của gen trong hai mẫu được đánh giá dựa trên việc so sánh mức độ phát huỳnh quang của mỗi mẫu; một vector biểu hiện mẫu được dùng để kết luận mức độ biểu hiện của từng gen trong mẫu thu nhận từ bệnh nhân (tiến hành so sánh với mẫu đối chứng). Phép phân tích “single-color” (Hình B), được thực hiện với Genechip (Affymetrix), tiến hành lai các RNA được đánh dấu từ mỗi mẫu sinh phẩm trên từng array tiến hành lai với các mẫu dò chuyên biệt. Mức độ biểu hiện gen được đánh giá bằng cách so sánh cường độ lai của một loạt các mẫu dò đã bắt cặp hoàn hảo, backgrou sẽ được tiến hành đánh giá thông qua các mẫu dò không bắt cặp. Mức độ biểu hiện của gen của mỗi mẫu thu nhận từ bệnh nhân được báo cáo với như một vector biểu hiện mẫu mà kết luận dựa trên sự khác biệt giữa tín hiệu và background của từng gen. Sau khi tiến hành thu nhận mẫu, các dữ liệu thường phải được tiêu chuẩn hóa để dễ dàng so sánh, tìm hiểu những điểm khác nhau giữa các thí nghiệm lai. Hiện nay, có rất nhiều phương pháp được sử dụng cho việc tiêu chuẩn hóa các dữ kiện, tuy nhiên sử dụng phương pháp nào phù hợp cho việc phân tích hoàn toàn phụ thuộc vào mục đích thí nghiệm, kết luận về các dự kiện. Thông thường các dữ kiện cũng phải được tiến hành chọn lọc dựa trên các tiêu chuẩn nhất định (ví dụ như là các gen có sự khác biệt nhau nhỏ sẽ bị loại) hay là tiến hành phân tích thông kê để lựa chọn các gen có sự biểu hiện với một mức độ cao mà chúng có liên quan đến các nhóm của mẫu xét nghiệm. Việc tiêu chuẩn hóa và chọn lọc phải được ứng dụng một cách thật cẩn trọng, tại vì nó có thể mang đến một số hiệu quả không mong muốn trong kết quả. Sự khác biệt trong các phương pháp phân tích thống kê sẽ cung cấp các kết quả khác nhau trong các gen chuyên biệt (thường là kết quả các gen sẽ gối đầu nhau). Những lưu ý này sẽ được thực hiện, chú trọng trong suốt quá trình tiến hành phân tích so sánh dữ liệu, các thông tin với nhau ở các phòng thí nghiệm khác nhau. Có thể dẫn tới các kết quả ttrái ngược nhau, tại vì họ rất ít để ý những khác biệt trong các phương 106
pháp so sánh, phân tích và thống kê các dữ liệu. Những so sánh này chuyển toàn bộ dữ liệu phân tích vào trong một kho dữ liệu, từ những thông tin đó, có thể tìm kiếm sự giống nhau giữa các dạng của microarray. Để tiến hành so sánh các dữ liệu một cách dễ dàng người ta phát triển một tiêu chuẩn chung cho phép phân tích các dữ liệu là “minimal information about a microarray experiment” (MIAME). Các database của DNA được phát triển và lưu giữ trong ngân hàng DNA để sử dụng cho việc nghiên cứu sự biểu hiện gen. Đây được xem là nguồn dữ liệu quan trọng và có giá trị trong ứng dụng trong việc nghiên cứu biểu hiện gen: các nghiên cứu về cùng một bệnh được tiến hành độc lập với nhau sẽ cung cấp các dữ liệu khách quan và được tiến hành so sánh, đánh giá các kết quả thu nhận được. Khi nghiên cứu một lượng lớn cỡ mẫu có thể cung cấp các dữ liệu quan trọng cho việc nghiên cứu các mẫu bệnh chung, và nghiên cứu việc biểu hiện gen có liên quan đến bệnh hay hậu quả của bệnh. Sau khi thu thập được các dữ liệu, các dữ liệu đã được tiến hành chọn lọc và tiêu chuẩn hóa, chúng được biểu hiện một cách điển hình trong một ma trận mà mỗi dòng biểu hiện cho một gen chuyên biệt và mỗi cột biểu hiện cho một mẫu sinh học đặc trưng. Mỗi dòng biểu thị cho một vector biệu hiện gen – các ô thể hiện các mức độ biểu hiện gen chuyên biệt trong tất cả các mẫu bệnh phẩm nghiên cứu. Mỗi cột biểu thị cho một vector biểu hiện mẫu, ghi nhận sự biểu hiện tất cả các gen trong mẫu. Để hiểu một cách dễ dàng các kết quả thu nhận được từ phương pháp lai kết hợp, các yếu tố của dữ liệu trong ma trận thường được biểu hiện với màu đỏ ứng với mức độ biểu hiện gen trong từng mẫu và các vùng quan sát được trên ma trận biểu hiện cho các mẫu đang phân tích. Trong hầu hết các phương pháp, màu sử dụng cho các gen được dựa trên tỷ lệ logarit đối với từng mẫu khi được tiến hành so sánh với mẫu đối chứng; giá trị tỷ lệ log gần như bằng không sẽ được biểu hiện bằng màu đen, giá trị lớn hơn không được biểu hiện bằng màu đỏ (ứng với các điều hòa thượng nguồn), và các giá trị âm tính được biểu hiện bằng màu xanh (ứng với các gen điều hòa hạ nguồn), ngoài ra có thể có nhiều màu khác nhau được phép sử dụng cho trường hợp đối với những người bị mù màu đỏ - xanh. Cường độ biểu hiện của các nhân tố được tiến hành so sánh sự biểu hiện các gen có quan hệ với nhau, các nhân tố có màu sáng biểu hiện cho sự biểu hiện với một mức độ cao. Chương trình được thực hiện theo các nhóm hàng ngang, hàng dọc hoặc là cả hai, từ đó, có thể xác định được mức độ biểu hiện của các gen khác nhau trong các mẫu bệnh phẩm khác nhau. 5.4. Xác định sự biểu hiện của mẫu Trong phân tích microarray, người ta tiến hành tìm kiếm các gen chuyên biệt và nghiên cứu sự biểu hiện của các mẫu liên quan tới trạng thái các bệnh lý hay có sự tương đồng với các mẫu có cùng sự biểu hiện. Hoặc là các mẫu được tìm kiếm với các gen có sự biểu hiện tương tự nhau. Chẳng hạn như một phép phân tích mà phụ thuộc vào một tiêu chuẩn để so sánh sự giống nhau trong sự biểu hiện, và mỗi thông số đều liên quan đến các đặc điểm khác nhau trong các dữ liệu thu thập được. Lúc này hai tiêu chuẩn thường được dùng để so sánh “euclidean distances” và “Pearson’s correlation coefficient distances”. “Euclidean distance” được ưu tiên sử dụng trong trường hợp khi nghiên cứu một cỡ mẫu rất lớn và sự biểu hiện gen rất quan trọng, trong khi Pearson’s correlation coefficient distances được sử dụng trong mô hình mẫu nghiên cứu với sự biểu hiện của gen hay mẫu là tương đối quan trọng. Nói chung, khi ứng dụng microarray trong việc phân loại các khối u thì sử dụng Pearson’s correlation coefficient distances sẽ thích hợp hơn. 107
Sau khi dữ liệu đã được ghi nhận, tiêu chuẩn hóa, chọn lọc và một phương tiện cho việc so sánh sự giống nhau được chọn, một loạt các phương pháp khác được tiến hành ứng dụng cho việc phân tích sau này. Các phương pháp cho việc phân tích sau này được nhóm thành hai nhóm chung: phương pháp “supervised” và “unsupervised”. Phương pháp “supervised” phụ thuộc vào các kiến thức trước đây về các mẫu bệnh nhằm tìm kiếm các gen có liên quan đến trạng thái bệnh lý, và chúng rất hữu dụng cho các nghiên cứu phân loại. Phương pháp “unsupervised” không phụ thuộc vào các kiến thức đã có trước đây, và chúng được ứng dụng cho việc xác định các phân nhóm (subgroup) của mẫu đặc trưng cho các bệnh chưa được nghiên cứu. 5.5. Phương pháp clustering (tìm kiếm sắp xếp nhóm) Bất kỳ một mục tiêu nào trong nghiên cứu microarray, kỹ thuật đầu tiên được áp dụng là phương pháp “unsupervised” để xem xét các mẫu sinh học đang nghiên cứu có nằm trong dữ liệu hay không? Phương pháp “unsupervised” không được ứng dụng vào việc phân loại, ví dụ như là những mẫu bệnh phẩm được tiến hành thu nhận từ các bệnh nhân u nguyên bào bạch cầu hay bệnh bạch cầu nguyên thủy bào. Những phương pháp này nhóm các mẫu bệnh phẩm (hay gen hay cả hai) trên cơ sở dựa trên việc so sánh sự tương quan trong các dữ liệu biểu hiện của chúng. Hai phương pháp ứng dụng rộng rãi cho việc xem xét sự biểu hiện gen là “hierarchical clustering” và “k-means clustering”. Các phương pháp này chia dữ liệu theo từng nhóm, và xác định các nhóm này có ý nghĩa trong việc phân tích có liên quan đến các dữ liệu thu nhận từ lâm sàng hay không, và đồng thời đòi hỏi phải phát triển nhiều phương pháp mới. Hình 4.20. Hình ảnh sắp xếp các dữ liệu bằng phương pháp clustering. Một bảng dữ liệu chưa được sắp xếp (hình A) và dữ liệu được sắp xếp bằng Hierarchical clustering, hay phân tích k-means được ứng dụng trong việc xác định các phân nhóm trong bảng dữ liệu. 6. Ví dụ việc ứng dụng microarray trong việc phân loại khối u Mục đích là xác định marker phân tử cho phép phân loại carcinoma dạ dày với mong muốn là trở thành một công cụ trong việc dự đoán lâm sàng. Carcinoma dạ dày là đối tượng dùng để phân tích bằng microarray khi tiến hành lai với cDNA với hơn 2504 mẫu dò. Sử dụng hệ thống “Rosstta rough-set based learning”, các nhà nghiên cứu đưa ra những dự đoán mô hình tăng trưởng của ruột hay là sự phát triển theo khóa phân loại của Lauren 108
và sự di căn đến hạch bạch huyết dựa trên sự biểu hiện của gen. Đối với chúng tôi, đây là nghiên cứu đầu tiên trên mô hình carcinoma mà sự phân chia dựa trên các marker phân tử bằng phương pháp microarray. Những hiểu biết về đặc điểm phân tử của carcinoma dã dày ngày càng được hiểu rõ. Những thay đổi về mặt di truyền bao gồm việc khuếch đại gen c-erbB2, đột biến của gen ras, APC và gen p53 và E-cadherin bị phân cắt. Sự mất đi tính dị hợp tử trong các carcinoma dạ dày liên quan đến vị trí trên các nhiễm sắc thể số 1, 5, 7, 12, 13 và 17. Các khối u cũng thường biểu hiện vượt mức oncogen Ras và cyclins. Các cytokine cũng được biểu hiện một cách vượt mức và carcinoma dạ dày cũng có thể biểu hiện các peptide điều hòa như là các yếu tố tăng trưởng biểu mô (EGF), yếu tố truyền tín hiệu tăng trưởng alpha (TGF-α), hay các yếu tố tăng trưởng có nguồn gốc từ tiểu cầu (PDGF) và yếu tố tăng trưởng giống insulin II (ILGF-II), yếu tố tăng trưởng tế bào gai (HGF) và các receptor của nó c-met cũng được biểu hiện một cách vượt mức. Việc phân chia theo Lauren cũng tương ứng với một số bất thường trong di truyền. Mục đích của nghiên cứu này là tiến hành khảo sát sự biểu hiện gen trong các khối u sơ cấp trong bệnh nhân bị carcinoma dạ dày bằng phương pháp microarray nhằm tìm kiếm và phân tích mối quan hệ giữa sự biểu hiện gen với các thông số liên quan đến khối u. 6.1. Chuẩn bị sinh phẩm khối u Khối u được thu nhận càng sớm càng tốt từ phòng giải phẩu bệnh học và giữ trong formalin hay đông lạnh giữ trong nitrogen lỏng. Phần được xử lý bằng fomaline sẽ tiến hành nhuộm mô với hematoxylin-eosin. Phần mô đông lạnh sẽ được đồng nhất trong dung dịch buffer guanidinum-isothiocyanate , và tổng số RNA được chiết ra bằng phương pháp siêu ly tâm trong nồng độ cesium chloride, thu nhận kết tủa, tinh chế với TRIzol (phenol- guanidinium-thiocyanate) , và tiến hành phân tách bằng điện di trên gel agarose và ước lượng các băng 18S và 28S rRNA. Còn đối với việc phân tích bằng microarray sẽ không tiến hành làm phân tách rRNA. 6.2. Quy trình microarray Các arrays được chuẩn bị và sử dụng mẫu dò cDNA để tái biểu hiện lại 2504 chuỗi trình tự khác nhau của người (Research Genetivà cs, Huntsville, AL) (Đoạn cDNA bổ sung có thể tìm kiếm trên địa chỉ bao gồm 1500 gen đã được xác định trong NCI oncochip ( Các mẫu dò sẽ được in vào tấm kính đã được phủ bằng amino-saline (Corning CMT-GAPS, Corning, Corning, NY) bằng cách sử dụng một printing robot được thiết lập với sự cộng tác của NEMKO (Trodheim, Norway) sau khi mẫu ban đầu được phát triển tại NHGRI (National Human Genome Research Institute). Các RNA (Universal Human Reference RNA) thu nhận từ Stratagene (LaJolla, CA) chứa đựng toàn bộ RNA từ 10 dòng khác nhau đã được chọn lôc nhằm làm tối ưu hóa trong phân tích microarray, và tổng RNA trong khối u (1 g), đã được dịch nghịch đảo nhuộm với Cy3- và Cỵ-attached dendrimer. Sử ụng protocol của bộ kit 3DNA dendrimer kit (Genisphere, NJ). Các array được quét với laser có bước sóng 532 và 633 nm được phát triển bởi NHGRI. 6.3. Phân tích dữ liệu 109