Giải trình tự SOLiD là gì?

Giải trình tự SOLiD

Công nghệ giải trình tự SOLiD là gì?

Phát hiện và nối Oligonucleotide được hỗ trợ (Supported Oligonucleotide Ligation and Detection – SOLiD) là một công nghệ giải trình tự ADN thế hệ thứ hai khác được phát triển bởi Applied Biosystems, công ty đã giới thiệu một phương pháp giải trình tự ADN mới được gọi là giải trình tự bằng cách nối (sequencing-by-ligation).

Ngược lại với các nguyên tắc giải trình tự bằng cách tổng hợp được đưa ra bởi những người tiền nhiệm, trong đó việc bổ sung các nucleotide bằng DNA polymerase (DNAP) được sử dụng để giải trình tự ADN mục tiêu, việc giải trình tự bằng cách nối phụ thuộc vào việc nối các đoạn ADN bằng cách sử dụng DNA ligase để xác định trình tự cơ bản của ADN mục tiêu.

Chuẩn bị thư viện ADN giải trình tự SOLiD

Quá trình này hoạt động bằng cách chia ADN mục tiêu thành các đoạn dài khoảng 35 nucleotide.

Các đoạn này bị biến tính để tạo thành các đoạn ADN chuỗi đơn (ssDNA) sau đó được nối vào hai bộ chuyển đổi khác nhau ở cả hai đầu (Hình 1A).

Thư viện ssDNA thu được sau đó được nạp vào các hạt từ tính thông qua việc ghép cặp bazơ bổ sung của một trong các bộ chuyển đổi với oligonucleotide bao phủ bề mặt bên ngoài của hạt từ tính (Hình 1B).

Sau nhiều vòng khuếch đại nhũ tương polymerase (emPCR), hàng triệu bản sao của cùng một ssDNA được cố định vào hạt từ tính (Hình 1C) được đặt trên một phiến kính.

chuẩn bị thư viện ADN giải trình tự SOLiD

Hình 1: Quá trình chuẩn bị thư viện ADN giải trình tự SOLiD
A. Phân mảnh và biến tính DNA và bổ sung hai chất chuyển đổi và biotin khác nhau.
B. Liên kết giữa biotin trên ssDNA và streptavidin trên hạt từ tính.
C. emPCR tạo ra hạt từ tính được phủ hàng triệu bản sao của cùng một ssDNA.

Phân tích dữ liệu và giải trình tự SOLiD

Các phân tử được dán nhãn huỳnh quang gọi là 8-mer được thêm vào phiến kính.

8-mer là các đoạn ssDNA ngắn trong đó nucleotide thứ nhất và thứ hai là hai nucleotide tiếp theo của chuỗi ADN kéo dài, các nucleotide thứ ba đến thứ năm bị thoái hóa và nucleotide thứ sáu đến thứ tám là bazơ inosine, trong đó bazơ inosine thứ tám là gắn với thuốc nhuộm huỳnh quang đặc trưng (Hình 2).

phân tích dữ liệu giải trình tự SOLiD

Hình 2: Sự phân bố và ghi nhãn thuốc nhuộm huỳnh quang dựa trên hai nucleotide đầu tiên của 8-mer

Nếu nucleotide thứ nhất và thứ hai của 8-mer là hai nucleotide tiếp theo trong chuỗi ADN kéo dài, thì nó sẽ lai với ssDNA và DNA ligase liên kết cộng hóa trị với mồi và 8-mer (Hình 3A).

Sau đó, bất kỳ 8-mer nào không liên kết sẽ bị cuốn trôi và tia laser kích thích nhãn huỳnh quang trên 8-mer dẫn đến sự phát xạ của bước sóng được phát hiện bởi một cảm biến có thể xác định hai bazơ nào vừa được thêm vào chuỗi ADN (Hình 3A).

Cho rằng có một liên kết photphorothioate giữa bazơ thứ năm và thứ sáu trên 8-mer, bước tiếp theo liên quan đến việc bổ sung các ion bạc để tách liên kết này, dẫn đến giải phóng thuốc nhuộm huỳnh quang (Hình 3B). Quá trình này được lặp lại với việc bổ sung thêm nhiều đoạn 8-mer cho đến khi toàn bộ ssDNA được liên kết bổ sung bởi các đoạn 8-mer (Hình 3C).

hoàn thành giải trình tự SOLiD

Hình 3: Hoàn thành giải trình tự SOLiD
A. Việc bổ sung mồi và 8-mer, trong đó nếu hai nucleotide đầu tiên bổ sung cho nhau thì DNA ligase sẽ gắn nó vào mồi.

B. Các 8-mer không liên kết sẽ bị cuốn trôi và tia laser kích thích thẻ huỳnh quang trên 8-mer để phát ra tín hiệu ánh sáng có thể phát hiện được và tín hiệu này được ghi lại. Liên kết photphorothioate giữa nucleotide thứ năm và thứ sáu trên 8-mer bị cắt, cho phép thẻ huỳnh quang bị cuốn trôi.
C. Lặp lại AB cho đến hết đoạn ADN.
D. Chuỗi ADN mới được tổng hợp sẽ bị tan chảy và AC được lặp lại bằng cách sử dụng đoạn mồi có chiều dài N-1, N-2 và N-3.

Vì điều này chỉ cung cấp thông tin về một phần của trình tự ADN, vì các nucleotide thứ ba đến thứ năm của mỗi 8-mer đều chưa được biết, chuỗi ADN vừa được tổng hợp sẽ bị tan chảy và toàn bộ quá trình được lặp lại bằng cách sử dụng các đoạn mồi có chiều dài bằng N-1, N-2 và N-3 (Hình 3D). Dữ liệu thu được từ các lần đọc này sau đó được phân tích bằng chương trình máy tính để thu được toàn bộ trình tự của phân tử ADN ban đầu.

Tiềm năng của công nghệ giải trình tự SOLiD

Nhờ phương pháp giải trình tự rất kỹ lưỡng này nên trình tự SOLiD được coi là một trong những công nghệ giải trình tự thế hệ thứ hai có độ chính xác cao nhất với độ chính xác lên tới 99,94%.

Góp phần vào độ chính xác cao này là nhờ công nghệ này đã giảm thiểu sai số đo lường và khả năng phát hiện SNP vượt trội. Ngoài ra, giải trình tự SOLiD tương đối dễ thực hiện và có thể truy cập dễ dàng do thực tế là nó được thực hiện với các thuốc thử có sẵn.

Tuy nhiên, nhược điểm của nó nằm ở chỗ nó khá chậm vì có thể mất tới 7 ngày để hoàn thành một lần chạy và độ dài đọc ngắn 35 bp là nhỏ hơn đáng kể so với độ dài được cung cấp bởi các công nghệ giải trình tự cạnh tranh.

Các nghiên cứu gần đây cũng chỉ ra rằng các phương pháp giải trình tự bằng cách thắt gặp khó khăn trong việc giải trình tự chính xác các chuỗi palindromic.

Bất chấp điều đó, những ưu điểm của công nghệ này vượt xa những nhược điểm của nó và do đó, giải trình tự SOLiD có thể để lại dấu ấn trên nhiều ứng dụng trong lĩnh vực phiên mã, nghiên cứu bộ gen vi khuẩn và kích thích miễn dịch nhiễm sắc thể.

Mặc dù thực tế là công nghệ giải trình tự SOLiD có khả năng cải thiện sự hiểu biết của chúng ta về sinh học phân tử và bệnh tật trước đó, công nghệ này không thể theo kịp bản chất phát triển nhanh chóng của lĩnh vực giải trình tự ADN và những cải tiến mạnh mẽ do các công nghệ cạnh tranh mang lại.

Nhược điểm của giải trình tự SOLiD trở nên rõ ràng hơn và kết quả là Thermo Fisher Scientific, công ty đã mua lại Life Technologies vào năm 2014, đã quyết định đóng cửa tất cả các nền tảng giải trình tự SOLiD vào năm 2016.

Tài liệu tham khảo

  • SOLiD System Brochure. Applied Biosystems; 2008. http://www.columbia.edu/cu/biology/courses/w3034/Dan/readings/SOLiD_System_Brochure.pdf 
  • Next-generation sequencing. ATD Bio. [accessed 2021 Oct 8]. https://atdbio.com/nucleic-acids-book/Next-generation-sequencing
  • Ho A, Murphy M, Wilson S, Atlas S, Edwards J. Sequencing by ligation variation with endonuclease V digestion and deoxyinosine-containing query oligonucleotides. BMC Genom. 2011;12(1).
  • Castellana S, Romani M, Valente E, Mazza T. A solid quality-control analysis of AB SOLiD short-read sequencing data. Brief. Bioinform. 2012;14(6):684-695.
  • Hert D, Fredlake C, Barron A. Advantages and limitations of next-generation sequencing technologies: A comparison of electrophoresis and non-electrophoresis methods. Electrophoresis. 2008;29(23):4618-4626.
Rate this post

Leave a Reply