Hệ gen là gì?

Hệ gen là gì

Hệ gen là gì?

Bài viết sau đây không nhằm cung cấp một cách tường tận mọi khía cạnh của hệ gen, nhưng sẽ giúp độc giả có được thông tin cơ bản để trả lời cho câu hỏi: hệ gen là gì?

Trong sinh học nói chung, hệ gen chứa đựng thông tin di truyền của một sinh vật. Nó bao gồm ADN (hoặc ARN của các virus RNA). Hệ gen bao gồm cả vùng ADN mã hóa và vùng ADN không mã hóa, cũng như ADN ty thể và ADN lục lạp. Nghiên cứu về hệ gen được gọi là genomic.

Giải trình tự hệ gen

Trình tự hệ gen là tập hợp đầy đủ các nucleotide (A, C, G và T – trường hợp hệ gen là ADN) tạo nên tất cả các nhiễm sắc thể của một cá thể hoặc một loài. Trong một loài, phần lớn các nucleotide giống hệt nhau giữa các cá thể, nhưng giải trình tự nhiều cá thể có thể chỉ ra được sự đa dạng di truyền trong loài.

Năm 1976, Walter Fiers tại Đại học Ghent (Bỉ) là người đầu tiên xác định được chuỗi nucleotide hoàn chỉnh của hệ gen của một virus ARN (Bacteriophage MS2). Một năm sau, Fred Sanger hoàn thành trình tự hệ gen ADN đầu tiên: Phage-X174, có kích cỡ 5386 cặp base (bp) [1].

Hệ gen hoàn chỉnh đầu tiên trong ba lãnh giới của sự sống đã được công bố trong một thời gian ngắn sau đó vào giữa những năm 1990: Hệ gen vi khuẩn đầu tiên được giải trình tự là Haemophilus influenzae, được hoàn thành bởi một nhóm nghiên cứu tại Viện nghiên cứu hệ gen The Institute for Genomic Research vào năm 1995 [2].

Vài tháng sau, hệ gen sinh vật nhân chuẩn đầu tiên đã được hoàn thành, với 16 nhiễm sắc thể của nấm men Saccharomyces cerevisiae được công bố sau những nỗ lực bắt đầu vào giữa những năm 1980. Trình tự hệ gen đầu tiên của một loài cổ khuẩn, Methanococcus jannaschii, cũng đã được hoàn thành vào năm 1996, một lần nữa cũng bởi Viện The Institute for Genomic Research.

Sự phát triển của các công nghệ mới đã làm cho giải trình tự gen trở nên rẻ hơn và dễ dàng hơn, và số lượng trình tự hệ gen hoàn chỉnh đang tăng lên nhanh chóng. Trong số hàng ngàn dự án giải trình tự hệ gen đã hoàn thành bao gồm những dự án cho lúa, chuột, cây Arabidopsis thaliana, cá nóc và vi khuẩn E. coli. Vào tháng 12 năm 2013, các nhà khoa học lần đầu tiên giải trình tự toàn bộ hệ gen của người Neanderthal, một loài người đã tuyệt chủng [3]. ADN được tách chiết từ ​​xương ngón chân của một người Neanderthal 130.000 tuổi được tìm thấy trong một hang động ở Siberia.

Xem thêm: Các kỹ thuật giải trình tự thế hệ mới

Hệ gen của các nhóm sinh vật

Hệ gen virus

Hệ gen của virus có thể là ARN hoặc ADN. Hệ gen của virus ARN có thể là ARN chuỗi đơn hoặc chuỗi kép và có thể chứa một hoặc nhiều phân tử ARN riêng biệt [4]. Virus ADN có thể có hệ gen đơn chuỗi hoặc chuỗi kép. Hầu hết các hệ gen của virus ADN bao gồm một phân tử ADN đơn, thẳng, một số được tạo thành từ một phân tử ADN tròn [5].

Hệ gen sinh vật nhân sơ (Prokaryote)

Sinh vật nhân sơ và sinh vật nhân chuẩn có hệ gen ADN.

Cổ khuẩn có một nhiễm sắc thể tròn mạch kép duy nhất.

Hầu hết các vi khuẩn cũng có một nhiễm sắc thể tròn; tuy nhiên, một số loài vi khuẩn có nhiễm sắc thể tồn tại ở dạng thẳng [6] hoặc nhiều nhiễm sắc thể. Nếu ADN được sao chép nhanh hơn so với tốc độ phân chia tế bào, nhiều bản sao của nhiễm sắc thể có thể tồn tại trong một tế bào và nếu các tế bào phân chia quá nhanh thì việc sao chép nhiễm sắc thể sẽ được diễn ra nhiều lần trước khi quá trình phân chia xảy ra, cho phép các tế bào con nhận hệ gen hoàn chỉnh.

Phần lớn các prokaryote có rất ít ADN lặp đi lặp lại trong hệ gen của chúng [7]. Tuy nhiên, một số vi khuẩn cộng sinh (ví dụ: Serratia symbiotica) đã tiêu giảm hệ gen và mang một tỉ lệ lớn là gen giả: chỉ ~ 40% ADN mã hóa protein [8].

Hệ gen vi khuẩn

Hình ảnh nhiễm sắc thể siêu xoắn của vi khuẩn E. coli. Nguồn: Dr Ruth Kavennoff.

Một số vi khuẩn có vật liệu di truyền bổ sung, cũng là một phần của hệ gen, được mang trong các plasmid. Khi đó, khái niệm hệ gen không nên chỉ được hiểu là nhiễm sắc thể.

ADN được đóng gói trong sinh vật nhân sơ như thế nào?

Hệ gen sinh vật nhân thực (Eukaryote)

Hệ gen của sinh vật nhân chuẩn chứa một hoặc nhiều nhiễm sắc thể dạng thẳng. Số lượng nhiễm sắc thể rất khác nhau, từ kiến ​​nhảy Myrmecia pilosula và một loài giun tròn vô tính Diploscapter pachys, mỗi loài chỉ có một cặp nhiễm sắc thể, đến một loài dương xỉ có 720 cặp [9]. Các giao tử, chẳng hạn như trứng, tinh trùng, bào tử và phấn hoa, là đơn bội, có nghĩa là chúng chỉ mang một bản sao của mỗi nhiễm sắc thể.

Ngoài các nhiễm sắc thể trong nhân, các bào quan như lục lạp và ty thể có ADN riêng. Ty thể đôi khi được cho là có hệ gen của riêng, thường được gọi là “hệ gen ty thể”. ADN được tìm thấy trong lục lạp có thể được gọi là “plastome”. Do có nguồn gốc từ vi khuẩn mà ty thể và lục lạp có nhiễm sắc thể dạng tròn.

Không giống như nhân sơ, sinh vật nhân chuẩn có phân biệt exon-intron trên các gen mã hóa protein và hệ gen còn chứa số lượng ADN lặp lại. Ở động vật có vú và thực vật, phần lớn hệ gen được cấu thành từ ADN lặp lại [10].

Gen nhảy là gì?

Kích thước hệ gen

Kích thước hệ gen là tổng số cặp base ADN trong một hệ gen đơn bội.

Ở người, hệ gen nhân đơn bội chứa khoảng 3,2 tỷ nucleotide ADN, được chia thành 23 nhiễm sắc thể dạng thẳng, nhiễm sắc thể ngắn nhất chứa 50.000.000 nucleotide và dài nhất chứa 260.000.000 nucleotide.

Kích thước hệ gen có tỉ lệ thuận với sự phức tạp về hình thái giữa sinh vật nhân sơ và sinh vật nhân thực bậc thấp; tuy nhiên, kể từ sau động vật thân mềm và tất cả các sinh vật nhân chuẩn cấp cao hơn, mối tương quan này không còn hoàn toàn tuân thủ [10, 11]. Hiện tượng này cũng cho thấy ảnh hưởng sâu sắc đến từ ADN lặp lại trên hệ gen.

Kich thước hệ gen

Kích thước hệ gen só sự khác biệt lớn giữa các nhóm sinh vật. Kích cỡ hệ gen không phải luôn phản ánh mức độ tiến hóa của loài vật

Vì hệ gen rất phức tạp, có một định hướng nghiên cứu làm giảm số lượng gen trong hệ gen xuống mức tối thiểu nhưng vẫn cho phép sinh vật tồn tại được. Việc thử nghiệm đang được tiến hành trên hệ gen tối thiểu cho các sinh vật đơn bào cũng như hệ gen tối thiểu cho các sinh vật đa tế bào [11] [12].

Sự tiến hóa của hệ gen

Hệ gen là một thứ không chỉ đơn thuần là tập hợp các gen của sinh vật đó và có những đặc điểm có thể được đo lường cũng như nghiên cứu mà không cần tham khảo đến bất kỳ gen cụ thể nào.

Các nhà nghiên cứu so sánh các đặc điểm như nhiễm sắc thể đồ, kích thước hệ gen, thứ tự gen, xu hướng sử dụng codon và hàm lượng GC để xác định cơ chế nào có thể tạo ra vô vàn hệ gen tồn tại ngày nay (Brown 2002; Saccone và Pesole 2003; Benfey và Protopapas 2004; Gibson và Muse 2004; Reese 2004; Gregory 2005).

Sự nhân lặp (duplication) đóng vai trò chính trong việc định hình hệ gen. Nhân lặp có thể xảy ra với các trình tự ngắn lặp liên tục, lặp các cụm gen và thậm chí là một nhiễm sắc thể hay cả bộ nhiễm sắc thể. Sự nhân lặp như vậy có thể là nền tảng cho việc tạo ra đặc tính di truyền mới.

Truyền gen ngang giải thích lý do thường có sự tương đồng cực cao giữa các phần nhỏ trong hệ gen của hai sinh vật có họ hàng rất xa. Truyền gen ngang dường như khá phổ biến giữa nhiều vi khuẩn. Ngoài ra, cũng có khả năng các tế bào nhân chuẩn cũng có hiện tượng một số vật liệu di truyền từ hệ gen lục lạp và ty thể của chúng sang nhiễm sắc thể trong nhân.

Kết quả thực nghiệm cho thấy vai trò quan trọng của virus, nhất là các virus có hiện tượng tiềm tan, giúp tạo ra tính mới của gen đồng thời chỉnh sửa hệ gen tự nhiên của vật chủ.

Lược sử tiến hóa hệ gen người

Lời kết: Thông qua bài viết này, chắc chắn nhiều bạn đã có thông tin trả lời cụ thể hơn cho câu hỏi về hệ gen là gì? Mặc dù việc giải mã hệ gen của một sinh vật, bao gồm cả con người, đang trở nên đơn giản hơn thì song song với đó, việc phân tích dữ liệu ẩn chứa đằng sau mỗi bộ gen đang đối mặt với nhiều thách thức. Chúng ta cùng hy vọng vào sự đột phá về trí tuệ nhân tạo (AI), dữ liệu lớn (Big Data), máy học (Machine Learning) và siêu máy tính (Super Computer) sẽ giúp các nhà khoa học có được bức tranh toàn cảnh và chi tiết hơn về hệ gen và các cơ chế điều hòa liên quan.

Tài liệu tham khảo

  1. Sanger, F., Air, G. M., Barrell, B. G., Brown, N. L., Coulson, A. R., Fiddes, J. C., … & Smith, M. (1977). Nucleotide sequence of bacteriophage φX174 DNA. nature265(5596), 687.
  2. Fleischmann, R. D., Adams, M. D., White, O., Clayton, R. A., Kirkness, E. F., Kerlavage, A. R., … & Merrick, J. M. (1995). Whole-genome random sequencing and assembly of Haemophilus influenzae Rd. Science, 269(5223), 496-512.
  3. Prüfer, K., Racimo, F., Patterson, N., Jay, F., Sankararaman, S., Sawyer, S., … & Li, H. (2014). The complete genome sequence of a Neanderthal from the Altai Mountains. Nature505(7481), 43.
  4. McDonald, S. M., Nelson, M. I., Turner, P. E., & Patton, J. T. (2016). Reassortment in segmented RNA viruses: mechanisms and outcomes. Nature Reviews Microbiology14(7), 448.
  5. Shulman, L. M., & Davidson, I. (2017). Viruses with circular single-stranded DNA genomes are everywhere!. Annual review of Virology4, 159-180.
  6. Chaconas, G., & Chen, C. W. (2005). Replication of linear bacterial chromosomes: no longer going around in circles. The bacterial chromosome (pp. 525-540). American Society of Microbiology.
  7. Koonin, E. V., & Wolf, Y. I. (2010). Constraints and plasticity in genome and molecular-phenome evolution. Nature Reviews Genetics11(7), 487.
  8. McCutcheon, J. P., & Moran, N. A. (2012). Extreme genome reduction in symbiotic bacteria. Nature Reviews Microbiology10(1), 13.
  9. Khandelwal S (March 1990). “Chromosome evolution in the genus Ophioglossum L.”. Botanical Journal of the Linnean Society102(3): 205–17.
  10. Lewin B (2004). Genes VIII (8th ed.). Upper Saddle River, NJ: Pearson/Prentice Hall. ISBN 978-0-13-143981-8.
  11. Gregory TR, Nicol JA, Tamm H, Kullman B, Kullman K, Leitch IJ, Murray BG, Kapraun DF, Greilhuber J, Bennett MD (January 2007). “Eukaryotic genome size databases”. Nucleic Acids Research35(Database issue): D332–38.
  12. Forster AC, Church GM (2006). “Towards synthesis of a minimal cell”. Molecular Systems Biology2(1): 45.

Iceberg (dịch và biên tập)
Cố vấn khoa học: TS. Đặng Trần Hoàng
www.tapchisinhhoc.com

5/5 - (12 votes)