آموزشی

توالی‌ یابی DNA چیست؟ معرفی انواع روش‌ها و کاربردهای آن

توالی یابی DNA

توالی‌ یابی DNA یکی از مهم‌ترین و تحول‌آفرین‌ترین فناوری‌های زیست‌مولکولی در دهه‌های اخیر است. این فناوری به تعیین ترتیب دقیق نوکلئوتیدها ( آدنین (A)، تیمین (T)، سیتوزین (C) و گوانین (G)) در یک مولکول DNA می‌پردازد و امکان خوانش و تحلیل کد ژنتیکی موجودات زنده را فراهم می‌کند. درک این توالی، پایه اصلی شناخت ساختار ژن‌ها، عملکرد آن‌ها و شناسایی تغییرات ژنتیکی است که می‌توانند در بروز بیماری‌ها یا تنوع زیستی نقش داشته باشند.

با پیشرفت روش‌های نوین توالی‌ یابی، به‌ویژه فناوری‌های نسل دوم و سوم، سرعت انجام آزمایش‌ها افزایش چشمگیری یافته و هزینه تعیین توالی ژنوم به‌طور قابل‌توجهی کاهش پیدا کرده است. این پیشرفت‌ها موجب شده‌اند توالی‌یابی DNA به ابزاری کلیدی در ژنتیک مولکولی، پزشکی فردمحور، تشخیص سرطان، بیوتکنولوژی، کشاورزی مدرن، اپیدمیولوژی و حتی پزشکی قانونی تبدیل شود.

در این مقاله، ابتدا مفهوم و اصول توالی‌یابی DNA را بررسی می‌کنیم، سپس روش‌های مختلف از توالی‌یابی مانند سنگر (Sanger) تا فناوری‌های نسل دوم (NGS) و نسل سوم را معرفی خواهیم کرد. در ادامه، مراحل انجام توالی‌یابی و کاربردهای گسترده آن در حوزه‌های علمی و بالینی را مرور می‌کنیم و در پایان، به چشم‌انداز آینده این فناوری در پزشکی دقیق و پژوهش‌های ژنومی می‌پردازیم.

توالی‌ یابی DNA چیست؟

DNA حامل اطلاعات ژنتیکی است که بخش عمده‌ای از فرآیندهای زیستی را هدایت و تنظیم می‌کند. این مولکول از چهار نوکلئوتید اصلی شامل آدنین (A)، تیمین (T)، سیتوزین (C) و گوانین (G) تشکیل شده است. ترتیب قرارگیری این بازهای نوکلئوتیدی، ساختار ژن‌ها، صفات ارثی، عملکرد سلولی و حتی استعداد ابتلا به بسیاری از بیماری‌ها را تعیین می‌کند.

توالی‌یابی DNA فرایندی است که طی آن ترتیب دقیق این نوکلئوتیدها در یک قطعه مشخص از DNA تعیین می‌شود. به بیان ساده، این فناوری امکان «خواندن» کد ژنتیکی را فراهم می‌کند.

ساختمان DNA
ساختمان DNA. DNA دارای ساختار مارپیچ دوگانه (Double Helix) است که از دو رشته مکمل تشکیل شده و بازهای نوکلئوتیدی آن به‌صورت جفت‌های A–T و C–G در کنار یکدیگر قرار می‌گیرند. همین آرایش منظم، پایه ذخیره و انتقال اطلاعات ژنتیکی را تشکیل می‌دهد.

مراحل کلی توالی‌ یابی DNA

عملیات توالی‌ یابی، صرف‌نظر از نوع پلتفرم (Sanger، NGS یا نسل سوم)، معمولاً شامل چند مرحله اصلی است:

استخراج DNA با کیفیت بالا

DNA از سلول‌ها یا بافت مورد نظر استخراج و خالص‌سازی می‌شود. کیفیت، خلوص و میزان تخریب DNA نقش مستقیمی در دقت نتایج نهایی دارد.

قطعه‌سازی (Fragmentation)

در بسیاری از روش‌ها، DNA به قطعات کوچک‌تر تقسیم می‌شود تا برای فرآیند خوانش مناسب شود. اندازه این قطعات بسته به پلتفرم متفاوت است.

آماده‌سازی کتابخانه (Library Preparation)

یکی از مهم‌ترین مراحل توالی‌ یابی تهیه کتابخانه DNA است. در این مرحله:

  • قطعات DNA انتخاب شده،آداپتورهای اختصاصی به دو انتهای آن‌ها متصل می‌شود. در برخی پلتفرم‌ها، تکثیر (PCR amplification) برای افزایش مقدار نمونه انجام می‌شود.

طراحی کتابخانه کاملاً وابسته به هدف مطالعه است. برای مثال، در مطالعات ژنومی ممکن است کتابخانه کل ژنوم (WGS) آماده شود، در حالی که در توالی‌یابی اگزوم فقط نواحی کدکننده غنی‌سازی می‌شوند. در برخی مطالعات اپی‌ژنتیکی، روش‌های تخصصی مانند بیسمارکینگ (Bisulfite Sequencing) به‌کار می‌رود. در این تکنیک، DNA با بی‌سولفیت تیمار می‌شود تا سیتوزین‌های غیرمتیله به اوراسیل تبدیل شوند، در حالی که سیتوزین‌های متیله بدون تغییر باقی می‌مانند. این تغییر شیمیایی امکان شناسایی الگوهای متیلاسیون DNA را فراهم می‌کند، اما به‌دلیل ماهیت واکنش، بر طراحی کتابخانه، شرایط تکثیر و تفسیر داده‌ها تأثیر مستقیم دارد.

انجام توالی‌ یابی در دستگاه

بسته به فناوری مورد استفاده، الحاق نوکلئوتیدها به‌صورت چرخه‌ای ثبت می‌شود (مانند Illumina)، تغییرات pH اندازه‌گیری شده (Ion Torrent)،یا عبور مولکول DNA از نانوحفره ثبت می‌شود (Nanopore). در روش‌های نسل سوم، بسیاری از مراحل تکثیر حذف شده و توالی‌ یابی به‌ صورت تک‌مولکولی انجام می‌شود.

تحلیل داده‌های بیوانفورماتیکی

داده‌های خام تولیدشده (reads) از نظر کیفیت بررسی شده، به ژنوم مرجع هم‌تراز می‌شوند و سپس انواع واریانت‌ها شامل SNP، indel و در برخی موارد تغییرات ساختاری مورد شناسایی قرار می‌گیرند.

مدت زمان و هزینه توالی‌ یابی DNA به عوامل متعددی مانند نوع فناوری، اندازه ژنوم، عمق پوشش (coverage) و پیچیدگی تحلیل داده‌ها بستگی دارد. برای مثال، توالی‌ یابی یک قطعه کوتاه با روش Sanger ممکن است چند ساعت طول بکشد، در حالی که تعیین توالی کامل یک ژنوم انسانی با فناوری‌های پیشرفته می‌تواند در کمتر از یک روز انجام شود، هرچند مراحل آماده‌سازی و تحلیل داده معمولاً زمان بیشتری نیاز دارند.

تاریخچه‌ای کوتاه از توالی‌ یابی DNA

تاریخچه توالی‌ یابی DNA را می‌توان در قالب سه نسل اصلی فناوری بررسی کرد؛ هر نسل پاسخی به محدودیت‌های نسل پیشین بوده و تحولی جدی در سرعت، دقت و مقیاس تحلیل ژنومی ایجاد کرده است.

نسل اول: روش سنگر (Sanger Sequencing)

نخستین جهش بزرگ در تعیین توالی DNA در دهه ۱۹۷۰ و با معرفی روش توقف زنجیره توسط فردریک سنگر (Frederick Sanger) رخ داد. این روش که با نام Sanger sequencing یا dideoxy chain-termination sequencing شناخته می‌شود، بر استفاده از نوکلئوتیدهای دی‌دئوکسی (ddNTP) استوار است؛ مولکول‌هایی که فاقد گروه 3′-OH هستند و بنابراین پس از الحاق به رشته در حال سنتز، مانع ادامه طویل شدن زنجیره DNA می‌شوند.

در سال‌های ابتدایی، روش دیگری نیز توسط Maxam و Gilbert معرفی شد، اما به‌دلیل پیچیدگی فنی و استفاده از مواد شیمیایی خطرناک، به‌تدریج کنار گذاشته شد و روش سنگر به استاندارد طلایی توالی‌ یابی تبدیل شد.

روش سنگر با استفاده از الکتروفورز (و بعدها الکتروفورز مویرگی و آشکارسازی فلورسانس) امکان خوانش قطعاتی در حدود ۷۰۰ تا ۱۰۰۰ جفت‌باز را با دقت بسیار بالا (بیش از ۹۹٫۹٪) فراهم می‌کرد. این فناوری نقشی کلیدی در اجرای پروژه ژنوم انسانی (Human Genome Project) ایفا کرد. با این حال، توان خروجی پایین و هزینه بالا به‌ازای هر باز، محدودیت‌های جدی این روش برای پروژه‌های بزرگ مقیاس محسوب می‌شد.

نسل دوم: توالی‌یابی نسل جدید (NGS)

در اوایل دهه ۲۰۰۰، فناوری‌های نسل دوم یا NGS معرفی شدند که انقلابی در سرعت، دقت و مقیاس توالی‌یابی DNA ایجاد کردند. این نسل امکان توالی‌ یابی هم‌زمان میلیون‌ها قطعه DNA را فراهم ساخت و مفهوم «توالی‌ یابی با توان بالا» (High-throughput sequencing) را عملی کرد.

NGS شامل مجموعه‌ای از پلتفرم‌ها با اصول فنی متفاوت است، از جمله Illumina، Ion Torrent، 454 Pyrosequencing و SOLiD، که هرکدام ویژگی‌ها و کاربردهای خاص خود را دارند. توان بالای خروجی و کاهش هزینه به‌ازای هر باز، امکان اجرای پروژه‌های بزرگ مانند توالی‌یابی کل ژنوم (WGS)، توالی‌یابی اگزوم (WES) و RNA‑seq را فراهم کرد.


توالی یابی Ion Torrent

نسل سوم: توالی‌ یابی تک‌مولکولی با خوانش‌های بلند

ننسل سوم توالی‌یابی با هدف رفع محدودیت‌های خوانش کوتاه نسل دوم معرفی شد. ویژگی اصلی این نسل، توانایی خوانش مستقیم مولکول‌های منفرد DNA با طول بسیار بلند است که بسیاری از محدودیت‌های سنتی خوانش کوتاه را برطرف می‌کند. علاوه بر این، در بسیاری از پروتکل‌ها نیاز به تکثیر DNA با PCR کاهش یافته یا حذف شده است.

دو پلتفرم برجسته نسل سوم شامل PacBio (SMRT – Single Molecule Real-Time) و Oxford Nanopore هستند، که هر دو امکان توالی‌یابی طولانی و بررسی ساختارهای ژنومی پیچیده را فراهم می‌کنند.

انواع روش‌های توالی یابی DNA

در این بخش به معرفی کامل هر یک از تکنیک‌ها و روش‌های توالی یابی DNA می‌پردازیم:

۱. روش سنگر (Sanger Sequencing)

روش سنگر که در سال ۱۹۷۷ توسط فردریک سنگر معرفی شد، نخستین تکنیک توالی‌ یابی DNA با دقت بالا بود و به‌سرعت به «استاندارد طلایی» این حوزه تبدیل شد. این روش نقش مهمی در توسعه ژنتیک مولکولی و اجرای پروژه‌هایی مانند پروژه ژنوم انسانی ایفا کرد و همچنان در بسیاری از کاربردهای تشخیصی و تحقیقاتی مورد استفاده قرار می‌گیرد.

اساس روش سنگر

اساس این روش بر استفاده از نوکلئوتیدهای دی‌دئوکسی (ddNTP) است. این مولکول‌ها نسخه‌های اصلاح‌شده نوکلئوتیدهای طبیعی هستند که فاقد گروه 3′-OH در انتهای قند خود هستند. نبود این گروه شیمیایی مانع تشکیل پیوند فسفودی‌استر بعدی می‌شود؛ بنابراین هنگامی که یک ddNTP در رشته در حال سنتز وارد شود، طویل شدن زنجیره متوقف می‌شود. همین توقف کنترل‌شده مبنای تعیین توالی DNA در این روش است.

در یک واکنش توالی‌ یابی، مخلوطی از نوکلئوتیدهای طبیعی (dNTP) و مقدار محدودی از ddNTPهای نشاندار به همراه DNA الگو و آنزیم DNA پلیمراز استفاده می‌شود.بنابراین مجموعه‌ای از قطعات DNA با طول‌های متفاوت تولید می‌شود که هرکدام در موقعیت یک نوکلئوتید خاص متوقف شده‌اند.

در سامانه‌های مدرن، هر نوع ddNTP با رنگ فلورسانس متفاوتی برچسب‌گذاری می‌شود. قطعات حاصل از طریق الکتروفورز مویرگی (Capillary Electrophoresis) بر اساس اندازه از هم جدا می‌شوند و دستگاه با ثبت سیگنال فلورسانس در انتهای مویرگ، ترتیب دقیق نوکلئوتیدها را بازسازی می‌کند.

تعیین توالی سنگر
روش تعیین توالی سنگر در 7 مرحله. (1) قطعه dsDNA به دو قطعه ssDNA دناتوره می‌شود. (2) یک قطعه از ssDNA به میلیون‌ها نسخه تکثیر می‌شود. (3) یک پرایمر که مربوط به یک انتهای قطعه است، متصل می‌شود. (4) قطعات به چهار محلول پلیمراز اضافه می‌شوند. هر محلول شامل چهار نوع باز اما فقط یک نوع نوکلئوتید انتهایی است. (5) زنجیره تا زمانی که یک نوکلئوتید انتهایی به طور تصادفی اضافه شود، رشد می‌کند. (6) قطعات dsDNA حاصل دناتوره می‌شوند تا یک سری ssDNA با طول‌های مختلف به دست آید. (7) قطعات با الکتروفورز از هم جدا می‌شوند و توالی خوانده می‌شود.

کاربردهای روش سنگر

امروزه روش سنگر بیشتر در کاربردهای با مقیاس محدود اما نیازمند دقت بالا به کار می‌رود. از جمله مهم‌ترین کاربردهای آن می‌توان به تأیید واریانت‌های شناسایی‌شده در آزمایش‌های NGS (به‌ویژه در تشخیص بالینی)، تعیین توالی پلاسمیدها، بررسی کلونینگ ژن‌ها، توالی‌یابی محصولات PCR و شناسایی جهش‌های منفرد در ژن‌های هدف اشاره کرد.

دقت این روش معمولاً بیش از 99.9٪ است و طول خوانش آن در شرایط استاندارد بین ۷۰۰ تا ۱۰۰۰ جفت‌باز متغیر است؛ ویژگی‌ا که آن را برای تحلیل نواحی مشخص ژنی بسیار مناسب می‌کند.

محدودیت‌های روش سنگر

با وجود دقت بالا، روش سنگر دارای محدودیت‌هایی است. توان خروجی آن در مقایسه با فناوری‌های نسل جدید بسیار پایین‌تر است و هزینه به‌ازای هر باز بیشتر محسوب می‌شود. علاوه بر این، برای پروژه‌های بزرگ‌مقیاس مانند توالی‌یابی کل ژنوم (WGS) یا توالی‌یابی کل اگزوم (WES) از نظر زمانی و اقتصادی مقرون‌به‌صرفه نیست.

با این حال، به دلیل پایداری، سادگی تفسیر داده و دقت بالا، روش سنگر همچنان معتبرترین روش برای تأیید نتایج حاصل از NGS در آزمایشگاه‌های ژنتیک پزشکی به شمار می‌رود.

۲. توالی‌ یابی نسل جدید (NGS – Next-Generation Sequencing)

توالی‌یابی نسل جدید نقطه عطفی در تاریخ ژنومیک محسوب می‌شود. این فناوری با فراهم‌کردن امکان خوانش هم‌زمان میلیون‌ها قطعه DNA، سرعت، مقیاس و هزینه توالی‌یابی را به‌طور بنیادین متحول کرد. توان موازی‌سازی گسترده (Massively Parallel Sequencing) سبب شد NGS در کمتر از دو دهه به ستون اصلی پژوهش‌های ژنتیک، زیست‌شناسی مولکولی و پزشکی دقیق تبدیل شود.

توالی یابی نسل جدید
مراحل انجام توالی یابی نسل جدید

مراحل انجام توالی‌یابی نسل جدید

فرآیند NGS معمولاً با قطعه قطعه کردن DNA و آماده‌سازی کتابخانه (Library Preparation) آغاز می‌شود. پس از این مرحله، قطعات DNA به آداپتورهای اختصاصی متصل می‌شوند تا امکان شناسایی و تکثیر آن‌ها فراهم شود.

بسیاری از پلتفرم‌ها، این قطعات روی بستری مانند flow cell تثبیت و از طریق تکثیر خوشه‌ای (مانند bridge amplification در فناوری Illumina) تکثیر می‌شوند. در برخی سامانه‌ها نیز خوانش به‌صورت تک‌مولکولی و بدون نیاز به PCR انجام می‌شود. با هر چرخه توالی‌ یابی، نوکلئوتیدها به رشته در حال سنتز افزوده می‌شوند و دستگاه با ثبت سیگنال‌های حاصل که می‌تواند به‌صورت فلورسانس، تغییرات الکتروشیمیایی یا تغییر pH باشد ترتیب بازها را تعیین می‌کند. در نهایت از کنار هم قرار گرفتن این سیگنال‌ها، خوانش‌ها (Reads) تولید می‌شوند که مبنای تحلیل‌های بیوانفورماتیکی بعدی هستند.

پلتفرم‌های شناخته‌شده NGS

در خانواده NGS فناوری‌های متعددی توسعه یافته‌اند که هرکدام اصول فنی متفاوتی دارند:

  • Illumina (Sequencing by Synthesis – SBS)
    مبتنی بر نوکلئوتیدهای فلورسانس برگشت‌پذیر است. این پلتفرم به دلیل دقت بالا، نرخ خطای پایین و اکوسیستم بیوانفورماتیکی گسترده، رایج‌ترین فناوری NGS در جهان محسوب می‌شود. با این حال طول خوانش آن کوتاه (Short Reads) است.
  • Ion Torrent
    در این فناوری، هنگام الحاق هر نوکلئوتید، یون هیدروژن آزاد شده و تغییر pH ثبت می‌شود. حذف سیستم فلورسانس موجب افزایش سرعت شده است، اما این روش نسبت به توالی‌های هموپلیمر (Homopolymer) حساسیت بیشتری دارد.
  • SOLiD (Applied Biosystems)
    مبتنی بر اتصال (Ligation) پروب‌های کوتاه است و از سیستم کدگذاری دوبخشی استفاده می‌کند. اگرچه دقت بالایی دارد، اما پیچیدگی تحلیل داده و ظهور فناوری‌های ساده‌تر باعث کاهش کاربرد آن شده است.
  • 454 Pyrosequencing (Roche)
    یکی از نخستین پلتفرم‌های تجاری NGS که بر اساس واکنش نشر نور (Pyrosequencing) کار می‌کرد. با وجود ارائه خوانش‌های نسبتاً بلندتر در زمان خود، به دلیل هزینه بالا و مشکلات هموپلیمر، امروزه منسوخ شده است.
  • BGI – DNBSEQ
    این فناوری از ساختار DNA nanoball استفاده می‌کند که موجب کاهش بایاس تکثیر و هزینه می‌شود و معماری متفاوتی نسبت به Illumina دارد.

کاربرد توالی یابی نسل جدید

  • توالی‌یابی کل ژنوم (WGS): این روش امکان شناسایی تغییرات تک‌نوکلئوتیدی (SNP)، درج‌ها و حذف‌های کوچک (indel)، تغییرات در تعداد نسخه (CNV) و بخشی از واریانت‌های ساختاری را فراهم می‌کند. WGS برای مطالعه ژنوم انسان، شناسایی جهش‌های مرتبط با سرطان، تحلیل ژنتیک جمعیت و بررسی میکروبیوم بسیار کاربردی است.
  • توالی‌یابی کل اگزوم (WES): در این روش، تنها بخش کوچکی از ژنوم که شامل تمام نواحی کدکننده پروتئین (تقریباً ۱–۲٪ ژنوم) است، توالی‌یابی می‌شود. WES به‌طور ویژه در مطالعات بالینی و کشف جهش‌های بیماری‌زا استفاده می‌شود و روشی مقرون‌به‌صرفه برای تمرکز بر بخش‌های ژنتیکی با بیشترین اهمیت عملکردی است.
  • RNA-seq: این روش امکان بررسی ترنسکریپتوم و اندازه‌گیری میزان بیان ژن‌ها را فراهم می‌کند. علاوه بر آن، RNA-seq به شناسایی ایزوفرم‌های مختلف، تحلیل مسیرهای زیستی و بررسی تغییرات بیان ژنی در شرایط مختلف کمک می‌کند، که در مطالعات سرطان، توسعه دارو و زیست‌فناوری کاربرد دارد.
  • توالی‌یابی امپلیکون و پنل‌های هدفمند (Amplicon/Targeted Panels): در این روش‌ها تمرکز بر ژن‌ها یا نواحی خاصی از ژنوم است. این روش‌ها به‌طور گسترده در تشخیص‌های بالینی، تعیین واریانت‌های شناخته‌شده، بررسی جهش‌های مرتبط با سرطان و مطالعات میکروبیوم به کار می‌روند. تمرکز محدود و هدفمند این روش باعث افزایش دقت و کاهش هزینه نسبت به توالی‌یابی کل ژنوم می‌شود.

مزایا

  • توان خروجی بسیار بالا (High Throughput): امکان توالی‌یابی میلیون‌ها تا میلیاردها قطعه DNA در یک اجرا.
  • هزینهٔ بسیار کمتر به‌ازای هر باز نسبت به Sanger: مناسب برای پروژه‌های بزرگ مثل WGS و WES.
  • دقت بالا با امکان ساخت توالی اجماعی (Consensus): با پوشش بالا، خطاهای تصادفی حذف می‌شوند.

محدودیت‌ها

  • طول خوانش کوتاه (Short Reads): معمولاً ۵۰ تا ۳۰۰ bp؛ در تکرارهای ژنومی و ساختارهای پیچیده محدودیت ایجاد می‌کند.
  • حساسیت برخی پلتفرم‌ها به توالی‌های خاص: مثلاً Ion Torrent در homopolymerها خطا می‌دهد.
  • نیاز به PCR در بیشتر روش‌ها: این موضوع می‌تواند باعث بایاس و خطای تکثیر شود.
  • تحلیل داده پیچیده و پرهزینه است: نیاز به سخت‌افزار حرفه‌ای و بیوانفورماتیک قوی دارد.
  • چالش در شناسایی واریانت‌های ساختاری بزرگ: به‌دلیل کوتاه بودن خوانش‌ها در شناسایی واریانت‌های ساختاری بزرگ مناسب نیست.

۳. توالی‌ یابی نسل سوم (Third-Generation Sequencing)

نسل سوم توالی‌ یابی با هدف رفع محدودیت‌های بنیادی در NGS معرفی شد. مهم‌ترین ویژگی‌های این نسل عبارت‌اند از:

  • خوانش‌های بسیار بلند (Long Reads) که می‌توانند از چند کیلوباز تا ده‌ها کیلوباز یا حتی صدها کیلوباز باشند.
  • توالی‌ یابی تک‌مولکولی (Single-Molecule Sequencing) بدون نیاز به تکثیر PCR انجام می‌دهد.
  • توانایی بسیار بهتر در مطالعه‌ی تکرارهای طولانی، ساختارهای پیچیده ژنومی، واریانت‌های ساختاری بزرگ و رونوشت‌های کامل (Full-Length RNA) دارد.

پلتفرم‌های اصلی نسل سوم

پلتفرم‌های این نسل شامل موارد زیر است:

PacBio (SMRT Sequencing – Single Molecule Real-Time)

فناوری SMRT که توسط شرکت Pacific Biosciences توسعه یافته، بر پایش سنتز DNA در زمان واقعی استوار است. در این سیستم، DNA پلیمراز در حفره‌های بسیار کوچکی به نام Zero-Mode Waveguide (ZMW) تثبیت می‌شود و هنگام الحاق هر نوکلئوتید، سیگنال فلورسانس ثبت می‌شود.

نسخه‌های جدید این فناوری موسوم به HiFi Reads از طریق خواندن مکرر یک مولکول حلقوی‌شده (Circular Consensus Sequencing) تولید می‌شوند. نتیجه، ترکیبی از:

  • طول خوانش بالا (تقریباً ۱۰ تا ۲۵ کیلوباز)
  • دقت بسیار بالا (QV30–QV40؛ معادل ≥99.9%)

است که بسیاری از محدودیت‌های سنتی خوانش بلند (خطای بالا) را برطرف کرده است.

مزایا PacBio

  • دقت بالا در نسخه HiFi
  • مناسب برای اسمبل de novo
  • شناسایی بهتر واریانت‌های ساختاری
  • امکان تحلیل برخی تغییرات اپی‌ژنتیکی بر اساس سینتیک واکنش آنزیمی

محدودیت‌ها PacBio

  • هزینه بالاتر نسبت به short-readها
  • نیاز به DNA با کیفیت و طول بالا
  • توان خروجی کمتر از برخی پلتفرم‌های NGS در پروژه‌های بزرگ غربالگری
Oxford Nanopore Technologies (ONT)

فناوری نانوپور که توسط Oxford Nanopore Technologies توسعه یافته، رویکردی کاملاً متفاوت دارد. در این سیستم، مولکول DNA از یک نانوحفره پروتئینی عبور می‌کند و تغییرات جریان یونی ناشی از عبور بازهای مختلف ثبت می‌شود. هر الگوی تغییر جریان، معادل یک توالی خاص از بازهاست.

این فناوری امکان تولید خوانش‌های فوق‌العاده بلند (Ultra-long reads) را فراهم می‌کند که می‌تواند به صدها کیلوباز و حتی بیش از یک مگاباز برسد.

دستگاه‌های این شرکت شامل:

  • MinION (قابل‌حمل)
  • GridION
  • PromethION

هستند که کاربردهای آزمایشگاهی و میدانی متنوعی دارند.

مزایای ONT

  • خوانش‌های بسیار بلند
  • قابلیت حمل و استفاده در میدان (Field Sequencing)
  • تشخیص مستقیم متیلاسیون و برخی تغییرات اپی‌ژنتیکی بدون نیاز به بیس‌سلفایت
  • آماده‌سازی کتابخانه سریع‌تر در برخی پروتکل‌ها

محدودیت‌های ONT

  • نرخ خطای خام بالاتر نسبت به Illumina (هرچند با الگوریتم‌های تصحیح بهبود یافته است)
  • حساسیت بیشتر به کیفیت نمونه
  • نیاز به تحلیل بیوانفورماتیکی پیشرفته برای تصحیح خطا

کاربردهای توالی یابی نسل سوم

۱. توالی‌ یابی آسان‌تر ژنوم‌های دشوار : خوانش‌های بلند PacBio و Oxford Nanopore امکان اسمبل de novo ژنوم‌هایی را فراهم می‌کنند که به دلیل نواحی تکراری، ساختارهای پیچیده یا طول زیاد توالی‌ها با فناوری‌های خوانش کوتاه به‌سختی یا ناقص بازسازی می‌شوند. این مزیت برای ژنوم‌های میکروبی، قارچ‌ها و بسیاری از گیاهان اهمیت ویژه دارد.

۲. فازبندی هاپلوتیپ‌ها (Haplotype phasing): چون هر خوانش بلند بخش بزرگی از یک مولکول DNA را می‌پوشاند، می‌توان واریانت‌هایی را که روی همان مولکول قرار گرفته‌اند به‌طور مستقیم به هم نسبت داد. به همین دلیل توالی‌ یابی نسل سوم ابزار قدرتمندی برای تعیین فاز کروماتیدها و شناسایی هاپلوتیپ‌های واقعی فرد است.

۳. مطالعهٔ اپی‌ژنتیک مستقیم: Oxford Nanopore قادر است الگوهای متیلاسیون را بدون نیاز به تیمار بیس‌سولفیت و فقط بر اساس تغییرات جریان یونیک تشخیص دهد. PacBio نیز با تحلیل سینتیک پلی‌مراز در حین توالی‌ یابی می‌تواند نشانه‌هایی از برخی تغییرات شیمیایی بازها را آشکار کند. این ویژگی‌ها مطالعهٔ اپی‌ژنتیک را از مرحلهٔ آماده‌سازی پیچیده بی‌نیاز می‌کند.

۴. فناوری PacBio HiFi (دقت بالا با خوانش‌های بلند): نسل HiFi ترکیبی از طول خوانش بالا (~۱۰ تا ۲۵ kb) و دقت بسیار زیاد ارائه می‌دهد. خوانش‌های HiFi معمولاً به دقتی در محدوده‌ی QV30–QV40 می‌رسند (خطای کمتر از ۰.۱٪، یعنی حدود ۹۹.۹٪ دقت) و بسیاری از محدودیت‌های سنتی خوانش‌های بلند مانند خطاهای بالا یا نیاز به تصحیح گسترده را تا حد زیادی برطرف می‌کنند.

مزایای توالی یابی نسل سوم

  • خوانش‌های فوق‌العاده بلند (Long Reads):
    • PacBio: معمولاً ۱۰–۲۵ kb
    • Oxford Nanopore: از ۱۰ kb تا حتی >۱ Mb
  • توالی‌ یابی تک‌مولکولی (Single-Molecule): اغلب نیازی به PCR نیست و خطاهای تکثیر حذف می‌شود.
  • توانایی بی‌نظیر در شناسایی ساختارهای ژنومی پیچیده: مانند جابه‌جایی‌ها، وارونگی‌ها، تکرارهای طولانی، VNTRها و STRها.
  • سرعت بالا در اجرای آزمایش: برخی دستگاه‌های Nanopore نتایج را در لحظه (Real-Time) ارائه می‌دهند.

محدودیت‌های توالی یابی نسل سوم

  • نرخ خطای خام بالاتر از NGS
    • PacBio عادی: نرخ خطا بالاتر بود، اما HiFi این مشکل را تقریباً حل کرده است.
    • Nanopore: خطای خام هنوز بالاتر است (هرچند در حال کاهش)
  • هزینه‌ی بیشتر برای برخی کاربردها: به‌ویژه زمانی که دقت بسیار بالا و پوشش زیاد لازم باشد.
  • نیاز به DNA ورودی با کیفیت بسیار بالا: DNA باید بلند، سالم و فاقد تخریب باشد.
  • توان خروجی برخی دستگاه‌ها کمتر از NGS است (بسته به مدل دستگاه).
  • سرمایه‌گذاری اولیه زیاد برای تجهیزات پیشرفته

جدول مقایسه روش‌های توالی یابی

ویژگی‌هاSangerنسل دوم (Illumina, Ion Torrent, 454, SOLiD)نسل سوم (PacBio, ONT)
میانگین طول خوانش700–1000 bp50–300 bp (برخی تا 600 bp)10 kb – 100 kb، تا 1 Mb در ONT
نرخ خطابسیار پایین (0.001)کم (1–2٪)بالاتر، اما در PacBio HiFi مشابه Illumina
توان خروجی (Throughput)بسیار کمبسیار بالامتوسط تا بالا
هزینه به‌ازای هر باززیادبسیار کممتوسط
نیاز به PCRداردداردندارد (Single-Molecule)
کاربردهای اصلیتأیید جهش‌ها، قطعات کوچکژنوم، اگزوم، RNA-seqساختارهای پیچیده، متیلاسیون، Long Reads

مراحل اصلی توالی‌ یابی DNA

هر پروژه توالی‌ یابی DNA چه مبتنی بر Sanger، چه نسل دوم (NGS) و چه نسل سوم مانند PacBio و Nanopore باشد، به‌ طور معمول شامل مراحل زیر است:

1. استخراج DNA با کیفیت بالا

هدف، به‌دست‌آوردن DNA سالم، فاقد آلودگی پروتئینی یا مهارکننده‌های PCR است. کیفیت و کمیت مواد اولیه تأثیر مستقیم بر دقت، طول خوانش و بازدهی کل فرایند دارد.

استخراج DNA
استخراج DNA

2. کنترل کیفیت اولیه (Pre-sequencing QC)

DNA استخراج‌شده از نظر موارد زیر بررسی می‌شود:

  • خلوص (Spectrophotometry – نسبت‌های A260/A280 و A260/A230)
  • سلامت و اندازه قطعات (الکتروفورز ژل یا Bioanalyzer)
  • مقدار (Qubit یا PicoGreen)

3. آماده‌سازی کتابخانه (Library Preparation)

این مرحله بسته به تکنولوژی توالی‌ یابی متفاوت است، اما معمولاً شامل موارد زیر است:

  • خرد کردن DNA به قطعات مناسب
  • اتصال آداپتورها (adaptors)
  • در صورت نیاز، تکثیر (PCR)
  • پاکسازی و انتخاب اندازه قطعات
تهیه کتابخانه DNA

نکته:
در پلتفرم‌های نسل سوم (Oxford Nanopore و PacBio HiFi)، به‌دلیل خوانش تک‌مولکولی، PCR یا بسیار کم است یا حذف می‌شود و همین باعث کاهش بایاس و افزایش دقت ساختاری می‌شود.

4. انجام توالی‌ یابی روی دستگاه

دستگاه توالی‌یاب بسته به تکنولوژی به کار رفته در آن، سیگنال‌های متفاوتی تولید می‌کند:

  • Sanger: توقف زنجیره با ddNTP
  • Illumina: سنتز با سیگنال فلورسنت
  • Ion Torrent: تغییر pH
  • SOLiD: توالی‌یابی مبتنی بر لیگیشن
  • PacBio SMRT: ثبت زمان‌بندی ورود نوکلئوتیدها
  • Nanopore: تغییر جریان یونی هنگام عبور مولکول

خروجی دستگاه فایل‌های اولیه خام (FASTQ) است.

5. تحلیل داده‌ها (Bioinformatics)

تحلیل شامل چند مرحله استاندارد است:

  • کنترل کیفیت داده خام (FastQC)
  • برش و حذف خوانش‌های بی‌کیفیت
  • هم‌ترازی به ژنوم مرجع (BWA، Minimap2 و…)
  • شناسایی واریانت‌ها (GATK، FreeBayes و…)
  • ساخت ژنوم de novo در موارد لازم
  • خروجی‌گیری در قالب BAM، VCF یا گزارش‌های تحلیلی

6. تفسیر ژنتیکی

پیچیده‌ترین بخش پروژه توالی یابی، تفسیر ژنتیکی نتایج است:

  • بررسی اهمیت بالینی واریانت‌ها
  • تفسیر یافته‌ها در چارچوب بیماری، صفات، دارودرمانی یا اهداف تحقیقاتی
  • ارزیابی اعتبار نتایج و تهیه گزارش نهایی توسط متخصص ژنتیک، بیوانفورماتیک و پزشک مربوط

کاربردهای توالی‌ یابی DNA در علوم و فناوری

در این بخش به بررسی کاربردهای کلی توالی یابی DNA می‌پردازیم:

۱. پزشکی و تشخیص بیماری‌ها

  • تشخیص بیماری‌های ژنتیکی ارثی: توالی‌ یابی (WES, WGS, panel sequencing) ابزار اصلی شناسایی جهش‌های منجر به بیماری‌های نادر یا وراثتی است.
  • پزشکی شخصی‌سازی‌شده (Personalized / Precision Medicine): با تحلیل ژنوم فرد، امکان انتخاب دارو یا درمان متناسب با ژنتیک شخص وجود دارد؛ این رویکرد به ویژه در بیماری‌های پیچیده و درمان سرطان اهمیت دارد. NGS می‌تواند جهش‌ها، تغییرات ساختاری (مثل حذف، درج، CNV) و تغییرات در بیان ژن/ترنسکریپتوم را در سلول‌های توموری شناسایی کند؛ این اطلاعات برای تعیین استراتژی درمان هدفمند کاربرد دارد.
  • تشخیص بیماری‌های عفونی و میکروبی / پاتوژن‌ها: توالی‌یابی ژنوم یا ژن‌های خاص پاتوژن‌ها (مثلاً 16S rRNA در باکتری‌ها) به شناسایی عامل بیماری حتی با غلظت کم کمک می‌کند؛ این روش در تشخیص سریع میکروب‌ها و شناسایی میکروارگانیسم‌هایی که کشت نمی‌شوند مفید است.

۲. پژوهش و زیست‌فناوری

  • ژنومیک تطبیقی و تکاملی: با توالی‌یابی ژنوم گونه‌های مختلف (گیاهان، جانوران، میکروب‌ها) می‌توان روابط تکاملی را بررسی کرد، تنوع ژنتیکی جمعیت‌ها را مطالعه کرد و سیر تکامل را بازسازی نمود. پروژه‌های بین‌المللی مثل Earth BioGenome Project نمونه‌هایی از این کاربردها هستند.
  • ژنومیک عملکردی / ترنسکریپتومیکس / امیکس‌ها (omics): ترکیب توالی‌ یابی DNA/RNA با سایر روش‌های اُمیکس (مثلاً RNA-seq, epigenomics) برای درک عملکرد ژن‌ها، بیان ژنی، تنظیم بیان ژن‌های مختلف به کار می‌رود.
  • مطالعات محیطی و میکروبیوم / تنوع زیستی: توالی‌ یابی metagenomic یا marker gene (مثل 16S rRNA) برای تعیین تنوع میکروبی در محیط (خاک، آب، روده انسان و…) کاربرد دارد؛ این روش جایگزین کشت کلاسیک می‌شود و می‌تواند گونه‌های غیرقابل‌کشت را نیز شناسایی کند.

۳. کشاورزی، محیط زیست و حفاظت از تنوع زیستی

  • اصلاح نژاد و مهندسی ژنتیک گیاهان و دام‌ها: با توالی‌یابی ژنوم و شناسایی ژن‌های مرتبط با صفات مطلوب (مثل مقاومت به خشکی، بیماری، آفات) می‌توان با روش‌های ژنتیکی یا زیستی، اصلاح نژاد انجام داد.
  • پایش تنوع زیستی و حفاظت از گونه‌ها: توالی‌ یابی DNA در پروژه‌های زیست‌محیطی و حفظ تنوع ژنتیکی گونه‌ها نقش کلیدی دارد؛ برای مثال، شناسایی گونه‌ها و زیرگونه‌ها، بررسی تنوع جمعیتی و ردیابی جمعیت‌های در معرض خطر از این طریق ه‌سادگی امکان‌پذیر می‌شود.
  • میکروبیولوژی محیطی و پایش آلودگی / کیفیت محیط: استفاده از توالی‌ یابی DNA برای شناسایی و بررسی جمعیت‌های میکروبی در خاک، آب یا فاضلاب انجام می‌شود؛ همچنین برای پایش میکروارگانیسم‌های شاخص آلودگی کاربرد دارد.

 ۴. پزشکی قانونی و علوم جنایی / هویت‌شناسی

شناسایی هویت و بررسی‌های جنایی: توالی‌ یابی DNA و تکنیک‌های مرتبط مانند STR و SNP امکان شناسایی دقیق افراد، تعیین خویشاوندی و تحلیل نمونه‌های کوچک یا تخریب‌شده را فراهم می‌کنند؛ این روش‌ها به‌ویژه در تحقیقات جنایی و پزشکی قانونی کاربرد حیاتی دارند.

آینده توالی‌ یابی DNA

پیشرفت توالی‌ یابی DNA همچنان با سرعت بسیار بالا ادامه دارد. در آینده نزدیک انتظار می‌رود:

  • هزینه توالی‌یابی ژنوم انسان به زیر ۱۰۰ دلار برسد.
  • دستگاه‌های کوچک‌تر و قابل‌حمل‌تر، توالی‌یابی را به محیط‌های بالینی و حتی منزل وارد کنند.
  • تحلیل‌های مبتنی بر هوش مصنوعی تفسیر نتایج ژنتیکی را دقیق‌تر و سریع‌تر کنند.
  • پزشکی فردمحور براساس ژنوم هر فرد، به استاندارد درمانی تبدیل شود.

توالی‌ یابی DNA یکی از بنیادی‌ترین ابزارهای علم مدرن است که بر حوزه‌های گسترده‌ای از پزشکی، کشاورزی، بیوتکنولوژی، محیط‌زیست و حتی امنیت و عدالت تأثیر گذاشته است. از روش سنگر تا فناوری‌های نسل سوم، روند تکامل این فناوری نشان می‌دهد که انسان هر روز بیشتر به درک کد حیات نزدیک می‌شود.

پژوهشگران امروز از توالی‌ یابی برای شناسایی بیماری‌ها، توسعه داروهای جدید، اصلاح گیاهان و حیوانات، بررسی تاریخ تکاملی موجودات و حتی کشف اسرار ژنومی جوامع میکروبی استفاده می‌کنند. با توجه به پیشرفت‌های سریع در سرعت، دقت و کاهش هزینه، انتظار می‌رود توالی‌ یابی DNA در سال‌های آینده نقشی کلیدی‌تر در پزشکی دقیق، درمان‌های هوشمند و تصمیم‌گیری‌های بالینی ایفا کند.

منابع: ، britannica، yourgenome، geneious

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *