زیست‌فناوری، ژنومیک و پروتئین‌های نو, مقالات وسترا

گراف‌ژنوم محصولات بومی برای طراحی ارقام اقلیم‌تاب‌آور

گراف‌ژنوم محصولات بومی برای طراحی ارقام اقلیم‌تاب‌آور

گراف‌ژنوم و پان‌ژنوم محصولات بومی برای طراحی ارقام اقلیم‌تاب‌آور

وقتی یک رقم بومی در خشکی، گرما، شوری یا فشار بیماری دوام می‌آورد، بخشی از پاسخ آن در ژن‌هایی نهفته است که همیشه در ژنوم مرجع تجاری دیده نمی‌شوند. ژنوم مرجع واحد مانند یک نقشه ضروری اما ناقص عمل می‌کند؛ خوانش‌ها، واریانت‌ها و ژن‌ها را روی یک مسیر خطی می‌نشاند، اما اگر آلل یا قطعه‌ای از DNA در آن مسیر حضور نداشته باشد، امکان دارد بد نگاشت شود یا از تحلیل بیرون بماند. برای کشاورزی اقلیم‌تاب‌آور، این محدودیت فقط یک مسئله فنی در آزمایشگاه نیست، بلکه به انتخاب رقم، امنیت غذایی، اقتصاد آب و تصمیم سرمایه‌گذاری در زنجیره بذر مربوط می‌شود. هرچه تنش‌های اقلیمی فشار بیشتری بر تولید وارد کنند، ارزش دیدن بخش‌های پنهان تنوع ژنتیکی که خارج از مرجع واحد مانده است بیشتر آشکار می‌شود.

– یائو ژو و همکاران، مؤسسه گیاه‌شناسی آکادمی علوم چین و همکاران بین‌المللی: «نقشه واریانت مبتنی بر یک مرجع خطی، سوگیری مرجع ایجاد می‌کند.»

پان‌ژنوم از همین نقطه اهمیت پیدا می‌کند، زیرا به‌جای یک ژنوم نماینده، مجموعه ژن‌ها، آلل‌ها، توالی‌های غیرمرجع، واریانت‌های ساختاری و مسیرهای هاپلوتیپی چندین ژنوتیپ را در یک چارچوب مشترک نگه می‌دارد. گراف‌ژنوم نیز نمایش محاسباتی پیشرفته همین تنوع است؛ در آن، درج‌ها، حذف‌ها، وارونگی‌ها و مسیرهای آللی مختلف به‌صورت گره و مسیر ذخیره می‌شوند و خوانش‌ها به یک مسیر ثابت محدود نمی‌مانند. این تفکیک مهم است، زیرا پان‌ژنوم مفهوم زیستی و داده‌ای تنوع است، اما گراف‌ژنوم ابزار نگاشت، فراخوانی و تحلیل همان تنوع در سطح محاسباتی است. برای محصولات بومی، این تغییر مسیر به معنای عبور از ثبت ساده ژرم‌پلاسم به طراحی داده‌محور رقم‌های مقاوم‌تر در برابر تنش‌های واقعی مزرعه است.

گراف‌ژنوم محصولات بومی برای طراحی ارقام اقلیم‌تاب‌آور

چرا ژنوم مرجع واحد برای محصولات بومی اقلیم‌تاب‌آور کافی نیست؟

محصولات بومی و خویشاوندان وحشی آن‌ها معمولا حامل تنوعی هستند که طی اهلی‌سازی، انتخاب تجاری یا تمرکز بر رقم‌های پرعملکرد از دید اصلاح‌گر پنهان مانده است. اگر یک برنامه اصلاحی فقط به مرجع خطی متکی باشد، ممکن است ژن‌های مرتبط با دفاع، طعم، تحمل تنش یا سازگاری منطقه‌ای را که در مرجع حضور ندارند، کم‌ارزش یا نامرئی تلقی کند. نمونه گوجه‌فرنگی ۲۰۱۹ نشان داد تحلیل ۷۲۵ دسترسی از گوجه‌فرنگی زراعی و خویشاوندان نزدیک آن به شناسایی ۴٬۸۷۳ ژن کدکننده پروتئین در توالی‌های غیرمرجع منجر شد. این عدد نشان می‌دهد بخشی از تنوع مهم برای اصلاح نباتات، بیرون از قاب ژنوم مرجع واحد قرار می‌گیرد و بدون پان‌ژنوم در تحلیل نهایی حضور مؤثر ندارد.

گراف‌پان‌ژنوم گوجه‌فرنگی سطح دوم این مسئله را روشن‌تر کرد. در آن پروژه، ۸۳۸ ژنوم و ۳۲ اسمبلی جدید در سطح مرجع به کار رفت و بیش از ۱۹ میلیون واریانت ثبت شد. برآورد وراثت‌پذیری صفات مولکولی از ۰٫۳۳ در ژنوم خطی به ۰٫۴۱ در گراف‌پان‌ژنوم رسید که معادل افزایش ۲۴ درصدی بود. در همان مطالعه، مرجع خطی فقط حدود ۲۰ درصد واریانت‌های ساختاری شناسایی‌شده با گراف‌پان‌ژنوم را بازیابی کرد و همین فاصله نشان داد که واریانت ساختاری در مرجع واحد به‌شدت کم‌نمایی می‌شود.

– یائو ژو و همکاران، مؤسسه گیاه‌شناسی آکادمی علوم چین و همکاران: «این مطالعه قدرت گراف‌پان‌ژنوم را در فهم وراثت‌پذیری صفات پیچیده و اصلاح محصول نشان می‌دهد.»

برای محصولات بومی، ارزش این فناوری فقط کشف ژن تازه نیست، بلکه پیوند دادن ذخایر بانک ژن، داده‌های فنوتیپی مزرعه‌ای، داده‌های اقلیمی و داده‌های چندامیکی به یک مسیر اصلاحی قابل تصمیم‌گیری است. اگر یک رقم در یک اقلیم خشک یا گرم عملکرد پایدارتری دارد، پان‌ژنوم باید نشان دهد کدام واریانت، کدام هاپلوتیپ و کدام شبکه تنظیمی می‌تواند در برنامه اصلاحی ردیابی شود. این منطق، اصلاح نباتات را از انتخاب بر اساس مشاهده عمومی مزرعه به طراحی مبتنی بر داده نزدیک می‌کند. نتیجه عملی آن، تولید فهرستی از اهداف اصلاحی است که با تنش‌های مشخص مانند خشکی، گرما، شوری، بیماری و کیفیت غذایی ارتباط دارند.

گراف‌پان‌ژنوم چگونه واریانت‌های پنهان را به داده اصلاحی تبدیل می‌کند؟

– از خوانش بلند تا نگاشت آگاه از گراف

پان‌ژنوم‌های جدید گیاهی به‌طور فزاینده بر توالی‌یابی خوانش بلند، اسمبلی‌های کروموزومی، Hi-C و نگاشت آگاه از گراف متکی‌اند. خوانش بلند برای دیدن درج‌های بزرگ، نواحی تکراری و واریانت‌های ساختاری ضروری است، زیرا بسیاری از این قطعات با داده‌های کوتاه‌خوان یا مرجع خطی به‌درستی بازسازی نمی‌شوند. Hi-C نیز با داده تماس کروموزومی به مرتب‌سازی و جهت‌دهی کانتیگ‌ها کمک می‌کند و در نمونه سیب‌زمینی، اسمبلی‌های هاپلوتیپی با اتکا به آن به شبه‌کروموزوم تبدیل شدند. نگاشت آگاه از گراف نیز خوانش‌ها را به ساختاری چندمسیره متصل می‌کند و خطاهای پیرامون واریانت‌های ساختاری را کاهش می‌دهد.

کیفیت چنین سامانه‌ای با سنجه‌های اسمبلی و فراخوانی واریانت قابل سنجش است. در گراف‌پان‌ژنوم گوجه‌فرنگی، نسخه SL5.0 کانتیگ N50 برابر ۴۱٫۷ مگاباز داشت و نسبت به SL4.0 حدود هفت برابر افزایش نشان داد. میانگین BUSCO برای ژن‌های Solanales در اسمبلی‌های همان مطالعه ۹۶٫۲ درصد گزارش شد که برای سنجش کامل‌بودن ژن‌های تک‌نسخه‌ای ارتولوگ اهمیت دارد. در داده شبیه‌سازی‌شده ۱۰×، امتیاز F1 گراف‌پان‌ژنوم برای SNP برابر ۰٫۹۶۶، برای indel برابر ۰٫۹۴۱ و برای SV برابر ۰٫۸۴۰ بود، درحالی‌که مرجع خطی به‌ترتیب به ۰٫۹۳۱، ۰٫۸۹۷ و ۰٫۴۷۴ رسید.

– هاپلوتیپ به‌عنوان واحد طراحی رقم

طراحی اقلیم‌تاب‌آور فقط با دانستن یک ژن منفرد کامل نمی‌شود، زیرا بسیاری از صفات پیچیده با مجموعه‌ای از آلل‌ها و مسیرهای هاپلوتیپی کنترل می‌شوند. در سیب‌زمینی دیپلوئید، گراف‌پان‌ژنوم فازبندی‌شده از ۶۰ هاپلوتیپ ساخته شد و طول نمایندگی‌شده در گراف ۳٬۰۷۶ مگاباز بود، درحالی‌که مرجع خطی ۷۴۲ مگاباز را پوشش می‌داد. در همان مورد، ۱۳۳٬۲۶۴ واریانت ساختاری با آستانه ۵۰ جفت‌باز یا بیشتر گزارش شد و ۸۷٫۰ درصد واریانت‌های ساختاری چندآللی بودند. شناسایی ۱۹٬۶۲۵ واریانت ساختاری بالقوه زیان‌آور نیز نشان داد که طراحی هاپلوتیپ می‌تواند به کاهش بار ژنتیکی نامطلوب در اصلاح پیش‌بینانه کمک کند.

– لین چنگ و همکاران، نویسندگان مقاله Nature در حوزه گراف‌پان‌ژنوم سیب‌زمینی: «نیاز است از ژنوم‌های مرجع واحد به مرجع‌های پان‌ژنومی فازبندی‌شده گذار کنیم.»

این گذار برای محصولات بومی، معنایی فراتر از افزایش دقت محاسباتی دارد. اگر بانک ژن فقط نمونه را نگهداری کند اما مسیر هاپلوتیپی، فنوتیپ تنش و داده اقلیمی آن نمونه روشن نباشد، اصلاح‌گر نمی‌تواند آن را به‌سرعت وارد برنامه انتخاب کند. گراف‌ژنوم فازبندی‌شده امکان می‌دهد یک ژرم‌پلاسم نه فقط با نام و منشأ، بلکه با مسیرهای آللی و خطر واریانت‌های زیان‌آور توصیف شود. با این حال، هتروزیگوسیتی بالا، واریانت‌های چندآللی و نیاز به فازبندی دقیق باعث می‌شود کاربرد مستقیم این مدل بدون زیرساخت زیست‌داده‌ورزی و اصلاح محاسباتی دشوار باشد.

موردکاوی‌های جهانی پان‌ژنوم برای تحمل گرما خشکی و سازگاری زیستگاه

ارزن مرواریدی یکی از نمونه‌های روشن ارتباط گراف‌پان‌ژنوم با تنش گرما است. در این مطالعه، ۱۰ اسمبلی کروموزومی جدید به‌همراه یک اسمبلی موجود برای ساخت گراف‌پان‌ژنوم به کار رفت و ۴۲۴٬۰۸۵ واریانت ساختاری ثبت شد. نتیجه فنی مطالعه به گسترش خانواده فاکتور رونویسی RWP-RK و ژن‌های مرتبط با شبکه اندوپلاسمی در تحمل گرما اشاره داشت. اهمیت این نمونه برای محصولات بومی در این است که اقلیم‌تاب‌آوری معمولا در واریانت‌های کوچک و بزرگ پراکنده است و بدون گراف‌پان‌ژنوم، بخش مهمی از آن در حاشیه تحلیل باقی می‌ماند.

– هایدونگ یان و همکاران، نویسندگان مقاله Nature Genetics درباره ارزن مرواریدی: «ما با ده ژنوم کروموزومی و یک اسمبلی موجود، پان‌ژنوم مبتنی بر گراف ساختیم.»

گندم نیز نشان می‌دهد پان‌ژنوم می‌تواند تاریخ اصلاح و سازگاری زیستگاه را در کنار هم بخواند. مطالعه Nature روی ۱۷ رقم چینی در سطح کروموزومی، ۲۴۹٬۹۷۶ واریانت ساختاری شناسایی کرد که ۱۲۲٬۵۶۷ مورد، یعنی ۴۹٫۰۳ درصد، بزرگ‌تر از ۵ کیلوباز بودند. مقاله همچنین ارتباط واریانت‌های نزدیک سانترومر با کاهش کراس‌اور و نقش تغییرات VRN-A1 در گذار گندم از تیپ بهاره به زمستانه را مطرح کرد. این داده برای ایران در سطح منطق روش اهمیت دارد، زیرا تعمیم مستقیم آن به گندم ایران بدون رقم‌های ایرانی، اقلیم ایران و فنوتیپینگ بومی مسیر علمی مطمئنی ایجاد نمی‌کند.

– چنگژی جیائو و همکاران، آکادمی علوم کشاورزی چین، دانشگاه کشاورزی چین و همکاران: «ما اسمبلی‌های کروموزومی ۱۷ رقم گندم را گزارش می‌کنیم که تاریخ اصلاح چین را ثبت می‌کنند.»

در جو، مقیاس پروژه به مرحله جمعیتی نزدیک‌تر شده است. پان‌ژنوم توسعه‌یافته جو شامل ۷۶ توالی در سطح کروموزوم از خوانش بلند و داده‌های کوتاه‌خوان ۱٬۳۱۵ ژنوم جو بود. این ساختار نشان می‌دهد پان‌ژنوم فقط مجموعه‌ای از چند اسمبلی ممتاز نیست، بلکه می‌تواند ژنوم‌های وحشی و اهلی را در یک چارچوب برای کشف واریانت‌های سازگاری و اصلاح ادغام کند. برای کشورهایی که محصولات بومی و خویشاوندان وحشی آن‌ها سرمایه ژنتیکی مهمی محسوب می‌شوند، چنین الگویی مسیر تبدیل بانک ژن به سامانه فعال کشف و انتخاب را نشان می‌دهد.

در ذرت، مطالعه Nature Genetics با ۲۵ اسمبلی جدید از ژرم‌پلاسم‌های دارای تفاوت زیاد در مقاومت خشکی و ۳۱ ژنوم اضافی، سه ژن ZmUGE2، ZmSIL2 و ZmASI3 را با مقاومت خشکی در مراحل مختلف رشد مرتبط کرد. اهمیت این مورد در پیوند پان‌ژنوم با داده‌های چندامیکی است، زیرا مقاله به RNA-seq، ChIP-seq و داده‌های ترنسژنیک در NCBI و Zenodo ارجاع داده است. این نمونه نشان می‌دهد پان‌ژنوم کاربردی فقط یک فایل ژنوم نیست، بلکه شبکه‌ای از ژنوم، بیان ژن، تنظیم‌گری و فنوتیپ است. بنابراین، کشف ژن بدون فنوتیپینگ چندمحیطی و داده تنظیم‌گری، برای طراحی رقم اقلیم‌تاب‌آور کافی نیست.

استاندارد بانک ژن و بازتولیدپذیری داده در زیرساخت پان‌ژنوم ملی

زیرساخت پان‌ژنوم از نمونه ژنتیکی آغاز می‌شود و به همین دلیل بانک ژن در مرکز آن قرار دارد. استانداردهای FAO برای بانک‌های ژن گیاهی، حوزه‌هایی مانند حفاظت بذر ارتدوکس، کلکسیون‌های مزرعه‌ای، کشت درون‌شیشه‌ای و کرایوپریزرویشن را پوشش می‌دهد و ماهیت داوطلبانه دارد. نسخه عملیاتی ۲۰۲۲ این استانداردها نیز راهنمای گام‌به‌گام مدیریت بذر ارتدوکس، کلکسیون مزرعه‌ای و کشت درون‌شیشه‌ای ارائه می‌کند. اتصال چنین استانداردهایی به پروژه پان‌ژنوم به این معنا است که هر نمونه، پیش از ورود به تحلیل ژنومی، باید از نظر منشأ، وضعیت نگهداری، فراداده و قابلیت ردیابی قابل اعتماد باشد.

– سازمان خواربار و کشاورزی ملل متحد: «بانک‌های ژن خوب مدیریت‌شده، تنوع ژنتیکی را حفظ و برای اصلاح‌گران قابل استفاده می‌کنند.»

انتشار علمی پان‌ژنوم نیز بدون دسترسی‌پذیری و بازتولیدپذیری داده کامل نمی‌شود. در مطالعه ذرت ۲۰۲۵، داده‌های خام در NCBI SRA با BioProject PRJNA1103102 منتشر شد و اسمبلی، حاشیه‌نویسی و واریانت‌های ساختاری در Zenodo قرار گرفت. کدهای سفارشی همان مطالعه نیز در GitHub و Zenodo منتشر شد و این موضوع نشان می‌دهد استاندارد داده در پان‌ژنوم فقط فایل توالی نیست. برای برنامه‌های ملی، چنین الگویی یعنی هر پروژه باید از ابتدا برای مخزن داده، نسخه‌بندی کد، فراداده فنوتیپی و امکان بازتحلیل توسط گروه‌های مستقل طراحی شود.

مدل تأمین مالی مناسب برای ساخت نسخه باز پان‌ژنوم محصولات راهبردی در پرونده جهانی بیشتر به کنسرسیوم عمومی دانشگاهی نزدیک است. پروژه‌های گوجه‌فرنگی، گندم، جو و ذرت با مشارکت چند دانشگاه یا مؤسسه و انتشار داده در مخازن باز پیش رفته‌اند، هرچند ارقام بودجه آن‌ها در داده‌های قابل استفاده عددگذاری نشده است. این ویژگی برای سرمایه‌گذاری فناورانه مهم است، زیرا خروجی اولیه پان‌ژنوم لزوما رقم آماده فروش نیست، بلکه داده معتبر، نشانگر، مسیر هاپلوتیپی و ژرم‌پلاسم اولویت‌دار است. بنابراین، بازگشت ارزش در چنین پروژه‌ای از مسیر کوتاه‌مدت فروش محصول عبور نمی‌کند، بلکه از ایجاد زیرساخت تصمیم برای اصلاح نباتات شکل می‌گیرد.

مسیر ایران برای تبدیل ژرم‌پلاسم بومی به برنامه پان‌ژنوم کاربردی

برای ایران، نقطه شروع روشن در سطح بین‌المللی، شناسایی نهادی بانک ژن ملی گیاهی ایران در WIEWS و Genesys است. National Plant Gene Bank of Iran با کد IRN029 ثبت شده و نوع آن دولتی گزارش شده است. Seed and Plant Improvement Research Institute نیز با کد IRN001 در Genesys ثبت شده، اما تعداد دسترسی‌های ثبت‌شده برای آن صفر نشان داده می‌شود. این صفر نباید به نبود ذخایر داخلی تعبیر شود؛ معنای دقیق‌تر آن این است که در سطح Genesys، رکورد قابل جست‌وجوی عمومی برای آن نهادها در دسترس نیست.

همین وضعیت، اولویت اجرایی ایران را روشن می‌کند. پیش از هر ادعای بزرگ درباره پان‌ژنوم محصولات بومی، باید زنجیره نمونه، فراداده، فنوتیپ، اقلیم و توالی‌یابی به هم متصل شود. اگر رکورد ژرم‌پلاسم در پلتفرم عمومی قابل بازیابی نباشد، اگر فنوتیپ تنش در چند محیط ثبت نشده باشد، یا اگر مسیر داده از بانک ژن تا اصلاح‌گر قابل ردیابی نباشد، پروژه پان‌ژنوم به کاتالوگ واریانت تبدیل می‌شود. طراحی کاربردی باید از محصولاتی آغاز شود که هم اهمیت امنیت غذایی دارند و هم امکان فنوتیپینگ چندمحیطی، نمونه‌برداری استاندارد و تحلیل زیست‌داده‌ورزی برای آن‌ها فراهم است.

ریسک اصلی برای ایران، تعمیم شتاب‌زده یافته‌های گوجه‌فرنگی، گندم، ارزن، جو، ذرت یا سیب‌زمینی به ارقام داخلی است. هر موردکاوی جهانی یک الگوی روش‌شناختی می‌دهد، اما آلل مفید در یک جمعیت و اقلیم، بدون آزمون ژنوتیپ در محیط، الزاما برای جمعیت بومی دیگر همان اثر را ندارد. به همین دلیل، پان‌ژنوم ملی باید با فنوتیپینگ اقلیمی، داده‌های چندامیکی و آزمون‌های اصلاحی محلی پیش برود. مسیر درست، ساخت همزمان زیرساخت داده و مسیر تصمیم اصلاحی است، نه تولید انبوه داده توالی بدون پرسش روشن زراعی.

در طراحی اجرایی، نخستین خروجی نباید رقم تجاری فوری فرض شود، بلکه باید یک بسته داده قابل استفاده برای اصلاح‌گر باشد. این بسته می‌تواند شامل شناسه پایدار نمونه، وضعیت نگهداری در بانک ژن، کیفیت اسمبلی، مسیرهای هاپلوتیپی، واریانت‌های ساختاری، داده فنوتیپی چندمحیطی و پیوند آن با تنش‌های غالب باشد. چنین بسته‌ای با منطق پروژه‌های جهانی سازگار است، زیرا ارزش گراف‌پان‌ژنوم زمانی آشکار می‌شود که از سطح کشف واریانت عبور کند و به نشانگر اصلاحی، انتخاب ژنومی و اولویت‌بندی ژرم‌پلاسم برسد. برای ایران، چنین طراحی‌ای ظرفیت بانک ژن را از نگهداری خام به زیرساخت فعال اصلاح نباتات نزدیک می‌کند.

جمع‌بندی کاربردی برای ایران این است که گراف‌ژنوم و پان‌ژنوم باید به‌عنوان زیرساخت تصمیم در اصلاح نباتات دیده شوند، نه صرفا پروژه‌ای پرهزینه در ژنومیکس. مرجع واحد برای ورود به تحلیل کافی است، اما برای کشف تنوع پنهان، واریانت‌های ساختاری، ژن‌های غیرمرجع و مسیرهای هاپلوتیپی اقلیم‌تاب‌آور کافی نیست. برنامه موفق باید از بانک ژن استاندارد، داده باز یا نیمه‌باز، اسمبلی باکیفیت، نگاشت آگاه از گراف، فنوتیپینگ چندمحیطی و قابلیت بازتولید محاسباتی تشکیل شود. تنها در چنین ساختاری، ذخایر بومی از حالت دارایی خام ژنتیکی خارج می‌شوند و به ابزار طراحی رقم برای امنیت غذایی و سازگاری اقلیمی تبدیل می‌شوند.

گراف‌ژنوم محصولات بومی برای طراحی ارقام اقلیم‌تاب‌آور
دیدگاه‌های کاربران

شما می‌توانید دیدگاه خود را بصورت کاملا ناشناس و بدون درج اطلاعات شخصی خود ثبت نمایید.