کاهش حجم داده‌های DNA به میزان ۳۰۰ برابر و تغییر در تحقیقات ژنومی با استفاده از «متاگراف»

گروهی از پژوهشگران دانشگاه ETH Zurich واقع در سوئیس، موفق به ایجاد سیستمی به نام MetaGraph شده‌اند که جست‌وجویی مشابه با گوگل را اما برای اطلاعات ژنتیکی فراهم می‌کند؛ ابزاری که با فشرده‌سازی منحصر به فرد داده‌ها، امکان جست‌وجو در توالی‌های DNA و RNA را به گونه‌ای سریع‌تر، دقیق‌تر و با هزینه‌ای کمتر میسر می‌سازد.

با توسعه فناوری‌هایی در زمینه توالی‌یابی DNA، حجم داده‌های ژنتیکی در پایگاه‌های داده عمومی به طرز چشمگیری در حال افزایش است. در این راستا، گروهی از محققان دانشگاه ETH Zurich به رهبری «میخائیل کاراسیکوف» توانسته‌اند سامانه‌ای به نام MetaGraph طراحی نمایند که به نوعی شبیه به گوگل برای داده‌های ژنتیکی عملکرد دارد.

طبق گزارش ایتنا و به نقل از تک‌اسپات، این ابزار نخستین مرحله برای راه‌اندازی یک موتور جست‌وجوی جهانی در زمینه ژنوم را فراهم می‌آورد و به کاربران این امکان را می‌دهد تا میان میلیون‌ها توالی DNA و RNA بدون نیاز به بارگذاری داده‌های عظیم جست‌وجو کنند.

مطالعه‌ای که منتشر شده، نشان می‌دهد متاگراف یک چارچوب نوآورانه برای ساخت نمایه‌ای مقیاس‌پذیر از داده‌های ژنتیکی فراهم می‌آورد. این سیستم به کاربران این اجازه را می‌دهد که در داده‌های خام زیستی جست‌وجو کنند، در حالی که روش‌های قبلی تنها بر اساس فراداده (metadata) توصیفی عمل کرده و نتایجی ناکافی ارائه می‌دادند. به بیان پژوهشگران، جست‌وجو با متاگراف به مراتب اقتصادی‌تر است؛ به طوری که تمامی داده‌های ژنتیکی عمومی را می‌توان تنها در چند هارددیسک ذخیره کرد و هر جست‌وجوی عمده تنها هزینه‌ای کمتر از ۰/۷۴ دلار به ازای هر مگابیس خواهد داشت.

ساختار داده‌ای این موتور جست‌وجو به شکل یک ماتریس عظیم با میلیون‌ها ستون و تریلیون‌ها ردیف طراحی شده است. تیم تحقیقاتی ETH Zurich با به کارگیری تکنیک‌های فشرده‌سازی پیشرفته، توانسته‌اند داده‌ها را تا ۳۰۰ برابر بیشتر از حالت معمول فشرده‌سازی کنند؛ دستیابی که به گفته دکتر «آندره کالس» از گروه انفورماتیک زیست‌پزشکی این دانشگاه، مرزهای قابل دسترسی در مدیریت داده‌های ژنتیکی را تغییر داده است.

پروژه متاگراف از سال ۲۰۲۰ آغاز گردیده و تاکنون فرآیند توسعه آن ادامه دارد. در حال حاضر، نسخه‌ای عمومی از این سامانه برای جست‌وجوهای محدودی در دسترس قرار گرفته و برنامه‌نویسان و محققان می‌توانند کد متن‌باز آن را در مخزن رسمی گیت‌هاب مشاهده کنند. این سامانه هم‌اکنون تقریبا نیمی از داده‌های ژنتیکی جهان را نمایه‌سازی کرده و هدف آن این است که تا پایان سال، تمامی داده‌های موجود را پوشش دهد.

دانشمندان دانشگاه ETH Zurich امیدوارند که شرکت‌های داروسازی از MetaGraph در تحقیقات داخلی خود بهره‌مند شوند و در آینده، کاربران عادی نیز بتوانند به کمک این فناوری جست‌وجوهای ژنتیکی شخصی انجام دهند. همان‌طور که کالس اشاره کرده، در آغاز فعالیت گوگل، کسی نمی‌دانست که موتور جست‌وجو چه تحولی در بر خواهد داشت و MetaGraph نیز می‌تواند در آینده به ابزاری روزمره برای شناسایی دقیق‌تر گیاهان یا ویژگی‌های ژنتیکی افراد تبدیل گردد.

مشاهده بیشتر

نوشته های مشابه

دکمه بازگشت به بالا