کاهش حجم دادههای DNA به میزان ۳۰۰ برابر و تغییر در تحقیقات ژنومی با استفاده از «متاگراف»

طبق گزارش ایتنا و به نقل از تکاسپات، این ابزار نخستین مرحله برای راهاندازی یک موتور جستوجوی جهانی در زمینه ژنوم را فراهم میآورد و به کاربران این امکان را میدهد تا میان میلیونها توالی DNA و RNA بدون نیاز به بارگذاری دادههای عظیم جستوجو کنند.
مطالعهای که منتشر شده، نشان میدهد متاگراف یک چارچوب نوآورانه برای ساخت نمایهای مقیاسپذیر از دادههای ژنتیکی فراهم میآورد. این سیستم به کاربران این اجازه را میدهد که در دادههای خام زیستی جستوجو کنند، در حالی که روشهای قبلی تنها بر اساس فراداده (metadata) توصیفی عمل کرده و نتایجی ناکافی ارائه میدادند. به بیان پژوهشگران، جستوجو با متاگراف به مراتب اقتصادیتر است؛ به طوری که تمامی دادههای ژنتیکی عمومی را میتوان تنها در چند هارددیسک ذخیره کرد و هر جستوجوی عمده تنها هزینهای کمتر از ۰/۷۴ دلار به ازای هر مگابیس خواهد داشت.
ساختار دادهای این موتور جستوجو به شکل یک ماتریس عظیم با میلیونها ستون و تریلیونها ردیف طراحی شده است. تیم تحقیقاتی ETH Zurich با به کارگیری تکنیکهای فشردهسازی پیشرفته، توانستهاند دادهها را تا ۳۰۰ برابر بیشتر از حالت معمول فشردهسازی کنند؛ دستیابی که به گفته دکتر «آندره کالس» از گروه انفورماتیک زیستپزشکی این دانشگاه، مرزهای قابل دسترسی در مدیریت دادههای ژنتیکی را تغییر داده است.
دانشمندان دانشگاه ETH Zurich امیدوارند که شرکتهای داروسازی از MetaGraph در تحقیقات داخلی خود بهرهمند شوند و در آینده، کاربران عادی نیز بتوانند به کمک این فناوری جستوجوهای ژنتیکی شخصی انجام دهند. همانطور که کالس اشاره کرده، در آغاز فعالیت گوگل، کسی نمیدانست که موتور جستوجو چه تحولی در بر خواهد داشت و MetaGraph نیز میتواند در آینده به ابزاری روزمره برای شناسایی دقیقتر گیاهان یا ویژگیهای ژنتیکی افراد تبدیل گردد.



