جامعه پژوهشی درمورد پتانسیل DNA برای عملکرد به‌عنوان ابزاری برای ذخیره‌سازی آرشیوی طولانی‌مدت هیجان‌زده محسوب می‌شود که تا حد زیادی به آن علت است که دی‌ان‌ای بسیار متراکم است و ازنظر شیمیایی برای...

کد خبر: 1140121
تاریخ انتشار: ۱۴۰۱/۰۷/۱۳-۰۶:۴۱
ارسال توسط :
بازدید: 1
چرا سازندگان هارد دیسک روی ذخیره‌سازی داده‌ها در DNA سرمایه‌گذاری کنند؟

جامعه پژوهشی درمورد پتانسیل DNA برای عملکرد به‌عنوان ابزاری برای ذخیره‌سازی آرشیوی طولانی‌مدت هیجان‌زده محسوب می‌شود که تا حد زیادی به آن علت است که دی‌ان‌ای بسیار متراکم است و ازنظر شیمیایی برای ده‌ها هزار سال پایدار است و الگویی دارد که بعید است نحوه خواندن آن را فراموش نماییم.

درحالی‌که پیشرفت‌های جالبی وجود داشته، به‌علت هزینه بالا و سرعت بسیار پایین خواندن و نوشتن، تلاش‌ها عمدتاً محدود به جامعه پژوهشی مانده است. این‌ها مشکلاتی می باشند که باید پیش از عملی‌شدن ذخیره‌سازی مبتنی‌بر دی‌ان‌ای حل شوند. بنابراین، شنیدن این خبر موجب شگفتی است که سیگیت، غول ذخیره‌سازی داده‌ها با ۱ شرکت ذخیره‌سازی مبتنی‌بر DNA به نام کاتالوگ وارد همکاری شده است.

ارز تکنیکا برای پی بردن به این مسئله که فناوری این شرکت چقدر به کاربردی‌شدن نزدیک است، با هیونجون پارک، مدیرعامل شرکت کاتالوگ صحبت کرد. پارک اشاره کرد که رویکرد کاتالوگ در ۲ سطح غیرمنتظره است: داده‌ها را آن‌طور که انتظار دارید، ذخیره نمی‌کند و اصلاً روی ذخیره‌سازی آرشیوی تمرکز ندارد.

ذخیره‌سازی متفاوت

دی‌ان‌ای مولکولی است که می‌توان آن را به‌عنوان آرایه خطی از بازها درنظر گرفت که هر باز یکی از ۴ ماده شیمیایی متمایز است: A، T، C و G.

به‌طور معمول، از هر باز DNA برای نگه‌داری ۲ بیت اطلاعات استفاده می‌شود و مقادیر بیت‌ها بوسیله باز خاصی که وجود دارد، مشخص می‌شود. بنابراین، A می‌تواند رمزکننده ۰۰ باشد، T می‌تواند رمزکننده ۰۱ باشد، C می‌تواند ۱۱ را رمزگذاری کند و G می‌تواند ۱۱ را رمزگذاری کند. به این شیوه، مولکول AA از توانایی رمزگذاری ۰۰۰۰ برخوردار است، درحالی‌که AA می‌تواند ۰۰۱۰ را رمزگذاری کند و به همین ترتیب.

ما می‌توانیم مولکول‌های دی‌ان‌ای به طول صدها باز را با کارآیی بالا سنتز نماییم و می‌توانیم توالی‌های جانبی را اضافه نماییم که معادل اطلاعات سیستم فایل‌بندی است که به ما می‌گوید قطعه‌ی واحدی از دی‌ان‌ای کدام قطعه از داده‌های باینری را نشان می‌دهد.

مشکل این رویکرد آن است که هرچه رشته بیت‌هایی که می‌خواهید ذخیره کنید، طولانی‌تر باشد، زمان و هزینه بیشتری می‌برد. سخت‌افزارهای رباتیک واکنش‌های سنتر را انجام می‌دهند و هر واحد سخت‌افزاری می‌تواند در هر زمان تنها ۱ مولکول دی‌ان‌ای را سنتز کند.

مواد خامی که سخت‌افزار از آن برای سنتز استفاده می‌کند، نیز هزینه‌ای به هر مولکول ذخیره‌شده اضافه می‌کند. درحالی‌که این نگرانی برای پروژه‌های کوچک وجود ندارد، اگر شروع به ذخیره‌سازی مقادیر عظیمی از داده‌ها کنید، هزینه‌ها به سرعت بالا خواهد رفت. به‌گفته‌ی پارک، با فرض هزینه سنتر ۰٫۰۳ سنت به ازای هر باز و با درنظر گرفتن حجمی در حد گیگابایت، هزینه به چند میلیون دلار خواهد رسید که پول بسیار زیادی است.

مقاله‌های مرتبط:

پارک به ارز تکنیکا اعلام کرد که شرکت کاتالوگ با بازاندیشی درمورد فرایند رمزگذاری برای عبور از این مانع راه‌اندازی شد. فرایند رمزگذاری این شرکت با کتابخانه‌ای از ده‌ها تا صدها قطعه کوتاه از دی‌ان‌ای به نام اولیگو (مخفف اولیگونوکلئوتید) شروع می‌شود. سپس هر بیت از داده‌ها به ترکیب منحصربه‌فردی از اولیگوها اختصاص داده می‌شود. می‌توانید این فرایند را مانند پردازنده سیلیکونی درنظر بگیرید که ۱ بیت را در حافظه به ۱ آدرس منحصربه‌فرد ۶۴ بیتی اختصاص می‌دهد.

اگر آن بیت ۱ باشد، ربات می‌تواند نمونه‌های کوچکی از محلول‌های حاوی هریک از اولیگوها را که برای نشان دادن آن مورد نیاز است جمع‌آوری کند و آن‌ها را با آنزیمی ترکیب کند که بتواند تمام اولیگوها را به هم متصل کند. آنزیم مذکور اولیگوها را به شکل ۱ مولکول منفرد دی‌ان‌ای و طولانی‌تر در کنار هم قرار می‌دهد که حاوی ترکیب منحصر‌به‌فرد آن ۱ بیت است. درمقابل، اگر بیت صفر باشد، دی‌ان‌ای متناظر آدرس آن ساخته نمی‌شود.

سپس تمام مولکول‌هایی که تولید می‌شود را می‌توان در ۱ محلول واحد با هم ترکیب کرد (که می‌توان برای نگه‌داری طولانی‌مدت آن را خشک کرد). به‌منظور خواندن آن داده‌ها، جمعیت مولکول‌های دی‌ان‌ای توالی‌یابی می‌شود و ۱ الگوریتم ترکیب منحصربه‌فرد اولیگوهای حاضر در هر مولکول را تشخیص می‌دهد. به آدرس‌های تشخیص داده‌شده ۱ اختصاص داده می‌شود و بقیه ۰ می‌گیرند. این امر داده‌های رمزگذاری‌شده را به شکل دیجیتال بازیابی می‌کند.

این سیستم نسبت‌ به ذخیره‌سازی ۲ بیت در هر باز، ازنظر داده به ازای دی‌ان‌ای کارآیی کمتری دارد. اما مولکول‌های انفرادی به اندازه کافی کوچک باقی می‌مانند که همچنان محیط ذخیره‌سازی پایدار و فشرده‌ای باشد. این سیستم به دلیل عدم تقارن، به‌طور قابل‌توجهی در زمان و هزینه قابل‌توجهی صرفه‌جویی می‌کند: سنتز تعداد زیادی از ۱ توالی خاص دی‌ان‌ای نسبت‌ به سنتز مقادیر کمی از تعداد زیادی توالی مختلف دی‌ان‌ای ارزان‌تر است.

بنابراین، با مونتاژ دی‌ان‌ای با استفاده از مقادیر اندکی از حجم بالای دی‌ان‌ای از پیش ساخته‌شده، هزینه سنتز به‌طور چشمگیری کاهش پیدا می‌کند. هر واکنش مونتاژ می‌تواند به صورت موازی نیز اجرا شود. درمقابل، در روش سنتز توالی‌ها به صورت انفرادی، دستگاه تا زمان کامل شدن سنتز درگیر است و نمی‌تواند به‌طور هم‌زمان کار دیگری انجام دهد.

پارک گفت، در جدیدترین طرح این مفهوم، شرکت کاتالوگ براساس فناوری جوهرافشان دستگاهی را ساخته است. دستگاه مذکور شانون نام‌گذاری شده که برگرفته از نام کلاد شانون نظریه‌پرداز اطلاعات است. هر جت (فشانه) می‌تواند ۱ اولیگو را درون قطره‌ای روی صفحه پیوسته‌ای از ۱ فیلم چاپ کند. اولیگوهای مختلف در ۱ نقطه واکنش فرود می‌آیند و ۱ قطره آنزیم نیز به آن اضافه می‌شود. سپس فیلم درون انکوباتور قرار می‌گیرد و آنزیم آن‌ها را در قالب ۱ مولکول‌ دی‌ان‌ای مونتاژ می‌کند. وقتی واکنش‌ها کامل شد، قطرات می‌توانند با هم در ۱ محلول واحد قرار گیرند که حاوی کل داده‌های رمزگذاری شده است.

بخشی از مشارکت کاتالوگ با سیگیت شامل بررسی این موضوع است که آیا برخی از سخت‌افزارهای کار با مایعات که این شرکت‌ هارد درایو آن را توسعه داده، می‌توانند به کوچک‌شدن و خودکار‌شدن بیشتر این فرایند کمک کنند و استفاده از انرژی و منابع را کاهش دهند (پارک می‌گوید اندازه شانون درحد ۱ آشپزخانه معمولی است).

خروجی شانون برای بایگانی تنظیم شده است، اما این شرکت متوجه شده است که مشتریان بالقوه کمتر از انتظار آن‌ها، به آرشیوسازی علاقه‌مند می باشند. پارک می‌گوید: «ما با شرکت‌هایی مانند سیگیت، سایر شرکت‌های صنعت سرگرمی، گاز یا فناوری صحبت کرده‌ایم که شرکت‌هایی می باشند که مشکلات و چالش‌های بزرگی در زمینه داده‌ها می دارند و دیدیم که تنها جنبه ذخیره‌سازی سرد این کار نیست که برای آن‌ها جالب است.»

درعوض، پارک دریافت که مردم مجذوب این چشم‌انداز شده‌اند که دی‌ان‌ای می‌تواند عملیات موازی گسترده‌ای را روی داده‌های ذخیره‌شده بدون نیاز به تبدیل آن‌ها به اشکال دیجیتالی ممکن سازد. پارک می‌گوید: «می‌خواهیم سطح جدیدی از ذخیره‌سازی محاسباتی را ایجاد نماییم که از حجم عظیمی از داده‌ها حمایت کند اما درعین‌حال بسیار جست‌وجوپذیر و محاسبه‌پذیر باشد.»

به‌گفته‌ی پارک، این شیوه رمزگذاری می‌تواند مزیتی برای برخی از عملیات مبتنی‌بر دی‌ان‌دی فراهم کند، تا حدی به این علت که از قبل درمورد ساختار داده‌ها می‌دانیم. این مورد با طرح‌های رمزگذاری که در آن‌ها توالی بازها براساس داده‌های ذخیره‌شده متفاوت است، امکان‌پذیر نیست.

به‌طور مشابه، نبود توالی‌های خاص در این الگوی رمزگذاری می‌تواند مفید باشد. با‌این‌حال، در این مرحله پارک و کاتالوگ هنوز درحال بررسی نحوه به کارگیری برخی از این ایده‌ها می باشند. برخی از مزیت محاسباتی ممکن است دورتر باشند، زیرا برخی از مزیت‌ها تنها در مقیاس‌های بسیار بزرگ به دست می‌آیند.

ذخیره‌سازی مبتنی‌بر دی‌ان‌دی درنهایت از راه خواهد رسید، زیرا بهتر می‌تواند محاسبات موازی عظیم را مدیریت کند. پارک گفت، اگر برای مثال می‌خواهید روی مگابایت داده ذخیره‌شده در دی‌ان‌ای محاسبه انجام دهید، زمان یا منبع موردنیاز انجام این کار، مثلاً با زمان موردنیاز برای انجام محاسبه روی ۱ پتابایت (هر پتابایت برابر ۱۰۰۰ ترابایت است) داده ذخیره‌شده درون دی‌ان‌ای مشابه است.

درحالی‌که استارتاپی مانند کاتالوگ به‌طور آشکارا روی شرکت‌های سودآوری متمرکز است که با مجموعه‌های عظیم داده سروکار می دارند، ممکن است برخی از اولین کاربردها از جامعه دانشگاهی ظاهر شود.

پارک به حجم عظمی داده‌های تولیدشده بوسیله برخورددهنده هادرونی بزرگ به‌عنوان ۱ هدف احتمالی اشاره می‌کند و می‌گوید شرکت کاتالوگ برای چارچوب توسعه فناوری Open Labs که بوسیله سازمان اروپایی پژوهش‌های هسته‌ای اجرا می‌شود، قرارداد امضا کرده است. پارک می‌گوید: «فکر می‌کنم دی‌ان‌ای راهی عالی برای ذخیره‌سازی حجم عظیمی از داده‌ها باشد. وقتی تئوری جدیدی ارائه می‌شود، می‌خواهید بتوانید تمام آزمایش‌های قبلی را به شکل کارآمد جست‌وجو و بررسی کنید. درحال‌حاضر راهی برای انجام این کار وجود ندارد. فکر می‌کنم ۱ سیستم مبتنی‌بر دی‌ان‌ای راه‌حل عالی برای این مسئله باشد.»

منبع خبر ( ) است و دیتانیوز در قبال محتوای آن هیچ مسئولیتی ندارد. چنانچه محتوا را شایسته تذکر میدانید، اطلاع دهید.
به اشتراک بگذارید:
لینک کوتاه خبر: https://datanews.ir/?n=1140121
ما را در شبکه های اجتماعی و پیام رسان ها دنبال کنید
آخرین اخبار : فناوری و ارتباطات
اکسی‌توسین یا هورمون عشق به التیام قلب شکسته کمک می‌کند
۱۴۰۱/۰۷/۱۳-۰۱:۰۴

اکسی‌توسین که گاهی اوقات «هورمون عشق» نامیده می‌شود، ممکن است به بهبود قلب‌های شکسته کمک کند. در مطالعه‌ی جدیدی که روی گورخرماهی و سلول‌های انسانی انجام شد، دانشمندان دریافتند این هورمون که...

ارسال توسط : زومیت
پایان ماه‌ها تنش؛ توییتر با پیشنهاد تازه ایلان ماسک موافقت کرد
۱۴۰۱/۰۷/۱۳-۰۱:۰۴

درحالی‌که تنها چند هفته تا برگزاری جلسه‌ی پنج‌روزه‌ی دادگاه باقی مانده، به‌نظر می‌رسد که ایلان ماسک و توییتر رسما به توافق رسیده‌اند. ماسک ساعاتی پیش در نامه‌ای به مدیران توییتر اعلام کرد که قصد...

ارسال توسط : زومیت
فسیل‌های ماهی باستانی عجیب‌بودن اجداد مهره‌دار ما را آشکار کنند
۱۴۰۱/۰۷/۱۲-۲۳:۳۲

گنجینه‌ی جدیدی از فسیل‌های ماهی‌های باستانی در جنوب چین پیدا شده است که دریچه‌‌ی تازه‌ای رو به تاریخ اولیه‌ی مهره‌داران آرواره‌دار می‌گشاید. این گروه دربرگیرنده‌ی ۹۹ درصد از کل مهره‌داران روی زمین...

ارسال توسط : زومیت
هشدار: انتشار نسخه جعلی مرورگر تور برای شناسایی هویت کاربران در فضای آنلاین
۱۴۰۱/۰۷/۱۲-۲۳:۳۲

پژوهشگران مؤسسه‌ی امنیتی کسپرسکی بدافزاری را پیدا کرده‌اند که در نسخه‌ی اصلاح‌شده‌ی مرورگر تور (Tor) پنهان شده است. این مرورگر در حالت عادی، ناشناس‌ماندن کاربران در فضای مجازی را تضمین می‌کند؛ اما...

ارسال توسط : زومیت
توییتر بالاخره قابلیت ویرایش توییت‌ها را در اختیار کاربران سرویس بلو قرار داد
۱۴۰۱/۰۷/۱۲-۲۳:۰۸

کاربران توییتر سال‌هاست که خواستار اضافه شدن قابلیت ویرایش توییت به این شبکه اجتماعی می باشند. حالا سرانجام اعلام شده که مشترکان سرویس توییتر بلو در کانادا، استرالیا و نیوزلند می‌توانند به این...

ارسال توسط : انتخاب