در این مقاله سعی کردهایم تا کاربرد رایانش ابری در ژنتیک و بررسی توالی LncRNA، که بخشی از ژنوم پستانداران است را شرح دهیم.
به همین دلیل به سراغ همکاری آزمایشگاه Caltech Guttman با شرکت رایانش ابری آمازون وب سرویس (AWS) رفتهایم.
آزمایشگاه گاتمن در موسسه فناوری کالیفرنیا (Caltech) واقع شده است و توسط دانشمند برجستهای به نام دکتر میچ گاتمن رهبری میگردد.
این آزمایشگاه زیستشناسی، در واقع یک مرکز تحقیقاتی است که به مطالعه دسته جدیدی از ژنها به نام lncRNA میپردازد.
توالی یابی ژنوم، بیوشیمی، زیستشناسی مولکولی، زیستشناسی سلولی، زیستشناسی محاسباتی و رایانش ابری از جمله ابزارآلات این تیم تحقیقاتی هستند.
گاتمن و تیمش به دنبال پاسخ این سوالند که چگونه lncRNA، مولکولهای پروتئین و DNA را در سلول سازماندهی میکند تا برنامههای دقیق بیان ژن را کنترل کنند.
RNA بلند غیر کدکننده یا lncRNA چیست؟
مشاهدات جدید نشاندهنده وجود درصد بالایی از RNA بلند غیر کدکننده پروتئین یا lncRNA در ژنوم انسان است.
lncRNA شکل مخفف عبارت long non-coding RNAs میباشد که بخش عمدهای از فرآوردههای بیان ژن در توالیهای ریبونوکلئوتیدی را تشکیل میدهند.
این توالیها شامل مولکولهای RNA بلند با طول بیش از 200 نوکلئوتید میباشند.
مطالعات اخیر نشاندهنده نقش مهم این توالیها در ایجاد بیماریهایی نظیر سرطان، بیماریهای قلبی و عروقی، مالتیپل اسکلروزیس و …است.
چالش پیش از مهاجرت به فضای ابری
دکتر گاتمن در سال 2013 به Caltech پیوست و اولین درخواست وی یک خوشه محاسبات سنگین (HPC) الاستیک و انعطافپذیر بود. وی در اینباره میگوید:
«وقتی به خوشهای برای آزمایشگاه خود فکر میکردیم، میدانستیم که باید از تقاضاهای نوسانی محاسباتی ما پشتیبانی کند. گاهی اوقات ما به 1000 گره محاسباتی نیاز داریم، و گاهی اوقات فقط 10 گره لازم است.
وی در ادامه افزود که این تقاضاهای نوسانی، با میزان در دسترس بودن دادهها و اینکه در چه مرحلهای از یک پروژه تحقیقاتی قرار دارند، رابطه مستقیم دارد.
همچنین اگر چندین پروژه به صورت همزمان و همگرا با یکدیگر اجرا شوند، میزان نیاز به منابع محاسبات سنگین را بهشدت افزایش میدهند.
درخواست گاتمن با سیاستهای Caltech همخوانی نداشت. زیرا آنها نمیخواستند برای پشتیبانی از نیازهایشان، خوشهای در محل خود بسازند.
ایجاد خوشهای از سرورهای خانگی یا اصطلاحا On premise در کالیفرنیای آمریکا بسیار هزینه بردار است و مدیران Caltech بهخوبی از این قیمتها مطلع بوند.
جان لیلی، مدیر ارشد، سیستمها و خدمات مدیریت اطلاعات در Caltech، این مشکل را اینگونه شرح میدهد:
کالیفرنیا، یکی از بالاترین قیمتها را در زمینه املاک و برق کشور دارد. بنابراین نگران هزینه ایجاد خوشه خانگی در اینجا بودیم. ما همچنین نمیخواستیم وقت خود را صرف مدیریت و نگهداری خوشه کنیم.
بنابراین علاوه بر گران بودن قیمت برق و املاک در کالیفرنیا، نگرانی دیگر Caltech، وقت و هزینه مورد نیاز برای مدیریت و نگهداری از سرورها بود.
از طرفی گاتمن و تیمش قدرتی میخواستند که به راحتی اعتبار دسترسی خوشهای را مدیریت کنند. جان لیلی در این باره میگوید:
ما میخواستیم بتوانیم حسابهای کاربری خوشهای را از یک مکان مرکزی فعال و غیرفعال کنیم، بدون اینکه نگران باشیم اعتبار هر یک از دستگاهها را از دست بدهیم.
چرا رایانش ابری؟
رایانش ابری تنها راهحلی بود که نیاز به ایجاد یک خوشه محاسبات سنگین خانگی نداشت.
در نتیجه هزینههای مربوط به املاک، برق، خرید و تعمیر سرورها نیز از روی دوش آزمایشگاه برداشته میشد.
زیرا رایانش ابری امکان استفاده از منابع مجازی یک دیتاسنتر خارجی را فراهم میکند.
از طرفی سرورهای ابری دارای کشش و انعطافپذیری موردنظر گاتمن هستند. همچنین صرفهجویی در هزینهها را با روش پرداخت به میزان مصرف به دنبال دارند.
در حال حاضر آزمایشگاه گاتمن از یک خوشه HPC که شامل سرورهای متصل به یک ابر خصوصی مجازی میباشد، استفاده مینماید.
ایا ابر خصوصی یک محیط ایزوله و ایمن از سایر سرورهای ابری را در اختیار گاتمن قرار داده است.
مزایای استفاده از رایانش ابری
با کمک رایانش ابری، آزمایشگاه گاتمن اکنون قابلیت کشسانی برای مدیریت نوسان تقاضاهای محاسباتی خود را دارد. لیلی میگوید:
ما برای مدیریت استفاده از محاسبات خود مجبور نبودیم خوشه فیزیکی خود را بسازیم، زیرا AWS به طور خودکار برای ما مقیاس میشود.
گاتمن نیز از فضای محاسباتی بزرگ و کشسانی که در اختیار دارد بسیار راضی است و درباره عدم نیاز به اولویتبندی پروژهها میافزاید:
ما دیگر نیازی به صرف زمان برای اولویتبندی پروژهها از قبل نداریم. میدانیم که بدون نیاز به تجدید هر چند سال یک بار، قدرت محاسباتی کافی خواهیم داشت.
همچنین چابکی رایانش ابری باعث شده است که تیم گاتمن قادر به توسعه و آزمایش روشهای جدید تحقیقاتی باشد.
افزایش آنی میزان منابع مورد نیاز، بدون صرف هزینه و انرژی و تنها با یک کلیک، از دیگر مهمترین مزایای ابری است. لیلی در اینباره میگوید:
ما اخیراً نیاز داشتیم که سیستم GlusterFS خود را از 5 ترابایت به 24 ترابایت گسترش دهیم و توانستیم بدون خرید سختافزار جدید این کار را انجام دهیم. ما به سادگی سرورهای بیشتری را اضافه کردیم و فضای ذخیرهسازی ابری را افزایش دادیم و این فقط یک ساعت طول کشید. قبلاً هفتهها طول میکشید تا این کار انجام شود، زیرا بحثهایی درباره قیمتهای خرید سختافزار وجود داشت و سپس باید تهیه، نصب و آزمایش را انجام میدادیم.
علاوه بر این، محققان در آزمایشگاه می توانند داده های lncRNA را با استفاده از ابر AWS سریعتر تجزیه و تحلیل کنند. گاتمن افزود:
تحلیل lncRNA نیاز به پردازش محاسباتی و یکپارچه سازی زیادی دارد. اما با استفاده از ابر، میتوانیم به سرعت 1000 یا بیشتر گره را محاسبه کنیم. این چارچوب زمانی ما را برای تجزیه و تحلیل توالی ژنومی از هفتهها به روزها تغییر میدهد. ما با ظرفیت محدودی که قبلا داشتیم نمیتوانستیم این کار را انجام دهیم.
سرویس های ابری ابر فردوسی
شرکت ابر فردوسی ارائه دهنده سرویسهای ابری متنوع با بهترین قیمت و کیفیت است. از جمله این سرویسها میتوان به:
- سرور ابری
- سرور محاسبات سنگین
- سرور گرافیکی
- سرور ژوپیتر لب
- سرور اختصاصی و…
اشاره کرد. به عنوان مثال میتوانید از محاسبات سنگین این شرکت، برای کاربردهای مشابه در این مقاله بهره برد. جهت آشنایی و یا استفاده کلیک نمایید: