بیوانفورماتیک :پایگاه داده ها، نرم افزارها و ابزارهایی با کاربردها

بیوانفورماتیک یک رشته به سرعت در حال رشد در زیست شناسی است که بر توسعه و کاربرد ابزارهای محاسباتی برای تجزیه و تحلیل و تفسیر داده های بیولوژیکی تمرکز دارد. نرم افزار، ابزار و پایگاه های بیوانفورماتیک برای پردازش، ذخیره، تجزیه و تحلیل و تفسیر داده های بیولوژیکی استفاده می شود.

افزایش حجم داده های بیولوژیکی نیاز به توسعه ابزارهای محاسباتی برای مدیریت و تجزیه و تحلیل داده ها را ایجاد کرد که منجر به ایجاد رشته جدیدی به نام بیوانفورماتیک شد.

بیوانفورماتیک

تعداد زیادی از ابزارهای بیوانفورماتیک در حال حاضر در دسترس هستند که هر کدام برای رفع نیاز خاصی در تحقیقات بیولوژیکی طراحی شده اند. ابزارهای بیوانفورماتیک از نظر پیچیدگی و قالب متفاوت هستند، از ابزارهای خط فرمان ساده گرفته تا برنامه های گرافیکی پیچیده و خدمات وب مستقل که از سازمان های مختلف بیوانفورماتیک یا مؤسسات عمومی قابل دسترسی هستند.

پایگاه های بیولوژیکی

پایگاه های بیولوژیکی آرشیو داده های بیولوژیکی، شامل توالی های ژنتیکی و پروتئینی، حاشیه نویسی ها، مسیرها و اطلاعات بیماری ها هستند. این پایگاه داده ها برای ذخیره و سازماندهی داده ها به گونه ای استفاده می شود که امکان بازیابی آسان اطلاعات را فراهم می کند.

انواع پایگاه های بیولوژیکی

Biological databases را می توان بر اساس محتوای آنها به سه نوع زیر طبقه بندی کرد:

پایگاه های داده اولیه

پایگاه داده های اولیه مجموعه ای از داده های بیولوژیکی پردازش نشده هستند که از توالی های خام یا اطلاعات ساختاری تشکیل شده اند. این پایگاه های اطلاعاتی مخازن اطلاعات اصلی هستند و به هیچ وجه اصلاح نمی شوند. نمونه هایی از Primary databases عبارتند از GenBank، PDB و DDBJ.

پایگاه های داده ثانویه

پایگاه های داده ثانویه حاوی اطلاعاتی هستند که با استفاده از روش های محاسباتی یا دستی پردازش یا مدیریت شده اند. اطلاعات موجود در این پایگاه ها بر اساس داده های اصلی از Primary databases است. نمونه هایی از پایگاه های داده ثانویه عبارتند از PIR، SWISS-PROT و Pfam.

پایگاه های تخصصی

پایگاه های اطلاعاتی تخصصی پایگاه هایی هستند که برای خدمت به یک علاقه خاص تحقیقاتی طراحی شده اند. این پایگاه‌های اطلاعاتی با تمرکز خاصی بر روی یک ارگانیسم خاص یا نوع داده ایجاد می‌شوند. نمونه هایی از پایگاه های داده تخصصی شامل Flybase، پایگاه داده توالی HIV و پروژه پایگاه داده ریبوزومی است.

برخی از محبوب ترین پایگاه های بیولوژیکی در زیر مورد بحث قرار می گیرند:

  • GenBank

GenBank مجموعه ای جامع و مشروح از داده های توالی اسید نوکلئیک است که توسط مرکز ملی اطلاعات بیوتکنولوژی (NCBI) توسعه یافته است. این شامل داده هایی برای تقریباً همه انواع موجودات است.

  • EMBL

EMBL (آزمایشگاه بیولوژی مولکولی اروپایی) یک پایگاه داده توالی نوکلئوتیدی است که توسط موسسه بیوانفورماتیک اروپایی (EBI) مدیریت می شود. این یک مخزن گسترده از توالی های نوکلئوتیدی اولیه است که داده های مربوط به DNA و RNA، بیان ژن، پروتئین، ساختار، مسیرها و ادبیات را ذخیره می کند.

  • DDBJ

DDBJ (بانک داده های DNA ژاپن) یک پایگاه داده توالی نوکلئوتیدی است که داده های توالی نوکلئوتیدی را از محققان جمع آوری و نگهداری می کند. این توسط موسسه ملی ژنتیک در ژاپن، با همکاری مرکز ملی اطلاعات بیوتکنولوژی (NCBI) و آزمایشگاه بیولوژی مولکولی اروپا (EMBL) اداره می شود.

  • PDB

PDB (بانک داده پروتئین) یک پایگاه داده بیولوژیکی است که حاوی داده های ساختاری ماکرومولکول های بیولوژیکی است. PDB داده‌های ساختاری سه‌بعدی مولکول‌های بیولوژیکی بزرگ مانند پروتئین‌ها، DNA و RNA را که با روش‌های تجربی مانند کریستالوگرافی اشعه ایکس و طیف‌سنجی NMR تعیین می‌شوند، ذخیره می‌کند.

  • PIR

PIR (منبع اطلاعات پروتئین) یک پایگاه داده در دسترس عموم از بیوانفورماتیک پروتئین است. PIR دارای سه پایگاه داده دیگر است: پایگاه داده توالی پروتئین (PSD)، پایگاه داده مرجع غیر زائد (NREF) و پایگاه داده طبقه بندی پروتئین یکپارچه (iProClass).

  • PROSITE

PROSITE یک پایگاه داده پروتئین است که شامل مجموعه بزرگی از الگوها یا پروفایل های پروتئین است. این الگوها با اسنادی مرتبط هستند که اطلاعات بیولوژیکی مفیدی را در مورد خانواده پروتئین، دامنه یا سایت عملکردی ارائه می‌دهند.

  • Pfam

Pfam یک پایگاه داده از خانواده‌ها و دامنه‌های پروتئینی است که با هم‌ترازی‌های توالی متعدد، مدل‌های مارکوف پنهان (HMM) و حاشیه‌نویسی نشان داده می‌شوند. پایگاه داده به صورت آنلاین قابل دسترسی است و توسط محققان در سراسر جهان برای کاربردهای مختلف، از جمله حاشیه نویسی ژنوم، طبقه بندی پروتئین و پیش بینی ساختار پروتئین استفاده می شود.

  • KEGG

Kyoto Encyclopedia of Genes and Genomes یک پایگاه داده بیولوژیکی است که حاوی اطلاعات عملکردی ژنومی، شیمیایی و سیستمیک است که برای مطالعه اطلاعات سطح مولکولی در مورد فرآیندهای سلولی مختلف از جمله متابولیسم، سیگنالینگ و بیماری ها استفاده می شود.

  • OMIM

وراثت آنلاین مندلی در انسان (OMIM) یک پایگاه داده رایگان در دسترس از ژن‌های انسانی و اختلالات ژنتیکی است که شامل مروری دقیق و ارجاعی از همه اختلالات ژنتیکی شناخته شده مندلی و بیش از 16000 ژن است.

اهمیت پایگاه داده های بیولوژیکی

  • پایگاه داده های بیولوژیکی امکان سازماندهی حجم وسیعی از داده های بیولوژیکی را به شیوه ای ساختار یافته فراهم می کند.
  • Biological databases منابع مهمی برای محققان هستند که می توانند در تحقیقات آنها کمک کنند.
  • پایگاه‌های اطلاعاتی بیولوژیکی را می‌توان برای توسعه ابزارها و روش‌های جدید بیوانفورماتیک برای هدایت تحقیقات بیشتر مورد استفاده قرار داد.
  • Biological databases همچنین امکان همکاری بین محققان را فراهم می کند و به اشتراک گذاری داده ها و منابع را تسهیل می کند.

ابزارهای بیوانفورماتیک

بیوانفورماتیک ، همراه با ساخت و مدیریت پایگاه‌های اطلاعاتی بیولوژیکی، شامل توسعه ابزارهای محاسباتی برای تحلیل توالی، ساختار و عملکرد است.

ابزارهای بیوانفورماتیک برنامه های نرم افزاری کاربر پسندی هستند که به محققان امکان تجزیه و تحلیل داده های بیولوژیکی را می دهند.

انواع ابزار بیوانفورماتیک

ابزارهای بیوانفورماتیک را می توان بر اساس عملکرد، هدف و پیچیدگی به دسته های مختلفی طبقه بندی کرد. برخی از ابزارهای پرکاربرد عبارتند از:

ابزارهای تحلیل توالی

از این ابزارها برای آنالیز توالی نوکلئوتیدی یا پروتئینی استفاده می شود. آنها همچنین برای شناسایی توالی های همولوگ و درک روابط تکاملی بین موجودات مختلف استفاده می شوند. آنها شامل ابزارهای مورد استفاده برای هم ترازی توالی، جستجوی پایگاه داده توالی، کشف موتیف، فیلوژنی، و مونتاژ و مقایسه ژنوم هستند. برخی از ابزارهای رایج تجزیه و تحلیل توالی عبارتند از:

  • BLAST

BLAST (ابزار جستجوی ترازهای محلی پایه) یک ابزار جستجوی تشابه توالی پرکاربرد است که توالی های پرس و جو را با پایگاه داده ای از توالی های شناخته شده مقایسه می کند. می تواند توالی های مشابه را شناسایی کند، روابط تکاملی را استنباط کند، و حوزه های عملکردی بالقوه را در یک دنباله شناسایی کند.

  • ClustalW

ClustalW یک برنامه هم ترازی چند توالی برای توالی های DNA و پروتئین است.

  • T-Coffee

T-Coffee یکی دیگر از ابزارهای تراز چند سکانسی پرکاربرد است که از ترکیبی از الگوریتم‌های تراز پیش رونده و مبتنی بر سازگاری برای ایجاد ترازهای دقیق استفاده می‌کند. این به ویژه برای تراز کردن توالی های مرتبط با فاصله دور مفید است.

  • MEME

Multiple EM for Motif Elicitation برای کشف و جستجوی موتیف استفاده می شود. MEME Suite یک ابزار نرم افزاری است که چهار نوع تحلیل موتیف را انجام می دهد: کشف موتیف، جستجوی پایگاه داده موتیف-موتیف، جستجوی پایگاه داده موتیف-توالی و تخصیص عملکرد.

  • MEGA

Molecular Evolutionary Genetics Analysis یک نرم افزار کاربرپسند است که ابزارهای زیادی را برای تجزیه و تحلیل فیلوژنتیک، از جمله هم ترازی چند توالی، انتخاب مدل و استنتاج درخت ارائه می دهد.

  • PHYLIP

Phylogeny Inference Package مجموعه ای از نرم افزارهای کاربردی است که برای تعیین روابط تکاملی بین گونه ها استفاده می شود.

ابزارهای تجزیه و تحلیل ساختار

  • CN3D

یک بسته نرم افزاری است که برای مشاهده و تجزیه و تحلیل ساختارهای سه بعدی ماکرومولکول ها از جمله اسیدهای نوکلئیک و پروتئین ها استفاده می شود. ابزارهایی برای تجسم و دستکاری ساختار سه بعدی ماکرومولکول ها فراهم می کند.

  • PyMOL

یک ابزار تجسم مولکولی است که برای تجسم ساختار مولکولی سه بعدی، تجزیه و تحلیل و انیمیشن استفاده می شود. این می تواند مولکول ها را به روش های مختلف، از جمله به عنوان مدل های توپ و چوب، کارتون، یا نمایش سطح نمایش دهد.

  • RasMol

یک برنامه گرافیکی مولکولی است که برای تجسم و نمایش پروتئین ها، اسیدهای نوکلئیک و مولکول های کوچک در قالب گرافیکی طراحی شده است.

  • ODELLER

یک ابزار مدل‌سازی ساختار پروتئین مقایسه‌ای است که برای پیش‌بینی ساختارهای پروتئینی از طریق مقایسه آنها با یک ساختار پروتئینی شناخته شده استفاده می‌شود.

ابزارهای تحلیل عملکرد

این ابزارها برای درک عملکردها و روابط بین ژن ها و پروتئین های مختلف و برای شناسایی مسیرهای کلیدی درگیر در بیماری ها ضروری هستند. آنها شامل ابزارهایی هستند که برای پروفایل بیان ژن، پیش‌بینی تعامل پروتئین-پروتئین، پیش‌بینی محلی‌سازی درون سلولی پروتئین، و مدل‌سازی مسیرهای متابولیک استفاده می‌شوند.

  • GEO

Gene Expression Omnibus یک مخزن عمومی از داده های بیان ژن است که ابزارهایی را برای جستجو، دانلود و تجزیه و تحلیل مجموعه داده های بیان ژن فراهم می کند.

  • InterProScan

پکیچ نرم افزاری است که توالی های پروتئین را در برابر پایگاه های داده متعدد دامنه ها و خانواده های پروتئین اسکن می کند.

  • COBRA Toolbox

یک بسته نرم افزاری برای مدل سازی متابولیک مبتنی بر محدودیت است که مجموعه ای از ابزارها را برای شبیه سازی و تجزیه و تحلیل شبکه های متابولیک ارائه می دهد.

  • Pathway Tools

یک بسته نرم افزاری برای ساخت و تجزیه و تحلیل مدل های مسیر متابولیک است که شامل پایگاه داده ای از مسیرهای متابولیک انتخاب شده و ابزارهایی برای مهندسی متابولیک است.

کاربرد ابزارهای بیوانفورماتیک

ابزارهای بیوانفورماتیک کاربردهای متعددی دارند، از جمله:

  • تجزیه و تحلیل توالی و ابزار تجزیه و تحلیل فیلوژنتیک برای درک روابط تکاملی و شباهت های بین توالی ها استفاده می شود.
  • ابزارهای تجزیه و تحلیل ساختار و عملکرد برای حاشیه نویسی و شناسایی ژن ها و پروتئین های جدید و همچنین برای پیش بینی عملکرد آنها استفاده می شود.
  • ابزارهای آنالیز توالی پروتئین نیز برای پیش بینی ساختار سه بعدی پروتئین ها استفاده می شود.
  • ابزارهای تحلیل عملکردی نیز برای شناسایی و درک مسیرهای متابولیک مختلف استفاده می شود.
  • آنها همچنین ابزارهایی هستند که برای شناسایی اهداف دارویی بالقوه و طراحی داروهای جدید استفاده می شوند.

درحال حاضر مجموعه کیمیا زیست گستر نوین قادر به ارائه انواع مواد اولیه با گریدهای غذایی، دارویی، آرایشی، بهداشتی و صنعتی در حجم های بالا و کیفیت عالی از تولید کننده های معتبر می باشد. درصورت نیاز می توانید درخواست خود را با ما درمیان گذاشته تا در سریعترین زمان ممکن اطلاعات لازم را در اختیارتان قرار دهیم.