پژوهش – ارائه ی یک مدل داده مناسب برای کشف انتقال بیماری های ژنتیکی۹۳- …

پایان نامه های ارشد سری هفتم

پژوهش – ارائه ی یک مدل داده مناسب برای کشف انتقال بیماری های ژنتیکی۹۳- …

مسئله مهم دیگر این است که با توجه به نیاز به ژنتیک اعضای خانواده و نسلهای قبل بیمار باید توانایی افزودن موجودیتها(نسل های قبل و بعد)ی جدید را در حین انجام تحقیقات به این پایگاهداده داشته باشیم. در مورد انتقال بیماریها تشخیص مسیر انتقال بیماری اهمیت ویژهای دارد زیرا باید مشخص شود که بیماری از پدر یا مادر، در مرحله بعد از کدام یک از اجداد به ارث رسیده و همینطور تشخیص داده شود که این بیماری ممکن است به کدام یک از فرزندان دختر یا پسر به ارث برسد. به این دلیل باید پایگاهدادهای طراحی کنیم که قابلیت استخراج روابط بین موجودیتها را دارا باشد. البته روابط بین موجودیتها در پایگاهدادههای رابطهای نیز قابل استخراج است اما اولا به دلیل نیاز به نوشتن رویههای تودرتو امر بسیار پیچیده و زمان بر است ثانیا در مدلداده گراف میتوانیم بر روی یالها نیز خصوصیاتی را برای ارتباط موجودیتها تعریف کنیم. با توجه به این سه مسئله به این نتیجه میرسیم پایگاهداده گرافی بهترین انتخاب برای این نوع بیماری ها است.
در این پایاننامه با استفاده از مدلداده گراف پایگاهدادهای را طراحی خواهیم کرد که توانایی ذخیره انواع و حجمهای مختلف داده را دارا باشد. پایگاهدادهطراحی شده باید قابلیت انجام عملیات برروی این داده های ذخیره شده را داشته باشد و بتواند نتایج مورد نظر در بررسی انتقال بیماریهای ژنتیکی را ازآن استخراج کند. نتایجی مانند مسیر انتقال بیماری،امکان انتقال بیماری به نسل بعد یا امکان انتقال بیماری به جنسیت خاصی از نسل بعد، درصد انتقال بیماری و …
در این پایـگاهداده موجودیتها که همان افراد هستند درون گرهها ذخیره میشوند، در گرهها علاوه
بر مشخصات عمومی بیماران تمام اطلاعات مربوط به بیــماری افراد، شرایط و علائم بیماران نیز ذخیره
میشوند. در سطوح بعدی گراف، نسلهای بالاتر بیماران همراه با اطلاعات مربوط به بیماری مخصوصی
که در حال تحقیق در مورد آن هستند ذخیره خواهد شد. برای نمایش روابط بین افراد در این مدلداده از
یالها استفاده خواهیم کـــرد. به این صورت که اگر بیماری از شخصی به شخص دیگری انتقال یافت از
یال جهتدار برای نمایش این انتقال استفاده خواهیــم کرد. علاوه بر اینها میتـــوانیم بر روی یالهـــا
توضیحاتی را نیز اضافه نمائیم. توضیحاتی مانند درصد احتمال انتقال یک بیماری خاص از یک فرد بهفرد
دیگر.
۱-۳-اهمیت و ضرورت انجام تحقیق
تا کنون از چند مدلداده برای ذخیره اطلاعات پزشکی استفاده شده است اما هر یک از این مدلداده ها دارای معایبی هستند که باعث میشوند مدلدادهی ایدهآلی نباشند. یکی از این مدلدادهها مدلداده ی رابطهای میباشد.برخی از دادههایی که باید توسط پایگاهداده ذخیره و بررسی شود مانند نتایج رادیولوژی بیماران، نوار قلب و…به صورت تصویر هستند بنابراین پایگاهداده باید قادر به ذخیره دادههایی از قبیل تصویر باشد اما این مدلداده قادر به پشتیبانی از برخی از انواع داده نظیر صوت و تصویر نمیباشد. همچنین در این نوع پایگاهداده که برای تعریف دادهها باید شمای از پیش تعریف شده داشته باشیم، قادر به افزودن موجودیتهای جدید نمیباشیم و یافتن روابط بین افراد کار بسیار پیچیده و زمانبری می باشد.
مدلدادهی بعدی که مدلدادهی شی رابطهای میباشد با استفاده از طراحی EAVبه خوبی از عهده مشکل شمای از پیش تعیین شده و تعریف فرمت داده های مختلف بر میآید اما همچنان مشکل روابط بین افراد باقیست.
اما با استفاده از مدلداده گراف میتوانیم مدلدادهای را برای بیماری های ژنتیکی پیاده سازی کنیم که از فرمتهای مختلف داده و حجم داده ها در حوزهی بیماری های ژنتیکی پشتیبانی کند. این مدلداده میتواند به راحتی موجودیتهای جدید را اضافه کند و در حین کار اگر نیاز به افزودن صفات جدید برای موجودیتها داشتیم این کار به راحتی امکانپذیر میباشد. با این مدلداده روابط بین افراد به دلیل استفاده از یالها به راحتی قابل ارزیابی و نتیجهگیری میباشد.
۱-۴-جنبه جدید بودن و نوآوری در تحقیق
در این تحقیق با توجه به فرمت و حجم دادههای موجود در بررسی انتقال بیماریهای ژنتیکی و اهمیت بررسی روابط بین افراد در این نوع بیماری واین امر مهم که برای هر بیمار ممکن است نیاز به ذخیره دادههای خاصی داشته باشیم، بنابراین قادر به تعریف شمای از پیش تعیین شده نیستیم، همین طور نیاز به افزودن موجودیتهای جدید در حین انجام کار، پایگاهداده مناسبی طراحی میکنیم تا قادر به پشتیبانی از این مسائل باشد.
۱-۵-اهداف مشخص تحقیق
طراحی مدل داده ای جهت پشتیبانی از ذخیره و بررسی فرمتهای مختلف دادههای تولید شده در مسیر کشف انتقال بیماریهای ژنتیکی.
توانایی افزودن یک موجودیت جدید در هر زمان و هر مرحله مورد نیاز.
-توانایی افزودن یک صفت جدید برای هر موجودیت خاص در هر زمان و هر مرحله مورد نیاز.
۱-۶-مروری بر ساختار پایان نامه
در این پایان نامه مدل دادهای مناسب برای ذخیره دادههای مربوط به بیماری های ژنتیکی طراحی خواهیم نمود. در فصل اول پایان نامه به طور کلی در مورد موضوع و اهداف و دلیل این کار صحبت خواهیم نمود. در فصل دوم مفاهیم مورد نیاز برای آشنایی با موضوع مورد بحث مانند انواع پایگاه داده و بیماری ها و ذخیره داده های پزشکی را بیان خواهیم نمود.
در فصل سوم با کارهایی که در گذشته در این خصوص انجام شده است آشنا خواهیم شد و مشکلات و ضعف های این راه ها را بیان خواهیم نمود.در فصل چهارم پرس و جوهای مورد نیاز در مورد بیماری های ژنتیکی را بیان خواهیم نمود و مدل داده ای را طراحی خواهیم نمود تا از این نیاز ها پشتیبانی نماید.
فصل دوم: مفاهیم
۲-۱-مقدمه
برای ذخیره دادهها می توان از پایگاهداده و مدلدادههای مختلفی استفاده نمود.به طور کلیمدلدادهها به دو نوع مدلدادههای ساخت یافته و غیر ساخت یافته تقسیم میشوندو هر یک از این دو نوع دسته بندیهای مختلفی دارند و از دادههای مختلفی با ویژگیهای مختلف پشتیبانی میکنند که در خصوص انتخاب پایگاهداده باید به درستی تصمیم گرفته شود تا پایگاهداده به خوبی مدیریت دادهها را انجام دهد.
در این بخش با انواع مدلداده و مفهوم مدیریت دادهها آشنا میشویم. همچنین دادههای پزشکی را بررسی مینماییم و با توجه به خصوصیات دادههای پزشکی به نتیجهی مناسب در خصوص انتخاب پایگاهداده میرسیم.
۲-۲-مدل داده چیست؟
مدل کردن داده(data modeling)روشی است برای توصیف دادهها و عملیات روی آنها در پایگاه داده.به وسیله مدلداده ما میتوانیم نوع دادههای ذخیره شده درون پایگاهداده را مشخص کنیم. یعنی اینکه این پایگاهداده از چه نوع دادههایی پشتیبانی میکند زیرا تمام پایگاهدادهها از تمام انواع دادهها پشتیبانی نمیکنند به عنوان مثال پایگاهداده رابطهای نمیتواند دادههایی مانند صوت و تصویر را درون خود ذخیره و بازیابی کند،علاوه بر این با توجه به مدلداده حجم دادههایی که میتوانند درون پایگاه ذخیره شوند نیز مشخص میشود]۹[.
مدلداده مشخص میکند که بر روی دادههای ذخیره شده درون پایگاهداده چه عملیاتی را میتوانیم انجام دهیم.برای مثال در مدل رابطه‌ای عملیاتی همچون گزینش (selection)،طرح ریزی(projection) و اتصال (join)تعریف می‌‌گردد.علاوه براینمدلداده تعیین میکند یک پایگاهداده چگونه دادههای درون خود را به کاربران و برنامههای کاربردی نمایش دهد.
هر مدلداده باید از ۳ جنبه زیر پشتیبانی کند:
ساختمانهای داده
یکی از عناصر اصلی مدلداده ساختمان داده است. یعنی مدلداده باید نحوه نمایش موجودیتها را مشخص کند و همچنین عملیاتی که برروی این موجودیتها انجام می گردد. یعنی هر مدلداده باید دارای نمادهایی برای نمایش انواع موجودیت، انواع صفات خاصه و انواع ارتباط بین موجودیتها باشد.جامعیتهر مدلداده باید راه کارهایی برای تضمین اعتبار دادهها در پایگاهداده داشته باشد. به عبارتی باید بتوان داده های نامعتبر را تشخیص دهد و از ورود این دادهها به پایگاهداده جلوگیری کند. به این قوانین اصطلاحا جامعیت میگویند.
عملیاتیک مدلدادهباید بتواند مجموعه عملیاتی را تعریف کند که می تواند روی داده های ذخیره شده در پایگاهداده انجام شود. این عملیات امکان کار با داده را میدهند مانند اضافه،حذف، جستجو، ویرایش و بازیابی داده.
از نظر کلی مدلداده ها به دو نوع ساخت یافتهوغیرساختیافته تقسیم میشوند.
۲-۲-۱-مدل های داده ساخت یافته
مدلدادههای ساخت یافته از دستورات SQLبرای نوشتن پایگاهداده استفاده میکنند و برای استفاده از آنها باید فرمت دادههایی را که قصد ذخیره آنها را داریم از قبل تعریف کنیم. مدلدادههای ساخت یافته به ۳دسته تقسیم میشوند که در ادامه با هر یک از آنها آشنا میشویم.
۲-۲-۱-۱-مدل داده رابطهای
پایگاهداده رابطهای از دید کاربرانیک مجموعه از جدولهایی است که به درستی قابل درک می باشند.سه مفهوم اساسی در این مدل به شرح زیر وجود دارد:۱-جدول ۲-ستونها ۳-سطرها.این مدل براساس جدول دوبعدی(سطر و ستون)بنا شده است. همین امر امکان بازیابی سریع دادهها را فراهم میکند.هر جدول مربوط به یک موجودیت است و هرسطر نشان دهنده یک نمونه از آن موجودیت میباشد.هر جدول شامل رکوردها(ردیف)و صفات یا فیلدها(ستون)است]۳[.

برای دانلود متن کامل پایان نامه به سایت  jemo.ir  مراجعه نمایید.

Back To Top