ارائه ی یک مدل داده مناسب برای کشف انتقال بیماری های ژنتیکی۹۳- قسمت ۹

پایان نامه های ارشد سری هفتم

ارائه ی یک مدل داده مناسب برای کشف انتقال بیماری های ژنتیکی۹۳- قسمت ۹

جدول (۳-۲): پایگاهدادهEAV
در شکل زیر یک تصویر کلی از طراحی EAV مشاهده میکنیم.جدول اول به صورت رابطهای سنتی داده ها را ذخیره می کند.این داده ها شامل داده های غیر متغیر مانند نام و مشخصات بیمارهستند.جدول دوم به صورت EAVداده ها را ذخیره میکند تا توانایی اضافه کردن صفات را به پرونده پزشکی بیماران داشته باشیم و جدول سوم توصیفات صفت را به طور کلی بیان میکند تا برای هر بیمار مجبور به ذخیرهتوضیحات صفت نباشیم.هنگامی که به یک صفت برای بیمار رسیدیم برای مطالعه توضیحات آن به این جدول مراجعه میکنیم.
 
جدول(۳-۳) :یک شمای کلی ازEAV
علاوه بر این پایگاهدادهEAV باید توانایی نمایش روابط پیچیده بین رویدادهای کلینیکی را داشته باشد (به عنوان مثال:عفونت منجر به پنی سیلین می شود و سکته قلبی منجر به مرگ می شود).
برای نمایش این رویدادها از روابط شیگرا استفاده میکنیم یعنی کلاسها را اضافه میکنیم که حاصل ترکیب این دو روش مدلداده شی رابطهای است.که در این پروژه از نام EAV/CR استفاده میکنیم. در شکل زیر پیاده سازی یک EAV/CR ساده را نمایش میدهیم.
 
شکل(۳-۲) : یک پیاده سازی ساده از EAV/CR
اما در این پایگاهداده روابط بین افراد و موجودیت ها به خوبی پشتیبانی نمیشود.یعنی برای متوجه شدن مسیر بین بیماری باید پرس و جوهای بازگشتی بنویسیم که این کار زمان بر است.
۳-۴-مدل داده گرافی برای بیماری های همه گیری
از این مدلداده برای ذخیره داده های مربوط به بیماری های همه گیری استفاده شده است . بیماریهای همهگیری یعنی انتشار یک بیماری یا یک ویروس در بین یک جامعه که این میتواند شامل جامعه انسان ها، حیوانات یا حتی بروز ویروس در سیستمهای کامپیوتری باشد. برای ذخیره این داده ها از پایگاهداده گرافی استفاده مینماییم. موجودیت انسان را به چهار وضعیت سالم، ظاهر شده، آلوده و بهبود یافته ذخیره میکنیم و برای هر موجودیت علاوه بر مشخصات عمومی بیمار باید زمان ورود به هر یک از این وضعیت ها مشخص شود. زمان ورود یعنی زمان بروز اولین علایم بیماری(ETime)،زمان شروع انتشار و پخش بیماری(ITime)و زمان بهبود (Rtime) . علاوه بر این ها باید فرد انتقال دهنده بیماری را نیز مشخص کرد]۶[.
در پایگاهداده گراف در موجودیت ها مشخصات بیماری و زمان ورود را ذخیره میکنیم و فرد انتقال دهنده بیماری را به وسیله ی یک یال جهت دار مشخص می کنیم.این مدل در مقایسه با مدل رابطه ای کارایی بهتری در مورد روابط بین افراد و پرس و جوها دارد.
شکل (۳-۳) :پیاده سازی بیماری همه گیری با پایگاه داده گرافی
فصل چهارم: روش پیشنهادی
۴-۱-مقدمه
بدن انسانها از تریلیون سلول تشکیل شده و هر سلول دارای یک هسته میباشد.هسته سلولها از تعداد ۴۶ کروموزوم یا۲۳جفت کروموزوم تشکیل شده است.کروموزومها دارای رشتههای در هم پیچیدهای به نامDNA هستند که اینDNA ها شامل ژنها هستند.هر سلول بدن انسانها شامل۲۵۰۰۰تا۳۵۰۰۰ژن است.ژنها دارای اطلاعاتی هستند که این اطلاعات ویژگیهای انسان را می سازد.
توالی ژنهای مربوط به بیماریها در بدن انسانهای نرمال به یک شکل است و بیماری زمانی اتفاق می افتد که در این توالی تغییری ایجاد شود. بیماری های ژنتیکی به ۳دسته تقسیم می شوند: بیماریهای تک ژنی، بیماری های چند ژنی یا چند عاملی، بیماریهای میتوکندریایی.
بیماریهای تک ژنی بیماریهایی هستند که از والدین بیمار یا ناقل به فرزندان انتقال مییابند و فرزندان از بدو تولد دچار این بیماری هستند فقط سن بروز آنها در بدن متفاوت میباشد.مانند تالاسمی
بیماری های چند ژنی بیماریهایی هستند که ژن در اثر تغییرات محیطی دچار مشکل میشود و بیماری در بدن فرد بروز میکند. مانند سرطانها که در ابتلا به آنها عادات غذایی و عادات زندگی مانند سیگار کشیدن نقش مهمی دارند.بیماریهای میتوکندریایی بیماریهایی هستند که تنها از مادر به فرزند انتقال میابد و پدر نقش انتقال دهنده را نخواهد داشت.
به عنوان مثالهایی از بیماریهای ژنتیکی می توان از زالی،سرطان های پوست،سیستیکفیبروز،
عقب افتادگیذهنی، کم خونی داسی شکل، فنیل کتونوری، تالاسمی و … نام برد.
برخی از مواردی که بررسیهای ژنتیکی انجام میپذیرد به شرح ذیل است:

برای دانلود متن کامل این پایان نامه به سایت  pipaf.ir  مراجعه نمایید.

  • زوجی که قصد تشکیل خانواده دارند و یکی از آنها یا یکی از خویشان نزدیک او دچار بیماری ارثی است.
  • فردی که فرزندی با یک نقص مادرزادی حاد دارد.
  • کودکی با یک مشکل جسمی که می‌تواند ژنتیکی باشد.

برای انجام این تستهای ژنتیکی در وهله اول نیاز به داشتن شجرهنامه زوجین در هنگام تشکیل خوانواده، والدین در هنگام تستهای بارداری و بیمار در هنگام بررسی یک بیمار ژنتیکی داریم. پس از دانستن شجرهنامه در هنگام برخورد با بیماریها نیاز به ذخیره اطلاعاتی درباره بیمار داریم. فرمت دادههای مورد نیاز برای ذخیره به شرح ذیل می باشد:
خصوصیات عمومی بیمار،وضعیت عمومی بدن بیمار،تاریخچه بیمار مانند علائم بیماری،زمان متوجه شدن اولین علائم بیماری،سابقه ابتلا به بیماری،درمان های گذشته در صورت ابتلای قبلی،مدت ابتلا،گزارش جراحی قبلی،اطرافیان بیمار که مبتلا به این بیماری بوده اند، گزارشات کنونی پزشک، خدمات تصویر برداری، گزارش آزمایشگاه، خدمات بافتشناسی، گزارشات کاردرمانی، توالی نوکلئوتید (ژن) مربوط به بیماری و یک نسخه ژن متعادل.
حال برای ذخیره دادههای مربوط به بیماریهای ژنتیکی نیاز به پایگاه دادهای داریم که با توجه به تنوع دادههایی که باید ذخیره شوند، علاوه بر ذخیره این دادهها به بررسی و تجزیه تحلیل این دادهها بپردازد. یکی از مسایل مهم برای انتخاب پایگاه داده این است که در مورد دادههای پزشکی برای هر بیمار داده های متفاوت از دیگر بیماران ذخیره کنیم، به این دلیل بهتر است از ابتدا یک طرح کلی برای پایگاه داده طراحی نشود. با توجه به این موضوع به این نتیجه میرسیم که از پایگاه داده های SQLنمیتوانیم استفاده کنیم و پایگاه داده های NOSQLبرای این امر مناسب تر هستند.
با توجه به نیاز به ژنتیک اعضای خانواده و نسلهای قبل بیمار باید توانایی افزودن موجودیتها(نسل های قبل و بعد)ی جدید را در حین انجام تحقیقات به این پایگاه داده داشته باشیم. در مورد انتقال بیماریها تشخیص مسیر انتقال بیماری اهمیت ویژهای دارد. به این دلیل باید پایگاه دادهای طراحی کنیم که قابلیت استخراج روابط بین موجودیتها را دارا باشد. البته روابط بین موجودیت ها در پایگاه دادههای رابطهای نیز قابل استخراج است اما اولا به دلیل نیاز به نوشتن رویههای تو در تو امر بسیار پیچیده و زمان بر است ثانیا در مدل داده گراف میتوانیم بر روی یالها نیز خصوصیاتی را برای ارتباط موجودیتها تعریف کنیم. با توجه به این سه مسئله به این نتیجه میرسیم پایگاه داده گرافی بهترین انتخاب برای این نوع بیماری ها است.
در این پایان نامه با استفاده از مدل داده گراف پایگاه داده ای را طراحی خواهیم کرد که توانایی ذخیره انواع و حجمهای مختلف داده را داشته باشد زیرا در مورد داده های پزشکی مجبور به ذخیره تصویر،صوت، کاراکتر و … میباشیم.پایگاه داده طراحی شده باید بتواند به سوالات مطرح شده در زمینه انتقال بیماری های ژنتیکی پاسخ دهد.
در این پایگاه داده موجودیت ها که همان افراد هستند درون گرهها ذخیره میشوند،در گره ها علاوه بر مشخصات عمومی بیماران تمام اطلاعات مربوط به بیماری افراد،شرایط و علائم بیماران نیز ذخیره میشوند. در سطوح بعدی گراف نسلهای بالاتر بیماران،همراه با اطلاعات مربوط به بیماری مخصوصی که در حال تحقیق در مورد آن هستند ذخیره خواهد شد.برای نمایش روابط بین افراد در این مدل داده از یالها استفاده خواهیم کرد.به این صورت که اگر بیماری از شخصی به شخص دیگری انتقال یافت از یال از جهت منتقل کننده به منتقل شونده برای نمایش این انتقال استفاده خواهیم کرد. علاوه بر اینها میتوانیم بر روی یال ها توضیحاتی را نیز اضافه نمائیم.توضیحاتی مانند درصد احتمال انتقال یک بیماری خاص از یک فرد به فرد دیگر.
به دلیل اینکه در مورد بیماریهای ژنتیکی در یک خانواده،علاوه بر افراد بیمار افراد سالم نیز باید ذخیره شوند،در این نمودار موجودیت انسان را به چهار حالت در نظر میگیریم:حالتی که انسان بیمار باشد،سالم باشد،سالم باشد اما ناقل بیماری باشد که در خصوص بیماری های ژنتیکی بعضی از انسان ها بیمار نیستند بلکه حامل ژن بیمار هستند و این افراد در صورتی بیماری را انتقال می دهند که با فرد حامل دیگری ارتباط داشته باشند،یا انسانی باشد که این بیماری را در بدن وی کنترل کرده باشند.
در ادامه موجودیت ها و صفات مربوط به هر موجودیت به طور جداگانه مطرح میشود.
۴-۲-موجودیت ها
۱-انسان
۲-پزشک
۳-بیماری

Back To Top