ارائه ی یک مدل داده مناسب برای کشف انتقال بیماری های ژنتیکی۹۳- …

پایان نامه های ارشد سری هفتم

ارائه ی یک مدل داده مناسب برای کشف انتقال بیماری های ژنتیکی۹۳- …

جدول(۳-۳) : یک شمای کلیازEAV 46
جدول (۵-۱ ): زمان مربوط به پرس وجوهای مختلف ۸۵
فهرست نمودارها
عنوان صفحه
نمودار(۵-۱) پرس و جوهای یک گره………………………………………………………………………………….۸۶
نمودار(۵-۲) پرس و جوهای دو گره…………………………………………………………………………………..۸۷
نمودار(۵-۳) پرس و جوهای سه گره………………………………………………………………………………….۸۷
نمودار(۵-۴) پرس و جوهای تمام گره ها……………………………………………………………………………۸۸
نمودار(۵-۵) مقایسه کمترین-بیشترین و میانگین زمان پرس و جوها……………………………………….۸۹
فهرست شکل ها
عنوان صفحه
شکل(۲-۱ ) نمونه ای اولیه از پایگاه داده گراف…………………………………………………….. …………..۲۷
شکل(۳-۱)پیاده سازی بیماری همه گیری با پایگاه داده رابطه ای……………………………………………۴۴
شکل(۳-۲)یک پیاده سازی ساده از EAV/CR…………………………………………………………………….46
شکل (۳-۳) پیاده سازی بیماری همه گیری با پایگاه داده گرافی………………………………. ………….۴۷
شکل (۴-۱) نمودارER…………………………………………………………………………………………. ……….71
شکل (۴-۲) پایگاه داده گراف طراحی شده برای بیماری های ژنتیکی……………………………………۷۴
شکل(۵-۱) نمایش تمام گره ها روابط در پایگاه داده گرافی………………………………………………….۸۲
چکیده
در جامعه امروزی با توجه به پیشرفت علم پزشکی حجم دادههای پزشکی به سرعت در حال افزایش هستند. برای تحلیل سریعتر و کارآمدتر این دادهها نیاز به ذخیره الکترونیکی این دادهها داریم. دادههای مربوط به بیماریهای ژنتیکی نیز از این دسته دادهها به حساب میآیند. با توجه به این مسئله میبایست پایگاه دادهای مناسب ذخیره و بازیابی این داده ها طراحی نماییم. با توجه به ماهیت داده های ژنتیکی و این مسئله که در مورد انتقال بیماری های ژنتیکی روابط بین افراد و تجزیه تحلیل آن مسئله مهمی به حساب میآید در این مقاله برای ذخیره و بازیابی این دادهها از مدل دادهی گرافی که یکی از زیر مجموعههای مدل دادههای غیر ساخت یافته (NOSQL)است استفاده مینماییم. برای این کار ابتدا نیازها و پرس و جوهای مربوط به این مسئله را مشخص میکنیم و بر اساس آن مدل داده گرافی را طراحی مینماییم. برای ارزیابی مدل داده طراحی شده یک تیم متشکل از متخصصان ژنتیک نیز این مدل داده را بررسی کرده و نظر مساعد خود را در خصوص کاربرد این مدل داده برای بیماری های ژنتیکی بیان نمودند. همچنین از نرم افزار Neo4j استفاده نمودیم که دادههای مربوط به بیماری ژنتیکی تالاسمی را در آن ذخیره کرده و این مدل داده را بر اساس کارایی ذخیره سازی و بازیابی اطلاعات و زمان پرس و جوها مورد بررسی قرار دادیم که با توجه به زمان پرس و جوها و عدم پشتیبانی سایر مدل دادهها از روابط بین افراد، این مدل داده مدل مناسبی به شمار میآید.
کلمات کلیدی: ژن،بیماری های ژنتیکی، پایگاه داده های گرافی،neo4j،مدل داده
فصل اول: مقدمه
۱-۱-پیشگفتار
در زمینه پزشکی دادهها به سرعت در حال تولید وگسترش هستند. این دادهها در اشکال متفاوتتری نسبت به دادههای گذشته تولید میشوند و با توجه به پیشرفتهای علم در این زمینه نیاز به مدیریتهای جدید بسیار بیشتر از گذشته احساس میشود. برای ذخیره این دادهها پایگاهدادهای که قادر به پشتیبانی از انواع مختلف دادهها و حجم زیاد دادهها باشد و همچنین توانایی انجام مدیریت صحیح و کامل دادهها را دارا باشد، نیاز داریم]۱۴[.
در خصوص بیماریهای ژنتیکی دادههایی که نیاز به ذخیره آنها داریم، دادههای متنوعی هستند. با توجه به ماهیت بیماریهای ژنتیکی برای درک نحوه انتقال این بیماریها نیاز به ذخیره وضعیت سلامتی اجداد بیماران نیز داریم که در هر بررسی ممکن است فرد جدیدی به این شجره نامه اضافه شود، همچنین برای کشف مسیر انتقال بیماریها روابط بین افراد در این پایگاهداده بسیار مهم و ضروری میباشد. برای پشتیبانی از این نیازها و مدیریت روابط بین افراد و انتقال بیماری، پایگاهدادههای ساختیافته[۱]گزینه مناسبی نیستند، زیرا قادر به پشتیبانی از انواع مختلف داده ها نمیباشند.
پایگاهدادههای غیرساختیافته[۲]برای پشتیبانی انواع مختلف داده ها گزینه های مناسبتری هستند. پایگاهداده هایNOSQL انواع مختلفی دارند اما با توجه به این که در این نوع بیماری روابط بین افراد بسیار مهم است و همچنین باید در هر زمانی قادر به افزودن موجودیت ها باشیم پایگاهداده های گرافی مورد مناسبی میباشند.
۱-۲-بیان مسئله
بدن انسانها از تریلیون سلول تشکیل شده و هر سلول دارای یک هسته میباشد. هسته سلولها از تعداد ۴۶ کروموزوم یا۲۳جفت کروموزوم تشکیل شده است. کروموزومها دارای رشتههای در هم پیچیدهای به نامDNA هستند که اینDNA ها شامل ژنها هستند.هر سلول بدن انسانها شامل۲۵۰۰۰تا۳۵۰۰۰ژن است]۱[.
ژنها دارای اطلاعاتی هستند که این اطلاعات ویژگیهای انسان را می سازد.ژنها ازترکیب پایهای به نام نوکلئوتید تشکیل شدهاند. ترکیب پایه از۴ساختار تشکیل شده است”ادنینA[3]/گوانینG[4]/سیتوزینC[5]/ تیمینT[6]“در حقیقت برای بیان هر ژن از۴حرفA,T,C,Gاستفاده میکنیم که اصطلاحا به آن توالی نوکلئوتیدی گفته میشود.
توالی ژنهای مربوط به بیماریها در بدن انسانهای نرمال به یک شکل است و بیماری زمانی اتفاق می افتد که در این توالی تغییری ایجاد شود.البته طول توالی نوکلئوتیدی بیماریهای مختلف با یکدیگر متفاوت هستند.به طور مثال طول توالی ژن انسولین۳۳۳کاراکتر است. تا کنون بیشترین طول توالی نوکلئوتیدی شناخته شده مربوط به بیماری دوشن میباشد. طول این توالی۲٫۳مگا میباشد.
به عنوان مثالهایی از بیماریهای ژنتیکی میتوان از زالی، سرطان های پوست، عقب افتادگیذهنی، کم خونی داسی شکل، فنیل کتونوری، تالاسمی و نظایر آن نام برد]۲[.
برخی از مواردی که بررسیهای ژنتیکی انجام میپذیرد به شرح ذیل است:

برای دانلود متن کامل این پایان نامه به سایت  pipaf.ir  مراجعه نمایید.

  • زوجی که قصد تشکیل خانواده دارند و یکی از آنها یا یکی از خویشان نزدیک او دچار بیماری ارثی است.
  • فردی که فرزندی با یک نقص مادرزادی حاد دارد.
  • کودکی با یک مشکل جسمی که می‌تواند ژنتیکی باشد.

برای انجام این تستهای ژنتیکی در وهله اول نیاز به داشتن شجرهنامه زوجین در هنگام تشکیل خوانواده، والدین در هنگام تستهای بارداری و بیمار در هنگام بررسی یک بیمار ژنتیکی داریم. پس از دانستن شجرهنامه در هنگام برخورد با بیماریها نیاز به ذخیره اطلاعاتی درباره بیمار داریم.
برای ذخیره دادههای مربوط به بیماریهای ژنتیکی نیاز به پایگاهدادهای داریم که بتواند به خوبی از ذخیره انواع داده ها پشتیبانی کند. برای این داده ها نیاز به مدلدادهای داریم که بتواند علاوه بر ذخیره این دادهها به بررسی و تجزیه تحلیل این دادهها بپردازد. یکی از مسایل مهم برای انتخاب مدل داده این است که در مورد دادههای پزشکی برای هر بیمار ممکن است خصوصیاتی را ذخیره کنیم که برای دیگر بیماران نیازی به آن نداشته باشیم مثلا ممکن است برای یک بیمار نیاز به ذخیره جواب آزمایش خون داشته باشیم اما برای بیمار دیگر نیاز به انجام این تست و ذخیره این آزمایش نداشته باشیم و یا ممکن است در حین بررسی شرایط بیمار به مواردی برخورد کنیم که از ابتدا پیش بینی نشده بود، به این دلیل بهتر است از ابتدا یک طرح کلی برای پایگاهداده طراحی نشود تا بتوانیم هر خصوصیتی را که نیاز داشتیم یا در حین کار با آن مواجه شدیم برای بیمار اضافه کنیم.با توجه به این موضوع به این نتیجه می رسیم که از پایگاهداده های SQL نمیتوانیم استفاده کنیم و پایگاهداده های NOSQL برای این امر مناسبتر هستند.

Back To Top