پایان نامه بررسی طراحی و پیاده‌سازی پایگاه داده‌های توزیع شده همگن

پایان نامه بررسی طراحی و پیاده‌سازی پایگاه داده‌های توزیع شده همگن پایان نامه بررسی طراحی و پیاده‌سازی پایگاه داده‌های توزیع شده همگن

دسته : -فنی و مهندسی

فرمت فایل : word

حجم فایل : 967 KB

تعداد صفحات : 96

بازدیدها : 188

برچسبها : دانلود پایان نامه پژوهش پروژه

مبلغ : 6000 تومان

خرید این فایل

پایان نامه بررسی طراحی و پیاده‌سازی پایگاه داده‌های توزیع شده همگن در 96 صفحه ورد قابل ویرایش

پایان نامه بررسی طراحی و پیاده‌سازی پایگاه داده‌های توزیع شده همگن در 96 صفحه ورد قابل ویرایش  

مطالعات نظری.. 7

فصل اول. 8

1.                 سیستم پایگاهی توزیع شده 9

تعاریف... 9

2.                 مزایا و معایب سیستم پایگاهی توزیع شده 13

2.1.                  مزایا: 14

2.2.                  معایب: 14

3.                 چند سیستم نمونه. 14

4.                 یك اصل بنیادی.. 15

5.                 دوازده قاعده فرعی.. 17

5.1.                  خود مختاری محلی.. 17

5.2.                  عدم وابستگی به یك مانه مركزی.. 18

5.3.                  استمرار عملیات... 18

5.4.                  استقلال از مکان ذخیره سازی.. 19

5.5.                  استقلال از چگونگی پارسازی داده ها 19

5.6.                  استقلال ازچگونگی نسخه سازی داده ها 22

5.7.                  پردازش در خواست های توزیع شده 24

5.8.                  مدیریت تراكنش های توزیع شده 24

5.9.                  استقلال از سخت افزار. 25

5.10.                استقلال از سیستم عامل.. 25

5.11.                استقلال از شبكه. 25

5.12.                استقلال از DBMS. 26

6.                 پایگاه داده های توزیع شده همگن و ناهمگن.. 26

7.                 مشکلات سیستم های توزیع شده 26

7.1.                  پردازش در خواست... 27

7.2.                  مدیریت كاتالوگ... 30

7.3.                  انتشار بهنگام سازی.. 33

7.4.                  كنترل ترمیم. 34

7.5.                  كنترل همروندی.. 36

8.                 گدار. 38

9.                 مقایسه سیستم های مشتری/خدمتگزار با سیستم های توزیع شده 40

10.               خلاصه. 41

11.               نتیجه گیری.. 42

فصل دوم. 43

1.                 سیستم های پایگاه داده های توزیع شده و موازی.. 44

2.                 توازی بین درخواست ها 46

3.                 نگاهی دقیقتر به تکنولوژی پایگاه داده های توزیع شده وموازی.. 51

3.1.                  سطح و نوع توزیع شدگی داده ها ومسئولیت ها در  DDBMSهای مختلف.... 52

3.2.                  پردازش و بهینه سازی درخواست... 55

3.3.                  کنترل همروندی (Concurency control) 63

3.4.                  پروتکل های قابلیت اطمینان. 67

4.                 خلاصه. 77

5.                 نتیجه گیری.. 78

فصل سوم. 79

1.                 تاریخچه. 80

2.                 جنبه هایاوراکل برای سیستم های توزیع شده 82

3.                 خطوط اتصال پایگاه داده ها 82

3.1.                  رده بندی database link بر اساس نحوه برقراری ارتباط.. 83

ضرورت استفاده از database link ها 83

3.2.                  بکارگیری اسامی سراسری پایگاه داده هادر database link ها 84

3.3.                  نامگذاری database link ها 85

3.4.                  گونه های مختلف database link. 85

3.5.                  مقایسه کاربران ِ گونه های مختلف database link ها 86

3.6.                  مثال هایی از تعریف database link در سیستم های توزیع شده پایگاه داده ها 87

4.                 عملیات روی داده های ذخیره شده در پایگاه داده های توزیع شده اوراکل.. 88

فصل چهارم. 89

1.                 توزیع داده ها 90

1.1.                  استراتژی های توزیع داده ها 90

1.2.                  تخصیص داده ها 91

1.3.                  طرح توزیع و تخصیص مناسب برای DDB خوابگاه دانشگاه شهید بهشتی.. 91

1.4.                  انتخاب طرح توزیع DDB خوابگاه دانشگاه شهید بهشتی.. 91

 

  1.  سیستم پایگاهی توزیع شده[1]

تعاریف

پایگاه داده: مجموعه ای است از داده های ذخیره شده و پایا، بصورت مجتمع (یكپارچه) (نه لزوماً همیشه بطور فیزیكی، بلكه حداقل بطورمنطقی)، بهم مرتبط، حتی الامكان با كمترین افزونگی، (دارای یك ساختار منطقی مبتنی بر یك مدل داده ای و توصیف شده بویژه در محیط انتزاعی یعنی در چارچوب همان مدل داده ای )، تحت مدیریت یك سیستم كنترل متمركز، مورد استفاده یك یا چند كاربر از یك(یا بیش از یك)«سیستم كاربردی»،بطور همزمان و اشتراكی.]روحا83[

شبكه كامپیوتری: مجموعه ای از كامپیوتر ها، مسیر یاب ها، ماهواره ها،اتصالات ارتباطی، كه از طریق آن می توان به اطلاعات موجود در كامپیوترهای مختلف عضو این سیستم دسترسی پیدا كرد.

به زبان ساده سیستم پایگاه داده توزیع شده ، مزایای تكنولوژی پایگاه داده و تكنولوژی شبكه را در خود جمع كرده است.البته این یكپارچه سازی[2] ، با تمركز[3] تفاوت دارد.شكل زیر گویای این مطلب است:

 

 

شكل 1- معماری توزیع شده پایگاهی،تركیبی از تكنولوژی های شبكه و پایگاه داده ها[TAMER99]

  • تعریف اول:

یك سیستم توزیع شده پایگاهی، شامل مجموعه ای از مانه هاست[4] که از طریق برخی المانهای اتصال، بهم متصل می باشد بطوریکه :

1-     هر مانه خود یك سیستم پایگاه داده ها به معنای كامل می باشد.

2-     مانه ها به نحوی بهم متصل هستند كه كاربر هر مانه می تواند به داده های هر مانه دیگر طوری دسترسی یابد كه منطقاً با حالتی كه تمام داده ها در مانه كاربر مربوطه قرار دارند، فرقی نداشته باشد.

با تعریف ارائه شده فوق از سیستم های پایگاه داده های توزیع شده ،می توان فهمید كه سیستم پایگاه داده های توزیع شده، در واقع نوعی شیء مجازی[5] می باشد كه مولفه[6]های آن بطور فیزیكی در تعدادی پایگاه داده های واقعی[7] مختلف در تعدادی مانه مجزا قرار دارد . ( در اصل DDB[8] ، اجتماع منطقی این چند پایگاه داده واقعی می باشد ).] [DATE2000

  • تعریف دوم:

سیستم توزیع شده پایگاهی، مجموعه ای از داده های ذخیره شده ( با ویژگی های بر شمرده در تعریف پایگاه داده ها)، كه منطقاً به یك سیستم تعلق دارند ، ولی در مانه ها ی مختلف یك یا بیش از یك شبكه توزیع شده اند. به عبارتی دیگر، می توان گفت كه تعدادی پایگاه داده های ذخیره شده روی كامپیوتر های مختلف داریم كه از نظر كابران، پایگاه واحدی هستند. به بیان دیگر، مجموعه ای است از چند پایگاه داده منطقاً یكپارچه(مجتمع)،ولی بطور فیزیكی توزیع شده روی یك شبكه كامپیوتری.]روحا83[

 

شكل 2- یك سیستم پایگاه داده های توزیع شده

 

  • تعریف سوم:

یك سیستم پایگاهی توزیع شده(DDB) ،مجموعه ای است از چندین پایگاه داده های منطقاً بهم مرتبط از طریق یك شبكه كامپیوتری. سیستم مدیریت پایگاه داده های توزیع شده(DDBMS)،نرم افزاری كه مدیریت پایگاه داده های توزیع شده را فراهم می آورد و«توزیع شدگی» را از دید كاربران پنهان  می

سازد.[TAMER99]

طبق تعریف فوق، سیستم پایگاه داده های توزیع شده، از مجموعه ای مانه در خواست کننده[9] ( با صفر یا بیشتر عضو فعال ) و یک مجموعه ناتهی از مانه داده[10] ها تشکیل شده است.

مانه های داده ای، قابلیت نگهداری فیزیکی داده های سیستم را دارند در حالیکه مانه های درخواست کننده فاقد این امکان هستند. در مانه های درخواست کننده تنها واسط[11] هایی وجود دارد که با اجرای آنها، داده های ذخیره شده در مانه های داده ها  بهتر و راحتتر بدست می آیند.

 

شكل3- محیط[12] سیستم پایگاه داده توزیع شده[TAMER99]

همانطور که از شکل بالا مشخص است، بجز مانه1 که از نوع مانه درخواست کننده است، بقیه از نوع داده هستند.

اما حالت فوق، تنها حالت ممکن برای پایگاه داده های توزیع شده نیست. در نوع دیگری از معماری توزیع شده پایگاه داده ها، فرض می شود هر مانه(مانه های «درخواست کننده» و «داده ها») بطور منطقی حاوی ]حداقل[یک ماشین مستقل است. بنابراین هر کدام از مانه ها دارای مخزن ذخیره سازی اولیه و ثانویه مستقل خود می باشند. مانه ها، سیستم عامل های مستقل خود را (که می توانند همگن یا ناهمگن باشند)دارند و هر یک قادر خواهند بود برنامه های کاربردی خود را بطور محلی احرا نمایند. مانه ها بوسیله یک شبکه کامپیوتری بهم متصل شده اند. تاکید می شود که اتصال بین مانه ها در این نوع سیستم های توزیع شده، از نوع «اتصال ضعیف»[13] بین پردازنده ها است. منظور از اتصال ضعیف بین پردازنده آن است که هر پردازنده کلاک اختصاصی ، حافظه اولیه و ثانویه و سیستم عامل خود را دارد. در مقابل این نوع اتصال، «اتصال قوی» بین پردازنده ها وجود دارد که در آن پردازنده ها از یک حافظه مشترک[14] و یک کلاک همگام استفاده می کنند. سیستم عامل واحدی پردازنده ها و حافظه را مدیریت می کند. اتصال بین پردازنده از نوع مستقیم است نه از طریق یک شبکه ارتباطی.

گونه دیگری از سیستم های پایگاه داده ها وجود دارد که از جهاتی شبیه سیستم های پایگاه داده های موازی است. این نوع DBMS ها DBMS های موازی کاملاً مستقل[15] نامیده می شوند. در از DBMS های موازی، با بکارگیری معماری چند پردازنده ای، کارایی بالاتر و دسترس پذیری بیشتر را همراه با هزینه کمتر در مقایسه با ابر کامپیوترها خواهیم داشت.

معماری سیستم های پایگاه داده های موازی، جزئیات خاص خود را دارد که در محدوده این نوشتار نمی گنجد.

  • تعریف چهارم:

یك سیستم محاسبات توزیع شده[16]،شامل تعدادی عناصر پردازشگر- نه لزوماً همگن- است كه از طریق یك شبكه كامپیوتری با هم در ارتباطند. یك سیستم توزیع شده پایگاه داده را می توان منطقاً مجموعه ای چندگانه از پایگاه داده ها دانست كه روی یك شبكه كامپیوتری توزیع شده اند و DDBMS نرم افزار مدیریت این پایگاه داده توزیع شده است به نحوی كه توزیع شدگی سیستم را از دید كاربر پنهان می سازد.[CONN2002]

  • تعریف پنجم:

برخلاف سیستم های پایگاهی موازی[17] كه در آنها پردازشگرها كاملاً بهم متصل شده و یك  پایگاه داده واحد را تحت كنترل دارند، سیستم های پایگاهی توزیع شده از اتصال نسبتاً ضعیف مانه هایی كه هركدام بطور انحصاری میتوانند عمل كنند تشكیل شده است.

هر مانه ممكن است در پردازش یك تراكنشی كه داده مورد نیاز خود را از مانه(های) دیگر دریافت می كند،  شركت كند.

  1. تاریخچه

نرم افزار سیستم مدیریت پایگاه داده های اوراکل را می توان قویترین DBMS تجاری موجود برای پایگاه داده های رابطه ای دانست.

تاریخچه کمپانی اوراکل به سال 1977میلادی برمی گردد. در اوایل این سال ،Larry Ellison کمپانی SDL[18] را بنا نهاد. فعالیت این لابراتوار تا سال 1979 ادامه یافت و سپس با نام RSI[19] خود را به بازار معرفی کرد.

همگام با اولین DBMSهای تجاری رابطه ای ، اولین نسخه  اوراکل در سال 1979 با نام Oracle V2 توسط لابراتوار RSI به بازار عرضه شد. این نسخه، امکانی برای پشتیبانی از تراکنشها نداشت. تنها دارای امکانات اولیه برای دستورات اساسی مدیریت داده ها به زبان SQLاستاندارد و نیز دستورات پیوند رابطه ها بود.

اوراکل نسخه 1 هیچ گاه به بازار وارد نشد! در واقع به منظور استراتژی های تجاری اولین نسخه از اوراکل با نام اوراکل 2 به بازار آمد.

در سال 1983، لابراتوار RSI به کمپانی Oracle تغییر نام داد تا با محصول اوراکل خود از نظر نام شبیه تر باشد.

در همان سال نسخه 3 اوراکل توسط کمپانی مذکور تولید شد. Oracle V3 به زبان C بازنویسی شد.  این نسخه دارای توانش تثبیت و واگردانی تراکنش ها است. نیز در همین نسخه بود که پشتیبانی از ]بستر[20][ سیستم های UNIX بر توانش این DBMS افزوده شد. پیش از این DBMS اوراکل تنها بر روی سیستم های VAX/VSM اجرا می شد.

اوراکل نسخه 4 در سال 1984 با قابلیت پشتیبانی از سازگاری داده ها[21] به بازار آمد.

با ایجاد و گسترش شبکه های کامپیوتری در اواسط دهه 80 میلادی، اوراکل نیز همگام با این تکنولوژی نسخه جدیدش را تولید و به بازار عرضه کرد.

امکان پشتیبانی از درخواست های توزیع شده[22] از نسخه 5 اوراکل به این DBMS اضافه شد. در سال 1988 کمپانی اوراکل محصولات ERP خود را که با DBMS رابطه ای اوراکل هماهنگی داشت بصورت تجاری تولید کرد.

اوراکل نسخه 6 با امکان پشتیبانی از PL/SQL و قفل گذاری در سطح سطر[23] و امکانات ایجاد فایل های پشتیبان[24] از داده های ذخیره شده تولید شد.

در سال 1992 نسخه 7 اوراکل به بازار آمد. این نسخه (Oracle 7  ) دارای امکاناتی برای پشتیبانی از قواعد جامعیتی  ( مانند قواعد مربوط به کلید اصلی و کلید خارجی ) ، رهاناها و رویه های ذخیره شده بود.

در سال 1997 اوراکل 8 به همراه امکان پشتیبانی از برنامه های چندرسانه ای[25] و توسعه نرم افزار های شیءگرا ایجاد شد.

در اواسط سال 1999، [26]Oracle 8i با قابلیت ها و امکانات بیشتری برای کاربرد های اینترنتی به بازار آمد.

اوراکل، DBMSجدید خود را با عنوان Oracle 9i در سال 2001 وارد بازار نمود. این نسخه جدید، دارای 400 جنبه جدید از جمله امکاناتی[27] برای خواندن و نوشتن در متن های XML بود. این نسخه همچنین، دارای گزینه ای[28] برای Oracle RAC[29] است.

سرانجام در سال 2003 میلادی، Oracle 10g ایجاد شد. در این نسخه، توانش DBMS برای پردازش های شبکه ای به حد اعلا می رسد. ( به این جنبه از سیستم تا حدی توجه شده که اصطلاحاً نسخه 10g اوراکل را «آماده برای پردازش شبکه ای» نامیده اند.)

 

 

  1. جنبه های[30]اوراکل برای سیستم های توزیع شده

نرم افزار سیستم مدیریت پایگاه داده های اوراکل، دارای امکاناتی برای ایجاد پایگاه داده های همگن و ناهمگن است. گرچه این DBMS تمام جنبه های تئوریک DBMSهای توزیع شده را پشتیبانی نمی کند، اما تا حد قابل قبولی با مبانی تئوریک سازگار است.

در این نوشتار، صرف نظر از ذکر جزئیات ، به جنبه حمایت از توزیع شدگی این نرم افزار پرداخته می شود.

 

  1. خطوط اتصال پایگاه داده ها[31]

مهم ترین و اساسی ترین مفهوم در پایگاه داده های توزیع شده «خط اتصال پایگاه داده ها» است. یک خط اتصال پایگاه داده ها، یک اتصال فیزیکی بین دو خدمتگزار پایگاه داده ها است که مشتری ها را قادر می سازد به دو پایگاه داده های بطور فیزیکی مجزا، شبیه یک پایگاه داده های منطقی دسترسی داشته باشند.

این مفهوم، اصل پنهان سازی توزیع را تا حدی پیاده سازی کرده است. در واقع به کمک خطوط اتصال پایگاه داده ها، توزیع شدگی را از دید کاربران نهایی پنهان می سازد.

بطور دقیقتر و واقعی، خط اتصال پایگاه داده ها، اشاره گری[32] است که یک مسیر ارتباطی یک طرفه[33] از خدمتگزار پایگاهی اوراکل به یک خدمتگزار پایگاه داده های دیگر تعریف می کند. در واقع این اشاره گر، بعنوان یک مدخل در دیکشنری داده های جدول های داده ای تعریف می شود. برای دسترسی به این خط اتصال، لازم است کاربر به پایگاه داده های محلی خود که مدخل ذیل در دیکشنری داده های آن تعریف شده است وصل شود.

خط اتصال تعریف شده یک مسیر ارتباطی یک طرفه است. منظور از یک طرفه بودن آن است که، مشتری با اتصال به پایگاه داده های محلی خود مانند A ، می تواند به کمک خط اتصال موجود در آن، به داده ها و اطلاعات موجود در پایگاه داده های دوردست[34] مانند B دسترسی دارد در حالیکه مشتریان پایگاه داده های مقابل این امکان را ندارند.

به عبارتی دیگر با تعریف خط اتصال بالا در پایگاه داده های A، تنها کاربران محلی آن می توانند به آن دسترسی داشته و از طریق آن به پایگاه داده های دور مانند B دست یابند. این در حالی است که اگر کاربران محلی پایگاه داده های مانه B نیز بخواهند به داده های موجود در پایگاه داده های مانه A دست یابند، لازم است یک خط اتصال دیگر تعریف کنیم. البته این بار این خط اتصال در پایگاه داده های B ذخیره می شود.

با توضیحات بالا مشخص می شود که خط اتصال برای برقرای ارتباط بین پایگاه داده های توزیع شده است. برای تحقق این مطلب، لازم است که هر یک از پایگاه داده ها در سیستم توزیع شده، یک نام واحد سراسری[35] داشته باشند.

خط اتصال از نظر سطح دسترسی به آن، به دو گونه تفکیک می شوند. خط اتصال محرمانه[36]  و عمومی[37].

در گونه private آن، تنها کاربر(کاربرانی) که آن را تعریف نموده اند، می تواند به آن دسترسی داشته باشند. در حالیکه با تعریف یک خط اتصال ِpublic ، تمامی کاربران پایگاه داده هایی که حاوی تعریف خط اتصال است، می توانند به آن دسترسی داشته باشند.

 

خرید و دانلود آنی فایل

به اشتراک بگذارید

Alternate Text

آیا سوال یا مشکلی دارید؟

از طریق این فرم با ما در تماس باشید