วันเสาร์ที่ 18 กันยายน พ.ศ. 2553

บทที่ 3 ฐานข้อมูลและคลังข้อมูล

บทที่ 3
ฐานข้อมูลและคลังข้อมูล

โครงสร้างข้อมูล
            มีรูปแบบเป็นลำดับชั้นโดยเริ่มจากหน่วยที่เล็กที่สุด คือ
บิต (Bit) คือหน่วยที่เล็กที่สุด ประกอบด้วยเลขฐานสอง ซึ่งมีสถานะเป็น 0 กับ 1
ไบต์ (Byte) ประกอบด้วยบิตหลายๆ บิตมาเรียงต่อกัน เช่น นำ 8 บิตมาเรียงกันเป็น 1 ไบต์
เขตข้อมูล (Field) เป็นการนำข้อมูลหลายอักขระมารวมกันเป็นคำเพื่อให้เกิดความหมาย
ระเบียนข้อมูล (Record) คือ กลุ่มของเขตข้อมูลที่มีความสัมพันธ์กัน ถูกนำมารวมกัน เช่น ระเบียนข้อมูลพนักงาน
ไฟล์ (File) คือ กลุ่มของระเบียนข้อมูลที่มีความสัมพันธ์กันถูกนำมาจัดเก็บไว้ด้วยกัน

ปัญหาเกี่ยวกับแฟ้มข้อมูล
ความซ้ำซ้อนของข้อมูล (Data Redundancy)  การจัดเก็บข้อมูลมากกว่าหนึ่งแห่ง ทำให้ยากที่จะควบคุมถูกต้องตรงกันของข้อมูล
ความผูกพันระหว่างข้อมูลและโปรแกรม (Program-Data Dependence) คือ ความไม่เป็นอิสระของข้อมูล หากมีการเปลี่ยนแปลงโครงสร้างหรือวิธีการเรียกใช้ข้อมูลย่อมมีผลกระทบต่อโปรแกรม ทำให้ต้องตามแก้โปรแกรมต่างๆ ที่เกี่ยวข้องก่อให้เกิดค่าใช้จ่ายในการบำรุงรักษาโปรแกรมสูง
การไม่สามารถใช้ข้อมูลร่วมกันได้ (Lack of Data Sharing) ข้อมูลที่มีการจัดเก็บแยกจากกันโดนแต่ละส่วนงานจัดเก็บข้อมูลเป็นของตนเองทำให้ความซ้ำซ้อนของการใช้ข้อมูลอยู่ในระดับต่ำ ยากต่อการใช้งานร่วมกันได้
การขาดความคล่องตัว (Lack of Flexibility) ขาดการคล่องตัวในการตอบสนองต่อความต้องการใหม่ๆ เนื่องจากแฟ้มข้อมูลไม่สนับสนุนงานในรูปแบบที่ไม่เคยทำเป็นประจำ
การขาดระบบรักษาความปลอดภัยที่ดี (Poor Security) คือ การกำหนดว่าผู้ใช้รายใดสามารถเข้าถึงข้อมูลได้ในระดับใดได้บ้างจะทำได้ยากโดยการเขียนโปรแกรม วิธีรักษาความปลอดภัยของระบบแฟ้มข้อมูลมีขอบเขตความสามารถค่อนข้างจำกัด

องค์ประกอบของระบบฐานข้อมูล
ระบบฐานข้อมูลประกอบด้วยองค์ประกอบหลัก 4 ส่วน คือ
1.  ข้อมูล (Data) ข้อมูลและความสัมพันธ์ของข้อมูลที่จัดเก็บอยู่ในฐานข้อมูล
2.  ฮาร์ดแวร์ (Hardware) เครื่องคอมพิวเตอร์และอุปกรณ์รอบข้าง
3.  ซอฟต์แวร์ (Software) ระบบปฏิบัติการ (Operating Systems) และระบบจัดการข้อมูล (Database Management System : DBMS)
4.  ผู้ใช้ (Users) บุคลากรที่เกี่ยวข้องกับระบบฐานข้อมูล

รูปแบบของฐานข้อมูล (Database Model)
แบบจำลองฐานข้อมูลลำดับชั้น (Hierarchical Database Model) มีโครงสร้างคล้ายโครงสร้างต้นไม้ (Tree Structure)
            1.  ข้อมูลมีความสัมพันธ์กันในลักษณะ One-to-Many
            2.  ข้อมูลจะได้รับการจัดเก็บในรูปของ Segment
            3.  Segment ที่อยู่บนสุดเรียกว่า Root Node ลงมาเรียกว่า Child Node
            4.  Node ระดับบนจะเป็น Parent Segment ของ Node
            5.  ระดับล่างลงมาโดยที่ Parent Segment สามารถมี Child Segment ได้มากกว่าหนึ่ง ในขณะที่ Child Segment จะขึ้นอยู่กับ Parent Segment เดียวเท่านั้น

ข้อดีและข้อจำกัด
            เข้าใจง่าย มีความซ้ำซ้อนน้อยและเหมาะกับข้อมูลที่มีการเยงลำดับอย่างต่อเนื่อง แต่ไม่สามารถรองรับความสัมพันธ์ของข้อมูลในลักษณะ Many-to-Many และการเข้าถึงข้อมูลมีความคล่องตัวน้อย

แบบจำลองฐานข้อมูลเครือข่าย (Network Database Model)
            โครงสร้างของข้อมูลที่นำเสนอเป็นลักษณะ Multi-List Structure โดยมีความสัมพันธ์ของข้อมูลเป็นแบบ Many-to-Many โดยที่ Segment สามารถมี Parent ได้มากกว่าหนึ่ง และจะเรียก Parent  ว่า Owner ส่วน Child เรียกว่า Member




ข้อดีและข้อจำกัด
            ความซ้ำซ้อนของข้อมูลมีน้อยกว่าแบบจำลองฐานข้อมูลลำดับชั้น สามารถเชื่อมโยงข้อมูลแบบไป-กลับได้ โดยใช้พอยน์เตอร์ วิธีนี้จะเปลืองเนื้อที่ในการจัดเก็บพอยน์เตอร์ และยังมีความยุ่งยากอยู่ในการเปลี่ยนแปลโครงสร้างข้อมูลที่มีความซับซ้อน

แบบจำลองฐานข้อมูลเชิงสัมพันธ์ (Relational Database Model)
            แสดงโครงสร้างของข้อมูลในรูปแบบตาราง และเรียกตารางว่า รีเลชัน (Relation) โดยแต่ละรีเลชันประกอบด้วย แถวหรือทัพเพิล (Tuple) และ คอลัมน์ซึ่งเรียกว่า แอตทริบิวต์ (Attribute) ในแต่ละรีเลชันจะมีแอตทิรบิวต์หรือกลุ่มของแอตทริบิวต์ ซึ่งเรียกว่า คีย์ (Key)

ข้อดีและข้อจำกัด
            มีโครงสร้างที่เข้าใจง่ายกว่าฐานข้อมูลอื่นๆ ผู้ใช้ไม่จำเป็นต้องเข้าใจถึงโครงสร้างการจัดเก็บข้อมูลทางกายภาพ ข้อมูลมีความเป็นอิสระจากโปรแกรม แต่ต้องใช้ฮาร์ดแวร์และซอฟต์แวร์ที่มีคุณภาพสูง

ระบบข้อมูลแบบกระจาย (Distributed Database)
            ข้อมูลจัดเก็บไว้ที่เครื่องคอมพิวเตอร์หลายเครื่องตามพื้นที่ต่างๆ แทนที่จะเก็บไว้ที่ส่วนกลางเพียงแห่งเดียว เพื่อความคล่องตัวในการดำเนินงาน โดยเครื่องคอมพิวเตอร์เหล่านี้สามารถสื่อสารถึงกันได้

ข้อดีและข้อจำกัด
            ข้อมูลสอดคล้องกับลักษณะการใช้งานจริง ทำให้สามารถเรียกใช้ข้อมูลได้อย่างรวดเร็ว แต่ข้อมูลแบบกระจายจะมีความซับซ้อนในการประมวลผลเพื่อเรียกใช้ข้อมูล การฟื้นสภาพ และการออกแบบฐานข้อมูลมากกว่าระบบฐานข้อมูลแบบรวม

ฐานข้อมูลแบบออบเจ็กต์ (Object-Oriented Database)
            เรียกว่า ฐานข้อมูลเชิงวัตถุเกิดจากแนวคิดการเขียนโปรแกรมเชิงวัตถุ (Object-Oriented Program :OOP) เพื่อตอบสนองต่อความต้องการในการจัดเก็บข้อมูลที่มีความสลับซับซ้อน มีขนาดใหญ่ และมีความหลากหลายมากกว่าเดิม เช่น ข้อมูลเสียง รูปภาพ และ วีดิทัศน์

ข้อดีและข้อจำกัด
            สามารถเก็บข้อมูลพื้นฐานทั่วไป ข้อมูลวัตถุ และข้อมูลมัลติมีเดียได้ง่าย แต่การประมวลผลรายการ ข้อมูลทั่วไปจะไม่รวดเร็วเท่ากับระบบฐานข้อมูลเชิงสัมพันธ์

คลังข้อมูล (Data Warehouse)
            คือ ที่เก็บรวบรวมข้อมูลจากหลายแหล่งและหลากหลายชนิด เข้าด้วยกัน เป็นฐานข้อมูลขนาดใหญ่ขององค์การ โดยข้อมูลในคลังข้อมูลอาจได้มาจากฐานข้อมูลของระบบปฏิบัติการในองค์การ และฐานข้อมูลจากแห่งภายนอกองค์การ ซึ่งข้อมูลเหล่านี้จะได้รับการเลือก, กลั่นกรอง และปรับแก้ไขทำให้เป็นมาตรฐานเดียวกัน

ดาต้ามาร์ท (Data Mart)
            คือ คลังข้อมูลขนาดเล็กที่มีลักษณะเจาะจง สำหรับใช้ในองค์การธุรกิจ มีค่าใช้จ่ายต่ำกว่าคลังข้อมูล และการจัดทำข้อมูลดาต้ามาร์ท ใช้เวลาที่สั้นกว่าคลังข้อมูล และการนำไปประยุกต์ใช้ในการพัฒนาระบบสนับสนุนการตัดสินใจภายในหน่วยงาน สะดวกกว่าการใช้คลังข้อมูล

ธุรกิจอัจฉริยะ (Business Intelligence: BI)
            คือ การใช้ข้อมูลขององค์การที่มีคุณค่ามาช่วยสนับสนุนการตัดสินใจในการดำเนินงานของธุรกิจ ซึ่งโดยทั่วไปจะเกี่ยวข้องกับการเข้าใช้งานข้อมูล การวิเคราะห์ข้อมูล และการค้นพบโอกาสใหม่ๆ ในการดำเนินการทางธุรกิจ
กรณีศึกษาบทที่ 3
ระบบข้อมูลของโรงพยาบาลบำรุงราษฎร์

1.  ฐานข้อมูลกลางของคนไข้ที่โรงพยาบาลจัดเก็บสามารถนำมาวิเคราะห์โดยใช้ดาด้าไมนิ่งได้อย่างไรบ้าง
ตอบ    1.    สามารถนำมาวิเคราะห์อาการของคนไข้ว่าอยู่ในระดับใด
2.     ทำให้การวินิจฉัยคนไข้ทำได้ถูกต้องแม่นยำและมีความรวดเร็ว
3.     สามารถนำข้อมูลการรักษาต่างๆ มาจัดทำเป็นแผนป้องกัน และเผยแพร่ความรู้ในโรคที่กำลังจะระบาด
4.     สามารถวินิจฉัยเกี่ยวกับโรคที่จะเกิดขึ้นมาใหม่ในอนาคตได้โดยดูได้จากประวัติการดื้อยาของคนไข้

2.  หากโรงพยาบาลต้องการพัฒนาระบบให้เป็น Web Service ท่านคิดว่าระบบควรมีความสามารถในการให้บริการด้านใดบ้าง
ตอบ    1.    สามารถจองคิวรักษาตลอดจนถึงการจองห้องพักล่วงหน้าได้
2.     สามารถตรวจเช็คว่าในโรงพยาบาลมีแพทย์เฉพาะทางหรือไม่
3.     สามารถตรวจสอบราคาของค่าบริการ ค่ารักษาพยาบาล และค่าใช้จ่ายต่าง ๆ ได้
4.     สามารถตรวจสอบได้ว่ามีบริษัทประกันสุขภาพใดบ้างที่สามารถใช้บริการได้ในโรงพยาบาลนี้
5.     สามารถตรวจสอบได้ว่าโรงพยาบาลมีการให้บริการด้านใดบ้าง
6.     ให้บริการดาวโหลดแผนที่ตำแหน่งต่างๆ ภายใน       โรงพยาบาล
7.     นำระบบเว็บแคมมาประยุกต์ใช้สำหรับการเยี่ยมคนไข้ในโรงพยาบาลในกรณีที่ญาติผู้ป่วยต้องการเยี่ยมคนไข้แต่ไม่สะดวกที่จะมาที่โรงพยาบาล


คำถาท้ายบทบทที่ 3

1.  จากภาพที่กำหนดให้ จงอธิบายความหมายของคำต่อไปนี้ พร้อมยกตัวอย่าง
1.1  ฐานข้อมูล (database) ที่เก็บรวบรวมแฟ้มข้อมูลต่างๆ ที่มีความสัมพันธ์กันไว้ด้วยกัน โดยมีระบบการจัดการข้อมูลช่วยในการจัดเก็บและเรียกใช้ข้อมูล ทำให้เกิดสารสนเทศที่นำไปใช้ประโยชน์ต่อองค์กรได้
1.2  คลังข้อมูล (Data Warehouse)  คือที่เก็บรวบรวมข้อมูลจากหลายแหล่งและหลากหลายชนิด เข้าด้วยกัน เป็นฐานข้อมูลขนาดใหญ่ขององค์การ โดยข้อมูลในคลังข้อมูลอาจได้มาจากฐานข้อมูลของระบบปฏิบัติการในองค์การ และฐานข้อมูลจากแห่งภายนอกองค์การ ซึ่งข้อมูลเหล่านี้จะได้รับการเลือก, กลั่นกรอง และปรับแก้ไขทำให้เป็นมาตรฐานเดียวกัน
1.3  ดาต้ามาร์ท (Data Mart) คือคลังข้อมูลขนาดเล็กที่มีลักษณะเจาะจง สำหรับใช้ในองค์การธุรกิจ มีค่าใช้จ่ายต่ำกว่าคลังข้อมูล และการจัดทำข้อมูลดาต้ามาร์ท ใช้เวลาที่สั้นกว่าคลังข้อมูล และการนำไปประยุกต์ใช้ในการพัฒนาระบบสนับสนุนการตัดสินใจภายในหน่วยงาน สะดวกกว่าการใช้คลังข้อมูล
1.4  ดาต้าไมนิ่ง (Data Mining) เป็นเทคโนโลยีสารสนเทศที่สามารถกลั่นกรอง วิเคราะห์ข้อมูลที่มีปริมาณมหาศาลเพื่อให้ได้ข้อมูลที่มีประโยชน์หรือได้ข้อมูลที่ซ่อนเร้นอยู่ในข้อมูลที่มีปริมาณมหาศาล และนำข้อมูลที่มีประโยชน์มาใช้เป็นฐานความรู้เพื่อช่วยในการบริหารงาน
1.5  การประมวลผลเชิงวิเคราะห์แบบออนไลน์ (OLAP) เป็นเครื่องมือที่มีความสามารถในการค้นหารและวิเคราะห์ข้อมูลจากคลังข้อมูลเพื่อตอบสนองความต้องการของผู้ใช้ได้อย่างรวดเร็ว โดยสามารถใช้ OLAP ในการวิเคราะห์ข้อมูลในลักษณะต่างๆ เช่น การหมุนมิติ, การเลือกช่วงข้อมูล, การเลือกลำดับชั้นของข้อมูล
1.6  จากภาพที่กำหนด A, B และ C ให้ จงระบุและอธิบายว่า A, B และ C หมายถึงสิ่งใด
A  = คลังข้อมูล (Data Warehouse)  คือที่เก็บรวบรวมข้อมูลจากหลายแหล่งและหลากหลายชนิดเข้าด้วยกัน
B = ดาต้ามาร์ท (Data Mart) คือ คลังข้อมูลขนาดเล็กที่มีลักษณะเฉพาะเจาะจงและใช้สำหรับองค์การธุรกิจ
C = ดาต้าไมนิ่ง (Data Mining) คือเครื่องมือในการสกัดข้อมูลและประมวลผลในเชิงวิเคราะห์ขั้นสูงจากฐานข้อมูลขนาดใหญ่

2.  จงอธิบายถึงประโยชน์ของคลังข้อมูลที่มีต่อพนักงานปฏิบัติการขององค์การ
            -  ช่วยลดปริมาณในการจัดเก็บข้อมูล
            -  ช่วยลดการซ้ำซ้อนของข้อมูลในการจัดเก็บ
-  ช่วยในการค้นหาข้อมูลได้ง่ายและนำมาใช้อย่างมีประสิทธิภาพ
-  ช่วยในการรักษาความปลอดภัยของข้อมูล
-  การนำข้อมูลที่ต้องนำไปประมวลผลได้อย่างรวดเร็ว

3.  ธุรกิจอัจฉริยะ หรือ Business Intelligence คืออะไร และมีการนำไปใช้งานอะไร
            คือ การใช้ข้อมูลขององค์การที่มีคุณค่ามาช่วยสนับสนุนการตัดสินใจในการดำเนินงานของธุรกิจ ซึ่งโดยทั่วไปจะเกี่ยวข้องกับการเข้าใช้งานข้อมูล การวิเคราะห์ข้อมูล และการค้นพบโอกาสใหม่ๆ ในการดำเนินการทางธุรกิจ
            การนำไปใช้ ได้แก่
            -  การจัดทำประวัติของลูกค้า
-  การประเมินถึงสภาพของตลาด
-  การจัดกลุ่มของตลาด
- การจัดลำดับทางด้านเครดิต
-  การเพิ่มความสามารถในกรทำกำไรของผลิตภัณฑ์
-  การจัดการความเคลื่อนไหวของสินค้าคงคลัง

4.  จงยกตัวอย่างการประยุกต์ใช้ดาต้าไมนิ่งในธุรกิจอื่นๆ ที่ยังไม่ได้กล่าวถึงในบทนี้มาอย่างน้อย 3 ตัวอย่าง
ธุรกิจโทรคมนาคม
-  วิเคราะห์การใช้สื่อโทรคมนาคมของประชาชน
-  ทำนายการพัฒนาของอุปกรณ์สื่อสารในอนาคต
-  การวิเคราะห์และพัฒนาหารูปแบบใหม่ๆ ในการให้บริการ
ธุรกิจรักษาความปลอดภัย          
-  วิเคราะห์แนวโน้มการก่ออาชญากรรมพื้นที่ต่างๆที่อาจเกิดขึ้น
            -  สามารถวิเคราะห์ความประพฤติและพฤติกรรมของแต่ละชุมชนที่ให้บริการ
            - วิเคราะห์ถึงระบบการรักษาความปลอดภัยในเขตชุมชนต่างๆ
            -  วิเคราะห์และจัดสรรบุคคลกรที่เหมาะสมในการให้บริการแต่ละพื้นที่
ธุรกิจให้การศึกษาต่างๆ
            -  สามารถวิเคราะห์ถึงแนวโน้มการศึกษาในอนาคต
            -  สามารถนำมาปรับเปลี่ยนการให้ความรู้แก่นักศึกษาในแนวทางที่เกิดขึ้นในอนาคต (การศึกษาแผนใหม่)
            - วิเคราะห์และพัฒนาบุคลากรในสถานศึกษาให้มีคุณภาพระดับแนวหน้า

5.  จากปัญหาของแฟ้มข้อมูลที่ได้กล่าวในตอนต้นของบทนี้ ท่านคิดว่าคลังข้อมูลและดาต้าไมนิ่งช่วยแก้ปัญหาดังกล่าวอย่างไรบ้าง
คลังข้อมูลมีการเก็บรวบรวมข้อมูลจากหลายแหล่งและหลากหลายชนิด เข้าด้วยกัน ซึ่งข้อมูลเหล่านี้จะได้รับการเลือก, กลั่นกรอง และปรับแก้ไขทำให้เป็นมาตรฐานเดียวกัน และยังมีดาต้าไมนิ่งซึ่งช่วยในการ ประมวลผลและวิเคราะห์ข้อมูลให้เกิดความรู้ใหม่ๆจึงส่งผลให้มีความคล่องตัวในการใช้ลดความช้ำซ้อนของข้อมูล, มีความเป็นอิสระของข้อมูล, สนับสนุนการใช้งานร่วมกัน, มีความคล่องตัวในการใช้งานและ มีระบบรักษาความปลอดภัยของข้อมูล

ไม่มีความคิดเห็น:

แสดงความคิดเห็น