สิ่งเล็ก ๆ ที่เรียกว่า Big Data

เทคโนโลยี Big Data จริง ๆ ก็คือ เทคโนโลยีที่ใช้จัดการกับข้อมูลที่ปริมาณมหาศาล (Volume) มีการเปลี่ยนแปลงอย่างรวดเร็ว (Velocity) และมีความหลากหลายทั้งตัวของข้อมูลเองและจากแหล่งที่มา (Variety) เพื่อรองรับการจัดเก็บและวิเคราะห์ให้มีประสิทธิภาพมากขึ้น รวมถึงต้นทุนที่ใช้ในการจัดการที่ลดลง ในบทความนี้เราจะมาพูดถึงลักษณะของข้อมูลขนาดเล็ก ๆ จะกลายเป็นสิ่งที่เรียกว่า Big Data ได้อย่างไร ไปจนลักษณะของเทคโนโลยีที่ใช้จัดการข้อมูลขนาดใหญ่เหล่านี้กัน

ในทุกวันนี้ข้อมูลถูกสร้างขึ้นอย่างมากมายจากหลายแหล่งที่มา ไม่ว่าจะเป็นภาคเศรษฐกิจ การธนาคาร หรือไม่ว่าจะเป็นจากรัฐบาลเอง  เนื่องจากมีการพัฒนาของเทคโนโลยีอย่างก้าวกระโดด ไม่ว่าจะเป็น Internet of things และ Cloud Computing ทำให้เกิดการแพร่หลายของอุปกรณ์เทคโนโลยีที่ฉลาดและทันสมัย

แหล่งที่มาของข้อมูล

ข้อมูลที่ถูกสร้างขึ้นนี้ หากจะมองคร่าว ๆ ก็อาจจะแยกย่อยออกมาเพื่อให้เห็นภาพรวมดังนี้ครับ

  • People-People: การที่คนสื่อสารกันใน Internet ก็ทำให้เกิดข้อมูลขึ้นมากมาย อย่างเช่นการใช้งาน เฟซบุ๊ก ทวิตเตอร์ หรืออินสตาแกรม ซึ่งข้อมูลที่มาจากคนสื่อสารกันนี้อาจจะเป็นรูปแบบของรูปภาพหรือข้อความก็ได้ครับ
  • People-Machine: การที่คนเข้าเว็บหรือการใช้งานคอมพิวเตอร์ ก็เป็นการสื่อสารระหว่างคนกับเครื่องคอมครับ ส่วนข้อมูลที่เกิดขึ้นก็จะเป็น Log ครับซึ่งจะเป็นไฟล์ที่บันทึกเหตุการณ์ต่าง ๆที่เกิดขึ้นในระบบครับ
  • Machine-Machine: การที่เครื่องเขาสื่อสารกันครับ แล้วเขาจะสื่อสารกันอย่างไรล่ะครับ ผมจะยกตัวอย่างให้เห็นภาพนะครับ เช่น อุปกรณ์โทรศัพท์ของเราก็จะมีเครื่องอุปกรณ์หรือ Censer ต่าง ๆ ให้มันสื่อสารและทำงานร่วมกัน อย่างตอนที่เราจับโทรศัพท์ขึ้นมาแล้วหน้าจอก็สว่างขึ้นเองครับ

ลักษณะของเทคโนโลยี Big Data

จากข้อมูลที่มาจากหลายแหล่งที่มา ปริมาณมหาศาล และมีหลายประเภท สิ่งที่เกิดขึ้นต่อมาคือ การจัดเก็บข้อมูลที่มีลักษณะที่หลากหลาย จนเกิดเป็นเทคโนโลยีที่เรียกว่า Big Data นั่นเองครับ

จากที่ได้กล่าวไปก่อนหน้านั้นที่ว่า Big Data คืออะไร และใช้สำหรับอะไร อย่างที่หลายคนได้เจอในสื่อต่าง ๆ ที่มักจะใช้ตัว V นำเสนอถึงลักษณะของเทคโนโลยี Big Data ซึ่งโดยทั่วไปแล้วก็จะมี 3V นั่นก็คือปริมาณ (Volume) ความเร็ว (Velocity) และความหลากหลาย (Variety) หากจะหาเทคโนโลยีที่มีความสามารถในจัดการกับลักษณะทั้งสามแบบได้พร้อมกันขนาดนี้ก็ไม่ใช่เรื่องง่ายแล้วนะครับ

ในปัจจุบันการพัฒนาของ Big Data  ไม่ได้หยุดเพียงเท่านี้ เพราะการที่เทคโนโลยีที่ก้าวกระโดด การใช้ Big Data แบบทั่วจึงต้องมีอีก 3V เพิ่มขึ้นมาเพื่อรองรับรับกับเทคโนโลยีที่เปลี่ยนแปลง รวม ๆแล้วจึงมีถึง 6V นั่นเอง โดยแต่ละ V มีลักษณะต่อไปนี้

  • Volume: ลักษณะของข้อมูลปริมาณมหาศาลที่ต้องการพื้นที่จัดเก็บจำนวนมาก
  • Velocity: ลักษณะของข้อมูลที่ถูกสร้างขึ้นอย่างรวดเร็วและทันต่อเหตุการณ์
  • Variety: ลักษณะของข้อมูลที่มีความหลากหลายทั้งในตัวข้อมูลเองและหลากหลายในเรื่องของแหล่งที่มา
  • Veracity: ข้อมูลที่มีความน่าเชื่อถือที่ลดความผิดปกติของข้อมูล
  • Variability: การรวบรวมความหลากหลายของข้อมูลเพื่อสามารถวิเคราะห์ได้อย่างหลากหลาย
  • Value: ข้อมูลที่มีจุดประสงค์ในการจัดเก็บเพื่อหาความสัมพันธ์ที่เป็นประโยชน์ทางธุรกิจ

แต่การพัฒนาของเทคโนโลยีไม่ได้จบเพียงเท่านี้ เพราะการที่เทคโนโลยีพัฒนามากขึ้น มันบ่งบอกถึงประสิทธิภาพในการจัดเก็บและการใช้ข้อมูล ซึ่งหากองค์กรใดสามารถพัฒนา Big Data ที่มีประสิทธิภาพสูงได้ ก็อาจหมายถึง โอกาสทางธุรกิจในอนาคต

Related products

Apisit Anuntawan

If data was magic, I would be a wizard. การศึกษาปริญญาตรีและโทจากคณะเศรษฐศาสตร์ มหาวิทยาลัยเชียงใหม่มีความถนัดในการทำข้อมูลและการสร้างแบบจำลอง โดยเฉพาะเรื่องของ Big Data, Machine Learning, และBayesian.

Similar tags

Apisit Anuntawan

การจัดการ Big Data (Hadoop และ MapReduce)

ในการจัดการข้อมูลขนาดใหญ่หรือ Big Data มักมีการใช้ระบบสถาปัตยกรรมแบบ Hadoop ในการจัดการข้อมูล ไม่ว่าจะเป็นบริษัท Facebook หรือ eBay

Read more...
Apisit Anuntawan

สิ่งเล็ก ๆ ที่เรียกว่า Big Data

เทคโนโลยี Big Data จริง ๆ ก็คือ เทคโนโลยีที่ใช้จัดการกับข้อมูลที่ปริมาณมหาศาล มีการเปลี่ยนแปลงอย่างรวดเร็ว และมีความหลากหลายจากแหล่งที่มา

Read more...
Sirirat kantanat

Jupyter Notebook คือ เครื่องมือสำหรับ Data Science

เครื่องมือที่เราจะใช้ในการจัดการข้อมูลและการทำ Machine Learning ที่เรียกว่า Jupyter Notebook

Read more...