สิ่งเล็ก ๆ ที่เรียกว่า Big Data

เทคโนโลยี Big Data จริง ๆ ก็คือ เทคโนโลยีที่ใช้จัดการกับข้อมูลที่ปริมาณมหาศาล (Volume) มีการเปลี่ยนแปลงอย่างรวดเร็ว (Velocity) และมีความหลากหลายทั้งตัวของข้อมูลเองและจากแหล่งที่มา (Variety) เพื่อรองรับการจัดเก็บและวิเคราะห์ให้มีประสิทธิภาพมากขึ้น รวมถึงต้นทุนที่ใช้ในการจัดการที่ลดลง ในบทความนี้เราจะมาพูดถึงลักษณะของข้อมูลขนาดเล็ก ๆ จะกลายเป็นสิ่งที่เรียกว่า Big Data ได้อย่างไร ไปจนลักษณะของเทคโนโลยีที่ใช้จัดการข้อมูลขนาดใหญ่เหล่านี้กัน

ในทุกวันนี้ข้อมูลถูกสร้างขึ้นอย่างมากมายจากหลายแหล่งที่มา ไม่ว่าจะเป็นภาคเศรษฐกิจ การธนาคาร หรือไม่ว่าจะเป็นจากรัฐบาลเอง  เนื่องจากมีการพัฒนาของเทคโนโลยีอย่างก้าวกระโดด ไม่ว่าจะเป็น Internet of things และ Cloud Computing ทำให้เกิดการแพร่หลายของอุปกรณ์เทคโนโลยีที่ฉลาดและทันสมัย

แหล่งที่มาของข้อมูล

ข้อมูลที่ถูกสร้างขึ้นนี้ หากจะมองคร่าว ๆ ก็อาจจะแยกย่อยออกมาเพื่อให้เห็นภาพรวมดังนี้ครับ

  • People-People: การที่คนสื่อสารกันใน Internet ก็ทำให้เกิดข้อมูลขึ้นมากมาย อย่างเช่นการใช้งาน เฟซบุ๊ก ทวิตเตอร์ หรืออินสตาแกรม ซึ่งข้อมูลที่มาจากคนสื่อสารกันนี้อาจจะเป็นรูปแบบของรูปภาพหรือข้อความก็ได้ครับ
  • People-Machine: การที่คนเข้าเว็บหรือการใช้งานคอมพิวเตอร์ ก็เป็นการสื่อสารระหว่างคนกับเครื่องคอมครับ ส่วนข้อมูลที่เกิดขึ้นก็จะเป็น Log ครับซึ่งจะเป็นไฟล์ที่บันทึกเหตุการณ์ต่าง ๆที่เกิดขึ้นในระบบครับ
  • Machine-Machine: การที่เครื่องเขาสื่อสารกันครับ แล้วเขาจะสื่อสารกันอย่างไรล่ะครับ ผมจะยกตัวอย่างให้เห็นภาพนะครับ เช่น อุปกรณ์โทรศัพท์ของเราก็จะมีเครื่องอุปกรณ์หรือ Censer ต่าง ๆ ให้มันสื่อสารและทำงานร่วมกัน อย่างตอนที่เราจับโทรศัพท์ขึ้นมาแล้วหน้าจอก็สว่างขึ้นเองครับ

ลักษณะของเทคโนโลยี Big Data

จากข้อมูลที่มาจากหลายแหล่งที่มา ปริมาณมหาศาล และมีหลายประเภท สิ่งที่เกิดขึ้นต่อมาคือ การจัดเก็บข้อมูลที่มีลักษณะที่หลากหลาย จนเกิดเป็นเทคโนโลยีที่เรียกว่า Big Data นั่นเองครับ

จากที่ได้กล่าวไปก่อนหน้านั้นที่ว่า Big Data คืออะไร และใช้สำหรับอะไร อย่างที่หลายคนได้เจอในสื่อต่าง ๆ ที่มักจะใช้ตัว V นำเสนอถึงลักษณะของเทคโนโลยี Big Data ซึ่งโดยทั่วไปแล้วก็จะมี 3V นั่นก็คือปริมาณ (Volume) ความเร็ว (Velocity) และความหลากหลาย (Variety) หากจะหาเทคโนโลยีที่มีความสามารถในจัดการกับลักษณะทั้งสามแบบได้พร้อมกันขนาดนี้ก็ไม่ใช่เรื่องง่ายแล้วนะครับ

ในปัจจุบันการพัฒนาของ Big Data  ไม่ได้หยุดเพียงเท่านี้ เพราะการที่เทคโนโลยีที่ก้าวกระโดด การใช้ Big Data แบบทั่วจึงต้องมีอีก 3V เพิ่มขึ้นมาเพื่อรองรับรับกับเทคโนโลยีที่เปลี่ยนแปลง รวม ๆแล้วจึงมีถึง 6V นั่นเอง โดยแต่ละ V มีลักษณะต่อไปนี้

  • Volume: ลักษณะของข้อมูลปริมาณมหาศาลที่ต้องการพื้นที่จัดเก็บจำนวนมาก
  • Velocity: ลักษณะของข้อมูลที่ถูกสร้างขึ้นอย่างรวดเร็วและทันต่อเหตุการณ์
  • Variety: ลักษณะของข้อมูลที่มีความหลากหลายทั้งในตัวข้อมูลเองและหลากหลายในเรื่องของแหล่งที่มา
  • Veracity: ข้อมูลที่มีความน่าเชื่อถือที่ลดความผิดปกติของข้อมูล
  • Variability: การรวบรวมความหลากหลายของข้อมูลเพื่อสามารถวิเคราะห์ได้อย่างหลากหลาย
  • Value: ข้อมูลที่มีจุดประสงค์ในการจัดเก็บเพื่อหาความสัมพันธ์ที่เป็นประโยชน์ทางธุรกิจ

แต่การพัฒนาของเทคโนโลยีไม่ได้จบเพียงเท่านี้ เพราะการที่เทคโนโลยีพัฒนามากขึ้น มันบ่งบอกถึงประสิทธิภาพในการจัดเก็บและการใช้ข้อมูล ซึ่งหากองค์กรใดสามารถพัฒนา Big Data ที่มีประสิทธิภาพสูงได้ ก็อาจหมายถึง โอกาสทางธุรกิจในอนาคต

Related products

Apisit Anuntawan

If data was magic, I would be a wizard. การศึกษาปริญญาตรีและโทจากคณะเศรษฐศาสตร์ มหาวิทยาลัยเชียงใหม่มีความถนัดในการทำข้อมูลและการสร้างแบบจำลอง โดยเฉพาะเรื่องของ Big Data, Machine Learning, และBayesian.

Similar tags

Sirirat kantanat

Jupyter Notebook คือ เครื่องมือสำหรับ Data Science

เครื่องมือที่เราจะใช้ในการจัดการข้อมูลและการทำ Machine Learning ที่เรียกว่า Jupyter Notebook

Read more...
Apisit Anuntawan

Hello “AI”

บ่อยครั้งที่เราเล่นคอมพิวเตอร์หรือฟังข่าวก็มักจะได้ยินคำว่า “เอไอ (AI) ที่ฉลาด” “แมชชีนเลิร์นนิ่ง (Machine Learning)

Read more...
Sirirat kantanat

MACHINE LEARNING THE FUTURE IS NOW

Machine Learning คือ การที่คอมพิวเตอร์สามารถเรียนรู้ได้ด้วยตัวของมันเอง โดยที่เราไม่ได้เขียนโปรแกรมสั่งมัน ซึ่งมันจะมีการเรียนรู้ทั้งหมด 3 แบบ

Read more...