What is Big Data ?

เคยสงสัยหรือมั้ย ? ว่าBig Dataซึ่งเป็นเทคโนโลยีที่กำลังเป็นที่นิยมในไม่กี่ปีที่ผ่านมานี้ ตกลงมันคืออะไร ? กันแน่ มีสมบัติอย่างไร และเกี่ยวข้องอะไรในแวดวงธุรกิจยุคใหม่ ซึ่งเป็นข้อมูลทุกอย่างที่มีอยู่ในองค์กรนั้นเอง ถ้าจะพูดว่า Big Data is all around ก็ไม่ผิดเพราะไม่ว่าจะเป็น Database รูปแบบใด หรือมาจากไหนก็ตาม

โดยในบทความนี้จะนำเสนอคุณสมบัติ (4 Vs) และสรุปการนำข้อมูลที่มีไปใช้ในภาคธุรกิจได้อย่างไร

คุณสมบัติของ Big Data (4Vs)

1. Volume

Big Dataเป็นศูนย์รวมของข้อมูลที่มีขนาดใหญ่ โดยพัฒนาจากข้อมูลที่มีโครงสร้าง กึ่งโครงสร้าง และไม่มีโครงสร้างที่มีปริมาณมาก ๆ ซึ่งมีศักยภาพสูงในการค้นหาข้อมูล ทำงานร่วมกับระบบ Machine Learning และเครื่องมือวิเคราะห์ข้อมูลอื่น ๆ (Log nalytic Tool)

เพราะฉะนั้นจึงเป็นศูนย์รวม Database ขนาดใหญ่ที่เต็มไปด้วยข้อมูลต่าง ๆ มากมาย โดยที่จะไม่มีการรวมกันจะเป็นการแบ่งแยกข้อมูลกันอย่างชัดเจน

ยกตัวอย่างเช่น การใช้การวิเคราะห์ข้อมูลโดยมีเป้าหมายในการวัดจากยอดขายที่จะเกิดขึ้นในอนาคต ซึ่งสามารถประมาณการได้จากยอดขายที่ขายได้ในอดีต ข้อมูลการส่งคืนสินค้า และข้อมูลที่ลูกค้าซื้อสินค้าออนไลน์

2. Variety

ปริมาณข้อมูลที่เก็บสะสมอยู่นั้นมีความหลากหลาย และมาจากหลาย ๆ ที่ ยกตัวอย่างเช่น ระบบธุรกรรมทางธุรกิจ ฐานข้อมูลลูกค้า ข้อมูลการใช้งานอินเตอร์เน็ต แอพพลิเคชั้น Social Network ผลการทดลองทางวิทยาศาสตร์ ข้อมูลที่เกิดจากการทำงานของเครื่องจักร และข้อมูลที่ Real Time ซึ่งก่อนที่จะซอฟแวร์จะนำ Log มาวิเคราะห์จะต้องใช้เครื่องในการขุด (data mining) และแปรสภาพ Raw Log ให้สามารถใช้งานได้

3. Velocity

Big Dataมีความสามารถในการนำข้อมูลมาวิเคราะห์ และการดำเนินงานได้อย่างรวดเร็ว ได้แก่

การอัพเดทข้อมูลแบบ Real Time และการเปรียบเทียบข้อมูลที่เก็บไว้แบบรายวันเดือน หรือปี

ซึ่งเป็นการนำข้อมูลที่มีอยู่มาวิเคราะห์นั้นเอง นอกจากนี้ยังสามารถหาคำตอบหรือผลลัพท์ที่ได้ขึ้นอยู่การประมวลผลที่ครอบคลุมโดยนักวิเคราห์ข้อมูลจะต้องทำความเข้าใจข้อมูลที่มีอยู่ และแน่ใจว่าข้อมูลที่มีอยู่มีความถูกต้อง และอัพเดทล่าสุด

ดังนั้นความรวดเร็วในการวิเคราะห์ข้อมูลเป็นหนึ่งใน Capabilty ที่สามารถต่อยอดเรื่องการทำ Machine Learning และ ปัญญาประดิษฐ์ (AI) ซึ่งเป็นการสร้างกระบวนการวิเคราะห์ และจัดรูปแบบของข้อมูลอย่างอัตโนมัติ

4. Veracity

ความถูกต้องของข้อมูล นั่นหมายถึงระดับความมั่นใจของชุดข้อมูล Raw Log ที่มาจากหลาย ๆ ที่ เช่น

  • Social Media
  • เว็บไซน์
  • อุปกรณ์ไอทีต่าง ๆ ในองค์กร

โดยคำนึงถึงคุณภาพของข้อมูลเป็นสำคัญ ยกตัวอย่างเช่น บริษัทหนึ่งเก็บ log จากร้อย ๆ ที่ซึ่งอาจจะระบุที่มาของข้อมูลได้ไม่ถูกต้อง แต่นักวิเคราะห์ข้อมูลต้องการติดตามข้อมูลว่ามาจากไหนเพื่อที่จะจัดรูปแบบของข้อมูลได้อย่างถูกต้อง

ข้อมูลไม่รู้ที่มา (ไม่มีความถูกต้อง) จะนำพาไปสู่การวิเคราะห์ที่ผิดพลาดได้ ส่งผลให้คุณค่าของ Bussines Analytices ลดทอนลงเพราะ ผู้บริหารจะหมดความเชื่อใจข้อมูล โดยข้อมูลที่ไม่รู้ที่มานั้นจะถูกนับก่อนที่จะเข้าสู่ Log Centralization

ดังนั้น ทีมไอที และนักวิเคราะห์มีความต้องการที่จะแน่ใจได้ว่าข้อมูลที่เก็บได้มีความถูกต้องเพื่อนนำสู่ผลลัพท์ที่มีประสิทธิภาพ

การนำ Big Data ไปใช้ในองค์กร

องค์กรส่วนใหญ่นำไปใช้เพื่อสร้างความได้เปรียบทางการแข่งขัน โดยนำข้อมูลที่มีอยู่มากำหนดกลยุทธ์ วิเคราะห์สภาพตลาด พัฒนานวัตกรรมใหม่ ๆ เพื่อสนองต่อผู้ใช้งานในอนาคต

ช่วยให้องค์กรค้นพบโอกาสในการเติบโตทางธุรกิจใหม่ ๆ และนวัตกรรมใหม่ที่น่าสนใจที่สามารถวิเคราะห์ได้จากข้อมูลที่มี ในหลาย ๆ บริษัทมีข้อมูลมากพอเกี่ยวกับสินค้า และบริการ ผู้ใช้งาน – ลูกค้า ซัพพลายเออร์ รวมถึงความต้องการของผู้บริโภคที่สามารถเข้าถึง และวิเคราะห์ได้

นอกจากนี้ยังช่วยให้เข้าใจสภาพตลาดในปัจจุบัน โดยการวิเคราะห์พฤติกรรมการซื้อสินค้าของลูกค้าซึ่งสามารถหาได้จากสินค้าที่มียอดขามมากที่สุด และทำการผลิตสินค้าตามเทรนนั้น

เพราะฉะนั้นจะสรุปได้ว่า บริษัทใช้ประโยชน์จากข้อมูลที่มีในการปรับปรุงระบบการดำเนินงาน ปรับปรุงการบริการลูกค้าให้ดีขึ้น คิดค้นแผนการตลาดที่สามารถไปถึงกลุ่มลูกแบบเจาะจงมากขึ้นเพื่อสร้างกำไรให้กับองค์กร อีกทั้งยังไปใช้ในหาสาเหตุของความเสี่ยงเพื่อหาทางแก้ไข และป้องกัน สร้างคุณค่า (Value) ให้แก่องค์กรด้วย Log file ที่เก็บไว้เป็นอีกหนึ่งแนวทางในการจัดสรรค์ข้อมูลที่มีขนาดใหญ่ได้นั้นเอง (Variability)

Related products

No Product found.
Sirirat kantanat

นักเรียนทุนจุฬาลงกรณ์มหาวิทยาลัย หลักสูตรเศรษฐศาสตรบัณฑิต มีความเชี่ยวชาญด้านการประมาณการเชิงสถิติ กำลังศึกษาวิจัยและพัฒนาวิธีการประยุกต์ใช้ Machine Learningและ Data Scienceกับธุรกิจสมัยใหม่ ปัจจุบันกำลังทำวิจัย เรื่องการตรวจจับ Malicious URLs โดยใช้ Machine learning เพื่อเป็นการป้องกันการ Phishing จาก Threat เพื่อนำไป implement กับระบบ log management

Similar tags

Apisit Anuntawan

การจัดการ Big Data (Spark)

Spark คือหนึ่งในเทคโนโลยีที่ใช้งานกับบิ๊กดาต้าที่ได้รับความนิยมสูง เนื่องจากใช้งานง่ายและยังเป็นแพลตฟอร์มที่เป็น Open Source ที่สามารถใช้งานได้

Read more...
Apisit Anuntawan

การจัดการ Big Data (Hadoop และ MapReduce)

ในการจัดการข้อมูลขนาดใหญ่หรือ Big Data มักมีการใช้ระบบสถาปัตยกรรมแบบ Hadoop ในการจัดการข้อมูล ไม่ว่าจะเป็นบริษัท Facebook หรือ eBay

Read more...
Apisit Anuntawan

สิ่งเล็ก ๆ ที่เรียกว่า Big Data

เทคโนโลยี Big Data จริง ๆ ก็คือ เทคโนโลยีที่ใช้จัดการกับข้อมูลที่ปริมาณมหาศาล มีการเปลี่ยนแปลงอย่างรวดเร็ว และมีความหลากหลายจากแหล่งที่มา

Read more...