เคยสงสัยหรือมั้ย ? ว่าBig Dataซึ่งเป็นเทคโนโลยีที่กำลังเป็นที่นิยมในไม่กี่ปีที่ผ่านมานี้ ตกลงมันคืออะไร ? กันแน่ มีสมบัติอย่างไร และเกี่ยวข้องอะไรในแวดวงธุรกิจยุคใหม่ ซึ่งเป็นข้อมูลทุกอย่างที่มีอยู่ในองค์กรนั้นเอง ถ้าจะพูดว่า Big Data is all around ก็ไม่ผิดเพราะไม่ว่าจะเป็น Database รูปแบบใด หรือมาจากไหนก็ตาม
โดยในบทความนี้จะนำเสนอคุณสมบัติ (4 Vs) และสรุปการนำข้อมูลที่มีไปใช้ในภาคธุรกิจได้อย่างไร
คุณสมบัติของ Big Data (4Vs)
1. Volume
Big Dataเป็นศูนย์รวมของข้อมูลที่มีขนาดใหญ่ โดยพัฒนาจากข้อมูลที่มีโครงสร้าง กึ่งโครงสร้าง และไม่มีโครงสร้างที่มีปริมาณมาก ๆ ซึ่งมีศักยภาพสูงในการค้นหาข้อมูล ทำงานร่วมกับระบบ Machine Learning และเครื่องมือวิเคราะห์ข้อมูลอื่น ๆ (Log nalytic Tool)
เพราะฉะนั้นจึงเป็นศูนย์รวม Database ขนาดใหญ่ที่เต็มไปด้วยข้อมูลต่าง ๆ มากมาย โดยที่จะไม่มีการรวมกันจะเป็นการแบ่งแยกข้อมูลกันอย่างชัดเจน
ยกตัวอย่างเช่น การใช้การวิเคราะห์ข้อมูลโดยมีเป้าหมายในการวัดจากยอดขายที่จะเกิดขึ้นในอนาคต ซึ่งสามารถประมาณการได้จากยอดขายที่ขายได้ในอดีต ข้อมูลการส่งคืนสินค้า และข้อมูลที่ลูกค้าซื้อสินค้าออนไลน์
![](https://assets-global.website-files.com/5f583e0d98e34c0d7fac3685/5f5f1fa65096bf0db6597053_Detail_Pic_Volume.png)
2. Variety
ปริมาณข้อมูลที่เก็บสะสมอยู่นั้นมีความหลากหลาย และมาจากหลาย ๆ ที่ ยกตัวอย่างเช่น ระบบธุรกรรมทางธุรกิจ ฐานข้อมูลลูกค้า ข้อมูลการใช้งานอินเตอร์เน็ต แอพพลิเคชั้น Social Network ผลการทดลองทางวิทยาศาสตร์ ข้อมูลที่เกิดจากการทำงานของเครื่องจักร และข้อมูลที่ Real Time ซึ่งก่อนที่จะซอฟแวร์จะนำ Log มาวิเคราะห์จะต้องใช้เครื่องในการขุด (data mining) และแปรสภาพ Raw Log ให้สามารถใช้งานได้
![](https://assets-global.website-files.com/5f583e0d98e34c0d7fac3685/5f5f1fbf63b7d07684b0bb29_Detail_Pic_Velocity.png)
3. Velocity
Big Dataมีความสามารถในการนำข้อมูลมาวิเคราะห์ และการดำเนินงานได้อย่างรวดเร็ว ได้แก่
การอัพเดทข้อมูลแบบ Real Time และการเปรียบเทียบข้อมูลที่เก็บไว้แบบรายวันเดือน หรือปี
ซึ่งเป็นการนำข้อมูลที่มีอยู่มาวิเคราะห์นั้นเอง นอกจากนี้ยังสามารถหาคำตอบหรือผลลัพท์ที่ได้ขึ้นอยู่การประมวลผลที่ครอบคลุมโดยนักวิเคราห์ข้อมูลจะต้องทำความเข้าใจข้อมูลที่มีอยู่ และแน่ใจว่าข้อมูลที่มีอยู่มีความถูกต้อง และอัพเดทล่าสุด
ดังนั้นความรวดเร็วในการวิเคราะห์ข้อมูลเป็นหนึ่งใน Capabilty ที่สามารถต่อยอดเรื่องการทำ Machine Learning และ ปัญญาประดิษฐ์ (AI) ซึ่งเป็นการสร้างกระบวนการวิเคราะห์ และจัดรูปแบบของข้อมูลอย่างอัตโนมัติ
![](https://assets-global.website-files.com/5f583e0d98e34c0d7fac3685/5f5f1fc8a1c14751e3e9151a_Detail_Pic_Veracity.png)
4. Veracity
ความถูกต้องของข้อมูล นั่นหมายถึงระดับความมั่นใจของชุดข้อมูล Raw Log ที่มาจากหลาย ๆ ที่ เช่น
- Social Media
- เว็บไซน์
- อุปกรณ์ไอทีต่าง ๆ ในองค์กร
โดยคำนึงถึงคุณภาพของข้อมูลเป็นสำคัญ ยกตัวอย่างเช่น บริษัทหนึ่งเก็บ log จากร้อย ๆ ที่ซึ่งอาจจะระบุที่มาของข้อมูลได้ไม่ถูกต้อง แต่นักวิเคราะห์ข้อมูลต้องการติดตามข้อมูลว่ามาจากไหนเพื่อที่จะจัดรูปแบบของข้อมูลได้อย่างถูกต้อง
ข้อมูลไม่รู้ที่มา (ไม่มีความถูกต้อง) จะนำพาไปสู่การวิเคราะห์ที่ผิดพลาดได้ ส่งผลให้คุณค่าของ Bussines Analytices ลดทอนลงเพราะ ผู้บริหารจะหมดความเชื่อใจข้อมูล โดยข้อมูลที่ไม่รู้ที่มานั้นจะถูกนับก่อนที่จะเข้าสู่ Log Centralization
ดังนั้น ทีมไอที และนักวิเคราะห์มีความต้องการที่จะแน่ใจได้ว่าข้อมูลที่เก็บได้มีความถูกต้องเพื่อนนำสู่ผลลัพท์ที่มีประสิทธิภาพ
การนำ Big Data ไปใช้ในองค์กร
องค์กรส่วนใหญ่นำไปใช้เพื่อสร้างความได้เปรียบทางการแข่งขัน โดยนำข้อมูลที่มีอยู่มากำหนดกลยุทธ์ วิเคราะห์สภาพตลาด พัฒนานวัตกรรมใหม่ ๆ เพื่อสนองต่อผู้ใช้งานในอนาคต
ช่วยให้องค์กรค้นพบโอกาสในการเติบโตทางธุรกิจใหม่ ๆ และนวัตกรรมใหม่ที่น่าสนใจที่สามารถวิเคราะห์ได้จากข้อมูลที่มี ในหลาย ๆ บริษัทมีข้อมูลมากพอเกี่ยวกับสินค้า และบริการ ผู้ใช้งาน – ลูกค้า ซัพพลายเออร์ รวมถึงความต้องการของผู้บริโภคที่สามารถเข้าถึง และวิเคราะห์ได้
นอกจากนี้ยังช่วยให้เข้าใจสภาพตลาดในปัจจุบัน โดยการวิเคราะห์พฤติกรรมการซื้อสินค้าของลูกค้าซึ่งสามารถหาได้จากสินค้าที่มียอดขามมากที่สุด และทำการผลิตสินค้าตามเทรนนั้น
เพราะฉะนั้นจะสรุปได้ว่า บริษัทใช้ประโยชน์จากข้อมูลที่มีในการปรับปรุงระบบการดำเนินงาน ปรับปรุงการบริการลูกค้าให้ดีขึ้น คิดค้นแผนการตลาดที่สามารถไปถึงกลุ่มลูกแบบเจาะจงมากขึ้นเพื่อสร้างกำไรให้กับองค์กร อีกทั้งยังไปใช้ในหาสาเหตุของความเสี่ยงเพื่อหาทางแก้ไข และป้องกัน สร้างคุณค่า (Value) ให้แก่องค์กรด้วย Log file ที่เก็บไว้เป็นอีกหนึ่งแนวทางในการจัดสรรค์ข้อมูลที่มีขนาดใหญ่ได้นั้นเอง (Variability)