MACHINE LEARNING THE FUTURE IS NOW

คุณรู้สึกสงสัยไหม?

  • ว่าทำไม Siri มันจดจำเสียง คุยตอบโต้  หรือทำงานตามคำสั่งของเราได้เหมือนกับคนจริงๆ ทั้งๆที่มันไม่ใช่คน
  • หรือการที่คุณ search หาร้านกาแฟแถวบ้านใน google แต่พอวันต่อมากลับมีเพจร้านกาแฟบรรยากาศดีโผล่ขึ้นมาบนหน้า Facebookของคุณ แล้ว Facebookรู้ได้ไงว่าคุณสนใจเรื่องนี้?

ที่พูดมาทั้งหมดนั้นเป็นผลการทำงานของ Machine Learning (ML) จะเห็นได้ว่า ML เข้ามามีบทบาทในชีวิตประจำวันเรามาก คุณอาจจะยังไม่เข้าใจว่า Machine Learning คือ อะไร แล้วมันมีการทำงานยังทำไมมันถึงได้ฉลาดขนาดนี้ แล้วมันมีประโยชน์กับเรายังไงบ้าง เราจะมาหาคำตอบในบทความนี้กัน

ก่อนอื่นเราต้องมาทำความเข้าใจก่อนว่า Machine Learning คือ อะไร

Machine Learning (ML)

Machine Learning คือ การที่คอมพิวเตอร์สามารถเรียนรู้ได้ด้วยตัวของมันเอง โดยที่เราไม่ได้เขียนโปรแกรมสั่งมัน  ซึ่งมันจะมีการเรียนรู้ทั้งหมด 3 แบบ หลักๆ คือ

  • Supervised Learning
  • Unsupervised Learning
  • Reinforcement Learning 

ซึ่งการเรียนรู้แต่ละแบบก็จะมีการเรียนรู้ในระดับย่อยที่แตกต่างกันออกไป แต่ในบทความนี้เราจะพูดถึงเฉพาะความแตกต่างระหว่าง Supervised Learning และ Unsupervised Learning  ว่ามันมีการเรียนรู้จากข้อมูลที่ได้แตกต่างกันอย่างไร

Supervised Learning คือ อะไร

Supervised Learning คือ การเรียนรู้ที่ต้องมีคนมาสอนก่อน คอมพิวเตอร์จะสามารถหาคำตอบหรือผลลัพธ์ได้ด้วยตัวมันเอง หลังจากที่ได้เรียนรู้จากข้อมูลที่คุณใส่และสอนมันไปก่อนหน้า เมื่อมันรู้เรียนรู้แล้ว ในรอบต่อไปเมื่อคุณใส่ข้อมูลลงไปมันก็จะบอกผลลัพธ์ได้ทันทีตามที่คุณสอนมัน ซึ่งหากข้อมูลที่คุณสอนมันมีจำนวนมาก ในครั้งต่อไปมันก็จะยิ่งให้ผลลัพธ์ที่แม่นยำมากยิ่งขึ้นเช่นกัน การเรียนรู้แบบ Supervised Learning ที่เราได้ยินบ่อยๆ เช่น Classification, Regression เป็นต้น

การเรียนรู้แบบ Classification คือ การที่คุณสอนให้มันแบ่งกลุ่มข้อมูล ยกตัวอย่างเช่น มีคนไข้ที่เป็นเนื้องอกในสมอง คุณอยากรู้ว่าเขาจะเป็นเนื้องอกร้ายหรือเนื้องอกไม่อันตราย คุณจำเป็นต้องใส่ชุดข้อมูลและสอนมันว่า ขนาดเนื้องอกที่อยู่ระหว่าง 1 – 2 mmคือเนื้องอกไม่อันตราย ขนาดเนื้อ 3-5 mmเป็นเนื้องอกร้าย คอมพิวเตอร์ก็จะเรียนรู้การแบ่งกลุ่มตามที่คุณสอนไป เมื่อมีคนไข้ใหม่ที่เป็นเนื้องอกประมาณ 2 mm คอมพิวเตอร์มันก็จะบอกคุณได้เลยว่าเขาเป็นเนื้องอกไม่อันตราย

แต่!!! ในความเป็นจริงแล้วการที่จะดูว่าเขาเป็นเนื้องอกไม่อันตรายหรือร้ายนั้นไม่ได้ดูกันที่ขนาดอย่างเดียว แต่เราดูความเข้มของสี รูปทรง ความแข็งของเนื้องอก ตำแหน่งที่อยู่ ลักษณะพื้นผิว และปัจจัยอื่นๆอีกมาก ซึ่งปัจจัยพวกนั้นเยอะมากจนมนุษย์ไม่สามารถนำมาวิเคราะห์เองได้ว่าเป็นเนื้องอกดีหรือเนื้องอกร้ายโดยดูจากฟิล์มเอกซเรย์ แต่ ML ทำได้!! โดยที่เราต้องใส่รายละเอียดข้อมูลทั้งหมดลงไปและสอนมันแยกประเภท ต่อไปมันก็จะสามารถบอกได้ว่าเนื้องอกแบบไหนเป็นเนื้องอกดีหรือเนื้องอกร้าย หากมันพัฒนาไปได้ไกล อนาคตอาจจะมีหมอที่ชื่อว่า ML มาช่วยวินิจฉัยโรคให้คนก็เป็นได้

หรืออีกตัวอย่างหนึ่งของการเรียนรู้แบบ Classification ก็เหมือนการที่คุณสอนเด็กแยกประเภทของสัตว์ คุณก็ให้เด็กดูรูปภาพ เสือ แมว ในอิริยาบทต่างๆแล้วบอกเด็กว่า นี่เสือนะ นี่แมวนะ เมื่อเด็กได้เรียนรู้แล้ว ครั้งต่อไปเมื่อเด็กไปเจอรูปเสือเขาก็จะสามารถบอกได้ว่านี่คือเสือนะ


การเรียนรู้แบบ regression ยกตัวอย่างเช่น หากคุณต้องการขายบ้าน จะขายในราคาเท่าไรดี? คุณก็ใส่ชุดข้อมูลขนาดบ้านและราคาบ้านแบบต่าง ๆ ลงในคอมพิวเตอร์ คอมพิวเตอร์มันจะเรียนรู้จากชุดข้อมูลนั้นโดยที่มันจะวิเคราะห์ความสัมพันธ์ของทั้งสอง(ขนาดบ้านและราคาบ้าน) ออกมาเป็นสมการการประมาณราคาบ้านออกมา

ทีนี้เมื่อคอมพิวเตอร์มันได้เรียนรู้แล้วว่าขนาดบ้านและราคามีความสัมพันธ์กันอย่างไร  เมื่อเราต้องการรู้ราคาบ้านของเราว่าจะขายได้เท่าไร เราก็ใส่ข้อมูลขนาดบ้านของเราลงไป เช่น บ้านขนาด 60 ตารางวา คอมพิวเตอร์ก็จะใช้วิธี Regression นี้ ปะมาณราคาบ้านออกมาให้เรา ในที่นี้ก็ประมาณ 610 บาท (อันนี้สมมตินะคะ ราคาบ้านจริงไม่น่าจะถูกขนาดนี้

นี่เป็นตัวอย่างที่เราดูความสัมพันธ์แค่ราคาและขนาดบ้าน ในความเป็นจริงยังมีตัวแปลที่มันส่งผลต่อราคาบ้าน เช่น บ้าน 2 ชี้น มีสระว่ายน้ำ อยู่ในย่านธุรกิจ อื่นๆ อีกมากมาย ตัวแปลเหล่านี้เราสามารถใส่ลงไป เพื่อที่จะให้คอมพิวเตอร์ประมาณราคาออกมาให้ได้

แต่คุณต้องสอนมันก่อนนะ ไม่งั้นมันก็จะไม่รู้ว่าจะวิเคราะห์ยังไง

ต่อไปเราจะมาดูว่า การเรียนรู้ของ ML แบบ Unsupervised Learning มันเรียนรู้ยังไง และต่างจาก Supervised Learning อย่างไร

Unsupervised learning คือ อะไร

Unsupervised Learning คือ การเรียนรู้ที่ไม่ต้องอาศัยผู้สอน เราจะใส่ข้อมูลลงไปในคอมพิวเตอร์และเราไม่ได้กำหนดผลลัพธ์ว่าจะต้องเป็นแบบไหน เราปล่อยให้คอมพิวเตอร์มันเรียนรู้ที่จะแยกกลุ่มได้ด้วยตัวมันเอง ซึ่งการเรียนรู้แบบ Unsupervised Learning มีการแบ่งเป็น 2 ประเภทหลักๆ คือ clustering และ non-clustering

Clustering คือ การที่คอมพิวเตอร์สามารถเรียนรู้การแยกกลุ่มข้อมูลได้ด้วยตัวมันเอง ยกตัวอย่างเช่น คุณมีข้อมูลของลูกค้าประมาณ 1 ล้านรายชื่อ และคุณจำเป็นที่จะต้องแบ่งกลุ่มลูกค้าออกมาเพื่อที่จะได้ทำการตลาดได้ตรงกลุ่มลูกค้า แต่คุณไม่รู้จะแบ่งกลุ่มยังไง คุณสามารถนำข้อมูลเหล่านี้ใส่ลงไปในคอมพิวเตอร์ มันจะแยกกลุ่มลูกค้าออกมาให้คุณเองอัตโนมัติ การเรียนรู้แบบ Clustering จะช่วยให้คุณมองเห็นรูปแบบการแบ่งข้อมูลจากผลลัพธ์ที่มันแบ่งกลุ่มมาให้ และคุณอาจจะเอารูปแบบที่ได้นี้ไปใช้ในครั้งต่อไปเมื่อมีรายชื่อกลุ่มลูกค้าใหม่ๆเข้ามา

ตัวอย่างหนึ่งของการเรียนรู้แบบ non-clustering คือ Cocktail Party Algorithm เป็นการเรียนรู้ของคอมพิวเตอร์ที่จะสามารถแยกเสียงที่ต้องการได้ ยกตัวอย่าง เมื่อเราเข้าไปในงานเลี้ยง มีคนมากมายพูดคุยกันเสียงดังแถมยังมีเสียงเพลงอีก แล้วเราได้ยินเสียงของคู่สนทนาได้อย่างไร? นั่นเพราะว่าสมองเราสามารถที่จะแยกเสียงที่เราต้องการจะฟังได้ประกอบกับเราใช้วิธีการอ่านปากไปด้วยก็สามารถทำให้เราเข้าใจได้ ซึ่งตัว ML ก็สามารถที่จะเรียนรู้การแบ่งแยกเสียงที่ต้องการคล้ายสมองของเราได้เช่นกัน ซึ่งตอนนี้ทาง google ได้นำหลักการนี้มาพัฒนา google recognize สำหรับ google Assistant


ปัจจุบันได้มีการนำ ML มาปรับใช้เพื่อให้ตอบสนองความต้องการของคนมากขึ้น ยกตัวอย่างเช่น

  • Spam Detection – คือการที่มันสามารถคัดแยก Email ได้ว่า Email ไหนเป็น Spam อันไหนเป็น Email ที่เราต้องการ
  • Face Detection – เมื่อเราถ่ายรูปกับเพื่อนลง Facebook และมีกรอบสี่เหลี่ยมขึ้นล้อมรอบหน้าเพื่อนของเราเพื่อที่จะให้เรา tag
  • Self Driving Car – รถมีเซนเซอร์ เชื่อมต่อกับ GPS และทำงานรวมกับ Software อัจฉริยะ ทำให้รถสามารถขับเคลื่อนได้ด้วยตัวมันเอง ไม่จำเป็นต้องมีคนขับ!
  • Google Map – คุณสามารถสั่งให้มันช่วยค้นหาเส้นทางที่รวดเร็วที่สุด ไม่ต้องทนรถติดไปทำงานสาย

จะเห็นได้ว่า Machine Learning มันมีการเรียนรู้ และสามารถวิเคราะห์ได้เหมือนกับคนเลยทีเดียว และมันยังถึกกว่าคนมาก เพราะว่ามันสามารถที่จะประมวณผลข้อมูลเป็น ล้านๆ ข้อมูลได้ในเวลาที่รวดเร็วเมื่อเปรียบเทียบกับคน และตอนนี้ ML ก็เข้ามามีบทบาทในชีวิตของเรามาก ช่วยให้ชีวิตของเราสะดวกสบายขึ้น

ในอนาคต ML อาจจะพัฒนาไปถึงขั้นวินิจฉัยโรคแทนหมอ ตัดสินคดีแทนทนาย ไม่แน่อาจจะมีชุดไอร่อนแมนออกมาวางขาย คุณก็จะได้เป็นไอร่อนแมนคนที่ 2 ก็เป็นได้!

Related products

Sirirat kantanat

นักเรียนทุนจุฬาลงกรณ์มหาวิทยาลัย หลักสูตรเศรษฐศาสตรบัณฑิต มีความเชี่ยวชาญด้านการประมาณการเชิงสถิติ กำลังศึกษาวิจัยและพัฒนาวิธีการประยุกต์ใช้ Machine Learningและ Data Scienceกับธุรกิจสมัยใหม่ ปัจจุบันกำลังทำวิจัย เรื่องการตรวจจับ Malicious URLs โดยใช้ Machine learning เพื่อเป็นการป้องกันการ Phishing จาก Threat เพื่อนำไป implement กับระบบ log management

Similar tags

Apisit Anuntawan

การจัดการ Big Data (Hadoop และ MapReduce)

ในการจัดการข้อมูลขนาดใหญ่หรือ Big Data มักมีการใช้ระบบสถาปัตยกรรมแบบ Hadoop ในการจัดการข้อมูล ไม่ว่าจะเป็นบริษัท Facebook หรือ eBay

Read more...
Apisit Anuntawan

สิ่งเล็ก ๆ ที่เรียกว่า Big Data

เทคโนโลยี Big Data จริง ๆ ก็คือ เทคโนโลยีที่ใช้จัดการกับข้อมูลที่ปริมาณมหาศาล มีการเปลี่ยนแปลงอย่างรวดเร็ว และมีความหลากหลายจากแหล่งที่มา

Read more...
Sirirat kantanat

Jupyter Notebook คือ เครื่องมือสำหรับ Data Science

เครื่องมือที่เราจะใช้ในการจัดการข้อมูลและการทำ Machine Learning ที่เรียกว่า Jupyter Notebook

Read more...