รู้จัก depa
บริการ
TH
EN
TH
CN

ตัวอย่างการใช้ Big Data เพื่อส่งเสริมการลงทุน

บทความนี้ได้รับการเผยแพร่ครั้งแรกที่ BigData.go.th เว็บไซต์เพื่อการแบ่งปันความรู้และส่งเสริมการใช้ประโยชน์จากการวิเคราะห์ข้อมูลขนาดใหญ่ (Big Data Analytics)

ส่งเสริมการออมเงินของสมาชิก กบข. ด้วย Big Data

โดยตัวอย่างการพัฒนาแบบจำลองเชิงพยากรณ์ (Predictive Model) ที่เรานำเสนอในบทความนี้ มาจากโมเดลจริงที่ทาง Government Big Data Institute (GBDi) ร่วมมือกับสถาบันการเงินที่บริหารกองทุนบำเหน็จบำนาญข้าราชการทำขึ้น

โดยกองทุนบำเหน็จบำนาญข้าราชการ (กบข.) นั้นเป็นสถาบันบริหารเงินออมของข้าราชการเพื่อการเกษียณที่มีความยั่งยืน และมีเป้าหมายในการใช้ข้อมูลที่มีอยู่และความรู้ทาง Data Science เพื่อศึกษาวิจัยด้านการลงทุนในแง่ของเงินออมของสมาชิกเพื่อช่วยให้ กบข. สามารถส่งเสริมและสนับสนุนสมาชิกในการลงทุนที่เหมาะสม และผลักดัน กบข. ให้เป็นองค์กรที่ขับเคลื่อนด้วยข้อมูล (Data Driven Organization) อย่างแท้จริง

ที่มา : https://www.gpf.or.th/thai2019/Index/index.php?lang=th และ

https://gbdi.depa.or.th/

หนึ่งในเป้าหมายหลักด้านการส่งเสริมการออมเงินของสมาชิก กบข.นั้นก็คือ ทาง กบข. ต้องการให้สมาชิกมีความสนใจมาเพิ่มการลงทุนในกองทุนบำเหน็จบำนาญข้าราชการ (pension fund) ให้มากขึ้น เพื่อที่ว่าสมาชิกจะได้มีเงินออมที่พอใช้หลังเกษียณ เราจึงเริ่มจากการใช้ความรู้ทาง Data science มาช่วยในการวิเคราะห์ว่าสมาชิกคนไหนอยู่ในกลุ่มที่มีโอกาสจะมาเพิ่มเงินลงทุนใน pension fund ที่มากกว่า (Potential group) เพื่อที่เราจะได้สามารถเจาะกลุ่มสมาชิกได้ถูกกลุ่ม และเพิ่มประสิทธิภาพในการคิดแผนการตลาดต่าง ๆ ได้ โดยมีขั้นตอนในการดำเนินงานดังนี้

ศึกษาการจำแนกกลุ่มของข้อมูล หาผู้ที่มีแนวโน้มการออมเงินเพิ่ม ขั้นแรก จะเริ่มจากการจัดเตรียมข้อมูลสมาชิก จัดการความถูกต้อง และความเป็นระเบียบของข้อมูลและทำ Feature Engineering เพื่อให้โมเดลการทำนายมีประสิทธิภาพ เช่น การวิเคราะห์เพื่อดูว่าข้อมูลใดที่ควรนำมาเป็นตัวแปร (input feature) ที่จะใช้ในโมเดล โดยข้อมูลที่ใช้สำหรับการสร้างโมเดล จะประกอบไปด้วยหลายส่วน ได้แก่

  • ข้อมูลทางประชากร (Demographic data) เช่น เพศ อายุ รายได้
  • ข้อมูลทางภูมิศาสตร์ (Geographic data) เช่น จังหวัดหรือภูมิภาคที่อาศัย
  • ข้อมูลเชิงจิตวิทยา (Psychographic data) เช่น ไลฟ์สไตล์ ความชอบในสินค้า
  • ข้อมูลทางพฤติกรรม (Behavioral data) เช่น พฤติกรรมการใช้งานของสินค้าและบริการ

ภาพที่ 2 การจำแนกกลุ่มของข้อมูล

ที่มา : สถาบันส่งเสริมการวิเคราะห์และบริหารข้อมูลขนาดใหญ่ภาครัฐ

หลังจากขั้นตอนการจัดเตรียมข้อมูล เราจะนำข้อมูลเข้าสู่โมเดลเพื่อทำการเรียนรู้ โดยมีวัตถุประสงค์เพื่อจำแนกสมาชิก กบข. ออกเป็น กลุ่มที่มีแนวโน้มว่าจะมาเพิ่มเงินออมสูง กลุ่มที่มีแนวโน้มว่าจะออมเงินเพิ่มปานกลาง และกลุ่มที่มีแนวโน้มว่าจะออมเงินเพิ่มต่ำ โดยเกณฑ์ที่ใช้ในการจำแนกกลุ่มนี้ก็คือ ค่าความน่าจะเป็นที่ได้มาจากโมเดลนั่นเอง

ภาพที่ 3 การใช้โมเดลเพื่อจำแนกคนที่ออมเพิ่ม

ที่มา : สถาบันส่งเสริมการวิเคราะห์และบริหารข้อมูลขนาดใหญ่ภาครัฐ

ซึ่งโมเดลทางคณิตศาสตร์ที่สามารถนำมาใช้เพื่อจำแนกแนวโน้มการออมเงินเพิ่มของสมาชิก (Classification model) นั้นมีอยู่หลายโมเดลด้วยกัน อาทิเช่น Logistic regression, Naive Bayes classifier, Least squares support vector machines, Random forests, Neural networks ฯลฯ โดยหลังจากที่ทดลองใช้ข้อมูลจากสมาชิก กบข.กับหลาย ๆ โมเดลแล้ว ผลที่ได้พบว่า อัลกอริทึม Extreme Gradient Boosting (XGBoost) เป็นอัลกอริทึมที่มีประสิทธิภาพสูงที่สุดในการสร้างโมเดลสำหรับจำแนกสมาชิกด้านเงินออมของ กบข. ซึ่ง XGBoost นั้นก็เป็นโมเดลทำนายพื้นฐานที่ได้รับความนิยมอย่างมากและถูกใช้ในการแข่งขันวิเคราะห์ข้อมูลอย่างแพร่หลายโดยเฉพาะในเว็บไซต์ชุมชนวิเคราะห์ข้อมูลอย่าง Kaggle ("XGBoost - ML winning solutions (incomplete list)", 2016) โดยหลักการทำงานของ XGBoost จะมีลักษณะการนำเอา Decision Tree มาเทรนต่อกันหลายๆต้น โดยที่แต่ละ Decision tree จะเรียนรู้จาก error ของต้นก่อนหน้า ดังนั้น ความแม่นยำในการทำนายจะสูงขึ้นเรื่อย ๆ และโมเดลจะหยุดเรียนรู้เมื่อไม่เหลือแพทเทิร์นของ error ก่อนหน้าให้เรียนรู้อีก ซึ่งเราเรียกโมเดลลักษณะแบบนี้ว่า Ensemble Learning หรือหมายถึงการใช้หลาย ๆ โมเดลมาประกอบกันเป็นหนึ่งโมเดลเพื่อเพิ่มประสิทธิภาพในการทำนายนั่นเอง

ภาพที่ 4 อัลกอริทึม Extreme Gradient Boosting (XGBoost)

ที่มา : http://www.actuaries.jp/lib/meeting/reikai2018-02-siryo2-en.pdf

จากโมเดลคณิตศาสตร์ สู่แคมเปญส่งเสริมการออม

หลังจากที่เราทราบแล้วว่าสมาชิกคนใดมีโอกาสที่จะออมเงินในกองทุนกับ กบข. เพิ่มมากหรือน้อยแล้วนั้น กบข. ก็จะสามารถออกแบบแคมเปญหรือกิจกรรมต่าง ๆ เพื่อส่งเสริมทางการตลาดได้อย่างตรงจุดและได้ผลที่มากยิ่งขึ้น ตัวอย่างเช่น ข้อความที่ กบข. จะส่งออกให้แก่สมาชิกแต่ละกลุ่มผ่านทาง SMS, E-mail, Line message, Mobile application หรือช่องทางต่าง ๆ เพื่อชักชวนหรือให้ความรู้นั้น อาจเป็นข้อความที่ต่างกันตามกลุ่มที่จำแนกไว้ โดยอาจโฆษณาผลิตภัณฑ์ A ให้กับสมาชิกที่มีแนวโน้มในการออมเงินเพิ่มสูง และส่งแคมเปญ B ให้แก่กลุ่มสมาชิกที่โมเดลทำนายว่ามีแนวโน้มที่จะมาออมเงินเพิ่มต่ำ เพื่อเป็นการกระตุ้นให้สมาชิกกลุ่มนี้หันมาสนใจในการออมเงินที่มากยิ่งขึ้น ซึ่งนอกจากประโยชน์ในแง่ของการตลาดที่มีประสิทธิภาพมากขึ้นแล้วนั้น การทำการตลาดแบบเจาะกลุ่มคนที่เราสนใจ (Focus group) ยังสามารถช่วยประหยัดเวลาและค่าใช้จ่ายได้อย่างมากอีกด้วย หากต้องการรับชมตัวอย่างเพิ่มเติมในเรื่องของการใช้ Big data สำหรับ sector finance ในรูปแบบของวีดีโอ สามารถเข้าไปดูได้ที่ https://youtu.be/G54XC_i9Gao

โดย นางนภัสวันต์ พสุทิพย์

พิสูจน์อักษร ดร.ปริสุทธิ์ จิตต์ภักดี และ ปพจน์ ธรรมเจริญพร

สถาบันส่งเสริมการวิเคราะห์และบริหารข้อมูลขนาดใหญ่ภาครัฐ

สำนักงานส่งเสริมเศรษฐกิจดิจิทัล