ในโลกของธุรกิจที่มีการแข่งขันสูง การทำความเข้าใจลูกค้าอย่างลึกซึ้งเป็นกุญแจสำคัญที่ช่วยขับเคลื่อนการเติบโตและสร้างความสัมพันธ์ในระยะยาว
โปรเจกต์นี้มีเป้าหมายในการ วิเคราะห์และแบ่งกลุ่มลูกค้า (Customer Segmentation) โดยใช้เทคนิค RFM Analysis และพัฒนา โมเดล Machine Learning (Decision Tree) เพื่อช่วยในการจำแนกกลุ่มลูกค้าในอนาคตได้อย่างรวดเร็วและแม่นยำ
Dataset Description
- แหล่งข้อมูล : ฐานข้อมูลการซื้อขายของลูกค้าจำนวนมากกว่า 50,000 รายการ (Online Retail Dataset)
- การจัดการข้อมูล : กรองเฉพาะธุรกรรมที่สมบูรณ์เท่านั้น ลบรายการที่ไม่มี CustomerID และเลือกรายการที่มีปริมาณและราคาต่อหน่อยเป็นบวก
- สร้างตาราง RFM : RFM table (Recency, Frequency, Monetary) เพื่อแบ่งกลุ่มลูกค้า (K-Means Clustering)
- Link Source : Online Retail


Segment พิจารณาจากพฤติกรรม Recency และ Frequency เป็นหลัก โดย Monetary ใช้ในขั้นวิเคราะห์เชิงลึกเท่านั้น เพราะจากการวิเคราะห์พบว่า Monetary มีความแตกต่างระหว่างกลุ่มน้อยกว่าพฤติกรรมด้านเวลาและความถี่
Process
เพื่อให้ได้โมเดลที่สามารถจำแนกกลุ่มลูกค้าได้อย่างแม่นยำและเชื่อถือได้ เราได้ออกแบบกระบวนการวิเคราะห์เชิงระบบ

การแบ่งข้อมูล (Data Splitting) ข้อมูลทั้งหมดถูกแบ่งออกเป็น 2 ชุด
- 70% สำหรับการฝึกโมเดล (Training Set)
- 30% สำหรับการทดสอบโมเดล (Testing Set)
วิธีนี้ช่วยให้สามารถประเมินประสิทธิภาพของโมเดลบนข้อมูลที่ไม่เคยเห็นมาก่อนได้อย่างโปร่งใส
การฝึกโมเดลและตรวจสอบความแม่นยำ (Model Training & Validation)
ในชุดฝึก เราใช้เทคนิค K-Fold Cross Validation เพื่อเพิ่มความเสถียรและลดความเอนเอียงของโมเดล โดยทำการฝึกโมเดล 3 รูปแบบ ได้แก่:
- K-Nearest Neighbors (KNN)
- Decision Tree
- Random Forest
การใช้ K-Fold ทำให้มั่นใจได้ว่าผลลัพธ์ไม่ได้ขึ้นอยู่กับการแบ่งข้อมูลเพียงครั้งเดียว แต่ได้รับการประเมินจากหลายชุดย่อยอย่างเป็นระบบ
การทดสอบและประเมินผล (Model Evaluation)
เรานำไปทดสอบกับชุดข้อมูลที่กันไว้ (Testing Set) โดยพิจารณาจาก ความแม่นยำ (Accuracy) และ ความเสถียรของโมเดล ในการทำนายกลุ่มลูกค้า
Applied ML Models
- โครงสร้างการตัดสินใจแบบต้นไม้ (Decision Tree)
ทำหน้าที่เหมือนการเดินตามเส้นทางที่มีทางแยก ในแต่ละจุด เราแค่ตอบ “ใช่” หรือ “ไม่ใช่” แล้วเดินต่อไปตามทางเลือก จนไปถึงกลุ่มเป้าหมายสุดท้าย เป็นวิธีที่ช่วยจำแนกข้อมูลได้อย่างง่ายและเป็นระบบ - K-Nearest Neighbors (KNN) ทำงานเหมือนการถามว่า “เพื่อนบ้านใกล้ตัวของฉันกำลังทำอะไรอยู่?” มันจะมองหาลูกค้าที่มีพฤติกรรมคล้ายกันในบริเวณใกล้เคียง แล้วจัดกลุ่มลูกค้าใหม่ตามเสียงข้างมากจากเพื่อนบ้านเหล่านั้น
- Random Forest เปรียบเสมือนการถามคำถามชุดเดียวกันกับต้นไม้หลายต้น แล้วรวมคำตอบของแต่ละต้นเข้าด้วยกันเพื่อหาข้อสรุปสุดท้าย วิธีนี้ช่วยลดความผิดพลาดและทำให้ได้ผลลัพธ์ที่แม่นยำและเสถียรกว่าการใช้ต้นไม้เพียงต้นเดียว

ML Model Comparison
เราเปรียบเทียบโมเดลการเรียนรู้แบบมีผู้ดูแล 3 แบบ ได้แก่ K-Nearest Neighbors (KNN), Decision Tree และ Random Forest เพื่อใช้ในการแบ่งกลุ่มลูกค้า แม้ว่า Random Forest จะให้ความแม่นยำสูงที่สุด แต่สุดท้ายเราเลือกใช้ Decision Tree เพราะเข้าใจง่าย ตีความได้ และให้ข้อมูลเชิงลึกที่นำไปใช้ต่อได้จริง


เราเลือก Decision Tree เพราะแม้ Random Forest จะแม่นยำกว่าเล็กน้อย แต่ Decision Tree อธิบายได้ชัดเจน เข้าใจง่าย และนำไปใช้ได้จริงในทางธุรกิจ
Customer Insights & Campaign
จากการวิเคราะห์พฤติกรรมลูกค้า เราพบว่าแต่ละกลุ่มมีลักษณะเด่นที่แตกต่างกันอย่างชัดเจน เช่น ลูกค้ากลุ่ม Super VIP มีความถี่ในการซื้อสูง และมูลค่าการใช้จ่ายต่อครั้งมาก ในขณะที่กลุ่ม At Risk มีแนวโน้มลดความถี่ในการซื้ออย่างเห็นได้ชัด

เพื่อให้การดำเนินกลยุทธ์ทางการตลาดมีประสิทธิภาพยิ่งขึ้น เราออกแบบแคมเปญเฉพาะกลุ่ม ดังนี้:
- Super VIP: ข้อเสนอพิเศษและโปรแกรมสมาชิกระดับพรีเมียม
- Loyal Customers: คูปองส่วนลดสำหรับการแนะนำเพื่อน
- At Risk Customers: โปรโมชั่นพิเศษเพื่อกระตุ้นการกลับมาซื้อภายในระยะเวลาจำกัด
การเชื่อมโยงข้อมูลเชิงลึกกับการดำเนินการในลักษณะนี้ ช่วยเพิ่มโอกาสในการรักษาฐานลูกค้าและขยายรายได้อย่างต่อเนื่อง
Focus Area Summary
เรากำหนด 3 พื้นที่ที่ควรโฟกัส ดังนี้:

- Super VIP และ Best Customers: รักษาความสัมพันธ์ด้วยสิทธิพิเศษและโปรแกรมสมาชิก
- At Risk และ About to Sleep: กระตุ้นการกลับมาด้วยข้อเสนอพิเศษและแคมเปญกระตุ้นยอดซื้อ
- New Customers และ Potential Loyalists: ส่งเสริมการซื้อซ้ำและพัฒนาให้เป็นลูกค้าประจำด้วยโปรแกรมสะสมแต้ม
การโฟกัสเหล่านี้ช่วยเพิ่มการรักษาฐานลูกค้า กระตุ้นยอดขาย และขยายฐานลูกค้าในระยะยาว
RFM Dashboard : Looker Studio
Report PDF : Customer Segmentation & Mini ML Model
RFM Table : rfm_data_df.xlsx
Leave a Reply