Affinity Analysis เป็นโมเดลการวิเคราะห์ยอดนิยมอีกตัวหนึ่งของ Data Scientists สาย Data Mining โดย Affinity Analysis สามารถทำให้เราค้นความสัมพันธ์ของสิ่งต่างๆที่มักจะเกิดพร้อมหรือที่เราเรียกว่า “Association Rules”
Affinity Analysis และ Association Rules ถูกนำมาใช้มากใน Product/Content Recommendations เช่น ถ้าลูกค้าซื้อหนังสือเล่มนี้ หรือฟังเพลงนี้ เขาน่าจะซื้อหนังสือเล่มไหนหรือฟังเพลงอะไรต่อไป
ในธุรกิจค้าปลีก Affinity Analysis จะมีชื่อเฉพาะว่า “Market Basket Analysis” ซึ่งเป็นการวิเคราะห์ว่าถ้าลูกค้าซื้อสินค้าชิ้นหนึ่ง (ลง ‘ตระกร้า’) เขาจะซื้อสินค้าชิ้นอะไรต่อไป
วันนี้มีแบบฝึกหัดให้ Young Data Scientists ได้ลองทำ เป็นการสอนใช้ R ทำ Market Basket Analysis หรือ Affinity Analysis โดยมี Dataset ของจริงให้ (CSV file) พร้อมโค้ด R ให้รัน โดยโค้ด R ที่ใช้จะเป็นการรันอัลกอรึธิ่มที่ชื่อว่า “A Priori” ซึ่งเป็นอัลกอรึธิ่มืที่นิยมใช้ในการทำ Affinity Analysis
ที่สำคัญในตอนท้ายจะสอนการใช้ R สร้าง Visualization ของ Association Rules เพื่อสรุปผลให้ users เข้าใจง่าย (หลายคนตกม้าตายขั้นตอนนี้ เพราะบางครั้ง Association Rules ออกมาซับซ้อน สรุปให้คนอื่นเข้าใจไม่ได้)
สุดสัปดาห์นี้ลองทำกันดู ดาวโหลด Dataset ที่ให้ และเขียนโค้ด R ตามขั้นตอนที่บอก แค่นี้ก็ได้ Market Basket Analysis ที่รันบน R แบบมืออาชีพ
คลิ๊กก++++ http://www.salemmarafi.com/code/market-basket-analysis-with-r/