Affinity Analysis

Affinity Analysis เป็นโมเดลการวิเคราะห์ยอดนิยมอีกตัวหนึ่งของ Data Scientists สาย Data Mining โดย Affinity Analysis สามารถทำให้เราค้นความสัมพันธ์ของสิ่งต่างๆที่มักจะเกิดพร้อมหรือที่เราเรียกว่า “Association Rules”

Affinity Analysis และ Association Rules ถูกนำมาใช้มากใน Product/Content Recommendations เช่น ถ้าลูกค้าซื้อหนังสือเล่มนี้ หรือฟังเพลงนี้ เขาน่าจะซื้อหนังสือเล่มไหนหรือฟังเพลงอะไรต่อไป

ในธุรกิจค้าปลีก Affinity Analysis จะมีชื่อเฉพาะว่า “Market Basket Analysis” ซึ่งเป็นการวิเคราะห์ว่าถ้าลูกค้าซื้อสินค้าชิ้นหนึ่ง (ลง ‘ตระกร้า’) เขาจะซื้อสินค้าชิ้นอะไรต่อไป

วันนี้มีแบบฝึกหัดให้ Young Data Scientists ได้ลองทำ เป็นการสอนใช้ R ทำ Market Basket Analysis หรือ Affinity Analysis โดยมี Dataset ของจริงให้ (CSV file) พร้อมโค้ด R ให้รัน โดยโค้ด R ที่ใช้จะเป็นการรันอัลกอรึธิ่มที่ชื่อว่า “A Priori” ซึ่งเป็นอัลกอรึธิ่มืที่นิยมใช้ในการทำ Affinity Analysis

ที่สำคัญในตอนท้ายจะสอนการใช้ R สร้าง Visualization ของ Association Rules เพื่อสรุปผลให้ users เข้าใจง่าย (หลายคนตกม้าตายขั้นตอนนี้ เพราะบางครั้ง Association Rules ออกมาซับซ้อน สรุปให้คนอื่นเข้าใจไม่ได้)

สุดสัปดาห์นี้ลองทำกันดู ดาวโหลด Dataset ที่ให้ และเขียนโค้ด R ตามขั้นตอนที่บอก แค่นี้ก็ได้ Market Basket Analysis ที่รันบน R แบบมืออาชีพ

คลิ๊กก++++ http://www.salemmarafi.com/code/market-basket-analysis-with-r/

Advertisements