เราต่างคุ้นเคยกับคำว่า Data-driven ที่ได้ยิน ได้ฟัง ได้ทำ กันมาหลายปีแล้ว โดยความหมายแบบตรงไปตรงมาก็คือ การนำเอา ‘ข้อมูล‘ มาชับเคลื่อน ‘ส่ิงต่างๆ‘ โดยคาดหวังผลลัพธ์ที่ดีขึ้น ไม่ว่าสิ่งนั้นจะเป็น องค์กร (data-driven compamy) การตัดสินใจ (Data-driven decision) การทำการตลาด (Data-driven marketing) และอื่นๆ อีกมากมาย แล้วแต่อยากจะเอาคำนี้ไปใส่กับอะไร แต่สุดท้ายก็เพื่อทำให้สิ่งๆนั้นดีขึ้น พัฒนาขึ้นจากการใช้ข้อมูล
ทั้งๆ ที่รู้ว่า การมี Data การใช้ Data ไม่ว่าจะ Big หรือ Small ก็แล้วแต่ มันก็ดีกว่าการไม่มี Data ให้ใช้อยู่แล้ว แต่หลายครั้งผมเองก็สงสัย และเชื่อว่าหลายคนก็คงสงสัยเหมือนผมว่า วิธีการจริงๆ ที่ Data ถูกประมวลผลออกมาเป็น Result ให้เราเห็นนั้น จริงๆ มีหลักการคิดและแนวทางการทำงานอย่างไร ไม่ใช่อยากรู้เพราะว่าจะเอาไปเขียนระบบ สร้าง Model การประมวลผลอะไรหรอกนะครับ แต่ด้วยความขี้สงสัยก็แค่อยากรู้ว่ามันมีวิธีอย่างไรเท่านั้นเอง เพราะการเข้าใจพื้นฐานเล็กๆ น้อยเหล่านี้จะทำให้การศึกษาต่อยอดทำได้ง่ายขึ้น
เครื่องมือต่างๆ ของ Google ก็มีการใช้เรื่องของ Data-driven ในการทำงาน ไม่ว่าจะเป็นระบบการออปติไมซ์โฆษณาประเภท Automate Bidding ใน Google Ads และระบบการคำนวนค่า Conversion ในรีพอร์ทของ Google Analytics ซึ่งบทความนี้จะมาอธิบายหลักการทำงานของ Data-Driven Attribution ใน GA4 ให้เข้าใจโดยคอนเซปท์ ซึ่งถ้าเราเข้าใจ Data-driven attribution ใน GA4 แล้ว เราก็จะเข้าใจ Data-driven attribution ใน Google Ads ที่มีหลักการทำงานแบบเดียวกันด้วย
Attribution Model ใน Google Analytics คืออะไร
จริงๆ เรื่องนี้ผมได้เคยเขียนบทความ Attribution Model คืออะไร ควรเลือกใช้แบบไหน ที่พูดถึงการเลือกใช้แต่ละ Model ไว้ค่อนข้างละเอียดแล้ว ซึ่งใครที่ยังไม่รู้จัก Attribution Model แบบต่างๆ ควรอ่านอย่างมากครับ เพียงแต่ว่าในบทความก่อนหน้า ผมไม่ได้เขียนถึง Data-driven attribution เนื่องจากใน GA3 นั้น Data-driven attribution จะใช้ได้ก็ต่อเมื่อเป็นแอคเคาท์ที่ซื้อ License GA360 เท่านั้น แต่ใน GA4 ทุกแอคเคาท์สามารถใช้แล้วโดยไม่ต้องเสียเงิน ก็เลยคิดว่านำมาเขียนอธิบายให้ทุกคนได้เข้าใจกัน โดยสรุปสั้นๆ Attribution Model คือ การกำหนดว่าค่า Conversion ที่เกิดขึ้น Touch Points (ซึ่งอาจจะเป็น Marketing Chanel, Campaigns, Click, Device etc.) ใดควรได้รับเครดิตไป
Data-drivent attribution ใน GA4 มีวิธีการทำงานอย่างไร
อย่างที่ทราบว่า Attribution เป็นการกำหนดว่า Touch Points ไหนควรได้รับเครดิตจาก Conversion ที่เกิดขึ้น แต่ปัญหาคือ Attribution Model ทั้งหมดต่างยังมีจุดอ่อนในการให้เครดิตอยู่ ตัวอย่างเช่น Last click model หรือ First click model เป็นโมเดลที่ให้เครดิตกับ Touch point เพียง Touch point เดียวใน Converson path ซึ่งเป็นวิธีการที่ว่าตามตรงก็คือไม่เหมาะสม เนื่องจากกระบวนการตัดสินใจของลูกค้านั้นไม่เกิดขึ้นจาก Touch point เดียว พูดง่ายๆ คือ Customer jouney ของลูกค้ามีความซับซ้อนและมีหลาย Stage มากๆ กว่าจะตัดสินใจซื้อ
และแม้ว่าบางโมเดลนั้นจะเริ่มมีความซับซ้อนมากกว่า First click และ Last click ตัวอย่างเช่น Position-based model หรือ Time decay model ที่เริ่มมีการแบ่งกระจายเครดิตให้ทุกๆ แชนแนลใน Conversion path ซึ่งถือว่าเป็นวิธีการดีกว่าเดิม แต่ในรายละเอียดแล้วก็ยังเป็นรูปแบบการให้เครดิตที่กำหนดไว้แบบ Fix ตายตัว และ Result ที่ได้ก็อาจจะไม่ได้ถูกต้องทั้งหมด ดังนั้น Google จึงได้สร้าง Model ใหม่ขึ้นมา เรียกว่า Data-driven attribution model ที่ใช้ Machine learning ในการประมวลผล และเป็นการประมวลผลทีละ Conversion เลยทีเดียว ดังนั้นมันจึงไม่ได้เป็นรูปแบบที่ Fix ตายตัวเหมือน Model อื่นๆ ที่กล่าวมาก่อนหน้า
หลักการทำงานของ Data-driven attribution คือ การใช้ Machine Learning ช่วยประเมินทั้ง converting and non-converting paths กล่าวคือ ระบบจะตรวจสอบ และเปรียบเทียบว่า การมีอยู่ของ Touch points ใด Touch point หนึ่งนั้น ส่งผลต่อการการเกิด Conversion หรือไม่ และส่งผลมากน้อยแค่ไหน และใช้ข้อมูลที่ได้ในการกำหนดเครติดให้กับ Touch points ทั้งหมด จากตัวอย่างตามภาพด้านบนซึ่งเป็นการอธิบายให้เห็นภาพคร่าวๆ แบบ High level จะเห็นว่า รูปแบบของ Conversion path แรกด้านบนซึ่งผ่านทั้งหมด 4 touch points นั้นมีโอกาสเกิด Conversion ที่ 3% ส่วนรูปแบบ Conversion path ด้านล่างที่ผ่าน 3 touch points มีโอกาสเกิด Conversion ที่ 2% ดังนั้นระบบก็จะพบว่าการมีอยู่ของ Search ซึ่งเป็น Touch point สุดท้ายของ Conversion path แรกนั้น จะช่วยเพิ่ม Conversion ได้มากถึง 50% (จาก2% เป็น 3%) ดังนั้นเวลาที่ Google Analytics ทำการ Attribute ด้วย Data-driven model ระบบก็จะให้ความสำคัญและให้น้ำหนักกับ Search ค่อนข้างมาก
และในความเป็นจริง การทำงานของ Model นี้ก็จะทำแบบนี้กับทุก Touch points หมายความว่า ระบบจะไปดูตั้งแต่ Touch point แรก ว่าการมีอยู่หรือไม่มี Touch point นั้นส่งผลอย่างไรกับ Conversion โดยไปเทียบกับ Converting path และ Non converting path ทั้งหมดที่บันทึกได้ในบัญชี Google Analytics ของเรา และทำแบบนี้ทีละ Conversion อย่างที่กล่าวมาแล้ว
ควรใช้ Data-driven attribution หรือไม่ ถ้าใช้แล้วดีอย่างไร และจะเกิดอะไรขึ้น
ต้องบอกว่า Data-drivent attribution เป็น Model ที่ Google นั้น Recommend ให้ใช้งาน และตอนนี้ก็ถูกกำหนดเป็นค่าตั้งต้นใน GA4 (ใน GA3 จะใช้ Last-non direct เป็นค่าตั้งต้น) ซึ่งก็ต้องบอกว่าตามคอนเซปท์ถือเป็น Model ที่ดีมากเลยละครับ ทีนี้ถามว่าเราควรปล่อยให้เป็นแบบ Default หรือไม่ คำถามนี้ผมเองก็ไม่มีคำตอบ เพราะเอาจริงแล้ว มันก็ไม่มี Model ไหนที่ถูกต้อง 100% ซึ่งถ้าเราเข้าใจวิธีการทำงานและวิธีเลือกใช้แต่ละโมเดลจากบทความที่ผมแชร์ลิงค์ไว้ช่วงต้นบทความแล้ว ก็ลองเลือกใช้ดูให้เหมาะสมกับธุรกิจของเรา แต่สำหรับผู้เริ่มต้นใช้งาน Google Analytics การใช้ Data-driven model ก็ถือว่าเหมาะสม สามารถใช้ได้ดี แต่ต้องเข้าใจไว้ก่อนว่า Model นี้จะทำให้ตัวเลข Conversion ที่เราเห็นใน Report กลายเป็น จุดทศนิยม แบบที่เราไม่คุ้นเคย เพราะระบบจะกระจาย Conversion ออกไปให้ทุก Touch point ด้วยน้ำหนักที่ไม่ตายตัวจากเหตุผลที่ได้กล่าวมา
Happy Analytics 🙂