Google Correlate เผยคนตกงานเกี่ยวอะไรกับหนังผู้ใหญ่

pornhub-free-premium-covid-19

ไม่กี่วันก่อนชายไทยหลายคนน่าจะดีใจกับแคมเปญของเว็บไซต์หนังผู้ใหญ่ Pornhub.com กัน เพราะทาง Pornhub ได้ออกแคมเปญให้ทุกคนสามารถสมัครสมาชิก Premium ได้ฟรีไม่มีจำกัดเพื่อเป็นการช่วยส่งเสริมให้ทุกคน (โดยเฉพาะผู้ชาย) อยู่กับบ้าน ไม่ต้องออกไปไหน (หรือไม่ก็คงหมดแรงไม่สามารถออกไปไหนได้ ฮาาา) ซึ่งเป็นการช่วยลดการแพร่กระจายของเชื้อไวรัส Covid-19 ไปในตัว ใครสนใจก็ลองไปสมัครกันดูนะครับ แต่เรื่องที่น่าสนใจและอยากเอามาเล่านั้นเป็นเรื่องของ Google Correlate ซึ่งเป็นเครื่องมือของ Google ที่เอาไว้ค้นหา Trend การค้นหาที่มี Pattern แนวโน้มที่เป็นไปในทิศทางแบบเดียวกัน ผมเคยเขียนเอาไว้แล้ว ใครยังไม่รู้จักลองไปอ่านดูนะครับ เป็นเครื่องมือที่มีประโยชน์มากจริงๆ (เสียดายมาก Google ปิดให้บริการเครื่องมือนี้ไปแล้ว)

เรื่องที่อยากจะเล่าเพราะเห็นว่าสอดคล้องกับเรื่องของ Pornhub นี้ได้รับการเผยแพร่ในเว็บไซต์ รวมถึงได้รับการตีพิมพ์ในหนังสือชื่อ Everybody Lies ที่เขียนโดย Data Scienctist ชาวอเมริกันชื่อ seth stephens-davidowitz ใครอยากอ่านฟรีได้ที่ Google Books เลยนะครับ เนื้อหาที่เกี่ยวข้องกับบทความนี้จะอยู่ใน Chapter ที่ 3

ตัวอย่างหนึ่งในหนังสือคือเรื่องของ “อัตราการว่างงาน” หรือ “Unemployment Rate” ของสหรัฐ ตัวเลขนี้จะได้รับการเผยแพร่ออกมาจากทางรัฐบาลซึ่งปกติจะค่อนข้างล่าช้า คือจะ delay ประมาณ 1 สัปดาห์ แต่เนื่องจากตัวเลขนี้มีความสำคัญอย่างมาก และเป็นตัวเลขที่ส่งผลกระทบโดยตรงต่อระบบเศรษฐกิจและตลาดหุ้น คำถามจึงเกิดขึ้นว่าทำอย่างไรจึงจะทราบตัวเลขนี้ได้เร็วที่สุด ในเมื่อปัจจุบันเรามีข้อมูลให้วิเคราะห์อยู่มากมาย

นาย Jeremy Ginsberg ซึ่งเป็นอดีตพนักงานทีมเอ็นจิเนียร์ของ Google พบว่าข้อมูลด้านสุขภาพ “Health” มีความคล้ายกับข้อมูล “Unemployment” คือเป็นข้อมูลที่เผยแพร่โดยรัฐบาลและมีความล่าช้าเช่นเดียวกัน Ginsberg มีสมมุติฐานว่าคนที่ป่วยเป็นไข้หวัด น่าจะต้องมีการเสิร์ซใน Google ด้วยคำที่เกี่ยวข้องกับไข้หวัด และจากหนังสือบอกไว้ว่าได้มีการ Proved แล้วว่า คำว่า “Flu Symptoms” และ “Muscle Aches” เป็นคำที่สามารถใช้เป็นตัวชี้วัดว่าไข้หวัดมีการระบาดรวดเร็วแค่ไหน ดังนั้นวิธีการเดียวกันนี้ก็น่าจะสามารถนำมาใช้ได้กับ “ตัวเลขอัตราการว่างงาน” ด้วยว่ามีความสัมพันธ์กับการค้นหาแบบใด และ Google Correlate นี่แหละครับที่จะเป็นเครื่องมือช่วยไขความลับนั้น

อีกตัวอย่างหนึ่งที่น่าสนใจในหนังสือที่ใช้ Google Correlate ในการวิเคราะห์ข้อมูลก็คือ การทำนายเรื่องของราคาบ้านที่สูงขึ้นหรือลดลง ว่ามีความสัมพันธ์กับการค้นหาอะไรบ้าง การค้นหาคำอะไรสัมพันธ์กับการขึ้นของราคาบ้าน ก็ปรากฏว่า เมื่อบ้านมีราคาแพงขึ้นก็มักจะมีการค้นหาคำว่า “New Home Builder” และ “Appreciation Rate” มากขึ้นด้วย เป็นต้น พูดง่ายๆ ก็คือถ้ามีการ Search 2 คำนี้ในปริมาณที่มากขึ้นก็แสดงว่าบ้านมีแนวโน้มราคาสูงขึ้น ทำนองนั้น

ย้อนกลับมีเรื่อง “Unemployment Rate” ถ้าให้เราคิดกันเองเราก็คงคิดว่า ถ้าอัตราการว่างงานเพิ่มสูงขึ้น คนทั่วก็น่าจะค้นหาคำว่า  “New Jobs” หรือ “Unemployment Office” แปลเป็นไทยก็ประมาณ “สมัครงาน” หรือ “ตกงาน ประกันสังคม” ทำนองนี้ ในกรณีนี้การวิเคราะห์ข้อมูลทำโดยการอัพโหลดข้อมูล “Dataset” ของอัตราการว่างงาน ตั้งแต่ปี 2004 ถึง 2011 เข้าไปใน Google Correlate ผลการค้นหาเปรียบเทียบกับ Search Terms ที่มีจำนวนระดับ Trillion (ล้านล้าน) ในช่วงเวลาดังกล่าว ปรากฏออกมาเป็นคำว่า “Slutload” !!!!!! มายกอด เว็บไซต์หนังผู้ใหญ่นั่นแหละครับ ในหนังสือสรุปช่วงตอนนี้ไว้อย่างน่าขันว่า

This may seem strange at the first blush, but unemployed people presumably have a lot of time on their hands

แปลตรงๆ ก็คือ เค้าคิดว่าคนว่างงานอยู่บ้าน อยู่คนเดียว คงเบื่อ แต่ก็จะมีเวลาว่างกับ “มือ” เยอะขึ้น ฮาาาา

หรือนี่เป็นข้อมูลที่ Pornhub เองก็รู้ และคิดว่าการมีเวลาอยู่บ้านมากขึ้นในช่วงเวลากักตัวเองเพื่อป้องการการแพร่ระบาดของ Covid-19 น่าจะทำให้แคมเปญนี้ประสบความสำเร็จมากขึ้นไปด้วย

อย่างไรก็ตามจากการวิเคราะห์ก็ยังพบคำอื่นที่ Correlate กับ Unemployment Rate เช่นคำว่า “Spider Solitaire” (แต่ก็เรื่องเดิมคือ มือมันว่าง นั่นแหละ หนังสือเค้าว่าอย่างนั้น โอยยย)

ใครที่อยากอ่านลงรายละเอียดลึกกว่านี้ในเรื่องนี้สามารถอ่านได้ในลิงค์ที่ผมให้ไว้ด้านบนนะครับ ยังมีอีกหลายบทที่หัวข้อน่าสนใจเชียวครับ สามารถเวลาว่างที่ไม่ต้องขับรถไปทำงานอ่านได้สบายๆ เลย 🙂

Happy Analytics:)

Leave a Reply