การที่มีบทความซ้ำกันหรือคล้ายกันมากๆ ไม่ใช่เรื่องที่ดี เพราะส่วนนี้จะทำให้ Google มองเว็บเราไม่ดี และทำให้คะแนน SEO ร่วงเอาง่ายๆ แต่โดยทั่วไปแล้วเว็บไซต์ส่วนใหญ่มักจะมีเนื้อหาซ้ำกันในหนึ่งเว็บไซต์ ส่วนใหญ่เกิดจากกรณีที่เราไม่ตั้งใจซะด้วย ลองมาดูกันครับ
ความหมายของ Duplicate Content
Duplicate Content หมายถึงการที่มีเนื้อหาเหมือนกันทั้งหมด หรือเกือบจะเหมือนกัน โดยอยู่บน URL ที่ต่างกัน ให้ลองนึกถึงเว็บไซต์ที่คัดลอกเนื้อหาจากเว็บไซต์อื่นมา หรือนำมาแก้ไขเพียงเล็กน้อยซึ่งไม่เพียงพอที่จะตบตา algorithm ของ Google
แต่ถ้าเป็นเนื้อหาที่แปลมาจากแหล่งที่มาเดียวกัน โดยการใส่สำนวนของผู้เขียนลงไปด้วย อันนี้ไม่ถือว่าเป็น Duplicate Content เพราะคงไม่มีใครแปลออกมาแล้วจะเหมือนเป๊ะขนาดนั้น
ทำไมถึงเกิด Duplicate Content?
การที่มีบทความซ้ำบนเว็บไซต์ทั่วไป ส่วนใหญ่มักจะเกิดขึ้นจาก 3 กรณีนี้
- คุณเขียนบทความลงเว็บไซต์ของตัวเอง แล้วไปโพสต์บนเว็บอื่นๆ อย่าง Medium หรือ pantip ด้วยเนื้อหาเดียวกัน หรือคล้ายกัน
- คุณไม่ได้ตั้งใจ คุณจะเขียนเนื้อบนเว็บไซต์ที่เดียวนี่แหละ แต่บนเว็บคุณมีฟีเจอร์บางอย่างที่ทำให้เกิด URL ของ Post มากกว่า 1 ชุด เช่น การเข้าถึงเนื้อหาด้วย URL ที่ มี/ไม่มี www หรือ http/https ซึ่งทุก URL ก็จะมีเนื้อหาเหมือนกันเป๊ะๆ ถือว่า Duplicate
- อีกหนึ่งกรณีคือเว็บไซต์อื่นคัดลอกเนื้อหาของเราไป ซึ่งตรงนี้ส่วนใหญ่เราจะไม่ได้รับผลกระทบ เพราะเว็บไซต์เราจะถูกมองว่าเป็นต้นฉบับอยู่แล้ว (ขยายความในเนื้อหาถัดไป)
ผลที่ตามมาของการมี Duplicate Content
การที่เว็บไซต์มีเนื้อหาซ้ำกันบนโลกอินเตอร์เน็ตถือว่าเป็นเรื่องไม่ดี และแน่นอนว่า Google ก็มองแบบนี้ ทำให้ถูกมองว่าเป็นเนื้อหาที่มีคุณภาพต่ำ เพราะการแสดงเนื้อหาที่ซ้ำกันในหน้าเดียวกันของ Google นั้นไม่เป็นประโยชน์ต่อผู้ใช้ (คิดง่ายๆ ว่า Google สนับสนุนหรือไม่สนับสนุนอะไร ให้ลองคิดในมุมของผู้ใช้ ว่าสิ่งนั้นมีประโยชน์ต่อผู้ใช้หรือไม่)
ถ้ามีเนื้อหาที่ซ้ำกัน แล้วเว็บไหนจะถูกมองว่าลอกมา?
ตอนที่เรา Publish เนื้อหาออกไปแล้ว Google จะมาเก็บ Index ที่เนื้อหาเราแทบจะทันที ถ้าเราเป็นต้นฉบับขอให้มั่นใจว่าเว็บไซต์เราจะไม่ถูกลดคะแนน SEO ลงอย่างแน่นอน แต่ให้ระวังเรื่องของการลงข่าว PR ที่นำเนื้อหาจากเอกสารมาลงเหมือนกันเป๊ะในหลายเว็บ
แต่ถ้าหาก Duplicate Content เกิดขึ้นบนเว็บไซต์ของเราเอง เป็นไปได้ว่า Google จะมา Index ใน URL ที่เราไม่ต้องการ แทนที่จะมา Index ใน URL หลักก่อน ในส่วนนี้ค่อนข้างอันตราย รวมไปถึงการมีเนื้อหาที่ซ้ำกันในเว็บเดียวก็ไม่ใช่เรื่องที่ดี
วิธีแก้ไขหากพบว่ามี Duplicate Content
กรณีที่พบว่าเว็บไซต์เรามี Duplicate Content ในเว็บของเราเอง อันนี้ต้องสะกิดฝั่งผู้ดูแลเว็บไซต์ให้เขียนโปรแกรมเพื่อใส่ Canonical Tag ลงในหน้าที่ไม่ใช่หน้าหลัก เพื่อ “ชี้” ไปยังหน้าที่เราต้องการให้ Google เก็บ Index จริงๆ
ถ้าใครใช้ WordPress แล้วติดตั้ง Plugin Yoast SEO เอาไว้ ตรงนี้เค้าจะช่วยใส่ Canonical Tag เอาไว้ให้อัตโนมัตอยู่แล้วครับ โดยการชี้ไปที่ permalink ที่เราตั้งค่าเอาไว้ แต่ถ้าใครต้องการจะชี้ไปหน้าอื่น ที่ด้านล่างของบทความจะมีให้ใส่ Canonical URLs ให้เราใส่ URL ที่ถูกต้องแบบเป๊ะๆ ลงไปได้ (แต่โดยทั่วไปก็ไม่ต้องทำนะ)
และกรณีที่เราโดนเว็บไซต์อื่นคัดลอกเนื้อหาไปแล้ว แล้ว Google ดันไปมองว่าเว็บที่คัดลอกไปเป็นต้นฉบับ ในส่วนนี้เราสามารถแจ้ง Google เพื่อให้เค้าดำเนินการให้ได้ที่ : google.com/webmasters/tools/dmca-notice (อาจใช้เวลานาน)
อ้างอิง : support.google.com