หลังจากตรวจสอบได้ว่า Microsoft ใช้บทความของ The New York Times ในการเทรน OpenAI ทั้ง LLM และตัว ChatGPT/Copilot โดยไม่ได้รับอนุญาต และไม่ได้มีการจ่ายเงินชดเชยค่าลิขสิทธิ์ให้ ทำให้ ChatGPT นำข้อมูลในบทความของ The New York Times แทบทั้งหมดมาตอบ ถือว่าเป็นครั้งแรกที่บริษัทสื่อใหญ่ฟ้องร้อง ChatGPT เลยก็ว่าได้
ด้านสำหนักข่าวไม่ได้ระบุจำนวนเงินที่ Microsoft จะต้องจ่าย เพราะการฟ้องร้องในครั้งนี้ดูเหมือนจะมีจุดประสงค์เพื่อให้อีกฝ่ายรับผิดชอบความเสียหายที่เกิดขึ้นตามกฎหมาย ซึ่งอาจตีมูลค่าออกมาหลายพันล้านดอลลาร์
โดยปกติแล้ว OpenAI ไม่ได้เปิดเผยชุดข้อมูลที่ใช้เทรน GPT-4 แต่สำหรับ GPT-2 และ GPT-3 ได้เคยระบุไว้ว่ามีการใช้ชุดข้อมูล WebText/WebText2 ที่ดาวน์โหลดข้อมูลจำนวนมากจากเว็บคุณภาพสูงต่าง ๆ ซึ่งเว็บไซต์ของ The New York Times (www.nytimes.com) เป็นหนึ่งในเว็บไซต์ที่ถูกใช้เป็นแหล่งข้อมูลในการเทรน GPT-3 มากที่สุด และตรวจพบว่า มีการบันทึกทั้งบทความข่าวด่วนและคอมเมนต์บนเว็บไซต์ รวมถึงแบรนด์ในเครือ มากกว่า 66 ล้านรายการ
แม้ก่อนหน้านี้ The New York Times ได้มีการเจรจากับ Microsoft และ OpenAI แล้ว แต่ไม่สามารถตกลงกันได้ ในมุมของเหล่าบริษัทที่พัฒนาเทคโนโลยี AI ก็พยายามหาทางทำงานร่วมกันกับมนุษย์ผู้ผลิตคอนเทนต์ แต่สุดท้ายแล้วก็ยังเกิดกรณีดังกล่าวออกมาอยู่เรื่อย ๆ หากการฟ้องร้องในครั้งนี้มีความคืบหน้า ก็อาจเป็นโอกาสสำหรับบริษัทสื่ออื่น ๆ เริ่มฟ้องร้อง AI ข้อหานำข้อมูลไปใช้เทรนโดยไม่ได้รับอนุญาตด้วยเช่นกัน
ที่มา: Engadget