A leaked document indicates Runway’s Gen-3 AI video generation tool may have been trained on YouTube videos and copyrighted content without permission-

Here’s a question that can throw a generative AI company into a twist: “What content has been used to train your models?” While some opt to dodge the question, and others bullishly front out the issue entirely, the question of whether an AI company has scraped content for its own business purposes without permission is a thorny one. 

At best, you’re likely to get a mealy-mouthed explanation of “curated datasets”, and at worst, a polemic about whether everything on the internet is essentially fair game.

Now a document obtained by 404media appears to show that part of the data used to train Runway’s latest AI video generation tool, Gen-3, may have come from the YouTube channels of thousands of popular media companies, including Pixar, Netflix, Disney and Sony.

While 404media doesn’t go into details as to how the document was obtained, nor could it verify that every video mentioned within was used to train Gen-3, it’s potentially an insight into the sort of practices that an AI company might use to scrape copyrighted material to train its models.

A former Runway employee spoke to 404media about the methodology involved. The 14 spreadsheets contained within the leaked document are said to feature terms like “beach” or “rain”, with the names of Runway employees next to them. 

According to the source, these names were said to be employees tasked with finding videos or channels related to these keywords, who would then go on to use a YouTube video downloader tool via a proxy to scrape them from the site without being blocked by Google.

It’s not just YouTube content that looks to have been scraped, either. A spreadsheet containing 14 links to non-YouTube sources, including a link to a website dedicated to streaming popular cartoons and animated movies, with thousands of copyright complaints logged against it. 

Essentially, pirated media looks to have been at least under consideration for training data, if not directly scraped and used.

404media actually went one step further, and attempted to use Gen-3 to generate video using prompts that contained keywords based on the terms found in the spreadsheet, and was able to create clips that looked to be very much in the same style as the associated content.

Runway was itself part-funded by Google, among others, so scraping content without permission from creators on its platforms, if true, is likely to land it in significant hot water. Never mind the potential wider legal repercussions.

Still, while the issue of AI content theft is a thorny one, the model does still appear to have issues. Ars Technica tried creating some videos recently with Gen-3 Alpha, and it gave a cat a pair of human hands. I’m not sure what content was used to train that particular version of the model, but I’d suggest that no matter the methodology used here, it could do with some work one way or the other.

Related Posts

อินซากี้โอเคทีมชนะแต่ชี้ว่าควรทำได้ดีกว่านี้

“งูใหญ่” ลงสนามในเกมนี้หลังพ่ายต่อ เอซี มิลาน เมื่อสัปดาห์ที่แล้ว โดยทีมนำก่อนจาก ดาวิเด้ ฟรัตเตซี่ ตั้งแต่นาทีแรก แต่ถูก คริสเตียน คาบาเซเล่ ตีเสมอนาที 35 จากนั้นทีมมาได้สองประตูรวดของ เลาตาโร่ มาร์ตีเนซ ช่วงทดเวลาบาดเจ็บครึ่งแรกและนาทีที่ 47 แม้ อูดิเนเซ่ มายิงเพิ่มอีกจาก ลอเรนโซ่ ลุชก้า นาที 83 แต่ทีมก็รักษาสกอร์ชนะ…

เพลิแกนส์ขยายสัญญาอัลวาราโด้2ปี

นิว ออร์ลีนส์ เพลิแกนส์ บรรลุข้อตกลงกับ โฮเซ่ อัลวาราโด้ การ์ดวัย 26 ปีด้วยสัญญา 2 ปี มูลค่า 9 ล้านเหรียญสหรัฐ ตามรายงานจาก บ็อบบี้ มาร์คส์ ผู้สื่อข่าวอีเอสพีเอ็น  คำพูดจาก สล็อตเว็บตรง อัลวาราโด้ ยังอยู่ภายใต้สัญญาอีกหนึ่งปี มูลค่า 1.9 ล้านเหรียญสหรัฐ และตอนนี้การทำข้อตกลงใหม่จะทำให้เขาอยู่ใน นิว…

โจนส์พร้อมฉลองหากทำสกอร์ที่แลมโบฟิลด์

แอรอน โจนส์ รันนิ่งแบ็กวัย 29 ปีของ มินเนโซต้า ไวกิ้งส์ เผยว่าเขาพร้อมกระโดดขึ้นบนอัฒจันทร์ของสนาม แลมโบ ฟิลด์ หากตนเองทำทัชดาวน์ได้ในการเผชิญหน้ากับทีมเก่า กรีนเบย์ แพ็คเกอร์ส วันอาทิตย์นี้ ตามรายงานจากเอ็นเอฟแอลเน็ตเวิร์คคำพูดจาก สล็อตเว็บตรง โจนส์ เล่นกับ แพ็คเกอร์ส นาน 7 ฤดูกาล นับตั้งแต่เข้าลีกฐานะดราฟท์รอบ 5 คลาส 2017 ก่อนจะย้ายมาเซ็นสัญญา…

เรือควงหงส์เยือนเกมหนัก, ผีฟัดจิ้งจอก'บาวคัพ'รอบ4_1

ผลการประกบคู่ คาราบาว คัพ รอบ 4 หรือรอบ 16 ทีมสุดท้ายออกมาเป็นที่เรียบร้อยหลังจบการแข่งขันรอบ 3 เมื่อคืนวันพุธที่ผ่านมา คู่ที่น่าสนใจหนีไม่พ้น ไก่เดือยทอง ต้องเปิดบ้านรับมือ เรือใบสีฟ้า ซึ่งถือเป็นบิ๊กแมตช์ของรอบนี้ ทางด้าน หงส์แดง มีคิวออกไปเยือน นกนางนวลแดนใต้ ผิดกับ ปิศาจแดง ได้เปิดสนาม โอลด์ แทร็ฟฟอร์ด รอพบ จิ้งจอกสีน้ำเงิน ฝั่ง…

อัลกวาซิลชมลูกทีมหลังเกมบุกเสมอนีซ

อีมานอล อัลกวาซิล เทรนเนอร์ เรอัล โซเซียดาด กล่าวยกย่องผลงานของลูกทีมหลังการบุกเสมอ นีซ 1-1 บนเวทียูโรปาลีก โดยเฉพาะสองแข้งดาวรุ่ง จอน มาร์ติน และ ปาโบล มาริน ที่ลงเล่นตัวจริงครั้งแรก จากการเปิดเผยกับเรเลโบเมื่อวันพฤหัสฯที่ผ่านมา 'ถ้ามีสิ่งหนึ่งที่ทีมนี้มี นั่นคือบุคลิกที่พิเศษมาก การเปลี่ยนระบบ มีนักเตะที่เติบโตจากท้องถิ่นจำนวนมาก สำหรับหลายๆคน นั่นเป็นการลงสนามฐานะตัวจริงครั้งแรกของพวกเขา ผมมักจะพูดแบบเดิมเสมอ นักเตะเหล่านี้ลงสนามด้วยความคิดของผม ด้วยสิ่งที่ผมบอกพวกเขา' 'อีกครั้ง…

โซลันกี้ชี้แข้งไก่เล่นตามแผนสาเหตุชนะสวย

ไก่เดือยทอง เปิดบ้านชนะ การาบัก 3-0 ในศึก ยูโรปา ลีก รอบลีก สเตจ นัดแรก เมื่อคืนวันพฤหัสบดีที่ผ่านมา โดยเกมดังกล่าว สเปอร์ส ต้องเล่น 10 คนตั้งแต่นาทีที่ 8 หลังจาก ราดู ดรากูชิน โดนไล่ออก “มีความสุขมากที่คว้าชัยมาครอง นักเตะทุกคนสู้กันอย่างหนัก” กองหน้าที่ทำหนึ่งประตูและหนึ่งแอสซิสต์กล่าวผ่าน ทีเอ็นที สปอร์ตส์ “การเหลือผู้เล่นแค่…