再びこの話題です。
Proof Newsの調査により、Anthropic、Nvidia、Apple、Salesforceなど、世界有数の大企業が、YouTube動画の字幕を無断で使用しAIをトレーニングしていたことが明らかになりました。このデータセット「YouTube Subtitles」には、Khan Academy、MIT、Harvardなどの教育チャンネルや、The Wall Street Journal、NPR、BBCなどの報道機関、さらに人気YouTuberの動画が含まれており、多くのクリエイターが不満を表明しています。
クリエイターの権利は保護されるべきですが、一方でAIの高度化にはトレーニングデータが不可欠です。著作権法上のフェアトレードの観点から見ると、トレーニングされたAIが結果の出力に元の映像や内容をそのまま使用しているわけではないため、問題ないとも言えます。
しかし、クリエイターからすれば、時間をかけて作成したコンテンツを無断で使用され、その結果生まれたAIモデルが大きな収益を上げているとなると、納得できないのも感情的には理解できます。AIが自分たちの作品と同様のコンテンツを生成したり、模倣者を生み出す可能性への懸念も完全には払拭できません。
この問題は、AIの発展とクリエイターの権利保護という相反する立場からの主張なので、現状のままでは解決は難しいでしょう。そろそろ規制当局が、AIトレーニングデータの使用に関する方針を示す必要があります。許可なくデータを使用することの問題点を踏まえつつ、AIの発展を過度に制限しないような法的措置や規制について、早急に議論を深めて方向性を示すべき時期に来ていると言えます。