AI技術の進化が目覚ましい昨今、特に「生成AI」をめぐる著作権が問題となっています。
従来のAIは、データを整理・分類し、構造化されたデータセットをもとに予測を行うものでしたが、「生成AI」と呼ばれる最新型のAIは、構造化されていないデータをもとに新たなコンテンツを創造できる技術です。
今回は、生成AIと著作権をめぐる問題のうち、生成AIの開発段階に焦点を絞って解説します。
生成AIの開発と著作権をめぐる問題点
生成AIの開発では、まず膨大な学習用データを収集し、それを加工して学習用データセットを構築します。続いて、構築された学習用データセットを学習用プログラムに入力すると、AIの学習済みモデルができます。ここまでが、生成AIの開発段階です。
生成AIの開発段階で収集する学習用データには、小説や論文、絵画や楽曲といった典型的な著作物が含まれます。このため、既存の著作物を生成AIの開発に利用すること自体が、著作権侵害のリスクをはらんでいるのではないか、ということが議論になっています。
著作権とは
著作権とは、著作物の創作者が自身の著作物を勝手に複製されたり、インターネットで公開されたりしない権利です。何が「著作物」にあたるか、著作権はどのような範囲で保護されているかなどは、著作権法に規定されています。
著作権法の目的
著作権法(以下、「法」)第1条には、「この法律は、著作物並びに実演、レコード、放送及び有線放送に関し著作者の権利及びこれに隣接する権利を定め、これらの文化的所産の公正な利用に留意しつつ、著作者等の権利の保護を図り、もつて文化の発展に寄与することを目的とする」と明記されています。
著作権法は「著作者等の権利の保護」と「文化的所産の公正な利用」のバランスを図ることを目的とした法律なのです。「文化的所産の公正な利用」とはすなわち、著作物を円滑に利用できることを意味します。
このため著作権法では、「著作権者の著作権」は「著作物の円滑な利用を妨げない」限りにおいて保護されます。
保護される「著作物」の範囲
法第2条1項第1号には、「著作物」の定義について「思想又は感情を創作的に表現したものであつて、文芸、学術、美術又は音楽の範囲に属するもの」と規定されています。
保護対象は「思想又は感情」ですので、単なる歴史的事実やデータなどは保護されません。また、「創作的に表現したもの」のみが著作物とされていますので、「ありふれた表現」や「表現にあたらないアイデア」は著作物にはあたりません。また、著作物は「文芸、学術、美術又は音楽の範囲に属するもの」に限定されているため、実用品などは保護の対象外です。
著作権が及ぶ利用形態
著作物のいかなる利用形態にも著作権が及ぶとしたら、「著作物の円滑な利用」が妨げられてしまいます。そこで、著作権法には「複製権」、「公衆送信権」、「譲渡権」といったいわゆる「支分権」が規定されており、著作権の及ぶ利用形態が限定されています。
支分権の及ぶ形態で著作物を利用する場合には、原則として著作権者からの許諾が必要です(法第63条第1項)。しかし、支分権の及ばない利用形態、例えば、個人が小説を読んだり絵画を鑑賞したりする行為には著作権が及ばず、著作権者から許諾を得る必要はありません。
また、著作権法には、一定の場合に著作権者の許諾を得ることなく著作物の利用が認められる「権利制限規定」が設けられています。権利制限規定の例としては、「私的使用のための複製」(法第30条)、「引用」(法第32条)、「学校教育番組の放送等」(法第34条)、「営利を目的としない上演等」(法第38条)などが挙げられます。
著作物の利用形態は多岐にわたります。どのような利用形態に著作権が及ぶかは、判例や裁判例を参考にしながら個別具体的に検討する必要があります。
生成AI開発における著作物の利用の可否
生成AIの開発で著作権が問題になる工程
生成AIの開発段階では、AI学習用データセット構築に向けた「学習データの収集・加工」、基礎モデルにデータセットを学習させるための「学習用データセットのWeb公開」といった行為が介在します。また、生成AIを搭載したアプリケーションやシステムの開発では、「学習済みモデルへの追加的な学習」や「指示・入力に用いるためのデータベース作成」が行われます。
いずれの工程でも、対象データには「著作物」が含まれています。そこで、例えば「学習データの収集・加工」は著作権法上の「複製」ではないか、「学習用データセットのWeb公開」は「公衆送信」ではないかなど、著作権との抵触の可能性が浮上します。
しかしながら、数十億点にものぼる膨大な著作物について個別に許諾を得るのは現実的ではありません。
生成AI開発を見据えた著作権法の改正(2018年5月)
こうしたテクノロジーの進化を背景に、2018年5月に著作権法が改正され、「著作物に表現された思想又は表現の享受を目的としない利用」(法第30条の4)が権利制限規定のひとつとして追加されました。
【著作権法第30条の4】 著作物は、次に掲げる場合その他の当該著作物に表現された思想又は感情を自ら享受し又は他人に享受させることを目的としない場合には、その必要と認められる限度において、いずれの方法によるかを問わず、利用することができる。ただし、当該著作物の種類及び用途並びに当該利用の態様に照らし著作権者の利益を不当に害することとなる場合は、この限りでない。 一 著作物の録音、録画その他の利用に係る技術の開発又は実用化のための試験の用に供する場合 二 情報解析(多数の著作物その他の大量の情報から、当該情報を構成する言語、音、影像その他の要素に係る情報を抽出し、比較、分類その他の解析を行うことをいう。第四十七条の五第一項第二号において同じ。)の用に供する場合 三 前二号に掲げる場合のほか、著作物の表現についての人の知覚による認識を伴うことなく当該著作物を電子計算機による情報処理の過程における利用その他の利用(プログラムの著作物にあつては、当該著作物の電子計算機における実行を除く。)に供する場合 |
この法改正により、生成AI開発段階における情報解析手段としての著作物の利用は「著作物に表現された思想又は感情の享受目的ではない利用」だということで、著作権者の許諾なく著作物を利用できることが明らかにされました。
もっとも、法第30条の4の但し書きにあるとおり、「著作権者の利益を不当に害することとなる場合」は、著作物の利用はできません。
具体的にどのようなケースが「著作権者の利益を不当に害することとなる場合」にあたるかは、事例の集積を待つほかありません。参考までに、文化審議会著作権分科会法制度小委員会がまとめた令和6年3月15日付「AIと著作権に関する考え方について」には、同条但し書きの適用例として「情報解析用に販売されているデータベースの著作物をAI学習目的で複製する場合」が挙げられています。
まとめ
AI開発段階における著作物の利用に関しては、法第30条の4が定められたことで「著作権侵害にあたらない」範囲が一定程度明確化されました。
しかしながら、但し書きの解釈や「享受目的」での利用どうかの判断を含め、その運用は具体的な事例の蓄積に委ねられています。生成AIの開発事業者や生成AIを使ったアプリケーションを展開する事業者は、引き続き生成AIと著作権に関する判例・裁判例を注視する必要があるでしょう。
井上国際特許商標事務所には、著作権に関する知見が豊富な弁理士が所属しています。AI開発における著作権問題にお悩みの方は、ぜひご相談ください。
Comments