Microsoft と GitHub に対する提訴:Copilot を通じてオープンソースの著作権を侵害した疑い

Microsoft sued for open-source piracy through GitHub Copilot

2022/11/05 BleepingComputer — プログラマーで弁護士の Matthew Butterick が、GitHub の Copilot がオープンソースのライセンス条項に違反し、プログラマーの権利を侵害しているとして、Microsoft/GitHub/OpenAI を提訴している。2022年6月にリリースされた GitHub Copilot は、Visual Studio でソースコードや関数の推奨値を、OpenAI Codex を利用してリアルタイムに生成する、AI ベースのプログラミング支援ツールだ。公開リポジトリの数十億行のコードを使用して、機械学習によりトレーニングされた GitHub Copilot は、自然言語を、数十のプログラミング言語のコード・スニペットに変換できるとされる。

作者の切り出し

Copilot はコードを書くプロセスを高速化し、ソフトウェア開発を容易にする一方で、公開されたオープンソース・コードを使用している。そのため、専門家たちは、ライセンスの帰属や制限の違反を懸念している。

GPL/Apache/MIT ライセンスなどのオープンソース・ライセンスでは、作者の名前を帰属させ、特定の著作権を定義することが義務付けられている。しかし、Copilot はこの要素を排除しており、スニペットが 150文字以上で、トレーニング・セットから直接取得したものであっても、帰属表示は行われない

一部のプログラマーは、これをオープンソース・ロンダリングと呼ぶほどである。そして、Copilot の発表後に、このアプローチの法的意義が発売後に示された。

Tweet

Butterick の代理人を務める法律事務所の Joseph Saveri は、今回の訴訟に関して、「Microsoft は、基礎となるオープンソース・ライセンスの条件や、その他の法的要件を無視して、他人の著作物から利益を得ているようだ」とコメントしている。

さらに悪いことに、公開リポジトリで公開されたシークレットを、Copilot が誤って漏洩してしまい、API キーのようなトレーニング・セットに取り込んでしまったという事例が報告されている。

ライセンス違反の他にも、以下のような点で Github は違反していると、Butterick は主張している。

  • GitHub のサービス利用規約とプライバシー・ポリシー。
  • 著作権管理情報の削除を禁じた DMCA 1202。
  • カリフォルニア州消費者プライバシー法。
  • その他、関連する法的請求の根拠となる法律。

この訴状は、カリフォルニア州北部地区連邦地方裁判所に提出され、$9,000,000,000 の法定損害賠償の承認を要求している。

訴状の具体的な内容としては、「Copilot が違法な Output を提供するたびに、1202条に3回違反する (1: 帰属表示、2: 著作権表示、 3: ライセンス条項なしでの対象物の配布) 。つまり、各ユーザーが Copilot の使用期間中 (最も早く導入したユーザーで最大 15ヶ月間) に、1202条に違反する出力を1回受けるだけだとしても、GitHub と OpenAI は、DMCA に360万回も違反したことになる。1回の違反につき、最低 $2,500 の法定賠償金を支払うとすると、$9,000,000,000 になる」と記されている。

オープンソースに及ぼす害

2022年10月初めのブログ記事でも、Butterick は別の話題にも触れており、Copilot がオープンソース・コミュニティにもたらす損害について以下のように論じている。

Butterick は、「人々にコードの断片を提供し、そのコードの作者を伝えないことにで、オープンソースへのコントリビューションや共同作業のインセンティブが、根本から取り除かれてしまう」と主張している。

また、Butterick のブログには、「Microsoft は、プログラマーが従来のオープンソース・コミュニティを発見するのを妨げるような、新しい壁のある庭を作ろうとしている。時間が経つにつれて、このプロセスは、これらのコミュニティを餓死させるだろう。ユーザーの注意と関与は、オープンソース・プロジェクトそのものから、つまり、ソースレポジトリ/課題追跡システム/メーリングリスト/ディスカッションボードから遠ざかっていくだろう」と記されている。

Butterick の懸念は、長い時間をかけながら、Copilot によりオープンソース・コミュニティは衰退し、最終的には、学習データに含まれるコードの品質が低下するという点だ。BleepingComputer が、上記について Microsoft と GitHub の双方にコメントを求めたところ、GitHub から次のような声明が届いた。

GitHub ーーー 我々は当初から、Copilot で責任ある革新を行うことを約束している。世界中の開発者に対して、最高のサービスを提供するために、製品を進化させ続けていくつもりだ。

オープンソースって、いったい何なのだろうという、本質的な問がありますね。ただし、そこに共通の答えがあるかと言うと、それも無いだろうと思えてしまいます。たまに読む安冨歩の本に、「経済には創発的価値と貨幣的価値がある。放っておくと両者は乖離していくので、それを是正するのが経済学の役割だ」というようなことが書いてありました。オープンソース・コミュニティとのギャップを、埋めていくような未来になるよう、期待したいですね。

%d bloggers like this: