オープンイノベーション促進のためのモデル契約(AI編)のポイント

February 17, 2022

執筆者:弁護士 西口健太

(目次)

1.はじめに

2.モデル契約書(AI編)について

3.データの活用と保護

4.学習済みモデルの活用

5.まとめ

―――

1.はじめに

 近時、工場における不良品の検知、保険会社における保険金の不正請求の発見、EC(通販)サイトにおける消費者の嗜好に基づくレコメンド、実店舗での消費者の行動予測、パッケージ開発など、あらゆる場面でAIが利用されるようになりました。

 そのため、AI技術の開発を行うスタートアップ企業はもちろん、AI技術の開発を行う企業でなくとも、その事業活動において何らかの形でAI技術を利用する機会が一気に増加することが予想され、それに伴ってAIに関連する契約の重要性も増しています。

 しかしながら、AIの特殊性もあり、AIに関連する契約においては通常の契約とは異なる考慮要素も多く存在します。

 本稿では、2021年3月に特許庁及び経産省により公開された、「研究開発型スタートアップと事業会社のオープンイノベーション促進のためのモデル契約書」(以下、「モデル契約書」)の「AI編」を題材に、AIに関連する契約の重要なポイントについて解説します。

2.モデル契約書(AI編)について

(1)モデル契約書(AI編)の概要

 近年、人工知能(AI)などテクノロジーの急速な進展とともに、大企業の自前による研究開発の限界が認識され、スタートアップ企業を含む外部の企業、大学、研究機関等との連携による事業開発(いわゆるオープンイノベーション)が大変注目されています。

 ところが、日本企業は従来このようなオープンな外部との連携には慣れていなかったため、契約交渉などが難航する事例も多くありました。

 このような状況を受けて、特許庁と経産省は、2020年6月、新素材開発のスタートアップ企業と自動車部品メーカーが連携を模索するというストーリーに沿ったモデル契約書を公開しました。

 そして、本年3月には、本稿の検討の対象であるAI編も公開されました。

 AI編では、動画・静止画から人体の姿勢を推定する高度なAI技術を有するスタートアップ企業と、介護施設向けリハビリ機器の製造販売メーカー(以下、「リハビリ機器メーカー」)が、同AI技術を介護施設における被介護者の見守り用のカメラシステムと連携できるようにすることで、被介護者の転倒・徘徊等の防止に活用するという協業を模索するというストーリーに沿って、契約書のモデル(ひな形やその解説)が示されています。

 このモデル契約書は、秘密保持契約書、PoC契約書、共同研究開発契約書、ライセンス契約書からなります。

 これは、秘密保持契約を交わして情報交換をし、次いでPoC(Proof of Concept。スタートアップ企業の技術について検証や実証実験を行う過程)を行い、その結果に応じて共同で研究開発を行い、成果物についてライセンスを行う、というスタートアップ企業と事業会社の連携におけるスタンダードな流れに沿っています。

(2)契約ガイドラインとの違いについて

なお、経済産業省からは、モデル契約書とは別に、AI・データの利用に関する契約ガイドライン(以下、「契約ガイドライン」)が公開されています。

モデル契約書(AI編)と契約ガイドラインの違いですが、契約ガイドラインはAI及びデータに関する契約一般について記載しているのに対し、モデル契約書(AI編)は、AI技術を有するスタートアップ企業と事業会社の連携という具体的な設例に沿って作成されています。

また、契約ガイドラインは2018年6月に初版(2019年12月に1.1版)が策定されたものですが、モデル契約書(AI編)は2021年3月に公開されておりこの間の契約実務の進展を反映している部分もあります。

3.データの活用と保護

(1)AIにおけるデータの活用の必要性と、その保護の必要性

AIに関連する契約書を作成するにあたっては、AIを活用したシステム等を開発するにあたって、どのようなことが行われるのかを理解しておく必要があります。

そこで、AI技術の実用化のフローを見てみましょう。

(出典:契約ガイドライン12頁)

 モデル契約書(AI編)の共同開発の事例をもとに考えると、まず上図の「学習段階」では、リハビリ機器メーカーが、介護施設向け見守り用カメラの映像などの「生データ」を、AI技術を有するスタートアップ企業に提供します。  

 この生データは、外れ値、欠損値を含むなどそのままではAIの学習に適していないものが含まれていることが多いため、スタートアップ企業において、この外れ値、欠損値を除外、修正するなどの作業が必要になります。

 また、例えば、被介護者が転倒や徘徊をした画像にその旨のラベル情報を付す(つまり、「こんな動きをしたら転倒したということだよ」というのをAIに教えてあげるというイメージです)など、あるデータの入力に対する正解を規定するというような作業も必要になることがあります。

 このようにして生データを加工・前処理して作られたAIの学習用のデータセットを「学習用データセット」といいます。

 この学習用データセットの質と量が、その後のAIの能力や精度を大きく左右します。 

 AIを効率的に学習させるためにどのように学習用データセットを作るかというのはAI技術を有するスタートアップ企業の腕の見せ所であり、ノウハウでもあります。 

 この学習用データセットを用いて、スタートアップ企業が保有する「学習用プログラム」に入力してAIに学習させることで、ソフトウェアとしての「学習済みモデル」ができることになります。

 基本的に、有用な生データが多ければ多いほど、「学習済みモデル」の精度は上がります。

***

 次に上図の「利用段階」では、スタートアップ企業とリハビリ機器メーカーが共同して、この「学習済みモデル」であるAIと見守り用カメラが連携するシステムを作り、カメラで被介護者が転倒した画像が確認できた場合に、「転倒」として検知し、自動的に担当者に通知がされる、というような利用を行うことが考えられます。

 

(2)データの活用と保護に関するモデル契約の条項

 このように、AIの活用には生データの質や量が重要であること、AIに効率的に学習させるためにも、生データの加工・前処理を行って学習用データセットを作ることが重要であることがお分かりいただけたかと思います。

 また、自社のデータを提供する側の企業としては、そのデータの取扱いについて強い関心があるものと思われます。

 そのことを前提に、モデル契約書(AI編)のうちの「共同研究開発契約書」の内容を見ていきましょう。 

***

 まず、提供された生データの取扱いに関しては、目的外利用と第三者への提供を禁止するのが原則です。

 このうち目的外利用の禁止ですが、定められた目的以外での生データの利用を禁止することになりますので、「目的」の内容をどのように規定するかが契約上の一つのポイントになります。

 スタートアップ企業側における生データの利用目的は、「本共同開発の遂行」というように規定され、そのプロジェクトについてだけ利用できるようにすることが比較的多いように思われます。

 他方、スタートアップ企業としては、この目的に、「甲(※注:スタートアップ企業)が保有または開発するAI技術の向上」も含まれるというような規定をして、利用目的を拡張することも考えられます(モデル契約書(AI編)でもその点が指摘されています)。

 AI関連のスタートアップにとってデータをどの範囲で活用できるかは大変重要ですので、大事な交渉ポイントとして常に意識するようにしておくのがよいと思います。

 提供される生データの性質・重要性なども考慮し、事案に応じて、生データを利用できる「目的」の範囲についてスタートアップ企業とデータ提供側の企業で適切な落としどころを見つける必要があります。 

***

 次に、学習用データセットの取扱いです。

 この部分は、データ提供側の企業がAI関係に不慣れだと、そもそも提供したデータとは別に学習用データセットが作られるというような基本的な部分の理解に乏しく、契約上で適切な定めがされないことも多いので、注意が必要です。  

 まずはモデル契約書(AI編)(共同研究開発契約)の条項例(※一部を抜粋)を見てみましょう(甲がスタートアップ企業、乙が介護施設向けリハビリ機器の製造販売メーカーを指します)。

 (本学習用データセットの取扱い)

  第13条 甲は、本共同開発の過程で甲が生成する本学習用データセットを、乙に対し開示等する義務を負わない。

       2 甲は、本学習用データセットを、本共同開発の遂行の目的を超えて、使用、利用または第三者に開示等してはならない。