「企業内でディープラーニング(深層学習)を手掛けようにも、現状は手足を縛られているような状態だ。企業が問題なく使える『政府お墨付きのデータ』を整備してもらえないか――」。 2017年5月24日、愛知県で開催された人工知能学会全国大会の公開セッションで、質問に立った企業の技術者が切実な声を挙げた。 深層学習を始めとする人工知能(AI)技術の研究開発には、AIに学習を施すための学習用データの整備が不可欠だ。 だがAIが学習するデータの多くは、行動履歴、チャット、ブログ、つぶやきなど「ユーザーが生成に関わったデータ」である。 こうしたデータを扱うには、著作権などの知的財産権、通信の秘密、プライバシーといった法律的、倫理的な問題への配慮が求められる。データ生成元への配慮を欠けば、思わぬ“炎上”につながりかねない。 同全国大会の研究発表で、まさにこの懸念が現実になった。立命館大学の研究チームが学会の