2023年01月24日 12時30分ネットサービス

ニュースメディアのCNETが使っていた記事作成AIは「競合他社や系列サイトのライターの記事を盗作していた」という指摘

2023年1月、ニュースメディアのCNETが作成にAIを用いた金融解説記事をひそかに公開していることが発覚し、大きな話題を呼びました。すでにCNETはAI製記事の公開を停止していますが、新たにテクノロジー系メディアのFuturismが「CNETのAIは競合他社やグループ会社のライターが書いた記事から盗作していた」と報告しました。

CNET's AI Journalist Appears to Have Committed Extensive Plagiarism
https://futurism.com/cnet-ai-plagiarism

Futurismは2023年1月、CNETが2022年11月頃から一部の金融解説記事にAIを用いていたことを報じました。CNETのAI製記事には「CNET Money」と署名されており、一見しただけではAIによる記事だとはわからないようになっていました。なお、CNETの親会社であるRed VenturesはCNETだけでなく、BankrateやCreditCard.comといった系列サイトでもAI製記事を公開していたことが明らかとなっています。

ニュースメディアのCNETが2022年11月から「CNET Money」という署名を付けて密かにAIで記事を作成していると報じられる - GIGAZINE

その後の調査では、CNETのAI製記事は人間によるファクトチェックを経ていたにもかかわらず、内容には重大な誤りが含まれていたことが報じられました。

ニュースサイト「CNET」に掲載されたAI製記事は人間のファクトチェックを経てもなお重大な誤りが含まれていた - GIGAZINE

一連の報道が問題視されたことを受けて、CNETの首脳陣はAIが生成したすべての記事の公開を停止することを決定しました。なお、CNETの編集者であるコニー・グリエルモ氏は1月12日の声明で、AIの使用は記者をAIに置き換えることを目的としたものではなく、人間の仕事を支援することを目的とした「実験」と呼んでいます。

CNETがAIで記事を書いていることを問題視されて記事の公開を停止へ - GIGAZINE

新たにFuturismは、CNETのAIが競合他社や系列サイトの「人間のライター」が記した記事から逐語的なコピーや言い換えを行っており、それらすべてに適切なクレジットを付けていないと報告しました。たとえば、預金残高を超えた支払いが行われた際の手数料である「overdraft fee(当座貸越手数料)」を回避する「overdraft protection(当座貸越保護)」について記されたCNETのAI製記事には、以下のような文章が含まれています。

How to avoid overdraft and NSF fees
Overdraft fees and NSF fees don't have to be a common consequence. There are a few steps you can take to avoid them.

和訳：
当座貸越手数料とNSF(残高不足)手数料を回避する方法
当座貸越手数料やNSF手数料は、一般的な結果である必要はありません。それらを避けるためのいくつかのステップがあります。

一方、競合他社であるForbes Advisorに掲載された別の記事にも、非常に類似した文章があります。

How to Avoid Overdraft and NSF Fees
Overdraft and NSF fees need not be the norm. There are several tools at your disposal to avoid them:

和訳：
当座貸越手数料とNSF(残高不足)手数料を回避する方法
当座貸越手数料やNSF手数料は標準である必要はありません。それらを回避するために、自由に使えるいくつかのツールがあります。

AI製記事の文章をForbes Advisorの文章と比較すると、大文字と小文字の変更や文言の言い換え、構文の変化などがあるものの、ほぼ同じ内容であることがわかります。

また、CNETのAIが書いた別の記事とForbesの記事の見出しを比較すると以下のようになります。

CNET：
Can You Buy a Gift Card With a Credit Card?

Forbes：
Can You Buy Gift Cards With a Credit Card?

いずれも「クレジットカードでギフトカードを購入できますか？」という意味の見出しとなっており、2つの違いは「Gift Card」(単数形)か「Gift Cards」(複数形)かという1点だけです。

さらにFuturismは、CNETのAIが系列サイトであるBankrateのライターの文章も利用していたと指摘。CNETの記事とBankrateの記事を比較すると以下の通り。

CNET：
Becoming an authorized user can help you avoid applying for a card on your own, which is a major benefit if you currently have bad credit or no credit history.

和訳：
認証ユーザーになることで、自分でカードを申し込む必要がなくなるため、現在の信用度が低い人やクレジットヒストリーがない人には大きなメリットとなります。

Bankrate：
Becoming an authorized user also lets you avoid having to apply for a card on your own, which is a major benefit if you currently have bad credit or no credit history at all.

和訳：
認証ユーザーになると、自分でカードを申し込む必要がなくなるため、現在の信用度が低い人やクレジットヒストリーがまったくない人には大きなメリットとなります。

Futurismは、「基本的にCNETのAIは、すでに公開されている同様の記事を調べ、それらから文章を読み取ることでトピックにアプローチしているようです。その過程で元の文章の構文や単語選択、および構造の調整を行います。時には2つの文章をマッシュアップしたり、1つの文章をバラバラにしたり、一部を新しいつぎはぎの文章に組み立てたりします」「要するにCNETのAIによって生成された記事を綿密に調べると、洗練されたテキストジェネレーターではなく、人間のジャーナリストを解雇する記事を送り出す自動化された盗作マシンのように見えます」と指摘しています。

CNETのAIが盗作マシンのようになっている理由については、機械学習システム自体が膨大な量の「トレーニングデータ」を入力し、高度なアルゴリズムによって同様の作業を実行可能にするという仕組みだからだろうとFuturismは主張しました。

アメリカのワシントン・アンド・リー大学でAIを用いた不正行為について調査しているJeff Schatten教授は、Futurismが提出したCNETのAIによる盗作の調査結果をレビューし、一連の記事は盗作のレベルに達していると回答したとのこと。Schatten氏はFuturismに対し、「もし学生が私の授業でCNETが作成したものと同等のものを発表し、出典を明記していなければ、私は間違いなく盗作と見なすでしょう」と述べています。

Futurismの編集長であるJon Christian氏は、「少なくとも作家やアーティスト、その他のクリエイターが学習データに含められることからオプトアウトする方法が必要だと思います(そして、技術的にどうであれできるならば学習済みモデルからも)」と述べました。

Yeah, I do think that at the *very* least there needs to be a way for writers/artists/other creators to opt out of inclusion in training data (and hopefully trained models as well, whatever that would look like technologically)
— Jon Christian (@Jon_Christian) January 23, 2023

この記事のタイトルとURLをコピーする

・関連コンテンツ

2023年01月24日 12時30分00秒 in ソフトウェア, ネットサービス, Posted by log1h_ik

You can read the machine translated English article here.