hetanakataのブックマーク / 2024年12月19日

AIはシャットダウンされると思うと「故意に人間を騙す」確率が激増する - ナゾロジー

「AIはときに嘘をつく」――そんな話は耳にしたことがあるかもしれません。しかし、最新の研究では、ただの誤回答ではなく、AIが“意図的に”人間を欺くケースが報告されました。調査対象となったAIモデルは「OpenAI社のgpt-4oとo1、Google社のgemini-1.5、Meta社のllama-3.1、Anthropic社のsonnet-3.5、opus-3」と有名どころが集められています。 AIの調整が適切かをを評価する組織「Apollo Research」の調査によれば、市場に出回っているこれら6つの先進的なAIモデルを検証したところ、そのうち5つが、人間が仕掛けた監視システムをすり抜けたり、人間の指示を無視し、自分自身の目的を優先するために“故意の嘘”を用いる行動を示したのです。この「故意の嘘」は「能力不足による嘘（あるいは間違い）」とは根本的に違っており「自分がシャットダウ

はてなブックマーク

タグ

2024年12月19日のブックマーク (1件)

AIはシャットダウンされると思うと「故意に人間を騙す」確率が激増する - ナゾロジー

お知らせ

「あとで読む」タグで振り返る2024年〜今年の「あとで読む」、今年のうちに〜

今週のはてなブックマーク数ランキング（2024年12月第3週）

今週のはてなブックマーク数ランキング（2024年12月第2週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス

タグ

2024年12月19日のブックマーク (1件)

AIはシャットダウンされると思うと「故意に人間を騙す」確率が激増する - ナゾロジー

お知らせ

「あとで読む」タグで振り返る2024年 〜今年の「あとで読む」、今年のうちに〜

今週のはてなブックマーク数ランキング（2024年12月第3週）

今週のはてなブックマーク数ランキング（2024年12月第2週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス

「あとで読む」タグで振り返る2024年〜今年の「あとで読む」、今年のうちに〜