[표지로 읽는 과학] AI가 생성한 데이터 학습한 AI, 오염된 정보 낳는다

입력2024.07.27. 오전 8:00

기사원문

박정연 기자

추천

성별

말하기 속도

이동 통신망을 이용하여 음성을 재생하면 별도의 데이터 통화료가 부과될 수 있습니다.

네이처 제공

국제학술지 '네이처'는 이번주 표지로 입에서 오물을 토해내는 로봇의 이미지를 실었다. 로봇이 흘린 오물에는 작은 로봇들이 달라붙어 있다. 큰 로봇이 생산한 오물이 다시 다른 로봇에게 전해지는 모습을 표현한 것이다.

대형언어모델(ILL)과 같은 생성형 인공지능(AI) 도구의 비약적인 발전은 이 같은 도구가 인간이 오랜 세월 생성한 방대한 데이터를 학습했기 때문이다. 하지만 AI가 만들어낸 정보가 온라인을 통해 빠르게 확산되면서 상황이 변했다. AI가 학습하는 데이터가 인간이 아닌 AI가 생성한 정보로 대체되기 시작한 것이다.

일라일 슈마일로프 영국 옥스퍼드대 교수 연구팀은 AI가 인간이 생산한 정보가 아닌 정보로 학습하기 시작하면서 생성하는 정보의 질이 급격히 저하된다는 연구 결과를 24일(현지시간) 네이처에 발표했다.

이번 연구에선 AI가 생산하는 정보의 질이 급격하게 저하된 사례가 소개됐다. 중세 건축물에 대한 글을 학습한 대형언어모델이 9번에 걸쳐 AI가 생성한 새로운 정보를 학습한 뒤 생성한 텍스트에는 엉뚱하게도 북미산 토끼에 대한 이야기가 담겼다.

TV 예능 프로그램 등에서 소음이 심한 헤드셋을 낀 여러 명의 참가자가 차례대로 단어를 전하는 게임을 할 때와 비슷한 상황이다. 이런 게임에서 마지막 참가자는 종종 처음 제시어와 전혀 다른 단어를 정답으로 제시하곤 한다.

연구팀은 이같은 현상을 '모델 붕괴(models collapse)'라 명명했다. AI가 생성한 질이 저하된 정보가 다음 세대의 AI를 퇴행시키는 현상을 가리킨다. 연구팀은 "오염된 데이터로 학습한 AI는 현실 자체를 잘못 인식하게 된다"고 말했다.

모델 붕괴는 초기 붕괴와 후기 붕괴로 나뉜다. 초기 붕괴는 전체 데이터 중 말단 정보가 손상된다. 후기 붕괴는 전체 데이터 분포가 전반적으로 초기 데이터와 유사하지 않은 분포를 보이게 된다.

연구팀은 이러한 데이터 손상이 발생하는 원인으로 '근사치의 오류'를 지목했다. 정보가 재생산되는 과정에서 AI 모델은 근사치로 추정을 하게 되는데 이렇게 누적된 오차가 결국 데이터를 오염시킨다는 것이다.

연구팀은 "AI가 생성한 데이터를 사용해 대형언어모델을 훈련하는 것이 불가능한 것은 아니지만 이러한 데이터를 정제하는 데 많은 주의를 기울여야 한다"면서 "데이터의 질 측면에선 인간이 생성한 데이터가 여전히 우위에 있을 것"이라고 강조했다.

박정연 기자 [email protected]

박정연 기자

구독자 0

응원수 0

안녕하세요. 박정연 기자입니다.

이 기사는 언론사에서 IT 섹션으로 분류했습니다.

기사 섹션 분류 안내

기사의 섹션 정보는 해당 언론사의 분류를 따르고 있습니다. 언론사는 개별 기사를 2개 이상 섹션으로 중복 분류할 수 있습니다.

닫기

주요뉴스해당 언론사에서 선정하며 언론사 페이지(아웃링크)로 이동해 볼 수 있습니다.

이 기사를 추천합니다

기사 추천은 24시간 내 50회까지 참여할 수 있습니다.

연재 표지로 읽는 과학 구독 명

구독해주셔서 감사합니다

구독한 연재는 설정 페이지에서
확인할 수 있습니다

닫기

동아사이언스 언론사홈 바로가기

동아사이언스 헤드라인

동아사이언스 헤드라인

동아사이언스 랭킹 뉴스 오후 10시~11시까지 집계한 결과입니다.

1

눈과 얼음의 남극 풍경, 초록빛으로 바뀐다

5시간전

더보기
2

장학금 주고 모신 이공계 외국인 석박사, 줄줄이 본국행

12시간전

더보기
3

[사이언스영상] 좀비 손처럼 떨어져 나온다

15시간전

더보기
4

세계 최초 하이브리드 양자 오류정정 기술 개발

11시간전

더보기
5

목성 위성 유로파 탐사선 발사 예정…생명체 존재 가능성 확인

11시간전

더보기

1

의대 교수들 "의대생 휴학 승인 거부는 반헌법적"

11시간전

더보기
2

장학금 주고 모신 이공계 외국인 석박사, 줄줄이 본국행

12시간전

더보기
3

"암흑물질 'DFSZ액시온' 연구 2팀 중 한 팀은 한국…발견만 하면 노벨상"

15시간전

더보기
4

목성 위성 유로파 탐사선 발사 예정…생명체 존재 가능성 확인

11시간전

더보기
집계기준에 해당하는 기사가 더 없습니다.

함께 볼만한 기자

김미래 기자

구독해주셔서 감사합니다

김미래 기자의 기사는
언론사별에서 볼 수 있습니다
닫기

언론사도 함께 구독해 보세요.

언론사를 함께 구독중입니다.

의심사고 766 건 , 인정은 0건?…자동차 급발진 존재할까
동아사이언스
1일전

더보기
이경탁 기자

구독해주셔서 감사합니다

이경탁 기자의 기사는
언론사별에서 볼 수 있습니다
닫기

언론사도 함께 구독해 보세요.

언론사를 함께 구독중입니다.

메타, 동영상 생성 AI ‘무비 젠’ 공개… 오픈AI·구글과 본격 경쟁
조선비즈
5시간전

더보기
장경윤 기자

구독해주셔서 감사합니다

장경윤 기자의 기사는
언론사별에서 볼 수 있습니다
닫기

언론사도 함께 구독해 보세요.

언론사를 함께 구독중입니다.

TSMC, 앰코와 손잡고 美 파운드리 사업 힘준다
지디넷코리아
14시간전

더보기

이종현 기자

구독해주셔서 감사합니다

이종현 기자의 기사는
언론사별에서 볼 수 있습니다
닫기

언론사도 함께 구독해 보세요.

언론사를 함께 구독중입니다.

[우리 술과 과학]⑦ “송산 포도 막걸리 개발만 2년…향료로 흉내내면 농가 피해”
조선비즈
1일전

더보기
박세정 기자

구독해주셔서 감사합니다

박세정 기자의 기사는
언론사별에서 볼 수 있습니다
닫기

언론사도 함께 구독해 보세요.

언론사를 함께 구독중입니다.

“낯익은 앳된 얼굴, 누군가 했더니” 요즘 난리…이것까지 보게 될 줄은
헤럴드경제
1일전

더보기
심관흠 기자

구독해주셔서 감사합니다

심관흠 기자의 기사는
언론사별에서 볼 수 있습니다
닫기

언론사도 함께 구독해 보세요.

언론사를 함께 구독중입니다.

"게임으로 세대 간 벽 허문다"...2024 게임문화축제
YTN
22시간전

재생하기

더보기

진동영 기자

구독해주셔서 감사합니다

진동영 기자의 기사는
언론사별에서 볼 수 있습니다
닫기

언론사도 함께 구독해 보세요.

언론사를 함께 구독중입니다.

'치지직'도 스포츠 중계 강화…아프리카TV 잡는다
서울경제
5시간전

더보기
이준기 기자

구독해주셔서 감사합니다

이준기 기자의 기사는
언론사별에서 볼 수 있습니다
닫기

언론사도 함께 구독해 보세요.

언론사를 함께 구독중입니다.

유상임 "AI 안전, 기후변화 등 복합위기에 글로벌 협력 필수"
디지털타임스
5시간전

더보기
이나리 기자

구독해주셔서 감사합니다

이나리 기자의 기사는
언론사별에서 볼 수 있습니다
닫기

언론사도 함께 구독해 보세요.

언론사를 함께 구독중입니다.

LGD 'TV·모니터용 OLED' 눈 건강 지킨다...최고 등급 획득
지디넷코리아
13시간전

더보기

정지성 기자

구독해주셔서 감사합니다

정지성 기자의 기사는
언론사별에서 볼 수 있습니다
닫기

언론사도 함께 구독해 보세요.

언론사를 함께 구독중입니다.

[iR52 장영실상] 차세대 메모리 선도 … 방대한 데이터 더 빨리 처리
매일경제
7시간전

더보기
이성규 기자

구독해주셔서 감사합니다

이성규 기자의 기사는
언론사별에서 볼 수 있습니다
닫기

언론사도 함께 구독해 보세요.

언론사를 함께 구독중입니다.

항암제 잘 안 듣는 '흑색종' 원인 규명...새 치료법 제시
YTN
4일전

재생하기

더보기
류은주 기자

구독해주셔서 감사합니다

류은주 기자의 기사는
언론사별에서 볼 수 있습니다
닫기

언론사도 함께 구독해 보세요.

언론사를 함께 구독중입니다.

"내수 시장 포화·EU 관세장벽"…중동으로 손 뻗는 中 전기차
지디넷코리아
12시간전

더보기

이병철 기자

구독해주셔서 감사합니다

이병철 기자의 기사는
언론사별에서 볼 수 있습니다
닫기

언론사도 함께 구독해 보세요.

언론사를 함께 구독중입니다.

NASA가 포기한 달 탐사차, 민간 기업이 구원 투수?
조선비즈
17시간전

더보기
송혜영 기자

구독해주셔서 감사합니다

송혜영 기자의 기사는
언론사별에서 볼 수 있습니다
닫기

언론사도 함께 구독해 보세요.

언론사를 함께 구독중입니다.

에스티팜, 日 후지모토 올리고·mRNA 캡핑 대량생산 신기술 도입
전자신문
4일전

더보기
남정민 기자

구독해주셔서 감사합니다

남정민 기자의 기사는
언론사별에서 볼 수 있습니다
닫기

언론사도 함께 구독해 보세요.

언론사를 함께 구독중입니다.

노을, 동남아 시장 공략 속도…인니서 체외진단기 인허가
한국경제
4시간전

더보기

하승연 기자

구독해주셔서 감사합니다

하승연 기자의 기사는
언론사별에서 볼 수 있습니다
닫기

언론사도 함께 구독해 보세요.

언론사를 함께 구독중입니다.

지연·황재균, 결혼 2년 만에 파경…“다름 극복하지 못해 별거 끝에 이혼”
서울신문
1일전

더보기
김은빈 기자

구독해주셔서 감사합니다

김은빈 기자의 기사는
언론사별에서 볼 수 있습니다
닫기

언론사도 함께 구독해 보세요.

언론사를 함께 구독중입니다.

속옷까지 훔쳐 판다…이 나라에선 유니클로가 고급 브랜드
중앙일보
1일전

더보기
백수전 기자

구독해주셔서 감사합니다

백수전 기자의 기사는
언론사별에서 볼 수 있습니다
닫기

언론사도 함께 구독해 보세요.

언론사를 함께 구독중입니다.

"테슬라 자살 행위라던 4680"…머스크, 결국 파격 결단 [테슬람 X랩]
한국경제
1일전

더보기

김세린 기자

구독해주셔서 감사합니다

김세린 기자의 기사는
언론사별에서 볼 수 있습니다
닫기

언론사도 함께 구독해 보세요.

언론사를 함께 구독중입니다.

"헤즈볼라 '후계자' 사피에딘 연락 두절"…사망설까지
한국경제
1일전

더보기
윤현주 기자

구독해주셔서 감사합니다

윤현주 기자의 기사는
언론사별에서 볼 수 있습니다
닫기

언론사도 함께 구독해 보세요.

언론사를 함께 구독중입니다.

"지렁이 나오던 지하 단칸방 생활"…'흙수저' 男의 인생역전 [윤현주의 主食이 주식]
한국경제
16시간전

더보기
정예원 기자

구독해주셔서 감사합니다

정예원 기자의 기사는
언론사별에서 볼 수 있습니다
닫기

언론사도 함께 구독해 보세요.

언론사를 함께 구독중입니다.

"키스할 땐 어떡하나"…'탁구공보다 굵은 혀' 자랑한 女
아시아경제
1일전

더보기

김가연 기자

구독해주셔서 감사합니다

김가연 기자의 기사는
언론사별에서 볼 수 있습니다
닫기

언론사도 함께 구독해 보세요.

언론사를 함께 구독중입니다.

한가인 “애들 쥐 잡듯 잡지 않아, 행복이 우선”…‘14시간 라이딩’ 해명
조선일보
1일전

더보기
김성훈 기자

구독해주셔서 감사합니다

김성훈 기자의 기사는
언론사별에서 볼 수 있습니다
닫기

언론사도 함께 구독해 보세요.

언론사를 함께 구독중입니다.

"뒤에 남자 무섭다" 박대성에 피살된 여고생, 범행 예감했다
헤럴드경제
1일전

더보기
김예슬 기자

구독해주셔서 감사합니다

김예슬 기자의 기사는
언론사별에서 볼 수 있습니다
닫기

언론사도 함께 구독해 보세요.

언론사를 함께 구독중입니다.

文 전 대통령 딸 문다혜, 음주운전 사고 입건…면허 취소 수준
동아일보
1일전

더보기

전종헌 기자

구독해주셔서 감사합니다

전종헌 기자의 기사는
언론사별에서 볼 수 있습니다
닫기

언론사도 함께 구독해 보세요.

언론사를 함께 구독중입니다.

“러닝 붐 타고 달리는 MZ 잡아라”…신세계百, 스포츠 매장 리뉴얼
매일경제
17시간전

더보기
김벼리 기자

구독해주셔서 감사합니다

김벼리 기자의 기사는
언론사별에서 볼 수 있습니다
닫기

언론사도 함께 구독해 보세요.

언론사를 함께 구독중입니다.

무섭다, 돌아온 ‘찬또배기’…불티나게 팔리는 ‘이 제품’ [푸드360]
헤럴드경제
1일전

더보기
윤예림 기자

구독해주셔서 감사합니다

윤예림 기자의 기사는
언론사별에서 볼 수 있습니다
닫기

언론사도 함께 구독해 보세요.

언론사를 함께 구독중입니다.

日남성들, 목욕탕서 모이는 이유…‘이상한 짓’ 발각되자 결국
서울신문
23시간전

더보기

김민주 기자

구독해주셔서 감사합니다

김민주 기자의 기사는
언론사별에서 볼 수 있습니다
닫기

언론사도 함께 구독해 보세요.

언론사를 함께 구독중입니다.

“내 돈 5000만원 더 보호해주면 좋은 거 아니야?”…예금자보호한도 갑론을박 재점화
매일경제
16시간전

더보기
강민서 기자

구독해주셔서 감사합니다

강민서 기자의 기사는
언론사별에서 볼 수 있습니다
닫기

언론사도 함께 구독해 보세요.

언론사를 함께 구독중입니다.

“대만도 중국, 홍콩도 중국”…대만 번화가서 난동부린 중국인, 무슨 일?
서울경제
21시간전

더보기
박영훈 기자

구독해주셔서 감사합니다

박영훈 기자의 기사는
언론사별에서 볼 수 있습니다
닫기

언론사도 함께 구독해 보세요.

언론사를 함께 구독중입니다.

“10만원→100만원 간다” 소문에 전국민 ‘열풍’…난리 났었는데
헤럴드경제
2시간전

더보기