OpenAI
Trụ sở chính tại Tòa nhà Pioneer ở San Francisco | |
Ngành nghề | Trí tuệ nhân tạo |
---|---|
Thành lập | 10 tháng 12 năm 2015 |
Người sáng lập |
|
Trụ sở chính | Pioneer Building, San Francisco, California, US[2][3] |
Thành viên chủ chốt |
|
Sản phẩm | |
Số nhân viên | 375 (tính đến tháng 1 năm 2023)[4] |
Website | openai |
| ||
---|---|---|
Cá nhân
Công ty
Trong văn hóa đại chúng
Liên quan
|
||
OpenAI là một phòng thí nghiệm nghiên cứu trí tuệ nhân tạo (AI) của Mỹ bao gồm tổ chức phi lợi nhuận OpenAI Incorporated (OpenAI Inc.) và công ty con hoạt động vì lợi nhuận OpenAI Limited Partnership (OpenAI LP). OpenAI tiến hành nghiên cứu AI với mục đích đã tuyên bố là thúc đẩy và phát triển một AI thân thiện. Các hệ thống OpenAI chạy trên siêu máy tính mạnh thứ năm trên thế giới.[5][6] Tổ chức được thành lập tại San Francisco vào năm 2015 bởi Sam Altman, Reid Hoffman, Jessica Livingston, Elon Musk, Ilya Sutskever, Peter Thiel và những người khác.[7][1][8] Musk đã từ chức khỏi hội đồng quản trị vào năm 2018 nhưng vẫn là một nhà tài trợ. Microsoft đã cung cấp cho OpenAI LP khoản đầu tư 1 tỷ USD vào năm 2019 và khoản đầu tư thứ hai trong nhiều năm vào tháng 1 năm 2023, được báo cáo là 10 tỷ USD.[9]
Lịch sử
Khởi đầu phi lợi nhuận
Vào tháng 12 năm 2015, Sam Altman, Greg Brockman, Reid Hoffman, Jessica Livingston, Peter Thiel, Elon Musk, Amazon Web Services (AWS), Infosys và YC Research đã công bố[10] việc thành lập OpenAI và cam kết hơn 1 tỷ USD cho liên doanh. Tổ chức tuyên bố rằng họ sẽ "hợp tác tự do" với các tổ chức và nhà nghiên cứu khác bằng cách công khai các bằng sáng chế và nghiên cứu của mình.[11][12] OpenAI có trụ sở chính tại Tòa nhà Pioneer ở Quận Mission, San Francisco.[13][3]
Theo Wired, Brockman đã gặp Yoshua Bengio, một trong những "cha đẻ" của học sâu và lập danh sách "những nhà nghiên cứu giỏi nhất trong lĩnh vực này".[14] Brockman có thể đã thuê chín người trong số họ làm nhân viên đầu tiên vào tháng 12 năm 2015.[14] Vào năm 2016, OpenAI đã tiến hành trả lương cấp công ty (chứ không phải cấp phi lợi nhuận), nhưng không trả lương cho các nhà nghiên cứu AI theo mức tương đương với lương của Facebook hoặc Google.[15]
Chuyển đổi sang định hướng lợi nhuận
Vào năm 2019, OpenAI đã chuyển đổi từ phi lợi nhuận sang vì lợi nhuận có "giới hạn", với lợi nhuận tối đa giới hạn ở mức gấp 100 lần bất kỳ khoản đầu tư nào.[16] Theo OpenAI, mô hình lợi nhuận giới hạn cho phép OpenAI LP thu hút đầu tư hợp pháp từ các quỹ mạo hiểm và ngoài ra cấp cổ phần cho nhân viên trong công ty, mục tiêu là họ có thể nói "Tôi sẽ tham gia OpenAI, nhưng trong về lâu dài, điều đó sẽ không gây bất lợi cho chúng ta với tư cách là một gia đình."[17] Nhiều nhà nghiên cứu hàng đầu làm việc cho Google Brain, DeepMind hoặc Facebook, cũng được công ty cấp cho quyền chọn mua cổ phiếu của công ty, việc mà khi làm cho một tổ chức phi lợi nhuận không thể có được.[18] Trước khi chuyển đổi, việc tiết lộ công khai về thù lao của những nhân viên hàng đầu tại OpenAI là bắt buộc về mặt pháp lý.[19]
Sản phẩm và ứng dụng
Mô hình tạo nội dung (Generative model)
Các mô hình GPT
Bài báo gốc về đào tạo tổng quát mô hình ngôn ngữ dựa theo giải thuật transformer được viết bởi Alec Radford và các đồng nghiệp của ông. Bài báo được đăng dưới dạng preprint trên trang web của OpenAI vào ngày 11 tháng 6 năm 2018.[20] Bài báo cho thấy cách làm thế nào để một mô hình ngôn ngữ tổng quát có thể thu nhận kiến thức thế giới và xử lý các tham số phụ thuộc tầm xa bằng cách đào tạo trước trên một kho văn bản đa dạng với các đoạn văn bản liên tục kéo dài.
GPT-2
Generative Pre-training Transformer 2 (GPT-2) là một mô hình ngôn ngữ trên thuật toán transformer không giám sát và là phiên bản kế thừa từ mô hình GPT thử nghiệm đầu tiên của OpenAI. GPT-2 được công bố lần đầu tiên vào tháng 2 năm 2019, với các phiên bản trình diễn giới hạn ban đầu được phát hành ra công chúng. Phiên bản đầy đủ của GPT-2 đã không được phát hành ngay lập tức do lo ngại về khả năng sử dụng sai mục đích, bao gồm cả lo ngại các ứng dụng viết tin giả.[21] Một số chuyên gia bày tỏ sự hoài nghi việc GPT-2 có thể là một mối đe dọa đáng kể.
GPT-3
Được mô tả lần đầu vào tháng 5 năm 2020, Generative Pre-training Transformer 3 (GPT-3) là một mô hình ngôn ngữ trên thuật toán transformer không giám sát thế hệ tiếp theo của GPT-2.[22] OpenAI tuyên bố rằng phiên bản đầy đủ của mô hình GPT-3 có chứa đến 175 tỷ tham số,[23] lớn hơn hai cấp so với 1,5 tỷ tham số[24] trong phiên bản đầy đủ của GPT-2 (mặc dù các có các mô hình GPT-3 chỉ có 125 triệu tham số cũng đã được đào tạo).[25]
GPT-4
Ngày 14 tháng 3 năm 2023, OpenAI đã công bố phát hành Generative Pre-training Transformer 4 (GPT-4), mô hình mới ngôn ngữ thế hệ mới có khả năng chấp nhận văn bản hoặc hình ảnh đầu vào.[26] OpenAI thông báo rằng phiên bản mới sử dụng công nghệ cập nhật đã vượt qua kỳ thi mô phỏng của trường luật với số điểm nằm trong khoảng 10% người dự thi cao nhất; ngược lại, phiên bản trước, GPT-3.5, chỉ đạt điểm dưới 10%. GPT-4 cũng có thể đọc, phân tích hoặc tạo văn bản tối đa 25.000 từ và viết mã lập trình bằng tất cả các ngôn ngữ lập trình chính hiện nay.[27]
Whisper
Năm 2022, OpenAI phát hành mô hình Whisper, đây là mô hình nhận dạng giọng nói đa năng.[28] Mô hình được đào tạo trên một tập dữ liệu lớn gồm nhiều âm thanh đa dạng và cũng là một mô hình đa tác vụ có thể thực hiện nhận dạng giọng nói đa ngôn ngữ cũng như dịch giọng nói và nhận dạng ngôn ngữ.[29]
Codex
Được công bố vào giữa năm 2021, Codex là mô hình phát triển từ GPT-3 nhưng được đào tạo thêm về lập trình từ 54 triệu mã trong kho lưu trữ GitHub[30][31] và trở thành mô hình AI hỗ trợ cho công cụ tự động hoàn thành mã GitHub Copilot.[32]
Vào tháng 8 năm 2021, OpenAI phát hành một API thử nghiệm ở dạng beta riêng tư.[33] Theo OpenAI, mô hình này có thể tạo mã hoạt động bằng hơn chục ngôn ngữ lập trình, hiệu quả nhất là bằng Python.[34] Tuy nhiên, sau khi hoạt động, có một số vấn đề về trục trặc, lỗi thiết kế và lỗ hổng bảo mật đã được chỉ ra.[35][36] GitHub Copilot bị cáo buộc tạo ra mã nguồn đã có bản quyền nhưng không có sự ghi nhận tác giả hoặc giấy phép.[37] OpenAI đã thông báo rằng họ sẽ ngừng hỗ trợ Codex API bắt đầu từ ngày 23 tháng 3 năm 2023.[38][39]
Tham khảo
- ^ a b “Introducing OpenAI”. OpenAI (bằng tiếng Anh). 12 tháng 12 năm 2015. Lưu trữ bản gốc ngày 8 tháng 8 năm 2017. Truy cập ngày 27 tháng 1 năm 2023.
- ^ Markoff, John (11 tháng 12 năm 2015). “Artificial-Intelligence Research Center Is Founded by Silicon Valley Investors”. The New York Times. Lưu trữ bản gốc ngày 30 tháng 8 năm 2020. Truy cập ngày 12 tháng 12 năm 2015.
- ^ a b Hao, Karen (17 tháng 2 năm 2020). “The messy, secretive reality behind OpenAI's bid to save the world”. MIT Technology Review (bằng tiếng Anh). Lưu trữ bản gốc ngày 3 tháng 4 năm 2020. Truy cập ngày 9 tháng 3 năm 2020.
- ^ “Microsoft fires 10,000, invests $10bn in 375-person OpenAI”. The Stack. 23 tháng 1 năm 2023. Lưu trữ bản gốc ngày 3 tháng 2 năm 2023. Truy cập ngày 24 tháng 1 năm 2023.
- ^ Langston, Jennifer (11 tháng 1 năm 2023). “Microsoft announces new supercomputer, lays out vision for future AI work”. Source. Lưu trữ bản gốc ngày 10 tháng 2 năm 2023. Truy cập ngày 10 tháng 2 năm 2023.
Built in collaboration with and exclusively for OpenAI
- ^ Foley, Mary Jo (19 tháng 5 năm 2020). “Microsoft builds a supercomputer for OpenAI for training massive AI models”. ZDNET. Lưu trữ bản gốc ngày 10 tháng 2 năm 2023. Truy cập ngày 10 tháng 2 năm 2023.
- ^ “SAM ALTMAN ON HIS PLAN TO KEEP A.I. OUT OF THE HANDS OF THE "BAD GUYS”. Vanity Fair. 2015. Lưu trữ bản gốc ngày 3 tháng 2 năm 2023. Truy cập ngày 23 tháng 1 năm 2023.
- ^ “OpenAI, the company behind ChatGPT: What all it does, how it started and more”. The Times of India (bằng tiếng Anh). 25 tháng 1 năm 2023. Lưu trữ bản gốc ngày 3 tháng 2 năm 2023. Truy cập ngày 28 tháng 1 năm 2023.
- ^ Browne, Ryan. “Microsoft reportedly plans to invest $10 billion in creator of buzzy A.I. tool ChatGPT”. CNBC (bằng tiếng Anh). Lưu trữ bản gốc ngày 3 tháng 2 năm 2023. Truy cập ngày 27 tháng 1 năm 2023.
- ^ “Introducing OpenAI”. OpenAI (bằng tiếng Anh). 12 tháng 12 năm 2015. Lưu trữ bản gốc ngày 8 tháng 8 năm 2017. Truy cập ngày 23 tháng 12 năm 2022.
- ^ “Introducing OpenAI”. OpenAI Blog. 12 tháng 12 năm 2015. Lưu trữ bản gốc ngày 24 tháng 2 năm 2019. Truy cập ngày 29 tháng 9 năm 2018.
- ^ “Tech giants pledge $1bn for 'altruistic AI' venture, OpenAI”. BBC News. 12 tháng 12 năm 2015. Lưu trữ bản gốc ngày 14 tháng 3 năm 2018. Truy cập ngày 19 tháng 12 năm 2015.
- ^ Conger, Kate. “Elon Musk's Neuralink Sought to Open an Animal Testing Facility in San Francisco”. Gizmodo (bằng tiếng Anh). Lưu trữ bản gốc ngày 24 tháng 9 năm 2018. Truy cập ngày 11 tháng 10 năm 2018.
- ^ a b Cade Metz (27 tháng 4 năm 2016). “Inside OpenAI, Elon Musk's Wild Plan to Set Artificial Intelligence Free”. Wired (bằng tiếng Anh). Lưu trữ bản gốc ngày 27 tháng 4 năm 2016. Truy cập ngày 28 tháng 4 năm 2016.
- ^ Metz, Cade. “Inside OpenAI, Elon Musk's Wild Plan to Set Artificial Intelligence Free”. Wired (bằng tiếng Anh). ISSN 1059-1028. Lưu trữ bản gốc ngày 27 tháng 4 năm 2016. Truy cập ngày 18 tháng 4 năm 2023.
- ^ Coldewey, Devin (11 tháng 3 năm 2019). “OpenAI shifts from nonprofit to 'capped-profit' to attract capital”. TechCrunch (bằng tiếng Anh). Lưu trữ bản gốc ngày 4 tháng 1 năm 2023. Truy cập ngày 18 tháng 4 năm 2023.
- ^ Simonite, Tom. “To Compete With Google, OpenAI Seeks Investors–and Profits”. Wired (bằng tiếng Anh). ISSN 1059-1028. Lưu trữ bản gốc ngày 14 tháng 3 năm 2020. Truy cập ngày 18 tháng 4 năm 2023.
- ^ “AI Research Group Co-Founded by Elon Musk Starts For-Profit Arm”. Bloomberg.com (bằng tiếng Anh). 11 tháng 3 năm 2019. Lưu trữ bản gốc ngày 7 tháng 12 năm 2019. Truy cập ngày 18 tháng 4 năm 2023.
- ^ Metz, Cade (19 tháng 4 năm 2018). “A.I. Researchers Are Making More Than $1 Million, Even at a Nonprofit”. The New York Times (bằng tiếng Anh). ISSN 0362-4331. Lưu trữ bản gốc ngày 8 tháng 8 năm 2018. Truy cập ngày 18 tháng 4 năm 2023.
- ^ “Improving Language Understanding by Generative Pre-Training” (PDF). Lưu trữ (PDF) bản gốc ngày 26 tháng 1 năm 2021. Truy cập ngày 18 tháng 4 năm 2023.
- ^ Hern, Alex (14 tháng 2 năm 2019). “New AI fake text generator may be too dangerous to release, say creators”. The Guardian (bằng tiếng Anh). ISSN 0261-3077. Lưu trữ bản gốc ngày 14 tháng 2 năm 2019. Truy cập ngày 18 tháng 4 năm 2023.
- ^ GPT-3: Language Models are Few-Shot Learners, OpenAI, 18 tháng 4 năm 2023, Bản gốc lưu trữ ngày 14 tháng 11 năm 2020, truy cập ngày 18 tháng 4 năm 2023
- ^ Brown, Tom B.; Mann, Benjamin; Ryder, Nick; Subbiah, Melanie; Kaplan, Jared; Dhariwal, Prafulla; Neelakantan, Arvind; Shyam, Pranav; Sastry, Girish (22 tháng 7 năm 2020). “Language Models are Few-Shot Learners”. arXiv:2005.14165 [cs]. Bản gốc lưu trữ ngày 17 tháng 4 năm 2023. Truy cập ngày 18 tháng 4 năm 2023.
- ^ “Language Models are Unsupervised Multitask Learners” (PDF). Lưu trữ (PDF) bản gốc ngày 12 tháng 12 năm 2019. Truy cập ngày 18 tháng 4 năm 2023.
- ^ Brown, Tom B.; Mann, Benjamin; Ryder, Nick; Subbiah, Melanie; Kaplan, Jared; Dhariwal, Prafulla; Neelakantan, Arvind; Shyam, Pranav; Sastry, Girish (22 tháng 7 năm 2020). “Language Models are Few-Shot Learners”. arXiv:2005.14165 [cs]. Bản gốc lưu trữ ngày 17 tháng 4 năm 2023. Truy cập ngày 18 tháng 4 năm 2023.
- ^ “OpenAI announces GPT-4 — the next generation of its AI language model”. www.theverge.com. Lưu trữ bản gốc ngày 14 tháng 3 năm 2023. Truy cập ngày 19 tháng 4 năm 2023.
- ^ Wiggers, Kyle (14 tháng 3 năm 2023). “OpenAI releases GPT-4, a multimodal AI that it claims is state-of-the-art”. TechCrunch (bằng tiếng Anh). Lưu trữ bản gốc ngày 15 tháng 3 năm 2023. Truy cập ngày 19 tháng 4 năm 2023.
- ^ Wiggers, Kyle (21 tháng 9 năm 2022). “OpenAI open-sources Whisper, a multilingual speech recognition system”. TechCrunch (bằng tiếng Anh). Lưu trữ bản gốc ngày 12 tháng 2 năm 2023. Truy cập ngày 19 tháng 4 năm 2023.
- ^ Radford, Alec; Kim, Jong Wook; Xu, Tao; Brockman, Greg; McLeavey, Christine; Sutskever, Ilya (6 tháng 12 năm 2022). “Robust Speech Recognition via Large-Scale Weak Supervision”. arXiv:2212.04356 [cs, eess]. Bản gốc lưu trữ ngày 15 tháng 3 năm 2023. Truy cập ngày 19 tháng 4 năm 2023.
- ^ “OpenAI Announces 12 Billion Parameter Code-Generation AI Codex”. InfoQ (bằng tiếng Anh). Truy cập ngày 19 tháng 4 năm 2023.
- ^ “OpenAI warns AI behind GitHub's Copilot may be susceptible to bias”. VentureBeat (bằng tiếng Anh). 8 tháng 7 năm 2021. Truy cập ngày 19 tháng 4 năm 2023.
- ^ “OpenAI warns AI behind GitHub's Copilot may be susceptible to bias”. VentureBeat (bằng tiếng Anh). 8 tháng 7 năm 2021. Truy cập ngày 19 tháng 4 năm 2023.
- ^ “OpenAI Codex”. openai.com (bằng tiếng Anh). Truy cập ngày 19 tháng 4 năm 2023.
- ^ “OpenAI Announces 12 Billion Parameter Code-Generation AI Codex”. InfoQ (bằng tiếng Anh). Truy cập ngày 19 tháng 4 năm 2023.
- ^ “What to expect from OpenAI's Codex API”. VentureBeat (bằng tiếng Anh). 16 tháng 8 năm 2021. Truy cập ngày 19 tháng 4 năm 2023.
- ^ Claburn, Thomas. “GitHub's Copilot may steer you into dangerous waters about 40% of the time – study”. www.theregister.com (bằng tiếng Anh). Truy cập ngày 19 tháng 4 năm 2023.
- ^ Jain, Ayush (23 tháng 10 năm 2022). “GitHub Copilot: The Latest in the List of AI Generative Models Facing Copyright Allegations”. Analytics India Magazine (bằng tiếng Anh). Truy cập ngày 19 tháng 4 năm 2023.
- ^ Pandey, Mohit (21 tháng 3 năm 2023). “OpenAI Might Invite Legal Trouble”. Analytics India Magazine (bằng tiếng Anh). Truy cập ngày 19 tháng 4 năm 2023.
- ^ “OpenAI to discontinue support for the Codex API | Hacker News”. news.ycombinator.com. Truy cập ngày 19 tháng 4 năm 2023.