Iste articlo ye en proceso de cambio enta la ortografía oficial de Biquipedia (la Ortografía de l'aragonés de l'Academia Aragonesa d'a Luenga). Puez aduyar a completar este proceso revisando l'articlo, fendo-ie los cambios ortograficos necesarios y sacando dimpués ista plantilla.

ChatGPT ye un prototipo d'un chatbot basau en intelichencia artificial. Estió desembolicau per OpenAI y lanzau en noviembre de 2022. O chatbot s'entrenó con RLHF (Reinforcement Learning from Human Feedback ("aprendizache reforzau a partir de comentarios humans", una mena d'aprendizache reforzau)[1] y PPO (Proximal Policy Optimization ("optimización de politica proxima", unatra forma d'aprendizache reforzau)[2], y fa servir a dentrada de texto y la salida fa servir intelichencia artificial GPT-3.5 (GPT significa Generative Pre-trained Transformer ("transformador preentrenau chenerativo"), una versión amillorada de GPT-3 d'OpenAI.

Seguntes a suya experiencia en o desembolique de GPT y Codex, OpenAI ha incorporau numbrosas midas de seguranza pa privar respuestas incorrectas y maliciosas. Pa amillorar o suyo modelo, a intelichencia artificial (IA) de ChatGPT se millora de contino con comentarios humans.

ChatGPT se lanzó lo 30 de noviembre de 2022 y ha clamau l'atención per as suyas respuestas detalladas y articuladas, encara que s'ha criticau la suya precisión factica. O servicio s lanzó en primeras de baldes pa lo publico, con plans de monetizar-lo mas adebant. O 4 d'aviento, OpenAI calculaba que Cmas d'un millón d'usuarios.[3]

Vinclos externos

editar

Referencias

editar
  1. (en) Paul Christiano, Jan Leike, Tom B. Brown, Miljan Martic, Shane Legg, Dario Amodei: Deep reinforcement learning from human preferences. 13. Juli 2017, doi:10.48550/arxiv.1706.03741
  2. (en) John Schulman, Filip Wolski, Prafulla Dhariwal, Alec Radford, Oleg Klimov: Proximal Policy Optimization Algorithms. 28. August 2017, doi:10.48550/arxiv.1707.06347
  3. (en) What is ChatGPT and why does it matter? Here's what you need to know en zdnet.com