Sparrow (бот)

Sparrow
Sparrow
Тип	виртуальный собеседник
Разработчик	DeepMind

Sparrow — чат-бот, разработанный исследовательской лабораторией искусственного интеллекта DeepMind, дочерней компанией Alphabet Inc. Он предназначен для того, чтобы правильно отвечать на вопросы пользователей, снижая при этом риск небезопасных и неуместных ответов^[1]/ Одним из мотивов создания Sparrow является решение проблемы языковых моделей, производящих неверные, предвзятые или потенциально вредные результаты^[2]^[3]. Sparrow обучается с использованием человеческих суждений, чтобы быть более «полезным, правильным и безвредным» по сравнению с базовыми предварительно обученными языковыми моделями^[2]. При разработке Sparrow участникам платного исследования предлагалось взаимодействовать со Sparrow, а также собирались их предпочтения для обучения модели полезности ответа^[4].

Чтобы улучшить правильность и помочь избежать проблемы «галлюцинации», Sparrow имеет возможность поиска в Интернете с помощью Google Search^[5]^[6]^[7], чтобы найти и процитировать доказательства любых заявлений о фактах, которые он делает.

Чтобы сделать модель более безопасной, её поведение ограничивается набором правил, например, «не делать угрожающих заявлений» и «не делать ненавистных или оскорбительных комментариев», а также правил о возможно вредных советах и непритязаниях выдавать себя за человека^[5]. Во время исследования участников попросили пообщаться с системой и попытаться обманом заставить ее нарушить эти правила^[6]. На суждениях этих участников была обучена «модель правил», которая использовалась для дальнейшего обучения.

Sparrow была представлена в сентябре 2022 года в документе под названием «Улучшение согласования диалоговых агентов с помощью целенаправленных человеческих суждений»^[8], однако он не был опубликован публично. ^[5] ^[9] Генеральный директор DeepMind Демис Хассабис сказал, что DeepMind рассматривает возможность выпуска Sparrow в виде «частной бета-версии» где-то в 2023 году^[10]^[11]^[12].

ОбучениеПравить

Sparrow — глубокая нейронная сеть, основанная на архитектуре модели машинного обучения "трансформер" . Она точно настроена на основе предварительно обученной большой языковой модели DeepMind Chinchilla AI (LLM)^[5], которая имеет 70 миллиардов весов^[13].

Sparrow обучается с использованием обучения с подкреплением на основе обратной связи с человеком (RLHF)^[5]^[9], хотя также используются некоторые контролируемые методы тонкой настройки. В обучении RLHF используются две модели вознаграждения, учитывающие человеческие суждения; «модель предпочтений», которая предсказывает, что предпочтет участник исследования, и «модель правил», которая предсказывает, нарушила ли модель одно из правил^[14].

ОграниченияПравить

Корпус обучающих данных Sparrow в основном на английском языке, а это означает, что на других языках он работает хуже.

При враждебной тактике со стороны участников исследования модель нарушает правила в 8% случаев^[6], однако это всё ещё в 3 раза ниже, чем у предварительно обученной модели с подсказкой базового уровня (Chinchilla).

См. такжеПравить

ПримечанияПравить

↑ Quach. The secret to Sparrow, DeepMind's latest Q&A chatbot: Human feedback (неопр.). The Register (23 января 2023). Дата обращения: 6 февраля 2023.
↑ ¹ ² Quach, Katyanna The secret to Sparrow, DeepMind's latest Q&A chatbot: Human feedback (неопр.). The Register (23 января 2023). Дата обращения: 6 февраля 2023.
↑ Gupta. Deepmind Introduces ‘Sparrow,’ An Artificial Intelligence-Powered Chatbot Developed To Build Safer Machine Learning Systems (неопр.). MarkTechPost (28 сентября 2022). Дата обращения: 6 февраля 2023.
↑ Gupta, Khushboo Deepmind Introduces ‘Sparrow,’ An Artificial Intelligence-Powered Chatbot Developed To Build Safer Machine Learning Systems (неопр.). MarkTechPost (28 сентября 2022). Дата обращения: 6 февраля 2023.
↑ ¹ ² ³ ⁴ ⁵ Quach. The secret to Sparrow, DeepMind's latest Q&A chatbot: Human feedback (неопр.). The Register (23 января 2023). Дата обращения: 6 февраля 2023.Quach, Katyanna (January 23, 2023). "The secret to Sparrow, DeepMind's latest Q&A chatbot: Human feedback". The Register. Retrieved February 6, 2023.
↑ ¹ ² ³ Gupta. Deepmind Introduces ‘Sparrow,’ An Artificial Intelligence-Powered Chatbot Developed To Build Safer Machine Learning Systems (неопр.). MarkTechPost (28 сентября 2022). Дата обращения: 6 февраля 2023.Gupta, Khushboo (September 28, 2022). "Deepmind Introduces 'Sparrow,' An Artificial Intelligence-Powered Chatbot Developed To Build Safer Machine Learning Systems". MarkTechPost. Retrieved February 6, 2023.
↑ Goldman. Why DeepMind isn’t deploying its new AI chatbot — and what it means for responsible AI (неопр.). Venture Beat (23 января 2023). Дата обращения: 6 февраля 2023.
↑ Cuthbertson. DeepMind’s AI chatbot can do things that ChatGPT cannot, CEO claims (неопр.). The Independent (16 января 2023). Дата обращения: 6 февраля 2023.
↑ ¹ ² Goldman. Why DeepMind isn’t deploying its new AI chatbot — and what it means for responsible AI (неопр.). Venture Beat (23 января 2023). Дата обращения: 6 февраля 2023.Goldman, Sharon (January 23, 2023). "Why DeepMind isn't deploying its new AI chatbot — and what it means for responsible AI". Venture Beat. Retrieved February 6, 2023.
↑ Cuthbertson, Anthony DeepMind’s AI chatbot can do things that ChatGPT cannot, CEO claims (неопр.). The Independent (16 января 2023). Дата обращения: 6 февраля 2023.
↑ Perrigo. DeepMind’s CEO Helped Take AI Mainstream. Now He’s Urging Caution (неопр.). TIME (12 января 2023). Дата обращения: 6 февраля 2023.
↑ Wilson. Google's DeepMind says it'll launch a more grown-up ChatGPT rival soon (неопр.). Tech Radar (16 января 2023). Дата обращения: 6 февраля 2023.
↑ Hoffmann. An empirical analysis of compute-optimal large language model training (неопр.). DeepMind (12 апреля 2022). Дата обращения: 6 февраля 2023.
↑ Goldman, Sharon Why DeepMind isn’t deploying its new AI chatbot — and what it means for responsible AI (неопр.). Venture Beat (23 января 2023). Дата обращения: 6 февраля 2023.

СсылкиПравить

[:1-1] Quach. The secret to Sparrow, DeepMind's latest Q&A chatbot: Human feedback (неопр.). The Register (23 января 2023). Дата обращения: 6 февраля 2023.

[автоссылка1-2] ¹ ² Quach, Katyanna The secret to Sparrow, DeepMind's latest Q&A chatbot: Human feedback (неопр.). The Register (23 января 2023). Дата обращения: 6 февраля 2023.

[:2-3] Gupta. Deepmind Introduces ‘Sparrow,’ An Artificial Intelligence-Powered Chatbot Developed To Build Safer Machine Learning Systems (неопр.). MarkTechPost (28 сентября 2022). Дата обращения: 6 февраля 2023.

[автоссылка2-4] Gupta, Khushboo Deepmind Introduces ‘Sparrow,’ An Artificial Intelligence-Powered Chatbot Developed To Build Safer Machine Learning Systems (неопр.). MarkTechPost (28 сентября 2022). Дата обращения: 6 февраля 2023.

[автоссылка3-5] ¹ ² ³ ⁴ ⁵ Quach. The secret to Sparrow, DeepMind's latest Q&A chatbot: Human feedback (неопр.). The Register (23 января 2023). Дата обращения: 6 февраля 2023.Quach, Katyanna (January 23, 2023). "The secret to Sparrow, DeepMind's latest Q&A chatbot: Human feedback". The Register. Retrieved February 6, 2023.

[автоссылка4-6] ¹ ² ³ Gupta. Deepmind Introduces ‘Sparrow,’ An Artificial Intelligence-Powered Chatbot Developed To Build Safer Machine Learning Systems (неопр.). MarkTechPost (28 сентября 2022). Дата обращения: 6 февраля 2023.Gupta, Khushboo (September 28, 2022). "Deepmind Introduces 'Sparrow,' An Artificial Intelligence-Powered Chatbot Developed To Build Safer Machine Learning Systems". MarkTechPost. Retrieved February 6, 2023.

[:3-7] Goldman. Why DeepMind isn’t deploying its new AI chatbot — and what it means for responsible AI (неопр.). Venture Beat (23 января 2023). Дата обращения: 6 февраля 2023.

[:4-8] Cuthbertson. DeepMind’s AI chatbot can do things that ChatGPT cannot, CEO claims (неопр.). The Independent (16 января 2023). Дата обращения: 6 февраля 2023.

[автоссылка5-9] ¹ ² Goldman. Why DeepMind isn’t deploying its new AI chatbot — and what it means for responsible AI (неопр.). Venture Beat (23 января 2023). Дата обращения: 6 февраля 2023.Goldman, Sharon (January 23, 2023). "Why DeepMind isn't deploying its new AI chatbot — and what it means for responsible AI". Venture Beat. Retrieved February 6, 2023.

[автоссылка6-10] Cuthbertson, Anthony DeepMind’s AI chatbot can do things that ChatGPT cannot, CEO claims (неопр.). The Independent (16 января 2023). Дата обращения: 6 февраля 2023.

[:5-11] Perrigo. DeepMind’s CEO Helped Take AI Mainstream. Now He’s Urging Caution (неопр.). TIME (12 января 2023). Дата обращения: 6 февраля 2023.

[:7-12] Wilson. Google's DeepMind says it'll launch a more grown-up ChatGPT rival soon (неопр.). Tech Radar (16 января 2023). Дата обращения: 6 февраля 2023.

[:6-13] Hoffmann. An empirical analysis of compute-optimal large language model training (неопр.). DeepMind (12 апреля 2022). Дата обращения: 6 февраля 2023.

[автоссылка7-14] Goldman, Sharon Why DeepMind isn’t deploying its new AI chatbot — and what it means for responsible AI (неопр.). Venture Beat (23 января 2023). Дата обращения: 6 февраля 2023.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]