Это не официальный сайт wikipedia.org 01.01.2023

Sparrow (бот) — Википедия

Sparrowчат-бот, разработанный исследовательской лабораторией искусственного интеллекта DeepMind, дочерней компанией Alphabet Inc. Он предназначен для того, чтобы правильно отвечать на вопросы пользователей, снижая при этом риск небезопасных и неуместных ответов[1]/ Одним из мотивов создания Sparrow является решение проблемы языковых моделей, производящих неверные, предвзятые или потенциально вредные результаты[2][3]. Sparrow обучается с использованием человеческих суждений, чтобы быть более «полезным, правильным и безвредным» по сравнению с базовыми предварительно обученными языковыми моделями[2]. При разработке Sparrow участникам платного исследования предлагалось взаимодействовать со Sparrow, а также собирались их предпочтения для обучения модели полезности ответа[4].

Sparrow
Тип виртуальный собеседник
Разработчик DeepMind

Чтобы улучшить правильность и помочь избежать проблемы «галлюцинации», Sparrow имеет возможность поиска в Интернете с помощью Google Search[5][6][7], чтобы найти и процитировать доказательства любых заявлений о фактах, которые он делает.

Чтобы сделать модель более безопасной, её поведение ограничивается набором правил, например, «не делать угрожающих заявлений» и «не делать ненавистных или оскорбительных комментариев», а также правил о возможно вредных советах и непритязаниях выдавать себя за человека[5]. Во время исследования участников попросили пообщаться с системой и попытаться обманом заставить ее нарушить эти правила[6]. На суждениях этих участников была обучена «модель правил», которая использовалась для дальнейшего обучения.

Sparrow была представлена в сентябре 2022 года в документе под названием «Улучшение согласования диалоговых агентов с помощью целенаправленных человеческих суждений»[8], однако он не был опубликован публично. [5] [9] Генеральный директор DeepMind Демис Хассабис сказал, что DeepMind рассматривает возможность выпуска Sparrow в виде «частной бета-версии» где-то в 2023 году[10][11][12].

ОбучениеПравить

Sparrow — глубокая нейронная сеть, основанная на архитектуре модели машинного обучения "трансформер" . Она точно настроена на основе предварительно обученной большой языковой модели DeepMind Chinchilla AI (LLM)[5], которая имеет 70 миллиардов весов[13].

Sparrow обучается с использованием обучения с подкреплением на основе обратной связи с человеком (RLHF)[5][9], хотя также используются некоторые контролируемые методы тонкой настройки. В обучении RLHF используются две модели вознаграждения, учитывающие человеческие суждения; «модель предпочтений», которая предсказывает, что предпочтет участник исследования, и «модель правил», которая предсказывает, нарушила ли модель одно из правил[14].

ОграниченияПравить

Корпус обучающих данных Sparrow в основном на английском языке, а это означает, что на других языках он работает хуже. 

При враждебной тактике со стороны участников исследования модель нарушает правила в 8% случаев[6], однако это всё ещё в 3 раза ниже, чем у предварительно обученной модели с подсказкой базового уровня (Chinchilla).

См. такжеПравить

ПримечанияПравить

  1. Quach. The secret to Sparrow, DeepMind's latest Q&A chatbot: Human feedback  (неопр.). The Register (23 января 2023). Дата обращения: 6 февраля 2023.
  2. 1 2 Quach, Katyanna The secret to Sparrow, DeepMind's latest Q&A chatbot: Human feedback  (неопр.). The Register (23 января 2023). Дата обращения: 6 февраля 2023.
  3. Gupta. Deepmind Introduces ‘Sparrow,’ An Artificial Intelligence-Powered Chatbot Developed To Build Safer Machine Learning Systems  (неопр.). MarkTechPost (28 сентября 2022). Дата обращения: 6 февраля 2023.
  4. Gupta, Khushboo Deepmind Introduces ‘Sparrow,’ An Artificial Intelligence-Powered Chatbot Developed To Build Safer Machine Learning Systems  (неопр.). MarkTechPost (28 сентября 2022). Дата обращения: 6 февраля 2023.
  5. 1 2 3 4 5 Quach. The secret to Sparrow, DeepMind's latest Q&A chatbot: Human feedback  (неопр.). The Register (23 января 2023). Дата обращения: 6 февраля 2023.Quach, Katyanna (January 23, 2023). "The secret to Sparrow, DeepMind's latest Q&A chatbot: Human feedback". The Register. Retrieved February 6, 2023.
  6. 1 2 3 Gupta. Deepmind Introduces ‘Sparrow,’ An Artificial Intelligence-Powered Chatbot Developed To Build Safer Machine Learning Systems  (неопр.). MarkTechPost (28 сентября 2022). Дата обращения: 6 февраля 2023.Gupta, Khushboo (September 28, 2022). "Deepmind Introduces 'Sparrow,' An Artificial Intelligence-Powered Chatbot Developed To Build Safer Machine Learning Systems". MarkTechPost. Retrieved February 6, 2023.
  7. Goldman. Why DeepMind isn’t deploying its new AI chatbot — and what it means for responsible AI  (неопр.). Venture Beat (23 января 2023). Дата обращения: 6 февраля 2023.
  8. Cuthbertson. DeepMind’s AI chatbot can do things that ChatGPT cannot, CEO claims  (неопр.). The Independent (16 января 2023). Дата обращения: 6 февраля 2023.
  9. 1 2 Goldman. Why DeepMind isn’t deploying its new AI chatbot — and what it means for responsible AI  (неопр.). Venture Beat (23 января 2023). Дата обращения: 6 февраля 2023.Goldman, Sharon (January 23, 2023). "Why DeepMind isn't deploying its new AI chatbot — and what it means for responsible AI". Venture Beat. Retrieved February 6, 2023.
  10. Cuthbertson, Anthony DeepMind’s AI chatbot can do things that ChatGPT cannot, CEO claims  (неопр.). The Independent (16 января 2023). Дата обращения: 6 февраля 2023.
  11. Perrigo. DeepMind’s CEO Helped Take AI Mainstream. Now He’s Urging Caution  (неопр.). TIME (12 января 2023). Дата обращения: 6 февраля 2023.
  12. Wilson. Google's DeepMind says it'll launch a more grown-up ChatGPT rival soon  (неопр.). Tech Radar (16 января 2023). Дата обращения: 6 февраля 2023.
  13. Hoffmann. An empirical analysis of compute-optimal large language model training  (неопр.). DeepMind (12 апреля 2022). Дата обращения: 6 февраля 2023.
  14. Goldman, Sharon Why DeepMind isn’t deploying its new AI chatbot — and what it means for responsible AI  (неопр.). Venture Beat (23 января 2023). Дата обращения: 6 февраля 2023.

СсылкиПравить