Адреа Лонца - Алгоритмы обучения с подкреплением на Python

Описание и разработка алгоритмов искусственного интеллекта

	Название:	Алгоритмы обучения с подкреплением на Python
	Автор:	Адреа Лонца
	Жанр:	Искусственный интеллект, Python
	Изадано в серии:	неизвестно
	Издательство:	ДМК Пресс
	Год издания:	2020
	ISBN:	978-5-97060-855-5
	Отзывы:	Комментировать
	Рейтинг:
Поделись книгой с друзьями! Помощь сайту: донат на оплату сервера

Краткое содержание книги "Алгоритмы обучения с подкреплением на Python"

Эта книга поможет читателю овладеть алгоритмами обучения с подкреплением (ОП) и научиться реализовывать их при создании самообучающихся агентов. В первой части рассматриваются различные элементы ОП, сфера его применения, инструменты, необходимые для работы в среде ОП. Вторая и третья части посвящены непосредственно алгоритмам. В числе прочего автор показывает, как сочетать Q-обучение с нейронными сетями для решения сложных задач, описывает методы градиента стратегии, TRPO и PPO, позволяющие повысить производительность и устойчивость, а также детерминированные алгоритмы DDPG и TD3. Читатель узнает о том, как работает техника подражательного обучения, познакомится с алгоритмами исследования на базе верхней доверительной границы (UCB и UCB1) и метаалгоритмом ESBAS. Издание предназначено для тех, кто интересуется исследованиями в области искусственного интеллекта, применяет в работе глубокое обучение или хочет освоить обучение с подкреплением с нуля. Обязательное условие – владение языком Python на рабочем уровне.

Читаем онлайн "Алгоритмы обучения с подкреплением на Python". [Страница - 5]

.................................................................................................................257
Вопросы ...............................................................................................................258
Для дальнейшего чтения....................................................................................258

Глава 13. Практические подходы к решению проблем ОП ........259
Рекомендуемые практики глубокого ОП ..........................................................259
Выбор подходящего алгоритма .....................................................................260
От простого к сложному .................................................................................261
Проблемы глубокого ОП.....................................................................................263
Устойчивость и воспроизводимость результатов ........................................263
Эффективность ...............................................................................................264
Обобщаемость.................................................................................................265
Передовые методы .............................................................................................266
ОП без учителя ................................................................................................266
Перенос обучения ...........................................................................................268
ОП в реальном мире ...........................................................................................270
Лицом к лицу с реальным миром ..................................................................270
Преодоление разрыва между имитационной моделью и реальным
миром ..............................................................................................................271
Создание собственной окружающей среды..................................................272
Будущее ОП и его влияние на общество ...........................................................272
Резюме .................................................................................................................273
Вопросы ...............................................................................................................274
Для дальнейшего чтения....................................................................................274

Ответы на вопросы......................................................................................275
Предметный указатель ..............................................................................281

Об авторе
Андреа Лонца занимается глубоким обучением, одержим искусственным
интеллектом и страстью создавать машины, действующие «разумно». Знания в области обучения с подкреплением, обработки естественного языка
и компьютерного зрения приобрел в ходе работы над проектами по машинному обучению в университете и в промышленности. Также участвовал в нескольких конкурсах Kaggle и достигал высоких результатов. Всегда ищет интересные задачи и любит доказывать, на что способен.

О рецензенте
Грег Уолтерс занимается компьютерами и программированием с 1972 года.
Отлично владеет языками Visual Basic, Visual Basic .NET, Python и SQL (диалектами MySQL, SQLite, Microsoft SQL Server, Oracle), C++, Delphi, Modula-2, Pascal, C, ассемблером 80x86, COBOL и Fortran. Обучает программированию, через его руки прошло множество людей, которых он учил таким продуктам, как
MySQL, Open Database Connectivity, Quattro Pro, Corel Draw!, Paradox, Microsoft
Word, Excel, DOS, Windows 3.11, Windows for Workgroups, Windows 95, Windows
NT, Windows 2000, Windows XP и Linux. Сейчас на пенсии и в свободное время
музицирует и обожает готовить, но всегда готов поработать фрилансером над
разными проектами.

Предисловие
Обучение с подкреплением (ОП) – популярное и многообещающее направление искусственного интеллекта, в рамках которого изучается построение
моделей и агентов, способных находить идеальное поведение в условиях изменяющихся требований. Эта книга поможет вам овладеть алгоритмами ОП
и научиться реализовывать их при создании самообучающихся агентов.
Книга начинается с введения в инструменты, библиотеки и процедуру установки, необходимые для работы в среде ОП, затем рассматриваются различные элементы ОП и применение методов, основанных на понятии ценности,
в частности алгоритмов Q-обучения и SARSA. Вы научитесь сочетать Q-обучение с нейронными сетями для решения сложных задач. Рассматриваются также методы градиента стратегии, TRPO и PPO, позволяющие повысить производительность и устойчивость, а затем детерминированные алгоритмы DDPG
и TD3. Объясняется, как работает техника подражательного обучения и как алгоритм Dagger позволяет обучить агента летать. Вы узнаете об эволюционных
стратегиях и оптимизации методом черного ящика. И напоследок познакомитесь с алгоритмами исследования на базе верхней доверительной границы
(UCB и UCB1) и метаалгоритмом ESBAS.
Прочитав книгу до конца, вы научитесь применять основные алгоритмы ОП
для решения реальных задач и станете членом сообщества ОП.

ПредПОлагаемая аудитОрия
Если вы занимаетесь исследованиями в области ИИ, применяете в работе глубокое обучение или просто хотите изучить ОП с нуля, то эта книга для вас. Она
будет полезна и тем, кто хочет --">

Оставить комментарий:

Книги схожие с «Алгоритмы обучения с подкреплением на Python» по жанру, серии, автору или названию:

Библиотека Keras - инструмент глубокого обучения. Реализация нейронных сетей с помощью библиотек Theano и TensorFlow. Антонио Джулли

Антонио Джулли, Суджит Пал - Библиотека Keras - инструмент глубокого обучения. Реализация нейронных сетей с помощью библиотек...

Жанр: Искусственный интеллект

Год издания: 2018

Разработка конвейеров машинного обучения. Автоматизация жизненных циклов модели с помощью TensorFlow. Ханнес Хапке

Ханнес Хапке, Кэтрин Нельсон - Разработка конвейеров машинного обучения. Автоматизация жизненных циклов модели с помощью TensorFlow

Жанр: Искусственный интеллект

Год издания: 2021

Серия: Бестселлеры o’reilly

Программируем с PyTorch. Создание приложений глубокого обучения. Ян Пойнтер

Ян Пойнтер - Программируем с PyTorch. Создание приложений глубокого обучения

Жанр: Искусственный интеллект

Год издания: 2020

Серия: Бестселлеры o’reilly

Глубокое обучение с подкреплением. Теория и практика на языке Python. Лаура Грессер

Лаура Грессер, Ван Лун Кенг - Глубокое обучение с подкреплением. Теория и практика на языке Python

Жанр: Python

Год издания: 2022

Серия: Библиотека программиста

Фантастика и фэнтези	Детективы и триллеры	Любовные романы	Информация о сайте
Научная	Боевик	Современные	Для правообладателей
Фэнтези	Исторические	Фантастические	Правила & Политика конф.
Боевая	Криминальные	Короткие	Обмен ссылками
Ужасы и мистика	Полицейские	Детективные	Все жанры библиотеки
Космическая	Триллеры	О любви	Отзывы о книгах
Альтернативная история	Шпионские	Исторические	Книги с оценками
Попаданцы	Детские	Эротические 18+
Социальная фантастика	Иронические
Юмористическая	Крутые
Постапокалипсис	Политические
Детективная	Маньяки

Почта сайта:	2019 - 2024 © "КнигаГо" - электронная библиотека. Книги читать онлайн без регистрации полностью или ознакомительные фрагменты с возможностью покупки книги.
Большинство книг на сайте опубликовано легально на правах партнёрской программы ЛитРес. Если Ваша книга была опубликована с нарушениями авторских прав, пожалуйста, направьте Вашу жалобу на или заполните форму обратной связи.
Интересная статья: Поиск синонимов к словам