Грант Бейлевельд , Джон Крон , Аглаэ Бассенс - Глубокое обучение в картинках. Визуальный гид по искусственному интеллекту
Название: | Глубокое обучение в картинках. Визуальный гид по искусственному интеллекту | |
Автор: | Грант Бейлевельд , Джон Крон , Аглаэ Бассенс | |
Жанр: | Искусственный интеллект | |
Изадано в серии: | Библиотека программиста | |
Издательство: | Питер | |
Год издания: | 2020 | |
ISBN: | 978-5-4461-1574-7 | |
Отзывы: | Комментировать | |
Рейтинг: | ||
Поделись книгой с друзьями! Помощь сайту: донат на оплату сервера |
Краткое содержание книги "Глубокое обучение в картинках. Визуальный гид по искусственному интеллекту"
Глубокое обучение стало мощным двигателем для работы с искусственным интеллектом. Яркие иллюстрации и простые примеры кода избавят вас от необходимости вникать в сложные аспекты конструирования моделей глубокого обучения, делая сложные задачи доступными и увлекательными. Джон Крон, Грант Бейлевельд и замечательный иллюстратор Аглаэ Бассенс используют яркие примеры и аналогии, которые позволяют объяснить, что такое глубокое обучение, почему оно пользуется такой популярностью и как эта концепция связана с другими подходами к машинному обучению. Книга идеально подойдет разработчикам, специалистам по обработке данных, исследователям, аналитикам и начинающим программистам, которые хотят применять глубокое обучение в своей работе. Теоретические выкладки прекрасно дополняются прикладным кодом на Python в блокнотах Jupyter. Вы узнаете приемы создания эффективных моделей в TensorFlow и Keras, а также познакомитесь с PyTorch. Базовые знания о глубоком обучении позволят создавать реальные приложения — от компьютерного зрения и обработки естественного языка до генерации изображений и игровых алгоритмов. 16+
Читаем онлайн "Глубокое обучение в картинках. Визуальный гид по искусственному интеллекту". [Страница - 162]
ОБРАБОТКА ЕСТЕСТВЕННОГО ЯЗЫКА
Подобно набору данных Fashion-MNIST, который легко можно использовать для
обучения моделей классификации изображений, созданных нами в этой книге,
1
2
bit.ly/kaggleCD
github.com/googlecreativelab/quickdraw-dataset
ГЛАВА 14. Вперед, к собственным проектам глубокого обучения
369
существуют наборы данных, подготовленные Сяном Чжаном (Xiang Zhang) и его
коллегами из лаборатории Яна Лекуна (см. рис. 1.9), которые можно напрямую
использовать для обучения моделей классификации естественного языка из главы 11, что делает их идеальным выбором для первого собственного проекта NLP.
Все восемь наборов данных на естественном языке, сформированных Чжаном
и его коллегами, подробно описаны в их статье1 и доступны для загрузки по
адресу bit.ly/NLPdata. Каждый набор данных по крайней мере на порядок превосходит по объему набор данных IMDb с обучающей выборкой в 25 000 образцов,
с которыми мы работали в главе 11, что позволяет экспериментировать с более
сложными моделями глубокого обучения и конструировать гораздо более богатые векторные пространства слов. Шесть наборов данных из этой коллекции
имеют более двух классов (поэтому в выходном слое должно иметься несколько
нейронов с активацией softmax), а два других предназначены для задач бинарной классификации (что позволит вам сохранить один сигмоидный выход, как
в наших примерах с данными IMDb):
Yelp Review Polarity: 560 000 обучающих и 38 000 проверочных образцов,
которые классифицируются как положительные (четырех- или пятизвездочные) или отрицательные (одно- или двухзвездочные) отзывы, размещенные на веб-сайте Yelp.
Amazon Review Polarity: колоссальное число обучающих (3.6 миллиона)
и проверочных (400 000) образцов отзывов, собранных гигантом электронной коммерции Amazon, которые делятся на два класса — положительные
и отрицательные.
Данные для задач обработки естественного языка доступны также в Kaggle,
Figure Eight (выполните поиск по слову sentiment или text на figure-eight.com/
data-for-everyone) и на странице Люка де Оливейры (Luke de Oliveira, по адресу
bit.ly/LukeData под заголовком «Natural Language»), которые можно использовать
как основу для своих проектов глубокого обучения.
ГЛУБОКОЕ ОБУЧЕНИЕ С ПОДКРЕПЛЕНИЕМ
В качестве первого проекта глубокого обучения в этом направлении можно
попробовать:
Изменить окружение: например, обучить агента DQN из блокнота cartpole_
dqn.ipynb2, которого мы создали в главе 13, действовать в другом окружении
из числа имеющихся в OpenAI Gym. Вот несколько относительно простых
вариантов: Mountain Car (MountainCar-v0) и Frozen Lake (FrozenLake-v0).
1
2
См. четвертый раздел («Large-scale Datasets and Results») в статье: Zhang X. et al. (2016).
«Character-level convolutional networks for text classification». arXiv: 1509.01626.
Для этого измените строковый аргумент, который передается в вызов gym.make()
в листинге 13.1.
370
ЧАСТЬ IV. Вы и Искусственный интеллект
Создать нового агента: если у вас есть доступ к компьютеру с ОС Unix
(в том числе и macOS), вы можете установить SLM Lab (см. рис. 13.10),
чтобы опробовать других агентов (например, Actor-Critic; см. рис. 13.12).
Некоторые из них достаточно сложны, чтобы показать превосходные результаты в продвинутых окружениях, таких как игры для Atari1 из библиотеки OpenAI Gym или трехмерные окружения из Unity.
Освоив работу с продвинутыми агентами, попробуйте обучить их в других
окружениях, таких как DeepMind Lab (см. рис. 4.14), или обучить одного агента
сразу в нескольких разных (SLM Lab поможет вам в этом).
ПРЕОБРАЗОВАНИЕ ИМЕЮЩЕГОСЯ ПРОЕКТА МАШИННОГО ОБУЧЕНИЯ
Все проекты, предложенные выше, связаны с использованием сторонних источников данных, но вы вполне можете собрать данные сами. Возможно, у вас даже
уже есть какие-то данные, которые вы использовали для машинного обучения,
например, в моделях линейной регрессии или в методе опорных векторов. Если
это так, то можете попробовать использовать имеющиеся данные в некоторой
модели глубокого обучения. Начните с полносвязанной сети, включающей три
x
«глубина»
необработанные
входные данные
слои, такие как:
• conv
• RNN
• dense
«ширина»
признаки
x
1-3 полносвязанных слоя
объединение
1-3 полносвязанных слоя
ŷ
Рис. 14.2. Архитектура модели широкого и глубокого обучения объединяет результаты двух отдельных ветвей.
Глубокая ветвь получает исходные (необработанные) данные и использует лишь несколько соответствующих слоев
(например, сверточных, рекуррентных, --">
Книги схожие с «Глубокое обучение в картинках. Визуальный гид по искусственному интеллекту» по жанру, серии, автору или названию:
Эндрю Траск - Грокаем глубокое обучение. Жанр: Искусственный интеллект Год издания: 2019 Серия: Библиотека программиста |
Бхарат Рамсундар, Питер Истман, Патрик Уолтерс и др. - Глубокое обучение в биологии и медицине Жанр: Искусственный интеллект Год издания: 2020 |
Джон Д. Келлехер - Глубокое обучение. Самый краткий и понятный курс Жанр: Искусственный интеллект Год издания: 2022 Серия: Библиотека MIT |
Мартин Форд - Архитекторы интеллекта Жанр: Современные российские издания Год издания: 2019 Серия: Библиотека программиста |
Другие книги из серии «Библиотека программиста»:
Коллектив авторов - Язык СИ для профессионалов Жанр: C, C++, C# Год издания: 1991 Серия: Библиотека программиста |
Владимир Силва - Разработка с использованием квантовых компьютеров Жанр: Программирование: прочее Год издания: 2020 Серия: Библиотека программиста |
Фредерик Брукс - Мифический человеко-месяц, или Как создаются программные системы Жанр: Деловая литература: прочее Год издания: 2021 Серия: Библиотека программиста |
Курупа Чиннатхамби - JavaScript с нуля Жанр: Java, Java Script Год издания: 2021 Серия: Библиотека программиста |