Валлиаппа Лакшманан , Сара Робинсон , Майкл Мунн - Машинное обучение. Паттерны проектирования
Название: | Машинное обучение. Паттерны проектирования | |
Автор: | Валлиаппа Лакшманан , Сара Робинсон , Майкл Мунн | |
Жанр: | Искусственный интеллект | |
Изадано в серии: | Бестселлеры o’reilly | |
Издательство: | БХВ-Петербург | |
Год издания: | 2022 | |
ISBN: | 978-5-9775-6797-8 | |
Отзывы: | Комментировать | |
Рейтинг: | ||
Поделись книгой с друзьями! Помощь сайту: донат на оплату сервера |
Краткое содержание книги "Машинное обучение. Паттерны проектирования"
Приводимые в книге патrерны проектирования отражают лучшие практические подходы к решению типичных задач машинного обучения. Указанные паттерны, реализованные в программном коде, сконцентрировали опыт сотен экспертов в простые и легкодоступные советы. Книга содержит подробный разбор 30 патrернов, служащих для представления данных и задач, тренировки моделей, отказоустойчивого обслуживания, обеспечения воспроизводимости и искусственного интеллекта. Каждый паттерн включает в себя постановку задачи, ряд потенциальных решений и рекомендации по выбору технического приема, наилучшим образом подходящего к данной ситуации. Для программистов в области машинного обучения
Читаем онлайн "Машинное обучение. Паттерны проектирования". [Страница - 82]
taxi_df = pd.read_csv("taxi-train.csv")
#
Сконструировать признак,
евклидово расстояние
taxi_df['euclid_dist'] = taxi_df.apply(compute_dist, axis=l)
Мы можем добавлять сущности и признаки в набор признаков с помощью функции
. add ( ... ) . С другой стороны, метод . infer_ fields _ from_ df ( ... ) создаст сущности и
признаки для нашего экземпляра FeatureSet непосредственно из фрейма данных
pandas.
и
Мы просто указываем имя столбца, который представляет сущность. Схема
типы
данных
для
признаков
экземпляра
FeatureSet
позднее
вычисляются
из
фрейма данных:
pandas
taxi_fs.infer_fields_from_df(taxi_df,
entities=[Entity(name='taxi_id', dtype=ValueType.INT64)],
replace_existing_features=True)
#
Вычислить признаки из кадра данных
Регистрация экземпляра Featureset. После того как набор признаков будет соз
дан,
мы
можем зарегистрировать его
в хранилище
Feast
с
помощью метода
cl ien t. appl у (taxi _ f s) . В целях подтверждения правильности регистрации набора
признаков или инспектирования содержимого еще одного набора признаков мы
можем извлечь его с помощью метода
. get_ feature _ set ( ... ) :
print (client .get_feature_set ( "taxi_rides"))
Приведенная выше инструкция возвращает объект
ных для набора признаков taxi _rides:
"spec": {
"name": "taxi _ rides",
"entities":
"name":
11
key",
"valueТype":
]
"INT64"
,
"features":
"name": "dropoff_lon",
"valueТype":
},
"DOUBLE"
JSON,
содержащий схему дан
Паттерны обеспечения воспроизводимости
347
"name": "pickup_lon",
"valueТype":
"DOUBLE"
},
]
,
Внесение признаковых данных в экземпляр FeatureSet. Убедившись в правиль
ности нашей схемы, мы можем направить признаковые данные кадра данных
в хранилище
Feast для
их приемки, используя метод
. ingest ( ... } .
Здесь мы укажем
экземпляр FeatureSet под названием taxi _ fs и кадр данных taxi _ df, из которого бу
дут заполняться признаковые данные.
# Загрузить признаковые данные
client.ingest(taxi fs, taxi_df}
в
Feast
для этого конкретного набора признаков
На этом шаге приемки на экран выводится индикатор хода выполнения, показывая,
что мы внесли
ща
28 247
строк данных в набор признаков taxi_rides внутри хранили
Feast:
100% ,• • • • 128247 /28247 [00: 02IC)
.,.,..,,(...,
egeney.eode..Fld8ral~
O
~,.c:odl_N8tion81Credit
о
Unюn ~(NCUA)
+
t~
·-·-
Colono
ь,1n•" ,.,. ~
е1
Рис.
7.13.
'.t>.ol
Редактор точек данных инструмента What-lf для двоичной классификационной модели .
Ось у- это результат предсказания модели для каждой точки данных
в диапазоне от О (отклонено) до
1
(одобрено)
32 На этом наборе данных можно было бы выnолн1пь еще м1ю1·0 других пр~дтренировочных оптимизаций.
Мы выбрали только одну ю них в качестве демонстрации того, что возможно.
Глава
400
7
Вкладка Performance & Fairness (Результативность и объективность) инструмента
What-lf позволяет оценивать объективность модели по разным срезам данных. Вы
брав один из признаков модели для Slice Ьу (Нарезать по), мы можем сравнить
результаты работы модели для различных значений этого признака. На рис. 7.14
показано, что мы нарезали набор данных по признаку agency_ code _ HUD значению, указывающему на факт гарантирования заявки агентством
кредитов не под надзором
~
""'
--__
....."_,..""'
-----"~.... _"
,__ "_
HUD, 1 для
кредитов под надзором
булеву
HUD
(О для
HUD).
Custom thr~holds kx 2 va~s of agency_code_Depor~t of Нousrng and 1.kЬм ~ {HUD) 0
St3
-TIStмf ...110>
___.
."
,"
"
05
--"-~
PA-~OЬIJQ
6R
/
/
-12~
(З13J
u_n.
(3SJ 71 .7'.
(368)
(1tO}
/
l.Wyanopllmtlttlori•tr1t~
ktlкt•1IПICl!gylOM-ic:'8!fJ"'~llVeМolch,Ьasedon
ll\tмtQISlnltiohid.ta--~.-lly.ь..w,i~OI
c:Nl\orl!QCO.lnll10Wll-...,мrt11010·cuяom~
00
05
@) Cи"""\tlr»l1Q/dtQ
QS --">
Книги схожие с «Машинное обучение. Паттерны проектирования» по жанру, серии, автору или названию:
Араки Масахиро - Занимательная манга. Машинное обучение Жанр: Искусственный интеллект Год издания: 2020 Серия: Образовательная манга |
Орельен Жерон - Прикладное машинное обучение с помощью Scikit-Learn, Keras и TensorFlow Жанр: Искусственный интеллект Год издания: 2020 Серия: Бестселлеры o’reilly |
Ханнес Хапке, Кэтрин Нельсон - Разработка конвейеров машинного обучения. Автоматизация жизненных циклов модели с помощью TensorFlow Жанр: Искусственный интеллект Год издания: 2021 Серия: Бестселлеры o’reilly |
Джон Боднер - Go: идиомы и паттерны проектирования Жанр: Go (golang) Год издания: 2022 Серия: Бестселлеры o’reilly |
Другие книги из серии «Бестселлеры o’reilly»:
Кеннет Рейтц, Таня Шлюссер - Автостопом по Python Жанр: Python Год издания: 2017 Серия: Бестселлеры o’reilly |
Джереми Ховард, Сильвейн Гуггер - Глубокое обучение с fastai и PyTorch: минимум формул, минимум кода, максимум эффективности Жанр: Python Год издания: 2022 Серия: Бестселлеры o’reilly |
Касун Индрасири, Данеш Курупу - gRPC: запуск и эксплуатация облачных приложений. Go и Java для Docker и Kubernetes Жанр: Go (golang) Год издания: 2021 Серия: Бестселлеры o’reilly |
Томас Хантер II, Брайан Инглиш - Многопоточный JavaScript Жанр: Java, Java Script Год издания: 2022 Серия: Бестселлеры o’reilly |