Библиотека knigago >> Компьютеры: Языки и системы программирования >> Python >> Предварительная подготовка данных в Python: Том 1. Инструменты и валидация


Коллектив авторов Культурология и этнография "Вожди умов и моды" - это увлекательный и проницательный сборник эссе, исследующий роль покойных знаменитостей и лидеров в формировании нашей современной идентичности. Коллектив авторов изучает, как мы наследуем и подражаем моделям жизни, установленным теми, кто уже ушел. В книге представлен широкий спектр исследований, охватывающих такие фигуры, как Энди Уорхол, Элвис Пресли, Принцесса Диана и Стив Джобс. Авторы рассматривают, как...

Артём Владимирович Груздев - Предварительная подготовка данных в Python: Том 1. Инструменты и валидация

Предварительная подготовка данных в Python: Том 1. Инструменты и валидация
Книга - Предварительная подготовка данных в Python: Том 1. Инструменты и валидация.  Артём Владимирович Груздев  - прочитать полностью в библиотеке КнигаГо
Название:
Предварительная подготовка данных в Python: Том 1. Инструменты и валидация
Артём Владимирович Груздев

Жанр:

Python

Изадано в серии:

неизвестно

Издательство:

ДМК Пресс

Год издания:

ISBN:

978-5-93700-156-6

Отзывы:

Комментировать

Рейтинг:

Поделись книгой с друзьями!

Помощь сайту: донат на оплату сервера

Краткое содержание книги "Предварительная подготовка данных в Python: Том 1. Инструменты и валидация"

В двухтомнике представлены материалы по применению классических методов машинного обучения в различных промышленных задачах. Первый том посвящен инструментам Python – основным библиотекам, классам и функциям, необходимым для предварительной подготовки данных, построения моделей машинного обучения, выполнения различных стратегий валидации. В конце первого тома разбираются задачи с собеседований по SQL, Python, математической статистике и теории вероятностей. Издание рассчитано на специалистов по анализу данных, а также может быть полезно широкому кругу специалистов, интересующихся машинным обучением.

Читаем онлайн "Предварительная подготовка данных в Python: Том 1. Инструменты и валидация". [Страница - 88]

 257
C помощью функции zip() «сшиваем» константу и коэффициенты с названиями признаков.
# печатаем название "Константа"
print("Константа:", intercept)
# печатаем название "Регрессионные коэффициенты"
print("Регрессионные коэффициенты:")
# для удобства сопоставим каждому названию
# признака соответствующий коэффициент
for c, feature in zip(coef[0], all_columns_lst):
print(feature, c)
Константа: -1.697
Регрессионные коэффициенты:
Customer Lifetime Value 0.007
Income 0.023
Monthly Premium Auto 0.124
Months Since Last Claim -0.047
Months Since Policy Inception -0.029
Number of Open Complaints -0.04
Number of Policies -0.059
Coverage_Basic -0.036
Coverage_Extended 0.129
Coverage_Premium -0.094
Education_Bachelor -0.164
Education_College -0.021
Education_Doctor 0.412
Education_High School or Below -0.171
Education_Master -0.057
EmploymentStatus_Disabled 0.001
EmploymentStatus_Employed -0.524
EmploymentStatus_Medical Leave -0.1
EmploymentStatus_Retired 1.648
EmploymentStatus_Unemployed -1.026
Gender_F -0.007
Gender_M 0.006

С помощью функций make_pipeline() и make_column_transformer(), класса
make_column_selector можно сократить объем программного кода, требуемого
для создания экземпляра класса ColumnTransformer.
Существует удобная функция make_column_transformer(), которая позволяет
создать экземпляр класса ColumnTransformer и автоматически присвоить имя
каждому конвейеру, исходя из номера списка столбцов, к которому он должен
быть применен. Например, конвейер, предназначенный для обработки первого
списка – списка количественных признаков, будет назван 'pipeline-1', а конвейер, предназначенный для обработки второго списка – списка категориальных признаков, будет назван 'pipeline-2'. Списки признаков определенного
типа можно создавать автоматически с помощью класса make_column_selector.
У класса make_column_selector будут два параметра: параметр dtype_include
задает тип признаков для включения, а параметр dtype_exclude – тип признаков для исключения. В итоге мы можем передать в функцию make_column_
transformer() двухэлементные кортежи, в которых первый элемент – конвей-

258



Инструменты

ер, создаваемый с помощью функции make_pipeline(), а второй элемент – список признаков, создаваемый с помощью класса make_column_selector.
Давайте импортируем функции make_pipeline() и make_column_
transformer(), класс make_column_selector.
# импортируем функции make_pipeline() и make_column_transformer(),
# класс make_column_selector
from sklearn.compose import (make_column_transformer,
make_column_selector)
from sklearn.pipeline import make_pipeline

Теперь с помощью функции make_column_transformer() автоматически создаем экземпляр класса ColumnTransformer, при этом автоматически создав
трансформеры с помощью функции make_pipeline() и списки признаков с помощью класса make_column_selector.
# автоматически создаем экземпляр класса ColumnTransformer,
# при этом автоматически создав трансформеры и списки
# признаков
column_transformer_quick = make_column_transformer(
(make_pipeline(SimpleImputer(strategy='median'),
StandardScaler()),
make_column_selector(dtype_include=np.number)),
(make_pipeline(SimpleImputer(strategy='most_frequent'),
OneHotEncoder()),
make_column_selector(dtype_include=object)))

Давайте посмотрим получившийся результат (вывод для удобства восприятия изменен).
column_transformer_quick
ColumnTransformer(
transformers=[('pipeline-1', Pipeline(
steps=[('simpleimputer', SimpleImputer(strategy='median')),
('standardscaler', StandardScaler())]),
--">

Оставить комментарий:


Ваш e-mail является приватным и не будет опубликован в комментарии.

Книги схожие с «Предварительная подготовка данных в Python: Том 1. Инструменты и валидация» по жанру, серии, автору или названию:

Python. Лучшие практики и инструменты. Михал Яворски
- Python. Лучшие практики и инструменты

Жанр: Python

Год издания: 2021

Серия: Библиотека программиста