Артём Владимирович Груздев - Предварительная подготовка данных в Python: Том 1. Инструменты и валидация
Название: | Предварительная подготовка данных в Python: Том 1. Инструменты и валидация | |
Автор: | Артём Владимирович Груздев | |
Жанр: | Python | |
Изадано в серии: | неизвестно | |
Издательство: | ДМК Пресс | |
Год издания: | 2023 | |
ISBN: | 978-5-93700-156-6 | |
Отзывы: | Комментировать | |
Рейтинг: | ||
Поделись книгой с друзьями! Помощь сайту: донат на оплату сервера |
Краткое содержание книги "Предварительная подготовка данных в Python: Том 1. Инструменты и валидация"
В двухтомнике представлены материалы по применению классических методов машинного обучения в различных промышленных задачах. Первый том посвящен инструментам Python – основным библиотекам, классам и функциям, необходимым для предварительной подготовки данных, построения моделей машинного обучения, выполнения различных стратегий валидации. В конце первого тома разбираются задачи с собеседований по SQL, Python, математической статистике и теории вероятностей. Издание рассчитано на специалистов по анализу данных, а также может быть полезно широкому кругу специалистов, интересующихся машинным обучением.
Читаем онлайн "Предварительная подготовка данных в Python: Том 1. Инструменты и валидация". [Страница - 88]
C помощью функции zip() «сшиваем» константу и коэффициенты с названиями признаков.
# печатаем название "Константа"
print("Константа:", intercept)
# печатаем название "Регрессионные коэффициенты"
print("Регрессионные коэффициенты:")
# для удобства сопоставим каждому названию
# признака соответствующий коэффициент
for c, feature in zip(coef[0], all_columns_lst):
print(feature, c)
Константа: -1.697
Регрессионные коэффициенты:
Customer Lifetime Value 0.007
Income 0.023
Monthly Premium Auto 0.124
Months Since Last Claim -0.047
Months Since Policy Inception -0.029
Number of Open Complaints -0.04
Number of Policies -0.059
Coverage_Basic -0.036
Coverage_Extended 0.129
Coverage_Premium -0.094
Education_Bachelor -0.164
Education_College -0.021
Education_Doctor 0.412
Education_High School or Below -0.171
Education_Master -0.057
EmploymentStatus_Disabled 0.001
EmploymentStatus_Employed -0.524
EmploymentStatus_Medical Leave -0.1
EmploymentStatus_Retired 1.648
EmploymentStatus_Unemployed -1.026
Gender_F -0.007
Gender_M 0.006
С помощью функций make_pipeline() и make_column_transformer(), класса
make_column_selector можно сократить объем программного кода, требуемого
для создания экземпляра класса ColumnTransformer.
Существует удобная функция make_column_transformer(), которая позволяет
создать экземпляр класса ColumnTransformer и автоматически присвоить имя
каждому конвейеру, исходя из номера списка столбцов, к которому он должен
быть применен. Например, конвейер, предназначенный для обработки первого
списка – списка количественных признаков, будет назван 'pipeline-1', а конвейер, предназначенный для обработки второго списка – списка категориальных признаков, будет назван 'pipeline-2'. Списки признаков определенного
типа можно создавать автоматически с помощью класса make_column_selector.
У класса make_column_selector будут два параметра: параметр dtype_include
задает тип признаков для включения, а параметр dtype_exclude – тип признаков для исключения. В итоге мы можем передать в функцию make_column_
transformer() двухэлементные кортежи, в которых первый элемент – конвей-
258
Инструменты
ер, создаваемый с помощью функции make_pipeline(), а второй элемент – список признаков, создаваемый с помощью класса make_column_selector.
Давайте импортируем функции make_pipeline() и make_column_
transformer(), класс make_column_selector.
# импортируем функции make_pipeline() и make_column_transformer(),
# класс make_column_selector
from sklearn.compose import (make_column_transformer,
make_column_selector)
from sklearn.pipeline import make_pipeline
Теперь с помощью функции make_column_transformer() автоматически создаем экземпляр класса ColumnTransformer, при этом автоматически создав
трансформеры с помощью функции make_pipeline() и списки признаков с помощью класса make_column_selector.
# автоматически создаем экземпляр класса ColumnTransformer,
# при этом автоматически создав трансформеры и списки
# признаков
column_transformer_quick = make_column_transformer(
(make_pipeline(SimpleImputer(strategy='median'),
StandardScaler()),
make_column_selector(dtype_include=np.number)),
(make_pipeline(SimpleImputer(strategy='most_frequent'),
OneHotEncoder()),
make_column_selector(dtype_include=object)))
Давайте посмотрим получившийся результат (вывод для удобства восприятия изменен).
column_transformer_quick
ColumnTransformer(
transformers=[('pipeline-1', Pipeline(
steps=[('simpleimputer', SimpleImputer(strategy='median')),
('standardscaler', StandardScaler())]),
--">
Книги схожие с «Предварительная подготовка данных в Python: Том 1. Инструменты и валидация» по жанру, серии, автору или названию:
Михал Яворски, Тарек Зиаде - Python. Лучшие практики и инструменты Жанр: Python Год издания: 2021 Серия: Библиотека программиста |