Библиотека knigago >> Компьютеры и Интернет >> Учебники и самоучители по компьютеру >> Базовые алгоритмы машинного обучения на языке python


СЛУЧАЙНЫЙ КОММЕНТАРИЙ

# 1815, книга: Я - снайпер Рейха
автор: Йозеф Оллерберг

Книга «Я — снайпер Рейха», написанная Йозефом Оллербергом, представляет собой глубоко личный и захватывающий рассказ о жизни и опыте немецкого снайпера во время Второй мировой войны. Благодаря форме мемуаров книга дает читателям уникальную возможность взглянуть на войну глазами человека, который участвовал в ней на передовой. Оллерберг честно и подробно описывает свою военную подготовку, боевые действия и душевные переживания. Оллерберг был чрезвычайно опытным снайпером и установил рекорд...

А. Ю. Долганов - Базовые алгоритмы машинного обучения на языке python

Базовые алгоритмы машинного обучения на языке python
Книга - Базовые алгоритмы машинного обучения на языке python.  А. Ю. Долганов  - прочитать полностью в библиотеке КнигаГо
Название:
Базовые алгоритмы машинного обучения на языке python
А. Ю. Долганов

Жанр:

Учебники и самоучители по компьютеру

Изадано в серии:

неизвестно

Издательство:

неизвестно

Год издания:

-

ISBN:

неизвестно

Отзывы:

Комментировать

Рейтинг:

Поделись книгой с друзьями!

Помощь сайту: донат на оплату сервера

Краткое содержание книги "Базовые алгоритмы машинного обучения на языке python"


Читаем онлайн "Базовые алгоритмы машинного обучения на языке python". [Страница - 3]

представлены данные об успеваемости некоторой
группы студентов.
Пример данных успеваемости студентов
id стуВозПол
дента
раст
0
1
2
3
4
5
6
7
8
9

Ж
М
М
Ж
М
М
Ж
Ж
Ж
Ж

24
23
24
24
24
24
23
23
24
24

Институт
ФТИ
Другой
Другой
ИРИТ-РТФ
ИРИТ-РТФ
ФТИ
ИРИТ-РТФ
ИРИТ-РТФ
ИРИТ-РТФ
ИЕНиМ

Обще- Ражитие бота
нет
нет
нет
нет
да
да
нет
нет
да
да

нет
нет
да
да
да
да
нет
нет
да
да

ОценЕГЭ
ка
Инф.
Python
75
83
79
40
43
59
98
83
50
65
45
96
71
98
98
43
49
61
63
46

Таблица 1.1

Баллы по
МО
54
98
43
46
49
90
50
55
83
71

Экзамен по
МО
Отл.
Уд.
Уд.
Отл.
Неуд.
Неуд.
Хор.
Уд.
Неуд.
Хор.

Первые ключевые понятия и обозначения, которые стоит ввести:
• x — объект, требующий некоторого предсказания (в табл. 1.1 это
строка для отдельного студента, характеризуемого собственным id);
7

Глава 1. Машинное обучение: общие сведения и понятия

 — полный набор объектов (в табл. 1.1 это совокупность студентов, все строки);
• y — цель (target), которая является ожидаемым предсказанием
(в табл. 1.1 это две целевые переменные для каждого студента: баллы по курсу «Машинное обучение» и оценка за экзамен
по машинному обучению);
•  — полный набор целей (в табл. 1.1 это целевые переменные
для совокупности студентов, оба столбца);
• признаки (features) — характеристики объектов (в табл. 1.1 это
пол, возраст, институт, общежитие, работа, баллы ЕГЭ по информатике и оценка за курс по Python).
В связи с этим на высоком уровне типичная задача машинного обучения формулируется следующим образом: искать возможности получать целевые переменные при использовании некого признакового пространства данных.



Типы данных
К слову, о признаках и данных. Существуют различные подходы
к классификации признаков, назовем их микроуровень и макроуровень.
На микроуровне признаки можно разделить на числовые и категориальные.
Числовые признаки — это некоторые количественные оценки объектов. Числовые признаки делят на дискретные, которые невозможно
измерить, но можно посчитать: например, ученики в классе, пальцы,
результат в футболе. Выделяют также непрерывные данные, которые
не могут быть подсчитаны, но их можно измерить — это, например,
температура, напряжение, высота.
Для числовых данных используются следующие обозначения:
•  — натуральные числа;
•  — целые числа;
•  — рациональные числа;
•  — действительные числа;
•  — комплексные числа.
Категориальные признаки — это характеристики объектов. Обычно категориальные признаки делят на номинальные (nominal), кото8

Типы данных

рые отвечают на вопрос о том, какое значение принимает данная характеристика, например цвет, пол, язык, институт и т. д., и порядковые
(ordinal) — дискретные и упорядоченные величины, например уровень английского, итоговая оценка за курс машинного обучения. Номинальные признаки, в которых всего два возможных значения, называют бинарными (это ответы на такие вопросы, которые предполагают
только «да» или «нет»).
На практике категориальные данные могут быть представлены
в виде числовых значений, как это изображено на рис. 1.1.
Вы женаты?
• Да
• Нет




На каком языке вы говорите?
• Русский
• Английский
• Китайский
• Арабский

1
0





0
1
2
3

Довольны ли вы курсом «Машинное обучение»?
• Полностью удовлетворен
• Умеренно удовлетворен
• Нейтрально
• Умеренно не удовлетворен
• Полностью не удовлетворен







2
1
0
−1
−2

Рис. 1.1. Пример представления категориальных данных
в виде числовых значений

Но нужно помнить, что подобные числа не имеют математического значения, как в случае числовых признаков, т. е. их нельзя складывать (например, нельзя сложить английский и китайский и получить
арабский) или сравнивать между собой (нельзя сказать, что английский в три раза меньше, чем арабский). Это накладывает определенные ограничения на использование категориальных признаков в моделях машинного обучения.
На макроуровне признаки можно разделить на табличные и нетабличные. Первые — это данные, представленные в виде таблицы (см. табл. 1.1),
отображающей совокупность различных числовых и категориальных
признаков. В строках --">

Оставить комментарий:


Ваш e-mail является приватным и не будет опубликован в комментарии.