Ренат Алимбеков - Руководство по подготовке к Data science интервью
Название: | Руководство по подготовке к Data science интервью | |
Автор: | Ренат Алимбеков | |
Жанр: | Учебники и самоучители по компьютеру | |
Изадано в серии: | неизвестно | |
Издательство: | неизвестно | |
Год издания: | - | |
ISBN: | неизвестно | |
Отзывы: | Комментировать | |
Рейтинг: | ||
Поделись книгой с друзьями! Помощь сайту: донат на оплату сервера |
Краткое содержание книги "Руководство по подготовке к Data science интервью"
Читаем онлайн "Руководство по подготовке к Data science интервью". [Страница - 3]
- 1
- 2
- 3
- 4
- 5
- . . .
- последняя (14) »
n
попыток.
У него есть только два возможных исхода: успех или неудача.
Рассмотрим случайную величину X только с одним параметром p, который представляет
вероятность наступления события.
Функция плотности:
○ P[X=1]=p
○ P[X=0]=1-p
○ Где X = 1 указывает, что событие произошло, а X = 0 указывает, что событие не
произошло.
Равномерное распределение
Простейшее распределение вероятностей - это равномерное распределение, которое дает
одинаковую вероятность для любых точек набора.
В своей непрерывной форме равномерное распределение между a и b имеет функцию плотности:
А вот как это выглядит:
Как видите, чем шире диапазон, тем ниже распределение. Это нужно, чтобы площадь оставалась
равной единице.
Распределение называется равномерным, если все исходы события имеют равные
вероятности.
Равномерное распределение также называется прямоугольным.
Ожидаемое значение равномерного распределения не дает нам соответствующей
информации.
Поскольку каждый результат одинаково вероятен, среднее значение и дисперсия не
поддаются интерпретации.
Распределение Пуассона
Распределение Пуассона также называется распределением редких событий. В общем, если у вас
есть событие, которое происходит с фиксированной скоростью во времени (т.е. 3 события в
минуту, 5 событий в час), вероятность наблюдения числа n событий в единицу времени может
быть описана распределением Пуассона, которое имеет эту формулу:
μ - частота событий в единицу времени.
Вот несколько примеров:
Как видите, его форма похожа на распределение Гаусса, а его пик равен μ.
Распределение Пуассона широко используется в физике элементарных частиц, а в науке о данных
может быть полезно, описывать события с фиксированной скоростью (например, покупатель,
который входит в супермаркет утром).
Распределение Пуассона - это дискретное распределение вероятностей.
Распределение Пуассона — это распределение количества, т.е. количества случаев, когда
событие произошло в заданный интервал времени.
Распределение Пуассона можно использовать для прогнозирования вероятности
количества успешных событий, которые могут произойти в определенный интервал
времени.
Пример: если в колл-центр поступило 50 звонков за 1 час, то с помощью распределения
Пуассона мы можем предсказать вероятность получения 20 звонков в следующие 30
минут.
Логнормальное распределение
Если вы возьмете гауссовскую переменную и возведете в степень, вы получите логнормальное
распределение, функция плотности вероятности которого:
μ и σ совпадают с исходным гауссовым распределением.
Несколько примеров:
Логнормальное распределение широко встречается в природе. Артериальное давление следует
логнормальному распределению, размеры городов и так далее. Очень интересно использовать
геометрическое броуновское движение, которое представляет собой модель случайного
блуждания, часто используемую для описания финансовых рынков, особенно в уравнении БлэкаШоулза для ценообразования.
Экспоненциальное распределение
Если у вас есть событие Пуассона, которое происходит с фиксированной скоростью, временной
интервал между двумя последовательными появлением этого события распределяется
экспоненциально.
Экспоненциальное распределение имеет такую функцию плотности:
τ - средний временной интервал между двумя последовательными событиями.
Экспоненциальное распределение используется в физике элементарных частиц и, вообще, если
вы хотите перейти от пуассоновского процесса (в котором вы изучаете количество событий) к
чему-то более связанному со временем (например, сколько времени проходит между двумя
последовательными клиентами, входящими в магазин).
Машинное обучение с учителем
Что такое машинное обучение с учителем?
Случай, когда у нас есть как объекты (матрица X), так и таргеты (вектор y)
Бинараная классификация
Статистическая бинарная классификация. Статистическая классификация - это проблема,
изучаемая в машинном обучении. Это тип обучения с учителем, метод машинного обучения, в
котором таргеты предопределены, и используется для категоризации новых вероятностных
наблюдений по указанным таргетам. Когда есть только два таргета, проблема известна как
статистическая бинарная классификация.
Некоторые из --">
попыток.
У него есть только два возможных исхода: успех или неудача.
Рассмотрим случайную величину X только с одним параметром p, который представляет
вероятность наступления события.
Функция плотности:
○ P[X=1]=p
○ P[X=0]=1-p
○ Где X = 1 указывает, что событие произошло, а X = 0 указывает, что событие не
произошло.
Равномерное распределение
Простейшее распределение вероятностей - это равномерное распределение, которое дает
одинаковую вероятность для любых точек набора.
В своей непрерывной форме равномерное распределение между a и b имеет функцию плотности:
А вот как это выглядит:
Как видите, чем шире диапазон, тем ниже распределение. Это нужно, чтобы площадь оставалась
равной единице.
Распределение называется равномерным, если все исходы события имеют равные
вероятности.
Равномерное распределение также называется прямоугольным.
Ожидаемое значение равномерного распределения не дает нам соответствующей
информации.
Поскольку каждый результат одинаково вероятен, среднее значение и дисперсия не
поддаются интерпретации.
Распределение Пуассона
Распределение Пуассона также называется распределением редких событий. В общем, если у вас
есть событие, которое происходит с фиксированной скоростью во времени (т.е. 3 события в
минуту, 5 событий в час), вероятность наблюдения числа n событий в единицу времени может
быть описана распределением Пуассона, которое имеет эту формулу:
μ - частота событий в единицу времени.
Вот несколько примеров:
Как видите, его форма похожа на распределение Гаусса, а его пик равен μ.
Распределение Пуассона широко используется в физике элементарных частиц, а в науке о данных
может быть полезно, описывать события с фиксированной скоростью (например, покупатель,
который входит в супермаркет утром).
Распределение Пуассона - это дискретное распределение вероятностей.
Распределение Пуассона — это распределение количества, т.е. количества случаев, когда
событие произошло в заданный интервал времени.
Распределение Пуассона можно использовать для прогнозирования вероятности
количества успешных событий, которые могут произойти в определенный интервал
времени.
Пример: если в колл-центр поступило 50 звонков за 1 час, то с помощью распределения
Пуассона мы можем предсказать вероятность получения 20 звонков в следующие 30
минут.
Логнормальное распределение
Если вы возьмете гауссовскую переменную и возведете в степень, вы получите логнормальное
распределение, функция плотности вероятности которого:
μ и σ совпадают с исходным гауссовым распределением.
Несколько примеров:
Логнормальное распределение широко встречается в природе. Артериальное давление следует
логнормальному распределению, размеры городов и так далее. Очень интересно использовать
геометрическое броуновское движение, которое представляет собой модель случайного
блуждания, часто используемую для описания финансовых рынков, особенно в уравнении БлэкаШоулза для ценообразования.
Экспоненциальное распределение
Если у вас есть событие Пуассона, которое происходит с фиксированной скоростью, временной
интервал между двумя последовательными появлением этого события распределяется
экспоненциально.
Экспоненциальное распределение имеет такую функцию плотности:
τ - средний временной интервал между двумя последовательными событиями.
Экспоненциальное распределение используется в физике элементарных частиц и, вообще, если
вы хотите перейти от пуассоновского процесса (в котором вы изучаете количество событий) к
чему-то более связанному со временем (например, сколько времени проходит между двумя
последовательными клиентами, входящими в магазин).
Машинное обучение с учителем
Что такое машинное обучение с учителем?
Случай, когда у нас есть как объекты (матрица X), так и таргеты (вектор y)
Бинараная классификация
Статистическая бинарная классификация. Статистическая классификация - это проблема,
изучаемая в машинном обучении. Это тип обучения с учителем, метод машинного обучения, в
котором таргеты предопределены, и используется для категоризации новых вероятностных
наблюдений по указанным таргетам. Когда есть только два таргета, проблема известна как
статистическая бинарная классификация.
Некоторые из --">
- 1
- 2
- 3
- 4
- 5
- . . .
- последняя (14) »
Книги схожие с «Руководство по подготовке к Data science интервью» по жанру, серии, автору или названию:
Дональд Мартин, Стивен Прата, Митчел Уэйт - Язык Си - руководство для начинающих Жанр: C, C++, C# Год издания: 1988 |
Герберт Шилдт - C# 4.0: полное руководство Жанр: C, C++, C# Год издания: 2011 |
Михаил В Рытов - Ягодники. Руководство по разведению крыжовника и смородины Жанр: Сад и огород Год издания: 2012 |
Шерри Аргов - Мужчины любят стерв. Руководство для слишком хороших женщин Жанр: Психология Год издания: 2012 |