Библиотека knigago >> Компьютеры и Интернет >> Учебники и самоучители по компьютеру >> Руководство по подготовке к Data science интервью

Ренат Алимбеков - Руководство по подготовке к Data science интервью

Руководство по подготовке к Data science интервью
Книга - Руководство по подготовке к Data science интервью.  Ренат Алимбеков  - прочитать полностью в библиотеке КнигаГо
Название:
Руководство по подготовке к Data science интервью
Ренат Алимбеков

Жанр:

Учебники и самоучители по компьютеру

Изадано в серии:

неизвестно

Издательство:

неизвестно

Год издания:

-

ISBN:

неизвестно

Отзывы:

Комментировать

Рейтинг:

Поделись книгой с друзьями!

Помощь сайту: донат на оплату сервера

Краткое содержание книги "Руководство по подготовке к Data science интервью"


Читаем онлайн "Руководство по подготовке к Data science интервью". [Страница - 13]

сопоставить
результаты с Sklearn MultinomialNB?
Как реализовать категориальный наивный байесовский метод с нуля для категориальных
данных и сопоставить результаты с помощью Sklearn CategoriesavericalNB?
Как реализовать Gaussian Naive Bayes с нуля для числовых данных и сопоставить
результаты с помощью Sklearn GaussianNB?
Каковы сложности обучения и проверки → временные и пространственные сложности
наивного Байеса?
Влияет ли на наивный байесовский метод несбалансированные данные, если да, то как
это исправить?
Как наивный байесовский метод влияет на выбросы?
Можно ли интерпретировать наивный байесовский анализ, можем ли мы сказать, какие
особенности помогли нам предсказать конкретный класс?
Является ли наивный байесовский классификатор линейным, может ли он решить
нелинейную границу принятия решений?
Как избежать проблем с переобучением или недообучением в наивном байесовском
методе?
Опишите механизм работы логистической регрессии, что такое функция правдоподобия и
как она максимизируется.
Разница между регуляризациями L1 и L2, в чем их смысл и как они используются в
логарифмической регрессии.
Как устроено дерево и лес, по какому принципу растет дерево, как упорядочено и почему.
Определение энтропии и критерия Джини.
Вопросы о предварительной обработке: что такое тригонометрические функции и когда
это может быть полезно; способы восполнения пробелов, способы поиска выбросов и
аномалий.
Зачем нужен логарифм в логистической регрессии?
Могут ли две обученные случайные модели леса иметь один и тот же признак с разной
важностью?
Какими свойствами должна обладать потеря для повышения?
Может ли функция активации быть недифференцируемой?
Может ли линейная регрессия переобучаться? Почему?
Телекоммуникационная компания

1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.

SQL. Есть 2 таблицы в одной 20 строк в других 30 строках. Мы соединяемся, используя
внутреннее соединение 1 = 1. Сколько строк будет в итоговой таблице?
SQL. Как подсчитать дубликаты?
SQL. Как работает левый join?
Задача. Есть набор данных, в котором есть 3 столбца: название города, координаты
квартиры, стоимость аренды. Объясните порядок прогнозирования стоимости аренды.
Что делать с категоричными признаками?
Как устранить пропуски в этом наборе данных?
Как рассчитать расстояние от центра?
Формула расстояния Евклида?
Где взять координаты городов?
Формула линейной регрессии?
Как рассчитываются веса линейной регрессии?
Формула линейной регрессии?
Опишите алгоритм дерева решений?
На каком основании выполняется разделение в первую очередь?
Есть прогнозируемые данные об оттоке. Как узнать топ-20 нелояльных клиентов?
Какие существуют метрики классификации?

17.
18.
19.
20.
21.
22.
23.
24.
25.

Что такое точность?
Что такое точность и охват?
Как объяснить бизнесу, что означает точность 0,6 и охват 0,5?
Как построить AUC-ROC?
Формула логистической регрессии?
Формула сигмоидной функции и зачем она нужна?
Метрики в задачах регрессии?
Формула MSE?
Что такое R2? Формула и что это значит, если R2 = 0,3?

Компьютерное зрение
1.
2.
3.
4.
5.
6.

Основные вещи, такие как классификация, обнаружение, сегментация.
Иногда задавались узкие определения вроде архитектуры какой-то сетки, например
resnet, resnext, se-resnext и т. д.
Как бы вы решили какую-то прикладную задачу (обычно это то, что решают на работе),
выбирая метрику, собирая данные и т. д.
Какие архитектуры классификации, сегментации, обнаружения вы знаете? (в чем разница
между ними)
Чем ReLU отличается от сигмовидной? Почему лучше в глубоких сетях? Что является
причиной этого?
Почему Адам лучше SGD? Какие еще есть алгоритмы обучения и почему они лучше?

Банк
1.
2.
3.
4.

В чем разница между метриками регрессии (среднеквадратичная ошибка, средняя
абсолютная ошибка, R в квадрате)? Когда использовать?
Как связаны коэффицент Джини и AUC-ROC?
Когда менять порог классификации?
После Upsampling выясняется, что вероятности классов меняются. Как сделать так, чтобы
модель была предсказуемой на самом деле?

Интервью - Вопросы от Мирас Амира
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.

(startup) Чем бустинг отличается от бэггинга?
(startup) Чем xgboost отличается от повышения в sklearn?
(startup) Расскажите об алгоритмах выбора признаков
(startup) Что такое PCA?
(startup) --">

Оставить комментарий:


Ваш e-mail является приватным и не будет опубликован в комментарии.