Библиотека knigago >> Компьютеры и Интернет >> Базы данных >> Разберись в Data Science. Как освоить науку о данных и научиться думать как эксперт


СЛУЧАЙНЫЙ КОММЕНТАРИЙ

# 1475, книга: Цветы в Пустоте. Книга 1
автор: Леа Рэд

"Цветы в пустоте" от Леи Рэд - это захватывающее путешествие в неизведанные глубины космоса, где человечество сталкивается с необъяснимым и таинственным. С самого начала книга затягивает вихрем событий, перенося читателя в мир, где космические корабли рассекают звездные просторы, а древние артефакты разжигают любопытство и жажду приключений. История вращается вокруг Сары, талантливой этноархеолога, которая отправляется в экспедицию в дальние уголки галактики в поисках затерянных...

Алекс Дж. Гатман , Джордан Голдмейер - Разберись в Data Science. Как освоить науку о данных и научиться думать как эксперт

Разберись в Data Science. Как освоить науку о данных и научиться думать как эксперт
Книга - Разберись в Data Science. Как освоить науку о данных и научиться думать как эксперт.  Алекс Дж. Гатман , Джордан Голдмейер  - прочитать полностью в библиотеке КнигаГо
Название:
Разберись в Data Science. Как освоить науку о данных и научиться думать как эксперт
Алекс Дж. Гатман , Джордан Голдмейер

Жанр:

Базы данных

Изадано в серии:

Мировой компьютерный бестселлер

Издательство:

неизвестно

Год издания:

ISBN:

978-5-04-184971-9

Отзывы:

Комментировать

Рейтинг:

Поделись книгой с друзьями!

Помощь сайту: донат на оплату сервера

Краткое содержание книги "Разберись в Data Science. Как освоить науку о данных и научиться думать как эксперт"

Перед вами исчерпывающее руководство по основам Data Science. С помощью него вы сможете научиться мыслить статистически и понимать, какую роль в вашей работе играет аналитика, пользоваться языком науки о данных, избегать распространенных ошибок при работе с ними и, наконец, разобраться в полезных инструментах, которые используют эксперты.

В формате PDF A4 сохранен издательский макет книги.


К этой книге применимы такие ключевые слова (теги) как: эффективное руководство,анализ данных,статистический анализ,Data Science

Читаем онлайн "Разберись в Data Science. Как освоить науку о данных и научиться думать как эксперт" (ознакомительный отрывок). [Страница - 4]

дефолты происходят по принципу домино, то есть предыдущий дефолт может предсказать вероятность дальнейших дефолтов. Дефолт по одному ипотечному кредиту приводил к снижению стоимости находящейся поблизости недвижимости, что способствовало росту риска дефолта по соответствующим кредитам. По сути, один дом утягивал за собой соседние.

Допущение независимости фактически связанных между собой событий – распространенная ошибка в статистике.

Но давайте углубимся в эту историю. Инвестиционные банки создали модели, которые переоценили эти инвестиции. Модели, о которых мы поговорим далее в книге, – это упрощенные версии реальности. Они используют предположения о реальном мире для понимания и предсказания определенных явлений.

А кто создавал эти модели? Это были люди, которые заложили основы будущей профессии дата-сайентиста. Люди вроде нас. Статистики, экономисты, физики – люди, которые занимались машинным обучением, искусственным интеллектом и статистикой. Они работали с данными. И они были умны. Невероятно умны.

И все же что-то пошло не так. Может быть, они не сумели задать правильные вопросы? Или информация о риске и неопределенности не была должным образом донесена до лиц, принимающих решения, в результате чего у них возникла иллюзия совершенно предсказуемого рынка недвижимости? А может быть, кто-то откровенно соврал о результатах?

Но больше всего нас интересовало то, как избежать подобных ошибок в нашей собственной работе?

У нас было много вопросов, и об ответах мы могли лишь гадать, но одно было ясно – это была крупномасштабная катастрофа с данными. И она обещала быть не последней.

Всеобщие выборы в США 2016 года

8 ноября 2016 года кандидат от республиканцев Дональд Дж. Трамп победил на всеобщих выборах в Соединенных Штатах, обойдя предполагаемого лидера и кандидата от демократической партии Хиллари Клинтон. Для политических социологов это стало настоящим шоком, поскольку их модели не предсказывали его победу. А год был самым подходящим для подобных предсказаний.

В 2008 году Нейт Сильвер, автор блога FiveThirtyEight, тогда бывшего частью газеты The New York Times, проделал фантастическую работу и предсказал победу Барака Обамы. В то время эксперты скептически относились к способности его алгоритма прогнозирования точно предсказывать результаты выборов. В 2012 году Нейт Сильвер снова оказался в центре внимания, предсказав очередную победу Обамы.

К этому моменту деловой мир уже начал осваивать работу с данными и нанимать дата-сайентистов. Успешное предсказание переизбрания Барака Обамы Нейтом Сильвером лишь подчеркнуло важность и оракулоподобные возможности прогнозирования на основе данных. Статьи в деловых журналах предостерегали руководителей о том, что если они не освоят работу с данными, то проиграют в конкурентной борьбе. Промышленный комплекс науки о данных заработал в полную силу.

К 2016 году каждое крупное новостное издание вложило средства в алгоритм предсказания исхода всеобщих выборов. Подавляющее большинство из них прогнозировали сокрушительную победу кандидата от демократической партии Хиллари Клинтон. Как же они ошибались.

Давайте сравним эту ошибку с кризисом субстандартного ипотечного кредитования. Можно было бы утверждать, что мы многому научились и что интерес к науке о данных должен был бы позволить избежать ошибок прошлого. Действительно, начиная с 2008 года, новостные организации стали нанимать дата-сайентистов, вкладывать средства в проведение опросов общественного мнения, формировать команды аналитиков и тратить большое количество денег на сбор качественных данных.

Что же произошло, учитывая все это время, деньги, усилия и образование?[4]

Наша гипотеза

Почему возникают подобные проблемы с данными? Мы видим три причины: сложность проблемы, недостаток критического мышления и плохая коммуникация.

Во-первых (как мы уже говорили), работа с данными зачастую очень сложна. Даже при наличии большого количества данных, подходящих инструментов, методик и умнейших аналитиков случаются ошибки. Прогнозы могут и будут оказываться ошибочными. И это не критика данных и статистики. Такова реальность.

Во-вторых, некоторые аналитики и заинтересованные стороны перестали критически относиться к проблемам данных. Промышленный комплекс науки о данных в своем высокомерии нарисовал картину уверенности и простоты, и некоторые люди на нее --">

Оставить комментарий:


Ваш e-mail является приватным и не будет опубликован в комментарии.

Книги схожие с «Разберись в Data Science. Как освоить науку о данных и научиться думать как эксперт» по жанру, серии, автору или названию:

PHP и MYSQL. Серверная веб-разработка. Джон Дакетт
- PHP и MYSQL. Серверная веб-разработка

Жанр: Базы данных

Серия: Мировой компьютерный бестселлер

Другие книги из серии «Мировой компьютерный бестселлер»:

Photoshop CC для начинающих. Роберт Шаффлботэм
- Photoshop CC для начинающих

Жанр: Графика. Дизайн. Мультимедиа

Год издания: 2017

Серия: Мировой компьютерный бестселлер

Учим Python, делая крутые игры. Эл Свейгарт
- Учим Python, делая крутые игры

Жанр: Программирование игр

Год издания: 2022

Серия: Мировой компьютерный бестселлер