Алекс Дж. Гатман , Джордан Голдмейер - Разберись в Data Science. Как освоить науку о данных и научиться думать как эксперт
Название: | Разберись в Data Science. Как освоить науку о данных и научиться думать как эксперт | |
Автор: | Алекс Дж. Гатман , Джордан Голдмейер | |
Жанр: | Базы данных | |
Изадано в серии: | Мировой компьютерный бестселлер | |
Издательство: | неизвестно | |
Год издания: | 2023 | |
ISBN: | 978-5-04-184971-9 | |
Отзывы: | Комментировать | |
Рейтинг: | ||
Поделись книгой с друзьями! Помощь сайту: донат на оплату сервера |
Краткое содержание книги "Разберись в Data Science. Как освоить науку о данных и научиться думать как эксперт"
Перед вами исчерпывающее руководство по основам Data Science. С помощью него вы сможете научиться мыслить статистически и понимать, какую роль в вашей работе играет аналитика, пользоваться языком науки о данных, избегать распространенных ошибок при работе с ними и, наконец, разобраться в полезных инструментах, которые используют эксперты.
В формате PDF A4 сохранен издательский макет книги.
К этой книге применимы такие ключевые слова (теги) как: эффективное руководство,анализ данных,статистический анализ,Data Science
Читаем онлайн "Разберись в Data Science. Как освоить науку о данных и научиться думать как эксперт" (ознакомительный отрывок). [Страница - 4]
Допущение независимости фактически связанных между собой событий – распространенная ошибка в статистике.
Но давайте углубимся в эту историю. Инвестиционные банки создали модели, которые переоценили эти инвестиции. Модели, о которых мы поговорим далее в книге, – это упрощенные версии реальности. Они используют предположения о реальном мире для понимания и предсказания определенных явлений.
А кто создавал эти модели? Это были люди, которые заложили основы будущей профессии дата-сайентиста. Люди вроде нас. Статистики, экономисты, физики – люди, которые занимались машинным обучением, искусственным интеллектом и статистикой. Они работали с данными. И они были умны. Невероятно умны.
И все же что-то пошло не так. Может быть, они не сумели задать правильные вопросы? Или информация о риске и неопределенности не была должным образом донесена до лиц, принимающих решения, в результате чего у них возникла иллюзия совершенно предсказуемого рынка недвижимости? А может быть, кто-то откровенно соврал о результатах?
Но больше всего нас интересовало то, как избежать подобных ошибок в нашей собственной работе?
У нас было много вопросов, и об ответах мы могли лишь гадать, но одно было ясно – это была крупномасштабная катастрофа с данными. И она обещала быть не последней.
Всеобщие выборы в США 2016 года
8 ноября 2016 года кандидат от республиканцев Дональд Дж. Трамп победил на всеобщих выборах в Соединенных Штатах, обойдя предполагаемого лидера и кандидата от демократической партии Хиллари Клинтон. Для политических социологов это стало настоящим шоком, поскольку их модели не предсказывали его победу. А год был самым подходящим для подобных предсказаний.В 2008 году Нейт Сильвер, автор блога FiveThirtyEight, тогда бывшего частью газеты The New York Times, проделал фантастическую работу и предсказал победу Барака Обамы. В то время эксперты скептически относились к способности его алгоритма прогнозирования точно предсказывать результаты выборов. В 2012 году Нейт Сильвер снова оказался в центре внимания, предсказав очередную победу Обамы.
К этому моменту деловой мир уже начал осваивать работу с данными и нанимать дата-сайентистов. Успешное предсказание переизбрания Барака Обамы Нейтом Сильвером лишь подчеркнуло важность и оракулоподобные возможности прогнозирования на основе данных. Статьи в деловых журналах предостерегали руководителей о том, что если они не освоят работу с данными, то проиграют в конкурентной борьбе. Промышленный комплекс науки о данных заработал в полную силу.
К 2016 году каждое крупное новостное издание вложило средства в алгоритм предсказания исхода всеобщих выборов. Подавляющее большинство из них прогнозировали сокрушительную победу кандидата от демократической партии Хиллари Клинтон. Как же они ошибались.
Давайте сравним эту ошибку с кризисом субстандартного ипотечного кредитования. Можно было бы утверждать, что мы многому научились и что интерес к науке о данных должен был бы позволить избежать ошибок прошлого. Действительно, начиная с 2008 года, новостные организации стали нанимать дата-сайентистов, вкладывать средства в проведение опросов общественного мнения, формировать команды аналитиков и тратить большое количество денег на сбор качественных данных.
Что же произошло, учитывая все это время, деньги, усилия и образование?[4]
Наша гипотеза
Почему возникают подобные проблемы с данными? Мы видим три причины: сложность проблемы, недостаток критического мышления и плохая коммуникация.Во-первых (как мы уже говорили), работа с данными зачастую очень сложна. Даже при наличии большого количества данных, подходящих инструментов, методик и умнейших аналитиков случаются ошибки. Прогнозы могут и будут оказываться ошибочными. И это не критика данных и статистики. Такова реальность.
Во-вторых, некоторые аналитики и заинтересованные стороны перестали критически относиться к проблемам данных. Промышленный комплекс науки о данных в своем высокомерии нарисовал картину уверенности и простоты, и некоторые люди на нее --">Книги схожие с «Разберись в Data Science. Как освоить науку о данных и научиться думать как эксперт» по жанру, серии, автору или названию:
К. Дж. Дейт - SQL и реляционная теория. Как грамотно писать код на SQL Жанр: Базы данных Год издания: 2010 Серия: Бестселлеры o’reilly |
Джон Дакетт - PHP и MYSQL. Серверная веб-разработка Жанр: Базы данных Серия: Мировой компьютерный бестселлер |
Кори Альтхофф - Сам себе программист. Как научиться программировать и устроиться в Ebay? Жанр: Поиск работы, карьера Год издания: 2018 Серия: Мировой компьютерный бестселлер |
Другие книги из серии «Мировой компьютерный бестселлер»:
Дон Джонс - Soft skills для IT-специалистов. Прокачай карьеру и получи работу мечты Жанр: Корпоративная культура Год издания: 2022 Серия: Мировой компьютерный бестселлер |
Рауль-Габриэль Урма, Ричард Уорбертон - Гид Java-разработчика : проектно-ориентированный подход Жанр: Java, Java Script Год издания: 2022 Серия: Мировой компьютерный бестселлер |
Роберт Шаффлботэм - Photoshop CC для начинающих Жанр: Графика. Дизайн. Мультимедиа Год издания: 2017 Серия: Мировой компьютерный бестселлер |
Эл Свейгарт - Учим Python, делая крутые игры Жанр: Программирование игр Год издания: 2022 Серия: Мировой компьютерный бестселлер |