Перспективы Data Science

Данные — повсюду. Более того, имеющиеся объемы цифровых данных растут бешеными темпами, удваиваясь каждые два года. В статье из журнала Forbes утверждается, что ныне объемы данных растут быстрее, чем когда-либо ранее, и к 2020 году каждую секунду будет создаваться около 1,7 мегабайта новой информации на каждого человека на планете.

Data Science (наука о данных) — это сочетание статистики, математики, программирования, принятия решений, хранения данных изобретательными способами, умение по-иному смотреть на привычные вещи, а также действия по очистке, подготовке и выравниванию данных.

Простыми словами, это — эгида, под которой собраны методы для извлечения из данных ценных знаний и информации.

Наши возможности приобретать социальные и экономические выгоды на основе новосоздаваемых данных ограничиваются отсутствием соответствующего опыта. Работа з данными такого рода требует принципиально новых умений и инструментария. Корпусы данных столь объемны, что не вмещаются на одном компьютере. Их невозможно обрабатывать с помощью традиционных баз данных или статистических пакетов, невозможно представлять с помощью стандартных программ визуализации. Данные стали более разнородны, в отличие от хорошо систематизированных данных прошлых периодов. Цифровой текст, звук и видео, данные сенсоров и блогов, как правило, хаотичны, не полны и не структурированы. Часто мало что известно об их происхождении и качестве, и для получения пользы их необходимо комбинировать с другими данными. Обработка данных, созданных пользователями, также связана с непростыми вопросами приватности, безопасности и этики.

Издание

Название статьи

Краткое содержание

  Harvard Business Review

Data Scientist: The Sexiest Job of the 21st Century

Хел Вериан (Hal Varian), главный экономист Google, как-то сказал: «Сексуальной специальностью следующих 10 лет будет статистика. Люди думают, что я шучу, но кто бы мог подумать, что компьютерная инженерия станет сексуальной специальностью 90-х?»

Если под «сексуальностью» понимать обладание редкими качествами, пользующимися большим спросом, то специалисты по науке о данных (data scientists) очень «сексуальны». Их трудно и дорого нанимать, а с учетом высокой конкуренции на рынке за их услуги, еще и тяжело удерживать. Просто-напросто, мало какой специалист объединяет в себе научную подготовку с вычислительными и аналитическими способностями.

 Forbes

Is Being a Data Scientist Really the Best Job in America?

Революция данных большого объема (big data) и аналитики только начинается, и компании остро нуждаются в талантливых специалистах, которые способны помочь извлечь из их данных знания. Осознание возможных выгод будет привлекать все больше людей к карьере в области, где так остро ощущается нехватка молодой крови.

IEEE Computer Society

Data Scientist

В данной работе я рассматриваю новосозданную профессию в отрасли IT — специалиста по науке о данных (data scientist). Вначале я рассматриваю понятия данных, информации и знаний, а также текущую классификацию профессий в отрасли IT, чтобы задать контекст для описания текущих изменений. Затем я определяю понятие данных большого объема (big data), давших толчок развитию науки о данных (data science). Наконец, я даю определение, что на сегодняшний день понимают под наукой о данных, и чем занимаются специалисты по науке о данных.

 Glassdoor

50 Best Jobs in America

Это случилось: специалист по науке о данных (data scientist) — лучшая работа в Америке, согласно данным пользователей онлайн системы анализа занятости Glassdoor за 2016 и 2017 годы.

Сервисы Glassdoor позволяют наемным работникам анонимно оценивать свои места работы и руководителей, выставлять рейтинговые оценки уровню своей зарплаты, условиям труда, возможностям для карьерного роста.

 CareerCast

The Best Jobs of 2016

Высокий спрос на специалистов по науке о данных (data scientist) и статистиков объясняется неуклонно возрастающим значением сбора и оценивания существенных объемов данных. Возможности для специалистов в этих областях огромны, ведь в сфере IT, медицине, экономике, да и везде, где собирается информация о клиентах, можно с пользой обрабатывать соответствующие данные.

Наука о данных (data science) — относительно молодая область, предвещающая коренную перестройку различных отраслей, от бизнеса до государственного управления, от медицины до образования. Все больше университетов открывают специальности по науке о данных.