Данные — повсюду. Более того, имеющиеся объемы цифровых данных растут бешеными темпами, удваиваясь каждые два года. В статье из журнала Forbes утверждается, что ныне объемы данных растут быстрее, чем когда-либо ранее, и к 2020 году каждую секунду будет создаваться около 1,7 мегабайта новой информации на каждого человека на планете.
Data Science (наука о данных) — это сочетание статистики, математики, программирования, принятия решений, хранения данных изобретательными способами, умение по-иному смотреть на привычные вещи, а также действия по очистке, подготовке и выравниванию данных.
Простыми словами, это — эгида, под которой собраны методы для извлечения из данных ценных знаний и информации.
Наши возможности приобретать социальные и экономические выгоды на основе новосоздаваемых данных ограничиваются отсутствием соответствующего опыта. Работа з данными такого рода требует принципиально новых умений и инструментария. Корпусы данных столь объемны, что не вмещаются на одном компьютере. Их невозможно обрабатывать с помощью традиционных баз данных или статистических пакетов, невозможно представлять с помощью стандартных программ визуализации. Данные стали более разнородны, в отличие от хорошо систематизированных данных прошлых периодов. Цифровой текст, звук и видео, данные сенсоров и блогов, как правило, хаотичны, не полны и не структурированы. Часто мало что известно об их происхождении и качестве, и для получения пользы их необходимо комбинировать с другими данными. Обработка данных, созданных пользователями, также связана с непростыми вопросами приватности, безопасности и этики.
Издание |
Название статьи |
Краткое содержание |
|
Хел Вериан (Hal Varian), главный экономист Google, как-то сказал: «Сексуальной специальностью следующих 10 лет будет статистика. Люди думают, что я шучу, но кто бы мог подумать, что компьютерная инженерия станет сексуальной специальностью 90-х?» Если под «сексуальностью» понимать обладание редкими качествами, пользующимися большим спросом, то специалисты по науке о данных (data scientists) очень «сексуальны». Их трудно и дорого нанимать, а с учетом высокой конкуренции на рынке за их услуги, еще и тяжело удерживать. Просто-напросто, мало какой специалист объединяет в себе научную подготовку с вычислительными и аналитическими способностями. |
|
|
Революция данных большого объема (big data) и аналитики только начинается, и компании остро нуждаются в талантливых специалистах, которые способны помочь извлечь из их данных знания. Осознание возможных выгод будет привлекать все больше людей к карьере в области, где так остро ощущается нехватка молодой крови. |
|
mc.today |
Чтобы выгодно спланировать поездку, нужен месяц: как в tripmydream решили эту проблему |
Многие из тех, кто только поверхностно знаком со сферой туризма и продажей авиабилетов в частности, могут искренне удивиться, зачем вообще здесь Data Science (набор конкретных дисциплин из разных направлений, отвечающих за анализ данных и поиск оптимальных решений на их основе) — берешь все доступные билеты (туры, отели) и продаешь. |
IEEE Computer Society |
В данной работе я рассматриваю новосозданную профессию в отрасли IT — специалиста по науке о данных (data scientist). Вначале я рассматриваю понятия данных, информации и знаний, а также текущую классификацию профессий в отрасли IT, чтобы задать контекст для описания текущих изменений. Затем я определяю понятие данных большого объема (big data), давших толчок развитию науки о данных (data science). Наконец, я даю определение, что на сегодняшний день понимают под наукой о данных, и чем занимаются специалисты по науке о данных. |
|
|
Это случилось: специалист по науке о данных (data scientist) — лучшая работа в Америке, согласно данным пользователей онлайн системы анализа занятости Glassdoor за 2016 и 2017 годы. Сервисы Glassdoor позволяют наемным работникам анонимно оценивать свои места работы и руководителей, выставлять рейтинговые оценки уровню своей зарплаты, условиям труда, возможностям для карьерного роста. |
|
|
Высокий спрос на специалистов по науке о данных (data scientist) и статистиков объясняется неуклонно возрастающим значением сбора и оценивания существенных объемов данных. Возможности для специалистов в этих областях огромны, ведь в сфере IT, медицине, экономике, да и везде, где собирается информация о клиентах, можно с пользой обрабатывать соответствующие данные. Наука о данных (data science) — относительно молодая область, предвещающая коренную перестройку различных отраслей, от бизнеса до государственного управления, от медицины до образования. Все больше университетов открывают специальности по науке о данных. |