Кар'єра, Новини, Студенту, Технології

Хочу стати дата-сайентістом. Що потрібно робити?

28 Липня, 2020

Data Science – одна з найперспективніших і популярних сфер для зміни професії та додаткової освіти. Якщо ви теж хочете долучитися до світу даних, але не знаєте, з чого почати, ми ділимося докладним Data Science-гідом.

Що таке Data Science

Data Science – це наука про те, як працювати з великими даними, аналізувати їх і знаходити корисні взаємозв’язки, які потім можна використовувати для самих різних завдань.

Сьогодні Data Science використовують практично скрізь. Найпростіший приклад – онлайн-маркети на кшталт Ozon: магазин радить нам, що купити, аналізуючи наші попередні покупки або перегляди. Так само працюють плейлисти на Spotify. Ще один варіант – пошук за зображенням: якщо дівчина побачила десь класні туфлі, вона може сфотографувати їх і завантажити знімок в пошуковик. Комп’ютерний зір розпізнає об’єкт і запропонує схожі варіанти.

Де можна працювати

В Data Science, як і в інших сферах, є різні напрямки та спеціальності. Хтось займається рекомендаційними системами для Netflix, хтось – комп’ютерним зором для Google, а хтось – роботою з текстом для онлайн-перекладачів. Автоматизувати процеси можна майже скрізь, тому дата-сайентіст може працювати в різноманітних компаніях.

Що конкретно потрібно вміти

Є загальний набір навичок, якими повинен володіти кожен дата-сайентіст – шість скілів та три програми. Уже освоївши їх, можна вибрати якийсь напрямок або спеціалізацію.

Навички:

  1. Робота з даними
  2. Візуалізація даних
  3. Програмування на Python
  4. Теорія ймовірностей і математична статистика
  5. Машинне навчання
  6. Глибоке навчання

Програми:

  1. Apache Spark
  2. Hadoop
  3. SQL

Чи обов’язково вчити Python

Так, проте боятися не варто. Python – нескладна мова, в бібліотеках коду є багато прикладів для різних завдань. Її дуже зручно використовувати. З Python справляються всі, тим більше на базовому рівні.

Чи буде потрібна англійська

В Україні можна працювати в Data Science, не знаючи англійську. З перекладачем можна гори підкорити. Однак англійською мовою виходять ключові статті про нові моделі та методи, тому для поновлення знань вона іноді буде потрібна. Що стосується програм для роботи, їх інтерфейс не складніший звичного Microsoft Word – навіть англійською проблеми навряд чи виникнуть.

Скільки можна заробляти

Data Science – область високих зарплатних очікувань. Насправді робота дата-сайентістов дійсно добре оплачується.

Де і як можна вчитися

Багато людей хочуть самостійно увійти в Data Science без бекграунду в математиці та програмуванні. Це можливо, майже всі матеріали можна самому знайти в інтернеті. Однак без досвіду в цій сфері дуже важко побудувати програму навчання, яка охопить всі важливі етапи. Високий ризик, що якісь теми будуть втрачені, і це відіб’ється на пошуку роботи.

Якщо піти класичним шляхом, стати дата-сайентістом можна, закінчивши університет. Однак для дорослих людей цей шлях не підходить, тому що поєднувати навчання і повний робочий день виходить украй рідко. Інший варіант – очні та онлайн-курси, до вибору яких потрібно ставитися дуже уважно.

Скільки коштує навчання

Ціни на університетські програми по роботі з даними можуть коштувати сотні тисяч гривень. Звичайно, можна вступити на бюджетне місце або освоювати Data Science самостійно, за допомогою безкоштовних курсів на Coursera та інших доступних матеріалів. Але в другому варіанті немає людського контролю і фідбеку викладача. Онлайн-курс – відмінна альтернатива: справедлива ціна та всі необхідні для роботи знання.

Де ще можна потренуватися

Щоб отримати ще більше практики, можна зайти на Kaggle – це платформа, де проходять змагання з машинного навчання. Компанія ставить дата-сайентістам завдання, і той, хто швидше і краще вирішить, – отримує грошову винагороду і, можливо, роботу. Плюс, Kaggle дуже добре показує потреби ринку і показує, за що компанії готові платити.

Що запитають при влаштуванні на роботу

На етапі резюме попросять показати портфоліо: його можна зробити на програмістському порталі Github – він також підходить для дата-сайентістов. На самій співбесіді будьте готові до таких питань:

SQL, або як писати запити до великих даних: наприклад, я хочу вибрати з таблиці тільки людей старших 1998 року народження. Як це зробити?

Кілька питань про машинне і глибоке навчання: які є моделі та метрики, і як вони працюють?

Бекграунд: попросять розповісти про минулі проєкти.

Бонусом можуть додати математичну задачку і питання зі специфіки роботи.

Що я буду робити щодня

В основному працювати за комп’ютером і ходити на командні переговори. Data Science-завдання виконуються приблизно за одним сценарієм: компанія розповідає, що їй потрібно отримати, від запиту бізнесу потрібно перейти до реальної постановки завдання на рівні математики та аналізу даних. Потім потрібно зібрати та проаналізувати дані, обробити їх і побудувати модель – математичний алгоритм, який зможе розв’язувати задачу. Наступний етап – навчання моделі та оцінка якості: потрібно перевірити, що все стабільно працює протягом довгого часу. Тільки після цього ми впроваджуємо модель і закриваємо проєкт. Над одним завданням можна працювати майже рік – це досить довгий процес.

Кому така робота підійде найбільше

Люди з різноманітних сфер можуть приходити на курси: інженери, політологи, хіміки – і для всіх знаходяться цікаві завдання, які якось переплітаються з їх бекграундом. Не можна займатися Data Science в фінансах, якщо у тебе немає знань в цій сфері: помилка через незнання специфіки може дуже дорого коштувати. Тому найкраща рекомендація – знайти роботу, яка перегукується з попереднім досвідом.

Перспективи професії

Вважається, що кожна нова технологія проходить п’ять основних стадій: тригер-інновація, пік роздутих очікувань, природне падіння, новий розвиток і плато. Data Science же відразу стала реально працювати на бізнес. Ця сфера активно розвивається і не збирається здавати позиції. Поріг входу в професію постійно підвищується, а завдань стає все більше.

Data Science може вирішити безліч проблем, зробити життя людства набагато кращим і зручнішим. Однак новачкам потрібно морально підготуватися, що вчити доведеться досить багато. Зате потім у вас буде відмінна професія – з перспективами зростання і сталого розвитку.

Читайте «Український Спектр» у Facebook.

Український Спектр Читайте «Український Спектр» у Telegram
«Український Спектр» в Telegram – коротко про головне один раз на день
Підписатись на канал

Ми у соцмережах:

Слідкуйте за UAspectr у Facebook або ж читайте усе найцікавіше у нашому каналі в Telegram