Site icon Новини про технології та бізнес | UAspectr

12 проектів з дата-сайенс, які можна зробити за новорічні свята

Святкові дні – привід не тільки відпочити, а й вивчити щось нове. Початківці і навіть досвідчені фахівці з data science можуть зайнятися актуальними і цікавими проєктами. Пропонуємо 12 варіантів, які відмінно підійдуть для портфоліо.

Симуляції на Pythonhttps

Вони допомагають розвивати навички в програмуванні та науці про дані. Більш того, з ними цікаво експериментувати. Симулювати можна різні сценарії і фактори – для багатьох з них буде потрібно не більше двохсот рядків коду. Наприклад, можна змоделювати пандемію і спрогнозувати обмежувальні заходи для населення.

Складність: від найлегшої до неймовірно складної.

Ви навчитеся:

Аналіз роздрібної торгівлі

Застосовувати data science та програмування можна і в бізнесі. Прогноз кількості продажів у святкові дні дозволяє зрозуміти, скільки товарів потрібно зробити. Це дуже важливо, тому що, якщо їх буде занадто багато, вони залишаться лежати на полицях, а якщо занадто мало – бізнес втратить потенційний дохід.

Складність: середня.

З чого почати:

Ви навчитеся:

Вплив пандемії на трафік аеропортів

Навички в data science можна також покращувати в реальних сценаріях. За останні дев’ять місяців пандемія сильно вплинула на наше життя, особливо на міжнародні подорожі. Проаналізувати трафік аеропорту можна за допомогою даних, зазначених нижче.

Складність: легка.

З чого почати:

Ви навчитеся:

Аналог Tweetdeck

Це інструмент, який дозволяє відстежувати взаємодії в профілі Twitter і виявляти різну інформацію в реальному часі. За допомогою API Twitter і інструменту для візуалізації, наприклад Dash або Streamlit, можна створити власну платформу для аналітики в Twitter.

Складність: середня.

З чого почати:

Ви навчитеся:

A / B-тестування для показників клікабельності (CTR)

A / B-тестування – одна з найкорисніших для бізнесу концепцій в науці про дані. Однак в силу своєї складності вона часто розуміється неправильно. Визначення показників CTR – найважливіша метрика для будь-якої компанії, в якій є команда з маркетингу. Вона допомагає оптимізувати онлайн-рекламу – від її зовнішнього вигляду до загального посилання.

Складність: середня.

З чого почати:

Завантажити набір даних для прикладу можна тут.
Дотримуйтесь цієї покрокової інструкції.

Ви навчитеся:

Рекомендаційна система

Сучасні соціальні платформи і агрегатори контенту використовують неймовірно складні алгоритми. Щоб зрозуміти, як вони працюють, можна побудувати власний.

Складність: середня та просунута.

З чого почати:

Ви навчитеся:

Веб-скрейпінг відгуків покупців

Навчитися збирати дані з сайту легко. Для прикладу можна витягти інформацію з сервісу Trustpilot, на якому представлені відгуки покупців. Ці дані дуже корисні для бізнесу: вони допомагають визначити ставлення споживачів до бренду і зрозуміти, які аспекти варто поліпшити.

Складність: легка.

З чого почати:

Ви навчитеся:

Сегментація клієнтів

Повертаємося до роздрібної аналітики. Тепер наше завдання полягає в тому, щоб згрупувати покупців за допомогою статистики і визначити сегменти, на які ви хочете націлити бізнес.

Складність: середня та просунута.

З чого почати:

Ви навчитеся:

Прогноз витрат енергії по часових рядах

Використовуйте дані про споживання енергії з сайту регіональної організації США PJM. З їх допомогою можна побудувати модель часових рядів, щоб прогнозувати енергетичну витрату. Крім того, ці дані стануть в нагоді, щоб виявити тенденції витрат за часом доби, свят і більш тривалих термінів.

Складність: середня та просунута.

З чого почати:

Прогнозування цін на акції

Припустимо, ви хочете дізнатися, чи будуть зростати акції Tesla. Передбачити цінову траєкторію можна, використовуючи прогноз часових рядів. Бібліотека Prophet від Facebook значно спростить цю задачу.

Складність: середня.

З чого почати:

Ви навчитеся:

Прогнозування лайків в Instagram

Не можете вибрати, яку фотографію опублікувати в Instagram, щоб вона отримала більше позитивних оцінок? Прийняти рішення допоможе data science.

Ви можете створити модель прогнозування на основі декількох факторів, таких як використовувані хештеги, довжина опису і кількість зображень в каруселі. Потім протестуйте свої ідеї на цій моделі, відстежте результати і виявіть відповідний формат, який, швидше за все, збере найбільше лайків. Цей проєкт також підходить тим, хто зацікавлений в машинному навчанні.

Складність: складна.

З чого почати:

Ви навчитеся:

Порівнювач резюме і опису вакансії

З його допомогою можна визначити, наскільки близько резюме підходить до опису вакансії. Щоб його створити, скористаємося техніками NLP, наприклад латентно-семантичним аналізом.

З чого почати:

Ви навчитеся:

 

Exit mobile version