Ресурсы для обучения Data Science

Теги:
  • Образование / Работа в ИТ

Благодаря Data Science мы можем контролировать взлёты и посадки в самых больших аэропортах, можем анализировать и прогнозировать появление эпидемий без врачей. Благодаря не только современной технике, но и тем обученным программам, которые в ней установлены, доктора могут практически безошибочно ставить сложные диагнозы в некоторых отраслях медицины. Более того, у нас даже есть беспилотный транспорт и с каждым годом он лучше и умнее! Предлагаем вам не оставаться в стороне от такой интересной и перспективной науки и стать на сторону её развития.

 

resursy-dlya-obucheniya-data-science

 

Ядро науки о данных

Программа дополнительного образования от Udacity «DataAnalyst» (платно и на английском).

Если у вас есть желание подстроить программу образования под себя, то это будет бесплатно. Предлагаем следующую последовательность бесплатных курсов, входящих в программу выше:

  1. Введение в инференциальную статистику;
  2. Введение в описательную статистику;
  3. Введение в аналитическую обработку данных (с применением NumPy и Pandas);
  4. Введение в первичную обработку данных;
  5. SQL для аналитической обработки данных;
  6. MongoDB для аналитической обработки данных (при возможности и желании можно изучить аналитическую обработку данных с помощью языка R.);
  7. Введение в Машинное обучение;
  8. Визуализация данных и работа с D3.js;
  9. A/B тестирование.

 

Дополнительные курсы на русском языке

 

Машинное обучение

  1. Введение в машинное обучение;
  2. Обучение работе с TensorFlow с применением в реальных приложениях;
  3. Машинное обучение и масштабирование;
  4. Нейронные сети и машинное обучение.

 

Разработка программного обеспечения

Python

  1. Тестирование и отладка;
  2. Использование Git и GitHub для контроля версий;
  3. Создание реактивных аналитических веб-приложений на Python (статья).

 

R

Разработка программного обеспечения на R (ниже перечислены отдельные курсы, входящие в состав программы по обучению разработке программного обеспечения на языке R).

  1. Программное окружение и R;
  2. Продвинутый уровень написания программ на R;
  3. Сборка пакетов на R;
  4. Сборка инструментов визуализации данных.

 

Дополнительные материалы

  1. Введенние в Hadoop и MapReduce;
  2. Python как инструмент доступа к веб-данным.
  3. Dataquest

    Для кого этот курс: для новичков в Data Science — включая тех, кому большие данные необходимы для работы над бизнес-проектами. При выборе программы студент должен определить, насколько ему знаком Python.

  4. «Введение в машинное обучение» от «Яндекса» и ВШЭ на Coursera.
    Для кого этот курс: для тех, кого не пугают слова «матрица», «вектор» и «производная». Для выполнения практических заданий потребуются базовые навыки программирования. Очень желательно знать Python. Задания рассчитаны на использование этого языка и его библиотек numpy, pandas и scikit-learn.
    Чтобы успешно завершить курс, нужно набрать проходную сумму баллов за тесты и практические задания, а также выполнить финальный проект, посвящённый решению прикладной задачи анализа данных.

Не обязательно пытаться освоить всё и сразу. Есть мнение, что для Data Scientist’a достаточно знать только Python, а без R можно обойтись. Другие считают наоборот. В любом случае, пробуйте, выбирайте то, что вам ближе и у вас несомненно всё получится.

 

Источники tproger.ru и rb.ru

 

Вступай в сообщества ITmentor Вконтакте, Facebook и Telegram

 

Опубликован: 30-08-2018 7953 Поделиться: