Trinity
Администратор
- Регистрация
- 10.07.21
- Сообщения
- 31.580
- Реакции
- 446.452
[Udemy] Alexander Hagmann - Наука о данных Python с Pandas. Освойте 12 продвинутых проектов (2021)
Чему вы научитесь
Добро пожаловать на первый продвинутый и проектный курс по науке о данных Pandas!
Этот курс начинается там, где заканчиваются многие другие курсы : вы можете написать код Pandas, но вы все еще боретесь с реальными проектами, потому что
Этот курс охватывает полный рабочий процесс обработки данных AZ:
Для кого этот курс:
Чему вы научитесь
- Расширенные рабочие процессы с данными из реального мира с помощью Pandas вы не найдете ни в одном другом курсе.
- Параллельная работа с Pandas и SQL-базами данных (лучшее из двух миров)
- Работа с API, JSON и Pandas для импорта больших наборов данных из Интернета
- Доведение Pandas до предела (и за его пределами ...)
- Приложение для машинного обучения: прогнозирование цен на недвижимость
- Финансовые приложения: бэктестинг и форвардное тестирование инвестиционных стратегий + отслеживание индексов
- Разработка функций, стандартизация, фиктивные переменные и выборка с помощью Pandas
- Работа с большими наборами данных (миллионы строк / столбцов)
- Работа с полностью беспорядочными / нечистыми наборами данных (стандартный случай в реальном мире)
- Обработка строковых и вложенных данных JSON с помощью Pandas
- Загрузка данных из баз данных (SQL) в Pandas и наоборот
- Загрузка данных JSON в Pandas и наоборот
- Веб-парсинг с пандами
- Очистка больших и беспорядочных наборов данных (миллионы строк / столбцов)
- Работа с API и пакетами Python Wrapper для импорта больших наборов данных из Интернета
- Пояснительный анализ данных с большими наборами реальных данных
- Расширенная визуализация с Matplotlib и Seaborn
- Вы должны быть знакомы с Python (Стандартная библиотека, Numpy, Matplotlib)
- Вы должны были раньше работать с Pandas (по крайней мере, вы должны знать основы)
- Настольный компьютер (Windows, Mac или Linux), способный хранить и запускать Anaconda. Курс проведет вас через установку необходимого бесплатного программного обеспечения.
- Подключение к Интернету для потоковой передачи HD-видео.
- Некоторые математические навыки на уровне средней школы были бы отличными (не обязательно, но это помогает)
Добро пожаловать на первый продвинутый и проектный курс по науке о данных Pandas!
Этот курс начинается там, где заканчиваются многие другие курсы : вы можете написать код Pandas, но вы все еще боретесь с реальными проектами, потому что
- Реальные данные обычно не предоставляются в одном или нескольких текстовых файлах / файлах Excel -> более продвинутые методы импорта данных. требуются
- Реальные данные большие, неструктурированные, вложенные и нечистые -> более продвинутые методы обработки данных и анализа / визуализации требуются данных
- многие простые в использовании методы Pandas лучше всего работают с относительно небольшими и чистыми наборами данных -> для реальных наборов данных требуется больше общего кода (включая другие библиотеки / модули)
Этот курс охватывает полный рабочий процесс обработки данных AZ:
- Импорт (сложных и вложенных) данных из JSON файлов .
- Импортируйте (сложные и вложенные) данные из Интернета с помощью веб-API , JSON и пакетов Wrapper .
- Импорт (сложных и вложенных) данных из баз данных SQL .
- Хранить (сложные и вложенные) данные в JSON файлах .
- Хранить (сложные и вложенные) данные в данных базах SQL .
- Работайте с Pandas и базами данных SQL параллельно (используя лучшее из обоих миров).
- Эффективно импортируйте и объединяйте данные из множества текстовых / CSV-файлов .
- Очистите большие и беспорядочные наборы данных с помощью более общего кода .
- Очищайте, обрабатывайте и выравнивайте вложенные и строковые данные в DataFrames.
- Знайте, как обрабатывать и нормализовать строки Unicode .
- объединяйте и объединяйте Эффективно множество наборов данных.
- Масштабирование и автоматизация объединения данных.
- Пояснительный анализ данных и представление данных с помощью расширенных инструментов визуализации (расширенные Matplotlib и Seaborn).
- Проверьте пределы производительности Pandas с расширенными функциями агрегирования и группировки данных .
- Предварительная обработка данных и разработка функций для машинного обучения с помощью простого кода Pandas.
- Используйте свои данные 1. Обучите и протестируйте модели машинного обучения на предварительно обработанных данных и проанализируйте результаты.
- Используйте свои данные 2: бэктестирование и форвардное тестирование инвестиционных стратегий (стек финансов и инвестиций).
- Используйте свои данные 3: отслеживание индекса (стек финансов и инвестиций).
- Используйте свои данные 4. Представьте свои данные с помощью Python в красивом формате HTML (качество веб-сайта).
- и многое другое ...
Для кого этот курс:
- Всем, кто действительно хочет освоить большие, беспорядочные и нечистые наборы данных.
- Каждый, кто хочет улучшить свои навыки, от «Я могу написать код Pandas» до «Я могу освоить свои проекты данных реального слова с Pandas»
- Специалисты по данным
- Специалисты по машинному обучению
- Специалисты в области финансов и инвестиций
- Исследователи
Скачать:Для просмотра ссылок необходимо выполнить Вход или Регистрация
Для просмотра скрытого содержимого вы должны войти или зарегистрироваться.