Trinity
Администратор
- Регистрация
- 10.07.21
- Сообщения
- 31.305
- Реакции
- 440.292
[Udemy] Python 2023 для машинного обучения: пошаговое руководство (2023)
Добро пожаловать на наш курс «Проекты машинного обучения»! Этот курс предназначен для тех, кто хочет получить практический опыт разработки и внедрения моделей машинного обучения. На протяжении всего курса вы изучите концепции и методы, необходимые для создания и оценки моделей машинного обучения с использованием реальных наборов данных.
Мы рассмотрим основы машинного обучения, включая обучение с учителем и без учителя, а также типы проблем, которые можно решить с помощью этих методов. Вы также узнаете об общих алгоритмах машинного обучения, таких как линейная регрессия, k-ближайших соседей и деревья решений.
Лекции по основам машинного обучения
Ускоренный курс Python: это курс начального уровня, который разработан, чтобы помочь учащимся быстро освоить основы языка программирования Python.
Numpy: это библиотека на Python, обеспечивающая поддержку больших многомерных массивов однородных типов данных и большую коллекцию высокоуровневых математических функций для работы с этими массивами.
Pandas: это библиотека на Python, которая предоставляет простые в использовании структуры данных и инструменты анализа данных. Он построен на основе Numpy и широко используется для очистки, преобразования и обработки данных.
Matplotlib: это библиотека для построения графиков на Python, которая предоставляет широкий спектр инструментов визуализации и поддержку различных типов графиков. Он широко используется для исследования и визуализации данных.
Seaborn: это библиотека, построенная на основе Matplotlib, которая предоставляет API более высокого уровня для более простого и привлекательного построения графиков. Он широко используется для визуализации статистических данных.
Plotly: это библиотека с открытым исходным кодом на Python, которая обеспечивает интерактивную и сетевую визуализацию. Он поддерживает широкий спектр графиков и широко используется для создания интерактивных информационных панелей и визуализации данных для Интернета.
Модели машинного обучения, рассматриваемые в этом курсе
Линейная регрессия: алгоритм контролируемого обучения, используемый для прогнозирования непрерывной целевой переменной на основе набора независимых переменных. Он предполагает линейную зависимость между независимыми и зависимыми переменными.
Логистическая регрессия: алгоритм обучения с учителем, используемый для прогнозирования бинарного результата на основе набора независимых переменных. Он использует логистическую функцию для моделирования вероятности результата.
Деревья решений: контролируемый алгоритм обучения, который использует древовидную модель решений и их возможных последствий. Он часто используется для задач классификации и регрессии.
Случайный лес: алгоритм контролируемого обучения, который объединяет несколько деревьев решений для повышения точности и стабильности прогнозов. Это метод ансамбля, который уменьшает переоснащение и улучшает обобщение модели.
Машина опорных векторов (SVM): алгоритм обучения с учителем, используемый для задач классификации и регрессии. Он находит наилучшую границу (или гиперплоскость), которая разделяет разные классы данных.
K-ближайшие соседи (KNN): алгоритм обучения с учителем, используемый для задач классификации и регрессии. Он находит k ближайших точек к новой точке данных и классифицирует их на основе мажоритарного класса k ближайших точек.
Настройка гиперпараметров: это процесс систематического поиска наилучшего сочетания гиперпараметров для модели машинного обучения. Он используется для оптимизации производительности модели и предотвращения переобучения путем поиска оптимального набора параметров, которые хорошо работают с невидимыми данными.
AdaBoost: алгоритм контролируемого обучения, который адаптируется к данным путем корректировки весов наблюдений. Это метод ансамбля, который используется для задач классификации.
XGBoost: алгоритм обучения с учителем, который является расширением алгоритма повышения градиента. Он широко используется в соревнованиях Kaggle и отраслевых проектах.
CatBoost: алгоритм контролируемого обучения, предназначенный для эффективной обработки категориальных переменных.
Неконтролируемые модели
Алгоритмы кластеризации можно разделить на три типа: на основе центроидов, на основе плотности и иерархические. Алгоритмы кластеризации на основе центроида, такие как k-mean, группируют точки данных на основе их близости к центроиду или центральной точке. Алгоритмы кластеризации на основе плотности, такие как DBSCAN, группируют точки данных на основе их плотности в пространстве признаков. Алгоритмы иерархической кластеризации, такие как Agglomerative и Divisive, строят иерархию кластеров путем итеративного слияния или разделения кластеров.
K-Means: алгоритм кластеризации на основе центроида, который группирует точки данных на основе их близости к центроиду. Он широко используется для кластеризации больших наборов данных.
DBSCAN: алгоритм кластеризации на основе плотности, который группирует точки данных на основе их плотности в пространстве признаков. Это полезно для идентификации кластеров произвольной формы.
Иерархическая кластеризация: алгоритм, который строит иерархию кластеров путем итеративного объединения или разделения кластеров. Он может носить агломеративный или разделительный характер.
Спектральная кластеризация: алгоритм кластеризации, который находит кластеры, используя собственные векторы матрицы подобия данных.
Принципы
Материал на английском языке
Подробнее:
Добро пожаловать на наш курс «Проекты машинного обучения»! Этот курс предназначен для тех, кто хочет получить практический опыт разработки и внедрения моделей машинного обучения. На протяжении всего курса вы изучите концепции и методы, необходимые для создания и оценки моделей машинного обучения с использованием реальных наборов данных.
Мы рассмотрим основы машинного обучения, включая обучение с учителем и без учителя, а также типы проблем, которые можно решить с помощью этих методов. Вы также узнаете об общих алгоритмах машинного обучения, таких как линейная регрессия, k-ближайших соседей и деревья решений.
Лекции по основам машинного обучения
Ускоренный курс Python: это курс начального уровня, который разработан, чтобы помочь учащимся быстро освоить основы языка программирования Python.
Numpy: это библиотека на Python, обеспечивающая поддержку больших многомерных массивов однородных типов данных и большую коллекцию высокоуровневых математических функций для работы с этими массивами.
Pandas: это библиотека на Python, которая предоставляет простые в использовании структуры данных и инструменты анализа данных. Он построен на основе Numpy и широко используется для очистки, преобразования и обработки данных.
Matplotlib: это библиотека для построения графиков на Python, которая предоставляет широкий спектр инструментов визуализации и поддержку различных типов графиков. Он широко используется для исследования и визуализации данных.
Seaborn: это библиотека, построенная на основе Matplotlib, которая предоставляет API более высокого уровня для более простого и привлекательного построения графиков. Он широко используется для визуализации статистических данных.
Plotly: это библиотека с открытым исходным кодом на Python, которая обеспечивает интерактивную и сетевую визуализацию. Он поддерживает широкий спектр графиков и широко используется для создания интерактивных информационных панелей и визуализации данных для Интернета.
Модели машинного обучения, рассматриваемые в этом курсе
Линейная регрессия: алгоритм контролируемого обучения, используемый для прогнозирования непрерывной целевой переменной на основе набора независимых переменных. Он предполагает линейную зависимость между независимыми и зависимыми переменными.
Логистическая регрессия: алгоритм обучения с учителем, используемый для прогнозирования бинарного результата на основе набора независимых переменных. Он использует логистическую функцию для моделирования вероятности результата.
Деревья решений: контролируемый алгоритм обучения, который использует древовидную модель решений и их возможных последствий. Он часто используется для задач классификации и регрессии.
Случайный лес: алгоритм контролируемого обучения, который объединяет несколько деревьев решений для повышения точности и стабильности прогнозов. Это метод ансамбля, который уменьшает переоснащение и улучшает обобщение модели.
Машина опорных векторов (SVM): алгоритм обучения с учителем, используемый для задач классификации и регрессии. Он находит наилучшую границу (или гиперплоскость), которая разделяет разные классы данных.
K-ближайшие соседи (KNN): алгоритм обучения с учителем, используемый для задач классификации и регрессии. Он находит k ближайших точек к новой точке данных и классифицирует их на основе мажоритарного класса k ближайших точек.
Настройка гиперпараметров: это процесс систематического поиска наилучшего сочетания гиперпараметров для модели машинного обучения. Он используется для оптимизации производительности модели и предотвращения переобучения путем поиска оптимального набора параметров, которые хорошо работают с невидимыми данными.
AdaBoost: алгоритм контролируемого обучения, который адаптируется к данным путем корректировки весов наблюдений. Это метод ансамбля, который используется для задач классификации.
XGBoost: алгоритм обучения с учителем, который является расширением алгоритма повышения градиента. Он широко используется в соревнованиях Kaggle и отраслевых проектах.
CatBoost: алгоритм контролируемого обучения, предназначенный для эффективной обработки категориальных переменных.
Неконтролируемые модели
Алгоритмы кластеризации можно разделить на три типа: на основе центроидов, на основе плотности и иерархические. Алгоритмы кластеризации на основе центроида, такие как k-mean, группируют точки данных на основе их близости к центроиду или центральной точке. Алгоритмы кластеризации на основе плотности, такие как DBSCAN, группируют точки данных на основе их плотности в пространстве признаков. Алгоритмы иерархической кластеризации, такие как Agglomerative и Divisive, строят иерархию кластеров путем итеративного слияния или разделения кластеров.
K-Means: алгоритм кластеризации на основе центроида, который группирует точки данных на основе их близости к центроиду. Он широко используется для кластеризации больших наборов данных.
DBSCAN: алгоритм кластеризации на основе плотности, который группирует точки данных на основе их плотности в пространстве признаков. Это полезно для идентификации кластеров произвольной формы.
Иерархическая кластеризация: алгоритм, который строит иерархию кластеров путем итеративного объединения или разделения кластеров. Он может носить агломеративный или разделительный характер.
Спектральная кластеризация: алгоритм кластеризации, который находит кластеры, используя собственные векторы матрицы подобия данных.
Принципы
Материал на английском языке
Подробнее:
Скачать:Для просмотра ссылок необходимо выполнить Вход или Регистрация
Для просмотра скрытого содержимого вы должны войти или зарегистрироваться.