Четыре типа машинного обучения

Машинное обучение — это область искусственного интеллекта, где алгоритмы выявляют закономерности в данных, которые затем используются для точных прогнозов или для выполнения заданной задачи (например, для фильтрации спам-писем). Процесс, основанный на алгоритмах и статистических моделях для выявления закономерностей в данных, не требует последовательного или явного программирования. Затем он дополнительно оптимизируется путём проб и ошибок и обратной связи, что означает, что машины учатся на опыте и большем доступе к данным, почти так же, как это делают люди.
Сегодня машинное обучение стало популярным инструментом, используемым в ряде отраслей, от банковского дела и страхования, где оно выявляет мошенничества, до здравоохранения, розничного маркетинга и прогнозирования тенденций на рынке жилья и других рынках.
1• Контролируемое обучение — это машинное обучение с участием человека. При контролируемом обучении помеченные входные и выходные данные постоянно передаются и повторно передаются в обученные человеком системы, которые предлагают руководство в реальном времени, при этом точность прогнозов повышается после ввода в систему каждого нового набора данных. Одна из самых популярных форм машинного обучения – обучение с учителем – требует значительного вмешательства человека в данные, в отношении которых система может быть не уверена, а также огромных объёмов данных для создания точных прогнозов, что ограничивает его использование.
Обучение с учителем, как и каждый из прочих типов машинного обучения, служит зонтиком для конкретных алгоритмов и статистических моделей. Вот некоторые из них, которые подпадают под контролируемое обучение:
Алгоритмы классификации, используемые для дальнейшей категоризации данных — подумайте о надоедливом спаме и безжалостных маркетинговых электронных письмах — являются отличным инструментом для сортировки и даже сокрытия этих данных. Под широким зонтиком алгоритмов классификации существует ещё более узкое подмножество конкретных алгоритмов машинного обучения, таких как алгоритмы классификатора Байеса, метода опорных векторов, деревья решений и модели случайного леса, которые используются для сортировки данных.
Когда дело доходит до прогнозирования тенденций, таких как цены на рынке жилья, популярными инструментами становятся алгоритмы регрессии. Эти алгоритмы определяют отношения между результатами и другими независимыми переменными, чтобы делать точные прогнозы. Алгоритмы линейной регрессии используются наиболее широко, но другие часто используемые алгоритмы регрессии включают логистическую регрессию, гребневую регрессию и регрессию лассо.
2• При неконтролируемом обучении необработанные данные, которые не помечены, обрабатываются системой, что означает меньше работы для людей.
Алгоритмы обучения без учителя работают, выявляя шаблоны в наборе данных, группируя информацию на основе сходств и различий, что полезно, когда вы не уверены, что надо искать, хотя результаты и прогнозы менее точны, чем при обучении с учителем. Неконтролируемое обучение особенно полезно для сегментации клиентов и аудитории, а также для выявления закономерностей в записанных аудио- и графических данных.
Алгоритмы кластеризации являются наиболее широко используемым примером машинного обучения без учителя. Эти алгоритмы сосредотачиваются на сходстве необработанных данных, а затем соответствующим образом группируют эту информацию. Проще говоря, эти алгоритмы обеспечивают структуру необработанных данных. Алгоритмы кластеризации часто используются с маркетинговыми данными для сбора информации о клиентах (или потенциальных клиентах), а также для обнаружения мошенничества.
3• Полуконтролируемое обучение предлагает сбалансированное сочетание как контролируемого, так и неконтролируемого обучения. При таком обучении используется гибридный подход, когда небольшие объёмы помеченных данных обрабатываются вместе с большими фрагментами необработанных данных. Эта стратегия, по сути, дает алгоритмам преимущество, когда дело доходит до выявления соответствующих шаблонов и создания точных прогнозов по сравнению с алгоритмами обучения без учителя, без затрат времени, усилий и затрат, связанных с более трудоёмкими алгоритмами обучения с учителем.
4• При обучении с подкреплением компьютерные программы на базе ИИ, оснащённые датчиками, обычно называемыми интеллектуальными агентами, реагируют на окружающую их среду — подумайте о симуляциях, компьютерных играх и реальном мире — для независимого принятия решений, которые достигают желаемого результата. Воспринимая и взаимодействуя с окружающей средой, интеллектуальные агенты учатся методом проб и ошибок, в конечном итоге достигая оптимального мастерства за счёт положительного подкрепления или вознаграждения в процессе обучения. Обучение с подкреплением часто используется в робототехнике, помогая роботам приобретать определённые навыки и модели поведения.
Вот некоторые из алгоритмов, которые подпадают под обучение с подкреплением:
Q-обучение — это алгоритм обучения с подкреплением, который не требует модели среды интеллектуального агента. Алгоритмы Q-обучения рассчитывают ценность действий на основе вознаграждений, полученных в результате этих действий, для улучшения результатов и поведения.
Глубокое обучение с подкреплением, используемое при разработке самоуправляемых автомобилей, видеоигр и роботов, сочетает в себе глубокое обучение — машинное обучение на основе искусственных нейронных сетей — с обучением с подкреплением, когда действия или реакции на среду искусственной нейронной сети либо вознаграждаются, либо наказываются. При глубоком обучении с подкреплением требуются огромные объёмы данных и повышенная вычислительная мощность.
Подписывайтесь на журнал «Вестник ГЛОНАСС» и навигационный Telegram-канал