Технологии

Четыре типа машинного обучения

5 Октября 2022
Четыре типа машинного обучения

Машинное обучение — это область искусственного интеллекта, где алгоритмы выявляют закономерности в данных, которые затем используются для точных прогнозов или для выполнения заданной задачи (например, для фильтрации спам-писем). Процесс, основанный на алгоритмах и статистических моделях для выявления закономерностей в данных, не требует последовательного или явного программирования. Затем он дополнительно оптимизируется путём проб и ошибок и обратной связи, что означает, что машины учатся на опыте и большем доступе к данным, почти так же, как это делают люди.

Сегодня машинное обучение стало популярным инструментом, используемым в ряде отраслей, от банковского дела и страхования, где оно выявляет мошенничества, до здравоохранения, розничного маркетинга и прогнозирования тенденций на рынке жилья и других рынках.

1• Контролируемое обучение — это машинное обучение с участием человека. При контролируемом обучении помеченные входные и выходные данные постоянно передаются и повторно передаются в обученные человеком системы, которые предлагают руководство в реальном времени, при этом точность прогнозов повышается после ввода в систему каждого нового набора данных. Одна из самых популярных форм машинного обучения – обучение с учителем – требует значительного вмешательства человека в данные, в отношении которых система может быть не уверена, а также огромных объёмов данных для создания точных прогнозов, что ограничивает его использование.

Обучение с учителем, как и каждый из прочих типов машинного обучения, служит зонтиком для конкретных алгоритмов и статистических моделей. Вот некоторые из них, которые подпадают под контролируемое обучение:

Алгоритмы классификации, используемые для дальнейшей категоризации данных — подумайте о надоедливом спаме и безжалостных маркетинговых электронных письмах — являются отличным инструментом для сортировки и даже сокрытия этих данных. Под широким зонтиком алгоритмов классификации существует ещё более узкое подмножество конкретных алгоритмов машинного обучения, таких как алгоритмы классификатора Байеса, метода опорных векторов, деревья решений и модели случайного леса, которые используются для сортировки данных.

Когда дело доходит до прогнозирования тенденций, таких как цены на рынке жилья, популярными инструментами становятся алгоритмы регрессии. Эти алгоритмы определяют отношения между результатами и другими независимыми переменными, чтобы делать точные прогнозы. Алгоритмы линейной регрессии используются наиболее широко, но другие часто используемые алгоритмы регрессии включают логистическую регрессию, гребневую регрессию и регрессию лассо.

2• При неконтролируемом обучении необработанные данные, которые не помечены, обрабатываются системой, что означает меньше работы для людей.

Алгоритмы обучения без учителя работают, выявляя шаблоны в наборе данных, группируя информацию на основе сходств и различий, что полезно, когда вы не уверены, что надо искать, хотя результаты и прогнозы менее точны, чем при обучении с учителем. Неконтролируемое обучение особенно полезно для сегментации клиентов и аудитории, а также для выявления закономерностей в записанных аудио- и графических данных.

Алгоритмы кластеризации являются наиболее широко используемым примером машинного обучения без учителя. Эти алгоритмы сосредотачиваются на сходстве необработанных данных, а затем соответствующим образом группируют эту информацию. Проще говоря, эти алгоритмы обеспечивают структуру необработанных данных. Алгоритмы кластеризации часто используются с маркетинговыми данными для сбора информации о клиентах (или потенциальных клиентах), а также для обнаружения мошенничества.

3• Полуконтролируемое обучение предлагает сбалансированное сочетание как контролируемого, так и неконтролируемого обучения. При таком обучении используется гибридный подход, когда небольшие объёмы помеченных данных обрабатываются вместе с большими фрагментами необработанных данных. Эта стратегия, по сути, дает алгоритмам преимущество, когда дело доходит до выявления соответствующих шаблонов и создания точных прогнозов по сравнению с алгоритмами обучения без учителя, без затрат времени, усилий и затрат, связанных с более трудоёмкими алгоритмами обучения с учителем.

4• При обучении с подкреплением компьютерные программы на базе ИИ, оснащённые датчиками, обычно называемыми интеллектуальными агентами, реагируют на окружающую их среду — подумайте о симуляциях, компьютерных играх и реальном мире — для независимого принятия решений, которые достигают желаемого результата. Воспринимая и взаимодействуя с окружающей средой, интеллектуальные агенты учатся методом проб и ошибок, в конечном итоге достигая оптимального мастерства за счёт положительного подкрепления или вознаграждения в процессе обучения. Обучение с подкреплением часто используется в робототехнике, помогая роботам приобретать определённые навыки и модели поведения.

Вот некоторые из алгоритмов, которые подпадают под обучение с подкреплением:

Q-обучение — это алгоритм обучения с подкреплением, который не требует модели среды интеллектуального агента. Алгоритмы Q-обучения рассчитывают ценность действий на основе вознаграждений, полученных в результате этих действий, для улучшения результатов и поведения.

Глубокое обучение с подкреплением, используемое при разработке самоуправляемых автомобилей, видеоигр и роботов, сочетает в себе глубокое обучение — машинное обучение на основе искусственных нейронных сетей — с обучением с подкреплением, когда действия или реакции на среду искусственной нейронной сети либо вознаграждаются, либо наказываются. При глубоком обучении с подкреплением требуются огромные объёмы данных и повышенная вычислительная мощность.


Подписывайтесь на журнал «Вестник ГЛОНАСС» и навигационный Telegram-канал

Источник: По материалам Built
Короткая ссылка:  vestnik-glonass.ru/~WrJyN
29.08.2025
Компания SpaceX раскритиковала предложение штата Вирджиния о предоставлении федерального гранта на развитие широкополосной связи. В письме, направленном правительству штата, компания назвала это предложение «крупной тратой средств федеральных налогоплательщиков» и обвинила Вирджинию в несправедливом отклонении их предложения по спутниковому интернет-сервису Starlink.
27.08.2025
Беспилотники приносят всё больше проблем: они поджигают энергетические объекты, выводят из строя предприятия, вызывают заторы на железных дорогах и коллапсы в аэропортах. Какие способы защиты существуют? И реальна ли в принципе стопроцентная защита? На эти и другие вопросы «Российской газете» ответила заместитель директора НИИ «Вектор» (входит в «Росэл» Госкорпорации Ростех) Наталия Котляр.
25.08.2025
В Московском авиационном институте создана технология передачи данных и видеосигнала в реальном времени с беспилотного воздушного судна (БВС) на наземный пункт управления через сети мобильной связи 4G (LTE). Это позволяет оператору полностью контролировать параметры полёта, местоположение и техническое состояние дрона даже на больших расстояниях.
22.08.2025
Компания Infinite Orbits и Министерство обороны Франции подписали рамочное соглашение о запуске микроспутника наблюдения на геостационарной орбите (ГСО) для Французского космического командования. Запуск спутника Orbit Guard, о котором было объявлено во вторник, запланирован на 2027 год.

СТАТЬИ ГЛОНАСС

Киберугрозы как реальность сегодняшнего дня
В 2024 году в нашей стране было зарегистрировано более 765 тысяч правонарушений, совершённых с применением информационно-телекоммуникационных технологий, что составляет приблизительно 40% от общего объёма преступлений. Такие данные приводит новостной сайт Центра международной торговли со ссылкой на МВД РФ. В этом году их будет зарегистрировано ещё больше – можно ни разу не сомневаться. Цифровизация проникла во все сферы деятельности, сделав нашу жизнь продвинутой и комфортной – мы привыкли мгновенно оплачивать всё что хочешь через банковские приложения, управлять бизнесом в облаке, общаться в социальных сетях и одним кликом скупать содержимое маркетплейсов. Увы – вслед за этими удобствами идут массовые утечки персональных данных, промышленный шпионаж, репутационные риски, угрозы национальной безопасности и пр. Это не только экономические потери, но и серьёзные вызовы для государственного суверенитета и общественного доверия к цифровым системам.