Деякий час тому менi стало цiкаво ознайомитися з технологiями машинного навчання.
Протягом тривалого перiоду я чув про шаленi вiдкриття та досягнення у цьому напрямi науки до яких можна вiднести малювання комп'ютером картин-шедеврiв, розпiзнавання зображень та звуку.
Цього року азiати вразили свiт своєю технологiєю машинного навчання, яка генерує лиця не iснуючих людей. Це вiдкриття знайшло своє застосування у рекламi. Адже нема необхiдностi платити реальним людям за використання їх фото у рекламних цiлях.
Дуже тяжко уявити без знайомства iз цiєю сферою як можна навчити пристрiй робити такi абстрактнi речi.
Машинне навчання ассоцiювалося у мене з штучним iнтелектом, Skynet та фiльмами про Термiнатора :)
Але я почав поринати у безоднi цiєї науки та зараз я вивчаю основнi поняття i хочу периодично додавати пости на цю тему у спiльноту, бо один з найкращих шляхiв закрiпити iнформацiю у головi - розповicти про неї iншим!
Машинне навчання - це наука, що вивчає створення моделей, якi в свою чергу здiбнi виробляти ранiше описанi дивовижнi речi.
Модель - це сутнiсть з параметрами, якi можуть корректуватися. Корректування робиться за рахунок навчання моделi на даних.
Якщо ви хочете спрогнозувати значенная температури у березнi цього року, ви створюєте модель, годуєте її iнформацiєю про погоду у минулому та на виходi отримуєте модель, яка може робити прогноз.
Icнує 3 великi класи задач, якi вирiшується з допомогою манинного навчання:
Прогнозування
Прогнозування вже було розглянуто i воно має на увазі використання даних у минулому для прогнозування процеciв у майбутньому.
Здавалося б вигрузи усю свiтову iсторiю в таку модель, та прогнозуй наслiдки i от тобi i вiдсутнiсть вiйн, диктутур, тощо :)
Класифiкацiя
Вiдрiзнити собаку вiд хом'яка, чорне вiд бiлого, цифру вIд букви - все це дозволяє класифiкацiя. Ми привласнюємо класс тому чи iншому об'єкту в залежностi вiд його атрибутiв.
Модель для такого завдання навчається на даних з вiдповiдями. Наприклад фото собак з надписами "собака", та кішок к з надписом "кiшка".
Кластеризацiя
Кластеризацiя - це процесс розбивання даних на групи (кластери) по атрибутам. Ви можете навiть не знати на яку кiлькicть частин буде розбита iнформацiя та за якими ознаками.
Цей процесс допомогає знаходити закономірність в даних, встановлювати зв'язки атрибутiв яким ви ранiше не додавали значення. Кластеризацiя має велику вагу у доcлiдженнi iнтернет бiзнес-cервiciв.