[ 分享 ]  沒有大數據如何做 AI ?4 個方式用「小數據模型」進行機器學習
  回覆文章總數:

沒有大數據如何做 AI ?4 個方式用「小數據模型」進行機器學習

  By : Leadtek AI Expert     553

麗臺AI專家好文推薦


在訓練AI模型時最需要的就是充足且乾淨的數據,在現有的數據下如何將效益最大化則是一大難題

該篇文章則點出了四種方式,主要就是想跳脫原本的基本訓練流程思維,進而使模型達到更高且更好的預測效果。

在一般情境下通常都會遭遇數據量不足的問題,所以這篇文章非常值得大家參考。


原文網址

https://buzzorange.com/techorange/2021/04/19/ai-few-shot-learning/


摘要

對於許多企業、團隊而言,在 AI 專案剛起步時,常認為無法蒐集大量數據將是一大致命傷,然而近年在 ML 社群中出現一個新概念: Few shot learning,譯為「小樣本學習」或「小數據學習」,讓團隊透過現有的小量數據進行 AI 模型的訓練,連 AI 大神吳恩達也曾提及,小數據將成為 AI 下一步趨勢。


本篇文章重點摘錄台灣人工智慧學校工程師黃書璵,針對小樣本學習進行使用情境介紹,以及小樣本學習的 4 個實作方法與目標設定解析。


小數據學習,如何著手開始?


第一個方式很像數據的無性繁殖,也就是拿既有的少量數據,去生成更多不同特徵的數據。可以訓練一個 GAN 生成對抗網絡模型去做數據擴增,也可以訓練相似數據的合成。


第二個方式,在不改變數據情況下,可以嘗試改變模型的學習目標。例如,把舊模型的部分數據放到新模型內,讓新模型去學習怎麼比較出答案。


第三個方式,訓練一個新模型做多工學習,利用不同任務(task)之間的共同性,增加模型的適用範圍。例如模型學會中文語法後,可以應用在日本語法上面,但套用不同的字彙。


第四個方式,建構式的模型學習。先讓模型分別學習不同部分的特徵,最後再合併起來,學習如何整合判斷。

以下是回覆文