
Source:人工智慧概論-台大開放式課程
人工智慧是什麼?他是讓電腦接收資料輸入後,可以進行推論、學習並採取行動,而這類行動往往需要人類智慧判斷或涉及超出人為分析能力上限的資料規模。
機器學習
若要說人工智慧是往高階文明邁進的目標,機器學習就是達成人工智慧技術的手段,他的底層技術相當簡單,是人人都聽過的矩陣函數,它透過矩陣四則運算,拓展出擁有上億個參數的運算式,也就是演算法。
若用更白話的說法來解釋機器學習對人類的效益,就是我們現在只需要給輸入資料與最終結果,就可以透過機器學習建立的演算法,讓他自己找出答案。
機器學習所經歷的三階段 “資料接收、推論學習、輸出結果” 形成閉環,它能夠自行驗證結果並優化演算法,這也機器學習最令人驚豔之處。
深度學習
而能表示上億個參數的運算式,是一個名為深度學習的機器學習技術分支。其名為深度,在於能創造多個層次的的神經網路來容納上億個參數。換句話說,這些層層堆疊的參數,就像人類大腦的神經元互相連結,使用類神經網路來表示矩陣函式的技術,就被稱為深度學習。

生成式人工智慧
生成式人工運用深度學習技術建立,當遇到一個開放式問題,能回答出千百萬種組合的答案。因此他比單純的影像辨識貓或狗、只能下棋的 AlphaGo 等狹義型人工智慧更開放了些。
對於科學家而言,雖然也許與通用型人工智慧還有一段差距,但對於社會大眾而言,生成式人工智慧 ChatGPT 是眾人首次發現 AI 能廣泛應用到人類生活中。
參數 Parameter
參數大小是衡量一個模型的「容量」或複雜程度,通常也被視為
生成式人工智慧是由深度學習這項技術建構,而我們可以將深度學習簡略地說,是一個極度龐大的函數關係式。一個最簡單的函數式 ax+by = z,那麼 a, b 就是這個函式的參數。
上下文窗口 Context Window
Context window 是在生成輸出時,生成式 AI 模型可以參考的輸入文本的長度。最小單位是 Token (詞元),可以是一個字、一個詞,甚至是詞的一部分。例如,"世界第一高山是玉山" 這句話可能會被分解成以下幾個 token: "世界"、"第一"、"高"、"山"、"是”、”玉山”。Context Window 越大,則模型單一個問題的資訊接收量,能吸收得越多。
大型語言模型如何產出回覆?
單與生成式人工智慧互動,你可能會認為 Gen AI 吸收了大量的知識後,理解這些資訊,並建構起一個大腦能回答幾乎所有問題。但事實上,現階段的大型模型並不是先理解後回答,而是透過自然語言處理,從龐大的資料中進行機器學習,能根據前文推算出下一個最有可能發生什麼字。類似的模型早已存在我們生活中,手機輸入法的自動選字就是其中一種。