自然語言處理之2~大型語言模型

2-2大型語言模型

現今熱門的大型語言模型,比如像ChatGPT、Gemini,採用的都是Transformer架構。這種架構,可以將巨量訓練資料快速平行處理,但必須使用到多部AI伺服器在雲端運算,並不是一般中小型企業能負擔的起的

所以經過一番優勝劣敗激烈交鋒,目前能提供商品化服務的,僅寥寥幾家。即使研發能力傑出如臉書(Meta),最終還是退出了第一線的競爭

但臉書開發出來的大型語言模型第二版LLama 2,被該公司免費公開,讓其它研究資源有限的單位,可以下載其源碼,經過微調的程序,就可以套用在各自的系統當中

圖2-2-1. Meta公司的LLAMA 2被釋出為開源碼,造福不少財力有限的研究單位

一般中小型公司,轉而聚焦在邊緣運算當中,希望開發出來的模型在桌上型電腦,或者平板甚至手機就可以使用,如此不但可改善網路遲延(Latency),未來創造的商機更是不可限量

對個人工作者而言,ChatGPT也已從當初的玩具階段,晉身到工具水平。現在它的文字輸出品質早非昔日之吳下阿蒙。做簡報做表格它樣樣勝任愉快在畫圖方面,除了人物的一致性尚待加強採用寫實風格作畫,真是栩栩如生、躍然紙上

圖2-2-2. 向Copilot要求”請用寫實風格,畫出一張黃色柴犬的微笑圖片“它就幫你畫出這樣的圖片

Leave a Comment

Your email address will not be published. Required fields are marked *

Shopping Cart