AI 聊天機器人的構建必須得有巨量的數據,據了解以 OpenAI 在2018年推出的第一代 GPT,就有1.17億個參數,而後發布的 GPT-3 更多達1750億個參數。
GPT-3.5 則是 ChatGPT 的基礎,是基於 Google 於2017年發布的 NLP Transformer 創立。該特色就是利用數學找規則,翻轉過去 AI 訓練需要大量人力「標籤」的流程,只要有大量未標籤文本資料即可訓練,省下大量人力資源。
雖然目前ChatGPT還未公布其參數量,但參考過去Google所推出的語言模型達3.4億參數來看 ChatGPT 參數肯定超過 Google,在有巨量參數的基底下 ChatGPT 學習回應的流程是先從網路擷取大量文字來編寫內容,並利用豐富資料量「文字接龍」來拼湊多種答案與組合,並猜測句子中下一個字可能為何,也因此當我們提出同樣問題不見得可以獲得一樣的答案。
回應過程中,也會利用人工方式來調整其回答,令其更為「人性化」,透過開放免費使用,就能夠蒐集更多資訊並反覆調整應答內容,提升回應精準度,這也代表該工具距離要取代單一職業仍有難度。
除基本對談外 ChatGBT 也不僅是聊天機器人,在大量參數和人為調整下,還可以當作搜尋引擎使用,也能針對郵件部分內容,產生回應、透過角色、時間背景的設定完成短篇故事創作、依使用者需求寫出特定功能程式碼、輸入中英文內容翻譯、修改文法錯誤、輸入關鍵字就能寫詩、歌詞、分析長篇幅文本整理資料重點等。(來源:豐雲學堂)
点点赞赏,手留余香
给TA打赏
評論0