Hugging Face 整合超過 47 萬個開源、預先訓練好的 AI 模型,供任何人下載使用。由於訓練模型非常昂貴,這樣的平台可以大幅降低開發 AI 產品的時間與成本。他們也積極推動開源社群,致力於打造更安全與開放的 AI 模型。
Hugging Face 在 2023 年八月募資 D 輪 2.35 億美元,成為全世界估值前十的 AI 獨角獸,而且投資陣容相當豪華,包含 Google、Amazon、Nvidia、AMD、Intel、Qualcomm、IBM 等科技巨頭。本文將概覽 Hugging Face 對開發者的重要性,並在最後討論 Hugging Face 的商業模式與擁抱開放、傳遞知識的文化。
一家估值 45 億美元公司,主打開放原始碼 AI 模型平台,為什麼獲得大量 AI 應用開發者的熱愛與重視?
對開發者的重要性:多、省時、簡便且標準化
Hugging Face 被稱為「AI 界的 Github」,最大亮點是開源模型集散地,整合大量的模型、資料集。然而 Hugging Face 不單純是把模型放在網站上讓人下載,更重要的是提供標準化的函式庫、API 與網頁介面,並建立起開源社群。其主要服務包含:
- 模型與函式庫「Transformers Library」:標準化的函式庫,可透過統一的 API 完成下載、串接、微調模型。
- 集中式平台「Hugging Face Hub」:整理了上傳到 Hugging Face 的模型與資料集,並持續增加中:
- Models:47 萬個 AI 模型。
- Datasets:近 10 萬個資料集。
- Spaces:供開發者建立與部署自己的模型與應用,向社群分享。
- 簡易的論壇功能。
- 「Inference API」:透過 API 呼叫由 Hugging Face 管理的模型。
- 網頁 UI 工具「Gradio」:提供可串接模型的網頁 UI(原為新創公司,於 2021 年被 Hugging Face 收購)。
- 「Autotrain」:不需程式碼,只要提供資料便可以訓練或微調模型。
十年前做機器學習,必須要自己編寫程式,取得並整理測試資料,最後花上好幾個小時訓練。還記得大學熬夜做期末專案,在輸入訓練指令後就要設定一個鬧鐘,偷空睡一兩個小時再回來看結果。當時的開源社群已經有不少函式庫與零散的資料集,但很難找到已經預先訓練好的模型。
如今開發者不必自己訓練模型,可以透過 Hugging Face 大幅節省時間與成本。其中最重要的四項特色是:「多」、「省時」、「簡便」與「標準化」。
「多」:大量且多樣的 AI 模型
在 Hugging Face 上可以輕鬆找到各種模型與資料集,並開放原始碼,任何人都可以使用。頁面可依照「趨勢」排序,快速找到目前流行的模型。
如有特定需求,也可以使用預先訓練好的模型再進行微調(fine tune)。特別是訓練起來很昂貴的語言模型,不需要從頭訓練,可大量節省開發成本。
「省時」:直接在平台頁面預覽測試
AI 模型透過 Hugging Face 託管,可以直接在網頁上預覽。如果只想測試是否符合需求,不需要先下載整個模型、在自己的機器上跑起來,而是可以透過網頁看到結果,節省了許多時間。
舉例而言,進到 TinyLlama-1.1B-Chat-v1.0 模型頁面,右方可以直接輸入 prompt 並看到結果(藍字),底下也會顯示所需的時間。
Hugging Face 的 Gradio 也提供 UI 介面,同樣可以直接在網頁上看到測試結果。例如下圖是利用 PhotoMaker 這個模型,上傳一張或少量照片,便可以透過 prompt 生成指定的風格、場景、服裝。
「簡便」:透過 API 遠端串接模型
除了在 Hugging Face 的網頁上測試,Hugging Face 也提供 API,讓開發者可以直接遠端串接模型。這在開發產品 prototype 時非常方便,可以快速了解模型是否能整合進產品裡,正確執行任務。
免費版的 Inference API 有流量限制。如果在開發產品後,不想自己處理 AI 模型的 hosting 問題,也可以付費採用 Inference Endpoints。
「標準化」:統一的程式碼介面
Hugging Face 開發了函示庫 Transformers Library,並且預先定義許多常見的任務(Tasks),如「text-to-image」、「text-to-speech」。Transformers Library 統一串接不同模型時的介面,使開發流程標準化。如此一來,開發者在更換模型時,就不需要重寫程式,只需要修改呼叫時傳入的名稱即可。
例如下面的程式碼,可以下載 AI 模型並朗讀文字。如果想要更換模型,只需要將 suno/bark-small
更改成其他模型的名稱,不需要針對不同的模型重寫程式,讓開發更有效率。
Hugging Face 的商業模式
Hugging Face 上大多數的服務都是免費的。不過開發者可以訂閱年費,提早使用新功能與更強大的 Inference API(如:支援 streaming、可傳入更多參數)。若要使用 Spaces 的硬體或 Inference Endpoint(用於 production 的 API),則採按時計價。
然而,Hugging Face 目前的重心並不在獲利,而在推廣。早在 2022 年,Midjourney、ChatGPT 尚未掀起生成式 AI 浪潮之前,創辦人 Clément Delangue 接受 Forbes 採訪時便自信地說:
「我很難想像,當機器學習成為預設打造技術的方式,而 Hugging Face 是該領域的首選平台,我們怎麼會無法創造數十億美元的收益?」
Hugging Face 希望先推出低價易用的產品,逐步養成人工智慧社群,並且佔有整個市場。這當然並不容易,隨著生成式 AI 崛起,「賣鏟子」類型的新創也不斷出現。比如功能與 Hugging Face 類似的 Replicate,在 2023 年底募資 B 輪 4000 萬美元,估值達到 3.5 億美元。
不過 Hugging Face 最大的競爭對手,或許是封閉的 AI 大模型。雖然被稱為「AI 界的 Github」,Hugging Face 與 Github 最大的差異在於:只要是工程師,都一定會有託管程式碼的需求;但是做 AI 產品,並不一定得要託管模型。如果封閉的 AI 模型效果持續領先,開發者可能會更傾向使用封閉模型,Hugging Face 成為 AI 領域首選平台的假設也就不再成立。
Hugging Face 目前專注在推廣技術和建立社群,然而不明確的商業模式要怎麼撐起現在的估值會是未來的一大挑戰。但或許正因如此,Hugging Face 大力推動開源模型,不僅有助於探索更多商業機會,同時也符合公司的文化與使命,即促進 AI 技術的開放和普及。
Hugging Face 的使命:機器學習大眾化
相較於 OpenAI、Google 等科技巨頭的封閉傾向,Hugging Face 特別著重於開放文化,公司使命是「機器學習大眾化(democratize good machine learning)」。
這個理念或許能追溯到共同創辦人 Clément Delangue 的成長歷程。23 歲時,他曾在巴黎大學的 TEDx 上演講,倡議教育開放與普及,並介紹其服務 UniShared,目標是將大學教育提供給所有人。
但 Hugging Face 並非第一天就想做開源平台。2016 年創立之初的產品是「手機 AI 好友」,一款給青少年的聊天機器人 app,主打情感支持與有趣對話。可惜在當時,自然語言處理(NLP)仍是相當困難的領域,這款聊天機器人亦遲遲找不到獲利方式。
2017 年,Google 發表了開創性的論文〈Attention Is All You Need〉,其中介紹的「Transformer」技術在未來成為 LLM 的核心基礎。2019 年,Google 將 Transformer 技術用於搜尋。
大約同時,Hugging Face 將手上聊天機器人所用的自然語言模型開源,立刻在機器學習社群爆紅。苦於資料與硬體限制,一般企業與個人沒有能力使用 Transformer 技術自行訓練模型,Hugging Face 提供了開發者們使用語言模型的管道。
Hugging Face 因此轉型成收集、整合開源 AI 模型的平台。時至今日,Hugging Face 已成為開放 AI 的代言人。他們投注了不少心力在確保人工智慧對齊(AI alignment),並相信將 AI 技術開放,有助於加速推進科技發展。在 Hugging Face 與開源社群的推動下,如今開源模型的效果正逐漸逼近封閉模型,並為開發者們開啟更多可能性。
為什麼公司名稱與 logo 是可愛的擁抱臉 emoji?除了創業之初客群為青少年,而當時 emoji 非常流行;另一位共同創辦人 Julien Chaumond 也曾在訪談中提到:「擁抱臉」象徵著人與機器的溝通,既代表電腦科技,同時具備人類特徵,展現出人類情感姿勢「擁抱」。1
多年來,人工智慧領域大多專注在研究,目的是鑽研最尖端的技術並發表論文,卻較少關注如何商業化。Hugging Face 的出現,大幅降低開發門檻,加速 AI 進入產品服務。如同那個友善的 emoji,Hugging Face 正逐步打造開發者、AI 模型與商業化之間的橋樑。