什麼是 Hugging Face？開源 AI 平台介紹 4 點加速 AI 開發

內容目錄

Hugging Face 整合超過 47 萬個開源、預先訓練好的 AI 模型，供任何人下載使用。由於訓練模型非常昂貴，這樣的平台可以大幅降低開發 AI 產品的時間與成本。他們也積極推動開源社群，致力於打造更安全與開放的 AI 模型。

Hugging Face 在 2023 年八月募資 D 輪 2.35 億美元，成為全世界估值前十的 AI 獨角獸，而且投資陣容相當豪華，包含 Google、Amazon、Nvidia、AMD、Intel、Qualcomm、IBM 等科技巨頭。本文將概覽 Hugging Face 對開發者的重要性，並在最後討論 Hugging Face 的商業模式與擁抱開放、傳遞知識的文化。

一家估值 45 億美元公司，主打開放原始碼 AI 模型平台，為什麼獲得大量 AI 應用開發者的熱愛與重視？

對開發者的重要性：多、省時、簡便且標準化

Hugging Face 被稱為「AI 界的 Github」，最大亮點是開源模型集散地，整合大量的模型、資料集。然而 Hugging Face 不單純是把模型放在網站上讓人下載，更重要的是提供標準化的函式庫、API 與網頁介面，並建立起開源社群。其主要服務包含：

模型與函式庫「Transformers Library」：標準化的函式庫，可透過統一的 API 完成下載、串接、微調模型。
集中式平台「Hugging Face Hub」：整理了上傳到 Hugging Face 的模型與資料集，並持續增加中：
- Models：47 萬個 AI 模型。
- Datasets：近 10 萬個資料集。
- Spaces：供開發者建立與部署自己的模型與應用，向社群分享。
- 簡易的論壇功能。
「Inference API」：透過 API 呼叫由 Hugging Face 管理的模型。
網頁 UI 工具「Gradio」：提供可串接模型的網頁 UI（原為新創公司，於 2021 年被 Hugging Face 收購）。
「Autotrain」：不需程式碼，只要提供資料便可以訓練或微調模型。

十年前做機器學習，必須要自己編寫程式，取得並整理測試資料，最後花上好幾個小時訓練。還記得大學熬夜做期末專案，在輸入訓練指令後就要設定一個鬧鐘，偷空睡一兩個小時再回來看結果。當時的開源社群已經有不少函式庫與零散的資料集，但很難找到已經預先訓練好的模型。

如今開發者不必自己訓練模型，可以透過 Hugging Face 大幅節省時間與成本。其中最重要的四項特色是：「多」、「省時」、「簡便」與「標準化」。

「多」：大量且多樣的 AI 模型

在 Hugging Face 上可以輕鬆找到各種模型與資料集，並開放原始碼，任何人都可以使用。頁面可依照「趨勢」排序，快速找到目前流行的模型。

如有特定需求，也可以使用預先訓練好的模型再進行微調（fine tune）。特別是訓練起來很昂貴的語言模型，不需要從頭訓練，可大量節省開發成本。

Hugging Face models-2 — ▲ 在 Hugging Face 上可以找到各種模型。（圖片來源：截自 Hugging Face 網站）

「省時」：直接在平台頁面預覽測試

AI 模型透過 Hugging Face 託管，可以直接在網頁上預覽。如果只想測試是否符合需求，不需要先下載整個模型、在自己的機器上跑起來，而是可以透過網頁看到結果，節省了許多時間。

舉例而言，進到 TinyLlama-1.1B-Chat-v1.0 模型頁面，右方可以直接輸入 prompt 並看到結果（藍字），底下也會顯示所需的時間。

▲ 可以直接輸入 prompt 並看到結果。（圖片來源：截自 Hugging Face 網站）

Hugging Face 的 Gradio 也提供 UI 介面，同樣可以直接在網頁上看到測試結果。例如下圖是利用 PhotoMaker 這個模型，上傳一張或少量照片，便可以透過 prompt 生成指定的風格、場景、服裝。

▲ 上傳四張照片後，以模特兒的臉生成蜘蛛人裝扮。（測試圖片來源：Joel Mott on Unsplash）

「簡便」：透過 API 遠端串接模型

除了在 Hugging Face 的網頁上測試，Hugging Face 也提供 API，讓開發者可以直接遠端串接模型。這在開發產品 prototype 時非常方便，可以快速了解模型是否能整合進產品裡，正確執行任務。

免費版的 Inference API 有流量限制。如果在開發產品後，不想自己處理 AI 模型的 hosting 問題，也可以付費採用 Inference Endpoints。

「標準化」：統一的程式碼介面

Hugging Face 開發了函示庫 Transformers Library，並且預先定義許多常見的任務（Tasks），如「text-to-image」、「text-to-speech」。Transformers Library 統一串接不同模型時的介面，使開發流程標準化。如此一來，開發者在更換模型時，就不需要重寫程式，只需要修改呼叫時傳入的名稱即可。

例如下面的程式碼，可以下載 AI 模型並朗讀文字。如果想要更換模型，只需要將 suno/bark-small 更改成其他模型的名稱，不需要針對不同的模型重寫程式，讓開發更有效率。

Hugging Face 的商業模式

Hugging Face 上大多數的服務都是免費的。不過開發者可以訂閱年費，提早使用新功能與更強大的 Inference API（如：支援 streaming、可傳入更多參數）。若要使用 Spaces 的硬體或 Inference Endpoint（用於 production 的 API），則採按時計價。

然而，Hugging Face 目前的重心並不在獲利，而在推廣。早在 2022 年，Midjourney、ChatGPT 尚未掀起生成式 AI 浪潮之前，創辦人 Clément Delangue 接受 Forbes 採訪時便自信地說：

「我很難想像，當機器學習成為預設打造技術的方式，而 Hugging Face 是該領域的首選平台，我們怎麼會無法創造數十億美元的收益？」

Hugging Face 希望先推出低價易用的產品，逐步養成人工智慧社群，並且佔有整個市場。這當然並不容易，隨著生成式 AI 崛起，「賣鏟子」類型的新創也不斷出現。比如功能與 Hugging Face 類似的 Replicate，在 2023 年底募資 B 輪 4000 萬美元，估值達到 3.5 億美元。

不過 Hugging Face 最大的競爭對手，或許是封閉的 AI 大模型。雖然被稱為「AI 界的 Github」，Hugging Face 與 Github 最大的差異在於：只要是工程師，都一定會有託管程式碼的需求；但是做 AI 產品，並不一定得要託管模型。如果封閉的 AI 模型效果持續領先，開發者可能會更傾向使用封閉模型，Hugging Face 成為 AI 領域首選平台的假設也就不再成立。

Hugging Face 目前專注在推廣技術和建立社群，然而不明確的商業模式要怎麼撐起現在的估值會是未來的一大挑戰。但或許正因如此，Hugging Face 大力推動開源模型，不僅有助於探索更多商業機會，同時也符合公司的文化與使命，即促進 AI 技術的開放和普及。

Hugging Face 的使命：機器學習大眾化

相較於 OpenAI、Google 等科技巨頭的封閉傾向，Hugging Face 特別著重於開放文化，公司使命是「機器學習大眾化（democratize good machine learning）」。

這個理念或許能追溯到共同創辦人 Clément Delangue 的成長歷程。23 歲時，他曾在巴黎大學的 TEDx 上演講，倡議教育開放與普及，並介紹其服務 UniShared，目標是將大學教育提供給所有人。

但 Hugging Face 並非第一天就想做開源平台。2016 年創立之初的產品是「手機 AI 好友」，一款給青少年的聊天機器人 app，主打情感支持與有趣對話。可惜在當時，自然語言處理（NLP）仍是相當困難的領域，這款聊天機器人亦遲遲找不到獲利方式。

2017 年，Google 發表了開創性的論文〈Attention Is All You Need〉，其中介紹的「Transformer」技術在未來成為 LLM 的核心基礎。2019 年，Google 將 Transformer 技術用於搜尋。

大約同時，Hugging Face 將手上聊天機器人所用的自然語言模型開源，立刻在機器學習社群爆紅。苦於資料與硬體限制，一般企業與個人沒有能力使用 Transformer 技術自行訓練模型，Hugging Face 提供了開發者們使用語言模型的管道。

Hugging Face 因此轉型成收集、整合開源 AI 模型的平台。時至今日，Hugging Face 已成為開放 AI 的代言人。他們投注了不少心力在確保人工智慧對齊（AI alignment），並相信將 AI 技術開放，有助於加速推進科技發展。在 Hugging Face 與開源社群的推動下，如今開源模型的效果正逐漸逼近封閉模型，並為開發者們開啟更多可能性。

▲ Hugging Face logo（圖片來源：Hugging Face）

為什麼公司名稱與 logo 是可愛的擁抱臉 emoji？除了創業之初客群為青少年，而當時 emoji 非常流行；另一位共同創辦人 Julien Chaumond 也曾在訪談中提到：「擁抱臉」象徵著人與機器的溝通，既代表電腦科技，同時具備人類特徵，展現出人類情感姿勢「擁抱」。¹

多年來，人工智慧領域大多專注在研究，目的是鑽研最尖端的技術並發表論文，卻較少關注如何商業化。Hugging Face 的出現，大幅降低開發門檻，加速 AI 進入產品服務。如同那個友善的 emoji，Hugging Face 正逐步打造開發者、AI 模型與商業化之間的橋樑。

Large models in production with 🤗 HuggingFace CTO Julien Chaumond ↩︎

什麼是 Hugging Face？開源 AI 平台介紹 4 點加速 AI 開發

對開發者的重要性：多、省時、簡便且標準化

「多」：大量且多樣的 AI 模型

「省時」：直接在平台頁面預覽測試

「簡便」：透過 API 遠端串接模型

「標準化」：統一的程式碼介面

Hugging Face 的商業模式

Hugging Face 的使命：機器學習大眾化

相關

新手友善

活動聚會

時事論壇

豐富多元的活動交流：實現自我加值

・職涯說明會、工作坊
・線下實體活動聚會
・課程進度班、求職小組、時事論壇

程式設計

軟體工程師

JavaScript 入門

程式設計入門：踏入軟體開發的第一堂課

踏入軟體開發領域的第一堂課。四週讓零基礎者上手寫程式。帶你暸解網頁設計、HTML、CSS、程式語言 JavaScript 與基礎運算思維。體驗什麼是「前端」與「後端」開發

資料分析

SQL課程

數據分析師

SQL 課程：14 天從基礎語法到實戰案例

SQL 是和資料溝通的首選工具，在商業情境與資料日益複雜的現今，蹲好馬步打穩 SQL 基礎，是解決實務問題的第一步。上手 SQL 後，就能進一步整合思維、工具、與應用，並實現真正的數據價值

對開發者的重要性：多、省時、簡便且標準化

「多」：大量且多樣的 AI 模型

「省時」：直接在平台頁面預覽測試

「簡便」：透過 API 遠端串接模型

「標準化」：統一的程式碼介面

Hugging Face 的商業模式

Hugging Face 的使命：機器學習大眾化

相關

新手友善

活動聚會

時事論壇

豐富多元的活動交流：實現自我加值

・ 職涯說明會、工作坊 ・ 線下實體活動聚會 ・ 課程進度班、求職小組、時事論壇

程式設計

軟體工程師

JavaScript 入門

程式設計入門： 踏入軟體開發的第一堂課

踏入軟體開發領域的第一堂課。四週讓零基礎者上手寫程式。帶你暸解網頁設計、HTML、CSS、程式語言 JavaScript 與基礎運算思維。體驗什麼是「前端」與「後端」開發

資料分析

SQL課程

數據分析師

SQL 課程：14 天從基礎語法到實戰案例

SQL 是和資料溝通的首選工具，在商業情境與資料日益複雜的現今，蹲好馬步打穩 SQL 基礎，是解決實務問題的第一步。上手 SQL 後，就能進一步整合思維、工具、與應用，並實現真正的數據價值

訂閱最新消息

請勾選您最感興趣的內容 ( 可複選 )

・職涯說明會、工作坊
・線下實體活動聚會
・課程進度班、求職小組、時事論壇

程式設計入門：踏入軟體開發的第一堂課