文章目錄
什麼是OmniHuman-1?
OmniHuman-1 是由抖音母公司字節跳動(ByteDance Ltd.)研發的一款人工智慧影音生成模型。這款模型能夠僅憑一張靜態圖片,結合音頻或文字,生成栩栩如生的影片,包括人物說話時的口型、手勢等細節。官方示範的應用範圍廣泛,包括人類彈奏樂器、MV生成、動畫製作、街訪等。
OmniHuman-1 的特點
- 多模態輸入:支援文本、語音和影片等多種輸入形式,生成的數位人物可以在不同場景中展示豐富的情感與動作。
- 高質量輸出:能夠生成真人、動漫人物、3D人物等高質量數位形象,適用於直播、娛樂、教育等多種場景。
- 實時生成:具備實時生成能力,用戶能夠即時獲得數位人物的反饋。
- 表現力強:在多種驅動模式下,生成的數位人物能夠完成具有挑戰性的動作,進一步提升影片的真實感和表現力。
如何在台灣使用OmniHuman-1?
目前,OmniHuman-1 的功能建構在即夢AI(Dreramina)中,但台灣用戶直接登入即夢可能會遇到困難(需要使用抖音帳戶登入,但即便有帳戶,仍舊無法掃碼或輸入驗證碼成功登入)。以下提供台灣用戶登入使用的步驟:
- 登入CAPCUT:
- 前往 CAPCUT 官網,使用 Google 帳戶登入。
- 進入Dreramina:
- 使用 Google 搜尋「Dreramina」,或直接點擊 Dreramina 連結。
- 點擊登入,使用 Google 帳戶進行登入。
- 申請試用S2.0PRO:
- 在影片產生器中找到 S2.0PRO,點擊申請試用。注意:此步驟需要排隊審核。

官方影片範例
💡更多範例:https://omnihuman-lab.github.io/