OmniHuman-1 使用教學:台灣用戶如何體驗這款AI影音生成模型

什麼是OmniHuman-1?

OmniHuman-1 是由抖音母公司字節跳動(ByteDance Ltd.)研發的一款人工智慧影音生成模型。這款模型能夠僅憑一張靜態圖片,結合音頻或文字,生成栩栩如生的影片,包括人物說話時的口型、手勢等細節。官方示範的應用範圍廣泛,包括人類彈奏樂器、MV生成、動畫製作、街訪等。

OmniHuman-1 的特點

  • 多模態輸入:支援文本、語音和影片等多種輸入形式,生成的數位人物可以在不同場景中展示豐富的情感與動作。
  • 高質量輸出:能夠生成真人、動漫人物、3D人物等高質量數位形象,適用於直播、娛樂、教育等多種場景。
  • 實時生成:具備實時生成能力,用戶能夠即時獲得數位人物的反饋。
  • 表現力強:在多種驅動模式下,生成的數位人物能夠完成具有挑戰性的動作,進一步提升影片的真實感和表現力。

如何在台灣使用OmniHuman-1?

目前,OmniHuman-1 的功能建構在即夢AI(Dreramina)中,但台灣用戶直接登入即夢可能會遇到困難(需要使用抖音帳戶登入,但即便有帳戶,仍舊無法掃碼或輸入驗證碼成功登入)。以下提供台灣用戶登入使用的步驟:

  1. 登入CAPCUT:
  2. 進入Dreramina:
    • 使用 Google 搜尋「Dreramina」,或直接點擊 Dreramina 連結
    • 點擊登入,使用 Google 帳戶進行登入。
  3. 申請試用S2.0PRO:
    • 在影片產生器中找到 S2.0PRO,點擊申請試用。注意:此步驟需要排隊審核。
如何在台灣使用OmniHuman-1?

官方影片範例

💡更多範例:https://omnihuman-lab.github.io/