18video性欧美19sex,欧美高清videosddfsexhd,性少妇videosexfreexxx片中国,激情五月激情综合五月看花,亚洲人成网77777色在线播放

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

別只盯著Sora,中國AI視頻的實時交互已悄悄領(lǐng)先

腦極體 ? 來源:腦極體 ? 作者:腦極體 ? 2025-10-16 10:54 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

wKgZPGjwXneAHve5AAfNfdyKwtU653.jpg

剛剛過去的十一黃金周,大家一定沒少刷到Sora2生成的視頻,山姆·奧特曼到處給人送祝福,看得觀眾忍俊不禁。不過,等普通人真想用Sora做段自己的視頻才發(fā)現(xiàn),AI視頻還是沒有想象中一樣簡單。

我們看到的AI長視頻,一般是由多個幾秒長的短視頻拼接而成的。也就是說,用戶要先把完整創(chuàng)意拆成幾個分鏡,每一段劇情分別準(zhǔn)備獨立的圖片和Prompt提示詞描述,每一次生成都得碰運氣,后期拼接時還容易跳幀、風(fēng)格斷裂,感覺不滿意想調(diào)整,只能重寫Prompt、重新生成。

這種創(chuàng)作模式,也被稱為“抽卡”,就像手游里氪重金抽 SSR,花了時間、Token、算力和錢,還不一定拿到想要的結(jié)果,再加上海外平臺高昂的訂閱費,到底誰在說AI視頻的制作門檻被Sora打下來了?

其實,AI視頻技術(shù)的大眾普及這一塊兒,國內(nèi)視頻平臺早就走在了前面。最近我們就注意到,百度9月25日發(fā)布的“蒸汽機(jī)”最新版本,有兩個非常重要的升級:一是長視頻流式生成的產(chǎn)品體驗,二是模型支持實時交互。

前者可以用一張圖、一段視頻生成長視頻突破5s、10s限制,并支持邊做邊改,創(chuàng)作AI視頻不用再一次次“抽卡”賭運氣,可以在預(yù)覽中實時調(diào)整;后者則拓展了AI視頻的邊界,比如直播數(shù)字人這類需要實時推理會話的長視頻,類sora模型還無法做到。

可以發(fā)現(xiàn),在AI大眾化這件事上,deepseek、百度蒸汽機(jī)這樣的國內(nèi)科技企業(yè),是真的悶聲干大事。而這,也是中國AI的本色之一。或許比起sora,國內(nèi)視頻平臺正在終結(jié)AI視頻的抽卡魔咒,才是更值得大家關(guān)注的AI大事件。

wKgZPGjwXniAJx2qAAG_0waPvxU079.jpg

手游圈有一句話,玄不救非,氪能改命。指的是想抽到一張滿意的角色,要么靠玄學(xué)碰運氣,要么靠氪金砸錢?,F(xiàn)階段的大多數(shù)AI視頻工具,就是這么工作的。

常規(guī)的AI長視頻生成流程,采用首尾幀續(xù)寫技術(shù),或者簡單續(xù)寫能力,雖然一次生成的視頻時長更長了,但前后頻缺乏連貫性,調(diào)整前后邏輯、對齊音畫等,比傳統(tǒng)拍攝后期還累人;畫質(zhì)和細(xì)節(jié)也容易不穩(wěn)定,比如人物一活動,肢體和空間的關(guān)系就不符合物理規(guī)律了。想要調(diào)整,就得重新上傳圖片和“抽卡”,把流程再來一遍,而且花錢不討好,反復(fù)抽卡、多次生成,需要消耗大量計算資源,最終成本都要由用戶買單。

對于創(chuàng)作者和普通人來說,這樣的AI長視頻能力是無法實現(xiàn)創(chuàng)作自由的,大多嘗鮮之后就棄之不用了。

為什么AI無法一次生成高質(zhì)量的長視頻,而被迫陷入抽卡魔咒呢?行業(yè)普遍陷入了技術(shù)瓶頸:

瓶頸一,模型記不住,也就是長時序連貫性建模難題。

傳統(tǒng)的擴(kuò)散模型,是一種固定窗口的生成模式,對長視頻生成非常不友好,一方面窗口大小和生成成本是指數(shù)級關(guān)系,另外一方面通過簡單反復(fù)續(xù)寫,會存在較為嚴(yán)重的全局一致性和連續(xù)性問題。生成時長超過10秒,幀間累積誤差就會指數(shù)級增長,就像一個記性不好的人,做事做到第十秒,基本把前面干過什么忘光了,所以長視頻越做越亂,前后內(nèi)容不一致。

有的平臺為了緩解這個問題,支持用戶手動上傳關(guān)鍵幀,這就意味著,30秒視頻得傳6組,操作復(fù)雜度直接翻了好幾倍,而且鏡頭切換可能不自然,并沒能發(fā)揮出AIGC提質(zhì)增效的效果。

瓶頸二,模型聽不懂、算不快,也就是實時交互受限。

在互動視頻、直播等場景中,對視頻的持續(xù)時長與實時生成能力提出了更高要求。但傳統(tǒng)視頻生成,只能靠抽卡和調(diào)整提示詞,來不斷試錯,用戶無法在生成過程中就進(jìn)行修改和微調(diào),是因為Transformer架構(gòu)的二次計算復(fù)雜度很高,在生成長視頻時要實時互動,一是對GPU顯存與計算效率提出更高要求,需要軟硬件協(xié)同優(yōu)化來提升推理效率。還有成本考量,計算開銷隨生成時長呈平方級增長,為了控制成本,模廠只能限制時長,還必須等全部算完才能輸出結(jié)果。

上述技術(shù)瓶頸,導(dǎo)致AI長視頻不連貫、改不了、成本高,因此,目前這類短視頻生成技術(shù)主要應(yīng)用于工具層面,如視頻片段與素材制作,這顯然無法滿足C段和B端的復(fù)雜創(chuàng)作需求。

百度“蒸汽機(jī)”10.15版本的核心突破,就是把長視頻變成流式生成、實時交互,整個過程中,用戶可以邊瀏覽邊生成,支持在幀數(shù)間改寫、續(xù)寫,隨時打斷并修改提示詞,就能實時生成想要的畫面,從而打破了傳統(tǒng)視頻生成的“抽卡”魔咒。

wKgZPGjwXnmAadIBAAGfmZKBZVo787.jpg

面對行業(yè)普遍的10秒局限,以及用戶反復(fù)抽卡的無力,百度蒸汽機(jī)靠四大技術(shù)突破,從根源上破解了長視頻生成的效率、質(zhì)量與成本難題,終結(jié)“抽卡”模式。

突破一:基礎(chǔ)架構(gòu)改造,解決長視頻生成難題,一張圖一段文字極簡生成。

傳統(tǒng)模型生成超10秒視頻就會片段斷裂,還得補(bǔ)關(guān)鍵幀。百度蒸汽機(jī)引入自回歸擴(kuò)散模型,搭建流式滑窗架構(gòu),通過階梯獨立噪聲構(gòu)造,為每一幀匹配精準(zhǔn)噪聲級別,配合動態(tài)緩沖區(qū)管理,同步處理模糊草圖、半完成幀及高精度畫面等多狀態(tài)畫面,實現(xiàn)“邊生成邊調(diào)整”的實時交互生成流程。

我們上傳了一張騎在黑龍背上的視頻,自動生成12秒視頻,全程無需補(bǔ)充任何素材,而且生成過程中,還可以隨時選擇繼續(xù)生成或修改提示詞。

突破二:訓(xùn)推偏差消除,解決累積誤差,告別 “越生越崩” 的質(zhì)量衰減。

AI生成的視頻前5秒正常,后面人物空間關(guān)系就扭曲變形了,這種情況經(jīng)常出現(xiàn),本質(zhì)是傳統(tǒng)滑窗方法的誤差累積問題,導(dǎo)致生成的視頻質(zhì)量嚴(yán)重下降。

但我們用百度蒸汽機(jī)生成了一個長鏡頭的雙人互動,在長達(dá)20秒的時間里,兩個人物都保持了一致性,即使是在近景互動時也符合物理邏輯。

原來,百度蒸汽機(jī)通過歷史幀擾動增強(qiáng)技術(shù),在訓(xùn)練時故意加入幀誤差,讓模型具備自我糾錯能力,變得更加魯棒,緩解自回歸模型的累積誤差問題。

突破三,一致性優(yōu)化,讓長視頻像接力賽一樣絲滑。

行業(yè)普遍采用的片段拼接技術(shù),經(jīng)常出現(xiàn)走路跳步、音畫脫節(jié)等情況,比如人物說話時唇形與聲音對不上。百度蒸汽機(jī)采用全局規(guī)劃與局部參考相結(jié)合的優(yōu)化方法,解決長視頻連續(xù)性與一致性問題。其中,引入錨點幀引導(dǎo),保障全局記憶,引入了key frame建立全局注意力錨點,保證模型的長期記憶能力,引入歷史參考幀,作為上下文信息,使得模型具備短期記憶能力,保障連續(xù)生成。前后過渡像傳遞接力棒一樣流暢自然,多人對話等場景的AI視頻一次生成質(zhì)量更高。

突破四:實時流式計算,實現(xiàn)邊生成邊修改的創(chuàng)作自由。

以前生成3分鐘視頻得等40分鐘,而且生成后無法修改,一點就得重算。百度蒸汽機(jī)基于自回歸擴(kuò)散架構(gòu),突破高壓縮比生成技術(shù),大幅提升擴(kuò)散模型流式推理性能,保障效果和效率的極致平衡,滿足實時交互的推理需求。

比如我們用V2V模式,上傳一段賽車視頻,百度蒸汽機(jī)能夠在幾分鐘之內(nèi),就將視頻拓展到10秒以上。如果想改寫結(jié)局,可以選擇續(xù)改,選中關(guān)鍵階段的幀,直接輸入其他結(jié)果的提示詞,比如“銀車加速超過黃車”或“黃車加速超過銀車”,就能生成新的結(jié)局,輕松搞定不同劇情。

也就是說長視頻生成過程從黑箱變成了流式體驗,模型推理出多少,用戶就能實時預(yù)覽多少,不需要等待全部生成完成。而且百度蒸汽機(jī)升級了窗口注意力機(jī)制,將計算復(fù)雜度降為線性,結(jié)合模型蒸餾技術(shù),大幅提升計算效率,降低推理耗時,所以整個生成過程僅用時幾分鐘。整個制作過程既可控,又省力。

百度蒸汽機(jī)的四大突破,用技術(shù)把AI視頻的創(chuàng)作模式,從靠運氣抽卡變成了按需創(chuàng)作。這會推動行業(yè)發(fā)生至少兩個變化:

一是創(chuàng)作門檻進(jìn)一步降低。由于AI長視頻的生成質(zhì)量和效率得到提高,不再需要用戶上傳多張圖和prompt,不再需要費心描述和準(zhǔn)備關(guān)鍵幀,一次生成高可用,長視頻生成真的走向了人人可用的簡單時代。

二是應(yīng)用場景進(jìn)一步延伸。傳統(tǒng)長視頻生成技術(shù),難以承載復(fù)雜的創(chuàng)作需求,無法滿足數(shù)字人這類實時交互長視頻的需求。百度蒸汽機(jī)全新的技術(shù)架構(gòu)實現(xiàn)長視頻流式生成體驗,支持實時互動,可以拓展出AI導(dǎo)購、AI老師、AI陪伴等沉浸式數(shù)字人場景。支持開放世界的生成,比如游戲地圖、旅游景點體驗、宇宙空間等,都可以任意創(chuàng)造,比如家長可以用一張長城或宇宙的圖片,為孩子生成虛擬長城或虛擬宇宙,為教育、旅游、游戲打開新可能。

某個噱頭或爆款玩法,或許能在短時間內(nèi)帶火AI視頻的關(guān)注度,但一時熱度終會在門檻暴露后退潮。唯有扎扎實實的底層技術(shù)突破,才能為AI視頻生成的大眾化普及鋪平道路,真正降低使用門檻、拓展使用邊界,承接住不斷涌入的創(chuàng)作者和新用戶。

wKgZO2jwXnmAIDk5AAIAloU7Y1o274.jpg

Sora2的科幻短片刷爆社交平臺時,不少人又開始感慨,“AI視頻創(chuàng)作的天花板在海外”。但真實體驗過的創(chuàng)作者恐怕都會認(rèn)同,這些海外AI視頻創(chuàng)作與普通人仍有距離。百度蒸汽機(jī)為代表的國內(nèi)視頻平臺,更加普通人友好。

一方面,國內(nèi)平臺更早跳出了炫技式研發(fā),不像sora這樣“憋個大招”,以更快的技術(shù)迭代速度,貼實用戶需求。

拿百度蒸汽機(jī)來說,迭代速度堪稱行業(yè)標(biāo)桿,可以說是“月月有突破”。今年3月首發(fā)即實現(xiàn)高精度圖生視頻,5月登頂VBench-I2V權(quán)威榜單,畫質(zhì)達(dá)專業(yè)影視級;7月推出全球首個中文音視頻一體化模型,8月實現(xiàn)多人對話生成,9月發(fā)布“通用AI長視頻生成”功能……

這種應(yīng)用驅(qū)動研發(fā)的路徑,背后是搜索、百家號等場景的真實需求直接反推模型升級,讓百度蒸汽機(jī)的技術(shù)突破始終貼合用戶痛點,解決普通人的使用難題。

此外,AI視頻生成的大規(guī)模、產(chǎn)業(yè)級應(yīng)用,國內(nèi)視頻平臺也別有優(yōu)勢。

相比不懂中文語境的Sora、sunway等,百度蒸汽機(jī)等國內(nèi)模型憑借億級中文多模態(tài)數(shù)據(jù)訓(xùn)練,不僅中文唇形和語音能精準(zhǔn)同步,還能生成方言,讓創(chuàng)作者的內(nèi)容更容易打開中文市場。

國內(nèi)平臺也更懂產(chǎn)業(yè)落地AI的成本難題,比如百度蒸汽機(jī)堅持技術(shù)普惠,依托百度智能云“百舸”平臺與昆侖芯片,結(jié)合模型參數(shù)壓縮、算力動態(tài)調(diào)度等技術(shù),將推理效率提升3倍,刊例價較同類產(chǎn)品低至七成,并采用“按量后付+資源包”靈活計費模式,不讓用戶白花冤枉錢。相較海外平臺的服務(wù)費與訂閱費,大幅降低了產(chǎn)業(yè)級使用成本,也為AI視頻生成的規(guī)模落地拆除了門檻。

從抽卡試錯到按需創(chuàng)作,百度蒸汽機(jī)的技術(shù)突破不僅改變了AI視頻的創(chuàng)作邏輯,更展示了與海外平臺不同的技術(shù)產(chǎn)業(yè)化、技術(shù)普惠化之路。

正如大語言模型、對話式AI的普及歷程一樣,AI長視頻的全民時代,將由國內(nèi)平臺開啟。

wKgZO2jwXnqAI8SMAAHJtK2XnLc175.jpg

審核編輯 黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    88

    文章

    37115

    瀏覽量

    291133
  • Sora
    +關(guān)注

    關(guān)注

    0

    文章

    86

    瀏覽量

    711
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    除了刷屏的Sora,國內(nèi)外還有哪些AI視頻生成工具

    Sora的發(fā)布也讓AI生成視頻有了突破性進(jìn)展。 ? 過去一年多,全球科技公司都在發(fā)布各種大模型,然而AI生成內(nèi)容更多集中在文本和圖片方面,AI
    的頭像 發(fā)表于 02-26 08:42 ?6160次閱讀
    除了刷屏的<b class='flag-5'>Sora</b>,國內(nèi)外還有哪些<b class='flag-5'>AI</b><b class='flag-5'>視頻</b>生成工具

    Sora還在PPT階段,“中國Sora”已經(jīng)開放使用了!

    電子發(fā)燒友網(wǎng)報道(文/梁浩斌)今年春節(jié)期間,OpenAI的AI文字生成視頻模型Sora驚艷全世界,極高的視頻生成效果、長達(dá)60秒的視頻生成長
    的頭像 發(fā)表于 06-17 09:07 ?4712次閱讀

    面對Sora,中國AI可以不急不躁不焦慮

    AISora
    腦極體
    發(fā)布于 :2024年02月23日 00:51:52

    奧特曼發(fā)布王炸模型Sora OpenAI首個文生視頻模型Sora正式亮相

    奧特曼發(fā)布王炸模型Sora OpenAI首個文生視頻模型Sora正式亮相 2月16日凌晨OpenAI的首個文生視頻模型Sora正式亮相。
    的頭像 發(fā)表于 02-18 17:41 ?1414次閱讀

    OpenAI發(fā)布文生視頻模型Sora,引領(lǐng)AI視頻生成新紀(jì)元

    在人工智能(AI)領(lǐng)域掀起新一輪革命浪潮的,正是OpenAI最新推出的文生視頻大模型——Sora。這款被業(yè)界廣泛贊譽(yù)的模型,以其“逼真”和“富有想象力”的視頻生成能力,徹底顛覆了傳統(tǒng)
    的頭像 發(fā)表于 02-19 11:03 ?1545次閱讀

    探索OpenAI Sora視頻AI生成技術(shù)及其應(yīng)用如何使用指南

    OpenAI的Sora現(xiàn)已擴(kuò)展其能力范圍,進(jìn)入視頻生成領(lǐng)域,標(biāo)志著人工智能技術(shù)在多媒體內(nèi)容創(chuàng)作上的一個重大突破。Sora視頻AI功能使得用
    的頭像 發(fā)表于 02-20 12:01 ?2793次閱讀

    sora系列是哪個公司的 sora視頻怎么用

    sora系列是哪個公司的 Sora,美國人工智能研究公司OpenAI發(fā)布的人工智能文生視頻大模型(但OpenAI并未單純將其視為視頻模型,而是作為“世界模擬器”,于2024年2月15日
    的頭像 發(fā)表于 02-21 16:35 ?5703次閱讀

    OpenAI文生視頻模型Sora要點分析

    近日,美國人工智能公司OpenAI發(fā)布了首個視頻生成模型Sora。不同于此前許多AI大模型文生圖或視頻時,會出現(xiàn)人物形象前后不一致等問題
    的頭像 發(fā)表于 02-22 16:37 ?1941次閱讀
    OpenAI文生<b class='flag-5'>視頻</b>模型<b class='flag-5'>Sora</b>要點分析

    sora模型中國可以使用嗎 sora模型是哪個公司

    。 Sora是一種擴(kuò)散模型,具備從噪聲中生成完整視頻的能力,它生成的視頻一開始看起來像靜態(tài)噪音,通過多個步驟逐漸去除噪聲后,視頻也從最初的隨機(jī)像素轉(zhuǎn)化為清晰的圖像場景 ,其能夠一次生成
    的頭像 發(fā)表于 02-22 16:52 ?4957次閱讀

    7萬張H100打造的OpenAI文生視頻Sora功能原理詳解|Sora注冊全攻略

    近日,OpenAI發(fā)布的基于Transformer架構(gòu)的文生視頻Sora,可謂是在AI圈掀起新的熱潮。該模型具有強(qiáng)大的視頻生成能力,可產(chǎn)生高達(dá)一分鐘的高清
    的頭像 發(fā)表于 02-29 11:48 ?1817次閱讀
    7萬張H100打造的OpenAI文生<b class='flag-5'>視頻</b><b class='flag-5'>Sora</b>功能原理詳解|<b class='flag-5'>Sora</b>注冊全攻略

    新火種AI|圍攻光明頂:Sora效應(yīng)下的AI視頻生成競賽

    Sora的出現(xiàn),讓AI視頻生成領(lǐng)域真正“活”了起來
    的頭像 發(fā)表于 03-16 11:12 ?1013次閱讀

    智譜AI正研發(fā)對標(biāo)Sora的國產(chǎn)文生視頻模型

    智譜AI,這家國內(nèi)估值超過200億的AI大模型獨角獸企業(yè),正全力投入研發(fā)一款與OpenAI的Sora相媲美的國產(chǎn)文生視頻模型。據(jù)公司內(nèi)部人士透露,該模型預(yù)計最快將在今年內(nèi)發(fā)布,將成為
    的頭像 發(fā)表于 05-07 09:22 ?865次閱讀

    智譜AI正在研發(fā)國產(chǎn)文生視頻模型,對標(biāo)OpenAI Sora

    國內(nèi)AI領(lǐng)域的獨角獸企業(yè)智譜AI正全力研發(fā)一款與OpenAI的Sora相媲美的國產(chǎn)文生視頻模型。據(jù)悉,該模型的技術(shù)研發(fā)取得顯著進(jìn)展,預(yù)計最
    的頭像 發(fā)表于 05-13 11:14 ?1008次閱讀

    OpenAI開放Sora視頻生成模型

    OpenAI近日宣布,其傾力打造的人工智能視頻生成系統(tǒng)Sora正式向美國及其他市場的ChatGPT Plus訂閱用戶開放。自去年首次公開預(yù)覽以來,Sora歷經(jīng)約10個月的精心研發(fā)與優(yōu)
    的頭像 發(fā)表于 12-10 11:16 ?936次閱讀

    OpenAI推出AI視頻生成模型Sora

    近日,備受期待的OpenAI再次推出了其創(chuàng)新之作——AI視頻生成模型Sora。這一新品的發(fā)布,無疑為AI技術(shù)注入了新的活力。 據(jù)悉,Sora
    的頭像 發(fā)表于 12-12 09:40 ?941次閱讀