18video性欧美19sex,欧美高清videosddfsexhd,性少妇videosexfreexxx片中国,激情五月激情综合五月看花,亚洲人成网77777色在线播放

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

生成式 AI 研究通過引導(dǎo)式圖像結(jié)構(gòu)控制為創(chuàng)作者賦能

NVIDIA英偉達(dá) ? 來源:未知 ? 2023-07-24 19:30 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

新的研究正在通過一個(gè)文本引導(dǎo)的圖像編輯工具來提升生成式 AI 的創(chuàng)造性潛能。這項(xiàng)創(chuàng)新性的研究提出了一個(gè)使用即插即用擴(kuò)散特征(PnP DFs)的框架,可引導(dǎo)實(shí)現(xiàn)逼真而精確的圖像生成。通過這項(xiàng)研究,視覺內(nèi)容創(chuàng)作者只需一張?zhí)崾緢D片和幾個(gè)描述性詞語,就能將圖像轉(zhuǎn)化為視覺內(nèi)容。

可靠輕松編輯并生成內(nèi)容的能力有助于藝術(shù)家、設(shè)計(jì)師和創(chuàng)作者不斷擴(kuò)展創(chuàng)意的可能性。這也將為那些依賴動畫、視覺設(shè)計(jì)和圖像編輯的行業(yè)賦能。

這項(xiàng)研究的首席作者、魏茲曼科學(xué)研究院博士研究生 Narek Tumanyan 表示:“最新的文本到圖像生成模型標(biāo)志著數(shù)字內(nèi)容創(chuàng)作進(jìn)入了一個(gè)新時(shí)代。然而,將它們應(yīng)用于現(xiàn)實(shí)世界的主要挑戰(zhàn)在于缺乏用戶可控性,這在很大程度上局限于‘僅通過輸入文本來引導(dǎo)圖像生成’。我們的工作是最早為用戶提供圖像布局控制權(quán)的方法之一?!?/p>

生成式 AI 的最新突破為開發(fā)強(qiáng)大的文本到圖像模型提供了新方法。然而,復(fù)雜性、模糊性以及對定制內(nèi)容的需求限制了當(dāng)前渲染技術(shù)的發(fā)展。

這項(xiàng)研究引入了一種新方法,使用 PnP DFs 來改進(jìn)圖像編輯和生成過程,使創(chuàng)作者對最終產(chǎn)物有更大的控制權(quán)。

研究人員從一個(gè)簡單的問題入手:擴(kuò)散模型如何表現(xiàn)并捕捉圖像的形狀或輪廓?研究探索了圖像在生成過程中不斷演變的內(nèi)部表征,并研究了這些表征如何對形狀和語義信息進(jìn)行編碼。

這種新方法通過理解如何在預(yù)訓(xùn)練的文本到圖像模型中編碼空間信息來控制生成的圖像布局,而無需訓(xùn)練新的擴(kuò)散模型或?qū)ζ溥M(jìn)行微調(diào)。在生成過程中,模型從引導(dǎo)圖像中提取擴(kuò)散特征,并將其注入到整個(gè)過程中的每一個(gè)步驟,從而對新圖像的結(jié)構(gòu)進(jìn)行精細(xì)控制。

通過融合這些空間特征,擴(kuò)散模型可以完善新圖像,使其與引導(dǎo)結(jié)構(gòu)相匹配。它會反復(fù)進(jìn)行此過程,更新圖像特征,直到生成一張既保留引導(dǎo)圖像布局、又與文本提示相匹配的最終圖像。

作者寫道:“這就產(chǎn)生了一種簡單而有效的方法,即從引導(dǎo)圖像中提取的特征直接注入到轉(zhuǎn)化圖像的生成過程中,無需進(jìn)行訓(xùn)練或微調(diào)?!?/p>

這種方法為更先進(jìn)的可控生成和操作方法鋪平了道路。

視頻. 在 2023 年國際計(jì)算機(jī)視覺與模式識別會議(CVPR)上展示的“文本驅(qū)動的圖像到圖像翻譯的即插即用擴(kuò)散特征”研究概述

研究人員使用 cuDNN 加速的 PyTorch 框架在單個(gè) NVIDIA A100 GPU 上開發(fā)并測試了這個(gè) PNP 模型。該團(tuán)隊(duì)表示,GPU 的大容量使他們能夠?qū)W⒂陂_發(fā)方法。作為 NVIDIA 應(yīng)用研究加速器計(jì)劃的參與者,這些研究人員獲得了一塊 A100 GPU。

該框架部署在 A100 上,能夠在大約 50 秒內(nèi)從引導(dǎo)圖像和文本轉(zhuǎn)換為一個(gè)新圖像。

該過程不僅有高效,而且可靠,能準(zhǔn)確地生成令人驚嘆的圖像。除圖像外,它還適用于轉(zhuǎn)化草圖、繪圖和動畫,并能修改照明、色彩和背景。

圖 1.該方法的示例結(jié)果,保留了引導(dǎo)折紙圖像的結(jié)構(gòu),同時(shí)與目標(biāo)提示的描述相匹配(來源:Tumanyan, Narek 等人/CVPR 2023)

他們的方法還優(yōu)于現(xiàn)有的文本到圖像模型,在保留引導(dǎo)布局和偏離其外觀之間實(shí)現(xiàn)了卓越的平衡。

圖 2.示例結(jié)果,將該模型與 P2P、DiffuseIT、SDedit 和 VQ+CLIP 模型進(jìn)行三種不同噪聲水平的比較(來源:Tumanyan, Narek 等人/CVPR 2023)

然而,該模型確實(shí)存在一些局限性。當(dāng)編輯任意顏色的圖像區(qū)域時(shí),它的表現(xiàn)并不理想,因?yàn)樵撃P蜔o法從輸入圖像中提取語義信息。

目前,研究人員正在致力于將這種方法擴(kuò)展到文本引導(dǎo)的視頻編輯中。同時(shí),該研究還證明對于其他利用擴(kuò)散模型分析圖像內(nèi)部表征的研究也具有重要價(jià)值。

例如,有一項(xiàng)研究正在利用該團(tuán)隊(duì)的研究成果來改進(jìn)計(jì)算機(jī)視覺任務(wù),例如語義點(diǎn)對應(yīng)。另一項(xiàng)研究則專注于擴(kuò)展文本到圖像生成的控制,包括物體的形狀、位置和外觀。

這項(xiàng)研究已在 GitHub 上開源。

點(diǎn)擊“閱讀原文”,或掃描下方海報(bào)二維碼,在 8 月 8日聆聽NVIDIA 創(chuàng)始人兼 CEO 黃仁勛在 SIGGRAPH 現(xiàn)場發(fā)表的 NVIDIA 主題演講,了解 NVIDIA 的新技術(shù),包括屢獲殊榮的研究,OpenUSD 開發(fā),以及最新的 AI 內(nèi)容創(chuàng)作解決方案。


原文標(biāo)題:生成式 AI 研究通過引導(dǎo)式圖像結(jié)構(gòu)控制為創(chuàng)作者賦能

文章出處:【微信公眾號:NVIDIA英偉達(dá)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。


聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 英偉達(dá)
    +關(guān)注

    關(guān)注

    23

    文章

    4022

    瀏覽量

    97034

原文標(biāo)題:生成式 AI 研究通過引導(dǎo)式圖像結(jié)構(gòu)控制為創(chuàng)作者賦能

文章出處:【微信號:NVIDIA_China,微信公眾號:NVIDIA英偉達(dá)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    全球首個(gè)動漫專屬AI視頻生成平臺Animon,國內(nèi)版"萌動AI"正式發(fā)布

    平臺Animon正式推出國內(nèi)版產(chǎn)品——"萌動AI",為數(shù)億創(chuàng)作者帶來視覺革命。該平臺由專業(yè)的動漫制作團(tuán)隊(duì)和頂尖的AI技術(shù)團(tuán)隊(duì)聯(lián)合打造,并將專為專業(yè)創(chuàng)作團(tuán)隊(duì)和個(gè)人工作室設(shè)計(jì)的Animon
    的頭像 發(fā)表于 09-25 12:33 ?383次閱讀

    邊緣生成AI面臨哪些工程挑戰(zhàn)?

    本文由TechSugar編譯自electronicdesign當(dāng)大多數(shù)人想到人工智能(AI)時(shí),他們通常想到的是能夠生成新文本、圖像或語音內(nèi)容的應(yīng)用。像ChatGPT這樣流行的文本應(yīng)
    的頭像 發(fā)表于 06-25 10:44 ?768次閱讀
    邊緣<b class='flag-5'>生成</b><b class='flag-5'>式</b><b class='flag-5'>AI</b>面臨哪些工程挑戰(zhàn)?

    利用NVIDIA 3D引導(dǎo)生成AI Blueprint控制圖像生成

    AI 圖像生成技術(shù)突飛猛進(jìn),從早期模型會生成手指過多的人類
    的頭像 發(fā)表于 06-05 09:24 ?638次閱讀

    淺談生成AI的應(yīng)用場景

    AI 未來已來,將至已至:面對席卷而來的 AI 浪潮,許多高瞻遠(yuǎn)矚的公司、政府、研究機(jī)構(gòu)和初創(chuàng)公司不約而同地選擇了 Google AI 解決方案,為發(fā)展蓄勢
    的頭像 發(fā)表于 02-27 09:55 ?2172次閱讀

    富士通如何解鎖生成AI紅利 從人才進(jìn)化到業(yè)務(wù)

    生成AI技術(shù)正以每周迭代一次的速度重塑商業(yè)世界。利用生成AI,營銷部門10分鐘就可以產(chǎn)出百張
    的頭像 發(fā)表于 02-25 17:32 ?1015次閱讀

    聚云科技獲亞馬遜云科技生成AI能力認(rèn)證

    的應(yīng)用上展現(xiàn)出了卓越的能力。 聚云科技通過整合亞馬遜云科技的先進(jìn)技術(shù),從應(yīng)用范圍確定、模型選擇、數(shù)據(jù)處理、模型調(diào)優(yōu)到應(yīng)用集成與部署,為企業(yè)提供全方位的生成AI應(yīng)用落地支持。這不僅加速
    的頭像 發(fā)表于 02-19 10:33 ?716次閱讀

    聚云科技榮獲亞馬遜云科技生成AI能力認(rèn)證

    助力企業(yè)加速生成AI應(yīng)用落地 北京2025年2月14日?/美通社/ -- 云管理服務(wù)提供商聚云科技獲得亞馬遜云科技生成
    的頭像 發(fā)表于 02-14 16:07 ?605次閱讀

    聚云科技榮獲亞馬遜云科技生成AI能力認(rèn)證 助力企業(yè)加速生成AI應(yīng)用落地

    北京 ——2025 年 2 月 14 日 云管理服務(wù)提供商聚云科技獲得亞馬遜云科技生成AI能力認(rèn)證,利用亞馬遜云科技全托管的生成
    發(fā)表于 02-14 13:41 ?253次閱讀

    生成AI工具好用嗎

    當(dāng)下,生成AI工具正以其強(qiáng)大的內(nèi)容生成能力,為用戶帶來了前所未有的便捷與創(chuàng)新。那么,生成
    的頭像 發(fā)表于 01-17 09:54 ?685次閱讀

    Adobe發(fā)布新工具簡化內(nèi)容創(chuàng)作

    Adobe近日宣布了一系列面向內(nèi)容創(chuàng)作者的新工具和服務(wù),旨在利用生成人工智能技術(shù)簡化繁瑣的勞動密集型任務(wù)。其中,備受矚目的新工具——“FireflyBulkCreate”應(yīng)用程序,更是為內(nèi)容
    的頭像 發(fā)表于 01-15 10:39 ?640次閱讀

    全方位創(chuàng)意工作流程:西部數(shù)據(jù)推出全新消費(fèi)級存儲解決方案

    于一身,能夠完美適配家庭、工作室等各類創(chuàng)作場景,旨在幫助用戶更專注于創(chuàng)作出高質(zhì)量的內(nèi)容,啟迪他人靈感。 為提升與內(nèi)容創(chuàng)作者而生 全新的閃
    的頭像 發(fā)表于 01-08 11:52 ?934次閱讀
    全方位<b class='flag-5'>賦</b><b class='flag-5'>能</b>創(chuàng)意工作流程:西部數(shù)據(jù)推出全新消費(fèi)級存儲解決方案

    Google兩款先進(jìn)生成AI模型登陸Vertex AI平臺

    新的 AI 模型,包括最先進(jìn)的視頻生成模型Veo以及最高品質(zhì)的圖像生成模型Imagen 3。近日,我們在 Google Cloud 上進(jìn)一步推動這一勢頭,客戶可以在Vertex
    的頭像 發(fā)表于 12-30 09:56 ?869次閱讀

    NVIDIA推出全新生成AI模型Fugatto

    NVIDIA 開發(fā)了一個(gè)全新的生成 AI 模型。利用輸入的文本和音頻,該模型可以創(chuàng)作出包含任意的音樂、人聲和聲音組合的作品。
    的頭像 發(fā)表于 11-27 11:29 ?1083次閱讀

    NVIDIA生成AI閃耀CNCC2024大會

    在當(dāng)前數(shù)字化轉(zhuǎn)型的浪潮中,探索生成 AI 如何對新質(zhì)生產(chǎn)力提供強(qiáng)力,正成為推動社會進(jìn)步的重要課題。此前,10 月 24 - 26 日在
    的頭像 發(fā)表于 11-06 14:04 ?896次閱讀

    生成AI工具作用

    生成AI工具是指那些能夠自動生成文本、圖像、音頻、視頻等多種類型數(shù)據(jù)的人工智能技術(shù)。在此,petacloud.
    的頭像 發(fā)表于 10-28 11:19 ?1069次閱讀