<ul id="ouw02"></ul>
  • 手機版 | 網站導航
    觀察家網 > 專題 >

    GAN重出江湖!中國團隊搶先開源“復刻版”DragGAN,AI一鍵實現「大象轉身」

    微信公眾號:硅星人 | 2023-06-02 12:52:57

    在大家沉迷于Midjourney、Stable Diffusion 技術中無法自拔時,一時被人遺忘的GAN又帶著新技術重出江湖了。現在P圖,你只需要“輕輕點兩下”,AI就能迅速理解你的想法,秒速生成結果圖。

    DragGAN是由Max Planck研究所開發的一種新的人工智能工具,它允許用戶通過幾個點擊和拖動來真實地修改照片,目前還未對外開源。但王道控股旗下的“李白實驗室”算法團隊搶先重現了DragGAN的效果。


    【資料圖】

    目前,可直接使用的模型能夠讓你輕松掌控圖片中的人物和動物,通過拖拽控制點和目標點來調整他們的位置、形狀、姿勢等等。現在已經可以在 Hugging Face 上直接使用了。

    體驗入口:

    https://huggingface.co/spaces/wuutiing2/DragGAN_pytorch

    幾個點擊,輕松生成結果圖

    修改微笑弧度,讓一張嚴肅的照片變成露牙甜美笑

    放大圖片中小哥哥的眼睛

    拍照臉型不好看,一鍵瘦臉,毫無PS痕跡

    覺得貓咪太瘦不夠可愛,可以給它拉大臉龐,增加可愛度。

    發際線拯救神器,這簡直就是禿頭星人的救命工具

    輕輕一拖,在不影響美觀的情況下,可以讓貓咪的耳朵縮小

    讓獅子向右側方向移動,是不是和“大象轉身”的操作很接近

    可以隨意改變模特的發型,短發變長發;本來雙腳分開站立的模特,可以瞬間把腿拉至并攏

    原理揭秘:基于GAN的圖像編輯方法

    雖然上述的效果展示很多,但是其實DragGAN也就兩個技術原理:

    1、基于特征的運動監督,驅動手柄點向目標位置移動;

    2、一個新的點追蹤方法,利用鑒別性的發生器特征,不斷定位手柄點的位置。

    DragGAN是一種基于GAN的圖像編輯方法,可以實現運動監督和精確點跟蹤。任何人都可以通過DragGAN對像素進行精確的控制,進而編輯如動物、汽車、人類、風景等多種類別的姿態、形狀、表情和布局。

    DragGAN還允許用戶選擇感興趣的區域以執行特定于區域的編輯,而不需要依賴其他網絡。李白實驗室復現的“DragGAN”只需要幾秒就能完成效果,你可以選擇不同的迭代步數,步數越多效果越夸張,其生成時間就越慢。

    此外,DragGAN的無損優化功能可以讓用戶輸入二進制掩碼,指示圖像中的可移動區域,從而實現更細致的控制,避免損壞圖片的原屬性。

    與傳統PS的液化功能相比,DragGAN在編輯圖片時可以更好地保持圖片的原始屬性,并且具有更廣泛的應用范圍。例如,可以使用DragGAN來改變圖片中車輛的位置、大小和輪胎的形狀等。這種方法可以在幾次鼠標拖動的時間內完成,非常方便快捷。

    聚焦圖像處理:從大項目到“小”工具

    此次復現了DragGAN的“李白實驗室”是一個年輕的人工智能技術團隊,其中主創始人唐勇博士,畢業于美國賓夕法尼亞州立大學,在美國知名500強企業擔任技術學科專家,高級工程師等。其他成員均畢業于國內外知名高校,清華、北大、浙大、英國*理工和美國常青藤范圍等。

    在開啟創業之路之前,唐勇曾在美國的知名研究機構以及世界五*企業工作。他主導并參與了眾多社會、環境和能源的相關項目,這些項目的合作伙伴包括美國環保署,美國國家海洋和大氣管理局以及全球*能源公司。他專注于運用數學物理模型、高性能計算、多目標優化以及人工智能技術,解答現實世界中大尺度、多模態、多變量的復雜難題,這其中包括洪水預報、氣候變化、能源管道設備優化設計以及系統安全等一系列棘手問題。

    然而,現實世界的問題千絲萬縷,影響因子五花八門,充滿了無法預料的不確定性,完全理解其數學物理機理似乎是一項幾乎無法完成的挑戰。因此,在找到合伙人并得到杭州王道創投基金的支持后,唐勇還是成立了名為“李白”的人工智能實驗室,投入大量精力研發計算機視覺、語音以及自然語言處理等前沿技術,希望通過人工智能技術提升模型的泛化能力,從而更有效地解決現實世界的復雜問題。

    郭銘濤作為主創人員,也和在團隊一起攻堅克難后,終于復現了DragGAN。郭銘濤來自四川大學圖像所,目前在讀博士一年級,主要研究方向就是深度生成模型,此前他還獲得了CVPR 2023 工業圖像缺陷生成競賽冠軍。

    “李白實驗室”在智能圖像生成方面已經有不少積累。他們基于GAN技術實現了圖像分割、圖像修復增強、視頻處理等實用性功能,其中圖像背景分割算法模型在全球圖像分割alphamatting.com的模型評比中斬獲全球*,獲得國內外近30項學術和研究成果專利,80%為發明專利。

    他們還在2019年創辦了“PicUP.Ai皮卡智能”項目,海外同步上線“cutout.pro”項目,海外月活超千萬用戶,海外站更是躋身圖像編輯工具分類排名前十。

    2023年在DragGAN爆火期間,他們還推出“神采PromeAI”的項目。該項目通過算法優化升級,可直接應用于建筑、室內、產品、游戲/動漫場景設計中,不需要復雜的關鍵詞及參數設置,就可一鍵生成效果圖、線稿、電商產品圖等,實現把AIGC從玩具到工具的實用性轉變。

    李白實驗室告訴硅星人,自創立之初,他們便投入大量精力研發計算機視覺、語音以及自然語言處理等前沿技術。目前技術還在設計、營銷、生命科學等多個領域進行了商業落地,在實際生活中也得到了廣泛應用。

    他們此次開源“復刻版”DragGAN,也是為了能讓每一個普通用戶都能簡單使用這些工具,努力把AI技術革新的成功帶到普通用戶身邊

    若將DragGAN與圖像生成工具結合使用,下一代內容革新技術產品或許即將誕生,用戶將能夠更接近他們心目中理想圖像的輸入。

    也許不久之后,誰都可以輕松完成甲方提出“讓大象轉個身”的需求了。

    標簽:

    • 標簽:中國觀察家網,商業門戶網站,新聞,專題,財經,新媒體,焦點,排行,教育,熱點,行業,消費,互聯網,科技,國際,文化,時事,社會,國內,健康,產業資訊,房產,體育。

    相關推薦

    亚洲情综合五月天| 亚洲精品专区在线观看| 无码专区一va亚洲v专区在线| 亚洲国产高清美女在线观看| 久久国产亚洲高清观看| 亚洲av中文无码乱人伦在线r▽| 国产偷窥女洗浴在线观看亚洲| 久久精品国产精品亚洲人人 | 蜜桃传媒一区二区亚洲AV | 亚洲国产精品一区二区三区在线观看| 亚洲视频在线观看网址| 亚洲精品美女视频| 久久久久亚洲av无码专区喷水| 亚洲人成人77777网站不卡| 亚洲国产电影在线观看| 亚洲国产av高清无码| 亚洲H在线播放在线观看H| 亚洲AV无码久久久久网站蜜桃| 亚洲AV综合色区无码二区爱AV| 亚洲一区二区三区亚瑟| 在线精品亚洲一区二区| 亚洲精品乱码久久久久蜜桃 | 久久精品熟女亚洲av麻豆| 国产精品亚洲二区在线| 亚洲人成电影在线播放| 久久亚洲色一区二区三区| 亚洲精品高清国产一线久久| 久久精品国产亚洲AV果冻传媒| 亚洲精品免费观看| 亚洲国产精品成人综合色在线婷婷| 中文字幕亚洲综合小综合在线| 亚洲熟妇av午夜无码不卡| 韩国亚洲伊人久久综合影院| 亚洲七七久久精品中文国产| 亚洲线精品一区二区三区影音先锋 | 国产国拍亚洲精品福利| 亚洲动漫精品无码av天堂| 亚洲综合婷婷久久| 亚洲中字慕日产2021| 亚洲日韩精品无码专区加勒比| 亚洲av无码专区在线观看下载|