黄色成人软件,午夜影院免费体验,V国产精品久久久久精品综合紧

智譜AI正研發(fā)對標Sora的國產(chǎn)文生視頻模型

最快年內(nèi)發(fā)布

日期： 2024-05-07

來源：鈦媒體

關(guān)鍵詞： 智譜AI 文生視頻

5月6日消息，估值超200億的國內(nèi) AI 大模型獨角獸公司“智譜 AI”正在研發(fā)對標OpenAI Sora的高質(zhì)量文生視頻模型，預計最快年內(nèi)發(fā)布。

“文生視頻目前處于一個快速發(fā)展的階段，預計今年將是文生視頻大模型的爆發(fā)期。國內(nèi)公司在文生視頻技術(shù)方面的客戶需求非常多樣，從電影拍攝到短視頻、游戲制作等。智譜也將通過使用更高質(zhì)量的數(shù)據(jù)和更大的參數(shù)，開發(fā)高質(zhì)量的文生視頻產(chǎn)品?！币晃恢亲V AI 內(nèi)部人士對鈦媒體App表示。

據(jù)悉，成立于2019年的智譜 AI，由清華大學計算機系的技術(shù)成果轉(zhuǎn)化而來，源自清華大學知識工程（KEG）實驗室。智譜AI CEO張鵬畢業(yè)于清華大學計算機系，與總裁王紹蘭同為清華創(chuàng)新領(lǐng)軍博士，董事長劉德兵師從高文院士，曾任清華數(shù)據(jù)科學研究院科技大數(shù)據(jù)研究中心副主任，三位創(chuàng)始成員都是KEG實驗室核心成員。

智譜 AI 是國內(nèi)最早入局大模型賽道的公司之一，也是目前國內(nèi)頭部大模型廠商代表之一。

2023年3月，智譜 AI 推出千億開源基座對話模型ChatGLM系列，并在過去一年內(nèi)完成4次升級，于2024年1月推出GLM4系列。

同時，基于全自研基座大模型的能力，智譜 AI 亦已構(gòu)建了AIGC模型產(chǎn)品矩陣，包括 AI 提效助手智譜清言、高效率代碼模型CodeGeeX、多模態(tài)理解模型CogVLM和文生圖模型CogView等。

張鵬在今年3月透露，截至2023年底，智譜 AI 已擁有超2000家生態(tài)合作伙伴、超1000個大模型規(guī)?；瘧?，另有200多家企業(yè)跟智譜AI進行了深度共創(chuàng)，覆蓋傳媒、咨詢、消費、金融、新能源、互聯(lián)網(wǎng)、智能辦公等多個細分場景的多個頭部企業(yè)。

張鵬強調(diào)，由于智譜對多個模型版本進行開源，所以到目前為止，智譜ChatGLM-6B全球累計下載量已經(jīng)超過了1300萬，GitHub Star星數(shù)達到5萬，整個量級超過了Meta Llama兩個版本的總和。智譜 AI 已獲得全球最受歡迎的開源機構(gòu)的第五名，是全球唯一一家上榜的中國機構(gòu)和組織，“力壓了包括OpenAI、谷歌，還有微軟”。

融資方面，智譜AI已完成五輪融資。投資方包括君聯(lián)資本、啟明創(chuàng)投、中科創(chuàng)星、美團、螞蟻、阿里、騰訊、小米、金山、順為、Boss直聘、好未來、紅杉、高瓴等多家機構(gòu)，2023年融資額超過25億元人民幣，最新一輪是2024年3月北京市人工智能產(chǎn)業(yè)投資基金參與投資。

截至目前，智譜 AI 公司估值超過200億元人民幣，是國內(nèi) AI 領(lǐng)域獨角獸（超過10億美元）企業(yè)。

鈦媒體App了解到，對于智譜AI 當前的綜合能力水平，內(nèi)部人士稱“性能接近海外頂級模型”。

“最新基座大模型GLM-4，整體性能相比上一代大幅提升，逼近 GPT-4。如果做一個比較量化的對比，我們當時對標的對象是GPT-4，其性能的對比可以在很多方面上做到 95%左右。在比如中文對齊的任務下，我們甚至可以略微超過它。根據(jù)最新的海外伯克利Arena Hard 基準測試,GLM排名僅次于GPT-4 Turbo 和Claude 3 Opus，在國內(nèi)外模型中均處于領(lǐng)先地位。”智譜內(nèi)部人士稱。

智譜內(nèi)部人士反復強調(diào)，公司是投入時間比較早，擁有完全自主、自研、國產(chǎn)化的千億級模型算法，并且實現(xiàn)全棧國產(chǎn)化，從底層到模型層、應用層、應用接口PaaS層等實現(xiàn)全棧的自主研發(fā)。同時，在整個大模型體系里邊，除了語言模型，智譜還有文生圖模型、圖生文模型、代碼模型等多種模型，與目前全球最先進的OpenAI相比，其模型種類跟它形成了一一對標。

鈦媒體App了解到，雖然智譜 AI 已研發(fā)出多模態(tài)模型GLM-4，但據(jù)悉，今年2月Sora發(fā)布之前，智譜AI已經(jīng)在研發(fā)文生視頻模型。

智譜 AI 內(nèi)部人士坦言，對標Sora的文生視頻模型發(fā)展突破的關(guān)鍵主要包括技術(shù)路線選擇、訓練所用的高質(zhì)量視頻素材語料兩個方面。

“技術(shù)路線上，Transformer 與Diffusion 的結(jié)合架構(gòu)如何在效率和效果上進行優(yōu)化，如何解決連續(xù)幀之間的抖動問題，如何在滿足高分辨率的同時實現(xiàn)高一致性的長序列生成，如何獲取高質(zhì)量數(shù)據(jù)泛化到更多更細節(jié)的真實場景，都是技術(shù)上需要解決和通過大量實驗試錯的問題；數(shù)據(jù)集方面，此前 Sora 被評價模型對攝影術(shù)語(跟拍、平移、鏡頭切換)的理解有限，所生成的視頻后期還需要對視頻素材進行超分處理。公司會注重更全面的優(yōu)質(zhì)數(shù)據(jù)版權(quán)與使用?！鄙鲜鋈耸糠Q。

但值得注意的是，早前智譜 AI 投資的生數(shù)科技與清華大學聯(lián)合發(fā)布中國首個長時長、高一致性、高動態(tài)性視頻大模型Vidu，被稱為“國內(nèi)首個Sora級視頻模型”，也是中國首個純自研視頻大模型。

一旦智譜也發(fā)布類似的文生視頻模型的話，智譜AI將與被投公司生數(shù)科技產(chǎn)生競爭關(guān)系。

據(jù)鈦媒體App編輯梳理，截止目前，智譜 AI 以產(chǎn)業(yè)型投資方式，已經(jīng)投資、入股超過13家 AI 產(chǎn)業(yè)鏈的初創(chuàng)公司。

張鵬曾向鈦媒體App等表示，今天的智譜 AI正在經(jīng)歷一個從量變到質(zhì)變的過程，特別是像大模型所謂的涌現(xiàn)。而公司目標是瞄準AGI，實現(xiàn)超過人類水平的超級認知智能、實現(xiàn) AI 的自我解釋、自我評測、自我監(jiān)督，同時還將確保模型安全、可控。

Magazine.Subscription.jpg

版權(quán)聲明：本站內(nèi)容除特別聲明的原創(chuàng)文章之外，轉(zhuǎn)載內(nèi)容只為傳遞更多信息，并不代表本網(wǎng)站贊同其觀點。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問題，請及時通過電子郵件或電話通知我們，以便迅速采取適當措施，避免給雙方造成不必要的經(jīng)濟損失。聯(lián)系電話：010-82306118；郵箱：aet@chinaaet.com。

智譜AI正研發(fā)對標Sora的國產(chǎn)文生視頻模型

日期： 2024-05-07

來源：鈦媒體

相關(guān)內(nèi)容