欧美无砖专区一中文字_制服丝袜国产精品主_亚洲香蕉国产福利在线播放_日韩1区2区3区蜜桃在线观看

您當前的位置 :三板富> 營銷 > 正文
環(huán)球頭條:中國AIGC創(chuàng)新,一場“逆互聯(lián)網(wǎng)”式創(chuàng)業(yè)
2023-04-14 09:57:37 來源:刺猬公社 編輯:news2020

那些浪尖之上的中國AI創(chuàng)新者,我們見過了

走進中國AIGC創(chuàng)業(yè)江湖。

最近兩個多月,刺猬公社前往上海、杭州、成都、廣州等城市拜訪了多家公司。一個驚人的事實是,幾乎所有公司——不論是做游戲的,還是做直播電商、新消費、教育培訓、健身、播客、長短視頻的——都在討論一個共同話題:


(資料圖片僅供參考)

以Chat GPT為代表的AIGC,會如何闖入并改變我們所在的行業(yè)?取代我的工作,還是給產(chǎn)業(yè)帶來新的機會?

這個問題,Chat GPT暫時還回答不了。它可能組織一段邏輯通順的語言,但想要獲得更多新知,乃至找尋AIGC創(chuàng)業(yè)的參考,還得把目光放在大廠之外的AIGC創(chuàng)新者們。

在AI生成設計、AI生成虛擬人、AI生成音樂和對話式AI等四個AIGC創(chuàng)業(yè)的主流領域,刺猬公社對話了四家不同賽道的創(chuàng)業(yè)公司。相比Open AI等國內外大廠,我們能看到他們走出了一條完全不一樣的道路:

從某種程度上講,這些AIGC創(chuàng)新者所展現(xiàn)出的產(chǎn)品、商業(yè)和公司組織特質,甚至是“反傳統(tǒng)互聯(lián)網(wǎng)”的。

01 不問出處,都在人工智能創(chuàng)業(yè)

2023年2月,一份叫《ChatGPT團隊背景研究報告》的文章在AIGC創(chuàng)業(yè)圈、投資圈和媒體圈盛傳。研究團隊針對ChatGPT項目做出貢獻的87個成員進行了背景研究,其中,團隊成員絕大多數(shù)擁有名校學歷,且具有全球知名企業(yè)工作經(jīng)歷。他們的顯著特征是“年紀很輕”“背景豪華”“聚焦技術”“積累深厚”“崇尚創(chuàng)業(yè)”和“華人搶眼”。

在以上這些特征中,名校背景以及技術實力奪人眼球,但更重要的是,對于這些人才來說,走前人未走過的路、開拓一個全新領域,是他們最重要的追求之一。這也鮮明的體現(xiàn)在了刺猬公社拜訪的四家AIGC創(chuàng)業(yè)公司身上,盡管AI浪潮在2022年才正式開始,但這些公司創(chuàng)立的時間要早得多,在AIGC概念尚不清晰的時代,他們就已經(jīng)開始了努力。

只不過那時的AI創(chuàng)業(yè),沒有如今的喝彩與關注。

時間撥回2016年,伴隨VR浪潮的起伏,成維忠和創(chuàng)業(yè)團隊把目光瞄準虛擬人賽道,于是,專攻虛擬人動作和表情生成技術的中科深智誕生了。但在動捕技術與動作表情庫剪輯占主流的虛擬人市場,由深層次AI算法驅動虛擬人技術,并沒有引起市場足夠的重視。成維忠告訴我們,直到現(xiàn)在,國內外市場中使用這項技術的公司也并不多。

這也讓公司的早期融資面臨著不小的問題。在研發(fā)虛擬人驅動技術的過程中,中科深智也采用過動作捕捉與動作表情庫剪輯,但成維忠始終認為,這些都不是虛擬人的原生技術,AI算法驅動才是未來最正確的道路。直到創(chuàng)業(yè)四年后,公司迎來了第一筆融資,從2020年中到2021年末,中科深智獲得了三輪融資,AI道路得以持續(xù)。

2022年是個變局,在此之前,AIGC不能算是虛擬人生成領域的最優(yōu)解,但大模型技術的發(fā)展成熟正在改變一切。在此基礎上,中科深智也探索出了虛擬人動作表情驅動的深層次技術——多模態(tài)大模型技術。根據(jù)成維忠的設想,虛擬人生成技術將會突飛猛進。幾年內,AI將能完成動畫電影級別的制作,80%以上的動畫產(chǎn)品都可以利用AI生成,未來電影工業(yè)或許將會發(fā)生一場AI革命。

整個行業(yè)在“飛躍”,對于幾年前的國內AI創(chuàng)業(yè)人們來說,這是難以想象的。

同樣是2016年,還在清華讀博的劉曉光加入了清華大學的一個專攻AI音樂的興趣小組,這便是新音樂產(chǎn)業(yè)公司DeepMusic的前身。DeepMusic最早的目標是幫助音樂愛好者更高效率地創(chuàng)作音樂。但在當時的團隊內部,已經(jīng)萌生了AI基于人的交互生成音樂內容的想法,其實已經(jīng)很“AIGC”了。

2018年,在劉曉光的帶領下,DeepMusic從一個興趣小組變成了一家科技公司,并拿到了清華系基金和音樂人李健的投資。用AI幫助音樂人創(chuàng)作,乃至AI自主創(chuàng)作音樂,成為了DeepMusic的目標。讓劉曉光印象最深刻的是兩年之后的2020年,全民K歌找到了他們,希望能夠在平臺內開發(fā)“一鍵remix”的功能,將已有的音樂伴奏進行風格化改編。

“他們提出的訴求是,一個月做出5萬首左右的伴奏。一般來說,一個20人的音樂人團隊需要兩年左右才能完成?!眲怨饣貞洠M管DeepMusic的AI生成技術已經(jīng)相對成熟,但并沒有產(chǎn)品化,“這個要求是我們產(chǎn)能的10倍?!?/p>

這是DeepMusic第一次大規(guī)模地應用自己的技術,在建立起了一個流水線化的生產(chǎn)流程后,一個月,他們最終完成了任務,5萬首伴奏的通過率達到99%。與中科深智一樣,DeepMusic的AI技術同樣是應用在企業(yè)端的,早期的AIGC創(chuàng)業(yè)公司與傳統(tǒng)的互聯(lián)網(wǎng)公司不同,他們不追求直接觸達C端,而是以輸出技術的方式加持B端,這不僅關于技術能力的發(fā)展,更是由市場需求決定的。

直到2022年AI作畫興起,AIGC才真正開始走進C端市場,而DeepMusic一類的創(chuàng)業(yè)公司,則在B端更高要求的應用中,不斷推進技術的發(fā)展。2022年,DeepMusic已經(jīng)成為了國內頭部的AI音樂公司,不僅擁有“配樂貓”“口袋音樂”等創(chuàng)作產(chǎn)品,還與QQ音樂等頭部音樂平臺展開合作,推出了多個AI音樂系統(tǒng)。

伴隨時間的推移,在國內,真正面向更廣闊用戶,人們觸手可及的AI產(chǎn)品也開始出現(xiàn)。計算美學旗下的畫宇宙平臺正是其中之一。

“從很早開始,我們就覺得人工智能加設計肯定是未來?!庇嬎忝缹W聯(lián)合創(chuàng)始人趙哲析告訴刺猬公社,在營銷場景不斷增加的情況下,國內設計人才與設計力仍舊存在短板。想要解決長久以來的供求不平衡,必然需要新技術帶來新變革。2020年12月,趙哲析和幾個同學一起創(chuàng)辦了計算美學,專攻AI設計領域。

計算美學生成的風格化圖片

他們最先拿出了一款AI生成logo的產(chǎn)品,之后的2022年1月,進階產(chǎn)品“圖宇宙”正式推出,可以在AI技術的加持下實時生成海報。在當時的國內市場,AI生成海報的產(chǎn)品僅計算美學一家,2021年末,計算美學也獲得了高瓴創(chuàng)投的數(shù)千萬融資,新的產(chǎn)品也被提上日程。

不同于大多數(shù)AI作畫平臺,計算美學從一開始的目標就是希望利用AI賦能專業(yè)設計,2023年初,他們搭建起一個專業(yè)級別的智能設計平臺——“畫宇宙”,能夠實現(xiàn)“無限畫板”“實時編輯”,在AI的交互和可控方面更進一步。

值得關注的是,無論是計算美學和DeepMusic,他們的創(chuàng)業(yè)團隊都有著深厚的名校背景。DeepMusic脫胎于清華大學的興趣小組,核心成員基本都來自清華大學。計算美學同樣有著類似的基因,據(jù)聯(lián)合創(chuàng)始人趙哲析的介紹,計算美學的設計團隊基本都來自清華大學美術學院,技術方面的成員則基本都來自清華和北大。

國內頂尖高校背景、年輕的研發(fā)團隊,他們依靠著自身的學術圈層聚集在一起,共同步入了一個未來風口之中。

而在對談中,幾位公司的創(chuàng)始人都提到了團隊的一大特點,那就是團隊的穩(wěn)定?!皩τ诤芏嗨惴üこ處焷碚f,做AIGC不一樣,需要很深度的團隊協(xié)作,在人工智能的團隊里,長期投入才能看到成果。”成維忠告訴刺猬公社,AI創(chuàng)業(yè)并不簡單,無論是研發(fā)技術還是產(chǎn)品,都需要長時間的投入。因此,相比于人員變動頻繁的互聯(lián)網(wǎng)行業(yè)來說,AI創(chuàng)業(yè)公司的技術團隊非常穩(wěn)固,創(chuàng)業(yè)幾年過去,團隊中最早的一批成員仍舊是中流砥柱。

“我們的核心算法團隊從來沒有變過。”秘塔科技聯(lián)合創(chuàng)始人、首席運營官王益為告訴刺猬公社,他的另一個身份被更多人熟知:B站知名UP主“王一快”。

在AI創(chuàng)業(yè)之前,王一快是一名律師,2018年,他和幾位NLP領域的技術專家一起成立了秘塔科技,最早從AI翻譯服務切入,并逐步推出文本校對、改寫潤色等功能服務。秘塔科技是國內較早利用大語言模型技術推動AIGC內容的公司,“我們的技術路線,從2019年開始做寫作貓就已經(jīng)決定了。”

“2018年左右,我們都認為AI理解上下文語境是非常困難的,當時基本都是單輪問答,甚至單輪問答里面也不能設置太長的條件?!币揽繉ψ陨碚Z言模型的不斷的深度學習訓練,2021年末,秘塔科技已經(jīng)能夠實現(xiàn)AI的多輪對話。

2023年,ChatGPT席卷全球;3月,秘塔科技推出了自研AI文本生成產(chǎn)品“對話寫作貓”,算得上國內第一批“中文ChatGPT產(chǎn)品”。在實際的體驗中,對話寫作貓已經(jīng)能進行流暢的中文連續(xù)對話,并且在法律內容領域展現(xiàn)出了一定的優(yōu)勢。

向對話寫作貓?zhí)釂柸踔前蓡栴}

但差距仍然存在,“我們現(xiàn)在這個百億級別參數(shù)的訓練量還沒有跑完,這更像是個Demo?!辈贿^王一快對于未來信心滿滿?!拔覀冞€有很多辦法讓多輪對話去變得更加智能,可以期待,在半年之內能夠達到跟ChatGPT持平的效果?!?/p>

在與四家公司的對談中,我們能夠勾勒出中國AI創(chuàng)業(yè)人的大體樣貌:他們來自各行各業(yè),基本都非常年輕、擁有名校背景、與此同時關注垂直領域,并擁有足夠穩(wěn)固的團隊。跟許多互聯(lián)網(wǎng)公司不同,他們不在意營銷與流量,在AI這個全新的世界里,技術就是王道,而新浪潮的來臨,則為他們帶來了新的機會與新的挑戰(zhàn)。

總的來說,不論AI生成設計、AI生成虛擬人,還是AI生成音樂、對話式AI,這些和大洋彼岸的Open AI、Google和Midjourney們處在同一賽道的中國AI創(chuàng)業(yè)者們,都想發(fā)揮自己的優(yōu)勢,努力向前奔跑。

02 中國AI創(chuàng)新者,不想“大干快上”

“我們想用對話寫作貓給大家看一下,不是只有巨頭才能干好,其實用少一點的資源、小一點點的模型,也能輸出一個非常好的效果?!蓖跻豢煺f。

在訪談中,王一快常常把訓練模型的過程比作“一個龐大而精細的工程”。它不是可控核聚變那樣的顛覆性創(chuàng)新,但AI創(chuàng)新者們需要做的,是在資源有限的條件下,去完成這個可能有著海量細節(jié)的工程,為用戶呈現(xiàn)出最佳的體驗。那些“沒錢干不了大模型”“百億規(guī)模的模型就是不行”的聲音,王一快并不認同。

以對話寫作貓為例,其模型的成本、規(guī)模比ChatGPT低了一個數(shù)量級,但依然屬于大語言模型,同樣可以完成效果近似的中文對話。王一快透露,這是因為對話寫作貓的模型參數(shù)規(guī)模更小,但做了更精細化的調優(yōu)工作?!癘pen AI和某組織差不多,無限的彈藥量——堆算力、扔數(shù)據(jù),打出一個比較好的效果;我們創(chuàng)業(yè)公司沒有那么多錢,用非常有限的資源,只能這么打?!?/p>

即便效果可能并不是100分,但對于中國的AIGC創(chuàng)新者來說,有和無的問題更為重要?!拔覀円欢ㄊ窍饶靡粋€60分的產(chǎn)品出來用著,然后在罵聲和叫好聲中成長,慢慢地走到80分?!蓖跻豢煺f。

除了低成本和“小步快跑”,將創(chuàng)業(yè)方向放到互聯(lián)網(wǎng)大廠尚未涉足的細分領域,也是很多AI創(chuàng)新者們的選擇。

“我們在2018年前后判斷,因為大廠的數(shù)據(jù)最多、資本集中,歌詞生成這種自然語言的問題一定是大廠去做的?!倍话愕乃惴üこ?,很難理解伴奏該怎么變、樂器該怎么彈、旋律該怎么寫這類“小眾”問題,這就是DeepMusic要去解決的。

在生成音樂的技術路線上,DeepMusic用的是“符號生成音樂”的路徑,而不是音頻的直接生成。也就是說,讓AI檢測中音頻中的音樂知識,把音樂拆解成各種各樣的模態(tài)符號,再利用符號去生產(chǎn)音樂?!爱敺柮枋龀鰜硪院?,一個音樂人已經(jīng)知道這些符號該怎么去配所有的樂器了?!?/p>

這樣一來,生成所需技術的復雜度比大模型小很多,但通過符號生成,也可以通過自己的路徑達到一個較好的音樂效果。

劉曉光表示,DeepMusic相當重視AI在專業(yè)用戶中的應用,比如,他們希望讓AI輔助音樂生產(chǎn)者的工作,真正嵌入音樂的生產(chǎn)流程里面。

在AI生成的過程中,可控是最難的。比如,當我們生成一段10秒的音樂時,想控制這段的音樂第二秒是什么樣的非常困難。而如果不能實現(xiàn)可控,AI也就沒辦法被音樂生產(chǎn)者真正用上。此外,想要嵌入音樂人的工作流,還要做出一個音樂工作站——蘋果系統(tǒng)里的“庫樂隊”,就是一個簡易版的音樂工作站。DeepMusic同樣花費了很多技術精力,做出了一個音樂工作站,支持詞、曲、編、錄、混的AI生成,并且用一個音樂引擎把這些模態(tài)結合起來。

與大廠在技術路線上的差異,體現(xiàn)在更多AIGC的細分賽道。CEO成維忠向我們對比了Open AI等大廠和中科深智的區(qū)別:

大廠們一般走從大語言模型到文生圖再到文字生成視頻、動畫的技術路徑,從生成圖片到讓圖片動起來,“順理成章”,這種動畫、視頻被業(yè)內稱為“幀視頻”,本質上是2D技術;

中科深智的技術則更類似3D,能夠直接生成3D的動作表情數(shù)據(jù),而這些數(shù)據(jù)本身是看不到的。它繞過了文字生成圖片的環(huán)節(jié),在渲染引擎的支持下,可以直接給出3D效果的虛擬形象。

而“3D”能帶來的好處是,在視頻質量和實時生成上有較大優(yōu)勢,能夠滿足專業(yè)內容和人機交互的需要。在元宇宙中也能更加適配3D立體環(huán)境,成為元宇宙的基礎設施。

“我們自己的定位首先是個技術公司,不是應用公司。”成維忠向我們強調,“我們的核心是搞定生成式AI?!睂τ跇I(yè)內流行的動作庫、表情庫、動作捕捉等技術去驅動虛擬人,中科深智從2022年上半年起就逐漸用AI生成,替換用模型庫來創(chuàng)造虛擬人的方式。

這不意味著AI創(chuàng)新公司和大廠之間是對立的,也不乏兩者合作的案例。比如中科深智,就和英偉達、Unity等公司合作;計算美學,和百度文心大模型以調用接口的方式進行合作。這可以讓AI創(chuàng)新公司們“站上巨人的肩膀”,將更多資源用在自己的競爭優(yōu)勢上。

計算美學的一大優(yōu)勢在于打通了各種AI技術之間的壁壘,可以在AI生成的過程中做消除、擦除,也可以做擴展延伸,還可以根據(jù)文字進行調優(yōu)。

在眾多文生圖產(chǎn)品中,常常需要用戶像“抽盲盒”一樣,生成好多次才能想要得到一張滿意的圖片,無法干預生成的過程。“我們一直強調AIGC的能力要可控”,趙哲析說,“越可控,效果越好,越能為客戶產(chǎn)生價值。”

“我們應用層更多的是以需求為導向去做創(chuàng)新”。趙哲析告訴刺猬公社,AI產(chǎn)業(yè)可以分為三層——基礎層,也就是阿里云、騰訊云、華為云等云計算廠商,他們負責提供算力;模型層,以百度文心、Open AI等大模型廠商為代表;而計算美學處于第三層——應用層,在以上底層能力的基礎上,開發(fā)創(chuàng)新性的應用產(chǎn)品,而不是做前期投入較高的基礎性研究。

03 商業(yè)化:AI、G、C,該走哪條路?

在AIGC的商業(yè)化上,追趕Google和Open AI的中國AI創(chuàng)業(yè)者們常常被詬病的,不是商業(yè)化太慢了,而是太早就趕著去做商業(yè)化。

有人舉例子說,百度度秘(小度前身)剛學會基本對話就做了小度AI、阿里達摩院對話機器人剛能說話就轉向阿里小蜜客服機器人、無人駕駛剛學會低速行駛和認障礙物就搞無人車配送,認為“國內的AI一出生就接受生存教育,未成年就走出家門去賺錢。”

先不論這種聲音是否片面,但它道出了國內AIGC創(chuàng)業(yè)的一個困境:要在何時、以何種方式走向市場,與千行百業(yè)發(fā)生聯(lián)系?

“作為一個實際的從業(yè)者,抱怨或者指責沒有意義?!睂τ凇皣鴥華I商業(yè)化是否操之過急”的問題,王一快認為各個國家有不同的國情,AI產(chǎn)業(yè)的發(fā)展模式也不會相同。只有順應潮流,滿足大家對AI發(fā)展的期待。

“你不早點讓它落地,這事就做不起來?!彼f,特別是在國內,“用戶和企業(yè)都是非常實際的,誰效果好、誰能快速地給我?guī)碇苯拥氖找妫揖陀谜l的,而不是迷信大廠?!?/p>

除了對于“何時搞商業(yè)化”的討論,AIGC商業(yè)化的焦點還集中在以下兩個維度:

一是AIGC商業(yè)化的方向,是靠AI賺錢,還是靠AI生產(chǎn)出的內容?

二是要做To B,還是To C?

先看第一個問題。對于“AIGC”這四個字母,劉曉光將之拆分為AI、G和C,其中AI意味著內容生產(chǎn)的形式,G代表內容生產(chǎn)的過程,C就是生產(chǎn)出來的內容。

AI的意義,在于讓生產(chǎn)變得更快、更便宜。內容本來就可以不依靠AI生產(chǎn)出來,但AI的參與,能讓投入產(chǎn)出比小于1的事情大于1,讓它變得商業(yè)價值。從這個角度看,AI的商業(yè)化核心,在于解決To B的問題。

相對來說,G和C更加偏向To C,就是“做一個AI,讓用戶能夠生產(chǎn)出可消費的內容”。而這種模式和20年前互聯(lián)網(wǎng)“羊毛出在豬身上狗買單”的商業(yè)模式?jīng)]有本質區(qū)別,都是通過產(chǎn)品吸引用戶停留,然后在用戶時長的基礎上賣廣告。

“現(xiàn)在沒有流量紅利了,所以這種模式可能并不是現(xiàn)在應該優(yōu)先嘗試的方向?!眲怨庹f,“做一個更好的內容生產(chǎn)工具,讓人生產(chǎn)出可消費內容,然后聚集起來做一個平臺,這件事可能很困難。”

比如DeepMusic的產(chǎn)品“口袋樂隊”,在沒怎么投流的狀態(tài)下仍能留存不少忠實用戶,但劉曉光不認為在此基礎上做個內容社區(qū)是個好選擇。相比無數(shù)渴望實現(xiàn)從工具到社區(qū)跨越的互聯(lián)網(wǎng)從業(yè)者,這種思路顯得頗為不同。

DeepMusic AI生成的音樂集

在UGC時代,內容就已經(jīng)迎來了大爆發(fā),到了AIGC時代,內容生產(chǎn)的成本又低了幾個量級,C的供給越發(fā)遠大于求。比如音樂,2022年中國生產(chǎn)了大約300萬首音樂,而人們會去聽的,只有幾千首。在流量紅利消失之時,只有那些具有消費潛力的內容——那些用戶愿意去看、愿意去聽的——才有價值。

既然AI內容社區(qū)和AI內容本身的商業(yè)化困難重重,那么,什么才是AIGC商業(yè)化的希望所在?

“C可能并不是下一個爆發(fā)點。”劉曉光說,“G可能是下一個內容生產(chǎn)的爆發(fā)點。”

他進一步解釋,過去可能有人對一件事感興趣,但被一些復雜的學習門檻卡在外面;現(xiàn)在,由于AI的參與,不用學習也可以參與制作,擺脫知識的局限,并在其中找到心流體驗、感受有趣的生產(chǎn)過程。最終,人們可以利用AI工具去完成藝術探索,實現(xiàn)AIGC對UGC的反哺?!拔覀儗嶋H上是在做AI音樂制作人,把音樂生產(chǎn)各個環(huán)節(jié)里的輔助工具給到用戶,讓AI告訴你怎么去做音樂?!?/p>

至于做To B還是To C,受制于國內用戶付費習慣的限制,面向To B客戶做標準化產(chǎn)品,是AIGC創(chuàng)業(yè)中的主流選擇。“做技術的公司一旦開始個性化定制,規(guī)模效應就出不來。我們公司成立以來,只要是做都是以標準化產(chǎn)品為主?!背删S忠說,目前主要收入來自于SaaS服務,即使有定制的需求,也只提供虛擬人底層能力的定制,其他的定制工作都是交給其他合作伙伴集成商完成的。

“一定是要做標品的?!蓖跻豢煲脖硎荆赥o B的業(yè)務中以標準化產(chǎn)品為主,向用戶提供大模型的API接口。“如果做模型的定制,目前看來耗費的人力、提供的服務還是非常重的,可能只會按照大的行業(yè)去進行調優(yōu)?!?/p>

趙哲析也認為,“AIGC商業(yè)化更多的機會還是在To B上面。”To C更多的只是圍繞流量做用戶轉化,但嘗鮮用戶的多是一次性行為,深入使用和付費意愿也相對較低。因此,計算美學從一開始做產(chǎn)品就是定位在面向To B行業(yè)。

想要在To C上做商業(yè)化,也不是完全沒有空間,只不過機會可能不在國內。成維忠透露,他們想要在海外布局一個可以由文字生成3D動畫的產(chǎn)品,以訂閱制方式做商業(yè)化,不再區(qū)分To B還是To C。

不過,對于AIGC創(chuàng)業(yè)者們來說,一切其實都在變化,遠未來到定局。趙哲析告訴我們, 他的工作時間里7成是在解決現(xiàn)有的需求,3成要在做探索?!白疃瓵IGC的應該是我們這些從業(yè)者,不能指望著你的客戶去你提需求提得特別精準。”

這種工作邏輯有點像調查和實驗:提出假設、論證假設,修改假設再去論證假設,最后把它變?yōu)檎嬲苈涞氐臇|西?!皠?chuàng)業(yè)最怕剃頭挑子一頭熱,你以為解決了一個天大的需求,找到目標客戶一問人家說不需要?!壁w哲析說,“我們是很務實的。

04 AI的未來,人機交互革命?

商業(yè)化、供需、應用,在一系列行業(yè)面對的實際問題之下,AI創(chuàng)業(yè)者們腳踏實地,但也把目光投向了未來。

在與四位創(chuàng)始人的對談中,幾乎每位都提到了“人機交互”,在他們看來,AIGC不僅是生成內容的變革,更在于人機交互形式的革新,這也是他們能在浪潮來臨前入局AIGC創(chuàng)業(yè)的深層原因。

“最早我們與計算機交互可能是紙上打孔,之后是DOS系統(tǒng)的代碼,隨后是利用鼠標和鍵盤與計算機交互,再到如今用手指點屏幕,下一步,很可能就是利用語音直接與機器進行交互?!痹趧怨饪磥?,未來可能會出現(xiàn)基于自然語言交互的操作系統(tǒng),對于偏向內容型的服務行業(yè),會有一個新的入口可以去占領。

“我們希望音樂能夠被更多感官所感受,實現(xiàn)更游戲化的音樂欣賞過程以及娛樂過程?!痹谧鲆魳稟IGC的過程中,DeepMusic一直希望把音樂變成一種“不只通過耳朵攝入的內容”,用聲音的模態(tài)和圖像、視頻的模態(tài)結合起來,生成多模態(tài)的內容,為用戶提供一種新的服務形式。

這并不是一種“空中樓閣”式的設想,在劉曉光的認知里,AIGC將開拓更多元的交互場景與內容消費方式?!耙恍┬」緵]有能力去做大模型,那是大資本集中去做的事。但在應用上,AIGC可以做到許多新的服務形式,并且找到新的入口去占領?!?/p>

劉曉光特別看好教育和游戲領域的“強人機交互”屬性,“用戶在付費的時候都會有一個心理錢包的問題,比如說為了一個工具、一個視頻平臺付費,意愿可能沒那么強,但為了游戲可能會花很多錢?!币虼耍珹IGC第一波成功的商業(yè)化,很可能發(fā)生在游戲化或者教育化的應用上。

計算美學同樣是在人機交互協(xié)作的理念下,才開發(fā)出了畫宇宙這樣的工具類AI產(chǎn)品,他們考慮到的則是未來內容生產(chǎn)模式的變化。

計算美學生成的風格化圖片

“人機協(xié)作方式利用AI把設計變得可量化,幫助設計師的生產(chǎn)。”交互也體現(xiàn)在了產(chǎn)品的設計上,“畫宇宙”讓AI作圖不僅是人輸入指令、AI生產(chǎn)作品那么簡單,而且利用智能工具總結梳理素材,并進行實時修改與編輯,真正實現(xiàn)人機的共創(chuàng),“這是以往產(chǎn)品形態(tài)做不到的”。

這并非是一廂情愿的構想,在2023年,AIGC及大語言模型技術已經(jīng)在改變內容生產(chǎn)的模式,“人機交互”的革新也正在發(fā)生。3月16日,微軟的Copilot正式發(fā)布,其將大型語言模型的能力嵌入到Microsoft 365應用程序中,在Word、Excel、PowerPoint、Outlook等產(chǎn)品中都有應用。

我們能夠清晰的看到生產(chǎn)與工作的方式在被改變,無論是根據(jù)用戶需求生成文檔、PPT,還是協(xié)助用戶分析數(shù)據(jù),制定計劃、編寫講稿,借由AI強大的理解能力,人機交互變得更加有效,大量的生產(chǎn)力將被解放。

這或許將不亞于從DOS系統(tǒng)打孔輸入指令到鼠標鍵盤交互的變革。AIGC的發(fā)展不僅是AI智能提升這么簡單,更重要的是其能更好的整合數(shù)據(jù)資源,實現(xiàn)高效率的指令觸達,并且這種提升是指數(shù)級的,人與機器、算力的關系將被重構。

“我們最近在梳理一個新的領域,NUI,也就是自然用戶界面。”同樣的,在中科深智的構想中,AIGC的發(fā)展將催動下一代操作系統(tǒng)的誕生。過往的功能菜單將會被自然語言對話取代,想要實現(xiàn)交互,只要最簡單的對話與動作就能實現(xiàn)。

成維忠還將人機交互革新擴展開來。他提到了元宇宙概念,作為把沉浸式體驗作為核心研發(fā)方向的公司,中科深智一開始就把AI算法驅動虛擬人視為通往真正元宇宙的入口。

他認為,在視覺技術、XR技術的發(fā)展之下,元宇宙的場景、物品都能得到不錯的解決方案,目前相關技術也已經(jīng)較為成熟,但在元宇宙中“人”則是最難點。無論是虛擬空間的NPC,還是現(xiàn)實人類的虛擬化身,都需要更好的交互體驗,而AIGC則是最重要的解決方案。

“元宇宙它本身其實是更加社交屬性的,在虛擬化的社區(qū)里,人和人之間的交流就變得非常的重要,沒有非常好的Ai的技術,實際上就做不到真正的千人千面,所有人的動作表情都一樣?!盇I則能成為解決實時交互問題的核心技術,在成維忠的眼中,AIGC的發(fā)展成熟更能夠催動真正元宇宙的來臨。

對于元宇宙行業(yè)來說,ChatGPT及大語言模型為代表的AI生產(chǎn)力或許并非取代者,而能夠帶來真正的加持。在過去的元宇宙設想中,高效率的數(shù)字資產(chǎn)生產(chǎn)與有效的社交交互是虛擬世界的最大痛點之一,而在AI技術的加持下,無論是場景、道具生成,還是虛擬人驅動,或許都將迎來新的機會。

在未來,3D內容創(chuàng)作者或許也可以將AIGC技術應用于創(chuàng)作中。不同于以前的費力建模,伴隨AIGC的發(fā)展,輸入prompt、或者“口述”,場景與人物、道具就能直接生成,同樣也能加持人們的虛擬體驗。據(jù)悉,世界最大的“元宇宙”平臺Roblox正在構建一個AIGC平臺,希望發(fā)展通過語音、文本或基于觸摸的手勢,取代鼠標和鍵盤移動,即可實現(xiàn)傻瓜式創(chuàng)建的便利工具,通過AIGC將其平臺上5880萬用戶打造成為創(chuàng)作者。AIGC正在真實的改變這些新興的行業(yè)。

說回國內的AIGC創(chuàng)業(yè)者們。在這場人機交互革命之中,微軟、谷歌、OpenAI等大廠所做的,就是依賴大模型產(chǎn)品搭建新一代操作系統(tǒng)的基礎設施,正如百度CEO李彥宏在近期的訪談中所說,不會再出現(xiàn)一個OpenAI,沒必要重復造輪子,在技術底層、大模型技術領域,在客觀條件之下,國內AIGC創(chuàng)業(yè)公司或許已經(jīng)失去機會,但在應用層,一切都還剛剛開始。

大廠們忙著搞“基礎設施”,而我們所關注到的這些AIGC創(chuàng)業(yè)公司們,則在各個垂直領域深扎下去,依靠他們掌握的技術及產(chǎn)品,或許能夠成為這個未來操作系統(tǒng)的組成部分,也就是一個個具體的“功能”。這也是屬于他們的天地。

尾聲

在刺猬公社遇見的AIGC創(chuàng)業(yè)者中,始終有著一個疑問,AI產(chǎn)業(yè)的春天真的到了嗎?

而產(chǎn)業(yè)大爆發(fā)的卡點,恰恰是AIGC技術本身。

成維忠舉了AI生成虛擬人方面的例子——現(xiàn)在能生成雙人的交互,多人交互還做不到。只有進一步突破技術障礙,才能未來在游戲、動畫等領域大規(guī)模應用。劉曉光表示DeepMusic希望做些“增量”,在AI技術的支持下,讓更多人參與到音樂的生產(chǎn)過程中,“真正讓內容生產(chǎn)者,用AI工具做自己想做的事?!?/p>

至于商業(yè)化的難點,“我認為沒啥難點?!背删S忠說,“因為技術還沒到,所以能啃下的市場還是很少。挖空心思地‘想出一個市場’去規(guī)避掉技術問題,我覺得沒必要?!蔽磥恚鯝IGC還是要拼技術賺錢。

因此,此時此刻正處于聚光燈下、浪尖之上的AIGC創(chuàng)業(yè)者們,也要做“時間的朋友”。?

“等風口過去了之后,才真正進入落地的場景。”王一快說,“就像我們當初討論5G一樣,等到現(xiàn)在都不討論這件事了,說明它已經(jīng)成了一個基礎設施,大家真正能用上了。”

標簽:

相關閱讀
版權和免責申明

凡注有"三板富 | 專注于新三板的第一垂直服務平臺"或電頭為"三板富 | 專注于新三板的第一垂直服務平臺"的稿件,均為三板富 | 專注于新三板的第一垂直服務平臺獨家版權所有,未經(jīng)許可不得轉載或鏡像;授權轉載必須注明來源為"三板富 | 專注于新三板的第一垂直服務平臺",并保留"三板富 | 專注于新三板的第一垂直服務平臺"的電頭。

最新熱點

精彩推送

 

Copyright © 1999-2020 watercolorsinc.com All Rights Reserved 
三板富投資網(wǎng)  版權所有 滬ICP備2020036824號-16聯(lián)系郵箱:562 66 29@qq.com