理想八周年的時候,李想發(fā)了一封內(nèi)部信。但在九周年的時候,李想延續(xù)了自今年3月的沉默和低調(diào),他沒有內(nèi)部講話,也沒有發(fā)內(nèi)部信,“他也就出來參與了內(nèi)部活動的抽獎。”一位員工說。
正因為如此,當(dāng)李想在12月25日到27日,連續(xù)三天通過采訪形式談理想在智能駕駛、人工智能的進(jìn)展和未來規(guī)劃,才會讓人覺得意外。
2022年11月,OpenAI的聊天機(jī)器人ChatGPT驚艷亮相。兩個月后,李想在內(nèi)部說“理想的愿景是成為一家全球領(lǐng)先的人工智能企業(yè)?!边@看起來像一種跟風(fēng)行為,但李想在2022年9月的時候就已經(jīng)確定把人工智能作為面向未來競爭的一個重要方向。
汽車是人工智能技術(shù)最好的落地場景之一,智能駕駛體驗對于用戶購車決策的影響越來越明顯,語音是智能座艙最高頻的交互方式?!?023年初發(fā)布的愿景,我們把人工智能從一個隱藏的戰(zhàn)略變成一個開放的陽謀的戰(zhàn)略,這樣我們才能吸引到足夠多的人才?!崩钕脒@樣解釋自己的人工智能發(fā)槍令。
重新回到鏡頭前,他宣告自己要從一家汽車公司CEO轉(zhuǎn)變?yōu)槿斯ぶ悄芷髽I(yè)CEO,因為理想做的不是汽車的智能化,而是人工智能的汽車化——正如之前所說,汽車是人工智能具象的最佳產(chǎn)品之一。李想還提出了一個新的概念——“硅基家人”。
“下半年看不到變化,你就別干了”
今年初,李想對理想汽車智能駕駛研發(fā)負(fù)責(zé)人郎咸朋說了一句話:“下半年如果我還看不到變化,我們還是拿不到(智能駕駛)頭部位置的話,你這個負(fù)責(zé)人就可以不用干了?!?/p>
早在2023年4月的上海車展上,理想汽車就喊出了城市NOA落地100城的目標(biāo),以應(yīng)對來自華為和小鵬的競爭。但僅僅半年過后,這個目標(biāo)就縮水為“在100城開通通勤NOA”。但兩者的實現(xiàn)難度都不小,基于Transformer的BEV算法加上Occupancy網(wǎng)絡(luò),以及理想汽車和清華大學(xué)聯(lián)合研發(fā)的NPN神經(jīng)先驗網(wǎng)絡(luò)(Neural Prior Net)提供不了符合要求的可靠性和穩(wěn)定性,效率也很低。
今年初,李想逼著智駕團(tuán)隊前往美國,在不同的城市駕駛特斯拉的車輛,體驗FSD V12.隨后,理想汽車轉(zhuǎn)向無圖NOA,但功能推送也延遲了3個月。
今年3月,理想MEGA和新款理想L7、8、9上市后的表現(xiàn)都沒有達(dá)到預(yù)期,理想汽車進(jìn)行了一輪裁員,其中智能駕駛團(tuán)隊屬于“重災(zāi)區(qū)”。郎咸朋帶領(lǐng)的團(tuán)隊一直在致力于用代碼解決“corner case(極端情況)”,今年上半年,他自己和團(tuán)隊也遇到了職業(yè)生涯的corner case。
對于理想汽車來說,調(diào)減年度銷量目標(biāo)、新車銷量不及預(yù)期、產(chǎn)品降價以及裁員,今年上半年都是壞消息。但從李想給郎咸朋撂下那句狠話之后——另外一句則是,李想和郎咸朋說“要么做端到端,要么別做自動駕駛了”,一些改變開始發(fā)生。
“我們統(tǒng)一了思路,還是回歸產(chǎn)品和用戶體驗上,而不是追求指標(biāo)的領(lǐng)先?!崩上膛笳f,在李想撂下狠話之前,理想已經(jīng)開始在端到端的預(yù)研,那些話則是加快了研發(fā)的進(jìn)程。
4月,理想將AD團(tuán)隊中的200人帶到中關(guān)村進(jìn)行封閉開發(fā),沖刺端到端技術(shù)的研發(fā)。半個多月后,5月初,郎咸朋就坐上了第一個端到端版本的測試車,測試路線是從中關(guān)村到北京交通大學(xué),途經(jīng)包括中關(guān)村大街、三環(huán)的主輔路以及北京交通大學(xué)附近的狹小、無劃線道路等路段。
“縱向比之前試過的所有車的狀態(tài)都要好,剎車非常擬人舒適,這些問題在規(guī)則階段用很多代碼都沒有辦法解決?!崩上膛蠛荏@訝,因為僅僅用了15天時間就做到了這樣的水平。理想智駕算法研發(fā)部門負(fù)責(zé)人賈鵬對郎咸朋說:“一行規(guī)則都沒寫,全是系統(tǒng)按照給的數(shù)據(jù)訓(xùn)練出來的?!?/p>
1個月后,郎咸朋讓李想試一下。在理想汽車北京研發(fā)中心,當(dāng)時經(jīng)緯中國合伙人張穎也在,李想就讓他坐在主駕駛,自己坐在副駕駛。李想在試了之后對效果也感到驚訝,評價很高,“過去1個月的訓(xùn)練比過去3年做的東西進(jìn)步速度要更快?!?/p>
李想還舉了一個讓他印象深刻的場景,在一個路口,有一輛車為了躲避行人往測試車輛偏向,但這輛測試車學(xué)會了適時避讓,并且沒有生硬、頓挫的感覺。李想對張穎的解釋是“因為端到端的響應(yīng)速度更快,不是規(guī)則時代的四個步驟了。
“李想說的all in智駕真的不是說說而已,他把智駕看得真的很重,也是真金白銀投入?!币晃焕硐肫嚨膯T工說。
去年9月的雁棲湖內(nèi)部戰(zhàn)略會后,李想聽從了美團(tuán)CEO王興和Y Combinator中國創(chuàng)始人陸奇的建議,加大了云端訓(xùn)練的投入,從字節(jié)跳動購買英偉達(dá)的服務(wù)器,還在外高價采購英偉達(dá)訓(xùn)練卡,還先后與阿里云、百度云等云服務(wù)廠商開展合作。
今年初,理想的智算中心算力在半年時間里從2.4ELOPS翻倍增加至5EFLOPS,并會在今年底達(dá)到8EFLOPS。理想汽車每年在訓(xùn)練算力的投入超過10億元?!拔覀兠磕?00億的研發(fā)投入,有一半是和人工智能相關(guān)的投入?!崩钕胝f。
但長遠(yuǎn)投入更大,理想汽車認(rèn)為,如果最終實現(xiàn)自動駕駛,需要的訓(xùn)練算力要增加到100EFLOPS,折合成投入每年要超過10億美元。李想認(rèn)為這些投入都是值得的。
他本人80%的時間都是用智駕在開車,另外20%是因為趕時間,需要駕駛效率,才不用智駕?!岸说蕉嗽隗w驗上最多可以做到L3的水平。”李想說。
“L3或者有監(jiān)督智能駕駛并不是L2的延續(xù),而是L4或者自動駕駛的先導(dǎo)程序。我們是錨著未來的自動駕駛能力去研發(fā)、去成長和迭代的,而不是沿著過去一套用L2的思路,去做現(xiàn)在的自動駕駛?!崩上膛笳f,這是理想在端到端上重金投入的主要原因之一。
另外,理想汽車發(fā)現(xiàn)優(yōu)秀的智能駕駛體驗的確對銷量有幫助。今年2月,理想的AD Max交付量占比只到20%左右,但在今年下半年超過50%了,這意味著理想汽車交付的是價格更高的車型。理想汽車希望能夠在2025年實現(xiàn)L3。
“現(xiàn)階段我們做的都是為了拿到L4的門票。電動化是拿智能化下半場的門票,為了實現(xiàn)L4,我們至少要有500萬輛車跑在路上,還要自己掌握 VLA(Vision Language Action Model,視覺語言行動模型)這個基礎(chǔ)模型的能力。”李想說。
今年10月14日,理想汽車第100萬輛整車在常州基地下線,此時距離第一輛下線整車過去了58個月。
“智能駕駛和理想同學(xué),我都不會舍棄”
今年理想汽車在銷量上遇到一些挑戰(zhàn),今年前11個月,理想汽車?yán)塾嫿桓读?4.2萬輛車,按照理想汽車的銷售能力樂觀估計,今年的交付量最多能達(dá)到50萬輛,只有年初目標(biāo)的大約62.5%。
盡管如此,理想汽車的銷量在造車新勢力中仍然處于領(lǐng)先地位,這確保了他們擁有健康的現(xiàn)金流。今年第三季度,理想汽車的凈利潤達(dá)到28億元,經(jīng)營性現(xiàn)金流為110億元,現(xiàn)金儲備1065億元。
健康的財務(wù)狀況是理想在研發(fā)投入上的首要條件。即使不這樣,李想仍然不會舍棄在人工智能上的投入?!百Y源有限的話,智能駕駛和理想同學(xué)我也不會二選一,我會削減其他的投入?!崩钕胝f。
OpenAI的ChatGPT剛發(fā)布的時候,李想就用了,他的第一感覺是“這才是人工智能應(yīng)該有的樣子”。
理想汽車智能空間AI負(fù)責(zé)人陳偉也同樣大受震撼,其中一個原因是大模型帶來的認(rèn)知智能和語言智能上突飛猛進(jìn)的變化,再者他們也在反思,為什么沒有快速把模型架做高做大。李想對陳偉和他的團(tuán)隊提出,要回歸用戶體驗,從核心問題——認(rèn)知智能開始解決。
因為他們的判斷是,除了OpenAI,絕大部分的團(tuán)隊技術(shù)水平都處于早期階段,在邊界還不清晰的情況下,要把握住第一性原理規(guī)模效應(yīng)。于是,李想和陳偉決定要做基座模型,從底層開始建設(shè),以保證未來的技術(shù)擴(kuò)容能力,應(yīng)對產(chǎn)品迭代需求。
2023年4月,Mind GPT 1.0的第一版模型完成。2023年年底,理想汽車推送了OTA 5.0,大模型上車。今年年中,理想的Mind GPT 迭代到了2.0。今年底,理想就會上線Mind GPT 3.0。相比較前兩代,Mind GPT 3.0的重點(diǎn)是語言模型,人機(jī)交互的延遲更低,交互更擬人。
面向未來,Mind GPT 的模型架構(gòu)采用的是MoE(混合專家模型)和Transformer結(jié)合,持續(xù)往前迭代?!拔覀兪窍M軌?qū)崿F(xiàn)從L1 ChatBot(聊天機(jī)器人)到L2(推理者)的變化。在L1,它能實現(xiàn)多模態(tài),擁有指令遵循的能力。當(dāng)理想同學(xué)走到L3的時候,Mind GPT 應(yīng)該是一個多模態(tài)智能體?!标悅フf。
李想把“智能體”稱之為“iPhone 4時刻”——普通老百姓都能用,能獨(dú)立、連續(xù)、持續(xù)的完成任務(wù),而不再需要密集的提示詞。
12月27日,理想同學(xué)的應(yīng)用程序正式在手機(jī)端上線,這也是第一家把智能座艙的語音助手做成手機(jī)應(yīng)用程序的汽車公司。就功能和使用而言,理想同學(xué)就類似于字節(jié)跳動的豆包、百度的文心一言。使用場景的擴(kuò)展,會給理想的語言大模型迭代提供更多樣化的數(shù)據(jù)。
“不做人工智能,我們什么也不是”
李想說,如果不能實現(xiàn)L4自動駕駛,理想很難邁入萬億俱樂部的行列。陳偉則更加直接:“我們要是在未來不做人工智能,我們什么都不是?!?/p>
智能駕駛和理想同學(xué),按照定義其實屬于人工智能的兩個應(yīng)用。但在李想看來,兩者一定能夠產(chǎn)生連接,關(guān)鍵在于基座模型進(jìn)化為VLA。因為語言模型和智能駕駛一樣,都是通過語言和認(rèn)知理解三維世界,用擴(kuò)散模型和生成的方式來還原真實的物理世界。
李想認(rèn)為,AGI(通用人工智能)有三個階段。第一個階段是“增強(qiáng)我的能力”,也就是輔助階段,L3也處于這個階段;第二個階段是“成為我的助手“,意味著人工智能可以完成任務(wù)并承擔(dān)結(jié)果,比如L4;AGI的終極階段就是“硅基家人”,人工智能成為家庭的一員,或者一位可信賴的朋友,不需要任何指示,對所有相關(guān)成員都有深入了解。
對應(yīng)來看,理想也正在分三步走,首先是在中國市場爭取成為第一,然后考慮在受美國限制以外的市場做到第一;2025年,理想的目標(biāo)是要在中國成為智能駕駛的第一,在語言智能、大語言模型以及所提供的服務(wù)方面進(jìn)入到前三;再往后,要把語言模型和智能駕駛合成一個更大的VLA模型,全面進(jìn)入智能體階段,也具備L4的能力。
在未來,理想還會做具身機(jī)器人,或者在2030年的時候推出一輛具備人工智能能力的超級跑車——這個想法可能在李想下單購買法拉利296的時候就已經(jīng)出現(xiàn),但未來的主導(dǎo)者可能并不一定是李想本人。
他同樣喜歡把企業(yè)的發(fā)展分為三個階段。在0-1的階段,他是主導(dǎo),是團(tuán)隊的天花板;但在1-10的階段,他可能就是瓶頸了,所以理想正在建立一個培養(yǎng)人才的體系,確保每個做產(chǎn)品的人都要比三四年前的李想更好。而在走向100分的階段,可能就會是年輕人在主導(dǎo)。
2024年,理想迎來了3000人的校招新成員,在李想的眼里,這些人比他們那一代人優(yōu)秀10倍以上,受到了最好的教育,心智成熟,更重要的是他們已經(jīng)拿出了結(jié)果。理想的技術(shù)展示會上AI相關(guān)產(chǎn)品有一半以上都是校招團(tuán)隊做出來的,這令他非常驚訝。
“我們常說一個時代已經(jīng)過去了,但我在他們身上看到一個時代已經(jīng)開始了?!崩钕胝f。
理想汽車-W股價現(xiàn)漲超4% 1月交付維持穩(wěn)定智能駕駛持續(xù)升級
不會像特斯拉一樣做Robotaxi!李想“回歸”談人工智能三個階段,還解釋了為什么買法拉利
我國生成式人工智能產(chǎn)品用戶規(guī)模達(dá)2.3億人
王江平:中國是人工智能最好的發(fā)展應(yīng)用場所
業(yè)績+題材雙驅(qū)動,AI“三件套”集體上揚(yáng)!創(chuàng)業(yè)板人工智能ETF華寶(159363)放量勁漲2.41%,“智取”四連陽
2024年12月新勢力“成績單”出爐!小鵬、嵐圖、零跑交付創(chuàng)新高!阿維塔再破萬,理想超5.85萬輛
還沒有評論,來說兩句吧...