
奧特曼頻頻造勢(shì)、全世界都在翹首以盼的GPT-5終于來(lái)了老品牌速配。
北京時(shí)間8月8日凌晨,OpenAI正式發(fā)布GPT-5模型,舉行了長(zhǎng)達(dá)1個(gè)多小時(shí)的線上發(fā)布會(huì)。在發(fā)布會(huì)上,OpenAICEO山姆·奧特曼(Sam Altman)將GPT-5描述為“迄今為止最智能、最快速且最有用的模型”。
GPT-5主要有以下亮點(diǎn):
1.GPT-5是一個(gè)融合模型,能夠根據(jù)問(wèn)題的復(fù)雜程度自動(dòng)調(diào)整思考深度;
2.GPT-5在多個(gè)行業(yè)基準(zhǔn)測(cè)試中創(chuàng)下新高,如數(shù)學(xué)、多模態(tài)、編程、醫(yī)療;
3.“幻覺(jué)”問(wèn)題大大降低,模型也變得更加誠(chéng)實(shí),會(huì)明確告知自身能力邊界。
這些不僅凸顯了模型在認(rèn)知深度和專(zhuān)業(yè)性上的突破,也顯示了大模型正從通用工具向垂直領(lǐng)域的專(zhuān)業(yè)化應(yīng)用邁進(jìn)。
眼下正值全球AI競(jìng)爭(zhēng)加劇的關(guān)鍵時(shí)期,OpenAI的目標(biāo)顯然已不只是模型本身,其商業(yè)化也在加速,在消費(fèi)者訂閱之外,“更靠譜”的GPT-5瞄準(zhǔn)了更多行業(yè)應(yīng)用。
“博士級(jí)別”
“GPT-4感覺(jué)就像在和一名大學(xué)生交談,GPT-5是我們主流模型中首次讓人感覺(jué)與一位真正的專(zhuān)家、一位博士級(jí)別的專(zhuān)家對(duì)話。”奧特曼在發(fā)布會(huì)上表示。
OpenAI此次發(fā)布的GPT-5被廣泛認(rèn)為是迄今為止最強(qiáng)大、最全面的AI模型,其技術(shù)指標(biāo)和實(shí)際表現(xiàn)均實(shí)現(xiàn)了質(zhì)的飛躍。
根據(jù)官方公布的數(shù)據(jù),GPT-5在多個(gè)行業(yè)基準(zhǔn)測(cè)試中創(chuàng)下新高:數(shù)學(xué)推理方面,它在AIME 2025測(cè)試中達(dá)到94.6%的準(zhǔn)確率;多模態(tài)理解(MMMU)得分84.2%;醫(yī)療健康領(lǐng)域(HealthBench Hard)表現(xiàn)也顯著提升至46.2%。
編程能力的飛躍是GPT-5最引人注目的亮點(diǎn)之一。在衡量編程能力的SWE-bench Verified測(cè)試中得分74.9%,在評(píng)估多語(yǔ)言代碼編輯準(zhǔn)確性的Aider polyglot測(cè)試中達(dá)到驚人的88%。
現(xiàn)場(chǎng)演示中,OpenAI研究員僅用幾秒就讓GPT-5生成了一款完整的法語(yǔ)學(xué)習(xí)游戲,包含數(shù)百行可運(yùn)行代碼老品牌速配,且無(wú)需人工調(diào)試。
“GPT-5是我們使用過(guò)的最智能的編碼模型。”Cursor聯(lián)合創(chuàng)始人兼首席執(zhí)行官M(fèi)ichael Truell反饋稱(chēng)。Cursor團(tuán)隊(duì)在測(cè)試中發(fā)現(xiàn),GPT-5能夠發(fā)現(xiàn)其他模型遺漏的代碼錯(cuò)誤,并能自動(dòng)運(yùn)行后臺(tái)代理完成復(fù)雜任務(wù)。
有AI企業(yè)的相關(guān)負(fù)責(zé)人向記者表示,“AI編程是AI落地最成熟的場(chǎng)景之一。”Meta首席執(zhí)行官馬克·扎克伯格此前曾表示,預(yù)計(jì)明年公司約一半的代碼將由人工智能編寫(xiě)。微軟首席執(zhí)行官薩蒂亞·納德拉也公開(kāi)表示過(guò),公司20%到30%的代碼是由人工智能編寫(xiě)的。
而AI編程的賽道已經(jīng)十分擁擠,全球三大公有云巨頭在“AI編碼助手”賽道已全部落子,初創(chuàng)公司也層出不窮。GPT-5的更新無(wú)疑會(huì)讓競(jìng)爭(zhēng)更加激烈。
此外,OpenAI還花了很多時(shí)間談?wù)揋PT-5解決醫(yī)療保健用例的能力。據(jù)OpenAI介紹,GPT-5是“最準(zhǔn)確的醫(yī)療問(wèn)題解答模型”,能夠幫助患者理解、應(yīng)對(duì)復(fù)雜的醫(yī)療場(chǎng)景并做出知情決策,在HealthBench上的得分高于任何先前的模型。
奧特曼在發(fā)布會(huì)上分享了一位乳腺癌幸存者的反饋,GPT-4在她確診時(shí)提供了關(guān)鍵的信息支持,而GPT-5現(xiàn)在更像是一位“思維伙伴”,不僅能解釋醫(yī)學(xué)概念,還能結(jié)合她的個(gè)人情況提供更細(xì)致的建議。
OpenAI同時(shí)強(qiáng)調(diào),GPT-5并非要替代醫(yī)生,而是通過(guò)增強(qiáng)患者的知識(shí)水平和提問(wèn)能力,改善醫(yī)患溝通質(zhì)量。
除了應(yīng)用上的能力飛躍外,模型本身也更加穩(wěn)定和易用。
值得注意的是,GPT-5是一個(gè)融合模型,能夠根據(jù)問(wèn)題的復(fù)雜程度自動(dòng)調(diào)整思考深度,從而在速度和準(zhǔn)確性之間取得最佳平衡。
奧特曼舉例說(shuō)明,如果問(wèn)GPT-5一個(gè)簡(jiǎn)單的問(wèn)題,它會(huì)快速回答;但如果是一個(gè)復(fù)雜的科學(xué)或工程問(wèn)題,它會(huì)像專(zhuān)家一樣深入思考,直至找到最優(yōu)解。這一設(shè)計(jì)也使得GPT-5在真實(shí)世界的應(yīng)用場(chǎng)景中表現(xiàn)更加穩(wěn)定。
備受關(guān)注的“幻覺(jué)”現(xiàn)象也顯著減少,啟用網(wǎng)絡(luò)搜索時(shí),事實(shí)錯(cuò)誤率比GPT-4o降低45%;在深度推理模式下,錯(cuò)誤率比o3低約80%。模型也變得更加誠(chéng)實(shí),會(huì)明確告知自身能力邊界,避免對(duì)無(wú)法完成的任務(wù)進(jìn)行猜測(cè)。
目前,GPT-5已對(duì)所有ChatGPT用戶開(kāi)放,包括免費(fèi)用戶,付費(fèi)用戶(Plus、Pro、Team)可獲得更高使用額度或無(wú)限使用。
商業(yè)化突圍
不難看出,GPT-5的更新更強(qiáng)調(diào)其可用性、可靠性,在這背后,是OpenAI的商業(yè)模式正面臨關(guān)鍵轉(zhuǎn)折點(diǎn)。
在最新一輪融資中,OpenAI已成功籌集到83億美元,估值達(dá)3000億美元。同時(shí),OpenAI的年化經(jīng)常性收入已從6月份的100億美元躍升至130億美元,預(yù)計(jì)年底前將突破200億美元。
但從產(chǎn)業(yè)角度看,GPT-5的推出正值全球AI競(jìng)爭(zhēng)進(jìn)入白熱化階段。谷歌的Genie 3世界模型、Meta的開(kāi)源Llama 3系列,以及中國(guó)企業(yè)的Qwen 3和DeepSeek R1等模型都在不同領(lǐng)域展現(xiàn)出強(qiáng)大競(jìng)爭(zhēng)力。
摩根大通此前發(fā)布的一份報(bào)告指出,盡管OpenAI估值驚人,其商業(yè)模式面臨的風(fēng)險(xiǎn)正在擴(kuò)大。OpenAI的早期優(yōu)勢(shì)在于其極高的消費(fèi)者使用率和品牌實(shí)力,但其多元化程度并不高,約75%的收入來(lái)自消費(fèi)者訂閱。
OpenAI顯然意識(shí)到了這一風(fēng)險(xiǎn),正積極拓展企業(yè)客戶和政府市場(chǎng)。就在GPT-5發(fā)布一天前,OpenAI宣布,將在未來(lái)老品牌速配一年內(nèi)以象征性的1美元價(jià)格,向美國(guó)所有聯(lián)邦行政機(jī)構(gòu)提供ChatGPT企業(yè)版。表面上看是低價(jià)策略,實(shí)則是為打開(kāi)利潤(rùn)豐厚的政府服務(wù)市場(chǎng)鋪路,建立長(zhǎng)期合作關(guān)系。
近幾個(gè)月來(lái),OpenAI一直在積極加強(qiáng)與美國(guó)國(guó)會(huì)議員和監(jiān)管機(jī)構(gòu)的聯(lián)系,并計(jì)劃于2026年初在華盛頓特區(qū)開(kāi)設(shè)其第一家辦事處。
今年6月,OpenAI推出了“OpenAI for Government”專(zhuān)項(xiàng)業(yè)務(wù),并與美國(guó)國(guó)防部簽署了一份價(jià)值高達(dá)2億美元的合同。根據(jù)該合同,雙方將合作探索人工智能在醫(yī)療保健、網(wǎng)絡(luò)安全和行政流程優(yōu)化等領(lǐng)域的應(yīng)用。
此次GPT-5的發(fā)布也與以往側(cè)重消費(fèi)級(jí)應(yīng)用不同,特別強(qiáng)調(diào)了GPT-5在各垂直行業(yè)的專(zhuān)業(yè)能力和商業(yè)化潛力,比如奧特曼在發(fā)布會(huì)上重點(diǎn)提到的編程能力和醫(yī)療領(lǐng)域的應(yīng)用。
OpenAI在介紹中表示,運(yùn)用推理能力時(shí),GPT-5在大約一半的情況下表現(xiàn)達(dá)到或優(yōu)于人類(lèi)專(zhuān)家水平,且在涵蓋法律、物流、銷(xiāo)售和工程等40多種職業(yè)的任務(wù)中,整體表現(xiàn)均優(yōu)于o3和ChatGPT Agent。
有分析認(rèn)為,在企業(yè)市場(chǎng),高級(jí)推理能力或許能為OpenAI創(chuàng)造差異化的經(jīng)濟(jì)價(jià)值。復(fù)雜問(wèn)題解決能力使GPT-5能夠切入高附加值領(lǐng)域,如戰(zhàn)略咨詢、投資分析、研發(fā)設(shè)計(jì)等,這些領(lǐng)域愿意為可靠的高級(jí)認(rèn)知能力支付溢價(jià)。
不過(guò),GPT-5是否能為Open-AI的企業(yè)份額帶來(lái)推動(dòng),還有待觀察。根據(jù)Menlo Ventures的數(shù)據(jù),Anthropic在企業(yè)人工智能中占有32%的份額,其次是OpenAI(25%)和谷歌(20%)。
Anthropic尤為強(qiáng)調(diào)安全性和可解釋性,已經(jīng)贏得了金融、醫(yī)療等高度監(jiān)管行業(yè)的青睞;谷歌則利用其云服務(wù)基礎(chǔ)設(shè)施和Workspace集成優(yōu)勢(shì),為企業(yè)提供一站式AI解決方案。OpenAI想要擴(kuò)大企業(yè)市場(chǎng)份額,還需要構(gòu)建更完整的企業(yè)服務(wù)體系和行業(yè)解決方案。
未來(lái),其垂直行業(yè)的深化進(jìn)展將成為驗(yàn)證商業(yè)模式可行性的關(guān)鍵指標(biāo)。
實(shí)盤(pán)炒股配資平臺(tái)提示:文章來(lái)自網(wǎng)絡(luò),不代表本站觀點(diǎn)。