人工智能巨子 OpenAI 最近总算推出了万众等待的新一代旗舰模型 GPT-5。
在发布会上,CEO 山姆·奥特曼用一个颇具戏剧性的比方来描述它的跃升:“GPT-3 像高中生,偶然有灵光却缺少安稳;GPT-4 像大学生,兼具智能与有用;而 GPT-5,则像是与一位博士级专家对话。”
他还自嘲“在 GPT-5 面前一无可取”,吊足了全球用户的食欲。这场等待了两年半的晋级,“千呼万唤始出来”。
说起来,GPT-5 的诞生并不简略。背面阅历了长达一年的困难研制,中心团队还被高薪挖角,算力开支大得惊人。
OpenAI 这一路真是走得既焦虑又艰苦。现在,总算把这个“一致体系”搬上了台面,我们都在等它能带来什么新花样。
归纳来说,GPT5 最大的改变便是从一个“谈天机器人”进化成了一个真实能干活的“万能助理”。
首要,多模态开挂让这个新助理的“脑子”变好使了。曩昔你跟它说话、发图都得分开来,现在是“听说读写看”一把抓,你丢给它什么它都能马上了解。
更要害的是,它学会了“着手”。曾经的 GPT 只能给你出主意,现在的 GPT-5 能直接衔接你的其他软件,帮你操作Office、在开发工具里写代码,乃至处理工作流程。
为了让这个助理不那么板滞,OpenAI 还给它预设了不同的“品格”,你能够随时把它切换成毒舌的、谨慎的或许善解人意的形式。
自从 DeepSeek 创始了“Think 形式”之后,让大模型在答复前先“想一想”好像成了职业标配,各家都推出了相似的功用。
但 GPT-5 有点不一样,它把这个进程变得更直接了。
你不需求去特意寻觅或点击某个按钮,只要在发问时加上一句“认真思考”,体系就会主动为你切换到那个更拿手深度剖析的 gpt-5-thinking 形式,用更强的“脑力”来处理你的问题。
接着便是 GPT 传统保留节目:屠榜。OpenAI 甩出了 25 个榜单,鳞次栉比的图表告知你 GPT-5 在各个维度有多牛。
事实性错觉大幅削减,比 GPT-4o 少了 44%,比 o3 少了 78%,基本上是不胡言乱语了。
数学比赛直接干到了满分,实践国际编程才能新高,人类常识测验新高,多模态才能新高……横竖便是新高,新高,满是新高。
发布会一完毕,全球的网红和博主们就榜首时间冲了进去,开端对 GPT-5 进行形形色色的“极限施压”测验。
其间,50 万 粉丝的油管主 Matthew Berman 搞了个大的,他用一个 25 分钟的视频,密布展现了 GPT-5 近 30 个可谓反常的使命。
比方,让 GPT-5 写了个程序,能瞬间生成、打乱乃至恢复一个杂乱的 20 阶魔方。
更狠的是,它直接在网页里复刻出了 Word 和 Excel 的完好使用。留意,是能用的那个软件,而不是给你画个表格那么简略。
从经典的“生命游戏”3D版,到能够随意调理重力、空气阻力的流体动力学模拟器,GPT-5还真如奥特曼之前比方的“博士生水平”。
但是,就在开发者们为之狂欢时,另一边的画风却完全不同。
本钱市场最先用脚投票,发布当天概念股遍及回调,明显没被这个“博士生”完全感动。
究竟,我们等了两年半,等待的是一场惊天动地的革新,成果只等到了一次意料之中的惯例晋级,绝望在所难免。
更何况,现在的 AI 比赛早已进入了严酷的“春秋战国”年代,各路诸侯的技能距离正在飞速缩小,OpenAI 再想靠惯例爱情小熊动漫在线观看操作就甩开对手几个身位,现已难上加难。
在这片喧嚣中,OpenAI 的老冤家马斯克更是榜首个站出来唱反调,直接甩出成绩单,表明 GPT-5 还不如他家的 Grok 4。
不只本钱和对手不买账,一般网友的吐槽声也越来越大。
我们最直观的感触是,GPT-5 的“智商”好像是高了,但“情商”却下降了。
很多人反映,现在用它写案牍、写话术,感觉文字变得僵硬、机械,没了曾经那种灵动和天然。
有网友言必有中地戏弄:“心情和逻辑就像跷跷板,你把逻辑这头死死按住,情感那头可不就弹飞了吗?”
难怪不少网友忧虑自己最随手的 GPT-4.5 会就此消失,不过很快就有热心网友发现,设置里其实有个开关,曩昔的模型仍是能够切换回来的。
这种感觉,让很多人觉得 AI 好像真的进入了瓶颈期。
而争议最大的,仍是官方每次都吹得最响的编程才能。
很多人榜首反响仍是:“感觉不如 Claude 好用啊?” 这种“奥特曼式营销”宣扬时不着边际,实践用起来却有落差,让不少人对榜单上的“新高”打了好几个问号。
不过也有网友反应开发一个粤语学习使用,让几家大模型都试了试,成果 Claude 和 Gemini 在生成 UI 和精准修正代码时都或多或少出了问题,只要 GPT-5 稳稳地完成了使命,作用还出奇地好。
说到底,GPT-5 给人的感觉,就像一个严峻偏科的天才:它的文科乌烟瘴气,写不出有温度的文字;但它的理科,尤其是在需求紧密逻辑和杂乱工程才能的范畴,仍是非常抗打。
老狐觉得网友的这句话就归纳得恰如其分:仅仅没有预期那么好……但仍旧是当时最能打的大模型。
本文来自微信大众号“科技狐”(ID:kejihutv),作者:老狐,36氪经授权发布。