刚才发布了最强的Openai Model O3!我第一次可以在

“ O3已到达或接近天才水平。”刚才,OpenAI O3/O4 Mini模型终于正式推出了。实时广播持续了大约30分钟,速度如此之快,以至于飞行速度,但是信息量已满。 O3本身的排放过程也被逆转。今年2月,OpenAI宣布将制定独立的O3发布计划,该技术将包装并塞满GPT-5。在4月初,习惯“饥饿营销”的Altman声称他的计划发生了变化:如果您想先去O3,GPT-5必须等待,首先,这将需要几个月的时间。 O3,如果您想先走,GPT-5就必须等待,第一个将需要几个月的时间。扩展全文 一系列或最新系列的最智能模型极大地提高了推理的能力,并且更长的时间是PAG思想的时间,效果更好。 首先,图像是直接的ly集成到思维链中,图像是“思考”,可以将图像直接调用以处理图像。 首先,它完全支持Web搜索,文件审核,Python代码实现,视觉输入深度和图像生成。 就成本效率而言,这比前几代好,并且在延迟和成本下,O3的性能更强。 从现在开始,将诸如型号选择器,Chatgpt Plus,PRU和团队用户替换诸如O1之类的型号可以使用O3,O4-Mini和O4-Mini-High,并且公司和教育用户将获得一周的访问权限。 O3-Pro预计将在几周内发布。 自由用户可以通过“思考”模式使用O4-Mini,并且速率限制保持不变。 开发人员通过聊天完成和API响应访问,支持函数调用的推理和优化,并很快支持内置工具,例如Web搜索。 OpenAI推断的最强模型已发布,GPT-5还远吗? 最新的O3和O4-Mini发行版是一系列O系列中最明智的模型。 这两个模型在推理功能,工具使用和多模式处理方面表现良好,并且可以随着时间的推移考虑复杂的问题。首先,它完全支持Web搜索,文件审核,Python代码实现,视觉输入深度和图像生成。 从老年研究人员到顺序用户,新模型还具有更广泛的情况。 OpenAI O3和O4-Mini可以通过API函数调用来调用Chatgpt工具,并访问自定义工具。 Openai释放O3和O4-Mini,说O3可以“产生假设”小说'|蜂巢 通过研究加强,OpenAI还训练这两个模型如何使用工具 - 不仅知道如何和何时以及在正确的可靠答案中快速地快速使用,通常需要少于一分钟的时间。 例如,当被问及如何将加利福尼亚的能源与去年进行比较时,您可以搜索公共消费在在线数据上,编写Python代码预测,生成图表或照片,并解释预测的基础,并正确连接许多工具。查找推断的整个过程也很灵活且波动性:该模型可以几次调用搜索引擎以交叉验证结果;如果您缺乏知识,则可以进一步探索信息并包括跨型输出。 在今天早上的现场广播期间,Openai总裁Greg Brockman也很罕见。 OpenII表演者展示了新模型如何结合用户兴趣,并发现对用户感兴趣但尚不清楚的内容。 在新模型为您提供“内存”功能之后,您将了解主持人的兴趣 - 跳伞和音乐。 而不是简单地讨论这两个爱好分隔礁,然后用水下水扬声器重新播放录音,这将加快新珊瑚和鱼类的繁殖,并帮助珊瑚礁治愈和再生。 期间内容创建过程,该模型还会自动创建完整的博客文章。首先,它使用数据分析工具来产生可视化,并用画布创建了一个博客文章,并附有引用和资源。 作为旗舰旗舰店的最新模型,O3在编程,数学,科学和视觉感知的领域中创造了新的记录,例如CodeForces,Swe-Bench和MMMU基准,视觉活动为87.5%,并且Mathvista的视觉活动为75.4%。 对专家的外部分析表明,O3也比O1少20%,并且可以生成并批判性地评估生物学,数学和工程领域的新型假设,适用于复杂的查询。 O4-Mini是“较小”,可快速和低成本。在AIME 2024和2025数学测试中,它的准确率分别为92.7%和93.4%。这比非茎科学活动中的O3米尼更好,而且可以很好地处理更多请求,并且更适合需要快速响应的方案。 性能比较表明,在AIME,CodeForces,GPQA和MMMU等试验中,O3和O4-Mini超过了前几代,并且对命令和质量响应的遵守也有了显着改善。通过对话中的记忆和历史对话编译,答案在相关性方面更为个性化。 在整个Openai O3的整个发展过程中,Openai指出,大规模的增强研究表明,与培训前GPT系列相同的趋势。 结合这条路径(加强研究),OpenAI通过数量级增加了训练和理解时间。但是我仍然看到了显着的性能改善。凭借延迟和成本为O1,O3的表现更好,并使它有更多时间思考它,并且效果会更好。 Openai并没有忘记画蛋糕,还说O3和O4-Mini展示了合并或系列O的过程F本系列具有GPT系列的自然对话和工具使用,预计未来的模型(GPT-5)将进一步包括这些好处,以为用户提供莫名其妙,更实用的经验。 “思考”图片的能力偶尔意味着 - 而“思考太多” OpenAI O3和O4-Mini也是最新的视觉侵制模型或串联。 如何理解视觉卑鄙模型?根据官方报告,该模型首次将图像直接包含在思维链中,从而解决了一个新的问题,该问题解决了一种结合愿景和推理的愿景。 使用Python数据审核,Web搜索和图像生成等工具,它也可以处理更复杂的任务。 上传白板照片,教科书图表或手绘草图。尽管图像模糊,颠倒或质量较差,但可以准确地解释该模型,并直接调用该工具来处理图片。 Ang Pag -crop,旋转,比例尺和其他操作ARE没问题。 关键是这些功能是本地的,不必依靠单独的专用模型。 Blogger @Danshipper通过模糊图片找到了一个婴儿车品牌。从图片来看,整个过程还搜索了十二个网页。 我还上传了Wekan大楼的照片,O3准确地认识到该建筑位于Huaihai Road附近,但答案没有给出建筑物的名称。 当然,这种思维方式不是“缺陷”: 极其思考:模型可以过多地依靠工具或图像处理,从而导致一条漫长的思维链。 痴迷于眼睛:即使使用该工具正确使用,视觉争议也会导致错误的答案。 能力:相同的问题被扰乱多次,模型可能采用不同的途径,并且一些结果是不正确的。 就成本效率而言,O3和O4-Mini比前几代好。在2025年的AIME测试中,成本效益比O1和O3-Mini更好,这是更聪明,更有效。 O3输入每百万个令牌的成本(大约750,000个单词,比《指环王》系列的长度更长)为10美元,每百万个令牌的输出成本为40美元。 O4-Mini的投入为每百万个代币,每百万美元的产出额为每百万个代币,每百万个代币的产出。 之前,Openai接触了几个月到几天的安全性测试时间。 O3和O4-Mini系统卡显示,OpenAI正在重建安全培训,增加了新的生物威胁,恶意软件和越狱攻击以拒绝信号。 根据最新的准备框架,O3和O4-Minth风险在生物学和化学,网络安全和AI自我完善领域的“高”阈值之下。 ▲图片附加到Codex Cli GitHub地址:https://github.com/openai/codex 尽管该代理迟到了,但Openai还推出了一个轻巧的终端编码代理-Codex CLI。 基于O3和O4-Mini的功能识别,Codex CLI支持多模式输入,并且资源向GitHub开放。此外,OpenAI还启动了一项100万美元的计划,以支持相关项目,并接受了25,000美元的资助API积分。 Openai目前真的很开放。 根据报道,法典有两种操作模式,一种是“建议模式”(默认模式):建议用户确认命令,而其他命令则是“完整自动模式”:禁用对网络的访问,允许代理商独立工作,但要确保其安全。 在实时演示期间,OpenAI研究人员将屏幕截图拖到了终端,Codex CLI通过多模式推理,访问用户文件以及最终生成的HTML文件,创建ASCII ART生成器,并成功添加了网络摄像头API。 值得一提的是,根据彭博社的说法,OpenAI计划将AI编程工具公司Windsurf提高到30亿美元。如果收购成功,它将是最大的提取现在的Openai。 该报告指出,一旦达成交易,Openai就可以更直接地与诸如Anthropic,Github和Anysphere拥有的Microsoft之类的Thosecompanies竞争,从而使用编程工具在快速增长的工具市场中立足。 “天才级别”的O3吸引了Altman向前和支持,但是这些问题无法正确回答... 一些X平台博客作者提前获得了新模型的经验的资格,并分享了他们的用户体验。 @Danshipper有一个星期的经验,他说O3很快,非常“动力”,超级聪明,一般的感觉很棒。最喜欢的用途包括: 一个简单的机器学习课程开发并提醒每天早晨一个博客作者学习 通过模糊图片找到婴儿车品牌 以超快的速度编写新的AI基准程序 研究安妮·迪拉德(Annie Dillard Classic)活动,例如X射线,挖掘博客作者从未注意到 看到t的分钟他见面并热衷于让博客作者试图避免冲突 在审查了组织结构之后,建议推出哪种产品以及什么缺点。 MD @DelyAtr_认为O3很聪明,“当我要求挑战临床或医学问题时,它的答案就像是来自顶级医生:准确,全面,基于证据和信心,专业地行事,完全与我们对专家对该领域的期望完全一致。” 奥特曼还记得他的说法:“ O3处于天才或接近天才水平”。 在@delyatr_的看来,O4 mini有点“低调”,答案细节不像O3那样详细。它可能会更简单,更光滑,使人们有一种美丽感,并且可以更加“情感”。 当然,我们也开始尝试一些问题。 有一次,一个老门将为教堂准备了一个大铃铛。他很老,令人眼花长针。在会议上是凌晨6:00,他指出了“ 6”中的短针,“ 12”中的长针。老门将把它放回家。人们在晚上7点和下午8点后不久看时钟。他们都非常不同,立即去寻找老门将。当老门将到达时,是晚上7点。他把手表放在口袋里,有一对。时钟是准确的。他怀疑人们正在开车让他发笑。当他生气时,他回来了。时钟仍然在晚上9点和晚上9点跑,人们去寻找警卫。旧观察者在第二天早上8点左右使用几把手表,但仍然准确。请考虑一下,旧观察者第一次评论手表是什么时候?比较桌子的第二个机会是什么时间? 有一次,一个老门将为教堂准备了一个大铃铛。他年纪大了,令人眼花night乱,他做了一根长而短的针,而短针实际上是长针的12倍。是上午6:00在会议上,他指出了“ 6”中的短针,“ 12”中的长针。老门将把它放回家。人们在晚上7点看着时钟,而在下午8点之后。他们都非常不同,立即去寻找老门将。当老门将到达时,是晚上7点。他把手表放在口袋里,有一对。时钟是准确的。他怀疑人们试图摆脱他。当他生气时,他回来了。时钟仍然在晚上9点和晚上9点跑,人们去寻找警卫。旧观察者在第二天早上8点左右使用几把手表,但仍然准确。请考虑一下,旧观察者第一次评论手表是什么时候?比较桌子的第二个机会是什么时间? ▲O3错误答案 U2合唱团必须到达音乐会区17分钟,并且应该沿着途中越过一座桥,四个人从塔勒威尔的两端设置她的结局是黑暗的,他们只有一个手电筒。在大多数人中,可以同时越过桥,在越过桥时您应该握住手电筒,因此有人必须将手电筒带给您并恢复到桥的两端。手电筒不能通过扔掉。四人步行的速度不同。如果两个人在一起,那么速度较慢就应该占主导地位。 Bono需要1分钟的时间才能越过桥,Edge需要2分钟才能越过桥,需要5分钟的时间才能越过桥,并且需要10分钟才能穿过拉里的桥梁。他们如何在17分钟内越过桥? U2合唱团必须到达音乐会区17分钟,并且应该沿着一条桥上越过桥梁,四个人从桥梁的末端出发,您需要帮助他们到达另一端,黑暗,他们只有一个手电筒。在大多数人中,可以同时越过桥将手电筒带给您,然后回到桥的两端。手电筒不能通过扔掉。四人步行的速度不同。如果两个人在一起,那么速度较慢就应该占主导地位。波诺(Bono)越过桥梁需要1分钟,边缘越过桥需要2分钟,而亚当(Adam)越过桥梁需要5分钟,而拉里(Larry)需要10分钟才能越过桥。他们如何在17分钟内越过桥? ▲正确答案 如下实际测试所示,尽管O3提供了完整的步骤SA推理,但答案也是错误的。 ▲O3错误答案 随着Openai推出新产品,谨慎的网民还发现,新的双子座将于下周(4月22日)发布。 DeepSeek R2,Claude 4和Musk的剧透也有望在本月发布。 尽管我们期望的是,四月是AI最“偶然”的月份,这在很大程度上决定了TH的发展方向E AI行业明年。更强大的模型,较低的成本和更广泛的情况也将为我们带来更聪明,更加整合的情况。 Openai团队在X平台上持有的父亲的摘要: OpenAI计划在未来几个月内发布出色的开放模型,并将在API上发起新的图像生成能力。 O3现在可用于API,而MAS Advanced O3-Pro型号正在开发中,预计将很快发布。 加强微调即将完全开放,以允许公共维修或使用概念模型进行加固(RL)。 在API响应中,开发人员消息与系统消息之间的过渡会自动处理;将系统消息发送到O3或将开发人员消息发送到GPT-4.1将自动转换。 目前,API聊天量或响应不支持托管工具 在O3和O4-Mini理解期间,Web搜索,文件搜索和代码解释器等工具WIL我被积极使用;目前,这些工具在CHATGPT中得到了支持,但API尚未得到支持 - 预计将尽快增加支持。 Open AI正在积极地为SDK代理产生Threa支持,以改善对话和记忆的历史。 Openai认为,低代码平台对SDK代理的建议很有趣,并且接受开发人员来评论最有用的功能。 Codex CLI包括许多已记录的批准模式,允许用户为每个操作或会话选择模式。 Codex CLI不用于替代IDE工具,例如光标和Windsurf;当用户使用主IDE时,它旨在运行背景任务。 代码编码和深入研究功能的比较取决于所选模型(O3或O4-Mini); Codex专门使用函数调用直接向用户计算机命令。 新模型主要是在一般浏览,python/代码实现工具和用户指定工具中进行培训的对开发人员有用。 虽然GPT-4.5更强,但较慢且更加密集,但GPT-4.1为开发人员提供了更快,更有效的选择。 GPT-4.1的一些改进与Chatgpt集成在一起,将来还将引入更多改进。 Openai认识到,诸如“ 4O”和“ O4”之类的模型名称之间存在一项规定,并计划尽快简化命名。 #welcome跟随Aifaner的微信官员:Aifaner(微信ID:IFANR),并将尽快向您展示更多令人兴奋的内容。 | ··回到Sohu以查看更多