刚才发布了最强的Openai Model O3！我第一次可以在

“ O3已到达或接近天才水平。”刚才，OpenAI O3/O4 Mini模型终于正式推出了。实时广播持续了大约30分钟，速度如此之快，以至于飞行速度，但是信息量已满。 O3本身的排放过程也被逆转。今年2月，OpenAI宣布将制定独立的O3发布计划，该技术将包装并塞满GPT-5。在4月初，习惯“饥饿营销”的Altman声称他的计划发生了变化：如果您想先去O3，GPT-5必须等待，首先，这将需要几个月的时间。 O3，如果您想先走，GPT-5就必须等待，第一个将需要几个月的时间。扩展全文一系列或最新系列的最智能模型极大地提高了推理的能力，并且更长的时间是PAG思想的时间，效果更好。首先，图像是直接的ly集成到思维链中，图像是“思考”，可以将图像直接调用以处理图像。首先，它完全支持Web搜索，文件审核，Python代码实现，视觉输入深度和图像生成。就成本效率而言，这比前几代好，并且在延迟和成本下，O3的性能更强。从现在开始，将诸如型号选择器，Chatgpt Plus，PRU和团队用户替换诸如O1之类的型号可以使用O3，O4-Mini和O4-Mini-High，并且公司和教育用户将获得一周的访问权限。 O3-Pro预计将在几周内发布。自由用户可以通过“思考”模式使用O4-Mini，并且速率限制保持不变。开发人员通过聊天完成和API响应访问，支持函数调用的推理和优化，并很快支持内置工具，例如Web搜索。 OpenAI推断的最强模型已发布，GPT-5还远吗？最新的O3和O4-Mini发行版是一系列O系列中最明智的模型。这两个模型在推理功能，工具使用和多模式处理方面表现良好，并且可以随着时间的推移考虑复杂的问题。首先，它完全支持Web搜索，文件审核，Python代码实现，视觉输入深度和图像生成。从老年研究人员到顺序用户，新模型还具有更广泛的情况。 OpenAI O3和O4-Mini可以通过API函数调用来调用Chatgpt工具，并访问自定义工具。 Openai释放O3和O4-Mini，说O3可以“产生假设”小说'|蜂巢通过研究加强，OpenAI还训练这两个模型如何使用工具 - 不仅知道如何和何时以及在正确的可靠答案中快速地快速使用，通常需要少于一分钟的时间。例如，当被问及如何将加利福尼亚的能源与去年进行比较时，您可以搜索公共消费在在线数据上，编写Python代码预测，生成图表或照片，并解释预测的基础，并正确连接许多工具。查找推断的整个过程也很灵活且波动性：该模型可以几次调用搜索引擎以交叉验证结果；如果您缺乏知识，则可以进一步探索信息并包括跨型输出。在今天早上的现场广播期间，Openai总裁Greg Brockman也很罕见。 OpenII表演者展示了新模型如何结合用户兴趣，并发现对用户感兴趣但尚不清楚的内容。在新模型为您提供“内存”功能之后，您将了解主持人的兴趣 - 跳伞和音乐。而不是简单地讨论这两个爱好分隔礁，然后用水下水扬声器重新播放录音，这将加快新珊瑚和鱼类的繁殖，并帮助珊瑚礁治愈和再生。期间内容创建过程，该模型还会自动创建完整的博客文章。首先，它使用数据分析工具来产生可视化，并用画布创建了一个博客文章，并附有引用和资源。作为旗舰旗舰店的最新模型，O3在编程，数学，科学和视觉感知的领域中创造了新的记录，例如CodeForces，Swe-Bench和MMMU基准，视觉活动为87.5％，并且Mathvista的视觉活动为75.4％。对专家的外部分析表明，O3也比O1少20％，并且可以生成并批判性地评估生物学，数学和工程领域的新型假设，适用于复杂的查询。 O4-Mini是“较小”，可快速和低成本。在AIME 2024和2025数学测试中，它的准确率分别为92.7％和93.4％。这比非茎科学活动中的O3米尼更好，而且可以很好地处理更多请求，并且更适合需要快速响应的方案。性能比较表明，在AIME，CodeForces，GPQA和MMMU等试验中，O3和O4-Mini超过了前几代，并且对命令和质量响应的遵守也有了显着改善。通过对话中的记忆和历史对话编译，答案在相关性方面更为个性化。在整个Openai O3的整个发展过程中，Openai指出，大规模的增强研究表明，与培训前GPT系列相同的趋势。结合这条路径（加强研究），OpenAI通过数量级增加了训练和理解时间。但是我仍然看到了显着的性能改善。凭借延迟和成本为O1，O3的表现更好，并使它有更多时间思考它，并且效果会更好。 Openai并没有忘记画蛋糕，还说O3和O4-Mini展示了合并或系列O的过程F本系列具有GPT系列的自然对话和工具使用，预计未来的模型（GPT-5）将进一步包括这些好处，以为用户提供莫名其妙，更实用的经验。 “思考”图片的能力偶尔意味着 - 而“思考太多” OpenAI O3和O4-Mini也是最新的视觉侵制模型或串联。如何理解视觉卑鄙模型？根据官方报告，该模型首次将图像直接包含在思维链中，从而解决了一个新的问题，该问题解决了一种结合愿景和推理的愿景。使用Python数据审核，Web搜索和图像生成等工具，它也可以处理更复杂的任务。上传白板照片，教科书图表或手绘草图。尽管图像模糊，颠倒或质量较差，但可以准确地解释该模型，并直接调用该工具来处理图片。 Ang Pag -crop，旋转，比例尺和其他操作ARE没问题。关键是这些功能是本地的，不必依靠单独的专用模型。 Blogger @Danshipper通过模糊图片找到了一个婴儿车品牌。从图片来看，整个过程还搜索了十二个网页。我还上传了Wekan大楼的照片，O3准确地认识到该建筑位于Huaihai Road附近，但答案没有给出建筑物的名称。当然，这种思维方式不是“缺陷”：极其思考：模型可以过多地依靠工具或图像处理，从而导致一条漫长的思维链。痴迷于眼睛：即使使用该工具正确使用，视觉争议也会导致错误的答案。能力：相同的问题被扰乱多次，模型可能采用不同的途径，并且一些结果是不正确的。就成本效率而言，O3和O4-Mini比前几代好。在2025年的AIME测试中，成本效益比O1和O3-Mini更好，这是更聪明，更有效。 O3输入每百万个令牌的成本（大约750,000个单词，比《指环王》系列的长度更长）为10美元，每百万个令牌的输出成本为40美元。 O4-Mini的投入为每百万个代币，每百万美元的产出额为每百万个代币，每百万个代币的产出。之前，Openai接触了几个月到几天的安全性测试时间。 O3和O4-Mini系统卡显示，OpenAI正在重建安全培训，增加了新的生物威胁，恶意软件和越狱攻击以拒绝信号。根据最新的准备框架，O3和O4-Minth风险在生物学和化学，网络安全和AI自我完善领域的“高”阈值之下。 ▲图片附加到Codex Cli GitHub地址：https：//github.com/openai/codex 尽管该代理迟到了，但Openai还推出了一个轻巧的终端编码代理-Codex CLI。基于O3和O4-Mini的功能识别，Codex CLI支持多模式输入，并且资源向GitHub开放。此外，OpenAI还启动了一项100万美元的计划，以支持相关项目，并接受了25,000美元的资助API积分。 Openai目前真的很开放。根据报道，法典有两种操作模式，一种是“建议模式”（默认模式）：建议用户确认命令，而其他命令则是“完整自动模式”：禁用对网络的访问，允许代理商独立工作，但要确保其安全。在实时演示期间，OpenAI研究人员将屏幕截图拖到了终端，Codex CLI通过多模式推理，访问用户文件以及最终生成的HTML文件，创建ASCII ART生成器，并成功添加了网络摄像头API。值得一提的是，根据彭博社的说法，OpenAI计划将AI编程工具公司Windsurf提高到30亿美元。如果收购成功，它将是最大的提取现在的Openai。该报告指出，一旦达成交易，Openai就可以更直接地与诸如Anthropic，Github和Anysphere拥有的Microsoft之类的Thosecompanies竞争，从而使用编程工具在快速增长的工具市场中立足。 “天才级别”的O3吸引了Altman向前和支持，但是这些问题无法正确回答... 一些X平台博客作者提前获得了新模型的经验的资格，并分享了他们的用户体验。 @Danshipper有一个星期的经验，他说O3很快，非常“动力”，超级聪明，一般的感觉很棒。最喜欢的用途包括：一个简单的机器学习课程开发并提醒每天早晨一个博客作者学习通过模糊图片找到婴儿车品牌以超快的速度编写新的AI基准程序研究安妮·迪拉德（Annie Dillard Classic）活动，例如X射线，挖掘博客作者从未注意到看到t的分钟他见面并热衷于让博客作者试图避免冲突在审查了组织结构之后，建议推出哪种产品以及什么缺点。 MD @DelyAtr_认为O3很聪明，“当我要求挑战临床或医学问题时，它的答案就像是来自顶级医生：准确，全面，基于证据和信心，专业地行事，完全与我们对专家对该领域的期望完全一致。” 奥特曼还记得他的说法：“ O3处于天才或接近天才水平”。在@delyatr_的看来，O4 mini有点“低调”，答案细节不像O3那样详细。它可能会更简单，更光滑，使人们有一种美丽感，并且可以更加“情感”。当然，我们也开始尝试一些问题。有一次，一个老门将为教堂准备了一个大铃铛。他很老，令人眼花长针。在会议上是凌晨6:00，他指出了“ 6”中的短针，“ 12”中的长针。老门将把它放回家。人们在晚上7点和下午8点后不久看时钟。他们都非常不同，立即去寻找老门将。当老门将到达时，是晚上7点。他把手表放在口袋里，有一对。时钟是准确的。他怀疑人们正在开车让他发笑。当他生气时，他回来了。时钟仍然在晚上9点和晚上9点跑，人们去寻找警卫。旧观察者在第二天早上8点左右使用几把手表，但仍然准确。请考虑一下，旧观察者第一次评论手表是什么时候？比较桌子的第二个机会是什么时间？有一次，一个老门将为教堂准备了一个大铃铛。他年纪大了，令人眼花night乱，他做了一根长而短的针，而短针实际上是长针的12倍。是上午6:00在会议上，他指出了“ 6”中的短针，“ 12”中的长针。老门将把它放回家。人们在晚上7点看着时钟，而在下午8点之后。他们都非常不同，立即去寻找老门将。当老门将到达时，是晚上7点。他把手表放在口袋里，有一对。时钟是准确的。他怀疑人们试图摆脱他。当他生气时，他回来了。时钟仍然在晚上9点和晚上9点跑，人们去寻找警卫。旧观察者在第二天早上8点左右使用几把手表，但仍然准确。请考虑一下，旧观察者第一次评论手表是什么时候？比较桌子的第二个机会是什么时间？ ▲O3错误答案 U2合唱团必须到达音乐会区17分钟，并且应该沿着途中越过一座桥，四个人从塔勒威尔的两端设置她的结局是黑暗的，他们只有一个手电筒。在大多数人中，可以同时越过桥，在越过桥时您应该握住手电筒，因此有人必须将手电筒带给您并恢复到桥的两端。手电筒不能通过扔掉。四人步行的速度不同。如果两个人在一起，那么速度较慢就应该占主导地位。 Bono需要1分钟的时间才能越过桥，Edge需要2分钟才能越过桥，需要5分钟的时间才能越过桥，并且需要10分钟才能穿过拉里的桥梁。他们如何在17分钟内越过桥？ U2合唱团必须到达音乐会区17分钟，并且应该沿着一条桥上越过桥梁，四个人从桥梁的末端出发，您需要帮助他们到达另一端，黑暗，他们只有一个手电筒。在大多数人中，可以同时越过桥将手电筒带给您，然后回到桥的两端。手电筒不能通过扔掉。四人步行的速度不同。如果两个人在一起，那么速度较慢就应该占主导地位。波诺（Bono）越过桥梁需要1分钟，边缘越过桥需要2分钟，而亚当（Adam）越过桥梁需要5分钟，而拉里（Larry）需要10分钟才能越过桥。他们如何在17分钟内越过桥？ ▲正确答案如下实际测试所示，尽管O3提供了完整的步骤SA推理，但答案也是错误的。 ▲O3错误答案随着Openai推出新产品，谨慎的网民还发现，新的双子座将于下周（4月22日）发布。 DeepSeek R2，Claude 4和Musk的剧透也有望在本月发布。尽管我们期望的是，四月是AI最“偶然”的月份，这在很大程度上决定了TH的发展方向E AI行业明年。更强大的模型，较低的成本和更广泛的情况也将为我们带来更聪明，更加整合的情况。 Openai团队在X平台上持有的父亲的摘要： OpenAI计划在未来几个月内发布出色的开放模型，并将在API上发起新的图像生成能力。 O3现在可用于API，而MAS Advanced O3-Pro型号正在开发中，预计将很快发布。加强微调即将完全开放，以允许公共维修或使用概念模型进行加固（RL）。在API响应中，开发人员消息与系统消息之间的过渡会自动处理；将系统消息发送到O3或将开发人员消息发送到GPT-4.1将自动转换。目前，API聊天量或响应不支持托管工具在O3和O4-Mini理解期间，Web搜索，文件搜索和代码解释器等工具WIL我被积极使用；目前，这些工具在CHATGPT中得到了支持，但API尚未得到支持 - 预计将尽快增加支持。 Open AI正在积极地为SDK代理产生Threa支持，以改善对话和记忆的历史。 Openai认为，低代码平台对SDK代理的建议很有趣，并且接受开发人员来评论最有用的功能。 Codex CLI包括许多已记录的批准模式，允许用户为每个操作或会话选择模式。 Codex CLI不用于替代IDE工具，例如光标和Windsurf；当用户使用主IDE时，它旨在运行背景任务。代码编码和深入研究功能的比较取决于所选模型（O3或O4-Mini）； Codex专门使用函数调用直接向用户计算机命令。新模型主要是在一般浏览，python/代码实现工具和用户指定工具中进行培训的对开发人员有用。虽然GPT-4.5更强，但较慢且更加密集，但GPT-4.1为开发人员提供了更快，更有效的选择。 GPT-4.1的一些改进与Chatgpt集成在一起，将来还将引入更多改进。 Openai认识到，诸如“ 4O”和“ O4”之类的模型名称之间存在一项规定，并计划尽快简化命名。 #welcome跟随Aifaner的微信官员：Aifaner（微信ID：IFANR），并将尽快向您展示更多令人兴奋的内容。 | ··回到Sohu以查看更多