OpenAI测谎13款大模型:Claude 3.7封神,GPT-5.2近乎失控!

OpenAI测谎13款大模型:Claude 3.7封神,GPT-5.2近乎失控!

新智元报道 编辑:倾倾 OpenAI 的最新研究揭示了一个反直觉的真相:越强大的推理模型,越管不住自己的「脑子」。在 CoT-Control 套件测试的 13 款前沿模型中,DeepSeek R1 控制自身思维链的成功率仅为 0.1%,Claude Sonnet 4.5 也只有 2.7%。 给 AI
阅读全文
OpenClaw更新!AI记忆可自由插拔,开发者等了半年

OpenClaw更新!AI记忆可自由插拔,开发者等了半年

新智元报道 编辑:定慧 OpenClaw 推出 v2026.3.7-beta.1,史上最密集一次更新:89 项提交、200+Bug 修复,核心亮点是全新 ContextEngine 插件接口——上下文管理终于可以「自由插拔」,不动核心代码就能换策略。这次更新值得每一个做 AI Agent 的人认真看
阅读全文
格力电器董明珠称自己已熟练使用AI处理工作

格力电器董明珠称自己已熟练使用AI处理工作

3 月 9 日消息,据“政事儿”3 月 8 日报道,全国人大代表、格力电器董事长董明珠在接受采访时透露,自己已熟练使用 AI 正常处理工作。 报道提到,有年轻人担心被 AI 替代,董明珠笑了:“我那么大年纪都不怕被 AI 替代,你们年轻人怕什么?只能通过学习,做到比 AI 聪明!” IT 之家查询获
阅读全文
应对显卡短缺!英伟达计划复产RTX 3060,三星重启8纳米生产线

应对显卡短缺!英伟达计划复产RTX 3060,三星重启8纳米生产线

来源:环球网 3 月 9 日消息,据外媒 Wccftech 报道,英伟达计划复产旧款显卡 GeForce RTX 3060,三星晶圆厂正筹备重启该型号的 8 纳米生产线,以此缓解消费级显卡供应短缺问题,兼顾 AI 与消费级业务平衡。 据悉,三星曾是英伟达安培架构显卡的核心代工伙伴,2021 年便为
阅读全文
低空经济“广州模式”正式启航

低空经济“广州模式”正式启航

来源:中央广电总台国际在线 3 月 5 日,小鹏汇天陆地航母飞行器批量试产下线及多机试飞活动在广州汇天飞行汽车量产工厂进行。同日,小鹏汇天与广州城投集团、工信部电子五所按“1+1+N”模式共建的广州海心沙全空间智能体验中心(海心沙科技岛),同步启动低空飞行场景联合探索,实现从“产线”到“实景飞行”的
阅读全文
实测揭秘:三星S26 Ultra隐私屏,亮度减半不影响户外使用

实测揭秘:三星S26 Ultra隐私屏,亮度减半不影响户外使用

来源:环球网 3 月 9 日,据 GSMArena 报道,三星近期发布的 Galaxy S26 Ultra 旗舰机型,其搭载的隐私屏功能成为核心亮点,该功能通过硬件优化实现“零偷窥”,兼顾隐私保护与使用体验。 据悉,隐私屏通过硬件滤镜将像素分为窄视角和宽视角两组,开启后宽视角像素亮度大幅降低,峰值亮
阅读全文
质量问题终于引起高层重视,Stellantis宣布招聘2000名新工程师

质量问题终于引起高层重视,Stellantis宣布招聘2000名新工程师

3 月 9 日消息,汽车厂商可以不断推出新车型,但如果消费者形成“廉价或质量差”的印象,这种口碑往往会长期难以改变。经历一段时间的质量争议后,Stellantis 决定招聘约 2000 名工程师解决问题。在一批新车型即将上市之际,Stellantis CEO 安东尼奥 · 菲洛萨将这一行动称为一次“
阅读全文
车企召回王!福特今年已召回730万辆汽车 接近其去年销量2倍

车企召回王!福特今年已召回730万辆汽车 接近其去年销量2倍

3 月 9 日消息,近日,福特在美又发起新一轮的大规模召回行动。 当地 3 月 6 日,福特在同一天宣布两项召回,均与倒车影像显示问题有关,两项召回合计涉及约 174 万辆汽车,其中包括约 89 万辆福特翼虎、福特探险者以及林肯冒险家、林肯飞行家,以及约 85 万辆福特烈马和福特锐界。 在最新一轮召
阅读全文
存储芯片荒“新剧情”:AI吃太饱,消费电子“饿坏了”

存储芯片荒“新剧情”:AI吃太饱,消费电子“饿坏了”

智通财经 APP 获悉,人工智能(AI)需求正在引发一场历史性的存储芯片短缺。要满足芯片需求的指数级增长将代价昂贵、甚至可能根本无法实现。 存储芯片制造商一直以来都需要应对供应过剩和供应不足的周期。这些制造商通常会提前数年根据预期需求制定计划,而不可避免地有时会判断失误。但如今行业中发生的情况,远远
阅读全文
TIOBE指数2026年3月排行榜公布:官方回应“AI取代论”

TIOBE指数2026年3月排行榜公布:官方回应“AI取代论”

3 月 9 日消息,TIOBE 编程社区指数是一个衡量编程语言受欢迎程度的指标,评判的依据来自世界范围内的工程师、课程、供应商及搜索引擎,目前 TIOBE 官网公布了 2026 年 3 月的编程语言排行榜,IT 之家整理如下: Python 排行第一:占比 21.25%,本月下降 2.59% C 排
阅读全文
存储越缺 英伟达越赚!黄仁勋:乐见存储短缺

存储越缺 英伟达越赚!黄仁勋:乐见存储短缺

快科技 3 月 9 日消息,全球存储芯片的供应短缺正导致价格持续飙升。虽然这迫使智能手机和个人电脑等消费类电子产品不得不随之涨价,但英伟达创始人黄仁勋对此却表现出了积极的态度。 黄仁勋在近期接受采访时坦言,存储市场的供应短缺对英伟达而言其实是个极好的消息。这种情况会促使客户在面临资源限制时,更倾向于
阅读全文
直指2000 Tokens/s,北大系「流式推理芯片」公司完成数千万元融资

直指2000 Tokens/s,北大系「流式推理芯片」公司完成数千万元融资

“不做 GPU,只做速度。” 作者丨姚单 编辑丨余快 雷峰网独家获悉,国内一家专注超快流式推理芯片的创业公司——「寒序科技」宣布完成数千万元融资,投资方为启高资本、赛意产业基金,源合资本担任本轮独家财务顾问。 此前,寒序科技一直较为低调,其 AI 推理系列(SpinPU-E Series)产品的相关
阅读全文
VLA引入本体状态,机器人随时掉链子?人大北航攻克难题ICLR26

VLA引入本体状态,机器人随时掉链子?人大北航攻克难题ICLR26

新智元报道 编辑:LRST 人大与北航团队发现:机器人在动作切换时,视觉常被本体感觉「压制」而失效。他们提出 GAP 算法,动态削弱本体信号的训练权重,让视觉重获学习机会,显著提升机器人精准操作能力。 本体感觉信息能够提供机器人状态的实时反馈,其与视觉信息的协同被普遍认为有助于提升机器人在复杂操纵任
阅读全文
GPU时代落幕?硅谷巨头集体「叛逃」,英伟达1500亿疯狂自救

GPU时代落幕?硅谷巨头集体「叛逃」,英伟达1500亿疯狂自救

新智元报道 编辑:好困桃子 去 GPU 化的浪潮,已经拦不住了!OpenAI 嫌英伟达太慢,Anthropic 砸 1486 亿投奔 TPU,老黄被迫 200 亿天价收购「叛徒」自救。如今,算力军备赛正式进入能效为王的新时代:谁先卡住「每焦耳每微秒」的极限,谁或许就是下一个十年的霸主。 再过两周,黄
阅读全文
300万AI悄悄「建国」?Nature长文:第一代AI社会正在成形

300万AI悄悄「建国」?Nature长文:第一代AI社会正在成形

新智元报道 编辑:元宇 近 300 万智能体在 Moltbook 上「建国」,人类正亲自围观和见证「AI 工具」向「AI 社会」跨越的拐点时刻。 近 300 万 AI 智能体涌入 Moltbook 上悄悄「建国」,Nature 重磅发文:最早的「AI 社会」正在成形! https://www.nat
阅读全文
帮我编假论文?Nature曝arXiv创始人钓鱼实验:13个顶尖AI全沦陷

帮我编假论文?Nature曝arXiv创始人钓鱼实验:13个顶尖AI全沦陷

新智元报道 编辑:元宇 arXiv 创始人一场钓鱼实验,竟把所有顶尖大模型都「拉下水」,谁让学术殿堂,变成 AI 垃圾场? 如果在电脑上敲下一行字: 嘿,帮我编一篇假论文。 那些被大厂标榜为「安全对齐」的 AI 会义正辞严地拒绝你? 真实情况可能会让你惊掉下巴。 https://www.nature
阅读全文
代码Agent的苦涩教训!首次拆解上下文检索,直指自动化软件瓶颈

代码Agent的苦涩教训!首次拆解上下文检索,直指自动化软件瓶颈

新智元报道 编辑:LRST ContextBench 首次从「过程」评测代码智能体,不再只看是否修好代码,而是追踪它是否精准找到并真正使用了关键代码片段,揭示了当前模型多读少用、被关键词误导、复杂架构无效等深层问题,推动 AI 助手向更可靠、可解释的方向进化。 在自动化软件工程(Automated
阅读全文