首页 实时讯息

阿里AI三连发,千问3推理模型重磅更新,比肩Gemini-2.5 pro、o4-mini

日期:2025-07-25 21:22:00

7月25日,阿里巴巴全新开源千问3推理模型,性能大幅提升,比肩顶级闭源模型Gemini-2.5 pro、o4-mini。本周阿里已连续开源3款重磅模型,分别斩获基础模型、编程模型、推理模型等主流领域的三项全球开源冠军。两天前开源的AI编程模型Qwen3-Coder,更是引爆全球AI圈,掀起一波用中国千问开源模型替代闭源模型的新浪潮。

最新推出的千问3推理模型,成为全球最强开源推理模型之一。 自千问3旗舰模型Qwen3-235B-A22B发布后,阿里通义团队一直在扩展大模型的推理极限,全新开源的千问3推理模型在通用能力和深度思考能力上实现巨大飞跃。千问3推理模型支持256K上下文长度,在知识(SuperGPQA)、编程(LiveCodeBench v6)、数学(AIME25)、人类偏好对齐(Arena-Hard v2)、创意写作(WritingBench)、多语言能力(MultilF)等核心能力上,千问3推理模型完全可比肩Gemini-2.5 pro、o4-mini等顶尖闭源模型,并创下全球开源模型的最佳性能表现。

在经典基础模型领域,千问3全球最强之一。3天前开源的
Qwen3-235B-A22B-Instruct-2507(非思考版)新模型,性能显著提升,在GPQA(知识)、AIME25(数学)、LiveCodeBench(编程)、Arena-Hard(人类偏好对齐)、BFCL(Agent能力)等众多测评中表现出色,超越Claude4(Non-thinking)等领先闭源模型。权威AI研究机构Artificial Analysis指出,“千问3是全球最智能的非思考基础模型”。

在AI编程领域,新开源的Qwen3-Coder被誉为「全球最好的编程模型」之一。Qwen3-Coder在代码能力及Agent调用能力方面取得重大突破。在多语言SWE-bench、Mind2Web、Aider-Polyglot等模型Agent能力评估中,Qwen3-Coder超越GPT4.1、Claude4等顶级闭源模型,并登顶全球最大AI开源社区HuggingFace 模型总榜冠军。借助Qwen3-Coder,刚入行的程序员一天就能完成资深程序员一周的工作,生成一个品牌官网最快只需5分钟。

Qwen3-Coder的开源,引爆硅谷科技圈,在全球AI圈掀起一波「AI编程」热潮。推特创始人杰克·多尔西(Jack Dorsey)、爆火Agent应用Perplexity CEO 阿拉温德·斯里尼瓦斯(Aravind Srinivas)、著名风投公司a16z合伙人马克·马斯克罗(Marco Mascorro)等硅谷大咖盛赞Qwen3-Coder,HuggingFace CEO 克莱门特·德朗格(Clement Delangue)更是连转带发12条推文,向全球开发者力荐的编程模型。海外知名模型API聚合平台OpenRouter数据显示,阿里千问API调用量暴涨,过去几天已突破1000亿Tokens,在OpenRouter趋势榜上包揽全球前三,是当下最热门的模型。

截至目前,阿里巴巴已开源300余款通义大模型,通义千问衍生模型突破14万个,超越Meta的Llama系列成为全球头部的开源模型家族,通义也是开发者和企业使用广泛的大模型。未来三年,阿里巴巴还将投入超过3800亿元用于建设云和AI硬件基础设施,持续升级全栈AI能力,为中国和全球开发者和企业提供更先进的模型和云计算服务。

你感兴趣的

阿里AI三连发,千问3推理模型重磅更新,比肩Gemini-2.5 pro、o4-mini

7月25日,阿里巴巴全新开源千问3推理模型,性能大幅提升,比肩顶级闭源模型Gemini-2.5 pro、o4-mini。本周阿里已连续开源3款重磅模型,分别斩获基础模型、编程模型、推理模型等主流领域的三项全球开源冠军。两天前开源的AI编程模型Qwen3-Coder,更是引爆全球AI圈,掀起一波用中国

技能重塑未来:北京八维研修学院助力学子实现职场进阶

在当今就业市场中,不少本科生陷入了颇为尴尬的境地,既缺少名校学历带来的光环加持,又在实践操作技能方面较之于大专生、高职生略显逊色,面对市场用人标准缺乏优势。于是,我们看到了一种 “反向操作”,那就是 “先上本,再读专,或提升技能”,这是现实逼迫下的理智选择,也凸显出在当下,技能已然成为大学生们在职场

京东押注!一口气投资三家机器人企业

7月21日,京东宣布完成三家具身智能领域企业的投资,分别是千寻智能、逐际动力和众擎机器人。一口气投资三家机器人企业的京东,引发外界关注。但这并不是刘强东首次在此领域展开动作,不久前的“618”购物节,京东联名的机器人WAWA就曾公开亮相。券商中国记者搜寻京东平台发现,已有不少零售机器人产品上架销售。

筑牢迎峰度夏电力安全防线

近期,我国多地迎来高温天气,用电需求持续攀升。据初步预计,今年迎峰度夏期间全国最高用电负荷同比增加约1亿千瓦,电力保供迎来关键“大考”。在这一关键时期,完善相关保障制度体系,对于确保电力稳定供应具有重要意义。一段时间以来,我国电力行业多点发力,为今夏民生用能和全社会用电提供充足的能源保障。在发电方面

小米汽车详解“快捷找车”功能:AI大模型精准识别车位信息

IT之家 7 月 16 日消息,@小米技术 官微今日发文详细介绍了“快捷找车”功能,该功能已经率先上线 YU7。据介绍,该功能支持锁车自动拍照,用户在小米汽车 App 的相应设置中开启【自动拍照】功能后,锁车时车辆会从俯视、前、后、左、右五个角度自动拍摄周围环境照片,并上传至 App 的【车辆位置】

全球首例!深圳机器人自己搭地铁为商家配送货

全球首例由机器人自主搭乘地铁配送货,在深圳正式落地。7月14日,北极燕鸥卡通形象的机器人满载着通勤族最爱的补给商品,在深圳地铁2号线湾厦站试点首次试跑。配送货机器人由深铁集团与万科合作,巧妙利用地铁空闲时段和现有轨道网络,通过AI调度算法自主规划最优路线进行货物配送,显著提升了站内商户的补货效率。在

图文推荐

  • 三星中央空调客服人工号码(全国统一)400客服热线实时反馈全+境+到+达(三星中央空调空调耗电量 )

  • 泉州千年古街焕新颜,市井烟火与文艺新潮交织

  • 中国五冶取得用于外架金属冲孔防护板防护网一体化悬挂装置专利,避免金属冲孔防护板脱落和高空坠物

  • 艾柯空调客服号码售后号码大全及维修网点查询实时反馈-今-日-资-讯(艾柯空调空调插电跳闸 )

  • 广优中央空调客服号码售后号码大全及维修网点查询实时反馈全+境+到+达(广优中央空调空调显示C4故障码,怎么处理? )

  • EK空调400服务号码全国售后的热线实时反馈全+境+到+达(EK空调空调制热效果 )