AI新闻

已选标签:
多模态AI
模型安全
12月 3日
11 条新闻
18:09

老外傻眼,明用英文提问,DeepSeek依然坚持中文思考

老外傻眼,明用英文提问,DeepSeek依然坚持中文思考

DeepSeek发布的新模型V3.2和V3.2-Speciale在推理能力上显著提升,尤其在长思考与定理证明方面表现优异。研究发现,使用中文等非英语语言进行推理可以有效减少Token消耗并保持准确性,这表明语言选择对模型效率有直接影响。实验还显示,虽然中文在某些场景下比英文更高效,但并非所有情况下都是最优选择。此现象可能与训练数据中语言分布有关,揭示了大模型内部处理机制的复杂性。

来源:36氪

18:09

AI for Science,走到哪一步了?

AI for Science,走到哪一步了?

谷歌DeepMind的AlphaFold等AI模型在蛋白质结构预测、药物设计等方面取得突破,推动了生命科学领域的快速发展。同时,AI技术也在气象学、材料科学等领域展现出巨大潜力,如WeatherNext 2模型超越传统天气预报系统。此外,AI正在从被动工具转变为科学家的主动合作者,通过人机协同和自主实验室模式加速科研进程。

来源:36氪

16:04

豆包手机助手触发微信账号强制下线?豆包、微信双方回应

多位网友在社交平台上表示,有用户在努比亚M153上使用豆包手机助手操作任务时,操作到微信会导致微信异常退出甚至无法登陆。多位豆包手机的使用者确认了这一消息的真实性。据了解,豆包助手预览版的工程机目前可以正常使用微信,但豆包助手的操作手机功能,目前不再支持操作微信。对此,微信相关人士表示:“没有什么特别的动作,可能是中了本来就有的安全风控措施。”豆包方面回应称,豆包手机助手是通过和终端手机厂商合作获得权限,并在其隐私白皮书、权限清单中进行彻底披露。该权限可以让助手模拟点击事件,完成任务。手机助手执行任务需用户授权,在执行过程有明确的展示,且用户可以中断。操作手机能力由用户触发、用户监督,并不自动执行。亦有业内人士称,INJECT_EVENTS 是手机助手常用的系统权限,小米小爱、荣耀yoyo等手机厂商原生助手也拥有该权限。 (澎湃新闻)

来源:钛媒体

16:04

奥特曼怕了,GPT-5.5「大蒜」决战谷歌,红色警报紧急拉响

奥特曼怕了,GPT-5.5「大蒜」决战谷歌,红色警报紧急拉响

OpenAI正面临来自谷歌Gemini 3的严峻挑战,紧急启动了代号为’Garlic’的新一代预训练模型的研发。该模型在编码与推理任务上表现优异,预计明年初发布。同时,OpenAI调整战略重点,将资源集中于提升ChatGPT用户体验,包括增强个性化、图像生成能力及优化模型行为等,旨在巩固其市场地位并应对日益激烈的竞争。

来源:36氪

12:57

千问再放大招,阿里最强学习模型上线,能讲题、会批改、懂专业,直接把老师“请回家”

千问再放大招,阿里最强学习模型上线,能讲题、会批改、懂专业,直接把老师“请回家”

阿里发布基于Qwen3训练的“最强”学习大模型Qwen3-Learning,覆盖全学段、全学科,提供拍题答疑与作业批改功能。该模型通过多模态理解、精准文字识别及5亿级资料库支持,实现高准确率解题和批改能力,适用于从小学到大学的学习场景。其综合能力展示了从通用到专业领域的转化潜力,在教育之外,未来有望应用于工业检测、医疗辅助等领域。

来源:36氪

12:56

奥特曼发红色警报,大模型走进死胡同了吗 ?

奥特曼发红色警报,大模型走进死胡同了吗 ?

OpenAI CEO奥特曼宣布公司进入“Code Red”紧急状态,面临训练成本飙升但性能提升有限的技术困境。斯坦福大学报告显示,2023年后,每增加10倍训练成本,模型性能仅提升10%-15%。同时,谷歌与Anthropic的模型在基准测试中超越或接近GPT-4,用户数据和市场份额也出现显著增长。预训练成为行业瓶颈,大语言模型遭遇不可约误差限制及高质量数据枯竭问题,导致模型迭代停滞不前。

来源:36氪

11:54

联合国报告:人工智能管理差异或加剧国家间不平等

联合国开发计划署亚洲及太平洋区域局2日发布的一份有关人工智能的报告说,由于各国发展基础迥异,若缺乏对人工智能的有效管理,则有可能拉大各国间的差距,进而加剧国家间的不平等。这份报告说,虽然人工智能为发展开辟了新路径,但各国起步条件悬殊,导致它们在把握机遇、管理风险时的处境截然不同。若无有力的政策干预,这些差距可能会持续扩大,进而逆转长期以来发展差距逐步缩小的趋势。(证券时报)

来源:钛媒体

10:50

亚马逊重磅发布,挑战谷歌英伟达

亚马逊重磅发布,挑战谷歌英伟达

亚马逊AWS在re:Invent大会上推出Trainium 3 AI芯片,性能较上一代提升4倍,能效提高40%,并预告了支持英伟达NVLink技术的Trainium 4开发计划。同时,发布了Nova 2系列AI模型与服务,包括多模态处理、对话式AI和代码生成等,以及首创的’开放式训练’服务Nova Forge和浏览器任务自动化服务Nova Act,旨在通过性价比优势吸引更多客户,挑战英伟达和谷歌的市场地位。

来源:36氪

08:45

亚马逊杀疯了,连甩十大重磅发布,揭Agent大招、自研芯进展

亚马逊杀疯了,连甩十大重磅发布,揭Agent大招、自研芯进展

亚马逊云科技在AWS re:Invent上发布了一系列AI新品,包括最新AI芯片Trainium4、基于3nm AI芯片的Amazon EC2 Trainium3 UltraServers及第二代自研大模型Amazon Nova 2系列等。Nova 2 Pro在指令跟随、智能体工具使用榜单中超越了GPT-5 mini等多个前沿模型。此外,Amazon Bedrock新增18款全托管开源模型,含阿里Qwen3-NEXT等国内顶尖模型。这些更新展示了亚马逊在提升算力效率、优化模型性能和促进多模态推理方面的重要进展,为AI应用提供了更强大的支持。

来源:36氪

01:54

AWS推出新型Nova AI模型及一项赋予客户更多控制权的服务

AWS推出新型Nova AI模型及一项赋予客户更多控制权的服务

AWS 发布 Nova 2 系列 AI 模型,包括四款新模型:Nova 2 Lite、Nova 2 Pro、Nova 2 Sonic 和 Nova 2 Omni,覆盖文本生成、图像处理、语音识别及多模态推理等任务。同时推出 Nova Forge 服务,允许企业客户基于 AWS 预训练模型进行定制化开发,解决现有数据与预训练模型融合难题。

来源:TechCrunch AI

12月 2日
9 条新闻
23:37

Mistral以新开放权重前沿和小型模型逼近大型AI竞争对手

Mistral以新开放权重前沿和小型模型逼近大型AI竞争对手

法国AI初创公司Mistral发布了其新系列的Mistral 3开放权重模型,包括一个具有多模态和多语言能力的大规模前沿模型及九个可离线运行、完全可定制的小型模型。这些模型旨在满足企业级应用需求,通过精细化调整实现更高效的任务处理。Mistral强调,在实际应用场景中,小型模型经过调优后可以匹敌甚至超越大型封闭源模型的表现,尤其在成本控制与性能优化方面展现出优势。

来源:TechCrunch AI

22:29

谷歌卷土重来:你大爷还是你大爷

谷歌卷土重来:你大爷还是你大爷

谷歌凭借自研TPU芯片及Gemini-3模型,在AI领域强势回归,挑战英伟达GPU的垄断地位。TPU作为专用ASIC芯片,在特定AI任务上展现出更高效率与成本优势,吸引Meta等大客户考虑转向。尽管如此,英伟达依靠其成熟的CUDA生态及其他防御性布局仍保持较强竞争力。此事件反映了AI产业中通用与专用芯片之争,以及对算力效率和成本控制的关注。

来源:36氪

22:29

AI泡沫原罪:英伟达是AI戒不掉的“毒丸”?

AI泡沫原罪:英伟达是AI戒不掉的“毒丸”?

本文通过分析AI产业链核心公司的财务状况,揭示了AI投资热潮下的利润分配不均问题。在AI基建初期,云服务商面临高昂的前期投入与实际现金流紧张的矛盾;算力提供商如英伟达因垄断地位获利丰厚;而下游应用商如OpenAI则因收入增长速度不及成本增加速度而陷入亏损。文章指出,这种利润分配模式导致了整个AI产业生态链的不稳定,需要通过技术创新和商业模式优化来解决。

来源:36氪

19:24

退货率可达40%的AI眼镜,还是门好生意吗?

智能眼镜赛道在2025年末迎来激烈竞争,各大科技公司纷纷推出AI眼镜产品,价格持续下探至1500元左右。尽管销量增速显著,但高退货率反映了用户需求与技术瓶颈之间的差距。当前AI眼镜主要应用于便捷拍摄等场景,但在续航、AI功能实用性及网络连接稳定性方面存在不足。行业正经历残酷洗牌,企业需加速技术创新和生态建设以应对未来挑战。

来源:36氪

19:24

豆包的AI助手江湖

豆包的AI助手江湖

字节跳动推出搭载豆包AI助手的工程样机M153,标志着其在端侧多模态生成式AI应用上的重要进展。该手机助手通过高通骁龙8至尊版芯片支持,实现了自动语音识别、大语言模型交互等功能,展示了长文本处理、记忆及个性化服务等技术能力。与努比亚合作,豆包尝试了从工具到助理的角色转变,强调体验功能而非硬件性能的竞争。这表明,在AI助手领域,软件与硬件正在共同进化,以满足用户对于便捷交互的需求。

来源:36氪

18:22

这下Altman急了,OpenAI紧急启动「红色警报」

这下Altman急了,OpenAI紧急启动「红色警报」

OpenAI 面临谷歌等竞争对手的强势复苏,宣布进入红色警报状态,将集中资源改进ChatGPT。尽管过去一年中OpenAI在多模态、智能体等领域进行了广泛探索,但产品后续发展乏力。为应对挑战,OpenAI计划发布新推理模型,优化图像生成能力,并加强个性化互动与模型行为,以提升用户体验和竞争力。

来源:36氪

18:22

数据中心,电力告急

数据中心,电力告急

随着AI算力需求激增,数据中心电力消耗问题日益突出。高盛报告指出,美国AI发展面临的主要障碍是电力供应。初创公司如PowerLattice和Empower正致力于研发高效电源管理芯片,旨在减少能耗并提升计算效率,预计未来几年内将实现千兆瓦级别的能源节省。同时,第三代半导体材料GaN与SiC的应用,以及800V高压直流架构的推广,将进一步推动AI基础设施向更高效、更环保的方向发展。

来源:36氪

17:56

Runway Gen-4.5刷屏发布,把重量尘土和光影都做对了,网友:颠覆

Runway Gen-4.5刷屏发布,把重量尘土和光影都做对了,网友:颠覆

Runway Gen-4.5在文本转视频基准测试中以1247分超越所有现有模型,实现物理和视觉准确性突破。该模型擅长执行复杂序列式指令,生成的视频具有逼真的重量感与动量特征,适用于多种风格和场景。尽管存在因果推理等局限性,Gen-4.5展示了AI在多模态融合及内容生成领域的显著进步。

来源:量子位

16:52

商汤分拆了一家AI医疗公司,半年融资10亿,剑指“医疗世界模型”

商汤分拆了一家AI医疗公司,半年融资10亿,剑指“医疗世界模型”

商汤分拆的AI医疗公司半年内融资10亿,目标构建‘医疗世界模型’,以实现对医疗场景的全面感知与深度理解。其自研大语言模型‘大医®’在专业测试中表现优异,结合多模态基础模型群和双中台架构,形成数据-模型-场景-产业闭环。已在病理、影像等多个临床方向上线40余款AI模块,并与多家医院及企业合作,推动智慧医院建设。

来源:量子位