AI新闻

已选标签:
多模态AI
模型训练
12月 11日
15 条新闻
13:49

慧思开物全局调度,北京人形推出全国首个全自主无人化导览解决方案

慧思开物全局调度,北京人形推出全国首个全自主无人化导览解决方案

北京人形机器人创新中心发布全国首个全自主无人化导览解决方案,以“慧思开物”平台为核心,整合多模态融合感知、AI大模型决策及数据驱动执行技术,实现展厅导览等场景的全流程独立运作。该方案支持多机协同与全域IOT联动,标志人形机器人导览进入全自主时代,展示了在导览导购领域的规模化应用潜力。

来源:量子位

12:38

全球首个太空AI诞生,H100在轨炼出,马斯克爆赞

全球首个太空AI诞生,H100在轨炼出,马斯克爆赞

首个由H100太空GPU训练的LLM在外太空成功运行,基于Karpathy的nano-GPT和莎士比亚语料完成训练,能够以文艺复兴时期风格交流。这标志着AI技术在太空应用的新里程碑,开启了利用太空作为数据中心的可能性,以应对地球资源压力。同时,谷歌、SpaceX等也在探索太空算力竞赛,尽管面临强辐射、维修难等挑战,但预示着未来AI算力解决方案将向太空扩展。

来源:36氪

12:38

谷歌拿眼镜赌明天,字节让豆包注当下

谷歌拿眼镜赌明天,字节让豆包注当下

谷歌与字节跳动分别通过智能眼镜和智能手机助手,探索AI在个人设备中的应用。谷歌发布四款基于Android XR操作系统的XR设备,旨在构建一个由Gemini驱动的未来生态;而字节的豆包手机助手则实现了AI与手机操作系统的深度融合,引发市场热议。两者均致力于将AI融入日常生活,提升用户体验,同时面临隐私保护、数据安全等挑战。

来源:36氪

12:38

AI眼镜大混战:大厂抢入口,“Rokid们”紧张?

AI眼镜大混战:大厂抢入口,“Rokid们”紧张?

近期,谷歌、腾讯、字节跳动等大厂纷纷布局AI智能眼镜市场,预计2026年将有产品上市。该领域分为AI音频眼镜、AI拍摄眼镜和AI+AR眼镜三类,后者功能更全面但价格更高。大厂们根据自身优势选择不同方向,如夸克依托阿里生态推出轻便时尚的AI拍摄眼镜与带显示的AI+AR眼镜;理想则专注于车用场景的AI拍摄眼镜。尽管创业公司面临压力,但通过优化显示技术和提高实用性,仍能在竞争中占据一席之地。

来源:36氪

11:36

OpenAI神秘生图AI爆出,实测不敌谷歌一根香蕉,网友:就这?

OpenAI神秘生图AI爆出,实测不敌谷歌一根香蕉,网友:就这?

OpenAI即将发布GPT-5.2及图像生成模型GPT Image 2(代号栗子/榛子),与谷歌Nano Banana Pro展开竞争。尽管在物理色彩理论等复杂场景下表现不佳,但部分测试显示其生成代码和信息图的能力有所提升。谷歌新推出的Flash版「香蕉」则以将游戏画面转化为真实感图片、单句编辑图片等功能见长。双方在多模态处理能力上的较量预示着AI技术正向着更广泛的应用场景迈进。

来源:36氪

11:36

Meta公开抄阿里Qwen作业,还闭源了…

Meta公开抄阿里Qwen作业,还闭源了...

Meta计划于明年春季发布代号为「Avocado」的闭源AI模型,该模型在训练过程中采用了包括阿里巴巴Qwen在内的多个开源模型进行优化。此举标志着Meta从长期坚持的开源战略转向闭源开发,反映了当前AI领域内开源与闭源之间的动态变化。同时,也体现了中国企业在开源AI技术方面的领先地位。

来源:36氪

09:33

一口气发4款新品,谷歌发布会被所有人低估了:AI野心显露

一口气发4款新品,谷歌发布会被所有人低估了:AI野心显露

Google 在 Android Show: XR 发布会上,首次明确 Android XR 的设备路线及与三星合作的 AI 眻镜原型机。Gemini 作为多模态AI核心贯穿视觉、语音、环境感知与交互理解,Android XR 成为覆盖多种设备形态的新计算平台。发布会强调系统整合、开发框架和API共享,旨在推动XR成为Android生态自然延伸。策略上采取类似Nexus时代的合作模式,硬件探索由不同厂商承担,以确保技术适应性和生态开放性。

来源:36氪

09:10

谷歌应对AI竞赛的策略——提拔其数据中心技术背后的功臣

谷歌应对AI竞赛的策略——提拔其数据中心技术背后的功臣

Google 提升 Amin Vahdat 为 AI 基础设施首席技术官,彰显其在 AI 竞争中的重要性。Vahdat 在大规模计算效率方面有深厚背景,负责 Google 的 TPU、Jupiter 网络和 Borg 系统等关键基础设施,推动 AI 训练和推理的算力效率显著提升。此举不仅加强了 Google 在 AI 领域的技术实力,也有助于人才保留。

来源:TechCrunch AI

08:31

AI医疗影像:在数据“围城”中如何突围

国家五部门联合发布政策,推动AI在医疗卫生领域的应用,目标到2030年实现基层诊疗智能辅助全覆盖。当前,AI医疗影像技术已成熟应用于疾病诊断、治疗规划等场景,显著提升医生工作效率。然而,行业面临商业化困境,需通过引入Transformer等更先进技术,提高模型能力及多模态处理水平,以突破现有局限。数据获取与处理成为关键挑战与机遇所在。

来源:36氪

08:31

一家空间智能公司,要做AI时代的卖水人 | 最前线

一家空间智能公司,要做AI时代的卖水人 | 最前线

群核科技在2025酷+大会上发布Aholo空间智能开放平台和3D AI内容创作工具LuxReal,从3D空间软件提供商转向空间智能基础设施提供商。Aholo整合了空间重建、生成、编辑与理解四大核心能力,以API或SDK形式对外开放;LuxReal则通过引入3D技术解决AI视频生成的时空一致性问题。这些创新将推动影视、XR、文化遗产保护、工业孪生、机器人仿真等多个领域的应用发展。

来源:36氪

08:31

年终大冲刺,中美科技大厂都杀疯了

年终大冲刺,中美科技大厂都杀疯了

年末,阿里、蚂蚁、字节跳动及DeepSeek等科技巨头集中发布AI新产品,如千问APP、灵光APP、豆包AI助手及DeepSeek-V3.2等,展示了多语言处理、生活服务整合、自然语言生成应用及跨平台操作等能力。这些产品不仅在功能上实现了从被动问答到主动执行的跨越,还体现了AI技术向更高效、更智能方向发展的趋势。同时,硅谷的最新动态也表明,AI正从单一助手转向多智能体协作平台,预示着未来AI将更加注重可调度性与执行效率。

来源:36氪

06:28

据报道,英伟达正在测试追踪软件,同时芯片走私传闻四起

据报道,英伟达正在测试追踪软件,同时芯片走私传闻四起

Nvidia正在测试一种软件,能够追踪其AI芯片的位置,以应对芯片被走私到中国的报道。该软件通过计算性能和服务器间通信延迟来确定芯片所在国家,并将作为可选项首先应用于Blackwell芯片。尽管Nvidia否认了有关中国DeepSeek AI模型使用走私芯片的指控,但此技术旨在加强数据安全与合规性,反映了当前AI产业在面对全球贸易限制时的技术挑战和发展趋势。

来源:TechCrunch AI

04:01

Spotify测试更加个性化的AI驱动“提示播放列表”

Spotify测试更加个性化的AI驱动“提示播放列表”

Spotify 推出全新‘Promoted Playlists’功能,允许用户通过更长、更具体的文字指令定制个性化播放列表,该功能基于AI技术,能够综合考虑用户的整个听歌历史记录和世界知识。相比现有AI播放列表,新功能支持更复杂的请求,并允许用户自定义更新频率。这标志着在音乐推荐领域,人工智能正向着更加个性化与用户可控的方向发展。

来源:TechCrunch AI

12月 10日
5 条新闻
23:00

谷歌推出托管MCP服务器,让AI代理轻松接入其工具

谷歌推出托管MCP服务器,让AI代理轻松接入其工具

Google推出全托管的远程MCP服务器,旨在简化AI代理与外部工具和数据的连接。通过集成Maps、BigQuery等服务,开发者可以更便捷地将AI代理接入实际应用中,如直接查询大数据或进行行程规划。此举基于开放标准Model Context Protocol (MCP),不仅支持自家产品如Gemini CLI,也兼容第三方客户端如Claude和ChatGPT。同时,利用Apigee API管理工具,企业可为AI代理设置安全和治理规则,推动AI在企业级应用中的落地。

来源:TechCrunch AI

22:00

AI初创公司Tavus创始人称用户每天与AI圣诞老人“交谈数小时”

AI初创公司Tavus创始人称用户每天与AI圣诞老人“交谈数小时”

Tavus AI 创业公司推出第二代 AI 圣诞老人体验,利用语音和面部克隆技术创建数字复制品,实现与用户的文本、电话或视频聊天互动。新版AI圣诞老人更加富有表现力和情感意识,能够识别用户表情和手势,并记忆对话内容以提供个性化体验。该应用展示了多模态模型在智能助手领域的进步,但也引发了关于AI对儿童影响的讨论。

来源:TechCrunch AI

22:00

Figma推出基于AI的对象移除与图片扩展新功能

Figma推出基于AI的对象移除与图片扩展新功能

Figma 推出了基于AI的图像编辑新功能,包括对象移除、隔离和图像扩展等,旨在简化设计流程并减少对第三方工具的依赖。这些功能利用了先进的计算机视觉技术,使用户能够更直观地调整图像元素如光照、阴影、颜色等。同时,Figma 将所有图像编辑工具整合到一个工具栏中,提高了易用性。此举标志着Figma在与Adobe和Canva等竞争对手的竞争中迎头赶上,并展示了AI在提升用户体验方面的潜力。

来源:TechCrunch AI

20:41

乐奇Rokid这一年,一路狂飙不回头

乐奇Rokid这一年,一路狂飙不回头

乐奇Rokid在2025年智能眼镜市场中脱颖而出,通过深度学习与多模态技术优化用户体验。其产品集成了拍照、翻译、提词等功能,并创新性地引入了磁吸式充电设计及AI指令优化,显著提升了交互体验。乐奇Rokid还特别关注用户需求,如为视障用户提供更快速的语音提示服务,以及支持粤语唤醒功能。这些举措不仅推动了智能眼镜的技术进步,也为行业树立了新的标杆。

来源:量子位