AI新闻

已选标签:
多模态AI
11月 24日
11 条新闻
19:50

6天狂飙200万,这个AI应用为何全网爆火?

6天狂飙200万,这个AI应用为何全网爆火?

蚂蚁集团发布的全模态通用AI助手“灵光”在上线六天内下载量突破200万,其核心功能“闪应用”允许用户无需编程即可创建实用小程序,降低了技术门槛。灵光采用多模态交付方式,提升了信息呈现的直观性和美观度。这一趋势表明,AI产品正从强调模型能力转向注重用户体验和实用性,预示着未来AI将更加融入日常生活,并推动软件开发向去中心化、个性化方向发展。

来源:36氪

19:50

00后谈恋爱,用AI当「僚机」

新闻探讨了AI在恋爱场景中的应用,从一键生成高情商回复的恋爱键盘到提供策略的’AI军师’,这些产品正迅速吸引年轻用户。然而,尽管部分产品如Lovekey键盘取得商业成功,但更全面的AI恋爱助手却面临商业化困境,包括高昂的成本、有限的付费意愿等挑战。情感计算专家指出,仅靠文本分析无法完全理解人类情感复杂性,未来需结合多模态数据(如语音、面部表情)以实现更准确的情感识别与分析。

来源:36氪

19:49

奥特曼承认谷歌威胁到OpenAI,即将推出新模型“Shallotpeat”

奥特曼承认谷歌威胁到OpenAI,即将推出新模型“Shallotpeat”

谷歌Gemini 3 Pro和Nano Banana Pro的发布,对OpenAI构成了显著竞争压力。预训练技术成为谷歌弯道超车的关键,尤其是在编程等核心领域展现优势。面对财务和技术挑战,OpenAI正尝试通过优化模型追赶。此转变揭示了AI竞赛从单一模型突破向全栈体系对抗的趋势,谷歌凭借其在算力、数据及产品生态上的全栈优势,在这场竞争中占据了有利位置。

来源:36氪

19:15

睿尔曼开源全球首个高质量、模态数量最多的真机数据集

睿尔曼开源全球首个高质量、模态数量最多的真机数据集

睿尔曼开源全球首个高质量、多模态真机数据集,涵盖图像、关节位置等多模态数据,具备时空硬同步、超低丢帧率等六大技术优势。该数据集基于十大真实场景采集,旨在解决机器人训练数据瓶颈,提升泛化能力与产业化落地速度。项目致力于构建开放共享的机器人开源生态,推动智能机器人算法创新及应用拓展。

来源:量子位

18:46

阿里AI猛补课,蚂蚁的“灵光”灵不灵?

阿里AI猛补课,蚂蚁的“灵光”灵不灵?

蚂蚁集团推出全新AI助手“灵光”,具备全代码生成多模态内容能力,支持生成图文、3D模型等。其“闪应用”功能可在30秒内根据自然语言指令生成可交互的小应用。该产品定位为效率工具,强调信息展现形式的创新与移动端交互体验,旨在提升信息传递效率。技术上,灵光优化了模型架构和工程实现以应对高膨胀率挑战,展示了在多模态处理和代码生成方面的突破。

来源:36氪

18:46

自动驾驶教父Thrun预言,纯视觉路线决胜2026,空中机器人将成新蓝海

自动驾驶教父Thrun预言,纯视觉路线决胜2026,空中机器人将成新蓝海

Sebastian Thrun在摩根士丹利亚太峰会上深入探讨了自动驾驶技术路线,特别是纯视觉方案与多传感器融合方案的优劣。他强调特斯拉的纯视觉FSD测试将是行业转折点,指出纯视觉方案在成本上有显著优势,但面临恶劣天气下的可靠性挑战。Waymo等公司正加速扩展无人驾驶服务,标志着自动驾驶进入规模化阶段。Thrun还分享了Waymo早期发展历程及团队建设哲学,并预测未来3-5年是自动驾驶商业化黄金期。

来源:36氪

18:45

美国AI版“四万亿”,能给中国民间投资带来什么启示?

美国头部企业在AI领域的投资显著增长,特别是数据中心和相关设备领域,推动了宏观经济的发展。这些投资主要来自科技巨头,如苹果、微软等,预计2025年全年将达到5000亿美元。然而,这种大规模的投资也带来了金融风险的担忧。面对此情况,中国正通过政策调整鼓励民间资本进入AI等新兴领域,以促进技术创新和经济增长。

来源:36氪

17:44

互联网大厂下注,给具身智能机器人带来了哪些舞台?

互联网巨头如京东、美团、阿里等正积极投资具身智能机器人赛道,旨在通过财务回报、业务协同及服务场景渗透获得竞争优势。这些企业利用自身资源为机器人企业提供真实应用场景和数据支持,加速其技术迭代与商业化进程。未来,随着AI能力提升,机器人在仓储物流、零售、医疗保健等领域的应用将更加广泛,推动多模态融合、边缘计算等技术发展,形成降本增效的解决方案。

来源:36氪

17:44

Nano Banana,OpenAI 你学不会

Nano Banana,OpenAI 你学不会

谷歌的Nano Banana Pro通过引入思维链机制,实现了基于物理逻辑的图像生成,打破了传统AI依赖文本描述和统计学相关性的局限。其原生多模态架构直接处理语义、空间及物理属性,显著提升了生成图像的准确性和细节表现力。与之相比,OpenAI的GPT-4o在视觉理解和物理模拟方面存在不足,但其快速生成能力和审美直觉仍具优势。两者差异源于各自公司对AI技术路径的不同选择:谷歌强调统一模型下的多模态融合;而OpenAI则侧重于模块化拼接与专业分工。

来源:36氪

17:44

美国AI算力新基建是“泡沫”吗?

美国AI算力新基建是“泡沫”吗?

美国正进行大规模算力投资,以支持通用人工智能的发展,预计吸引超2.5万亿美元投资。尽管存在泡沫风险,但大模型企业如OpenAI和Anthropic的高速增长收入及各行业对AI应用的需求,为这一投资提供了合理性。同时,AI技术推动了云计算行业的显著增长,增加了对芯片和数据中心的需求。然而,需关注潜在的技术迭代减缓、产业链循环投资等风险。

来源:36氪

16:43

青年科学家数量创新高!35位新一期“新基石研究员”获资助

青年科学家数量创新高!35位新一期“新基石研究员”获资助

新基石研究员项目第三期资助35位科学家,其中青年科学家占比超过四分之一,平均年龄45岁。该项目聚焦原始创新与自由探索,支持数学与物质科学、生物与医学科学两大领域,鼓励跨学科研究。通过长期稳定资金支持,促进AI相关基础技术如深度学习、机器学习及多模态模型的发展,并推动其在医疗诊断等领域的应用。

来源:量子位