AI新闻

已选标签:
多模态AI
AI对话
12月 9日
13 条新闻
18:29

人工智能生成广告:机遇、挑战与对策

新闻探讨了生成式人工智能技术,如大语言模型和多模态模型,在广告行业中的应用与变革。从程序化推荐到基于用户意图理解的智能广告系统,AI正在重塑数字广告的生产、投放及效果评估流程。以谷歌Gemini和腾讯混元大模型为例,展示了AI如何推动广告从被动呈现转向主动交互,并实现“一人千面”的个性化体验。然而,技术成熟度不足、数据合规性以及算法偏见等问题也对广告业提出了新的挑战。

来源:36氪

18:28

一文读懂Android XR发布会:谷歌“亲儿子”明年开卖

一文读懂Android XR发布会:谷歌“亲儿子”明年开卖

谷歌发布Android XR平台,整合多模态AI能力,支持智能眼镜与头显设备。通过Gemini AI实现情境感知式交互,如视觉搜索、实时翻译等功能。同时,推出有线XR眼镜Project Aura,平衡算力与佩戴舒适度。此外,更新了Android XR SDK,提供Jetpack Glimmer和Projected库,简化开发流程,并遵循OpenXR标准,促进生态发展。

来源:36氪

18:18

共推空天领域智能化升级!趋境科技与金航数码强强联手

共推空天领域智能化升级!趋境科技与金航数码强强联手

趋境科技与金航数码达成战略合作,共同推动空天领域智能化升级。基于趋境科技的高性能大模型私有化部署算力底座及金航数码的应用能力,双方已在航空等复杂装备工业领域成功落地多个大模型解决方案,实现降低推理门槛10倍的效果。此次合作深化了在智能化数据库、数据分析、辅助编程等方面的应用,并计划推广至更广泛的航空航天场景中,加速行业智能化转型。

来源:量子位

17:27

特斯拉机器人又被抓包:疑似遥控「摘头显」摔倒,名场面诞生

特斯拉机器人又被抓包:疑似遥控「摘头显」摔倒,名场面诞生

特斯拉人形机器人Optimus在近期活动中因疑似远程操控引发热议,暴露了当前人形机器人技术在自主智能方面的局限。尽管面临争议,马斯克坚信Optimus将极大推动经济发展,甚至改变社会结构。从技术角度看,实现精准的力反馈、低延迟信号传输等是远程操控人形机器人的关键挑战。长远来看,随着深度学习、多模态处理能力的进步,真正的完全自主智能仍需行业共同努力。

来源:36氪

17:27

2026年全球保险业展望:AI“重编码”游戏规则

2026年全球保险业展望:AI“重编码”游戏规则

全球保险业正经历从规模驱动到技术、资本与服务能力的深度变革。生成式AI、物联网监测及地理空间分析等技术在非寿险领域广泛应用,推动行业从记录风险向预测风险转变,提升精算能力和控制赔付成本。同时,AI在核保、理赔、客服等环节加速落地,但其规模化应用仍面临数据质量与系统基础挑战。未来保险业的核心竞争力将聚焦于技术底座能力、资本结构灵活性、数据模型深度及以客户为中心的服务体系构建。

来源:36氪

15:43

论文自动变漫画PPT!Nano Banana同款用秘塔免费生成,还有一对一语音讲解

论文自动变漫画PPT!Nano Banana同款用秘塔免费生成,还有一对一语音讲解

秘塔AI推出了一款创新的漫画式课件生成工具,能够将学术论文或行业报告自动生成为图文并茂、附带语音讲解的PPT。该工具支持多种风格选择,无需繁琐申请即可免费使用,极大提升了知识获取效率与学习体验。此应用展示了AI在教育辅助领域的潜力,特别是通过多模态处理技术实现信息的可视化和口语化表达,降低了复杂信息的理解门槛。

来源:量子位

15:23

准确率腰斩,大模型视觉能力一出日常生活就「失灵」

准确率腰斩,大模型视觉能力一出日常生活就「失灵」

EgoCross项目团队提出首个跨域第一人称视频问答基准,涵盖手术、工业、极限运动和动物视角四大领域,揭示现有多模态大语言模型在跨域场景下的泛化瓶颈。通过全面评测8款主流MLLM,发现即使最佳模型在跨域场景中表现也显著下降。研究探索了提示学习、监督微调及强化学习等方法,其中RL方法带来最显著性能提升(平均22%),为构建更具泛化能力的AI系统提供了新方向。

来源:36氪

13:19

努比亚总裁与抖音副总裁回应豆包AI手机问题

努比亚技术有限公司总裁倪飞发文称,团队已收到一些问题与反馈,正在与合作伙伴积极沟通与解决。抖音集团副总裁李亮转发并配文称:AI带来的变革是真实存在的,用户的需求也是真实存在的。豆包和中兴的探索是一个开始,不论这次是否会成功,但AI一定是未来。(广角观察)

来源:钛媒体

10:12

AI 时代,怎么跟模型说话?

本文探讨了2025年AI对话的重要性,以及提示词技能在职场中的价值。Anthropic的哲学博士Amanda Askell通过与Claude模型的交互,塑造其温和、耐心的性格,并强调AI模型应被视为协作伙伴而非工具。她提出三个核心原则:明确需求、任务分解和提供上下文。Anthropic还通过一份长达14,000个token的灵魂文档,在训练阶段就让Claude形成稳定的价值观。未来,AI产品将不仅竞争于能力,更在于性格和价值观的设计上。

来源:36氪

09:05

智谱开源“会操作手机的AI”AutoGLM

智谱深夜开源其核心AI Agent模型AutoGLM。该模型被业界视为全球首个具备“Phone Use”(手机操作)能力的AI Agent,能够稳定完成外卖点单、机票预订等长达数十步的复杂操作流程。此次开源意味着硬件厂商、手机厂商和开发者均可基于AutoGLM,在自己的设备或系统中复现一个能“看懂”屏幕、并模拟真人进行点击、输入、滑动的AI助手。目前,AutoGLM已支持微信、淘宝、抖音、美团等超过50个高频中文应用的核心场景,其自动化操作能力与此前引发热议的“豆包手机”演示相似。(广角观察)

来源:钛媒体

09:05

谷歌新架构逆天,为了让AI拥有长期记忆,豆包们都想了哪些招数?

谷歌新架构逆天,为了让AI拥有长期记忆,豆包们都想了哪些招数?

Google提出HOPE框架,旨在解决大模型长期记忆问题,通过区分短期与长期记忆系统,实现更稳定、个性化的信息存储和调用。这一进展标志着大模型正从依赖超长上下文窗口向构建可持续更新的记忆体系转变,对于提升智能助手的连续性和可靠性至关重要。同时,行业内的探索如字节MemAgent和MiniMax等也在推动长期记忆机制内化为模型核心能力,强调记忆应参与决策而非仅作为外部存储。

来源:36氪

12月 8日
7 条新闻
21:45

北京市科委立项课题”AI辅助3D游戏内容生产平台研发与应用”正式启动

由元境与北航新媒体艺术与设计学院联合主办的”智绘万象·聚力共生”3D数字内容创新发展高峰论坛上,北京市科委立项课题”AI辅助3D游戏内容生产平台研发与应用”日前正式启动,元境同步与浙江省北大信息技术高等研究院、重庆千方实业发展有限公司达成战略合作,构建空间计算技术生态,加速3D AIGC在游戏、动漫等领域的应用落地。(广角观察)

来源:钛媒体

21:38

看完最新国产AI写的公众号文章,我慌了!

看完最新国产AI写的公众号文章,我慌了!

智谱最新升级的GLM-4.6V模型展示了强大的多模态处理能力,能够高效生成图文并茂的公众号文章、解读论文与财报、复刻网页设计等。该模型在多个主流评测中取得SOTA成绩,尤其在视觉推理方面表现出色,支持从图片到视频等多种格式的内容理解与生成。其创新性地将工具调用能力融入视觉模型,为实际应用场景中的多模态Agent提供了强有力的技术支持。

来源:量子位

21:00

Hinge的新AI功能助力约会者超越无聊的寒暄

Hinge的新AI功能助力约会者超越无聊的寒暄

Hinge推出AI驱动的’Convo Starters’功能,旨在帮助用户通过提供基于个人资料和照片定制的对话建议来打破初次交流的尴尬。该功能利用机器学习技术分析用户偏好,并生成能够激发兴趣的话题建议。尽管此举受到多数用户的欢迎,尤其是考虑到附带消息的喜欢能显著提高约会成功率,但部分年轻用户对在线交友中使用AI感到不安。这反映出AI在提升用户体验的同时,也面临着隐私保护与接受度等挑战。

来源:TechCrunch AI

20:42

理想也做AI眼镜了,小鹏、蔚来、小米还不速速跟进?

理想也做AI眼镜了,小鹏、蔚来、小米还不速速跟进?

新闻探讨了AI眼镜从技术到应用的潜力及挑战,强调其在多模态数据处理、实时流式语音交互上的突破。理想Livis眼镜通过结合大模型和流式智能语音框架,实现了更快捷自然的用户体验,特别是在车控场景中展现出显著优势。随着AI技术进步,AI眼镜有望成为下一代主流消费电子,推动新一轮‘范式转移’。

来源:36氪

20:00

OpenAI宣布企业合作胜利,几天前刚因谷歌威胁启动“红色警戒”

OpenAI宣布企业合作胜利,几天前刚因谷歌威胁启动“红色警戒”

OpenAI 发布数据显示,过去一年企业级 AI 工具使用量激增,ChatGPT 消息量增长 8 倍,员工每日节省多达一小时。尽管 OpenAI 在消费订阅市场面临 Google Gemini 的竞争压力,其企业客户比例已达 36%,远超 Anthropic 的 14.3%。OpenAI 正加大对企业市场的投入,承诺未来几年内投资 1.4 万亿美元用于基础设施建设。企业不仅在消息发送上增加,还通过 API 进行更复杂的问题解决,自定义 GPT 使用量增长 19 倍,显示了 AI 技术的深入应用与定制化趋势。

来源:TechCrunch AI

19:40

GMI Cloud:出海是AI企业释放产能、获取新生的最佳途径|WISE 2025

GMI Cloud:出海是AI企业释放产能、获取新生的最佳途径|WISE 2025

GMI Cloud VP钱宇靖在WISE2025大会上分享了AI应用出海效能升级的关键,包括算力全球化、需求与价值的全球化转型。他指出,AI市场正经历指数级增长,特别是在北美地区,用户已广泛接受AI工具。面对出海挑战如服务及时性、扩展性和稳定性,GMI Cloud通过建设大规模AI工厂、优化集群引擎和推理引擎来提供解决方案,支持全球范围内的自动扩缩容与高可用设计,助力企业更高效地部署海外AI应用。

来源:36氪