标签筛选

日期筛选

日

一

二

三

四

五

六

29

30

31

01

02

03

04

05

06

07

08

09

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

01

02

03

04

05

06

07

08

09

1月

39 条

2月

1 条

3月

3 条

4月

0 条

5月

0 条

6月

0 条

7月

0 条

8月

0 条

9月

0 条

10月

0 条

11月

0 条

12月

0 条

AI新闻

已选标签:

多模态AI

AI绘画

12月 1日

1 条新闻

08:25

这才是 AI 近年来最有价值的成就，却被很多人忽视

这才是 AI 近年来最有价值的成就，却被很多人忽视

AlphaFold2 利用深度学习技术，通过氨基酸序列预测蛋白质三维结构，准确率超过90%。该技术在医疗、遗传病研究、塑料降解及药物开发等领域展现出巨大潜力，如加速新冠疫苗研发、助力罕见遗传病研究、设计高效降解塑料酶等。随着 AlphaFold3 和 AlphaProteo 的推出，AI 在生命科学领域的应用将更加广泛，推动生物学研究进入新阶段。

来源：36氪

11月 30日

5 条新闻

15:04

阶跃开源4B Agent模型，跑通所有安卓设备，手搓党一键部署

阶跃开源4B Agent模型，跑通所有安卓设备，手搓党一键部署

阶跃开源了4B GUI Agent模型GELab-Zero，支持一键部署在所有安卓设备上，并刷新了同尺寸模型性能纪录。该模型基于视觉理解适配几乎所有App，无需厂商额外改造。同步开源的还有自建评测标准AndroidDaily，推动GUI领域向消费级、规模化应用发展。GELab-Zero提供轻量级本地推理、多设备任务分发等功能，降低了移动端Agent开发门槛，使开发者能更专注于策略创新与体验设计。

来源：量子位

12:53

阿里夸克S1AI眼镜，缺一个“AppStore”

阿里夸克S1AI眼镜，缺一个“AppStore”

阿里夸克S1眼镜结合了AI大模型与语音控制技术，支持支付、听歌、拍摄等功能，搭载通义千问等应用。尽管目前表现良好，但缺乏AppStore限制了开发者生态建设。未来AR与AI眼镜有望成为手机后的第二个终端产品，而构建开发者生态是关键。同时，MentraOS正尝试通过开源方式成为智能眼镜的安卓系统，为开发者提供更多灵活性。

来源：36氪

10:36

混元OCR模型核心技术揭秘：统一框架、真端到端

混元OCR模型核心技术揭秘：统一框架、真端到端

腾讯发布开源轻量级OCR模型HunyuanOCR，采用原生ViT和轻量LLM结合的架构，实现文字检测、识别及复杂文档解析等全能高效处理。该模型在ICDAR 2025 DIMT挑战赛中夺冠，并在多项关键指标上取得SOTA成绩。其核心技术包括轻量化设计、高质量预训练数据生产、重应用导向预训练策略及针对OCR任务定制的强化学习方案，为科研与工业落地提供强大支持。

来源：量子位

10:15

华尔街尬捧TPU学术界懵了：何恺明5年前就是TPU编程高手，多新鲜

华尔街尬捧TPU学术界懵了：何恺明5年前就是TPU编程高手，多新鲜

新闻指出，尽管市场对谷歌TPU的突然追捧导致英伟达股价下跌，但Meta、xAI等大公司及学术界早已广泛使用TPU进行AI模型训练。技术上，谷歌与英伟达均未形成绝对优势；成本方面，基于Llama 3.3的评测显示，H100相比TPU v6e在性价比上有显著优势。分析认为，谷歌通过TPU销售更多是为了保障产能而非直接竞争。

来源：量子位

05:39

Adobe称黑色星期五在线消费创纪录达118亿美元

Adobe称黑色星期五在线消费创纪录达118亿美元

Adobe与Salesforce数据显示，AI在黑色星期五全球销售额中发挥了重要作用，影响了约220亿美元的销售。这表明AI技术如推荐系统、智能助手等正逐渐成为电子商务的重要推手。尽管具体定义尚不明确，但AI对消费者购物体验的影响日益显著，反映了AI在零售业中的商业落地趋势及其对未来购物方式变革的潜力。

来源：TechCrunch AI

11月 29日

2 条新闻

13:19

阿里夸克、理想、谷歌押下重注，AI眼镜进入“巨头收割”新阶段

阿里夸克、理想、谷歌押下重注，AI眼镜进入“巨头收割”新阶段

多家企业竞相布局AI眼镜市场，将其视为下一代人机交互的关键入口。理想、阿里、谷歌等公司纷纷推出或重启相关项目，试图通过集成自家的大语言模型和其他AI技术，提供从导航到翻译等多功能服务。尽管当前产品在轻量化、续航等方面面临挑战，但各企业正努力优化用户体验，争夺特定场景下的用户黏性。预计未来几年内，该领域将经历从百花齐放到巨头主导的过程，最终胜出者将是那些能够深刻理解并满足特定应用场景需求的企业。

来源：36氪

09:40

万卡集群要上天？中国硬核企业打造太空超算！

万卡集群要上天？中国硬核企业打造太空超算！

中国科研机构与商业航天企业正积极推动太空超算发展，通过部署高性能计算集群和AI大模型，在轨实现数据处理与智能决策。中科天算的“天算计划”旨在构建10EOPS级天基万卡超级智能体集群，采用模块化设计应对极端环境挑战。这一创新将促进太空互联网应用生态的形成，并为远洋渔业等场景提供即时决策支持，标志着算力基础设施的重大变革。

来源：量子位

11月 28日

12 条新闻

20:54

Gemini立功，谷歌AI再次伟大，百度阿里们可以抄作业了？

Gemini立功，谷歌AI再次伟大，百度阿里们可以抄作业了？

Google发布新一代大模型Gemini 3，展现其在多模态处理和生成图像方面的强大能力，同时自研TPU成为英伟达算力霸权的最大变量。尽管曾因Bard失败而受质疑，但Google坚持AI优先战略，通过整合DeepMind与Google Brain、优化全栈式AI路线，在搜索、移动端等产品上实现显著提升，并推动了NotebookLM和Nano Banana等原生AI应用的发展。

来源：36氪

20:54

1688想用AI智能体“出海”

1688想用AI智能体“出海”

1688推出电商AI智能体‘遨虾’，利用多模态技术与阿里云算力支持，解决中小企业出海痛点，包括语言障碍、运营能力等。该系统通过分析市场、匹配工厂、生成素材及自动询价等功能，优化跨境电商业务链路，旨在构建更高效的企业出海解决方案。

来源：36氪

20:54

Gemini立功了，谷歌AI再次伟大，百度阿里们可以抄作业了？

Gemini立功了，谷歌AI再次伟大，百度阿里们可以抄作业了？

Google 发布了新一代大模型 Gemini 3，展示了其在多模态处理、视觉生成等方面的显著进步。基于自研 TPU 的强大算力支持，Gemini 3 在多个应用场景中表现出色，如医疗影像分析和建筑设计审查等。同时，Google 的全栈式 AI 路线也逐渐显现出优势，包括云基础设施、搜索数据资源以及移动端生态的整合，为未来AI技术的发展提供了坚实的基础。

来源：36氪

20:54

“文科生”微博，搞出一个数学学霸大模型

“文科生”微博，搞出一个数学学霸大模型

微博发布首个开源模型VibeThinker，以15亿参数和7800美元低成本在国际顶级数学测试中取得高分，挑战了“规模即智能”的行业共识。通过GRPO强化学习算法与频谱到信号原理（SSP）方法，VibeThinker在AIME2024、AIME2025及HMMT2025测试集中表现出色，尤其在数学推理能力上刷新了小模型的智能极限。这一成就不仅证明了小型模型也能解决复杂问题，还展示了成本控制与技术优化的新路径，可能重新定义AI领域的游戏规则。

来源：36氪

19:52

国产最强多模态宝座又易主？671B参数练就“火眼金睛”，基于DeepSeek打造

国产最强多模态宝座又易主？671B参数练就“火眼金睛”，基于DeepSeek打造

快手开源了新一代多模态大模型Keye-VL-671B-A37B，基于DeepSeek-V3-Terminus打造，拥有6710亿参数。该模型在图像和视频理解、跨模态对齐及复杂推理方面表现出色，超越了多个前沿VL模型。通过三阶段预训练策略和多阶段后训练优化，实现了高效的视觉理解和推理能力提升。未来，快手计划进一步融合多模态Agent能力，增强模型的工具调用与复杂问题解决能力。

来源：36氪

18:50

小米狂吸机器人技术大牛，前特斯拉Optimus工程师也来了

小米狂吸机器人技术大牛，前特斯拉Optimus工程师也来了

小米机器人团队引入前特斯拉Optimus灵巧手核心成员卢泽宇，加速灵巧手技术工程化落地。此举显示了小米在提升机器人灵巧性上的雄心，旨在为未来人形机器人奠定基础。同时，小米开源了首个跨域具身大模型MiMo-Embodied，成功融合自动驾驶与具身智能任务，标志着其在多模态模型和应用场景创新上取得重要进展。

来源：36氪

18:49

谷歌CTO兼首席AI架构师揭秘：谷歌如何用两年半完成AI逆袭

谷歌CTO兼首席AI架构师揭秘：谷歌如何用两年半完成AI逆袭

Gemini 3聚焦于精准意图理解、全球化服务及工具化创造能力，强调AI技术的实际应用价值而非单纯追求基准测试分数。通过自然语言编程打破创意与实现壁垒，推动AGI需与现实世界持续交互。文本与视觉模型共享底层架构以增强人类直觉交互体验。谷歌从实验室思维转向战场思维，每六个月迭代更新，激活全球专家资源，实现端到端协同。

来源：36氪

17:47

“AI新王”强势崛起，2027年谷歌TPU外销量或达100万颗

谷歌通过对外销售自研AI芯片TPU，有望显著提升其销售额和盈利。摩根士丹利预测，若谷歌售出约50万颗TPU，2027年云收入将增加130亿美元，每股收益增长3%。此举标志着谷歌战略转变，从内部使用转向市场推广，尽管存在商业模式、定价策略及工作负载承载能力的不确定性。同时，谷歌大模型Gemini 3获得好评，进一步推动其在AI领域的竞争地位。

来源：36氪

17:28

视频理解霸榜！快手Keye-VL旗舰模型重磅开源，多模态视频感知领头羊

视频理解霸榜！快手Keye-VL旗舰模型重磅开源，多模态视频感知领头羊

快手发布Keye-VL-671B-A37B多模态大语言模型，显著提升视觉感知与复杂推理能力。该模型在图像语义理解、视频细节把握等方面表现出色，通过多阶段预训练和后训练策略，实现了对日常场景及高难任务的精准解析。开源版本已上线，未来将融合更多Agent能力，推动AI向更智能形态发展。

来源：量子位

16:44

不止硅谷十万大裁员，Hinton警告：AI正以最糟糕方式颠覆社会

不止硅谷十万大裁员，Hinton警告：AI正以最糟糕方式颠覆社会

AI技术快速发展，特别是大语言模型和多模态处理能力的提升，正引发社会深刻变革。专家Hinton警告称，AI可能导致大规模失业和社会解体，但同时也强调其在医疗、教育等领域的巨大潜力。亚马逊等科技巨头通过裁员为AI发展腾出空间，引发了对AI伦理和控制权的广泛讨论。

来源：36氪

14:39

AI 霸主谷歌的反击：为什么说 4 万亿市值只是一个开始？

AI 霸主谷歌的反击：为什么说 4 万亿市值只是一个开始？

谷歌凭借Gemini 3和Nano Banana Pro在AI领域取得重大进展，尤其通过TPU算力集群，在推理成本控制上占据优势。Gemini 3展示了强大的多模态处理能力，适用于复杂任务如代码理解和视频分析。Nano Banana Pro则优化了移动设备上的AI应用。这些技术突破结合谷歌庞大的用户基础，为其在AI时代的全栈主权提供了坚实支持。

来源：36氪

14:39

80后诺奖得主：AlphaFold下一步融合大模型

80后诺奖得主：AlphaFold下一步融合大模型

AlphaFold在问世五周年之际，设计者John Jumper提出其下一步将与大模型融合，以提升科学文献数据处理和推理能力。自2020年推出以来，AlphaFold已帮助全球超过300万研究人员预测数亿种蛋白质的三维结构，推动了从心血管疾病到蜜蜂抗病性等多个领域的突破。未来，AlphaFold计划结合更广泛的AI技术，不仅限于结构预测，还将涉及假设生成、实验设计等复杂任务，进一步深化AI在生命科学中的应用。

来源：36氪

« 上一页
1
…
14
15
16
17
18
…
20
下一页 »