AiCC小报 2024-04-10

AiCC小报1年前 (2024)发布

3,321 0 0

2024年谷歌云大会：借助生成式AI增加动力

🔍 AI模型扩展：谷歌云正在扩展其在Vertex AI上提供的最佳AI模型的访问权限，包括Gemini 1.5 Pro的公开预览，该模型在长文本理解方面取得了突破。
💡 AI超级计算机：为了支持生成式AI的进步，谷歌云的AI超级计算机结合了TPU、GPU、AI软件等，为客户提供训练和服务模型的性能和成本优势。
🛡️ Gemini在云和网络安全中的应用：谷歌云正在推出新功能，通过AI帮助客户更高效地工作、识别和解决安全威胁。
📱 Google Workspace中的AI功能：继去年推出“帮我写”功能后，谷歌云正在为Google Workspace增加更多AI增强功能，包括Gmail、Meet和Chat的升级，并推出Google Vids视频创作应用。
https://blog.google/products/google-cloud/google-cloud-next-2024-generative-ai-gemini/#models-expanded-access

微软将投资29亿美元在日本开展AI项目

🌐 投资计划：微软计划在日本投资29亿美元，用于扩展其云和AI基础设施，培训300万人学习AI技术，并在东京设立微软亚洲研究院。
📈 投资规模：据报道，这将是微软在日本最大的一笔投资。
🔧 基础设施扩展：微软的基础设施扩展将包括在日本的两个现有地点增加先进的AI半导体。
🤖 研究与开发：位于东京的新实验室将专注于机器人和AI的研究与开发，利用日本在许多其他技术领域的优势。
🛡️ 网络安全合作：微软和日本政府还将合作加强网络安全防御能力。
https://www.pymnts.com/news/artificial-intelligence/2024/microsoft-invest-2-billion-dollars-ai-projects-japan/

苹果的新AI模型可能理解你的主屏幕并极大增强Siri的功能

🔍 研究进展：苹果研究人员发布了一篇研究论文，介绍了Ferret-UI，这是一种新的多模态大型语言模型（MLLM），能够理解移动用户界面（UI）屏幕。
📱 模型特点： Ferret-UI经过训练，能够识别主屏幕上的不同元素，如应用图标和文本。它通过“任何分辨率”功能克服了以往MLLMs难以识别小元素的挑战。
🌟 性能比较：与OpenAI的GPT-4V相比，Ferret-UI在几乎所有的基础任务中表现更佳，包括图标识别、OCR、小部件分类等。
🔄 定位对话：在基于UI发现的对话定位方面，GPT-4V略胜一筹，但Ferret-UI的性能仍然“值得注意”。

https://arxiv.org/abs/2404.05719

OpenAI 推出了具有视觉能力的 GPT-4 Turbo 模型

👁️ 视觉能力： OpenAI 推出了具有视觉能力的 GPT-4 Turbo 模型，这一新模型可以处理视觉请求，并通过 JSON 模式和函数调用执行任务。
API访问：通过OpenAI的API，开发者可以访问GPT-4 Turbo模型，将其集成到各种应用程序和服务中。
📚 文档和支持： OpenAI的帮助中心提供了详细的文档和支持，帮助用户了解如何使用GPT-4 Turbo以及如何通过API与之交互。
💡 使用指南：用户可以通过访问OpenAI的帮助中心文章来获取关于如何使用GPT-4 Turbo的更多信息和指导。
https://platform.openai.com/docs/models/continuous-model-upgrades

# AiCC小报