AiCC小报 2024-04-10

AiCC小报2个月前发布
1,888 0 0

2024年谷歌云大会:借助生成式AI增加动力

🔍 AI模型扩展: 谷歌云正在扩展其在Vertex AI上提供的最佳AI模型的访问权限,包括Gemini 1.5 Pro的公开预览,该模型在长文本理解方面取得了突破。
💡 AI超级计算机: 为了支持生成式AI的进步,谷歌云的AI超级计算机结合了TPU、GPU、AI软件等,为客户提供训练和服务模型的性能和成本优势。
🛡️ Gemini在云和网络安全中的应用: 谷歌云正在推出新功能,通过AI帮助客户更高效地工作、识别和解决安全威胁。
📱 Google Workspace中的AI功能: 继去年推出“帮我写”功能后,谷歌云正在为Google Workspace增加更多AI增强功能,包括Gmail、Meet和Chat的升级,并推出Google Vids视频创作应用。
https://blog.google/products/google-cloud/google-cloud-next-2024-generative-ai-gemini/#models-expanded-access

微软将投资29亿美元在日本开展AI项目

🌐 投资计划: 微软计划在日本投资29亿美元,用于扩展其云和AI基础设施,培训300万人学习AI技术,并在东京设立微软亚洲研究院。
📈 投资规模: 据报道,这将是微软在日本最大的一笔投资。
🔧 基础设施扩展: 微软的基础设施扩展将包括在日本的两个现有地点增加先进的AI半导体。
🤖 研究与开发: 位于东京的新实验室将专注于机器人和AI的研究与开发,利用日本在许多其他技术领域的优势。
🛡️ 网络安全合作: 微软和日本政府还将合作加强网络安全防御能力。
https://www.pymnts.com/news/artificial-intelligence/2024/microsoft-invest-2-billion-dollars-ai-projects-japan/

苹果的新AI模型可能理解你的主屏幕并极大增强Siri的功能

🔍 研究进展: 苹果研究人员发布了一篇研究论文,介绍了Ferret-UI,这是一种新的多模态大型语言模型(MLLM),能够理解移动用户界面(UI)屏幕。
📱 模型特点: Ferret-UI经过训练,能够识别主屏幕上的不同元素,如应用图标和文本。它通过“任何分辨率”功能克服了以往MLLMs难以识别小元素的挑战。
🌟 性能比较: 与OpenAI的GPT-4V相比,Ferret-UI在几乎所有的基础任务中表现更佳,包括图标识别、OCR、小部件分类等。
🔄 定位对话: 在基于UI发现的对话定位方面,GPT-4V略胜一筹,但Ferret-UI的性能仍然“值得注意”。

https://arxiv.org/abs/2404.05719

OpenAI 推出了具有视觉能力的 GPT-4 Turbo 模型

👁️ 视觉能力: OpenAI 推出了具有视觉能力的 GPT-4 Turbo 模型,这一新模型可以处理视觉请求,并通过 JSON 模式和函数调用执行任务。
API访问: 通过OpenAI的API,开发者可以访问GPT-4 Turbo模型,将其集成到各种应用程序和服务中。
📚 文档和支持: OpenAI的帮助中心提供了详细的文档和支持,帮助用户了解如何使用GPT-4 Turbo以及如何通过API与之交互。
💡 使用指南: 用户可以通过访问OpenAI的帮助中心文章来获取关于如何使用GPT-4 Turbo的更多信息和指导。
https://platform.openai.com/docs/models/continuous-model-upgrades

© 版权声明
广告也精彩

相关文章

暂无评论

暂无评论...