June 11 AI 日报
1️⃣ OpenAI 推出 o3-pro 模型,提升性能并优化成本
OpenAI 宣布 o3-pro 模型现已向所有 ChatGPT Pro 用户和 API 用户开放。o3-pro 在科学、教育、编程、数据分析和写作等领域表现优异,专家评估中优于 o3 模型。
o3-pro 支持多种工具,包括网络搜索、文件分析、视觉输入、Python 编程和个性化记忆等。企业和教育用户将在下一周获得访问权限,o3-pro 使用与 o3 相同的底层模型,安全细节可在 o3 系统卡中找到。
🔗 OpenAI 推文:https://x.com/OpenAI/status/1932530409684005048
2️⃣ ManusAI 推出 AI 工具,自动生成演示文稿
ManusAI 展示了其 AI 工具如何在几分钟内自动生成完整的演示文稿。该工具能够处理从研究到内容创作、图像选择和设计布局等所有步骤,提供出色的视觉效果和专业结构。
用户可以轻松编辑生成的文稿,工具支持高分辨率输出(1.5k 原生分辨率和最高 4k 超分辨率)。ManusAI 的解决方案旨在减少手动创建演示文稿的时间和努力,提供即用型的文档导出功能。
🔗 ManusAI 推文:https://x.com/ManusAI_HQ/status/1932462624136204360
3️⃣ OpenAI 大幅降低 o3 模型价格,并推出 o3-pro
OpenAI 宣布将 o3 模型价格降低 80%,新价格为输入 $2 / 1M tokens,输出 $8 / 1M tokens。同时,推出了 o3-pro 模型,价格为输入 $20 / 1M tokens,输出 $80 / 1M tokens,比 o1-pro 便宜 87%。
该价格调整是通过优化推理栈实现的,未对模型本身进行任何更改。o3-pro 推荐使用背景模式,以避免超时问题。OpenAI 还提到,o3 和 o3-pro 使用相同的底层模型,安全细节可在 o3 系统卡中找到。
🔗 OpenAI Developers 推文:https://x.com/OpenAIDevs/status/1932532777565446348
4️⃣ Mistral AI 推出 Magistral 模型,专注于领域特定和多语言推理
Mistral AI 宣布推出其首个推理模型 Magistral,旨在领域特定、透明和多语言推理方面表现出色。Magistral 提供两个变体:Magistral Small(24B 参数开源版本)和 Magistral Medium(企业版本)。
Magistral 的目标是解决 AI 生成内容的“AI 外观”问题,提供更真实和清晰的纹理以及多种风格。用户可以免费申请私有 beta 版本,体验其功能,模型支持广泛的艺术知识和风格参考。
🔗 Mistral AI 推文:https://x.com/MistralAI/status/1932441507262259564
5️⃣ KREA AI 推出 Krea 1 图像模型,专注于美学控制和图像质量
KREA AI 推出了其首个图像生成模型 Krea 1,提供优越的美学控制和图像质量。Krea 1 支持广泛的艺术知识,并允许风格参考和自定义训练。
Krea 1 旨在解决 AI 生成图像的“AI 外观”问题,提供高度真实、清晰的纹理和多种风格。模型支持高达 4k 的超分辨率输出,用户可以免费申请私有 beta 版本。
🔗 KREA AI 推文:https://x.com/krea_ai/status/1932440476541411670
6️⃣ LlamaIndex 展示如何将代理转化为 MCP 服务器
LlamaIndex 演示了如何将任何 LlamaIndex 代理转化为 MCP 服务器。通过一个自定义工作流 Fidelity FundExtraction,该工作流设计用于从复杂的多基金 PDF 中提取结构化数据,并作为 MCP 服务器部署,然后通过 Claude 调用。
该演示突出了将现有工作流转化为 MCP 服务器的简单性,只需一行代码即可实现。LlamaIndex 强调了将工具从基本 API 调用升级到完全代理工具的重要性,并使其易于通过 Claude Desktop、Cursor 或其他 MCP 客户端使用。
🔗 LlamaIndex 推文:https://x.com/llama_index/status/1932472507577299040
7️⃣ xAI 与 Polymarket 合作,整合市场预测与 X 数据和 Grok 分析
xAI 与 Polymarket 合作,将市场预测与 X 数据和 Grok 的分析相结合,旨在创建一个“硬核真相引擎”来理解全球趋势。该合作关系的目标是通过整合预测市场数据、社交媒体见解和 AI 分析来提供更准确的洞察。
该合作关系的示例是预测 2025 年美国经济衰退的可能性,结合了 Polymarket 的预测数据、X 的社交媒体数据和 Grok 的分析。xAI 和 Polymarket 表示这只是合作关系的开始,将来会有更多发展。
🔗 xAI 推文:https://x.com/xai/status/1932481207180406923
8️⃣ Google Gemini App 推出 Veogram 功能,创建个性化视频消息
Google Gemini App 推出了 Veogram 功能,允许用户使用 Gemini 平台创建个性化的视频消息。Veogram 旨在帮助用户表达难以通过文字传达的情感和信息。
示例视频展示了一只土拨鼠以 increasing urgency 呼叫“Robert”,表达在群聊中被忽略的挫败感。Veogram 功能面向 Pro 和 Ultra 用户,用户可以复制并粘贴提示,替换“Name”为任何想要的名字,并点击视频按钮即可生成。
🔗 Google Gemini App 推文:https://x.com/GeminiApp/status/1932474190797386202
今日 GitHub 热门项目
self-llm
self-llm 是一个针对中文初学者的开源大型语言模型(LLM)和多模态大型模型(MLLM)教程项目。该项目涵盖环境配置、部署、应用和微调等方面,旨在帮助普通学生和研究人员快速上手国内外开源 LLM/MLLM。
项目包括快速微调(全参数/LoRA)、部署和应用等指南,并鼓励社区通过 issues 或 PRs 贡献内容。初学者可以从 Qwen1.5、InternLM2 或 MiniCPM 等模型开始学习,进阶学习可参考相关项目如 Happy-LLM、Tiny-Universe、so-large-llm 和 llm-universe。
🔗 GitHub 项目页面:https://github.com/datawhalechina/self-llm