May 9 AI 日报

May 09, 2025

1️⃣ OpenAI发布模型使用指南

Paul Couvert在X上分享，OpenAI发布了一份新文档，详细指导用户如何选择适合任务的AI模型，包括GPT-4o、GPT-4.5、o4-mini、o4-mini-high、o3和o1 pro mode。

文档列出每个模型的最佳使用场景，例如GPT-4o适合日常任务（如头脑风暴、总结、邮件撰写），GPT-4.5更擅长创意任务，o4-mini适用于快速技术任务。

2️⃣ Google NotebookLM新功能曝光

TestingCatalog报道，Google正在为NotebookLM开发新功能，包括支持更多语言和增强AI能力，进一步扩展其作为AI研究助理的功能。

这些更新尚在开发中，尚未向公众开放，但显示了Google对多语言支持和功能扩展的重视。

3️⃣ Meta开源视频理解数据集

AI at Meta宣布发布一个开源视频理解数据集，支持细粒度任务，推动多模态AI研究和开发。

数据集与Meta Perception Language Model（PLM）相关，旨在提升视频内容解析能力，适用于内容分析、监控等场景。

4️⃣ OpenAI Responses API支持PDF输入

OpenAI Developers在X上宣布，Responses API和Chat Completions API新增PDF文件直接输入功能。

此更新使AI能够更高效地处理企业级文档数据和复杂文本任务，适合文档分析、摘要生成等场景。

5️⃣ Perplexity优化视频分析功能

Aravind Srinivas在X上透露，Perplexity的AskPerplexity现已支持视频内容导入，并能提供针对视频的详细解释。

用户可上传视频，AI会生成内容摘要或回答相关问题，增强了多模态数据处理能力。 🔗 X post

今日 GitHub 热门 AI 项目：MoneyPrinterTurbo

MoneyPrinterTurbo是一个开源AI视频生成工具，支持通过文本提示生成视频内容，快速部署，适合内容创作者和开发者。项目使用Python开发，支持多种模型和自定义配置，简化了视频生成流程。用户可通过Docker或本地安装运行，适用于营销、教育和娱乐场景。

DT News