March 13 AI 日报
1️⃣ Gemini 2 原生多模态图片生成 & YouTube 视频解析上线
Google 正式开放 Gemini 2 的原生图像生成和编辑功能,支持 文本生成图片、图片编辑,且 质量极高。此外,谷歌 AI Studio 现已支持解析 YouTube 视频,输入视频链接即可让 AI 分析内容、生成摘要、回答问题,无需手动上传。Gemini 2 可免费使用,在 Gemini AI Studio 直接输入文本即可生成或修改图片。同时 支持文本与图像交错,让 AI 生成更丰富的视觉内容。图源:@op7418
🔗 体验入口:Google AI Studio
2️⃣ Google 推出 Gemini Robotics
谷歌发布 Gemini Robotics,让 AI 具备实时感知、思考和行动能力,真正将 AI 融入机器人领域。机器人支持视觉感知,能实时理解环境;还可以结合 Gemini 2 的强大推理能力进行智能决策。此外,机器人可以在物理世界中执行复杂任务,如抓取、移动和交互。
🔗 更多细节:Google AI Robotics
3️⃣ Perplexity API 现已支持 MCP,AI 可获取实时信息
Perplexity API 新增 MCP(Multi-Context Processing)支持,让 AI 实时接入最新信息,增强推理能力。MCP 可为 Claude、Gemini 等 AI 提供实时数据,提高回答准确性,还可以优化信息检索能力。
🔗 详情:Perplexity API