May 25 AI 日报
1️⃣ Waterloo大学推出免费LLM基础课程
Waterloo大学推出了一门免费课程,专注于大型语言模型(LLM)的基础知识,由Wenhu Chen主讲。该课程涵盖了从基础到高级的AI主题,包括循环神经网络(RNN)、卷积神经网络(CNN)、自然语言处理(NLP)、计算机视觉(CV)、注意力机制、Transformer架构、预训练和参数高效微调(PEFT)等内容。
课程通过幻灯片和视频形式提供,适合初学者和有经验的开发人员深入学习AI模型开发。
🔗 推文
2️⃣ Google Labs推出Flow AI电影制作工具
Google Labs宣布其AI电影制作工具Flow现已扩展至71个新国家,通过Google AI Pro和Ultra订阅提供(Google Labs)。
Veo 3是Flow的核心功能之一,支持生成带声音的视频,现已对Pro用户开放试用,Ultra用户则享有更高的生成容量。
🔗 推文
3️⃣ Blackbox AI Agent:自主编程代理
Manish Kumar Shah在X上介绍了Blackbox AI Agent,一个已被超1000万开发者使用的自主编码代理(manishkumar_dev)。
该工具能够自动添加新功能、修复代码错误、从头构建完整应用程序,支持同步和异步工作模式,适应不同开发风格。视频演示(时长约8分钟)展示了Blackbox在代码编辑器中的操作,如修改代码、调试和项目管理。
🔗 推文
4️⃣ Google推出Jules:强大编程代理
Google推出了Jules,一个被誉为“最强大编码代理”的工具(jowettbrendan)。Jules能读取代码库、制定开发计划、构建功能、编写测试并推送拉取请求(PR),直接集成GitHub,减少开发者切换工具的麻烦。
它还提供音频提交摘要,方便团队同步更新。Jules运行于安全的Google Cloud虚拟机中,确保代码安全且无幻觉(hallucination)。目前处于免费公测阶段,开发者可通过Jules网站试用。
🔗 推文
5️⃣ Gemini App推广Veo 3
Google Gemini App宣布Veo 3现已在71个新国家可用,Pro用户可通过升级订阅试用此AI视频生成工具(GeminiApp)。
Veo 3支持生成带声音的视频,X帖子中展示了一个8秒视频,呈现了一只穿“GEMINI”毛帽的刺猬在雪地中的可爱场景,凸显其创意能力。
🔗 推文
6️⃣ Gamma:快速构建着陆页
Farah在X上分享了如何使用Gamma平台在不到2分钟内创建功能齐全的着陆页(farah_tech_AI)。Gamma是一个免费的AI驱动平台,已有超5000万用户,最近发布了新版本。
视频演示(时长82秒)展示了从输入描述(如“为TechNova AI Solutions创建着陆页”)到选择主题、编辑内容并发布的全过程。Gamma支持自定义主题和域名(Pro计划),生成的页面包括领导团队介绍和行业成功案例等内容。
🔗 推文
今日GitHub热门项目
LLaMA-Factory
LLaMA-Factory是一个开源AI项目,提供易用且高效的平台,用于训练和微调大型语言模型(LLM)(GitHub仓库)。它支持多种模型(如LLaMA、Mistral、Qwen等)和训练方法,包括预训练、指令监督微调、奖励模型训练等。
平台提供16位全参数微调、LoRA微调、QLoRA微调等多种计算精度,以及GaLore、BAdam、DoRA等优化算法和FlashAttention-2等加速运算符。用户无需编写代码即可在本地微调模型,适合研究者和开发者。LLaMA-Factory还支持多GPU分布式训练,近期更新包括支持Qwen3和InternVL3模型。
🔗 GitHub仓库