AGI日报20250801 | GPT-5即将问世,Figure机器人洗衣技能曝光,中国AI领域再掀热潮!
传说GPT-5将会在这两天发布,真的吗?记得看到最后,收录了最热AI新应用排行。
Part.01 AGI头条
1、GPT-5发布传闻:匿名推文猜测GPT-5这两天发布,引发广泛讨论。
2、中国开源模型爆发:智谱AI、阿里、月之暗面等发布多款高性能模型(如GLM-4.5、Qwen3、Kimi K2)在各大社区持续火爆。
3、Anthropic估值飙升:拟以1700亿美元融资,较四个月前增长近三倍。
4、ChatGPT学习模式上线:转型AI导师,提供分步引导式教育功能。
5、视频生成技术突破:Wan2.2支持无限长视频,xAI推Grok Imagine。
6、机器人硬件升级:Figure发布人形机器人洗衣服视频。
7、开源工具密集更新:SmolLM3、LangChain等发布代码与效能优化方案。
Part.02 模型发布与性能
中国开源浪潮引领创新
七月中国实验室密集发布多款高性能模型,采用宽松许可协议(如MIT许可)。
· 智谱AI推出GLM-4.5(3550亿参数MoE混合专家模型,激活参数320亿)及轻量版GLM-4.5-Air,性能对标Claude 4 Opus,部分基准超越Gemini 2.5 Pro。
· 阿里巴巴发布视频模型Wan-2.2、编程专用模型Qwen3 Coder及Qwen3-235B系列;Qwen3 Coder在代码编辑测试中失败率仅5.32%,媲美Claude Sonnet 4。
· 月之暗面开源Kimi K2(1万亿参数MoE模型),在LiveCodeBench等测试中领先开源领域。
Part.03 视频与图像生成进展
xAI
推出图像视频工具Grok Imagine,采用候补清单制访问。
Wan2.2
阿里巴巴发布的5亿参数视频模型,创新采用帧独立降噪技术(每帧设独立时间步),支持无限长视频生成。
Ideogram
发布了单图一致性角色生成模型Ideogram Character,实现角色形象稳定输出。
Part.04 机器人技术突破
Figure
公开Figure-02人形机器人洗衣服视频,展示硬件与功能升级,如灵活抓取与环境交互能力。
Skild AI
推出机器人通用模型Skild Brain,更接近人类的思考方式,目标是打造统一的机器人大脑,驱动所有类型的机器人完成所有任务。
ViTPose
高精度姿态估计技术应用于篮球分析AI,可实时识别球员是否进入禁区。
Part.05 AI工具与应用
ChatGPT
ChatGPT推出学习模式,通过苏格拉底式提问(连续追问引导深度思考)、迷你测验和图像解析强化主动学习,适用于所有登录用户。
NotebookLM
新增视频摘要功能,将复杂资料转化为精简视频,提升知识吸收效率。
谷歌AI搜索
英国上线新功能,支持图片PDF上传分析、实时画板笔记及跨文档比对。
LangChain
发布LangGraph上下文工程六大实践指南(含视频代码教程)。
LangSmith Traces
整合服务器日志,增强系统可观测性。
Perplexity Comet浏览器
内置AI搜索,演示复杂任务执行(如航班选座预订)。
ElevenLabs CLI工具
支持对话式AI管理代码化,实现版本控制与自动化部署。
Part.06 开源生态动态及其它
开源生态动态
· SmolLM3模型完整训练代码开源(含预训练脚本、对齐后优化SFTAPO流程),采用Apache 2.0许可。
· Keras BlockDL免费开源神经网络可视化工具,简化模型架构调试。
· Hugging Face效能优化,jobs CLI改用uv加速环境配置,提升开发效率。
技术突破
· 实现单张H200 GPU训练120万序列长度的Llama-8B模型,结合ALST、FA3及Liger-Kernel技术,突破长上下文训练瓶颈。
商业合作
·Anthropic拟由Iconiq Capital领投1700亿美元融资,CEO Dario Amodei投身AI动机源于其父罕见病治疗延误的亲身经历。
内容生态
· 虚假内容泛滥,Substack平台涌现大量AI生成匿名文章,采用模式化叙事(如这不是X,而是Y!),挤压真实作者收益与关注度。
Part.07 昨天最TOP产品
RunLLM
AI主动解决问题而非仅提供应答,适用于复杂任务自动化场景。
Magic Patterns
AI驱动的新功能设计工具,简化产品原型创作流程。
PodClips
将播客内容自动转化为病毒式短视频,提升内容传播效率。
SideNotes
屏幕边缘快速笔记工具,支持即时捕捉与整理灵感。
Jotform Gmail Agent
自动起草拟人化Gmail回复,优化邮件管理效率。