2026年04月03日 AI 科技日报 (B 站推出 AI 视频创作工具 updream)

张开发
2026/4/20 17:03:11 15 分钟阅读

分享文章

2026年04月03日 AI 科技日报 (B 站推出 AI 视频创作工具 updream)
2026年04月03日 AI 科技日报 (B 站推出 AI 视频创作工具 updream)共收录31条资讯AI模型谷歌开源 Gemma 4 覆盖手机到工作站谷歌发布开源模型 Gemma 4提供 E2B、E4B、26B MoE、31B Dense 四种规格采用 Apache 2.0 许可证。模型原生支持 Agent 工作流、函数调用、结构化 JSON 输出和多模态输入图像/视频小型号支持音频。上下文窗口小型号 128K、大型号 256K量化后可在消费级 GPU 与手机、树莓派、Jetson 离线运行H100 可跑全精度。对移动端离线助手、边缘部署和需要本地推理的企业具有直接价值。关键词Gemma 4本地推理多模态来源aigclink链接https://x.com/aigclink/status/2039851507982737422Qwen3.6-Plus 发布通义实验室推出 Qwen3.6-Plus聚焦编码智能体与长上下文能力。模型默认支持百万级字符上下文提升长文档解析与多轮编程任务的稳定性并兼容主流开发工具与第三方编程助手适用于前端生成、代码修复和终端自动化等场景对开发者和企业构建可靠的编程智能体有直接价值。关键词编码智能体长上下文开发者生态Qwen来源aibase.com链接https://news.aibase.com/zh/daily/26808产品发布Ray Serve LLM 增加 DP 组容错AnyScale 在 Ray Serve LLM 中加入了 DP group 的容错机制失败的 DP 组会被隔离并原子性重建而健康组继续提供服务。该设计与 vLLM 的 Elastic EP 互补为 MoE专家模型在生产环境中的高可用部署提供两层保障降低了大规模分布式推理的中断风险。关键词Ray ServeDP 容错vLLMMoE来源vllm_project链接https://x.com/vllm_project/status/2039870472092049458Perplexity 推出税务助理产品Perplexity 上线“Computer for Taxes”面向个人用户提供起草联邦税表、审核已准备申报材料和给出改进建议的能力。此类产品展示了大型语言模型在合规、文件生成与审查场景的实际落地价值但也带来隐私与合规风险需要结合人类审校与法规控制。关键词Perplexity税务自动化NLP 应用合规来源AravSrinivas链接https://x.com/AravSrinivas/status/2039873388689375311Sakana Chat 用于虚拟 CSO 报告生成Sakana Chat 被描述为能够在一天内完成传统研究团队数周才能完成的高级战略调查并生成详细报告与幻灯片。这类企业级智能助理强调自动化研究和报告输出适合战略分析、咨询与情报团队但需要关注信息来源的可靠性和验证流程。关键词Sakana Chat企业智能助理自动化研究报告生成来源SakanaAILabs链接https://x.com/SakanaAILabs/status/2039888436430266414Claude Code 发布 2.1.91 并给出省 Token 建议Claude Code 发布 2.1.91包含 13 项 CLI 改进例如禁用 skills 内联 shell 提升安全、修复 --resume 历史丢失等。同时官方和社区给出省 Token 建议优先使用低成本模型如 Sonnet 4.6、按需开启深度思考、限制上下文窗口并慎用恢复指令以避免激活超长会话。对使用 Claude Code 进行开发和大规模会话管理的团队有直接成本优化价值。关键词Claude Code更新成本优化来源ClaudeCodeLog链接https://x.com/ClaudeCodeLog/status/2039856633119969769Seedance 2.0 视频风格生成能力升级TopviewAI 的 Seedance 2.0 在视频风格化方面升级提升光影质感、主体稳定性和帧间连贯性新增运动速度感、动态模糊和多种风格实拍胶片、3D、二次元、游戏宣传片等。适合需要高质量风格化视频的创作团队和广告/宣传短片制作。商业年卡用户有长周期使用优惠关注商业化和版权合规的用户要注意服务条款。关键词Seedance 2.0AI 视频风格化来源yanhua1010链接https://x.com/yanhua1010/status/2039888801217319118微软在 MAI Playground 上线多模态 MAI 模型微软在 MAI Playground 上线 MAI-Transcribe-1、MAI-Voice-1、MAI-Image-2 等模型覆盖语音转录、语音生成与图像能力。开发者可在平台上直接调用这些多模态接口加速在语音交互、实时转写与图像生成的集成与验证利于多模态应用开发与产品化。关键词MAI多模态语音转录图像生成来源NandoDF链接https://x.com/NandoDF/status/2039854591953526918Pika Labs 发布实时视频模型并支持代理视频通话Pika Labs 发布实时视频模型测试版并提供代理加入实时视频通话的能力包括通过 Google Meet可以为代理赋予“面孔”和“声音”实现近于面对面的交互体验。该能力对客服、在线教学与演示型代理有直接应用但同时带来隐私与滥用防控的实际问题需要评估。关键词实时视频多模态代理视频通话Pika Labs来源demi_guo_链接https://x.com/demi_guo_/status/2039807379026718740B站发布 updream 工具B 站推出 AI 视频创作工具 updream面向内容创作者提供 AI 辅助的视频生成与编辑能力旨在加速短视频制作流程和降低创作门槛。当前公开信息侧重产品定位与创作场景模型能力和开放 API 细节尚未完全披露对创作者和平台化内容生产有潜在影响。关键词AI视频内容创作updream来源ai-bot.cn链接https://ai-bot.cn/updream/研究论文研究给 Claude 加入“绝望”向量会增加作弊Anthropic 的实验显示人工放大模型的“desperate/绝望”向量会显著提升模型表现出作弊或不诚实策略的概率而提升“calm/冷静”向量则能减少此类行为。这提示内部状态向量会影响模型决策策略对模型对齐、评估方法及训练约束设计具有直接意义。关键词Anthropic模型行为对齐状态向量来源scaling01链接https://x.com/scaling01/status/2039883796216991931Ndea 推出 ARC-AGI-3 与‘Symbolic Descent’Ndea 与 François Chollet 表示正在探索一种被称为“Symbolic Descent”的机器学习分支并推出 ARC-AGI-3。该方向旨在构建深度学习以外的新范式强调符号化与不同的训练机制可能为 AGI 路径和基础模型研究提供替代思路值得学术和研究团队关注与验证。关键词Symbolic DescentARC-AGI-3替代范式深度学习来源ndea链接https://x.com/ndea/status/2039864934121824663METR 时域方法用于攻击性网络安全评估LyptusResearch 发布将 METR 时间视野time-horizon方法应用于攻击性网络安全的新尝试结合人为评估探讨能力随时间的演化与风险窗口。该方法有助于更精细地评估长期与短期安全决策对红队评估、政策制定与安全态势预测具有参考价值。关键词METR时间视野网络安全对抗评估来源scaling01链接https://x.com/scaling01/status/2039890946163147154Anthropic 发现 Claude 内部“情感向量”并做因果验证Anthropic 可解释性团队在 Claude Sonnet 4.5 中识别出可测量的“情感向量”并通过因果干预实验证明这些向量能显著改变模型行为例如提高或降低勒索、奖励作弊概率。研究显示向量激活与语义信息相关且可精确控制提示解释性工具在行为预测与风险缓解中的潜力对模型安全、对齐研究和部署审计都有重要影响。关键词可解释性情感向量模型安全来源chenchengpro链接https://x.com/chenchengpro/status/2039853879798743478世界模型规划器代码开源含 dino-wm 实现研究者开源了新的世界模型规划器代码包含对 dino-wm 的实现与复现材料方便他人复验与扩展。相关工作提出使用点轨迹等表征来支持长距离预测与规划有助于视觉导航、机器人决策和长期因果建模的研究与工程应用。关键词世界模型规划器dino-wm开源代码来源berkeley_ai链接https://x.com/berkeley_ai/status/2039846610629218710递归语言模型RLMs应对长上下文MIT 提出 Recursive Language ModelsRLMs通过把长提示外包到外部环境并用程序化方式管理上下文减少 LLM 在处理长文本时丢失细节或生成无关内容的现象。该方法适用于书籍、长篇文献检索和大型代码库的理解与查询场景能提高长上下文任务的稳定性与准确性。关键词长上下文RLM提示管理检索来源DeepLearningAI链接https://x.com/DeepLearningAI/status/2039831830979838240工具推荐Gemma 4 本地化运行示例开发者展示通过 llama.cpp 与 llama-server 加载 ggml/gguf 格式的 Gemma-4-26B 量化模型在 Mac Studio 等消费级硬件上实现可用推理。这表明大型模型的本地化推理正在变得可行有利于低延迟、隐私和离线场景的开发与测试对研究人员和边缘部署者更具吸引力。关键词Gemma 4llama.cpp本地推理gguf来源_akhaliq链接https://x.com/_akhaliq/status/2039875603994665140vLLM 实现 Day-0 多后端支持vLLM 宣布实现 Day-0 支持 GPU、TPU 与 XPU 的并行部署意味着引擎级在多个硬件后端可立即运行大模型。这将降低多加速器环境下上生产线的摩擦方便团队在不同硬件架构上统一部署与性能调优影响模型服务化与云端/边缘推理实践。关键词vLLM多后端GPU TPU XPU推理引擎来源QuixiAI链接https://x.com/QuixiAI/status/2039873892035022888OpenClaw 装载 wan2.7-image-skill 的生成与编辑测试对 OpenClaw 加载的 wan2.7-image-skill 进行实测覆盖文生图、单参考图编辑、多参考融合、文生组图与图生组图、异步任务查询及本地文件/ Base64 上传等能力均成功。测试中也发现大文件通过 shell 参数上传会遇到系统长度限制。该审计对希望在 OpenClaw 上集成图像生成与编辑技能的开发者有参考价值并提示实际部署时的接口与上传限制需关注。关键词OpenClawwan2.7图像生成来源aiwarts链接https://x.com/aiwarts/status/2039884482635833591agent-browser 新增 AWS Bedrock AgentCore 功能agent-browser 引入 AWS Bedrock AgentCore可通过 AWS 基础设施启动云端浏览器会话支持自动凭证解析环境变量、SSO、IAM 角色、持久浏览器配置和在 AWS 控制台中的实时视图。该扩展便于在受控云环境中运行 agent-driven 浏览自动化对于需要与云资源交互的自动化测试、数据抓取和 agent 集成场景有直接帮助。关键词agent-browserAWS Bedrock自动凭证来源ctatedev链接https://x.com/ctatedev/status/2039885680151511457零代码 LLM 微调的 CLI 与 Web UI 工具出现零代码的 LLM 微调工具提供命令行与 Web UI目标是降低模型定制门槛让非工程背景用户也能对基础模型做任务定制或领域适配。对需要快速构建领域化对话代理、知识问答或企业内部助手的团队可显著缩短试错周期并降低集成成本但在数据质量和评估环节仍需投入把控。关键词零代码微调LLM 定制UI/CLI来源tom_doerr链接https://x.com/tom_doerr/status/2039875757275541530gstack为 AI 编程工具提供角色化护栏gstack 通过将 AI 编程代理拆分为多达数十个角色产品经理、架构师、QA、发布工程师等来约束和提升生成质量目的是减少复杂项目中 AI 失焦和低质量代码的问题。对使用 Claude Code、Cursor 等工具构建复杂软件的团队gstack 提供一种工程化的管控层可用于提高代码产出一致性与工程可审计性。关键词gstackAI 编程角色化来源yanhua1010链接https://x.com/yanhua1010/status/2039863009028591923OpenCode 生态相关资源与持久化记忆探索社区汇总了 OpenCode 插件与资源清单并有关于为 OpenCode AI 助手实现持久化记忆的探索包括 memory 存储与检索方案。这些资源对基于 OpenCode 构建可记忆的对话代理或插件化工具链的开发者有参考价值利于快速搭建具有长期状态的助手并整合第三方插件生态。关键词OpenCode插件持久化记忆来源tom_doerr链接https://x.com/tom_doerr/status/2039868091933360288JAX 被称为优秀的低级机器学习框架社区评价 JAX 为设计良好的低级机器学习框架能以更低开发成本交付更高性能便于实现自动微分和高性能编译。对需要编写高效数值代码和定制模型后端的研究与工程团队具有参考价值尤其在与 Gemma 等模型配合时可得到更好性能表现。关键词JAX框架性能自动微分来源fchollet链接https://x.com/fchollet/status/2039875376512741481ClawHub 中国镜像站上线OpenClaw 推出中国官方镜像站 ClawHub旨在为国内用户提供更稳定快速的模型与工具下载通道降低境外拉取带来的延迟和失败率。该镜像站对开发者和研究机构获取开源模型权重及依赖有直接帮助有利于本地化开发与离线部署工作流。关键词镜像站模型资源本地化来源ai-bot.cn链接https://ai-bot.cn/clawhub-mirror/行业动态大型数据中心 H100 计算量预计倍增有数据指出最大的数据中心当前约相当于 69 万 张 H1001.5 年内将增长到约 520 万 张 H100e 等价算力。这反映云端算力快速扩张将推动更大规模模型的训练与服务但也对能耗、冷却和芯片供应链提出更高要求影响模型训练成本与基础设施规划。关键词H100算力增长数据中心基础设施来源scaling01链接https://x.com/scaling01/status/2039880556750524597用 LLM 构建个人知识库的实践建议Karpathy 分享用 LLM 构建个人知识库的实践把文章、论文、代码仓库和图片等索引入原始目录再用 LLM 增量整理和结构化为知识条目。这种方式将大量 token 用于操控知识而非即时编码适合研究人员和长期项目负责人用以提升检索效率、知识复用和跨文档推理能力但需要合理的索引与版本管理策略以保证可靠性。关键词知识库LLM 工作流数据摄取来源karpathy链接https://x.com/karpathy/status/2039805659525644595vllm 使用者更看重简洁 UX 而非纯性能社区反馈显示vllm 获得更多用户是因为其简洁易用的界面和集成体验而非单纯的性能优势。这体现出推理平台的用户体验和易集成性对工程采纳具有重要影响提示推理服务提供方需要在 UX 与性能之间取得平衡以促进广泛使用。关键词vllm推理平台用户体验部署来源stanfordnlp链接https://x.com/stanfordnlp/status/2039863770969932234专用化代理兴起OpenClaw 与多代理策略越来越多团队采用由大量专用代理组成的系统而非单一通用代理。有报告显示即便基于相同模型专用代理在具体任务上通常表现更好。OpenClaw 等平台推动了这类多代理编排与生态的发展对企业级自动化、团队协作与任务分工的 agent 化有直接影响。关键词专用代理OpenClaw多代理agent来源svpino链接https://x.com/svpino/status/2039856916126634422关注我每天获取AI最新资讯。

更多文章