← 返回首页
历史回顾
2026108 篇日报
4月22日
ChatGPT Images 2.0 牵动图像与Agent安全线
4月21日
V8 可预测随机数引出前端安全盲区
4月20日
跨地域 KVCache 复用引爆推理不确定性
4月19日
Copilot 数据驻留落地与 Agent 轻量VM
4月18日
KV Packet 缓存复用:推理成本新杠杆
4月17日
Codex“全能化”与Agent可观测拐点
4月16日
Agents SDK 运行时原语上移的拐点
4月15日
SPEED-Bench 把推理加速拉回真实分布
4月14日
上下文路由与持久记忆进入编码Agent主战场
4月13日
Claude Code 配额与可靠性同时拉警报
4月12日
Axios 供应链事件把“证书轮换”推到台前
4月11日
SWE-Bench Verified 对自报分数开刀
4月10日
推测解码加速战升温:CPU 推理被重估
4月9日
轨迹评测与质控体系抬头
4月8日
ClawArena 把持久Agent拉进可测时代
4月7日
长上下文 vs RAG 工程栈:矢量库的必要性再被质疑
4月6日
MCP 1.7 万服务器与插件治理拐点
4月5日
WebGPU 端侧 Gemma 4 引爆本地推理路线分化
4月4日
axios 投毒复盘点燃供应链与Agent治理
4月3日
Gemma 4 开放权重点燃新一轮生态竞赛
4月2日
多Agent编排的“可观测与一致性”撞墙时刻
4月1日
MLX 进 Ollama:端侧推理栈拐点
3月31日
Copilot PR 广告注入拉响协作链路警报
3月30日
本地优先知识层抬头,Agent开始“管文件”
3月29日
SlopCodeBench 把长任务退化推上台面
3月28日
MCP 工具基准与长程退化评测抬头
3月27日
OpenTelemetry Profiles 公测与 LiteLLM 供应链警报
3月26日
TurboQuant 极限压缩牵动推理成本线
3月25日
LiteLLM 供应链投毒牵动Agent执行安全
3月24日
GitHub Actions 供应链再被劫持的信任裂缝
3月23日
Cargo CVE 拉响工具链供应链警报
3月22日
Agent治理栈抬头:遥测与门禁进 CLI
3月21日
Claude Code Channels 把Agent接入事件流
3月20日
SPEED-Bench 拉高端侧推理与解码竞赛
3月19日
评审队列翻倍:AI 产出撞上验证瓶颈
3月18日
跨项目记忆层争夺战:MCP 进 IDE
3月17日
JetBrains Air 把多Agent带进 IDE 主战场
3月16日
MCP 服务端门控把Agent纳入治理层
3月15日
浏览器工具化与Agent可靠性抬头
3月14日
缓存断点省 Token:Agent 成本拐点与风险
3月13日
DeepResearch 夺冠复盘牵引Agent工程化
3月12日
托管Agent运行时的成本与边界被摊开
3月7日
编码Agent异步化:从对话到后台交付的代价
3月6日
协同式代码Agent的权限与代价浮出水面
3月5日
Qwen3-Coder-Next 的稀疏推理成本账单
3月4日
即时推理版本把延迟写进定价
3月3日
并行编码Agent走向工程化:收益与失控点
3月2日
Agent确定性编辑拉高交付可靠性门槛
3月1日
涉密AI内网化:准入权向安全法务迁移
2月28日
Copilot可观测落地后,AI Coding 管理账本出现
2月27日
可移植记忆把长上下文变短账单
2月26日
智能体评测细分:指标先行的可靠性拐点
2月25日
评测污染治理倒逼基准溯源上桌
2月24日
评测成攻击面:LLM-judge 可信度告急
2月23日
Agent工作流编排走向并行分支与外置护栏
2月22日
摄像头音箱Agent:常驻入口的隐私与组织代价
2月21日
Agent变更失控:责任与门禁在重写
2月20日
多模态模型上云:Preview 先跑进采购链路
2月19日
提示注入攻防进入上下文治理赛段
2月18日
AMD推理栈补齐:非CUDA路径的真实代价
2月17日
Agent成本可观测成上线门槛
2月16日
AI滥用攻击链开始“产品化”
2月15日
Lockdown Mode 把 ChatGPT 安全切成可配置变量
2月14日
实验室治理转向:使命改写的工程代价
2月13日
长时推理模型的账单与可靠性拐点
2月12日
时变容量调度:把吞吐当作机会窗口
2月11日
编排式编程Agent走向看板化作业
2月10日
“Agentic CI”落地:产能与风险同时放大
2月9日
AI找漏洞供给化:分诊与误报成新瓶颈
2月8日
终端原生Agent化进入“可计费产能”阶段
2月7日
Agent持久记忆:从体验到合规的硬约束
2月6日
企业Agent治理层:从工具到管控的代价
2月5日
长上下文降本走向选择性计算拐点
2月4日
Codex App 把“代码Agent”推到桌面前台
2月3日
独立编码助手走向任务工作台
2月2日
工具增益评测把 AI Agent拉回可量化现实
2月1日
AGENTS.md 评测胜出:编码Agent可控性反噬
1月31日
模型退役常态化:产品表现开始漂移
1月30日
智能体评测扩张牵动交付与门禁
1月29日
Agent 系统扩容:可解释性与泄露成本上桌
1月28日
仓库级Agent流:代码评审入口在迁移
1月27日
AI 摘要健康引用转向 YouTube 的代价
1月26日
OS内置助手分层:Siri升级的组织代价
1月25日
SaaS长时中断:业务连续性被迫前置
1月24日
Codex agent loop:工程可靠性转向可观测闭环
1月23日
统一4D重建走出实验室:速度与可靠性博弈
1月22日
Agent检索评测化正在改写上线门槛
1月21日
长任务编码评测正在重写交付门槛
1月20日
Agent安全防线开始压过模型模板对齐
1月19日
Agent评测验证正在成为交付门槛
1月18日
多智能体长流程逼近交付链路现实
1月17日
硬件与供应链约束升级:关税/投资、国产替代、以及“AI算力地缘化”
1月16日
隔离、审计、回滚:高权限Agent执行的核心基石
1月15日
推理算力运营正在成为默认
1月14日
Agent 时代进入“可编排推理 + 可隔离执行”的硬约束阶段
1月13日
长时程AI系统进入“预算治理”时代:记忆、检索、协作与供应链同时收紧
1月12日
AI供应链开始从“推理风控”转向“训练与工具链硬约束”
1月11日
Agent 上线进入“评测+隔离+防护”的平台化阶段
1月10日
推理与开发正在进入“预算与治理”时代
1月9日
从“模型更强”转向“系统可控”:评测诊断、预算推理与安全收紧同日共振
1月8日
验证与证据正在成为智能体落地的硬门槛
1月7日
AI 应用正在从“会用模型”转向“可控的Agent与供应链”
1月6日
多模态Agent与推理架构:研究向产品化的当日脉动
1月5日
AI系统进入“可回归的治理层”:红队、评测、推理内存一起被工程化
1月4日
Agent 基建正在从“框架”转向“可控执行 + 可评估证据链”
1月3日
多模态评测正在从跑分转向可审计红队流程
1月2日
微SaaS、内存墙和信任博弈
1月1日