博客
文章系列日历
归档关于搜索

鄂ICP备19019526号

© 2026 博客

标签

  • 全部
  • AI 日报(31)
  • AI 编程(28)
  • Hermes Agent(13)
  • AI 工具与产品(10)
  • AI 原生架构(15)
  • 大模型研究(11)
  • 杂项(1)
  • AI 行业趋势(2)
  • 行业研究(0)
  1. 文章
  • 当基准说“你对了”但产品说“还不行”:2026 年 AI 能力度量的真实地基

    当基准说“你对了”但产品说“还不行”:2026 年 AI 能力度量的真实地基

    从 METR TH1.1、Anthropic ASL、SWE-bench/HLE/EvoMaster 三榜交叉三个一手数据出发,论证 2026 年下半年 AI 能力度量正在从“单一基准分数”迁移到“精度评估 + 阈值评估 + 评估单元声明”的三角验证体系。

    2026年6月14日·
    大模型研究
  • RAG 工程实战 2026:从 Naive RAG 到 Agentic RAG 的四层架构跃迁

    RAG 工程实战 2026:从 Naive RAG 到 Agentic RAG 的四层架构跃迁

    Anthropic Contextual Retrieval 让检索失败率下降 67%、Self-RAG/CRAG/GraphRAG 三大自反思范式落地、Agentic RAG 的工程陷阱与选型决策树——一篇 2026 年 RAG 工程师的实战地图。

    2026年6月14日·
    AI 原生架构
  • 【AI 日报】2026年06月14日 AI 行业最新动态

    【AI 日报】2026年06月14日 AI 行业最新动态

    Anthropic Fable 5 / Mythos 5 因美国出口管制全球下架;Meta 北京压力下拆 Manus 收购;Anthropic 发布 AI Exponential 政策提案;Google 起诉用 Gemini 实施诈骗的中国团伙;Anthropic Zero Trust for AI Agents 被指出 bearer token 短板;ClawMoat 推出 Agent 运行时隔离方案;Microsoft Research 发布前沿模型智能时间序列;俄国家庭用 AI 复活亲人引发伦理讨论。

    2026年6月14日·
    AI 日报
  • MoE 架构 2026:从稀疏门控到 DeepSeek-V3 与 Qwen3 的工程化集大成

    MoE 架构 2026:从稀疏门控到 DeepSeek-V3 与 Qwen3 的工程化集大成

    当 671B 参数的 DeepSeek-V3 每个 token 只激活 37B、Qwen3-30B-A3B 只激活 3B 时,MoE 已成为 LLM 规模化的默认范式。本文系统梳理从 Sparsely-Gated MoE (2017) → GShard (2020) → Switch Transformer (2021) → Mixtral (2023) → DeepSeek-MoE/V2/V3 (2024) → Qwen3-MoE (2025) 的工程演化,详解 5 个关键突破、3 类工程权衡、2 个产业判断。

    2026年6月14日·
    大模型研究
  • 【AI 日报】2026年06月13日 AI 行业最新动态

    【AI 日报】2026年06月13日 AI 行业最新动态

    Anthropic 首次就出口管制公开发声;Open Source AI Must Win 宣言登顶 HN;OpenAI 遭多州 AG 联盟调查;BitBoard 切入 Agent 分析工作区;FFmpeg 公开 21 个 0day;Arch Linux AUR 恶意包事件收尾。

    2026年6月13日·
    AI 日报
  • Diffusion LLM:当文本生成从打字机变成并行编辑器

    Diffusion LLM:当文本生成从打字机变成并行编辑器

    从 2025 年 5 月 Google Gemini Diffusion 的 857 tokens/s,到 2026 年 6 月 DiffusionGemma 的 500+ tokens/s,再到 Mercury 2 的 1109 tokens/s 商业化交付——文本生成正在经历一场静悄悄的范式革命。本文梳理 5 个核心项目、6 个一手来源,剖析 Diffusion LLM 如何重写大模型的推理架构。

    2026年6月13日·
    大模型研究
  • AI 网关工程实战:把多模型路由、缓存、限流、可观测性装进生产架构

    AI 网关工程实战:把多模型路由、缓存、限流、可观测性装进生产架构

    一篇关于 LLM 应用基础设施层——AI Gateway——的工程实战指南。覆盖多模型路由、语义缓存、统一可观测性、限流与降级、Guardrails 五大主题,结合 LiteLLM、Portkey、Cloudflare AI Gateway、OpenRouter 四种主流方案的真实接口形态与代码示例。

    2026年6月13日·
    AI 编程
  • 推理时计算的范式革命:当大模型学会“多花点时间想”之后,AI 架构发生了什么

    推理时计算的范式革命:当大模型学会“多花点时间想”之后,AI 架构发生了什么

    OpenAI o1/o3、Anthropic Claude 3.7 Sonnet、Google Gemini 2.5 Pro、DeepSeek R1——四家实验室在 2025 年集体把“推理时计算”推到默认能力。这篇文章拆解这场架构革命的根源、四条路径的差异,以及它对 AI 应用架构的连锁冲击。

    2026年6月13日·
    AI 原生架构
  • LLM 评估的危机与重建:从饱和基准到过程性评估的范式转移

    LLM 评估的危机与重建:从饱和基准到过程性评估的范式转移

    当 SWE-Bench Verified 接近饱和、METR 的算法分与整体分出现结构性撕裂,LLM 评估正在从「标准化考试」范式转向「动态测量」范式。本文用 METR 2025-2026 三篇关键报告、Anthropic ASL 框架与 GPQA、HLE 等新一代基准,描绘这场范式转移的全貌。

    2026年6月12日·
    大模型研究
  • LLM 应用的 Token 成本工程:缓存、路由与网关的 5 个实战模式

    LLM 应用的 Token 成本工程:缓存、路由与网关的 5 个实战模式

    把 LLM 应用从'能跑'带到'能盈利'的成本优化手册——围绕 Prompt Caching、模型路由、语义缓存、API Gateway、Token Budgeting 5 个模式,给出可落地的代码片段与账单算术。

    2026年6月12日·
    AI 编程
  • Agent 设计的反框架哲学:Anthropic 五大工作流模式深度解读

    Agent 设计的反框架哲学:Anthropic 五大工作流模式深度解读

    从 Augmented LLM 到自治 Agent——深度拆解 Anthropic 在《Building effective agents》中提出的五类工作流模式(Prompt Chaining / Routing / Parallelization / Orchestrator-Workers / Evaluator-Optimizer),结合 Cloudflare Code Mode 与 MCP 协议演进,探讨在 2026 年构建 LLM Agent 时应如何克制地引入复杂度。

    2026年6月12日·
    AI 原生架构
  • 【AI 日报】2026年6月12日 AI 最新动态

    【AI 日报】2026年6月12日 AI 最新动态

    今日 6 条 AI 要闻. Google 在德国为 AI 概览担责. 银行 AI Agent 被极小金额转账攻陷. Apache Burr 1.0. 员工每周花 6+ 小时看护 AI.

    2026年6月12日·
    AI 日报
  • 2026 上半年 AI 行业深度复盘:从基础模型竞速到 Agent 产品化的范式转移

    2026 上半年 AI 行业深度复盘:从基础模型竞速到 Agent 产品化的范式转移

    用一份 6 个月时间线回答:2025H2–2026H1 究竟发生了什么?范式为什么变了?开发者和组织下一步该把资源压在哪里?

    2026年6月11日·
    AI 行业趋势
  • MCP 工程实战:把 Model Context Protocol 跑进生产环境的 5 个关键决策

    MCP 工程实战:把 Model Context Protocol 跑进生产环境的 5 个关键决策

    Anthropic 在 2024 年 11 月开源的 MCP 协议,在 2026 年已经从"概念验证"走向"生产部署"。本文以最新 2025-11-25 规范为锚点,从架构、传输、安全、性能、可观测五个维度,剖析在生产环境部署 MCP 时必须回答的工程问题,并附 Cloudflare Code Mode 等 2026 年新范式的实战代码。

    2026年6月11日·AI原生架构 · 第 12 篇·
    AI 原生架构
  • Agent 工程范式 2026:从 Workflow 到 Context Engineering 的演进路径

    Agent 工程范式 2026:从 Workflow 到 Context Engineering 的演进路径

    从 Anthropic《Building Effective Agents》到 LangChain《Context Engineering 的崛起》,复盘 2024–2026 Agent 工程范式演进:为什么 context 才是决定 agent 表现的关键,以及开发者应当如何落地。

    2026年6月11日·AI原生架构 · 第 11 篇·
    AI 原生架构
  • 【AI 日报】2026年06月11日 AI 最新动态

    【AI 日报】2026年06月11日 AI 最新动态

    【AI 日报】2026年06月11日 AI 最新动态 今日 AI 圈六大看点:德国法院判定 Google 须为 AI Overviews 虚假回答担责;「AI 取代员工」的 CEO 言论遭学界与社区炮轰;微软开源工具被黑、专偷 AI 开发者凭据;OpenAI 秘密递交 IPO 申请、ChatGPT

    2026年6月11日·
    AI 日报
  • 【AI 日报】2026年06月10日 AI 最新动态

    【AI 日报】2026年06月10日 AI 最新动态

    📚 本系列目录 :《AI 日报》 当前第 26/26 篇 · 上一篇:【AI 日报】2026年06月09日 AI 最新动态 📚 系列导航 《 AI 日报 》共 26 篇,本篇是第 26 篇。 ← 上一篇:【AI 日报】2026年06月09日 AI 最新动态 【AI 日报】2026年06月10日

    2026年6月10日·
    AI 日报
  • 【AI 日报】2026年06月09日 AI 最新动态

    【AI 日报】2026年06月09日 AI 最新动态

    📚 本系列目录 :《AI 日报》 当前第 25/26 篇 · 上一篇:【AI 日报】2026年06月08日 AI 最新动态 · 下一篇:【AI 日报】2026年06月10日 AI 最新动态 📚 系列导航 《 AI 日报 》共 26 篇,本篇是第 25 篇。 ← 上一篇:【AI

    2026年6月9日·
    AI 日报
  • 【AI 日报】2026年06月08日 AI 最新动态

    【AI 日报】2026年06月08日 AI 最新动态

    # 【AI 日报】2026年06月08日 AI 最新动态 今日 AI 行业有大事接连发生:GitHub Copilot 涨价被网友戏称“Tokenpocalypse”、OpenAI 秘密研发的“超级 App”即将登场、特朗普政府或入股 OpenAI、Anthropic 上市前 Daniela Amodei 公开回应盈利能力质疑、Google 与 SpaceX 达成每月 9.2 亿美元算力大单、Mira Murati 的 Thinking Machines 重新回到聚光灯下。以下是今日值得关注的...

    2026年6月8日·
    AI 日报
  • 【AI 日报】2026年06月07日 AI 最新动态

    【AI 日报】2026年06月07日 AI 最新动态

    # 【AI 日报】2026年06月07日 AI 最新动态 今日 AI 行业又有重磅消息:OpenAI 推出全新记忆架构,Anthropic 估值逼近万亿美元,NVIDIA 用 Arm 芯片重新定义 PC,Microsoft 发布 7 款自研 MAI 模型,Claude Sonnet 4.8 泄露证据持续累积,联邦层面 269 页的《美国 AI 法案》草案出台。以下是今日值得关注的 5 条核心新闻

    2026年6月7日·
    AI 日报
上一页1 / 6
下一页