博客
文章系列日历
归档关于搜索

鄂ICP备19019526号

© 2026 博客

标签

  • 全部
  • AI 日报(32)
  • AI 编程(28)
  • Hermes Agent(13)
  • AI 工具与产品(10)
  • AI 原生架构(16)
  • 大模型研究(13)
  • 杂项(1)
  • AI 行业趋势(2)
  • 行业研究(0)
  1. 文章
  • 2026 开源大模型大爆发:从 DeepSeek-V3 到 Mistral Small 4,开源生态的范式跃迁

    2026 开源大模型大爆发:从 DeepSeek-V3 到 Mistral Small 4,开源生态的范式跃迁

    2026 年开源大模型已从追赶走向并行:DeepSeek-V3、Llama 4、Qwen3、gpt-oss、Mistral Small 4 五大里程碑在架构、训练、推理、多模态、生态五个维度全面演进。本文做一次贴近现状的深度复盘。

    2026年6月15日·
    大模型研究
  • LLM 可观测性工程实战 2026:从 OpenTelemetry GenAI 语义约定到生产级 trace 架构

    LLM 可观测性工程实战 2026:从 OpenTelemetry GenAI 语义约定到生产级 trace 架构

    当 LLM 应用进入生产,APM 工具的 QPS/P95/ErrorRate 已不再充分。本文从 8 个 GitHub 仓库实时数据出发,拆解 LLM 可观测性的 5 类核心信号(token/cost/latency/quality/retrieval)、OpenTelemetry GenAI 语义约定的标准化进程、Langfuse/Opik/Phoenix/OpenLLMetry/Helicone 五大开源项目横向对比,以及 5 个生产级工程模式与三类典型事故案例。

    2026年6月15日·
    AI 原生架构
  • Post-training 范式 2026:从 SFT/RLHF 到 GRPO/DPO/RLVR 的工程化大爆发

    Post-training 范式 2026:从 SFT/RLHF 到 GRPO/DPO/RLVR 的工程化大爆发

    2026 年大模型的真正范式拐点不在预训练而在 post-training。GRPO 把 RL 工程门槛降了一个量级、DPO 把对齐从强化学习拉回监督学习、RLVR 让可验证成为新范式、PRM 在数学代码上突围、Anthropic 的 RLAIF 让对齐本身可扩展。这篇深度长文用 8 节内容把这一轮 post-training 范式迁移讲清楚:它从哪里来、怎么变成今天的形状、哪些算法已经成为行业默认配置、2026 年我们应该把什么放进生产栈。

    2026年6月15日·
    大模型研究
  • 【AI 日报】2026年06月15日 AI 行业最新动态

    【AI 日报】2026年06月15日 AI 行业最新动态

    一日速览:从 Anthropic Mythos 的国安风波到 OpenRouter Fusion 把模型“合体”,从 Meta 把 Alexandr Wang 推上销售前线到中国 1.2 万个“过时学位”被砍,今天的 AI 行业主线是安全监管与模型工程化重组。八条主要消息覆盖安全监管、多模型融合、中美教育调整与 AI 工具体验设计争论。

    2026年6月15日·
    AI 日报
  • 2026 年 AI 能力度量的真实地基

    2026 年 AI 能力度量的真实地基

    从 METR TH1.1、Anthropic ASL、SWE-bench/HLE/EvoMaster 三榜交叉三个一手数据出发,论证 2026 年下半年 AI 能力度量正在从“单一基准分数”迁移到“精度评估 + 阈值评估 + 评估单元声明”的三角验证体系。

    2026年6月14日·
    大模型研究
  • RAG 工程实战 2026:从 Naive RAG 到 Agentic RAG 的四层架构跃迁

    RAG 工程实战 2026:从 Naive RAG 到 Agentic RAG 的四层架构跃迁

    Anthropic Contextual Retrieval 让检索失败率下降 67%、Self-RAG/CRAG/GraphRAG 三大自反思范式落地、Agentic RAG 的工程陷阱与选型决策树——一篇 2026 年 RAG 工程师的实战地图。

    2026年6月14日·
    AI 原生架构
  • 【AI 日报】2026年06月14日 AI 行业最新动态

    【AI 日报】2026年06月14日 AI 行业最新动态

    Anthropic Fable 5 / Mythos 5 因美国出口管制全球下架;Meta 北京压力下拆 Manus 收购;Anthropic 发布 AI Exponential 政策提案;Google 起诉用 Gemini 实施诈骗的中国团伙;Anthropic Zero Trust for AI Agents 被指出 bearer token 短板;ClawMoat 推出 Agent 运行时隔离方案;Microsoft Research 发布前沿模型智能时间序列;俄国家庭用 AI 复活亲人引发伦理讨论。

    2026年6月14日·
    AI 日报
  • MoE 架构 2026:从稀疏门控到 DeepSeek-V3 与 Qwen3 的工程化集大成

    MoE 架构 2026:从稀疏门控到 DeepSeek-V3 与 Qwen3 的工程化集大成

    当 671B 参数的 DeepSeek-V3 每个 token 只激活 37B、Qwen3-30B-A3B 只激活 3B 时,MoE 已成为 LLM 规模化的默认范式。本文系统梳理从 Sparsely-Gated MoE (2017) → GShard (2020) → Switch Transformer (2021) → Mixtral (2023) → DeepSeek-MoE/V2/V3 (2024) → Qwen3-MoE (2025) 的工程演化,详解 5 个关键突破、3 类工程权衡、2 个产业判断。

    2026年6月14日·
    大模型研究
  • 【AI 日报】2026年06月13日 AI 行业最新动态

    【AI 日报】2026年06月13日 AI 行业最新动态

    Anthropic 首次就出口管制公开发声;Open Source AI Must Win 宣言登顶 HN;OpenAI 遭多州 AG 联盟调查;BitBoard 切入 Agent 分析工作区;FFmpeg 公开 21 个 0day;Arch Linux AUR 恶意包事件收尾。

    2026年6月13日·
    AI 日报
  • Diffusion LLM:当文本生成从打字机变成并行编辑器

    Diffusion LLM:当文本生成从打字机变成并行编辑器

    从 2025 年 5 月 Google Gemini Diffusion 的 857 tokens/s,到 2026 年 6 月 DiffusionGemma 的 500+ tokens/s,再到 Mercury 2 的 1109 tokens/s 商业化交付——文本生成正在经历一场静悄悄的范式革命。本文梳理 5 个核心项目、6 个一手来源,剖析 Diffusion LLM 如何重写大模型的推理架构。

    2026年6月13日·
    大模型研究
  • AI 网关工程实战:把多模型路由、缓存、限流、可观测性装进生产架构

    AI 网关工程实战:把多模型路由、缓存、限流、可观测性装进生产架构

    一篇关于 LLM 应用基础设施层——AI Gateway——的工程实战指南。覆盖多模型路由、语义缓存、统一可观测性、限流与降级、Guardrails 五大主题,结合 LiteLLM、Portkey、Cloudflare AI Gateway、OpenRouter 四种主流方案的真实接口形态与代码示例。

    2026年6月13日·
    AI 编程
  • 推理时计算的范式革命:当大模型学会“多花点时间想”之后,AI 架构发生了什么

    推理时计算的范式革命:当大模型学会“多花点时间想”之后,AI 架构发生了什么

    OpenAI o1/o3、Anthropic Claude 3.7 Sonnet、Google Gemini 2.5 Pro、DeepSeek R1——四家实验室在 2025 年集体把“推理时计算”推到默认能力。这篇文章拆解这场架构革命的根源、四条路径的差异,以及它对 AI 应用架构的连锁冲击。

    2026年6月13日·
    AI 原生架构
  • LLM 评估的危机与重建:从饱和基准到过程性评估的范式转移

    LLM 评估的危机与重建:从饱和基准到过程性评估的范式转移

    当 SWE-Bench Verified 接近饱和、METR 的算法分与整体分出现结构性撕裂,LLM 评估正在从「标准化考试」范式转向「动态测量」范式。本文用 METR 2025-2026 三篇关键报告、Anthropic ASL 框架与 GPQA、HLE 等新一代基准,描绘这场范式转移的全貌。

    2026年6月12日·
    大模型研究
  • LLM 应用的 Token 成本工程:缓存、路由与网关的 5 个实战模式

    LLM 应用的 Token 成本工程:缓存、路由与网关的 5 个实战模式

    把 LLM 应用从'能跑'带到'能盈利'的成本优化手册——围绕 Prompt Caching、模型路由、语义缓存、API Gateway、Token Budgeting 5 个模式,给出可落地的代码片段与账单算术。

    2026年6月12日·
    AI 编程
  • Agent 设计的反框架哲学:Anthropic 五大工作流模式深度解读

    Agent 设计的反框架哲学:Anthropic 五大工作流模式深度解读

    从 Augmented LLM 到自治 Agent——深度拆解 Anthropic 在《Building effective agents》中提出的五类工作流模式(Prompt Chaining / Routing / Parallelization / Orchestrator-Workers / Evaluator-Optimizer),结合 Cloudflare Code Mode 与 MCP 协议演进,探讨在 2026 年构建 LLM Agent 时应如何克制地引入复杂度。

    2026年6月12日·
    AI 原生架构
  • 【AI 日报】2026年6月12日 AI 最新动态

    【AI 日报】2026年6月12日 AI 最新动态

    今日 6 条 AI 要闻. Google 在德国为 AI 概览担责. 银行 AI Agent 被极小金额转账攻陷. Apache Burr 1.0. 员工每周花 6+ 小时看护 AI.

    2026年6月12日·
    AI 日报
  • 2026 上半年 AI 行业深度复盘:从基础模型竞速到 Agent 产品化的范式转移

    2026 上半年 AI 行业深度复盘:从基础模型竞速到 Agent 产品化的范式转移

    用一份 6 个月时间线回答:2025H2–2026H1 究竟发生了什么?范式为什么变了?开发者和组织下一步该把资源压在哪里?

    2026年6月11日·
    AI 行业趋势
  • MCP 工程实战:把 Model Context Protocol 跑进生产环境的 5 个关键决策

    MCP 工程实战:把 Model Context Protocol 跑进生产环境的 5 个关键决策

    Anthropic 在 2024 年 11 月开源的 MCP 协议,在 2026 年已经从"概念验证"走向"生产部署"。本文以最新 2025-11-25 规范为锚点,从架构、传输、安全、性能、可观测五个维度,剖析在生产环境部署 MCP 时必须回答的工程问题,并附 Cloudflare Code Mode 等 2026 年新范式的实战代码。

    2026年6月11日·AI原生架构 · 第 12 篇·
    AI 原生架构
  • Agent 工程范式 2026:从 Workflow 到 Context Engineering 的演进路径

    Agent 工程范式 2026:从 Workflow 到 Context Engineering 的演进路径

    从 Anthropic《Building Effective Agents》到 LangChain《Context Engineering 的崛起》,复盘 2024–2026 Agent 工程范式演进:为什么 context 才是决定 agent 表现的关键,以及开发者应当如何落地。

    2026年6月11日·AI原生架构 · 第 11 篇·
    AI 原生架构
  • 【AI 日报】2026年06月11日 AI 最新动态

    【AI 日报】2026年06月11日 AI 最新动态

    【AI 日报】2026年06月11日 AI 最新动态 今日 AI 圈六大看点:德国法院判定 Google 须为 AI Overviews 虚假回答担责;「AI 取代员工」的 CEO 言论遭学界与社区炮轰;微软开源工具被黑、专偷 AI 开发者凭据;OpenAI 秘密递交 IPO 申请、ChatGPT

    2026年6月11日·
    AI 日报
上一页1 / 6
下一页