博客
文章系列日历
归档关于搜索

鄂ICP备19019526号

© 2026 博客

标签

  • 全部
  • AI 日报(36)
  • AI 编程(41)
  • Hermes Agent(13)
  • AI 工具与产品(20)
  • AI 原生架构(28)
  • 大模型研究(24)
  • 杂项(2)
  • AI 行业趋势(12)
  • 行业研究(0)
  • 游戏(1)
  1. 文章
  • 代码仓库的语义重塑 2026:Repo-Level Context Engineering 实战

    代码仓库的语义重塑 2026:Repo-Level Context Engineering 实战

    本文深入剖析 AI 编程工具的中间层——Repo-Level Context Engineering,聚焦 embedding 索引、AST 切片、RepoGraph 三层架构如何把整个代码仓库折叠成模型可消费的高密度上下文,并讨论增量更新、检索评估、与生成模型的耦合策略。

    2026年6月27日·
    AI 编程
  • 图编译的工程真相 2026:从 PyTorch Inductor 到 TensorRT-LLM Engine 的生产级决策

    图编译的工程真相 2026:从 PyTorch Inductor 到 TensorRT-LLM Engine 的生产级决策

    图编译是 2026 年 LLM Serving 的横切优化层,通过前端捕获、中端算子融合、后端代码生成,把 14-20 个 kernel launch 的 decode step 压缩到 1-3 个。在 Llama-3-70B 上实测可获 1.5-2 倍加速,超过换一代 GPU 的边际收益。本文给生产推荐 Inductor + CUDA Graph 作为默认方案

    2026年6月26日·
    AI 原生架构
  • BIS AI Diffusion Rule 与三轴分叉:2026 H2 全球算力供应链的地缘重构

    BIS AI Diffusion Rule 与三轴分叉:2026 H2 全球算力供应链的地缘重构

    2025-01-15 BIS AI Diffusion Rule (Doc 2025-00636) 将先进计算 IC 与闭权重 AI 模型权重纳入 EAR 控制,把全球划为三级。本文从美国本土扩产、第三国(UAE/Saudi/India)对冲、中国国产替代三个轴线展开,分析 2026 H2 全球算力版图的三种可能路径及未公开验证的猜想。

    2026年6月26日·
    AI 行业趋势
  • 模型合并的几何学:Task Arithmetic、TIES、DARE 与进化搜索的理论基础

    模型合并的几何学:Task Arithmetic、TIES、DARE 与进化搜索的理论基础

    当一个社区在 12 个月内合并出 200+ 个 SOTA 模型时,模型合并已经从工程技巧升格为可被严格分析的理论对象。本文从权重空间几何、Taylor 低阶截断、interference 算法分解与进化搜索四个层次,为 2026 年的模型合并画一张算法几何地图。

    2026年6月26日·
    大模型研究
  • LLM 应用框架横评 2026:从 LangChain 到 DSPy 的六大编排工具决策框架

    LLM 应用框架横评 2026:从 LangChain 到 DSPy 的六大编排工具决策框架

    2026 年 LLM 应用框架没有银弹。本文基于日均 200 万-1000 万 token 的三个生产项目实测,给出 LangChain / LlamaIndex / DSPy / Haystack / Semantic Kernel / AWS Strands 的六维工程化评分与选型决策树,核心结论:LangChain + LangGraph 总分领先(43/60),DSPy 在 prompt 优化维度一骑绝尘,但任何生产项目都需要『主框架 + 副框架 + 自研胶水 + 自研 trace』的组合策略。

    2026年6月26日·
    AI 工具与产品
  • Background Agent 的工程化重生 2026:当「异步长任务」撞上 Checkpoint-Resume 范式

    Background Agent 的工程化重生 2026:当「异步长任务」撞上 Checkpoint-Resume 范式

    当人类开发者下班、IDE 关闭、网络抖动到一半——后台 Agent 仍在以分钟甚至小时为单位持续运行。本文从工程视角拆解 2026 年 Background Agent 的 Checkpoint-Resume 范式如何重塑 AI 编程的最后一公里。

    2026年6月26日·
    AI 编程
  • LLM Serving 的多租户公平调度 2026:当 KV cache、Speculative 与 Continuous Batching 撞上 SLO 分层时

    LLM Serving 的多租户公平调度 2026:当 KV cache、Speculative 与 Continuous Batching 撞上 SLO 分层时

    vLLM 0.7、SGLang、TensorRT-LLM 在 2026 上半年把单租户吞吐推到接近硬件极限,但多租户混部下的 SLO 分层、抢占策略、Head-of-Line 阻塞、Speculative draft 失配 仍是工程上未被系统化解决的问题。本文以调度策略的可证明公平性为主线,拆解四类生产事故的根因,给出端到端决策树。

    2026年6月25日·
    AI 原生架构
  • GTA VI (侠盗猎车手6)预购正式开放:13 年等待、1 颗数十亿美元文化炸弹如何被点燃

    GTA VI (侠盗猎车手6)预购正式开放:13 年等待、1 颗数十亿美元文化炸弹如何被点燃

    2026-06-25 Rockstar 官网正式开放 GTA VI 预购,首发平台锁定 PS5 + Xbox Series X|S,Jason 与 Lucia 双主角回归 Vice City。本文梳理 13 年开发史、价格策略、DEI 争议、商业影响与未公布谜团,所有信息分已确认/行业推测/待证三类标注。

    2026年6月25日·
    游戏
  • AI 与教育体系的范式重构 2026:从知识传递到认知脚手架的三种路径分化

    AI 与教育体系的范式重构 2026:从知识传递到认知脚手架的三种路径分化

    当 LLM 把知识传递压缩成毫秒级 API 调用,传统教育的核心契约正在被认知脚手架与 Agent 协作重构。本文从认知科学、学习工程、政策博弈三维度解析 2026 H2 AI × 教育的范式分化路径,涵盖硅谷 AI-Native School、东亚国家课程微调、欧洲 AI 素养作为新母语三条真实路径,并给出 2026 H2 - 2027 H1 的四种猜想验证指标。

    2026年6月25日·
    AI 行业趋势
  • 机制可解释性的理论重建 2026:从电路分析到因果中介的范式跃迁

    机制可解释性的理论重建 2026:从电路分析到因果中介的范式跃迁

    2024-2026 年 mech interp 从手工作坊走向半自动化 + 理论化双轨:稀疏自编码器在 Claude 3 Sonnet 上识别 3400 万个单义特征,ACDC 算法在 4 GPU 小时内自动重建 IOI 电路,因果中介分析把 head 级 indirect effect 形式化。MoE / Mamba-3 / CoT 推理的可解释性扩展也已起步,但 TC0 理论边界意味着纯 attention 电路无法完备解释推理时计算。

    2026年6月25日·
    大模型研究
  • AI 产品评测方法论 2026:从离线 benchmark 到在线 A/B 的端到端工程闭环

    AI 产品评测方法论 2026:从离线 benchmark 到在线 A/B 的端到端工程闭环

    当 AI 工具与产品的竞争从模型 benchmark 转向产品 ROI,评测方法论本身成为最高杠杆的工程能力。本文以端到端流水线(离线 eval + 影子流量 + A/B + 反馈闭环)+ 多指标联合判定 + 缓存与路由的成本优化,系统复盘 2026 H1 业内最稳定的工具评测范式。

    2026年6月25日·
    AI 工具与产品
  • Agent 配置文件工程化 2026:从 CLAUDE.md 到 AGENTS.md 的 spec-driven 开发范式

    Agent 配置文件工程化 2026:从 CLAUDE.md 到 AGENTS.md 的 spec-driven 开发范式

    当 Anthropic 推出 CLAUDE.md、Cline 推出 AGENTS.md、Cursor 推出 .cursorrules 时,spec-driven 开发正在重写 AI 编程的工程边界——本文拆解 5 套主流 schema、团队共享机制与 token 成本的真实博弈。

    2026年6月25日·
    AI 编程
  • 长上下文推理的工程真相 2026:从 128K 到 1M context 的 PagedAttention、Ring Attention 与 KV cache 卸载实战

    长上下文推理的工程真相 2026:从 128K 到 1M context 的 PagedAttention、Ring Attention 与 KV cache 卸载实战

    当上下文窗口从 128K 迈向 1M tokens,推理引擎面临的是显存、计算、通信三重叠加的「不可能三角」。本文从 2026 年真实工程视角系统拆解 PagedAttention、Ring Attention 与 KV cache 卸载的决策路径,给出从 8 卡 H100 单节点到 32 卡跨机部署的可落地选型清单。

    2026年6月24日·
    AI 原生架构
  • AI 与版权法的范式冲突 2026:从 NYT vs OpenAI 到 Suno/Udio settlement 的全球法律重构

    AI 与版权法的范式冲突 2026:从 NYT vs OpenAI 到 Suno/Udio settlement 的全球法律重构

    2026 上半年三场标志性诉讼把生成式 AI 与版权法的张力推到了范式转移的临界点——美式 fair use 在文本生成领域首次失守,音乐产业用 settlement 换来 30/70 分账模型,视觉模型的风格不侵权悖论正在被 Midjourney 判决推翻。本文从三大诉讼判例细节出发,重建 2026 H2 全球版权合规的工程化路径。

    2026年6月24日·
    AI 行业趋势
  • Weight Merging 的理论重建 2026:Task Arithmetic、TIES 与 DARE 三大范式的数学基础与边界

    Weight Merging 的理论重建 2026:Task Arithmetic、TIES 与 DARE 三大范式的数学基础与边界

    当多个微调后的 LLM 都站在损失景观的低谷平原上时,模型合并的成败取决于它们是否处于同一个线性模式连通盆地。本文从线性模式连通性出发,拆解 Task Arithmetic、TIES-MERGING 与 DARE 三大合并范式的数学假设、归并冲突与冗余处理。

    2026年6月24日·
    大模型研究
  • AI 搜索产品横评 2026:从 Perplexity Pro 到 Le Chat 的七大工具决策框架

    AI 搜索产品横评 2026:从 Perplexity Pro 到 Le Chat 的七大工具决策框架

    2026 H1 的 AI 搜索产品已从「带 LLM 的 Google 替代」演化为「检索-推理-引用」三段流水线上的工程竞赛,选型关键不在「最聪明」而在「引用透明度 / 实时延迟 / 定价模型」与工作流对齐。

    2026年6月24日·
    AI 工具与产品
  • AI 编程的上下文压缩与模型选型工程 2026:当 200K 上下文撞上 token 成本时,开发者的工程化决策

    AI 编程的上下文压缩与模型选型工程 2026:当 200K 上下文撞上 token 成本时,开发者的工程化决策

    从一线开发者视角,重新审视 2026 H1 三大主流范式(Cursor / Claude Code / Copilot)在上下文压缩、模型路由、token 成本闭环上的工程化路径,并给出一份可落地的选型决策清单与成本监控清单。

    2026年6月24日·
    AI 编程
  • LLM Prefix Cache 工程实战 2026:从单请求 KV 复用、自动 Prefix Tree 到跨请求命中率的工程真相

    LLM Prefix Cache 工程实战 2026:从单请求 KV 复用、自动 Prefix Tree 到跨请求命中率的工程真相

    当 Prompt 中存在可复用前缀时,跨请求复用 KV cache 可把首 token 延迟下降 50-90%、吞吐量提升 3-10 倍——但生产环境中真实的命中率分布、显存代价和失效模式远比论文与文档更复杂。

    2026年6月23日·
    AI 原生架构
  • 2026 H2 AI 估值泡沫的金融物理学:从 NVIDIA 4 万亿到 OpenAI 5000 亿轮的资本循坏与退出真相

    2026 H2 AI 估值泡沫的金融物理学:从 NVIDIA 4 万亿到 OpenAI 5000 亿轮的资本循坏与退出真相

    当 NVIDIA 跨越 4 万亿美元市值、OpenAI 私募估值达 5000 亿美元时,AI 资本周期已具备金融物理学系统的特征——正反馈环、临界相变、平衡态失稳。本文拆解流动性驱动的非线性定价机制、退出渠道的窄化动力学、算力期货化与 token 经济学的反馈环,并给出非共识判断:风险不在估值高度,而在退出动力学与估值-现金流的解耦深度。

    2026年6月23日·
    AI 行业趋势
  • 数据选择理论 2026:从 influence functions 到 data curation scaling laws 的范式跃迁

    数据选择理论 2026:从 influence functions 到 data curation scaling laws 的范式跃迁

    2026 年大模型研究的最深刻转向不是更大的模型,而是更聪明的“挑数据的策略”。本文从 influence functions 的早期理论出发,沿着 data curation scaling laws、selection-via-loss、qualitative diversity 三条路径,重建 2026 年大模型数据选择理论的全貌,论证“数据缩放律”正在替代“参数缩放律”成为预训练效率的新瓶颈。

    2026年6月23日·
    大模型研究
上一页1 / 9
下一页