AI 知识中心 / 技术前沿
技术前沿
大模型技术突破与深度解读
advanced
MoE 混合专家:DeepSeek-V2 和 Mixtral
解析 MoE 架构原理,分析 DeepSeek-V2 和 Mixtral 如何实现高性价比的大模型。
MoEDeepSeekMixtral
📖 15 分钟·2026/5/14
advanced
长文本建模:从 RAG 到百万 Token
综述长文本处理方案,对比 RAG、位置编码扩展、层次化建模等不同路线。
长文本RoPE稀疏注意力
📖 16 分钟·2026/5/14
advanced
Mamba 架构:状态空间模型的崛起
深入了解 Mamba 如何通过选择性 SSM 挑战 Transformer,实现线性复杂度序列建模。
MambaSSM线性注意力
📖 14 分钟·2026/5/14
advanced
Sora 技术报告解读:视频生成的世界模型之路
深入分析 OpenAI Sora 的技术要点,探讨视频生成模型向世界模型演进的可能性。
Sora视频生成OpenAI
📖 10 分钟·2026/5/14
advanced
LLM 推理性能优化:从 10tok/s 到 100tok/s
系统梳理推理加速的全链路优化:KV Cache、Flash Attention、Speculative Decoding 等。
推理优化Flash Attention投机解码
📖 18 分钟·2026/5/14
advanced
vLLM 深度指南:高性能 LLM 推理服务
掌握 PagedAttention 原理与 vLLM 部署实践,实现高吞吐低延迟的推理服务。
vLLMPagedAttention推理加速
📖 14 分钟·2026/5/14
📊 难度分布
入门0
进阶0
高级0
共 6 篇