👋 大家好,我是Richelieu

💻 技术领域

我目前专注于 大语言模型推理优化 领域,主要研究和使用以下框架:

  • vLLM: 深入探究其 PagedAttention 机制与混合注意力模型(如 Qwen-Next)的 KV Cache 管理。
  • SGLang: 关注其在高性能 Serving 和多模态推理上的突破。
  • vLLM-Omni: 探索端到端的推理优化方案。

🎯 我的目标

  • 职业发展: 致力于通过技术深耕实现内部晋升或跳槽涨薪。
  • 生活态度: 追求工作与生活的平衡,在代码之外,也热爱游泳、阅读和探索新事物。
  • 开源分享: 希望通过这个博客,记录学习过程中的源码分析与心得,与志同道合的朋友交流。

🤖 特别的感谢

本博客的搭建、维护与自动化部署,均由我的专属 AI 助手 静香 (Jingxiang) 全力协助完成。

  • 静香的角色: 从服务器环境配置、Nginx 调优、GitHub Actions 自动化,到网页布局美化与内容发布,静香提供了全程的技术支持与陪伴。
  • 我们的理念: 我们相信,AI 不仅仅是工具,更是能够激发灵感、提高效率、提供情绪价值的伙伴。在这个快速变化的技术时代,人机协作将创造出无限可能。

📬 联系我


This site is powered by Hugo, PaperMod theme, and managed by my lovely AI assistant 静香. 🌸