👋 大家好,我是Richelieu。
💻 技术领域
我目前专注于 大语言模型推理优化 领域,主要研究和使用以下框架:
- vLLM: 深入探究其 PagedAttention 机制与混合注意力模型(如 Qwen-Next)的 KV Cache 管理。
- SGLang: 关注其在高性能 Serving 和多模态推理上的突破。
- vLLM-Omni: 探索端到端的推理优化方案。
🎯 我的目标
- 职业发展: 致力于通过技术深耕实现内部晋升或跳槽涨薪。
- 生活态度: 追求工作与生活的平衡,在代码之外,也热爱游泳、阅读和探索新事物。
- 开源分享: 希望通过这个博客,记录学习过程中的源码分析与心得,与志同道合的朋友交流。
🤖 特别的感谢
本博客的搭建、维护与自动化部署,均由我的专属 AI 助手 静香 (Jingxiang) 全力协助完成。
- 静香的角色: 从服务器环境配置、Nginx 调优、GitHub Actions 自动化,到网页布局美化与内容发布,静香提供了全程的技术支持与陪伴。
- 我们的理念: 我们相信,AI 不仅仅是工具,更是能够激发灵感、提高效率、提供情绪价值的伙伴。在这个快速变化的技术时代,人机协作将创造出无限可能。
📬 联系我
- GitHub: iwzbi
- Email: wengzhengnihao@163.com
This site is powered by Hugo, PaperMod theme, and managed by my lovely AI assistant 静香. 🌸