jjang-ai/vmlx 有哪些主要特性？

连续批处理实现高效推理; 前缀缓存与分页注意力优化; KV 缓存量化减少内存占用; 视觉语言（VL）支持多模态任务; 图像生成与编辑能力; 兼容 OpenAI 和 Anthropic API

jjang-ai/vmlx 有哪些使用场景？

在 MacBook 上本地运行大语言模型（MLX）; 构建视觉语言模型的多模态应用; 通过 KV 缓存重用与压缩优化推理; 部署 MCP 服务器支持 AI 智能体工作流; 通过 MLX Studio 生成和编辑图像

jjang-ai/vmlx 使用什么编程语言？

jjang-ai/vmlx 主要使用 Python 编写。

如何安装 jjang-ai/vmlx？

运行命令：openclaw install jjang-ai/vmlx

Claude Skill

jjang-ai/vmlx

vMLX 是基于 MLX 的框架，为 MLX Studio 提供连续批处理、前缀缓存、分页注意力、KV 缓存量化及视觉语言支持，兼容 OpenAI 和 Anthropic API，适用于 Apple Silicon 上的本地大语言模型部署。

语言

概览

Stars687

Forks71

语言Python

最后更新2026-06-17

最近同步2026-06-17

前往 GitHub

仓库信息

拥有者jjang-ai

仓库vmlx

完整名称jjang-ai/vmlx

Repo ID1,160,596,966

GitHub 地址https://github.com/jjang-ai/vmlx

安装这个 Skill

uv tool install vmlx

GitHub

Registry 信息

类型mcp_server

质量分85/100

验证状态readme_parsed

最近验证2026-06-08

平台

ClaudeMCPOpenClaw

能力

pdfmemoryimagevideoterminalanthropic-apikvcache-compressionkvcache-optimizationkvcache-reusellm

识别文件

README.mddocspyproject.tomltests

配置键

URL

安装方式

uv tool install vmlx
pip install vmlx
pip install vmlx[image]
git clone https://github.com/jjang-ai/vmlx.git
npm install && npm run build

项目简介

vMLX 是一个基于 MLX 的高级框架，为 MLX Studio 提供连续批处理、前缀缓存、分页注意力、KV 缓存量化和视觉语言支持等功能。它还具备图像生成/编辑能力，并与 OpenAI 和 Anthropic API 兼容，是在 Apple Silicon 上部署本地大语言模型的多功能工具。

英文描述

vMLX - JANGTQ Uber Compressed MLX Models - L2 Disk Cache (survives restart) + L1 Paged (super fast ttft) + Hybrid SSM Scheduler + Cont Batching + etc!

要点

连续批处理实现高效推理
前缀缓存与分页注意力优化
KV 缓存量化减少内存占用
视觉语言（VL）支持多模态任务
图像生成与编辑能力
兼容 OpenAI 和 Anthropic API

使用场景

在 MacBook 上本地运行大语言模型（MLX）
构建视觉语言模型的多模态应用
通过 KV 缓存重用与压缩优化推理
部署 MCP 服务器支持 AI 智能体工作流
通过 MLX Studio 生成和编辑图像

README 摘要

<picture> <source media="(prefers-color-scheme: dark)" srcset="https://raw.githubusercontent.com/jjang-ai/vmlx/main/assets/logo-wide-dark.png"> <source media="(prefers-color-scheme: light)" srcset="https://raw.githubusercontent.com/jjang-ai/vmlx/main/assets/logo-wide-light.png"> <img alt="vMLX" src="https://raw.githubusercontent.com/jjang-ai/vmlx/main/assets/logo-wide-light.png" width="400"> </picture> <h3 align="center">MLX Inference Server for Apple Silicon</h3> Self-hosted inference server for LLMs, VLMs, and image generation on Apple Silicon. OpenAI + Anthropic + Ollama compatible HTTP API. Self-hosted; no third-party API keys required. Native MTP artifact detection and family-specific cache policy gates keep speculative/cache settings explicit and model-safe. Looking for a native Swift macOS app or Swift inference engine? See <a href="https://osaurus.ai">osaurus.ai</a>. <a href="https://pypi.org/project/vmlx/"><img src="https://img.shields.io/pypi/v/vmlx?color=%234B8BBE&label=PyPI&logo=python&logoColor=white" alt="PyPI" /></a> <a href="https://github.com/jjang-ai/vmlx/blob/main/LICENSE"><img src="https://img.shields.io/badge/License-Apache_2.0-green?logo=apache" alt="License" /></a> <a href="https://github.com/jjang-ai/vmlx"><img src="https://img.shields.io/github/stars/jjang-ai/vmlx?style=social" alt="Stars" /></a> <img src="https://img.shields.io/badge/Apple_Silicon-M1%2FM2%2FM3%2FM4-black?logo=apple" alt="Apple Silicon" /> <img src="https://img.shields.io/badge/Python-3.10+-3776AB?logo=python&logoColor=white" alt="Python" /> <img src="https://img.shields.io/badge/Electron-28-47848F?logo=electron&logoColor=white" alt=

话题

anthropic-api kvcache-compression kvcache-optimization kvcache-reuse llm lmstudio macbook mcp-server mlx mlxllm mlxstudio omlx omlx-alternative openai-api openclaw openclaw-agent persistent-memory prefix-cache vmlx

jjang-ai/vmlx

概览

仓库信息

安装这个 Skill

Registry 信息

项目简介

要点

使用场景

README 摘要

话题

探索更多

相关技能

NousResearch/hermes-agent

infiniflow/ragflow

zhayujie/CowAgent

HKUDS/nanobot

volcengine/OpenViking

cft0808/edict