Easy Voice Input

一款完全免费的开源 macOS 语音输入工具。按住 Fn 说话,松手即输入。 你只需要配置自己的 ASR API Key,成本完全由你掌控。

A free and open-source macOS voice input app. Hold Fn to speak, release to type. Bring your own ASR API key — you control the cost from the source.

完全免费。如果你觉得好用,欢迎分享给朋友支持我们。 Completely free. If it helps you, please share it with a friend.

Fn to Speak Streaming ASR Chinese + English OpenRouter Optional Skill Hotkeys
实时输入 Live Input Streaming
“这是一段实时语音输入预览 — Hello,欢迎使用 Easy Voice Input。” “A live transcript preview — Hello, welcome to Easy Voice Input.”
浮窗实时显示识别内容 Overlay shows live transcript

为轻量高效输入而生 Designed for Fast, Clean Input

减少切换、减少干扰,把语音变成你更顺手的输入方式。 Less context switching, more flow. Voice becomes your fastest input channel.

流式 ASR Streaming ASR

阿里云百炼 FunASR 实时识别,中英混合语音也能稳定输出。 DashScope FunASR realtime transcription with mixed Chinese + English support.

低干扰交互 Low-distraction UX

菜单栏常驻,按住 Fn 即输入,松手自动回填。 Menu bar resident. Hold Fn to speak, release to insert.

麦克风监控 Mic Monitoring

内置设备选择与实时音量条,快速定位收音问题。 Built-in device selector + live level meter.

可选 AI 润色 Optional AI Refinement

连接 OpenRouter,多模型可选,自定义技能提升表达质量。 Connect OpenRouter, pick fast or SOTA models, and use custom skills.

技能快捷键 Skill Shortcuts

给技能绑定快捷键,按住说话即触发;可为每个技能指定独立模型。 Bind hold-to-talk shortcuts per skill, each with its own model.

成本对比:按量计费 vs 订阅制 Cost Model: Pay-as-you-go vs Subscription

我们不售卖语音额度。你直接使用自己的 API Key,成本透明、可控。 We don’t sell credits. You bring your API key, so costs stay transparent and flexible.

方案 费用结构 适合谁 你的优势
Easy Voice Input 自带 API Key,按量计费 轻度使用 / 使用量不稳定 不用订阅,成本随用量浮动
典型订阅制产品 固定月费 / 年费 重度使用 即开即用,但长期成本更高
实际费用以服务商报价为准。轻度或偶发使用场景下,按量计费通常更省。
Plan Cost Model Best For Your Benefit
Easy Voice Input Bring your API key, pay-as-you-go Light or variable usage No subscription, cost scales with usage
Typical subscription apps Fixed monthly or annual fee Heavy usage Simple, but long-term cost adds up
Actual prices depend on your ASR provider. Pay-as-you-go often wins for light usage.

完全免费 & 开源 Free & Open Source

Easy Voice Input 永远免费。成本由你的 API 使用量决定,我们不抽成、不售卖额度。 Easy Voice Input stays free forever. You only pay your API usage — no markup, no quotas.

如果它对你有帮助,欢迎分享给朋友或在 GitHub 点个 Star,这对我们很重要。 If it helps, please share it or give us a GitHub star — it truly supports the project.

我们的特色 What Makes It Different

  • 你掌控成本:API 原价直连,无订阅绑架 You control cost: direct API billing, no subscriptions
  • 可选模型:快模型与 SOTA 模型自由切换 Model choice: fast or SOTA, switch freely
  • 数据更克制:仅将音频发送给你配置的服务 Minimal data flow: audio only goes to your chosen provider
  • 本地优先:界面、快捷键、逻辑都可控 Local-first UX: configurable, fast, and focused
  • 技能级控制:快捷键 + 独立模型,场景分工更清晰 Skill-level control: shortcuts + per-skill models

与 LLM 结合,能力无限扩展 Extend Infinitely with LLMs

语音只是入口。接入 LLM 后,输入就能升级为“理解 + 产出”。 Voice is just the entry point. With LLMs, input becomes understanding + output.

智能润色 Smart Refinement

语气、格式、长度一键调整,适配邮件、文档、社交发言。 Adjust tone, format, and length instantly for emails, docs, or posts.

结构化输出 Structured Output

把口述变成要点、清单、会议纪要与行动项。 Turn speech into bullets, checklists, meeting notes, or action items.

跨语言表达 Cross-language

中英互译,双语内容一键生成与优化。 Translate between Chinese and English with bilingual polishing.

自定义工作流 Custom Workflows

用 Prompt / Skill 定义模板,搭配快捷键与独立模型,场景一键触发。 Define templates with skills, bind shortcuts, and use per-skill models.

用户常见场景 Popular Use Cases

Web Coding Web Coding

口述需求 → 生成 HTML/CSS/JS 片段或组件草稿。 Speak specs and generate HTML/CSS/JS snippets or component drafts.

产品文档 Product Docs

把想法变成 PRD、方案、结构化提纲。 Turn ideas into PRDs, plans, or structured outlines.

商务邮件 Business Email

快速草拟 + 一键润色,语气稳、格式清晰。 Draft fast and polish with the right tone and structure.

会议纪要 Meeting Notes

口述内容 → 关键点 + 行动项。 Speak it out, get action items and summaries.

研究/读书 Research Notes

边看边说 → 自动整理要点与结论。 Talk through articles and auto-summarize key takeaways.

客服/工单 Support Replies

固定问题快速回复,保持一致语气。 Respond quickly with consistent tone and structure.

CRM 记录 CRM Updates

通话后口述 → 自动生成跟进记录。 Speak after a call and generate follow-up notes.

内容创作 Content Drafts

标题、段落、社媒文案一键生成。 Generate titles, paragraphs, and social copy fast.

能力扩展空间没有上限,模型由你选择,成本由你掌控。 Choose any model, shape any workflow. Your API key, your cost ceiling.

三步开始使用 Three-step Workflow

  1. 1
    填入 API Key
    Add your API key

    DashScope FunASR 必填,OpenRouter 可选。

    DashScope FunASR is required. OpenRouter is optional.

  2. 2
    按住 Fn 说话
    Hold Fn to speak

    浮窗显示实时识别内容与音量变化,也可用技能快捷键。

    Overlay shows live transcript and input level. Skill shortcuts work too.

  3. 3
    松手自动回填
    Release to insert

    文本直接进入光标位置,继续你的工作。

    Text lands at cursor, ready for your next thought.

下载与安装 Download & Install

GitHub Release 提供最新安装包。解压后拖入“应用程序”。 Get the latest build from GitHub Releases and drag the app into Applications.

系统需求 System Requirements

macOS 14.0+

权限说明 Permissions

麦克风权限(必需) · 辅助功能权限(输入注入) Microphone (required) · Accessibility (text injection)

数据与隐私 Data & Privacy

API Key 仅保存在本地,音频仅发送到你配置的 ASR 服务。 API keys stay local. Audio only goes to your selected ASR provider.