很多人对开源软件的印象,还停留在技术圈的小众工具。
但这两年有个变化很明显:一些开源项目,已经开始直接对标甚至替代付费软件。
下面这4个就是如此。可以先收藏,后面可能就有用呢!

Chandra OCR
——连手写笔记都能识别的OCR,已经不只是“识别文字”
Github项目:
http://github.com/datalab-to/chandra
传统 OCR 的逻辑很简单:把图片里的文字识别出来。
但实际用的时候问题很多,像表格会乱掉、公式识别不准、排版完全丢失、手写内容基本不可用等。
Chandra OCR解决的核心点,是“结构化识别”。它不只是识别文字,而是把整个文档还原出来。

你上传一份 PDF 或图片,它可以直接输出,而且布局是带着的:
Markdown(适合做笔记、知识库)
HTML(保留页面结构)
JSON(方便程序处理)
这在做文档整理、知识库建设、数据抽取时,价值很高。

识别准确率达77.8%
3月更新2.0版本之后,它在几个点上明显提升:
数学公式识别更稳定
表格结构更准确
多语言支持(90+语言)
手写识别能力明显增强
还有一个比较实用的点是:它可以把表单里的复选框也识别出来。
部署方式也比较灵活,可以本地跑(适合隐私数据),也可以用远程推理(速度更快)。
Jellyfish
——开源免费的一站式制作短剧工具
Github项目:
http://github.com/Forget-C/Jellyfish
短剧这件事,现在很多人在做,而且胜在速度。

Jellyfish可以把这整条生产链路打通的同时利用AI力提升效率。
从剧本输入 → 智能分镜 → 角色/场景/道具一致性管理 → AI视频生成 → 后期剪辑 → 一键导出成片

整个过程都在同一个工具里完成,它里面几个比较关键的模块:
项目管理(多个短剧同时推进)
分镜控制(可以细调每一帧逻辑)
提示词模板(减少反复调参)
剪辑工作台(直接出成片)
这类工具对于做短视频矩阵、短剧账号的人会更实用些。
Eversheet
——完美解决Excel VBA遗憾,还能成为企业数字化统一底座!
iyunbiao.com
Eversheet的思路,是让“人”自己定义系统,而这个人并不一定是程序员,更多是指普通人
云表eversheet界面看起来像WPS Excel,但本质是一个企业级无代码开发平台。
像VBA能做的它可以做的更简单,VBA不能做的,只要你会业务公式、填表公式和数据接口,云表平台都可以实现。

它提供的能力包括:
中文填表公式 + 业务公式
填表驱动流程
数据接口打通系统
自动生成PC和移动端应用
这意味着业务改了,系统可以直接改,不用重新立项,不用等开发周期。

在一些大型企业里已经验证过,比如潞安化工、延长油田这类复杂流程环境,也能跑起来。
另外它支持和用友金蝶、SAP等主流软件对接,也能接硬件设备,比如PDA。
本质上,它更像一个“企业内部搭系统的工具”,不开源但提供“永久”免费版,可以本地部署,当然企业或集团版本更具优势。
OpenAI Whisper
——离线语音转文字,准确率已经够日常使用
Github项目:
http://github.com/openai/whisper
语音转文字这个需求,其实很多人都有但大多数工具,要么收费,要么限制多。

OpenAI Whisper 是一个完全开源的语音识别模型,而且可以离线使用。
特点:
支持多语言(包括中文)
可以识别音频,也可以直接处理视频
自动生成字幕

实际使用中几个优势比较明显:
对口音的容忍度比较高
背景噪音下依然能识别
长音频处理稳定
你可以把它理解成一个“本地版语音助手”,专门负责转录。
很多人会拿它做视频字幕批量生成、播客内容整理、会议纪要。
如果对隐私有要求,本地运行这一点会很关键。
总结
以上,它们其实更多是效率工具,觉得有用记得支持下哦!
下期见~